Yritin ratkoa tehtävää sivulta https://www.ohjelmointiputka.net/postit/tehtava.php?tunnus=mpera . Miksi tämä ei tuota tapauksessa 10 oikeaa vastausta: https://pastebin.com/UxPaEid7
Miksi putkapostin ratkaisuyritys tuottaa väärän tuloksen?
3
407
Vastaukset
Sulla kun on tuo testi
s[pos-i] == s[pos i]
niin sehän testaa että pos:ista eteen- ja taaksepäin on samoja merkkejä eli noin löytyisi (parittoman pituisia) palindromi-pötköjä.
Pitää testata, että vierkkäiset merkkijonot i:n matkalta ovat samat eli
s[pos-i:pos] == s[pos:pos i]
Sittenhän tulee ongelmaksi se, että luuppia ei voi katkaista, jos eroava indeksi löytyy, koska se ei tarkoita, että suuremmalla i:n arvolla ei voisi löytyä toistojaksoa.
Nuo korjaukset kun tekee (ja tallenna bestPos, se taisi sinulta unohtua, eikä mjonoa tarvitse mihinkään) ja output olisi näin
print(str(tapaus) " " str(maximi) " " str(bestPos-maximi 1))
Mutta nyt siis ongelma on että tuo koodi on melkolailla hidas. Itse huijasin ja käytin seuraava Sage-koodia:
from sage.combinat.words.suffix_trees import DecoratedSuffixTree
s = 'hfhfggccaggccagccafff'
start, run2 = max((x[1], x) for x in DecoratedSuffixTree(Word(s)).square_vocabulary())[1]
print ("{} {}".format(run2/2, start 1))https://doc.sagemath.org/html/en/reference/combinat/sage/combinat/words/suffix_trees.html
Tuossa algoritmissä, jota Sagekin käyttää on muuten takana suomalaisen Esko Ukkosen algoritmi:
https://en.wikipedia.org/wiki/Ukkonen's_algorithm
Tämä algoritmi muodostaa merkkijonon suffiksi-puun (kaikki merkkijonon päätteet koodaava tietorakenne) lineaarisessa ajassa (kun käytettävä merkistö on kiinnitetyn kokoinen).
Tai siis Ukkosen algorimia käyttää normaalille suffiksi puulle, "dekoroidulle" näytti olevan tästä: https://www.sciencedirect.com/science/article/pii/S0022000004000364?via=ihub , joka siis onkin ratkaisu juuri Putkapostin ongelmaan. Sen pitäisi olla lineaariaikainen mutta kertoimet ovat varmaan aika isoja (PS. Crochemoren algoritmi https://www.sciencedirect.com/science/article/abs/pii/0020019081900247 on saman ongelman ratkaisu ja sille taisi tilanvienti olla ainakin jotain 11*n), ainakin itselläni vei aika pitkään tuo ratkaisu. Mullahan ei omalla koneellani tuota Sagea ole vaan netissä suoritan: https://sagecell.sagemath.org/ . Olikin muuten aika homma saada nuo isot tapaukset laitettua :D Jotain "Message too long, message too long" se herjas, mutta näytti ne oikein kuitenkin menevän. Lopulta laitoin kympin (ajan takia) erikseen (piti muuten vielä maksimi rekursio-iteraatio limittiä nostaa, jo 9-tapauksessa) ja kyllä se lopulta oikeat vastaukset tuotti.
Tässä videossa näytetään toinen tapa muodostaa suffiksi-puu ja puhutaan sovelluksista, jotka ovat lähellä tätä ongelmaa (esim. pisin toistuva jono (mutta ei tarvitse olla vierekkäin)):
https://www.youtube.com/watch?v=NinWEPPrkDQ
Tänne oli tullut viesti, mutta AI ilmeisesti poistanut (ihan asiallinen mitä alkua inboxistani näin). Kannattaa laittaa koodit linkin taakse johonkin ulkoiseen juttuun, jos se niiden takia poistelee viestejä.
Tein nyt Python-version, jossa käytin kirjastoa https://pypi.org/project/suffix-trees/ . (Käytin aluksi https://pypi.org/project/suffix-tree/ :aa, mutta se on erittäin paljon hitaampi.) Ensin muodostetaan suffiksipuu ja siitä käydään sitten kaikki sisäsolmut läpi, joista jokaiselle käydään sen solmun lehtisolmu parit, joiden syvyyksien erotus on solmun syvyys. Koittelin tuohon tehdä erinäisiä parannuksia eritoteen 9 ja 10 tapauksissa taisi auttaa sellainen, että ensin tallennetaan dictiin kaikki lehtisolmut syvyyden mukaan ja sieltä voidaan sitten poimia tarvitun syvyinen pari kun yksi lehti on kiinnitetty, tarkastetaan vain onko se oikeassa haarassa. Joissain tapauksissa tuo taitaa vaan tulla liian hitaaksi (jos tutkitun syvyisiä lehtiä on paljon).
Tässä koodini https://repl.it/@minkkilaukku2/Mannynpera2#main.py . Ei toimi Python 3:lla, koska siellä _SNodella ei ole __dict__ -attributtia mutta Python 2:ssa on, mitä hittoa?!?? Ahaa: https://stackoverflow.com/questions/41658015/object-has-no-attribute-dict-in-python3
Loppujen lopuksi sain tavalla tai toisella tuolla koodilla kaikki tapaukset järjellisessä ajassa ratkaistua.
Noh,
Putkapostin kommenteissa ollut seuraava idea näyttää toimivan paljon nopeammin:
https://repl.it/@minkkilaukku2/Mannynpera1#main.py
Ketjusta on poistettu 1 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
Työeläkkeet ovat pois työntekijän palkasta
Jokainen työeläkkeen nimissä maksettu euro on otettu pois työtä tekevältä palkansaajalta. Mitä korkeampi työeläketaso o1642016Etkö sä muru mussakaiseni ymmärrä
Että me päästään lähenemään vain kaveruuden kautta? Vain siten mä voin lähettää sulle kuvia ja viestejä 😌 Tänäänkin o521568"Suomi voisi ottaa taloudessa oppia Espanjasta"
"Espanjassa talouspolitiikka on löysempää, mutta velka-aste on kääntynyt jopa laskuun.", pohdiskelee Suomen seuraava pää1281551Sofia Virta: bänet!
Matkailuautoilija metsänomistaja puoliso on nyt entisen teeren poikia, ja Sofia tekee comebackin vapaille markkinoille.761508- 781435
Kokoomus: SDP johtaa kansalaisia harhaan
(Umpityhmät palstademarit ovat taas uskoneet Lindtmanin höpötykset Espanjasta.) SDP harhaanjohtaa kansalaisia talouspol151277- 691267
Martina Aitolehdeltä kova tilitys podcastilla: "Kyllä mä turpaan vetäisin"!
Martina Aitolehti tilittää brutaalin rehellisesti Eskolle podcastilla syitä, miksi hän ei ole lähtenyt mukaan julkkisten2331102- 711069
Talousasiantuntija sanoo säästämisestä
" parin kuukauden tulo on sellainen, joka voi olla vaikka tilillä tai jossain korkorahastossa, eikä se ole tuottohakuine2311034