Minulla oli vuosia sitten ohjelmointiongelma, jossa piti keksiä sopiva tavutusalgoritmi suomen kielen sanoille. En löytänyt netistä tai avoimen lähdekoodin ohjelmista tällaista, joten voiko tällaisen tehdä matemaattisesti? Siis että tietokantaan syötettäisiin sanoja ja niiden tavutuksia ja ohjelma laskisi säännön, jonka mukaan koettaisi arvata jonkun uuden sanan tavutuksen. Täydellisyyteen ei varmasti päästä, mutta voiko tietokonetta opettaa tuntemaan, miten annetut dataparit ennustavat tulevia havaintoja?
Voiko matematiikkaa tai tilastotiedettä käyttää tavutusalgoritmi
4
58
Vastaukset
- Että tälleen
Olen tehnyt 30 vuotta sitten yksinkertaisen suomen kielen tavutusalgoritmin, joka puri noin 90 prosenttiin suomen sanoista. Ongelmaksi jäivät vokaalitavut, yhdyssanat sekä vieraslähtöiset sanat.
Ideana oli muuttaa sanat konsonatti-vokaalijonoksi, josta voi helposti päätellä tavurajat. Ohjelma oli pituudeltaan vajaan vaaksan eli hyvin lyhyt.
Säännöt on kerrottu mm. tässä
http://www.kotus.fi/index.phtml?s=4363
Saataisipa noiden sääntöjen keksiminen onnistua oppivalta ohjelmaltakin, mutta tehtävä on varmastikin vaikeampi.- matikisti
Juu, nykyään on olemassa tavutusalgoritmeja. Mutta kiinnostaisi vaan ihan yleisesti, mistä kannattaisi opetella tuollaista oppivan ohjelmoinnin teoriaa matikan ja tilastotieteen kannalta. Uskoisin, että tällaisen "yksinkertaisimman säännön" etsiminen voisi olla hyvinkin hyödyllinen monissa ohjelmointiprojekteissa, missä asiaa ei ole ennen tutkittu mutta jossain määrin optimaalinen sääntö tulisi löytää. Onko tämä pelkkää regressioanalyysiä vai käyttääkö vaikka itsestään ajavat autot tai Watson (http://en.wikipedia.org/wiki/Watson_(computer)) jotain muutakin oppimisalgoritmeja?
- temateekikko
Regressioanalyysiä ei missään nimessä. Käytännössä sinulla on edessä luokitteluongelma ja toimivat työkalut ovat tukivektorikone tai neuroverkot.
- Infoähkijä
Esittämäsi ongelma ei suinkaan ole merkityksetön. Nykyäänhän tietokoneet keräävät valtavan määrän kaikenlaista dataa. N.s. Big Data-ohjelmistot yrittävät löytää siitä jotain sääntöjä. Niitä yritetään käyttää esimerkiksi mainonnassa ja markkinoinnissa. Big Data on ehkä tulevaisuuden tilastotieteen kuuma aihe. Siinä tarvitaan varmasti myös matemaattista perustaa. Sovelllusalueiksi tulevat myös biologia ja lääketiede ja jopa politiikka.
Ketjusta on poistettu 0 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
Mielessäni vieläkin T
Harmi että siinä kävi niinkuin kävi, rakastin sinua. Toivotan sulle kaikkea hyvää. Toivottavasti löydät sopivan ja hyvän401992Pupuhuhdasta löytyi lähes sadan kilon miljoonalasti huumeita
Pupuhuhdasta löytyi lähes sadan kilon miljoonalasti huumeita – neljä Jyväskylän Outlaws MC:n jäsentä vangittu: "Määrät p431526Persut petti kannattajansa, totaalisesti !
Peraujen fundamentalisteille, vaihtkaa saittia. Muille, näin sen näimme. On helppo luvata kehareille, eikä ne ymmärrä,281438Nellietä Emmaa ja Amandaa stressaa
Ukkii minnuu Emmaa ja Amandaa stressaa ihan sikana joten voidaanko me koko kolmikko hypätä ukin kainaloon ja syleilyyn k61431- 191427
Nähtäiskö ylihuomenna taas siellä missä viimeksikin?
Otetaan ruokaöljyä, banaaneita ja tuorekurkkuja sinne messiin. Tehdään taas sitä meidän salakivaa.11395Sinäkö se olit...
Vai olitko? Jostain kumman syystä katse venyi.. Ajelin sitten miten sattuu ja sanoin ääneen siinä se nyt meni😅😅... Lis21367Housuvaippojen käyttö Suomi vs Ulkomaat
Suomessa housuvaippoja aletaan käyttämään vauvoilla heti, kun ne alkavat ryömiä. Tuntuu, että ulkomailla housuvaippoihin11300Hyvää yötä ja kauniita unia!
Täytyy alkaa taas nukkumaan, että jaksaa taas tämän päivän haasteet. Aikainen tipu madon löytää, vai miten se ärsyttävä21230Lepakot ja lepakkopönttö
Ajattelin tehdä lepakkopöntön. Tietääkö joku ovatko lepakot talvella lepakkopöntössä ´vai jossain muualla nukkumassa ta51217