Minulla oli vuosia sitten ohjelmointiongelma, jossa piti keksiä sopiva tavutusalgoritmi suomen kielen sanoille. En löytänyt netistä tai avoimen lähdekoodin ohjelmista tällaista, joten voiko tällaisen tehdä matemaattisesti? Siis että tietokantaan syötettäisiin sanoja ja niiden tavutuksia ja ohjelma laskisi säännön, jonka mukaan koettaisi arvata jonkun uuden sanan tavutuksen. Täydellisyyteen ei varmasti päästä, mutta voiko tietokonetta opettaa tuntemaan, miten annetut dataparit ennustavat tulevia havaintoja?
Voiko matematiikkaa tai tilastotiedettä käyttää tavutusalgoritmi
4
64
Vastaukset
- Että tälleen
Olen tehnyt 30 vuotta sitten yksinkertaisen suomen kielen tavutusalgoritmin, joka puri noin 90 prosenttiin suomen sanoista. Ongelmaksi jäivät vokaalitavut, yhdyssanat sekä vieraslähtöiset sanat.
Ideana oli muuttaa sanat konsonatti-vokaalijonoksi, josta voi helposti päätellä tavurajat. Ohjelma oli pituudeltaan vajaan vaaksan eli hyvin lyhyt.
Säännöt on kerrottu mm. tässä
http://www.kotus.fi/index.phtml?s=4363
Saataisipa noiden sääntöjen keksiminen onnistua oppivalta ohjelmaltakin, mutta tehtävä on varmastikin vaikeampi.- matikisti
Juu, nykyään on olemassa tavutusalgoritmeja. Mutta kiinnostaisi vaan ihan yleisesti, mistä kannattaisi opetella tuollaista oppivan ohjelmoinnin teoriaa matikan ja tilastotieteen kannalta. Uskoisin, että tällaisen "yksinkertaisimman säännön" etsiminen voisi olla hyvinkin hyödyllinen monissa ohjelmointiprojekteissa, missä asiaa ei ole ennen tutkittu mutta jossain määrin optimaalinen sääntö tulisi löytää. Onko tämä pelkkää regressioanalyysiä vai käyttääkö vaikka itsestään ajavat autot tai Watson (http://en.wikipedia.org/wiki/Watson_(computer)) jotain muutakin oppimisalgoritmeja?
- temateekikko
Regressioanalyysiä ei missään nimessä. Käytännössä sinulla on edessä luokitteluongelma ja toimivat työkalut ovat tukivektorikone tai neuroverkot.
- Infoähkijä
Esittämäsi ongelma ei suinkaan ole merkityksetön. Nykyäänhän tietokoneet keräävät valtavan määrän kaikenlaista dataa. N.s. Big Data-ohjelmistot yrittävät löytää siitä jotain sääntöjä. Niitä yritetään käyttää esimerkiksi mainonnassa ja markkinoinnissa. Big Data on ehkä tulevaisuuden tilastotieteen kuuma aihe. Siinä tarvitaan varmasti myös matemaattista perustaa. Sovelllusalueiksi tulevat myös biologia ja lääketiede ja jopa politiikka.
Ketjusta on poistettu 0 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
- 712338
Jotain puuttuu
Kun en sinua näe. Et ehkä arvaisi, mutta olen arka kuin alaston koivu lehtiä vailla, talven jäljiltä, kun ajattelen sinu1012113- 781738
Hei A, osaatko
sanoa, miksi olet ihan yhtäkkiä ilmestynyt kaveriehdotuksiini Facebookissa? Mitähän kaikkea Facebook tietää mitä minä en441547- 781536
- 111475
- 311439
Persuilla ja Saksi-Riikalla meni sitten pornon levittämiseksi koko touhu.
Onko kenellekään yllätys?521298Synnittömänä syntyminen
Helluntailaisperäisillä lahkoilla on Raamatunvastainen harhausko että ihminen syntyy synnittömänä.751258Mitä tämä tarkoittaa,
että näkyy vain viimevuotisia? Kirjoitin muutama tunti sitten viestin, onko se häipynyt avaruuteen?301209