Suomi24 Keskustelussa on viikonlopun aikana ollut poikkeuksellisen paljon bottien automaattiseti luomia kommentteja. Pahoittelemme tästä aiheutunutta harmia. Olemme kiristäneet Keskustelujen suojausasetuksia ja kommentointi on toistaiseksi estetty ulkomailta.

Voiko matematiikkaa tai tilastotiedettä käyttää tavutusalgoritmi

matikisti

Minulla oli vuosia sitten ohjelmointiongelma, jossa piti keksiä sopiva tavutusalgoritmi suomen kielen sanoille. En löytänyt netistä tai avoimen lähdekoodin ohjelmista tällaista, joten voiko tällaisen tehdä matemaattisesti? Siis että tietokantaan syötettäisiin sanoja ja niiden tavutuksia ja ohjelma laskisi säännön, jonka mukaan koettaisi arvata jonkun uuden sanan tavutuksen. Täydellisyyteen ei varmasti päästä, mutta voiko tietokonetta opettaa tuntemaan, miten annetut dataparit ennustavat tulevia havaintoja?

4

64

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • Että tälleen

      Olen tehnyt 30 vuotta sitten yksinkertaisen suomen kielen tavutusalgoritmin, joka puri noin 90 prosenttiin suomen sanoista. Ongelmaksi jäivät vokaalitavut, yhdyssanat sekä vieraslähtöiset sanat.

      Ideana oli muuttaa sanat konsonatti-vokaalijonoksi, josta voi helposti päätellä tavurajat. Ohjelma oli pituudeltaan vajaan vaaksan eli hyvin lyhyt.

      Säännöt on kerrottu mm. tässä

      http://www.kotus.fi/index.phtml?s=4363

      Saataisipa noiden sääntöjen keksiminen onnistua oppivalta ohjelmaltakin, mutta tehtävä on varmastikin vaikeampi.

      • matikisti

        Juu, nykyään on olemassa tavutusalgoritmeja. Mutta kiinnostaisi vaan ihan yleisesti, mistä kannattaisi opetella tuollaista oppivan ohjelmoinnin teoriaa matikan ja tilastotieteen kannalta. Uskoisin, että tällaisen "yksinkertaisimman säännön" etsiminen voisi olla hyvinkin hyödyllinen monissa ohjelmointiprojekteissa, missä asiaa ei ole ennen tutkittu mutta jossain määrin optimaalinen sääntö tulisi löytää. Onko tämä pelkkää regressioanalyysiä vai käyttääkö vaikka itsestään ajavat autot tai Watson (http://en.wikipedia.org/wiki/Watson_(computer)) jotain muutakin oppimisalgoritmeja?


    • temateekikko

      Regressioanalyysiä ei missään nimessä. Käytännössä sinulla on edessä luokitteluongelma ja toimivat työkalut ovat tukivektorikone tai neuroverkot.

    • Infoähkijä

      Esittämäsi ongelma ei suinkaan ole merkityksetön. Nykyäänhän tietokoneet keräävät valtavan määrän kaikenlaista dataa. N.s. Big Data-ohjelmistot yrittävät löytää siitä jotain sääntöjä. Niitä yritetään käyttää esimerkiksi mainonnassa ja markkinoinnissa. Big Data on ehkä tulevaisuuden tilastotieteen kuuma aihe. Siinä tarvitaan varmasti myös matemaattista perustaa. Sovelllusalueiksi tulevat myös biologia ja lääketiede ja jopa politiikka.

    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Takaisin ylös

    Luetuimmat keskustelut

    1. Millä voin

      Hyvittää kaiken?
      Ikävä
      71
      2338
    2. Jotain puuttuu

      Kun en sinua näe. Et ehkä arvaisi, mutta olen arka kuin alaston koivu lehtiä vailla, talven jäljiltä, kun ajattelen sinu
      Ikävä
      101
      2113
    3. Haluan sut

      Haluatko sinä vielä mut?
      Ikävä
      78
      1738
    4. Hei A, osaatko

      sanoa, miksi olet ihan yhtäkkiä ilmestynyt kaveriehdotuksiini Facebookissa? Mitähän kaikkea Facebook tietää mitä minä en
      Ikävä
      44
      1547
    5. Haluaisin aidosti jo luovuttaa ja unohtaa

      Ei tästä mitään tule koskaan.
      Ikävä
      78
      1536
    6. Ampuminen Iisalmessa

      Älytöntä on tämä maailman meno.
      Iisalmi
      11
      1475
    7. Pohjola kadulla paukuteltu

      Iltasanomissa juttua.
      Iisalmi
      31
      1439
    8. 52
      1298
    9. Synnittömänä syntyminen

      Helluntailaisperäisillä lahkoilla on Raamatunvastainen harhausko että ihminen syntyy synnittömänä.
      Helluntailaisuus
      75
      1258
    10. Mitä tämä tarkoittaa,

      että näkyy vain viimevuotisia? Kirjoitin muutama tunti sitten viestin, onko se häipynyt avaruuteen?
      Ikävä
      30
      1209
    Aihe