Mistä suomen kielen sanasto/sanatietokanta?

Adamantium

Haluaisin tietokoneelle sanaston, jossa on kaikki suomen kielen sanat ja mahdollisesti myös niiden sanaluokat, taivutusmuodot tms. mutta ainakin sanat. Sellaisessa muodossa, että niitä pystyy käsittelemään omilla tietokoneohjelmilla ja tekemään kaikkea kivaa.

Onko jollain tietoa mistä tällasen voisi hankkia?

Minulle on ehdotettu sanakirjoja, mutta en tiedä, miten niistä voisi "kaivaa" kaikki sanat käsiteltävään muotoon.

15

988

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • haluaisin

      tietokoneelleni ohjelman, joka kääntäisi
      tuotteeni kaikille mahdollisille kielille,
      suorittaisi tavutukset ja taivutukset.
      Kaikkein parasta olisi, jos ohjelma tekisi
      koti- ja työtehtäväni ihan minun puolestani,
      ettei minun tarvitsisi edes ajatella koko asiaa.

      • Adamantium

        Mielestäni toiveeni on ihan realistinen ja toteutettavissaoleva, enkä pyydä jotain, että olisipa laite, joka ajattelee puolestani, tekee safkaa, siivoaa, käy töissä...

        Luulisi, että on olemassa tietokanta kaikista suomen sanoista (ainakin poislukien yhdyssanat, joita voi keksiä mielivaltaisesti) ja on olemassa mahdollisuus saada se.


      • hölömö
        Adamantium kirjoitti:

        Mielestäni toiveeni on ihan realistinen ja toteutettavissaoleva, enkä pyydä jotain, että olisipa laite, joka ajattelee puolestani, tekee safkaa, siivoaa, käy töissä...

        Luulisi, että on olemassa tietokanta kaikista suomen sanoista (ainakin poislukien yhdyssanat, joita voi keksiä mielivaltaisesti) ja on olemassa mahdollisuus saada se.

        Kielihän kehittyy jatkuvasti.


      • Rexa
        hölömö kirjoitti:

        Kielihän kehittyy jatkuvasti.

        Jos suomen kielestä puhut, aika on muuttanut sitä, ei kehittänyt :(


    • Takametsien Mies

      Taitaisipa tarvettasi parhaiten vastata CD-perussanakirja. CD-Perussanakirja (1997) on Suomen kielen perussanakirjaan pohjautuva sähköinen sanakirja, jonka hakusanastoa on päivitetty 2 000 uudella sanalla ja johon on merkitty kaikkien taipuvien hakusanojen taivutus näkyviin.

      http://www.kotus.fi/julkaisut/sanakirjat/cdps/

      --

      • 2005 vuodelta

      • Takametsien Mies

      • Adamantium

        Eli siis tarkoitukseni EI OLE saada sanakirjaa, jota käytetään sanakirjaohjelman omalla käyttöliittymällä ja sanoja haetaan manuaalisesti.

        Sen sijaan haluaisin sanaston niin, että voisin tehdä omia ohjelmia, jotka automaattisesti käsittelevät sanastoja ja tuottavat jotain mielenkiintoista tietoa.

        Yksinkertaisena ja tylsähkönä esimerkkinä jos vaikka haluaisin tehdä ohjelman, joka tekee annetuista sanoista anagrammeja, en voisi sitä toteuttaa CD-sanakirjan avulla, koska ohjelmani ei pääse käsiksi CD-sanakirjan käyttämään omaan sanatietokantaansa.


      • Takametsien Mies
        Adamantium kirjoitti:

        Eli siis tarkoitukseni EI OLE saada sanakirjaa, jota käytetään sanakirjaohjelman omalla käyttöliittymällä ja sanoja haetaan manuaalisesti.

        Sen sijaan haluaisin sanaston niin, että voisin tehdä omia ohjelmia, jotka automaattisesti käsittelevät sanastoja ja tuottavat jotain mielenkiintoista tietoa.

        Yksinkertaisena ja tylsähkönä esimerkkinä jos vaikka haluaisin tehdä ohjelman, joka tekee annetuista sanoista anagrammeja, en voisi sitä toteuttaa CD-sanakirjan avulla, koska ohjelmani ei pääse käsiksi CD-sanakirjan käyttämään omaan sanatietokantaansa.

        Anagrammigeneraattoreita on tehtykin ja niitä löytyy netistä. Mm. Arrak käyttää vapaasti netistä löytyviä sanastoja - jos tarvitset sanastoja, kannattaisi ehkä kysellä Arrakin tekijöiltä, mistä ovat omansa löytäneet...


      • Takametsien Mies
        Takametsien Mies kirjoitti:

        Anagrammigeneraattoreita on tehtykin ja niitä löytyy netistä. Mm. Arrak käyttää vapaasti netistä löytyviä sanastoja - jos tarvitset sanastoja, kannattaisi ehkä kysellä Arrakin tekijöiltä, mistä ovat omansa löytäneet...

        Vilkaiseppa vaikka tästä linkistä:

        http://snowball.tartarus.org/finnish/

        Sieltä löytyy ainakin yksi sanasto ja löytyypä vielä taivutusalgoritmikin suomen kielelle.


      • Adamantium
        Takametsien Mies kirjoitti:

        Anagrammigeneraattoreita on tehtykin ja niitä löytyy netistä. Mm. Arrak käyttää vapaasti netistä löytyviä sanastoja - jos tarvitset sanastoja, kannattaisi ehkä kysellä Arrakin tekijöiltä, mistä ovat omansa löytäneet...

        Moi, kiitos, ja anteeksi kyltymättömyyteni.

        Kyseiseen sanastoon (joka on snowballin mukana sekä Arrakissa) olen tutustunut. Siinä valitettavasti on sanoja perusmuodossa että niiden seassa on satunnaisia taivutettuja muotoja niistä. Joistain jopa on pelkkiä taivutettuja muotoja. Tämä sanasto on luoto käymällä läpi internetin sivuja/keskusteluita ja keräämällä niistä sanoja.
        Se riittää aluksi, mutta nälkä kasvaa...


      • Takametsien Mies
        Adamantium kirjoitti:

        Moi, kiitos, ja anteeksi kyltymättömyyteni.

        Kyseiseen sanastoon (joka on snowballin mukana sekä Arrakissa) olen tutustunut. Siinä valitettavasti on sanoja perusmuodossa että niiden seassa on satunnaisia taivutettuja muotoja niistä. Joistain jopa on pelkkiä taivutettuja muotoja. Tämä sanasto on luoto käymällä läpi internetin sivuja/keskusteluita ja keräämällä niistä sanoja.
        Se riittää aluksi, mutta nälkä kasvaa...

        Vilkaiseppa tämäkin sanasto:
        http://humfs1.uchicago.edu/~jagoldsm/Finnish/Finnish_List.txt

        Suomen jäsentimestä saattaisi olla apua perusmuotojen seulomisessa, sellainenkin löytyy netistä.


      • hölömö

    • Marjaana

      Ei kaikkia suomen sanoja voi kukaan koskaan luetella, eikä kukaan ole niin hullu että luettelisi edes merkittävää osaa ilmaiseksi toisten hyödynnettäväksi.

      • Adamantium

        Tiedän että on mahdotonta luetella kaikkia sanoja.
        Niitä voidaan "tehdä" lisää yhdistelemällä ja taivuttelemalla ja vaikka miten. Kieli vieläpä elää, tulee uusia sanoja tms.

        Olen perillä tästä asiasta.

        Riittää, jos on sellainen "sanakirjasanasto" että on tavallisimmat sanat. Jos niihin on sisällytetty sanaluokka ja taivutusinformaatio, niitä voi sitten väännellä vaikka itse...

        Lisäksi ymmärrän ettei kukaan tee tätä MINUA VARTEN ilmaiseksi, enkä vaadikaan sitä, enkä oleta. Jos löydän jonkun hyvän, ei ole poissuljettua että siitä voisi maksaakin.

        tässä on liikaa keskitytty nyt hieromaan sanaa "kaikki".


    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Kumpi teki aloitteen?

      😃 häh
      Ikävä
      109
      4246
    2. Onko kaivattusi ulkoisesti

      paremman vai huonomman näköinen kuin exäsi? 🪤
      Ikävä
      78
      3476
    3. Oletko koskaan stalkannut kaivattuasi?

      Jos olet, miten olet stalkannut? Jäitkö kiinni? Onko hän stalkannut sinua? Jos on, miten suhtauduit?
      Ikävä
      80
      3302
    4. Karhuryhmä

      Kellään tarkempaa tietoa miksi ja missä karhuryhmä ollut? Perheväkivaltaa vai huumeperintää kenties taas?
      Jämsä
      24
      3209
    5. Just alkoi ottamaan päähän

      Miten voikin mennä näin, että koko päivän haluaa vain nähdä toisen ja lähelle. Sitten aivan salamana mieleen tulee kaikk
      Ikävä
      22
      3162
    6. Mitä kaikkea sä

      Olisit valmis tekeen mun eteen vielä? Vai oletko mitään?
      Ikävä
      72
      2906
    7. "Mielipide: Äärivasemmiston uhka on otettava vakavasti"

      Demokratia näyttäisi olevan Halla-aholle enemmänkin välttämätön paha kuin tavoiteltava asia. Väkivallan ihannointi ja m
      Maailman menoa
      45
      2780
    8. Raisionkaaren koira hyökkäys

      Taas nähtiin että koiriin ei voi luottaa. Eilen illalla vapaana ollut koira hyökkäsi Raisionkaarella kolmen henkilön kim
      Raisio
      62
      2743
    9. Tapa jolla kohtelit minua viimeksi miellytti erityisesti

      Osaat huomioida kauniisti ja katsot aina tilanteita yhteisen hyvän kannalta. Sitä arvostan erityisesti.
      Ikävä
      85
      2549
    10. Ei me saada toisiamme

      Ei vaan saada. On vain haaveita ja uunelmia
      Ikävä
      33
      2384
    Aihe