Sanalistat?

Anonyymi

Onko Linuxille jotain pakettia, mistä voisi poimia englannin ja ruotsin kielen sanalistat? Eli kaikki sanat perusmuodossa, mieluummin txt muodossa?
Noin 100 000 kpl / kieli.

20

97

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • Anonyymi

      Minulla on 4100545 suomenkielistä sanaa.

      • Anonyymi

        Tuskin ovat perusmuodossa. Suomen kielessä ei taida edes olla 4 miljoonaa sanaa. Veikkaan että 400 000 - 300 000 sanaa maksimissaan. Sillä en ole nähnyt yhtään sanakirjaa (painettua) missä olisi yli 130 000 suomenkielistä sanaa.


    • Anonyymi

      Kotuksen sivuilta saa suomen- ja ruotsinkieliset listat. Eiköhän englanniksi löydy joku vastaava. Ihan tarpeetonta itsensä kiusaamista etsiä tuollaista jostain Linux-paketista kun saman löytää helpommin käyttämällä aivoja.

      • Anonyymi

        Ruotsinkieliset listat? Missä? Löysin vain suomen!


      • Anonyymi
        Anonyymi kirjoitti:

        Ruotsinkieliset listat? Missä? Löysin vain suomen!

        Tjaa, nyt taisi vanhan muisti pettää. Jostain muistan vastaavan listan ladanneeni ruotsiksikin, ja muistelin että ne olisivat molemmat kotuksesta, mutta eipä tuolla tosiaan enää sellaista näy.


    • Anonyymi

      www.sanakirja.org mainostaa sivun alalaidassa:

      Sanoja yhteensä 7 800 122. Käännöksiä yhteensä 7 172 572.

      No minä yritin kääntää sanan "kirjat" englanniksi, ja sain vastaukseksi:

      Tarkoititko lukea?

      Voi helavatan hevatta!!

    • Anonyymi

      Onko sinulla suomenkielistä sanastoa, nimittäin "trans" on ohjelma jolla voit kääntää sanan, lauseen tai jopa tiedoston mille tahansa Google kääntäjän tukevalle kielelle.

      Pistät yöksi koneen trallattamaan käännöstä.

    • Anonyymi

      Ihan hupina testasin tuota "trans" ohjelmaa, pistämällä 10 sanaa tiedostoon ja otin ajan mikä meni kääntäessä.

      Aika oli real 0m1,950s

      joten 8 tunnin unet otat, niin on herätessä käännetty 14400 sanan sanasto.

      • Anonyymi

        Toimiiko sinulla tuo trans silmukassa?

        Noin 30-40 sanan jälkeen taisin saada bannit. Nyt tuo trans palauttaa vain tyhjän rivin.

        Kauanko bannit kestää?


    • Anonyymi

      Vielä löysin pyglossary ohjelman, jolla noita sanastoja voi muokata formaatista toiseen. Yritin hupina voikon XLM muodossa olevan sanaston muuntaa *.TXT muotoon, ei onnistunut.

      Ongelma on siinä että käyttäjän täytyy tietää, missä muodossa syöttösanasto on, ja se vaikuttaa olevan ihan oma tieteenlajinsa.

      Voi olla syynä myös tiedoston suuri koko yli 8Mt. Päätin siivota sen sitten grep -komennoin, ja loppu tulos oli ettei se sisältänyt kuin vajaat puolet tuosta mitä olit kaipailemassa.

    • Anonyymi
      • Anonyymi

        lisäänpä vielä että sanalistat MS-Access tietokantana tai Excel or SQL formaatissa ovat hiton arvokkaita 1,690.00 € (plus tax/VAT), joten en usko että niitä joka paikassa ollaan ilmaiseksi jakamassa. Tämä siksi että osaat arvostaa pienempääkin listaa.


      • Anonyymi
        Anonyymi kirjoitti:

        lisäänpä vielä että sanalistat MS-Access tietokantana tai Excel or SQL formaatissa ovat hiton arvokkaita 1,690.00 € (plus tax/VAT), joten en usko että niitä joka paikassa ollaan ilmaiseksi jakamassa. Tämä siksi että osaat arvostaa pienempääkin listaa.

        Tuo sanastohan sisältää 410 786 sanaa, joten ei ihan mitätön tuokaa ole. LibreOfficeen saa myös ladattua Ruotsin sanaston, Ruotsin oikoluvun ja Ruotsalaisen tavutuksen.


      • Anonyymi
        Anonyymi kirjoitti:

        Tuo sanastohan sisältää 410 786 sanaa, joten ei ihan mitätön tuokaa ole. LibreOfficeen saa myös ladattua Ruotsin sanaston, Ruotsin oikoluvun ja Ruotsalaisen tavutuksen.

        Aika paljon roskaa siinä on. Ja monet sanat eivät ole perusmuodossa, vaan taivutettu:

        baseballmatch
        baseballmatchen
        baseballmatchens
        baseballmatcher
        baseballmatcherna
        baseballmatchernas
        baseballmatchers
        baseballmatchs


      • Anonyymi
        Anonyymi kirjoitti:

        Aika paljon roskaa siinä on. Ja monet sanat eivät ole perusmuodossa, vaan taivutettu:

        baseballmatch
        baseballmatchen
        baseballmatchens
        baseballmatcher
        baseballmatcherna
        baseballmatchernas
        baseballmatchers
        baseballmatchs

        Aivan ja siinä on yhdysanoja, ilmeisesti kaipaa niitäkään.


      • Anonyymi
        Anonyymi kirjoitti:

        lisäänpä vielä että sanalistat MS-Access tietokantana tai Excel or SQL formaatissa ovat hiton arvokkaita 1,690.00 € (plus tax/VAT), joten en usko että niitä joka paikassa ollaan ilmaiseksi jakamassa. Tämä siksi että osaat arvostaa pienempääkin listaa.

        Ruotsalaisilla on sanalista-appi Androidille: "Svenska Akademiens ordlista"

        Jonka voi ladata tuolla: https://apkgk.com/se.svenskaakademien.saol/download

        Ja tuo 294 MB tiedosto on SQLite 3 tietokanta.

        Siitä saisi ripattua aika laadukkaankin sanalistan.


      • Anonyymi
        Anonyymi kirjoitti:

        Ruotsalaisilla on sanalista-appi Androidille: "Svenska Akademiens ordlista"

        Jonka voi ladata tuolla: https://apkgk.com/se.svenskaakademien.saol/download

        Ja tuo 294 MB tiedosto on SQLite 3 tietokanta.

        Siitä saisi ripattua aika laadukkaankin sanalistan.

        Joo, tuossa ovat taivutukset eri taulussa kuin perusmuodot. Perusmuodot on taulussa "c0kompakt"


      • Anonyymi
        Anonyymi kirjoitti:

        Joo, tuossa ovat taivutukset eri taulussa kuin perusmuodot. Perusmuodot on taulussa "c0kompakt"

        Taulussa on 122 472 sanaa.


      • Anonyymi
        Anonyymi kirjoitti:

        Taulussa on 122 472 sanaa.

        Siinä se taisi löytyä, lopetan etsimisen, tuo on hyvä.


      • Anonyymi
        Anonyymi kirjoitti:

        Siinä se taisi löytyä, lopetan etsimisen, tuo on hyvä.

        Vielä jos löytäisi yhtä laadukkaan englanninkielisen listan!


    Ketjusta on poistettu 1 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Oletko mokannut?

      Oletko omasta mielestäsi mokannut jotain kaivattusi suhteen?
      Ikävä
      183
      2254
    2. Oletko ymmärtänyt

      Oletko ymmärtänyt jotain kaivatustasi lähiaikoina tai oletko muuttanut mielipidettäsi kaivatustasi?
      Ikävä
      172
      2000
    3. Sanna Ukkolan kolumni: Rautarouva, joka unohti joukkonsa - Riikka Purran pitäisi katsoa peiliin

      "Historialliset tappiot eivät synny vahingossa. Ne syntyvät, kun johtaja unohtaa, ketä hänen piti palvella, kirjoittaa I
      Perussuomalaiset
      44
      1943
    4. Ottaisitko miten

      Kaivattusi?
      Ikävä
      128
      1650
    5. Ikäero suhteessa

      Huomasin äsken Iltalehden tuoreen artikkelin, jossa kerrottiin, että vain 5% parisuhteista on yli 10v ikäero. Millaisia
      Parisuhde
      64
      1529
    6. Liian paljon hylättyjä ääniä

      Ottakaa avustaja mukaan jos ette osaa äänestää oikein. Moni varmaan sekosi kahden listan ja lipun takia. Oliko tarkoitus
      Maailman menoa
      192
      1482
    7. Tiedän kyllä sen

      Että käyt täällä. En kuvittelisi sellaista asiaa. Tiedän kyllä senkin, että olet ainakin ollut minusta kiinnostunut. Sen
      Ikävä
      77
      1221
    8. Ähtärin vaalitulos ja nyt neuvottelut alkavat

      Keskusta voitti yhden paikan Ähtärissä kun oli hyvin ehdokkaita ( 32) ja kansanedustaja veturina keräämässä ääniä. P
      Ähtäri
      32
      1094
    9. Taas syytöntä illlllkkaa rangaistiin

      Niin se vain paha saa palkkansa ja rääsyämiselle ja räkimiselle laskettiin hinta. Ottaisi nyt tuo onneton lusikan kauni
      Haapavesi
      77
      1073
    10. Ärsyttää et olet

      Niin välinpitämätön suhteeni
      Ikävä
      71
      1063
    Aihe