Sanalistat?

Anonyymi

Onko Linuxille jotain pakettia, mistä voisi poimia englannin ja ruotsin kielen sanalistat? Eli kaikki sanat perusmuodossa, mieluummin txt muodossa?
Noin 100 000 kpl / kieli.

20

105

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • Anonyymi

      Minulla on 4100545 suomenkielistä sanaa.

      • Anonyymi

        Tuskin ovat perusmuodossa. Suomen kielessä ei taida edes olla 4 miljoonaa sanaa. Veikkaan että 400 000 - 300 000 sanaa maksimissaan. Sillä en ole nähnyt yhtään sanakirjaa (painettua) missä olisi yli 130 000 suomenkielistä sanaa.


    • Anonyymi

      Kotuksen sivuilta saa suomen- ja ruotsinkieliset listat. Eiköhän englanniksi löydy joku vastaava. Ihan tarpeetonta itsensä kiusaamista etsiä tuollaista jostain Linux-paketista kun saman löytää helpommin käyttämällä aivoja.

      • Anonyymi

        Ruotsinkieliset listat? Missä? Löysin vain suomen!


      • Anonyymi
        Anonyymi kirjoitti:

        Ruotsinkieliset listat? Missä? Löysin vain suomen!

        Tjaa, nyt taisi vanhan muisti pettää. Jostain muistan vastaavan listan ladanneeni ruotsiksikin, ja muistelin että ne olisivat molemmat kotuksesta, mutta eipä tuolla tosiaan enää sellaista näy.


    • Anonyymi

      www.sanakirja.org mainostaa sivun alalaidassa:

      Sanoja yhteensä 7 800 122. Käännöksiä yhteensä 7 172 572.

      No minä yritin kääntää sanan "kirjat" englanniksi, ja sain vastaukseksi:

      Tarkoititko lukea?

      Voi helavatan hevatta!!

    • Anonyymi

      Onko sinulla suomenkielistä sanastoa, nimittäin "trans" on ohjelma jolla voit kääntää sanan, lauseen tai jopa tiedoston mille tahansa Google kääntäjän tukevalle kielelle.

      Pistät yöksi koneen trallattamaan käännöstä.

    • Anonyymi

      Ihan hupina testasin tuota "trans" ohjelmaa, pistämällä 10 sanaa tiedostoon ja otin ajan mikä meni kääntäessä.

      Aika oli real 0m1,950s

      joten 8 tunnin unet otat, niin on herätessä käännetty 14400 sanan sanasto.

      • Anonyymi

        Toimiiko sinulla tuo trans silmukassa?

        Noin 30-40 sanan jälkeen taisin saada bannit. Nyt tuo trans palauttaa vain tyhjän rivin.

        Kauanko bannit kestää?


    • Anonyymi

      Vielä löysin pyglossary ohjelman, jolla noita sanastoja voi muokata formaatista toiseen. Yritin hupina voikon XLM muodossa olevan sanaston muuntaa *.TXT muotoon, ei onnistunut.

      Ongelma on siinä että käyttäjän täytyy tietää, missä muodossa syöttösanasto on, ja se vaikuttaa olevan ihan oma tieteenlajinsa.

      Voi olla syynä myös tiedoston suuri koko yli 8Mt. Päätin siivota sen sitten grep -komennoin, ja loppu tulos oli ettei se sisältänyt kuin vajaat puolet tuosta mitä olit kaipailemassa.

    • Anonyymi
      • Anonyymi

        lisäänpä vielä että sanalistat MS-Access tietokantana tai Excel or SQL formaatissa ovat hiton arvokkaita 1,690.00 € (plus tax/VAT), joten en usko että niitä joka paikassa ollaan ilmaiseksi jakamassa. Tämä siksi että osaat arvostaa pienempääkin listaa.


      • Anonyymi
        Anonyymi kirjoitti:

        lisäänpä vielä että sanalistat MS-Access tietokantana tai Excel or SQL formaatissa ovat hiton arvokkaita 1,690.00 € (plus tax/VAT), joten en usko että niitä joka paikassa ollaan ilmaiseksi jakamassa. Tämä siksi että osaat arvostaa pienempääkin listaa.

        Tuo sanastohan sisältää 410 786 sanaa, joten ei ihan mitätön tuokaa ole. LibreOfficeen saa myös ladattua Ruotsin sanaston, Ruotsin oikoluvun ja Ruotsalaisen tavutuksen.


      • Anonyymi
        Anonyymi kirjoitti:

        Tuo sanastohan sisältää 410 786 sanaa, joten ei ihan mitätön tuokaa ole. LibreOfficeen saa myös ladattua Ruotsin sanaston, Ruotsin oikoluvun ja Ruotsalaisen tavutuksen.

        Aika paljon roskaa siinä on. Ja monet sanat eivät ole perusmuodossa, vaan taivutettu:

        baseballmatch
        baseballmatchen
        baseballmatchens
        baseballmatcher
        baseballmatcherna
        baseballmatchernas
        baseballmatchers
        baseballmatchs


      • Anonyymi
        Anonyymi kirjoitti:

        Aika paljon roskaa siinä on. Ja monet sanat eivät ole perusmuodossa, vaan taivutettu:

        baseballmatch
        baseballmatchen
        baseballmatchens
        baseballmatcher
        baseballmatcherna
        baseballmatchernas
        baseballmatchers
        baseballmatchs

        Aivan ja siinä on yhdysanoja, ilmeisesti kaipaa niitäkään.


      • Anonyymi
        Anonyymi kirjoitti:

        lisäänpä vielä että sanalistat MS-Access tietokantana tai Excel or SQL formaatissa ovat hiton arvokkaita 1,690.00 € (plus tax/VAT), joten en usko että niitä joka paikassa ollaan ilmaiseksi jakamassa. Tämä siksi että osaat arvostaa pienempääkin listaa.

        Ruotsalaisilla on sanalista-appi Androidille: "Svenska Akademiens ordlista"

        Jonka voi ladata tuolla: https://apkgk.com/se.svenskaakademien.saol/download

        Ja tuo 294 MB tiedosto on SQLite 3 tietokanta.

        Siitä saisi ripattua aika laadukkaankin sanalistan.


      • Anonyymi
        Anonyymi kirjoitti:

        Ruotsalaisilla on sanalista-appi Androidille: "Svenska Akademiens ordlista"

        Jonka voi ladata tuolla: https://apkgk.com/se.svenskaakademien.saol/download

        Ja tuo 294 MB tiedosto on SQLite 3 tietokanta.

        Siitä saisi ripattua aika laadukkaankin sanalistan.

        Joo, tuossa ovat taivutukset eri taulussa kuin perusmuodot. Perusmuodot on taulussa "c0kompakt"


      • Anonyymi
        Anonyymi kirjoitti:

        Joo, tuossa ovat taivutukset eri taulussa kuin perusmuodot. Perusmuodot on taulussa "c0kompakt"

        Taulussa on 122 472 sanaa.


      • Anonyymi
        Anonyymi kirjoitti:

        Taulussa on 122 472 sanaa.

        Siinä se taisi löytyä, lopetan etsimisen, tuo on hyvä.


      • Anonyymi
        Anonyymi kirjoitti:

        Siinä se taisi löytyä, lopetan etsimisen, tuo on hyvä.

        Vielä jos löytäisi yhtä laadukkaan englanninkielisen listan!


    Ketjusta on poistettu 1 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Mihin kaivattusi

      Ja sinun juttusi kaatui?
      Ikävä
      180
      8316
    2. En löydä sinua

      En löydä sinua täältä, etkä sinä varmaankaan minua. Ennen kirjoitin selkeillä tunnisteilla, nyt jätän ne pois. Varmaan k
      Ikävä
      26
      4518
    3. Ketä julkkista

      kaivattunne muistuttaa?
      Ikävä
      50
      4088
    4. Tunniste

      Jonka vain sinä ja kaivattusi tietää. ⬇️
      Ikävä
      51
      3365
    5. Opettelen sun jokaisen virheen

      ja rakastan sua.
      Ikävä
      51
      3106
    6. Miten, milloin

      Se onnistuisi sun luona
      Ikävä
      50
      2860
    7. Ne oli ne hymyt

      Mitä vaihdettiin. Siksi mulla on taas niin järjetön ikävä. Jos haluat musta eroon päästä niin älä huomioi mua. Muuten kä
      Ikävä
      26
      2546
    8. Haluan huomiota sulta

      nainen…tiedoksi. 😥❤️ -M-
      Ikävä
      31
      2139
    9. Anteeksi kun käyttäydyn

      niin ristiriitaisesti. Mä en usko että haluaisit minusta mitään, hyvässä tapauksessa olet unohtanut minut. Ja silti toiv
      Ikävä
      38
      2003
    10. Mitä haluat oikeasti

      Mun ymmärtävän? Sitäkö ettet rakasta ja ole valmis mihinkään?
      Ikävä
      29
      1996
    Aihe