Onko Linuxille jotain pakettia, mistä voisi poimia englannin ja ruotsin kielen sanalistat? Eli kaikki sanat perusmuodossa, mieluummin txt muodossa?
Noin 100 000 kpl / kieli.
Sanalistat?
20
105
Vastaukset
- Anonyymi
Minulla on 4100545 suomenkielistä sanaa.
- Anonyymi
Tuskin ovat perusmuodossa. Suomen kielessä ei taida edes olla 4 miljoonaa sanaa. Veikkaan että 400 000 - 300 000 sanaa maksimissaan. Sillä en ole nähnyt yhtään sanakirjaa (painettua) missä olisi yli 130 000 suomenkielistä sanaa.
- Anonyymi
Kotuksen sivuilta saa suomen- ja ruotsinkieliset listat. Eiköhän englanniksi löydy joku vastaava. Ihan tarpeetonta itsensä kiusaamista etsiä tuollaista jostain Linux-paketista kun saman löytää helpommin käyttämällä aivoja.
- Anonyymi
Ruotsinkieliset listat? Missä? Löysin vain suomen!
- Anonyymi
Anonyymi kirjoitti:
Ruotsinkieliset listat? Missä? Löysin vain suomen!
Tjaa, nyt taisi vanhan muisti pettää. Jostain muistan vastaavan listan ladanneeni ruotsiksikin, ja muistelin että ne olisivat molemmat kotuksesta, mutta eipä tuolla tosiaan enää sellaista näy.
- Anonyymi
www.sanakirja.org mainostaa sivun alalaidassa:
Sanoja yhteensä 7 800 122. Käännöksiä yhteensä 7 172 572.
No minä yritin kääntää sanan "kirjat" englanniksi, ja sain vastaukseksi:
Tarkoititko lukea?
Voi helavatan hevatta!! - Anonyymi
Onko sinulla suomenkielistä sanastoa, nimittäin "trans" on ohjelma jolla voit kääntää sanan, lauseen tai jopa tiedoston mille tahansa Google kääntäjän tukevalle kielelle.
Pistät yöksi koneen trallattamaan käännöstä. - Anonyymi
Ihan hupina testasin tuota "trans" ohjelmaa, pistämällä 10 sanaa tiedostoon ja otin ajan mikä meni kääntäessä.
Aika oli real 0m1,950s
joten 8 tunnin unet otat, niin on herätessä käännetty 14400 sanan sanasto.- Anonyymi
Toimiiko sinulla tuo trans silmukassa?
Noin 30-40 sanan jälkeen taisin saada bannit. Nyt tuo trans palauttaa vain tyhjän rivin.
Kauanko bannit kestää?
- Anonyymi
Vielä löysin pyglossary ohjelman, jolla noita sanastoja voi muokata formaatista toiseen. Yritin hupina voikon XLM muodossa olevan sanaston muuntaa *.TXT muotoon, ei onnistunut.
Ongelma on siinä että käyttäjän täytyy tietää, missä muodossa syöttösanasto on, ja se vaikuttaa olevan ihan oma tieteenlajinsa.
Voi olla syynä myös tiedoston suuri koko yli 8Mt. Päätin siivota sen sitten grep -komennoin, ja loppu tulos oli ettei se sisältänyt kuin vajaat puolet tuosta mitä olit kaipailemassa. - Anonyymi
Tälläkin pääsisit alkuun:
https://raw.githubusercontent.com/martinlindhe/wordlist_swedish/master/swe_wordlist- Anonyymi
lisäänpä vielä että sanalistat MS-Access tietokantana tai Excel or SQL formaatissa ovat hiton arvokkaita 1,690.00 € (plus tax/VAT), joten en usko että niitä joka paikassa ollaan ilmaiseksi jakamassa. Tämä siksi että osaat arvostaa pienempääkin listaa.
- Anonyymi
Anonyymi kirjoitti:
lisäänpä vielä että sanalistat MS-Access tietokantana tai Excel or SQL formaatissa ovat hiton arvokkaita 1,690.00 € (plus tax/VAT), joten en usko että niitä joka paikassa ollaan ilmaiseksi jakamassa. Tämä siksi että osaat arvostaa pienempääkin listaa.
Tuo sanastohan sisältää 410 786 sanaa, joten ei ihan mitätön tuokaa ole. LibreOfficeen saa myös ladattua Ruotsin sanaston, Ruotsin oikoluvun ja Ruotsalaisen tavutuksen.
- Anonyymi
Anonyymi kirjoitti:
Tuo sanastohan sisältää 410 786 sanaa, joten ei ihan mitätön tuokaa ole. LibreOfficeen saa myös ladattua Ruotsin sanaston, Ruotsin oikoluvun ja Ruotsalaisen tavutuksen.
Aika paljon roskaa siinä on. Ja monet sanat eivät ole perusmuodossa, vaan taivutettu:
baseballmatch
baseballmatchen
baseballmatchens
baseballmatcher
baseballmatcherna
baseballmatchernas
baseballmatchers
baseballmatchs - Anonyymi
Anonyymi kirjoitti:
Aika paljon roskaa siinä on. Ja monet sanat eivät ole perusmuodossa, vaan taivutettu:
baseballmatch
baseballmatchen
baseballmatchens
baseballmatcher
baseballmatcherna
baseballmatchernas
baseballmatchers
baseballmatchsAivan ja siinä on yhdysanoja, ilmeisesti kaipaa niitäkään.
- Anonyymi
Anonyymi kirjoitti:
lisäänpä vielä että sanalistat MS-Access tietokantana tai Excel or SQL formaatissa ovat hiton arvokkaita 1,690.00 € (plus tax/VAT), joten en usko että niitä joka paikassa ollaan ilmaiseksi jakamassa. Tämä siksi että osaat arvostaa pienempääkin listaa.
Ruotsalaisilla on sanalista-appi Androidille: "Svenska Akademiens ordlista"
Jonka voi ladata tuolla: https://apkgk.com/se.svenskaakademien.saol/download
Ja tuo 294 MB tiedosto on SQLite 3 tietokanta.
Siitä saisi ripattua aika laadukkaankin sanalistan. - Anonyymi
Anonyymi kirjoitti:
Ruotsalaisilla on sanalista-appi Androidille: "Svenska Akademiens ordlista"
Jonka voi ladata tuolla: https://apkgk.com/se.svenskaakademien.saol/download
Ja tuo 294 MB tiedosto on SQLite 3 tietokanta.
Siitä saisi ripattua aika laadukkaankin sanalistan.Joo, tuossa ovat taivutukset eri taulussa kuin perusmuodot. Perusmuodot on taulussa "c0kompakt"
- Anonyymi
Anonyymi kirjoitti:
Joo, tuossa ovat taivutukset eri taulussa kuin perusmuodot. Perusmuodot on taulussa "c0kompakt"
Taulussa on 122 472 sanaa.
- Anonyymi
Anonyymi kirjoitti:
Taulussa on 122 472 sanaa.
Siinä se taisi löytyä, lopetan etsimisen, tuo on hyvä.
- Anonyymi
Anonyymi kirjoitti:
Siinä se taisi löytyä, lopetan etsimisen, tuo on hyvä.
Vielä jos löytäisi yhtä laadukkaan englanninkielisen listan!
Ketjusta on poistettu 1 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
- 1808316
En löydä sinua
En löydä sinua täältä, etkä sinä varmaankaan minua. Ennen kirjoitin selkeillä tunnisteilla, nyt jätän ne pois. Varmaan k264518- 504088
- 513365
- 513106
- 502860
Ne oli ne hymyt
Mitä vaihdettiin. Siksi mulla on taas niin järjetön ikävä. Jos haluat musta eroon päästä niin älä huomioi mua. Muuten kä262546- 312139
Anteeksi kun käyttäydyn
niin ristiriitaisesti. Mä en usko että haluaisit minusta mitään, hyvässä tapauksessa olet unohtanut minut. Ja silti toiv382003- 291996