Miten se lasketaan, että mikä on kielen yleisin kirjain? Kun esimerkiksi suomen kielessä yleisin kirjain on a ja yleisin konsonantti t. Olisi kiva tietää myös muiden kielten yleisimpiä kirjaimia.
Kielten yleisimmät kirjaimet
25
3440
Vastaukset
- K.V.G.
Onko sinulla mahdollisesti tietokonetta? Oletko kuullut esim. Google-hakukoneesta?
Joko on viimeinkin avattu se puhelinpalvelu, josta kansalaiset voivat kysellä vaikka tällaisia, ettei tarvitse enää soitella 112:een?- Kielet ja
Hih! Setä oikein kiihtyi...
- väksy
Ei ole tietokonetta enkä ole kuullut Google-hakukoneesta eikä ole avattu sellaista puhelinpalveluakaan, josta voisi kysellä tällaisia.
- Purkintippuri
A on yleisin kirjain mm. kymrissä.
- Itaesnläkou
Tietokoneella omatekoisella yksinkertaisella Basic-ohjelmalla voi laskea merkkien frekvenssejä miltä kieleltä tahansa.
Itselleni on jäänyt mieleen vanha laskelma suomen kielen kirjainten yleisyysjärjestyksestä: i-t-a-e-s-n-l-ä-k-o-u... - 2 tiuta
Englannissa yleisimmät kirjaimet ovat qwerty.
- Q = taa taa ti taa
Ei pidä paikkaansa. QWERTY-näppäimistöasettelu on laadittu alun pitäen sitä silmälläpitäen, etteivät kirjoituskoneen kirjasinvarret osuisi toisiinsa kirjoitettaessa nopeasti 10-sormijärjestelmällä.
Et kai tosissasi kuvittele, että Q-kirjain olisi englannin kielen viiden yleisimmän kirjaimen joukossa saati kaikkein yleisin?
Sähkötyksessä käytettävät Morsen aakkoset ovat amerikkalaisen keksijän Samuel Morsen ja hänen assistenttinsa Alfred Vailin luomus. Tarinan mukaan Morse oli saanut idean, jonka mukaan pisteistä ja viivoista muodostuvan koodin oli oltava sitä lyhyempi, mitä yleisempi koodattava kirjain on. Niinpä hän pyysi Vailia ottamaan sanomalehden ja analysoimaan siitä eri kirjainten esiintymistiheydet. Yleisimmäksi osoittautui E, joten sille varattiin lyhyin merkki, yksi ainoa piste • .
Q-kirjaimen harvinaisuutta kuvaa sen pitkä Morse-koodi – – • – .
Morsen järjestelmä eli morseaakkoset esiteltiin 1838. Sähkötyksen merkitys viestinnässä on painunut nykyisin vähäiseksi, mutta järjestelmä on yhtä kaikki yhä käytössä.
Sähkötys oli vahvasti koulutusohjelmassa vielä 1969–1970 suorittaessani asevelvollisuuttani erillisen viestiaselajin radiojoukoissa. Suoritin 1. luokan radioviestittäjätutkinnon, jossa liikennöinnin ohella oli hallittava sähkötysnopeus 80 merkkiä minuutissa. Tämän jälkeen onnistuin vielä ”tasokokeessa” 100/100 merkkiä minuutissa, mutta vastaanotossa nopeudella 120 mki/min tuli pari pummia liikaa eikä ranteen notkeuskaan yltänyt ”pumppuavaimella” aivan tuohon nopeuteen.
Noissa sähkötyskokeissa lähetettiin ja vastaanotettiin kirjaimista ja numeroista muodostuvaa satunnaiskoodia viiden merkin ryhmissä. Kun lähetyksessä käytetään automaattiavainta ja selväkieltä siten, ettei vastaanotettavaa sanomaa tarvitse kirjoittaa paperille vaan se ”luetaan päähän”, onnistuu harjaantuneitten sähköttäjien ”titauskeskustelu” nopeuksilla, jotka ylittävät selvästi 150 mki/min.
- Itaesnläkou
http://en.wikipedia.org/wiki/Letter_frequency
Suomen järjestys on tuossa: a-i-n-t-e-s-l-o-u-k- Itaesnläkou
Siellä on ruotsalaisella o:llakin å pienenpieni osuus. Puhtaasti suomenkielisessä (vieraat erisnimet poistettuina) tekstissä å voi esiintyä ainakin mittayksikkönä ångström ja sen lyhenteenä Å.
- *huokaus*
Kielissä ei ole kirjaimia, vaan äänteitä, joita voidaan merkitä (jos kielellä on kirjakieli) erilaisilla kirjaimilla, yhdellä tai useammalla, muttei välttämättä, koska muitakin kirjoitusjärjestelmiä on. Voidaan merkitä varsinaisilla kirjaimilla vain konsonantit, tai yksi kirjoitusmerkki on kokonainen sana.
- Itaesnläkou
Tässä lasketaan kirjoitetun kielen kirjaimia niiden äännearvosta riippumatta. Äänteiden laskeminen tuskin koneellisesti onnistuisikaan.
- papanikolaou
Voi... viisautta!
- Itaesnläkou
papanikolaou kirjoitti:
Voi... viisautta!
Hih...kiihtyikö setä ja mitä tuo tarkoitti?
- niin varmaan
Itaesnläkou kirjoitti:
Tässä lasketaan kirjoitetun kielen kirjaimia niiden äännearvosta riippumatta. Äänteiden laskeminen tuskin koneellisesti onnistuisikaan.
Mitä tuolla tiedolla tekee, varsinkin kun ottaa huomioon, ettei kaikkia kieliä kirjoiteta mitenkään, toisia ei kirjoiteta latinalaisilla kirjaimilla, ja joitakin ei kirjaimilla ollenkaan, vaan tavu- tai sanamerkeillä.
Olisit edes täsmentänyt, että tarkoitat, mikä on yleisimmin käytetty latinalainen kirjainmerkki. En tiedä, mitä merkitystä tällä tiedolla kenellekään on, koska se ei kerro mistään mitään, koska kirjaimilla merkitään eri äänteitä, ja joissain kielissä merkitään jotakin kirjainta tuplana tai useampana peräkkäin. Tai, kuten latvian kielessä kirjoitetaan "mājā" tai "maajaa" jos erikoismerkkejä ei ole käytettävissä. Joten aika tyhjänpäiväistä on kirjaimia laskea.
Lasketaan mistä sattuu – tai hienommin sanottuna jostakin valitusta aineistosta. Nykyisin tietysti käytetään tietokoneella luettavassa muodossa olevia tai sellaiseen muotoon saatettavissa olevia aineistoja. Itse laskenta on tietysti helppoa sen jälkeen, kun aineisto on sopivassa muodossa.
Väitteet jonkin kielen kirjainten yleisyydestä ovat parhaimmillaankin yksinkertaistuksia. Kieltä kokonaisuudessaan ei voi tutkia eikä siitä voi edes ottaa otosta. Kiinnostavaa onkin, miten aineisto valitaan. Vanhahkossa Kielikellon jutussa on tietoja, jotka auttavat suhtautumaan asiaan sopivan kriittisesti: siitä ilmenee, että kirjainten yleisyysjärjestys, suhteellisista osuuksista puhumattakaan, muuttuu sen mukaan, tarkastellaanko sanomalehtikieltä,kirjallisuuden kieltä vai kirjoitettuun muotoon saatettua puhekieltä:
http://www.cs.tut.fi/~jkorpela/kielikello/kirjtil.html
Käytännössä vaihtelu on kuitenkin suhteellisen pientä.- informaatioteoreetik
Kirjainten esiintymistodennäköisyydet voidaan kyllä määrittää melko tarkasti. Tällaisella tilastotiedolla on keskeinen asema kryptografiassa ja informaatioteoriassa. Esimerkiksi vanha Caesar-salaus ei ole enää pätevä, sillä se on liian helppo murtaa juurikin tiedolla kirjainten esiintymistodennäköisyyksistä.
- Kysyjä
informaatioteoreetik kirjoitti:
Kirjainten esiintymistodennäköisyydet voidaan kyllä määrittää melko tarkasti. Tällaisella tilastotiedolla on keskeinen asema kryptografiassa ja informaatioteoriassa. Esimerkiksi vanha Caesar-salaus ei ole enää pätevä, sillä se on liian helppo murtaa juurikin tiedolla kirjainten esiintymistodennäköisyyksistä.
Kerropa sitten, miten ne määrität. Miten ajattelit ottaa huomioon kaiken, mitä kirjoitetaan?
Caesar-salakirjoituksesta puhuminen on lähinnä koomista, eikä sen murtamiseen todellakaan tarvita frekvenssitietoja.
Frekvenssejä saatetaan kyllä muuten käyttää, eikä siihen tarvita tarkkoja tietoja. Joita siis ei ole saatavilla. Yleensä pelataan prosenttiyksikön luokkaa olevilla tarkkuuksilla, jolloin yleisyysjärjestykset todellakin voivat heitellä. - Itaesnläkou
Kysyjä kirjoitti:
Kerropa sitten, miten ne määrität. Miten ajattelit ottaa huomioon kaiken, mitä kirjoitetaan?
Caesar-salakirjoituksesta puhuminen on lähinnä koomista, eikä sen murtamiseen todellakaan tarvita frekvenssitietoja.
Frekvenssejä saatetaan kyllä muuten käyttää, eikä siihen tarvita tarkkoja tietoja. Joita siis ei ole saatavilla. Yleensä pelataan prosenttiyksikön luokkaa olevilla tarkkuuksilla, jolloin yleisyysjärjestykset todellakin voivat heitellä.On kysymys satunnaisuudesta ja otannasta. Suhteellisen pienilläkin tekstimäärillä päästään lähelle "oikeaa" tulosta. Tekstilln laadulla ei ole juuri väliä, mutta jonkinlainen vaikutus on sillä, jos tekstissä käytetään runsaasti esimerkiksi monikkoa (t korostuu jonkin verran) tai jotakin tiettyä aikamuotoa. Loppukappaleesi tiiivistää tilanteen.
- Statistix
Itaesnläkou kirjoitti:
On kysymys satunnaisuudesta ja otannasta. Suhteellisen pienilläkin tekstimäärillä päästään lähelle "oikeaa" tulosta. Tekstilln laadulla ei ole juuri väliä, mutta jonkinlainen vaikutus on sillä, jos tekstissä käytetään runsaasti esimerkiksi monikkoa (t korostuu jonkin verran) tai jotakin tiettyä aikamuotoa. Loppukappaleesi tiiivistää tilanteen.
No kun nimenomaan ei ole kyse satunnaisuudesta ja otannasta. Jos olisit suorittanut tilastotieteen alkeiden perusteiden johdantokurssin propedeuttisen osan, ymmärtäisit tämän.
Kielestä ei voi ottaa otosta. Voi ottaa otoksen vaikkapa Hömppälän Sanomat. -lehden aineistosta (tosin sekin on vaikeampaa kuin tilastotieteestä tietämätön voisi luulla), mutta tuloksista ei sitten voi päätellä kirjainten yleisyyttä suomen kielessä, ainoastaan Hömppälän Sanomat -lehdessä (ja silloinkin virhemarginaalit ovat monelta osin isompia kuin kirjainten frekvenssien erot).
- swl:llä
Joku tuolla edellä kirjoitti morsetuksesta eli sähkötyksestä eli cw.stä.
Nykyään monella käytössä automaatti-avaimet joissa peukalon painalluksella annetaan pisteet ja etusormella viivat, automatiikka säätää merkkien pituudet ja välit siinä tapauksessa jos annetaan esim kolme viivaa peräkkäin, silloin ei tarvitse päästää etusormea välilä pois avaimelta vaan tietyn mittainen painallus antaa tietyn määrän viivoja ja peukalolla sama juttu mutta tuloksena tietty määrä pisteitä, nopeutta voi säätää sähkötettäessä lähettimen avainnusautomatiikalla, näin olen ymmärtänyt.
Nykyään käytössä myös ohjelmia joilla sähkötyslähetteitä voidaan lähettää apuna tietokone ja näppäimistö, läppäri soveltuu tähän hyvin joka kytkettynä radiolähettimeen, nopeudet saadaan näin hurjankin korkeiksi joka ei enää edes oikein sähkötykseltä kuulosta ja onkin jo aivan verrattavissa digimodeihin kuten esim RTTY tai PSK1 tms.
Sähkötys ei vaadi minimissään mitään monimutkaisia laitteita, pumppuavain, lähetin ja virtalähde esim auton akku ja tietysti vastaanotin jos haluaa myös kuulla vasta-aseman.,ja taito sähköttää ja vastaanottaa sähkötystä joka sinänsä on taito siinä missä minkä muun kielen taitaminen. - Salaisuusonvankisi
Kirjainten taajuuksia selvittelivät ensimmäisenä arabit Islamin kultakaudella noin 900 jkr. Kyse oli aluksi vain Profeetan tekstien analysoinnista, kuten missä järjestyksessä hän oli ne antanut, mutta sillä oli odottamaton seuraus.
Kirjainten taajuudet nimittäin muodostavat perustan taajuusanalyysille, joka taas pystyy murskaamaan muutossifferin, eli sillä voi murtaa salakirjoitusta.
Tämän vuoksi kirjainten taajuksia on etsitty ja luetteloitu jo keskiajalta.
Esimerkkinä vaikka Englannin Kuningattaren Elisabet Ensimmäisen sihteeri Sir Francis Walshingham ja hänen salakirjoituseksperttinsä, jotka mursivat Skotlannin Kuningattaren Marian koodin ja saivat siten todistettua tämän yhteyden Elisabethin salamurhahankkeeseen. Taajuusanalyysi maksoi Kuningatar Marialle hänen päänsä.
Taajuusanalyysiä käytetään yhä. Se on tärkeä osatekijä Vignéren sifferin murtamisessa ja Vignére on edelleen osa merkittäviä salakirjoitus muotoja, kuten IBM:n Luciferia ja RSA:n joitakin muotoja, sekä ytimenä vaikkapa PGP salauksessa.
Joten voin taata, että jossakin NSA:n Fort Meaden päämajassa on kaveri, joka tietää että suomenkielen yleisin kirjain on A....- UUQIODBC
Taisi olla jostain luvatta kopioitua ja huonosti käännettyä tekstiä.
"Muutossifferi" on sen luokan kielisammakko, että sitä ei juuri voine syntyä muuten kuin silloin, kun suomea osaamaton yrittää ihan itse kääntää vaikeaa juttua.
- Etsin samaa tietoa
Tässä kaikki yleisyysjärjestyksessä:
https://www.cs.tut.fi/~jkorpela/kielikello/kirjtil.html
a i t n e s l o k u ä m v r j h y p d ö g b f c w å q - aiten
Olen itse laskenut Ctrl F -toiminnolla yleisyyksiä. Sen mukaan järjestys olisi a, i, t, e, n. Tulos eroaa siis Korpelan tuloksesta, siten että hänellä n oli yleisempi kuin e. N on kuitenkin yleisempi historia-aiheisissa teksteissä, jote ehkä Korpela analysoinut sellaisia.
Ketjusta on poistettu 0 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
Persujen mukaan rasismi on huumoria
Vaan kun koomikko kutsui Halla-ahoa fasistiksi, niin piti haastaa oikeuteen. Mihin se huumorinitaju yhtäkkiä hävisi? ⠀2196232Rasismia kaikkialla näkevät ovat Suomen tyhmimpiä ihmisiä
ja monillahan kuluu myös mielialalääkkeitä, eli päässä on ongelmia. Mutta he eivät tajua kuinka paljon ja ihan todellis1805791Ei kahta sanaa etteikö Petteri Orpo hyväksy rasismia
Koska jatkaa hallituksessa rasistisen perussuomalaisiksi itseään kutsuvan puolueen kanssa. Se on Petteri Orpon arvomaai155424BOIKOTOIN - Ei mitään Suomi.fi postilaatikoita käyttöön
Ainakaan minulle! Vai että pitäisi alkaa siellä käyädä katselemassa tammikuusta 2026 siis periaatteessa päivittäin että2514310Mitkäs nuorisoporukat ovat toisia nuoria ryöstelleet (selvää rassismia)
No poliisi kertoo, että maahanmuuttajataustaisia ovat, ja isot porukat sillä yhden suomalaisen uhrin kimpussa on ollut j714059- 2503775
Hallitus on kaadettava ja Orpon on erottava
Mikään muu hallitus ei ole oman elämäni aikana tuhonnut näin paljon tämän maan taloutta ja työllisyyttä sekä suomen main1393452Lasse Lehtonen vaatii persuja pyytämään anteeksi aasialaisilta
Persut ova romahduttaneet Suomen maakuvan parissa päivässä negatiiviseksi rasismillaan ja se alkaa vaikuttamaan jo Suome1283269HS 12/25 kysely: persut romahti, demarit raketoi
Kyyti on kylmää persuleirissä, saattaa vetää siellä silmätkin viirulleen. Sen sijaan SDP:n puoluetoimistolla voidaan pok212976Töppö-persut ovat todella tyhmiä
sen kertoo tämäkin avaus: "Persujen suosio vain laskee" Töppö-persu vaan unohtaa, että ennen tätä galluppia persujen kan22439