Kielten yleisimmät kirjaimet

väksy

Miten se lasketaan, että mikä on kielen yleisin kirjain? Kun esimerkiksi suomen kielessä yleisin kirjain on a ja yleisin konsonantti t. Olisi kiva tietää myös muiden kielten yleisimpiä kirjaimia.

25

3259

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • K.V.G.

      Onko sinulla mahdollisesti tietokonetta? Oletko kuullut esim. Google-hakukoneesta?
      Joko on viimeinkin avattu se puhelinpalvelu, josta kansalaiset voivat kysellä vaikka tällaisia, ettei tarvitse enää soitella 112:een?

      • Kielet ja

        Hih! Setä oikein kiihtyi...


      • väksy

        Ei ole tietokonetta enkä ole kuullut Google-hakukoneesta eikä ole avattu sellaista puhelinpalveluakaan, josta voisi kysellä tällaisia.


    • Purkintippuri

      A on yleisin kirjain mm. kymrissä.

    • Itaesnläkou

      Tietokoneella omatekoisella yksinkertaisella Basic-ohjelmalla voi laskea merkkien frekvenssejä miltä kieleltä tahansa.
      Itselleni on jäänyt mieleen vanha laskelma suomen kielen kirjainten yleisyysjärjestyksestä: i-t-a-e-s-n-l-ä-k-o-u...

    • 2 tiuta

      Englannissa yleisimmät kirjaimet ovat qwerty.

      • Itaesnläkou

        http://en.wikipedia.org/wiki/Letter_frequency


      • Q = taa taa ti taa

        Ei pidä paikkaansa. QWERTY-näppäimistöasettelu on laadittu alun pitäen sitä silmälläpitäen, etteivät kirjoituskoneen kirjasinvarret osuisi toisiinsa kirjoitettaessa nopeasti 10-sormijärjestelmällä.

        Et kai tosissasi kuvittele, että Q-kirjain olisi englannin kielen viiden yleisimmän kirjaimen joukossa saati kaikkein yleisin?

        Sähkötyksessä käytettävät Morsen aakkoset ovat amerikkalaisen keksijän Samuel Morsen ja hänen assistenttinsa Alfred Vailin luomus. Tarinan mukaan Morse oli saanut idean, jonka mukaan pisteistä ja viivoista muodostuvan koodin oli oltava sitä lyhyempi, mitä yleisempi koodattava kirjain on. Niinpä hän pyysi Vailia ottamaan sanomalehden ja analysoimaan siitä eri kirjainten esiintymistiheydet. Yleisimmäksi osoittautui E, joten sille varattiin lyhyin merkki, yksi ainoa piste • .

        Q-kirjaimen harvinaisuutta kuvaa sen pitkä Morse-koodi – – • – .

        Morsen järjestelmä eli morseaakkoset esiteltiin 1838. Sähkötyksen merkitys viestinnässä on painunut nykyisin vähäiseksi, mutta järjestelmä on yhtä kaikki yhä käytössä.

        Sähkötys oli vahvasti koulutusohjelmassa vielä 1969–1970 suorittaessani asevelvollisuuttani erillisen viestiaselajin radiojoukoissa. Suoritin 1. luokan radioviestittäjätutkinnon, jossa liikennöinnin ohella oli hallittava sähkötysnopeus 80 merkkiä minuutissa. Tämän jälkeen onnistuin vielä ”tasokokeessa” 100/100 merkkiä minuutissa, mutta vastaanotossa nopeudella 120 mki/min tuli pari pummia liikaa eikä ranteen notkeuskaan yltänyt ”pumppuavaimella” aivan tuohon nopeuteen.

        Noissa sähkötyskokeissa lähetettiin ja vastaanotettiin kirjaimista ja numeroista muodostuvaa satunnaiskoodia viiden merkin ryhmissä. Kun lähetyksessä käytetään automaattiavainta ja selväkieltä siten, ettei vastaanotettavaa sanomaa tarvitse kirjoittaa paperille vaan se ”luetaan päähän”, onnistuu harjaantuneitten sähköttäjien ”titauskeskustelu” nopeuksilla, jotka ylittävät selvästi 150 mki/min.


    • Itaesnläkou
      • Itaesnläkou

        Siellä on ruotsalaisella o:llakin å pienenpieni osuus. Puhtaasti suomenkielisessä (vieraat erisnimet poistettuina) tekstissä å voi esiintyä ainakin mittayksikkönä ångström ja sen lyhenteenä Å.


    • *huokaus*

      Kielissä ei ole kirjaimia, vaan äänteitä, joita voidaan merkitä (jos kielellä on kirjakieli) erilaisilla kirjaimilla, yhdellä tai useammalla, muttei välttämättä, koska muitakin kirjoitusjärjestelmiä on. Voidaan merkitä varsinaisilla kirjaimilla vain konsonantit, tai yksi kirjoitusmerkki on kokonainen sana.

      • Itaesnläkou

        Tässä lasketaan kirjoitetun kielen kirjaimia niiden äännearvosta riippumatta. Äänteiden laskeminen tuskin koneellisesti onnistuisikaan.


      • papanikolaou

        Voi... viisautta!


      • Itaesnläkou
        papanikolaou kirjoitti:

        Voi... viisautta!

        Hih...kiihtyikö setä ja mitä tuo tarkoitti?


      • niin varmaan
        Itaesnläkou kirjoitti:

        Tässä lasketaan kirjoitetun kielen kirjaimia niiden äännearvosta riippumatta. Äänteiden laskeminen tuskin koneellisesti onnistuisikaan.

        Mitä tuolla tiedolla tekee, varsinkin kun ottaa huomioon, ettei kaikkia kieliä kirjoiteta mitenkään, toisia ei kirjoiteta latinalaisilla kirjaimilla, ja joitakin ei kirjaimilla ollenkaan, vaan tavu- tai sanamerkeillä.

        Olisit edes täsmentänyt, että tarkoitat, mikä on yleisimmin käytetty latinalainen kirjainmerkki. En tiedä, mitä merkitystä tällä tiedolla kenellekään on, koska se ei kerro mistään mitään, koska kirjaimilla merkitään eri äänteitä, ja joissain kielissä merkitään jotakin kirjainta tuplana tai useampana peräkkäin. Tai, kuten latvian kielessä kirjoitetaan "mājā" tai "maajaa" jos erikoismerkkejä ei ole käytettävissä. Joten aika tyhjänpäiväistä on kirjaimia laskea.


    • Lasketaan mistä sattuu – tai hienommin sanottuna jostakin valitusta aineistosta. Nykyisin tietysti käytetään tietokoneella luettavassa muodossa olevia tai sellaiseen muotoon saatettavissa olevia aineistoja. Itse laskenta on tietysti helppoa sen jälkeen, kun aineisto on sopivassa muodossa.

      Väitteet jonkin kielen kirjainten yleisyydestä ovat parhaimmillaankin yksinkertaistuksia. Kieltä kokonaisuudessaan ei voi tutkia eikä siitä voi edes ottaa otosta. Kiinnostavaa onkin, miten aineisto valitaan. Vanhahkossa Kielikellon jutussa on tietoja, jotka auttavat suhtautumaan asiaan sopivan kriittisesti: siitä ilmenee, että kirjainten yleisyysjärjestys, suhteellisista osuuksista puhumattakaan, muuttuu sen mukaan, tarkastellaanko sanomalehtikieltä,kirjallisuuden kieltä vai kirjoitettuun muotoon saatettua puhekieltä:
      http://www.cs.tut.fi/~jkorpela/kielikello/kirjtil.html

      Käytännössä vaihtelu on kuitenkin suhteellisen pientä.

      • informaatioteoreetik

        Kirjainten esiintymistodennäköisyydet voidaan kyllä määrittää melko tarkasti. Tällaisella tilastotiedolla on keskeinen asema kryptografiassa ja informaatioteoriassa. Esimerkiksi vanha Caesar-salaus ei ole enää pätevä, sillä se on liian helppo murtaa juurikin tiedolla kirjainten esiintymistodennäköisyyksistä.


      • Kysyjä
        informaatioteoreetik kirjoitti:

        Kirjainten esiintymistodennäköisyydet voidaan kyllä määrittää melko tarkasti. Tällaisella tilastotiedolla on keskeinen asema kryptografiassa ja informaatioteoriassa. Esimerkiksi vanha Caesar-salaus ei ole enää pätevä, sillä se on liian helppo murtaa juurikin tiedolla kirjainten esiintymistodennäköisyyksistä.

        Kerropa sitten, miten ne määrität. Miten ajattelit ottaa huomioon kaiken, mitä kirjoitetaan?

        Caesar-salakirjoituksesta puhuminen on lähinnä koomista, eikä sen murtamiseen todellakaan tarvita frekvenssitietoja.

        Frekvenssejä saatetaan kyllä muuten käyttää, eikä siihen tarvita tarkkoja tietoja. Joita siis ei ole saatavilla. Yleensä pelataan prosenttiyksikön luokkaa olevilla tarkkuuksilla, jolloin yleisyysjärjestykset todellakin voivat heitellä.


      • Itaesnläkou
        Kysyjä kirjoitti:

        Kerropa sitten, miten ne määrität. Miten ajattelit ottaa huomioon kaiken, mitä kirjoitetaan?

        Caesar-salakirjoituksesta puhuminen on lähinnä koomista, eikä sen murtamiseen todellakaan tarvita frekvenssitietoja.

        Frekvenssejä saatetaan kyllä muuten käyttää, eikä siihen tarvita tarkkoja tietoja. Joita siis ei ole saatavilla. Yleensä pelataan prosenttiyksikön luokkaa olevilla tarkkuuksilla, jolloin yleisyysjärjestykset todellakin voivat heitellä.

        On kysymys satunnaisuudesta ja otannasta. Suhteellisen pienilläkin tekstimäärillä päästään lähelle "oikeaa" tulosta. Tekstilln laadulla ei ole juuri väliä, mutta jonkinlainen vaikutus on sillä, jos tekstissä käytetään runsaasti esimerkiksi monikkoa (t korostuu jonkin verran) tai jotakin tiettyä aikamuotoa. Loppukappaleesi tiiivistää tilanteen.


      • Statistix
        Itaesnläkou kirjoitti:

        On kysymys satunnaisuudesta ja otannasta. Suhteellisen pienilläkin tekstimäärillä päästään lähelle "oikeaa" tulosta. Tekstilln laadulla ei ole juuri väliä, mutta jonkinlainen vaikutus on sillä, jos tekstissä käytetään runsaasti esimerkiksi monikkoa (t korostuu jonkin verran) tai jotakin tiettyä aikamuotoa. Loppukappaleesi tiiivistää tilanteen.

        No kun nimenomaan ei ole kyse satunnaisuudesta ja otannasta. Jos olisit suorittanut tilastotieteen alkeiden perusteiden johdantokurssin propedeuttisen osan, ymmärtäisit tämän.

        Kielestä ei voi ottaa otosta. Voi ottaa otoksen vaikkapa Hömppälän Sanomat. -lehden aineistosta (tosin sekin on vaikeampaa kuin tilastotieteestä tietämätön voisi luulla), mutta tuloksista ei sitten voi päätellä kirjainten yleisyyttä suomen kielessä, ainoastaan Hömppälän Sanomat -lehdessä (ja silloinkin virhemarginaalit ovat monelta osin isompia kuin kirjainten frekvenssien erot).


    • swl:llä

      Joku tuolla edellä kirjoitti morsetuksesta eli sähkötyksestä eli cw.stä.

      Nykyään monella käytössä automaatti-avaimet joissa peukalon painalluksella annetaan pisteet ja etusormella viivat, automatiikka säätää merkkien pituudet ja välit siinä tapauksessa jos annetaan esim kolme viivaa peräkkäin, silloin ei tarvitse päästää etusormea välilä pois avaimelta vaan tietyn mittainen painallus antaa tietyn määrän viivoja ja peukalolla sama juttu mutta tuloksena tietty määrä pisteitä, nopeutta voi säätää sähkötettäessä lähettimen avainnusautomatiikalla, näin olen ymmärtänyt.

      Nykyään käytössä myös ohjelmia joilla sähkötyslähetteitä voidaan lähettää apuna tietokone ja näppäimistö, läppäri soveltuu tähän hyvin joka kytkettynä radiolähettimeen, nopeudet saadaan näin hurjankin korkeiksi joka ei enää edes oikein sähkötykseltä kuulosta ja onkin jo aivan verrattavissa digimodeihin kuten esim RTTY tai PSK1 tms.

      Sähkötys ei vaadi minimissään mitään monimutkaisia laitteita, pumppuavain, lähetin ja virtalähde esim auton akku ja tietysti vastaanotin jos haluaa myös kuulla vasta-aseman.,ja taito sähköttää ja vastaanottaa sähkötystä joka sinänsä on taito siinä missä minkä muun kielen taitaminen.

    • Salaisuusonvankisi

      Kirjainten taajuuksia selvittelivät ensimmäisenä arabit Islamin kultakaudella noin 900 jkr. Kyse oli aluksi vain Profeetan tekstien analysoinnista, kuten missä järjestyksessä hän oli ne antanut, mutta sillä oli odottamaton seuraus.

      Kirjainten taajuudet nimittäin muodostavat perustan taajuusanalyysille, joka taas pystyy murskaamaan muutossifferin, eli sillä voi murtaa salakirjoitusta.

      Tämän vuoksi kirjainten taajuksia on etsitty ja luetteloitu jo keskiajalta.

      Esimerkkinä vaikka Englannin Kuningattaren Elisabet Ensimmäisen sihteeri Sir Francis Walshingham ja hänen salakirjoituseksperttinsä, jotka mursivat Skotlannin Kuningattaren Marian koodin ja saivat siten todistettua tämän yhteyden Elisabethin salamurhahankkeeseen. Taajuusanalyysi maksoi Kuningatar Marialle hänen päänsä.

      Taajuusanalyysiä käytetään yhä. Se on tärkeä osatekijä Vignéren sifferin murtamisessa ja Vignére on edelleen osa merkittäviä salakirjoitus muotoja, kuten IBM:n Luciferia ja RSA:n joitakin muotoja, sekä ytimenä vaikkapa PGP salauksessa.

      Joten voin taata, että jossakin NSA:n Fort Meaden päämajassa on kaveri, joka tietää että suomenkielen yleisin kirjain on A....

      • UUQIODBC

        Taisi olla jostain luvatta kopioitua ja huonosti käännettyä tekstiä.

        "Muutossifferi" on sen luokan kielisammakko, että sitä ei juuri voine syntyä muuten kuin silloin, kun suomea osaamaton yrittää ihan itse kääntää vaikeaa juttua.


    • Etsin samaa tietoa
    • aiten

      Olen itse laskenut Ctrl F -toiminnolla yleisyyksiä. Sen mukaan järjestys olisi a, i, t, e, n. Tulos eroaa siis Korpelan tuloksesta, siten että hänellä n oli yleisempi kuin e. N on kuitenkin yleisempi historia-aiheisissa teksteissä, jote ehkä Korpela analysoinut sellaisia.

    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Martinan uusi poikakaveri

      Sielläpä se sitten on. Instastoorissa pienissä speedoissa retkottaa uusin kulta Martinan kanssa. Oikein sydämiä laitettu
      Kotimaiset julkkisjuorut
      205
      3121
    2. Suomessa helteet ylittää vasta +30 astetta.

      Etelä-Euroopassa on mitattu yli +40 asteen lämpötiloja. Lähi-Idässä +50 on ylitetty useasti Lämpöennätykset rikkoutuva
      Maailman menoa
      239
      1600
    3. Laita mulle viesti!!

      Laita viesti mesen (Facebook) kautta. Haluan keskustella mutta sinun ehdoilla en halua häiriköidä tms. Yhä välitän sinus
      Ikävä
      93
      1451
    4. Millaisessa tilanteessa olisit toiminut toisin

      Jos saisit yhden mahdollisuuden toimia toisin?
      Ikävä
      89
      1349
    5. Vanhemmalle naiselle

      alkuperäiseltä kirjoittajalta. On olemassa myös se toinen joka tarkoituksella käyttää samaa otsikkoa. Ihan sama kunhan e
      Ikävä
      46
      1314
    6. Fazer perustaa 400 miljoonan suklaatehtaan Lahteen

      No eipä ihme miksi ovat kolminkertaistaneen suklaalevyjensä hinnan. Nehän on alkaneet keräämään rahaa tehdasta varten.
      Maailman menoa
      155
      1228
    7. Ajattelen sinua tänäkin iltana

      Olet huippuihana❤️ Ajattelen sinua jatkuvasti. Toivottavasti tapaamme pian. En malttaisi odottaa, mutta odotan kuitenkin
      Ikävä
      12
      1168
    8. Ökyrikkaat Fazerit saivat 20 MILJOONAA veronmaksajien varallisuutta!

      "Yle uutisoi viime viikolla, että Business Finland on myöntänyt Fazerille noin 20 miljoonaa euroa investointitukea. Faze
      Maailman menoa
      123
      999
    9. Miehelle...

      Oliko kaikki mökötus sen arvoista? Ei mukavalta tuntunut, kun aloit hiljaisesti osoittaa mieltä ja kohtelit välinpitämät
      Ikävä
      89
      922
    10. Tuntuu liian hankalalta

      Lähettää sulle viesti. Tarvitsen apuasi ottaa koppi tilanteesta. Miehelle meni.
      Ikävä
      44
      803
    Aihe