Kielten yleisimmät kirjaimet

väksy

Miten se lasketaan, että mikä on kielen yleisin kirjain? Kun esimerkiksi suomen kielessä yleisin kirjain on a ja yleisin konsonantti t. Olisi kiva tietää myös muiden kielten yleisimpiä kirjaimia.

25

3494

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • K.V.G.

      Onko sinulla mahdollisesti tietokonetta? Oletko kuullut esim. Google-hakukoneesta?
      Joko on viimeinkin avattu se puhelinpalvelu, josta kansalaiset voivat kysellä vaikka tällaisia, ettei tarvitse enää soitella 112:een?

      • Kielet ja

        Hih! Setä oikein kiihtyi...


      • väksy

        Ei ole tietokonetta enkä ole kuullut Google-hakukoneesta eikä ole avattu sellaista puhelinpalveluakaan, josta voisi kysellä tällaisia.


    • Purkintippuri

      A on yleisin kirjain mm. kymrissä.

    • Itaesnläkou

      Tietokoneella omatekoisella yksinkertaisella Basic-ohjelmalla voi laskea merkkien frekvenssejä miltä kieleltä tahansa.
      Itselleni on jäänyt mieleen vanha laskelma suomen kielen kirjainten yleisyysjärjestyksestä: i-t-a-e-s-n-l-ä-k-o-u...

    • 2 tiuta

      Englannissa yleisimmät kirjaimet ovat qwerty.

      • Itaesnläkou

      • Q = taa taa ti taa

        Ei pidä paikkaansa. QWERTY-näppäimistöasettelu on laadittu alun pitäen sitä silmälläpitäen, etteivät kirjoituskoneen kirjasinvarret osuisi toisiinsa kirjoitettaessa nopeasti 10-sormijärjestelmällä.

        Et kai tosissasi kuvittele, että Q-kirjain olisi englannin kielen viiden yleisimmän kirjaimen joukossa saati kaikkein yleisin?

        Sähkötyksessä käytettävät Morsen aakkoset ovat amerikkalaisen keksijän Samuel Morsen ja hänen assistenttinsa Alfred Vailin luomus. Tarinan mukaan Morse oli saanut idean, jonka mukaan pisteistä ja viivoista muodostuvan koodin oli oltava sitä lyhyempi, mitä yleisempi koodattava kirjain on. Niinpä hän pyysi Vailia ottamaan sanomalehden ja analysoimaan siitä eri kirjainten esiintymistiheydet. Yleisimmäksi osoittautui E, joten sille varattiin lyhyin merkki, yksi ainoa piste • .

        Q-kirjaimen harvinaisuutta kuvaa sen pitkä Morse-koodi – – • – .

        Morsen järjestelmä eli morseaakkoset esiteltiin 1838. Sähkötyksen merkitys viestinnässä on painunut nykyisin vähäiseksi, mutta järjestelmä on yhtä kaikki yhä käytössä.

        Sähkötys oli vahvasti koulutusohjelmassa vielä 1969–1970 suorittaessani asevelvollisuuttani erillisen viestiaselajin radiojoukoissa. Suoritin 1. luokan radioviestittäjätutkinnon, jossa liikennöinnin ohella oli hallittava sähkötysnopeus 80 merkkiä minuutissa. Tämän jälkeen onnistuin vielä ”tasokokeessa” 100/100 merkkiä minuutissa, mutta vastaanotossa nopeudella 120 mki/min tuli pari pummia liikaa eikä ranteen notkeuskaan yltänyt ”pumppuavaimella” aivan tuohon nopeuteen.

        Noissa sähkötyskokeissa lähetettiin ja vastaanotettiin kirjaimista ja numeroista muodostuvaa satunnaiskoodia viiden merkin ryhmissä. Kun lähetyksessä käytetään automaattiavainta ja selväkieltä siten, ettei vastaanotettavaa sanomaa tarvitse kirjoittaa paperille vaan se ”luetaan päähän”, onnistuu harjaantuneitten sähköttäjien ”titauskeskustelu” nopeuksilla, jotka ylittävät selvästi 150 mki/min.


    • Itaesnläkou
      • Itaesnläkou

        Siellä on ruotsalaisella o:llakin å pienenpieni osuus. Puhtaasti suomenkielisessä (vieraat erisnimet poistettuina) tekstissä å voi esiintyä ainakin mittayksikkönä ångström ja sen lyhenteenä Å.


    • *huokaus*

      Kielissä ei ole kirjaimia, vaan äänteitä, joita voidaan merkitä (jos kielellä on kirjakieli) erilaisilla kirjaimilla, yhdellä tai useammalla, muttei välttämättä, koska muitakin kirjoitusjärjestelmiä on. Voidaan merkitä varsinaisilla kirjaimilla vain konsonantit, tai yksi kirjoitusmerkki on kokonainen sana.

      • Itaesnläkou

        Tässä lasketaan kirjoitetun kielen kirjaimia niiden äännearvosta riippumatta. Äänteiden laskeminen tuskin koneellisesti onnistuisikaan.


      • papanikolaou

        Voi... viisautta!


      • Itaesnläkou
        papanikolaou kirjoitti:

        Voi... viisautta!

        Hih...kiihtyikö setä ja mitä tuo tarkoitti?


      • niin varmaan
        Itaesnläkou kirjoitti:

        Tässä lasketaan kirjoitetun kielen kirjaimia niiden äännearvosta riippumatta. Äänteiden laskeminen tuskin koneellisesti onnistuisikaan.

        Mitä tuolla tiedolla tekee, varsinkin kun ottaa huomioon, ettei kaikkia kieliä kirjoiteta mitenkään, toisia ei kirjoiteta latinalaisilla kirjaimilla, ja joitakin ei kirjaimilla ollenkaan, vaan tavu- tai sanamerkeillä.

        Olisit edes täsmentänyt, että tarkoitat, mikä on yleisimmin käytetty latinalainen kirjainmerkki. En tiedä, mitä merkitystä tällä tiedolla kenellekään on, koska se ei kerro mistään mitään, koska kirjaimilla merkitään eri äänteitä, ja joissain kielissä merkitään jotakin kirjainta tuplana tai useampana peräkkäin. Tai, kuten latvian kielessä kirjoitetaan "mājā" tai "maajaa" jos erikoismerkkejä ei ole käytettävissä. Joten aika tyhjänpäiväistä on kirjaimia laskea.


    • Lasketaan mistä sattuu – tai hienommin sanottuna jostakin valitusta aineistosta. Nykyisin tietysti käytetään tietokoneella luettavassa muodossa olevia tai sellaiseen muotoon saatettavissa olevia aineistoja. Itse laskenta on tietysti helppoa sen jälkeen, kun aineisto on sopivassa muodossa.

      Väitteet jonkin kielen kirjainten yleisyydestä ovat parhaimmillaankin yksinkertaistuksia. Kieltä kokonaisuudessaan ei voi tutkia eikä siitä voi edes ottaa otosta. Kiinnostavaa onkin, miten aineisto valitaan. Vanhahkossa Kielikellon jutussa on tietoja, jotka auttavat suhtautumaan asiaan sopivan kriittisesti: siitä ilmenee, että kirjainten yleisyysjärjestys, suhteellisista osuuksista puhumattakaan, muuttuu sen mukaan, tarkastellaanko sanomalehtikieltä,kirjallisuuden kieltä vai kirjoitettuun muotoon saatettua puhekieltä:
      http://www.cs.tut.fi/~jkorpela/kielikello/kirjtil.html

      Käytännössä vaihtelu on kuitenkin suhteellisen pientä.

      • informaatioteoreetik

        Kirjainten esiintymistodennäköisyydet voidaan kyllä määrittää melko tarkasti. Tällaisella tilastotiedolla on keskeinen asema kryptografiassa ja informaatioteoriassa. Esimerkiksi vanha Caesar-salaus ei ole enää pätevä, sillä se on liian helppo murtaa juurikin tiedolla kirjainten esiintymistodennäköisyyksistä.


      • Kysyjä
        informaatioteoreetik kirjoitti:

        Kirjainten esiintymistodennäköisyydet voidaan kyllä määrittää melko tarkasti. Tällaisella tilastotiedolla on keskeinen asema kryptografiassa ja informaatioteoriassa. Esimerkiksi vanha Caesar-salaus ei ole enää pätevä, sillä se on liian helppo murtaa juurikin tiedolla kirjainten esiintymistodennäköisyyksistä.

        Kerropa sitten, miten ne määrität. Miten ajattelit ottaa huomioon kaiken, mitä kirjoitetaan?

        Caesar-salakirjoituksesta puhuminen on lähinnä koomista, eikä sen murtamiseen todellakaan tarvita frekvenssitietoja.

        Frekvenssejä saatetaan kyllä muuten käyttää, eikä siihen tarvita tarkkoja tietoja. Joita siis ei ole saatavilla. Yleensä pelataan prosenttiyksikön luokkaa olevilla tarkkuuksilla, jolloin yleisyysjärjestykset todellakin voivat heitellä.


      • Itaesnläkou
        Kysyjä kirjoitti:

        Kerropa sitten, miten ne määrität. Miten ajattelit ottaa huomioon kaiken, mitä kirjoitetaan?

        Caesar-salakirjoituksesta puhuminen on lähinnä koomista, eikä sen murtamiseen todellakaan tarvita frekvenssitietoja.

        Frekvenssejä saatetaan kyllä muuten käyttää, eikä siihen tarvita tarkkoja tietoja. Joita siis ei ole saatavilla. Yleensä pelataan prosenttiyksikön luokkaa olevilla tarkkuuksilla, jolloin yleisyysjärjestykset todellakin voivat heitellä.

        On kysymys satunnaisuudesta ja otannasta. Suhteellisen pienilläkin tekstimäärillä päästään lähelle "oikeaa" tulosta. Tekstilln laadulla ei ole juuri väliä, mutta jonkinlainen vaikutus on sillä, jos tekstissä käytetään runsaasti esimerkiksi monikkoa (t korostuu jonkin verran) tai jotakin tiettyä aikamuotoa. Loppukappaleesi tiiivistää tilanteen.


      • Statistix
        Itaesnläkou kirjoitti:

        On kysymys satunnaisuudesta ja otannasta. Suhteellisen pienilläkin tekstimäärillä päästään lähelle "oikeaa" tulosta. Tekstilln laadulla ei ole juuri väliä, mutta jonkinlainen vaikutus on sillä, jos tekstissä käytetään runsaasti esimerkiksi monikkoa (t korostuu jonkin verran) tai jotakin tiettyä aikamuotoa. Loppukappaleesi tiiivistää tilanteen.

        No kun nimenomaan ei ole kyse satunnaisuudesta ja otannasta. Jos olisit suorittanut tilastotieteen alkeiden perusteiden johdantokurssin propedeuttisen osan, ymmärtäisit tämän.

        Kielestä ei voi ottaa otosta. Voi ottaa otoksen vaikkapa Hömppälän Sanomat. -lehden aineistosta (tosin sekin on vaikeampaa kuin tilastotieteestä tietämätön voisi luulla), mutta tuloksista ei sitten voi päätellä kirjainten yleisyyttä suomen kielessä, ainoastaan Hömppälän Sanomat -lehdessä (ja silloinkin virhemarginaalit ovat monelta osin isompia kuin kirjainten frekvenssien erot).


    • swl:llä

      Joku tuolla edellä kirjoitti morsetuksesta eli sähkötyksestä eli cw.stä.

      Nykyään monella käytössä automaatti-avaimet joissa peukalon painalluksella annetaan pisteet ja etusormella viivat, automatiikka säätää merkkien pituudet ja välit siinä tapauksessa jos annetaan esim kolme viivaa peräkkäin, silloin ei tarvitse päästää etusormea välilä pois avaimelta vaan tietyn mittainen painallus antaa tietyn määrän viivoja ja peukalolla sama juttu mutta tuloksena tietty määrä pisteitä, nopeutta voi säätää sähkötettäessä lähettimen avainnusautomatiikalla, näin olen ymmärtänyt.

      Nykyään käytössä myös ohjelmia joilla sähkötyslähetteitä voidaan lähettää apuna tietokone ja näppäimistö, läppäri soveltuu tähän hyvin joka kytkettynä radiolähettimeen, nopeudet saadaan näin hurjankin korkeiksi joka ei enää edes oikein sähkötykseltä kuulosta ja onkin jo aivan verrattavissa digimodeihin kuten esim RTTY tai PSK1 tms.

      Sähkötys ei vaadi minimissään mitään monimutkaisia laitteita, pumppuavain, lähetin ja virtalähde esim auton akku ja tietysti vastaanotin jos haluaa myös kuulla vasta-aseman.,ja taito sähköttää ja vastaanottaa sähkötystä joka sinänsä on taito siinä missä minkä muun kielen taitaminen.

    • Salaisuusonvankisi

      Kirjainten taajuuksia selvittelivät ensimmäisenä arabit Islamin kultakaudella noin 900 jkr. Kyse oli aluksi vain Profeetan tekstien analysoinnista, kuten missä järjestyksessä hän oli ne antanut, mutta sillä oli odottamaton seuraus.

      Kirjainten taajuudet nimittäin muodostavat perustan taajuusanalyysille, joka taas pystyy murskaamaan muutossifferin, eli sillä voi murtaa salakirjoitusta.

      Tämän vuoksi kirjainten taajuksia on etsitty ja luetteloitu jo keskiajalta.

      Esimerkkinä vaikka Englannin Kuningattaren Elisabet Ensimmäisen sihteeri Sir Francis Walshingham ja hänen salakirjoituseksperttinsä, jotka mursivat Skotlannin Kuningattaren Marian koodin ja saivat siten todistettua tämän yhteyden Elisabethin salamurhahankkeeseen. Taajuusanalyysi maksoi Kuningatar Marialle hänen päänsä.

      Taajuusanalyysiä käytetään yhä. Se on tärkeä osatekijä Vignéren sifferin murtamisessa ja Vignére on edelleen osa merkittäviä salakirjoitus muotoja, kuten IBM:n Luciferia ja RSA:n joitakin muotoja, sekä ytimenä vaikkapa PGP salauksessa.

      Joten voin taata, että jossakin NSA:n Fort Meaden päämajassa on kaveri, joka tietää että suomenkielen yleisin kirjain on A....

      • UUQIODBC

        Taisi olla jostain luvatta kopioitua ja huonosti käännettyä tekstiä.

        "Muutossifferi" on sen luokan kielisammakko, että sitä ei juuri voine syntyä muuten kuin silloin, kun suomea osaamaton yrittää ihan itse kääntää vaikeaa juttua.


    • Etsin samaa tietoa
    • aiten

      Olen itse laskenut Ctrl F -toiminnolla yleisyyksiä. Sen mukaan järjestys olisi a, i, t, e, n. Tulos eroaa siis Korpelan tuloksesta, siten että hänellä n oli yleisempi kuin e. N on kuitenkin yleisempi historia-aiheisissa teksteissä, jote ehkä Korpela analysoinut sellaisia.

    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Duunarit hylkäsivät vasemmistoliiton, siitä tuli feministinaisten puolue

      Pääluottamusmies Jari Myllykoski liittyi vasemmistoliittoon, koska se oli duunarien puolue. Sitä samaa puoluetta ei enää
      Maailman menoa
      205
      5104
    2. Olen väsynyt tähän

      En osaa lopettaa ja koen huonoa omaatuntoa tästä. Kaikki on muutenkin turhaa ja tekemisesi sattuvat. Tunteita on vain hy
      Ikävä
      40
      4546
    3. Oppiiko vasemmistolaiset valehtelun jo kotonaan?

      Sillä vasemmistolaiset/äärivasemmistolaiset valehtelee ja keksii asioita omasta päästään todella paljon. Esim. joku vas
      Maailman menoa
      200
      2741
    4. Seuraava hallituspohja - Kokoomus, kepu, persut + KD

      Kokoomus saa ainakin 20% kannatuksen ensi vaaleissa, keskusta sanoisin noin 15%, persut todennäköisesti enemmän, ehkä 17
      Maailman menoa
      135
      2318
    5. Olenko mies sinun mielestä outo?

      Saat vastata rehellisesti.
      Ikävä
      61
      1952
    6. Maailman laiskin eläin: persu

      Persu ei ole eläessään laittanut rikkaa ristiin itsensä elättämiseen. Luonnossa tuollainen ei olisi mahdollista, mutta s
      Maailman menoa
      112
      1831
    7. Millasia unelmia sulla on?

      onko unelmia...?
      Ikävä
      67
      1794
    8. Miten usein toivot

      Tai olet toivonut että olisimme lähekkäin vai toivotko ollenkaan?
      Ikävä
      208
      1664
    9. Miksi et voi tutustua minuun irl?

      Vastaa yleisellä tasolla/ympäripyöreästi, jos pelkäät tunnistamisia.
      Ikävä
      152
      1232
    10. Martina tienaa itse rahansa

      Ei tarvitse anella elättäjältään rahaa, ruokaa ja laukkuja.
      Kotimaiset julkkisjuorut
      241
      964
    Aihe