Kielten yleisimmät kirjaimet

väksy

Miten se lasketaan, että mikä on kielen yleisin kirjain? Kun esimerkiksi suomen kielessä yleisin kirjain on a ja yleisin konsonantti t. Olisi kiva tietää myös muiden kielten yleisimpiä kirjaimia.

25

3193

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • K.V.G.

      Onko sinulla mahdollisesti tietokonetta? Oletko kuullut esim. Google-hakukoneesta?
      Joko on viimeinkin avattu se puhelinpalvelu, josta kansalaiset voivat kysellä vaikka tällaisia, ettei tarvitse enää soitella 112:een?

      • Kielet ja

        Hih! Setä oikein kiihtyi...


      • väksy

        Ei ole tietokonetta enkä ole kuullut Google-hakukoneesta eikä ole avattu sellaista puhelinpalveluakaan, josta voisi kysellä tällaisia.


    • Purkintippuri

      A on yleisin kirjain mm. kymrissä.

    • Itaesnläkou

      Tietokoneella omatekoisella yksinkertaisella Basic-ohjelmalla voi laskea merkkien frekvenssejä miltä kieleltä tahansa.
      Itselleni on jäänyt mieleen vanha laskelma suomen kielen kirjainten yleisyysjärjestyksestä: i-t-a-e-s-n-l-ä-k-o-u...

    • 2 tiuta

      Englannissa yleisimmät kirjaimet ovat qwerty.

      • Itaesnläkou

        http://en.wikipedia.org/wiki/Letter_frequency


      • Q = taa taa ti taa

        Ei pidä paikkaansa. QWERTY-näppäimistöasettelu on laadittu alun pitäen sitä silmälläpitäen, etteivät kirjoituskoneen kirjasinvarret osuisi toisiinsa kirjoitettaessa nopeasti 10-sormijärjestelmällä.

        Et kai tosissasi kuvittele, että Q-kirjain olisi englannin kielen viiden yleisimmän kirjaimen joukossa saati kaikkein yleisin?

        Sähkötyksessä käytettävät Morsen aakkoset ovat amerikkalaisen keksijän Samuel Morsen ja hänen assistenttinsa Alfred Vailin luomus. Tarinan mukaan Morse oli saanut idean, jonka mukaan pisteistä ja viivoista muodostuvan koodin oli oltava sitä lyhyempi, mitä yleisempi koodattava kirjain on. Niinpä hän pyysi Vailia ottamaan sanomalehden ja analysoimaan siitä eri kirjainten esiintymistiheydet. Yleisimmäksi osoittautui E, joten sille varattiin lyhyin merkki, yksi ainoa piste • .

        Q-kirjaimen harvinaisuutta kuvaa sen pitkä Morse-koodi – – • – .

        Morsen järjestelmä eli morseaakkoset esiteltiin 1838. Sähkötyksen merkitys viestinnässä on painunut nykyisin vähäiseksi, mutta järjestelmä on yhtä kaikki yhä käytössä.

        Sähkötys oli vahvasti koulutusohjelmassa vielä 1969–1970 suorittaessani asevelvollisuuttani erillisen viestiaselajin radiojoukoissa. Suoritin 1. luokan radioviestittäjätutkinnon, jossa liikennöinnin ohella oli hallittava sähkötysnopeus 80 merkkiä minuutissa. Tämän jälkeen onnistuin vielä ”tasokokeessa” 100/100 merkkiä minuutissa, mutta vastaanotossa nopeudella 120 mki/min tuli pari pummia liikaa eikä ranteen notkeuskaan yltänyt ”pumppuavaimella” aivan tuohon nopeuteen.

        Noissa sähkötyskokeissa lähetettiin ja vastaanotettiin kirjaimista ja numeroista muodostuvaa satunnaiskoodia viiden merkin ryhmissä. Kun lähetyksessä käytetään automaattiavainta ja selväkieltä siten, ettei vastaanotettavaa sanomaa tarvitse kirjoittaa paperille vaan se ”luetaan päähän”, onnistuu harjaantuneitten sähköttäjien ”titauskeskustelu” nopeuksilla, jotka ylittävät selvästi 150 mki/min.


    • Itaesnläkou
      • Itaesnläkou

        Siellä on ruotsalaisella o:llakin å pienenpieni osuus. Puhtaasti suomenkielisessä (vieraat erisnimet poistettuina) tekstissä å voi esiintyä ainakin mittayksikkönä ångström ja sen lyhenteenä Å.


    • *huokaus*

      Kielissä ei ole kirjaimia, vaan äänteitä, joita voidaan merkitä (jos kielellä on kirjakieli) erilaisilla kirjaimilla, yhdellä tai useammalla, muttei välttämättä, koska muitakin kirjoitusjärjestelmiä on. Voidaan merkitä varsinaisilla kirjaimilla vain konsonantit, tai yksi kirjoitusmerkki on kokonainen sana.

      • Itaesnläkou

        Tässä lasketaan kirjoitetun kielen kirjaimia niiden äännearvosta riippumatta. Äänteiden laskeminen tuskin koneellisesti onnistuisikaan.


      • papanikolaou

        Voi... viisautta!


      • Itaesnläkou
        papanikolaou kirjoitti:

        Voi... viisautta!

        Hih...kiihtyikö setä ja mitä tuo tarkoitti?


      • niin varmaan
        Itaesnläkou kirjoitti:

        Tässä lasketaan kirjoitetun kielen kirjaimia niiden äännearvosta riippumatta. Äänteiden laskeminen tuskin koneellisesti onnistuisikaan.

        Mitä tuolla tiedolla tekee, varsinkin kun ottaa huomioon, ettei kaikkia kieliä kirjoiteta mitenkään, toisia ei kirjoiteta latinalaisilla kirjaimilla, ja joitakin ei kirjaimilla ollenkaan, vaan tavu- tai sanamerkeillä.

        Olisit edes täsmentänyt, että tarkoitat, mikä on yleisimmin käytetty latinalainen kirjainmerkki. En tiedä, mitä merkitystä tällä tiedolla kenellekään on, koska se ei kerro mistään mitään, koska kirjaimilla merkitään eri äänteitä, ja joissain kielissä merkitään jotakin kirjainta tuplana tai useampana peräkkäin. Tai, kuten latvian kielessä kirjoitetaan "mājā" tai "maajaa" jos erikoismerkkejä ei ole käytettävissä. Joten aika tyhjänpäiväistä on kirjaimia laskea.


    • Lasketaan mistä sattuu – tai hienommin sanottuna jostakin valitusta aineistosta. Nykyisin tietysti käytetään tietokoneella luettavassa muodossa olevia tai sellaiseen muotoon saatettavissa olevia aineistoja. Itse laskenta on tietysti helppoa sen jälkeen, kun aineisto on sopivassa muodossa.

      Väitteet jonkin kielen kirjainten yleisyydestä ovat parhaimmillaankin yksinkertaistuksia. Kieltä kokonaisuudessaan ei voi tutkia eikä siitä voi edes ottaa otosta. Kiinnostavaa onkin, miten aineisto valitaan. Vanhahkossa Kielikellon jutussa on tietoja, jotka auttavat suhtautumaan asiaan sopivan kriittisesti: siitä ilmenee, että kirjainten yleisyysjärjestys, suhteellisista osuuksista puhumattakaan, muuttuu sen mukaan, tarkastellaanko sanomalehtikieltä,kirjallisuuden kieltä vai kirjoitettuun muotoon saatettua puhekieltä:
      http://www.cs.tut.fi/~jkorpela/kielikello/kirjtil.html

      Käytännössä vaihtelu on kuitenkin suhteellisen pientä.

      • informaatioteoreetik

        Kirjainten esiintymistodennäköisyydet voidaan kyllä määrittää melko tarkasti. Tällaisella tilastotiedolla on keskeinen asema kryptografiassa ja informaatioteoriassa. Esimerkiksi vanha Caesar-salaus ei ole enää pätevä, sillä se on liian helppo murtaa juurikin tiedolla kirjainten esiintymistodennäköisyyksistä.


      • Kysyjä
        informaatioteoreetik kirjoitti:

        Kirjainten esiintymistodennäköisyydet voidaan kyllä määrittää melko tarkasti. Tällaisella tilastotiedolla on keskeinen asema kryptografiassa ja informaatioteoriassa. Esimerkiksi vanha Caesar-salaus ei ole enää pätevä, sillä se on liian helppo murtaa juurikin tiedolla kirjainten esiintymistodennäköisyyksistä.

        Kerropa sitten, miten ne määrität. Miten ajattelit ottaa huomioon kaiken, mitä kirjoitetaan?

        Caesar-salakirjoituksesta puhuminen on lähinnä koomista, eikä sen murtamiseen todellakaan tarvita frekvenssitietoja.

        Frekvenssejä saatetaan kyllä muuten käyttää, eikä siihen tarvita tarkkoja tietoja. Joita siis ei ole saatavilla. Yleensä pelataan prosenttiyksikön luokkaa olevilla tarkkuuksilla, jolloin yleisyysjärjestykset todellakin voivat heitellä.


      • Itaesnläkou
        Kysyjä kirjoitti:

        Kerropa sitten, miten ne määrität. Miten ajattelit ottaa huomioon kaiken, mitä kirjoitetaan?

        Caesar-salakirjoituksesta puhuminen on lähinnä koomista, eikä sen murtamiseen todellakaan tarvita frekvenssitietoja.

        Frekvenssejä saatetaan kyllä muuten käyttää, eikä siihen tarvita tarkkoja tietoja. Joita siis ei ole saatavilla. Yleensä pelataan prosenttiyksikön luokkaa olevilla tarkkuuksilla, jolloin yleisyysjärjestykset todellakin voivat heitellä.

        On kysymys satunnaisuudesta ja otannasta. Suhteellisen pienilläkin tekstimäärillä päästään lähelle "oikeaa" tulosta. Tekstilln laadulla ei ole juuri väliä, mutta jonkinlainen vaikutus on sillä, jos tekstissä käytetään runsaasti esimerkiksi monikkoa (t korostuu jonkin verran) tai jotakin tiettyä aikamuotoa. Loppukappaleesi tiiivistää tilanteen.


      • Statistix
        Itaesnläkou kirjoitti:

        On kysymys satunnaisuudesta ja otannasta. Suhteellisen pienilläkin tekstimäärillä päästään lähelle "oikeaa" tulosta. Tekstilln laadulla ei ole juuri väliä, mutta jonkinlainen vaikutus on sillä, jos tekstissä käytetään runsaasti esimerkiksi monikkoa (t korostuu jonkin verran) tai jotakin tiettyä aikamuotoa. Loppukappaleesi tiiivistää tilanteen.

        No kun nimenomaan ei ole kyse satunnaisuudesta ja otannasta. Jos olisit suorittanut tilastotieteen alkeiden perusteiden johdantokurssin propedeuttisen osan, ymmärtäisit tämän.

        Kielestä ei voi ottaa otosta. Voi ottaa otoksen vaikkapa Hömppälän Sanomat. -lehden aineistosta (tosin sekin on vaikeampaa kuin tilastotieteestä tietämätön voisi luulla), mutta tuloksista ei sitten voi päätellä kirjainten yleisyyttä suomen kielessä, ainoastaan Hömppälän Sanomat -lehdessä (ja silloinkin virhemarginaalit ovat monelta osin isompia kuin kirjainten frekvenssien erot).


    • swl:llä

      Joku tuolla edellä kirjoitti morsetuksesta eli sähkötyksestä eli cw.stä.

      Nykyään monella käytössä automaatti-avaimet joissa peukalon painalluksella annetaan pisteet ja etusormella viivat, automatiikka säätää merkkien pituudet ja välit siinä tapauksessa jos annetaan esim kolme viivaa peräkkäin, silloin ei tarvitse päästää etusormea välilä pois avaimelta vaan tietyn mittainen painallus antaa tietyn määrän viivoja ja peukalolla sama juttu mutta tuloksena tietty määrä pisteitä, nopeutta voi säätää sähkötettäessä lähettimen avainnusautomatiikalla, näin olen ymmärtänyt.

      Nykyään käytössä myös ohjelmia joilla sähkötyslähetteitä voidaan lähettää apuna tietokone ja näppäimistö, läppäri soveltuu tähän hyvin joka kytkettynä radiolähettimeen, nopeudet saadaan näin hurjankin korkeiksi joka ei enää edes oikein sähkötykseltä kuulosta ja onkin jo aivan verrattavissa digimodeihin kuten esim RTTY tai PSK1 tms.

      Sähkötys ei vaadi minimissään mitään monimutkaisia laitteita, pumppuavain, lähetin ja virtalähde esim auton akku ja tietysti vastaanotin jos haluaa myös kuulla vasta-aseman.,ja taito sähköttää ja vastaanottaa sähkötystä joka sinänsä on taito siinä missä minkä muun kielen taitaminen.

    • Salaisuusonvankisi

      Kirjainten taajuuksia selvittelivät ensimmäisenä arabit Islamin kultakaudella noin 900 jkr. Kyse oli aluksi vain Profeetan tekstien analysoinnista, kuten missä järjestyksessä hän oli ne antanut, mutta sillä oli odottamaton seuraus.

      Kirjainten taajuudet nimittäin muodostavat perustan taajuusanalyysille, joka taas pystyy murskaamaan muutossifferin, eli sillä voi murtaa salakirjoitusta.

      Tämän vuoksi kirjainten taajuksia on etsitty ja luetteloitu jo keskiajalta.

      Esimerkkinä vaikka Englannin Kuningattaren Elisabet Ensimmäisen sihteeri Sir Francis Walshingham ja hänen salakirjoituseksperttinsä, jotka mursivat Skotlannin Kuningattaren Marian koodin ja saivat siten todistettua tämän yhteyden Elisabethin salamurhahankkeeseen. Taajuusanalyysi maksoi Kuningatar Marialle hänen päänsä.

      Taajuusanalyysiä käytetään yhä. Se on tärkeä osatekijä Vignéren sifferin murtamisessa ja Vignére on edelleen osa merkittäviä salakirjoitus muotoja, kuten IBM:n Luciferia ja RSA:n joitakin muotoja, sekä ytimenä vaikkapa PGP salauksessa.

      Joten voin taata, että jossakin NSA:n Fort Meaden päämajassa on kaveri, joka tietää että suomenkielen yleisin kirjain on A....

      • UUQIODBC

        Taisi olla jostain luvatta kopioitua ja huonosti käännettyä tekstiä.

        "Muutossifferi" on sen luokan kielisammakko, että sitä ei juuri voine syntyä muuten kuin silloin, kun suomea osaamaton yrittää ihan itse kääntää vaikeaa juttua.


    • Etsin samaa tietoa
    • aiten

      Olen itse laskenut Ctrl F -toiminnolla yleisyyksiä. Sen mukaan järjestys olisi a, i, t, e, n. Tulos eroaa siis Korpelan tuloksesta, siten että hänellä n oli yleisempi kuin e. N on kuitenkin yleisempi historia-aiheisissa teksteissä, jote ehkä Korpela analysoinut sellaisia.

    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Epäily: Oppilas puukotti kolmea Pirkkalan koululla

      Tämänhetkisen tiedon mukaan ainakin kolme oppilasta on loukkaantunut puukotuksessa Pirkkalan Vähäjärven koululla. Myös e
      Pirkanmaa
      208
      5995
    2. Jos olisit täällä

      Tosin en tiiä miks oisit. (Ja hävettää muutenkin kun ei muka muulla tavoin osaa kertoa tätäkään) Jos jollain pienellä
      Ihastuminen
      49
      2705
    3. Tämän hetken

      Terveiset kaivatullesi ⬇️
      Ikävä
      156
      2252
    4. Jos yhdistät nimikirjaimet

      Jos yhdistät sinun ja kaivattusi ensimmäisten nimien alkukirjaimet mitkä nimikirjaimet tulee? Sinun ensin ja sitten häne
      Ikävä
      41
      2042
    5. Kesän odotuksia hyrynsalmella

      Kyllä kesällä hyrynsalmellakin on mahdollisuus osallistua kylän menoon monella tavalla . On kaunislehdon talomuseolla
      Hyrynsalmi
      16
      1769
    6. Vieläkö sä toivot

      Meidän välille jotain?
      Ikävä
      82
      1414
    7. Pirkkalan koulussa puukotus, oppilas puukotti kolmea

      Ilmeisesti tyttöjä ollut kohteena.
      Maailman menoa
      162
      1387
    8. Voi Rakas siellä

      Olet ollut mun ajatuksissa taas koko päivän. Olet ihmeellinen kertakaikkiaan ja arvostan sinua niin paljon❤️Minulla ei o
      Tunteet
      24
      1321
    9. Ohhoh! KAJ laukoi suorat sanat somessa - V-sana mainittu!

      Ohhoh! Mitäs mieltä olet tästä huumoriryhmä KAJ:sta? Bara bada bastu on kyllä aikamoinen korvamato... Lue lisää: https
      Euroviisut
      35
      1271
    10. Erika selvisi hienosti ennakkosuosikin paineista

      Hienostihan se meni. Erika jätettiin yksin, eikä häntä tuettu, oli euroviisukiusattu, silti suoriutui ensiluokkaisesti.
      Maailman menoa
      109
      997
    Aihe