Suomenkielisissä USENET -ryhmissä näkee joskus hyvin outoa merkkikoodausta.
Tässä oudossa koodauksessa "ä" = EF BF BD
kirjaimen "ä" UNICODE -koodi on U 00E4.
UTF-8 koodattuna tämä olisi C3 A4.
Mutta mikä ihmeen koodaus "ä" -kirjaimelle on EF BF BD ?
Ja mikä oudointa, ovat koodanneet myös "ö" -kirjaimen täsmälleen samalla koodauksella!
Eli: tuollaisesta koodauksesta on ä ja ö -kirjaimia mahdotonta erottaa toisistaan !
Merkkikoodaus, USENET ???
Usenet_koodausvirhe
1
193
Vastaukset
- 1116
Kyse ei ole merkistökoodauksesta. Se on unicoden korvausmerkki jota käytetään toisinaan kun merkin esitys ei ole syystä tai toisesta mahdollista. Usein kyse on yksinkertaisesti siitä että teksti on koodattu käyttäen merkistökoodausta X mutta lukija yrittää näyttää sen käyttäen merkistökoodausta Y ja samaa merkkiä ei löydy molemmista koodaustavoista
http://en.wikipedia.org/wiki/Specials_(Unicode_block)#Replacement_character
http://www.mpc.fi/neuvot/unicode ratkaisuja merkillisiin ongelmiin/a809642?service=mobile&page=2
Ketjusta on poistettu 0 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
- 407003
- 323948
- 463347
- 402949
- 172726
- 372238
- 162196
- 412153
Voi ei! Jari Sillanpää heitti keikan Helsingissä - Hämmästyttävä hetki lavalla...
Ex-tangokuningas on parhaillaan konserttikiertueella. Hän esiintyi Savoy teatterissa äitienpäivänä. Sillanpää jakoi kons482087- 402058