Ohjelmani lukee tiedostosta tekstin ja tulostaa sen (siihen dossin näköiseen) konsoliin.
"...Sillä on yhteistä rajaa myös Venäjän kanssa..."
Mitä noille kirjaimille on tarkkaan ottaen tapahtunut? Onko käynyt niin että jotain UTF-x ollaan luettu kuin ascii-tekstiä?
C -kielen standardikirjastossa on joku wifstream ja wcout, jotka käsittelevät unicodeja, mutta ei auttanut tähän ongelmaan.
Kun laitoin
setlocale(LC_CTYPE, "fin");
se muutti väärin näkyviä merkkejä, mutta ei tuonut oikeita merkkejä.
Merkistöt - ikuinen ongelma
5
280
Vastaukset
- sdfsdfs
Konsoli käyttää eri merkistöä kuin luetun tekstitiedoston merkistö.
Ratkaisuja on kaksi. Muuttaa lähdemateriaalin merkistön terminaalin kanssa yhteensopivaksi tai sitten kirjoittaa ohjelman joka pystyy käsittelemään lähdemateriaalin merkistöä.
Tässä tapauksessa lähdemateriaali käyttää ilmeisesti UTF-X merkistöä.
Wide kirjastoja käyttämällä pitäisi onnistua käsittelemään "wide" merkistöjä mutta ilmeisesti se on vieläkin ongelmallinen. C ja C:n tulevissa standardeissa tähän tietääkseni puututaan.
http://utfcpp.sourceforge.net/
http://tidy.sourceforge.net/cgi-bin/lxr/source/src/utf8.c - mies..
Konsolin asetuksista vain näyttämään tekstit UTF-8:na, niin näkyy ääkkösetkin oikein.
UTF-8 on ascii/ansi yhteensopiva.- sfsdfs
Mutta C/C classit eivät ole.
Char muuttujien sisälle ei mahdu UTF-8 merkkejä.
- Merkistöasiaa
gcc -kääntäjän windows -väännös mingw-gcc saa konsoliin tulostettaessa aikaan juuri tuota.
Windowsissa oletusmerkistö on kiinteäpituuksinen 8 bittiä/merkki ns. Windows-1252. (Joissakin windowsin kieliversioissa oletusmerkistö voi olla muu, mutta silti kiinteäpituuksinen 8 bittiä/merkki, tai esim. kiinan- tai japaninkielisessä windowsissa oletusmerkistö voi olla vanhentunutta tapaa käyttävä muuttuvapituuksinen koodaus). MUTTA: Edelläoleva koskee GUI -sovelluksia. Konsolitilan oletusmerkistö on yleensä suomalaisessa windowsissa 850, mutta asennustavasta riippuen se voi olla myös 437. Jenkkiversioissa olettaisin oletuksen olevan 437.
Windowsin konsolin saa UTF-8 -koodausta käyttäväksi chcp 65001 -komennolla.
Vastaavasti normaaliin paluu sujuu chcp 850 -komennolla.
Tuolla komennolla saa siis hölmösti mingw-gcc:llä käännetyn ohjelman näyttämään järkevältä. Mutta muut ohjelmat ja windowsin komentotilan sisäiset komennot eivät välttämättä osaa hallita tilannetta, jossa chcp:llä on vaihdettu merkkikoodaukseksi muu kuin oletus.
Siksipä tulostuksen uudelleenohjaus tiedostoon tyyliin:
c:\komento >file1.txt
tai kirjoittimelle:
c:\komento >lpt1
saattaa tuottaa yllätyksiä jos merkkivalikoimaksi on vaihdettu muu kuin oletus.
Siksi esittämäni tapa on lähinnä hätävara, jolla huonosti koodatut sovellukset saadaan näyttämään oikeilta, mutta fiksumpaa olisi korjata väärin tehdyt sovellukset.
Windowsin komentotilaa ei ole alunperin suunniteltu tukemaan unicodea, ja esitetty chcp 65001 tuo osittaisen unicode -tuen, mutta rikkoo yhteensopivuutta monessa muussa asiassa. - denzo71
asettamalla chcp 65001, jotta se tukisi utf-8 merkistöä, aiheuttaa useiden dos-komentojen toimimattomuuden, mm. SET ja COPY, kun ne ajetaan batch-filenä.
Jostain syystä komentorivien alkuosasta leikkautuu merkkejä pois, jolloin tulee erroria ...
Eikö tähän todellakaan ole mitään ratkaisua ?
Ketjusta on poistettu 0 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
Aivosyöpää sairastava Olga Temonen TV:ssä - Viimeinen Perjantai-keskusteluohjelma ulos
Näyttelijä-yrittäjä Olga Temonen sairastaa neljännen asteen glioomaa eli aivosyöpää, jota ei ole mahdollista leikata. Hä912900Pelotelkaa niin paljon kuin sielu sietää.
Mutta ei mene perille asti. Miksi Venäjä hyökkäisi Suomeen? No, tottahan se tietenkin on jos Suomi joka ei ole edes soda2991686Mikä saa ihmisen tekemään tällaista?
Onko se huomatuksi tulemisen tarve tosiaan niin iso tarve, että nuoruuttaan ja tietämättömyyttään pilataan loppuelämä?2461557- 871391
IL - VARUSMIEHIÄ lähetetään jatkossa NATO-tehtäviin ulkomaille!
Suomen puolustuksen uudet linjaukset: Varusmiehiä suunnitellaan Nato-tehtäviin Puolustusministeri Antti Häkkänen esittel4021374Nyt kun Pride on ohi 3.0
Edelliset kaksi ketjua tuli täyteen. Pidetään siis edelleen tämä asia esillä. Raamattu opettaa johdonmukaisesti, että3981292Kiitos nainen
Kuitenkin. Olet sitten ajanmerkkinä. Tuskin enää sinua näen ja huomasitko, että olit siinä viimeisen kerran samassa paik21079Esko Eerikäinen tatuoi kasvoihinsa rakkaan nimen - Kärkäs kommentti "Ritvasta" lävähti somessa
Ohhoh! Esko Eerikäinen on ottanut uuden tatuoinnin. Kyseessä ei ole mikä tahansa kuva minne tahansa, vaan Eerikäisen tat381037Hyväksytkö sinä sen että päättäjämme ei rakenna rauhaa Venäjän kanssa?
Vielä kun sota ehkäpä voitaisiin välttää rauhanponnisteluilla niin millä verukkeella voidaan sanoa että on hyvä asia kun329874Miksi Purra-graffiti ei nyt olekkaan naisvihaa?
"Pohtikaapa reaktiota, jos vastaava graffiti olisi tehty Sanna Marinista", kysyy Tere Sammallahti. Helsingin Suvilahden257855