Merkistöt - ikuinen ongelma

where is the yucca?

2011-02-21 17:31:40

Ohjelmani lukee tiedostosta tekstin ja tulostaa sen (siihen dossin näköiseen) konsoliin.

"...SillÃ¤ on yhteistÃ¤ rajaa myÃ¶s VenÃ¤jÃ¤n kanssa..."

Mitä noille kirjaimille on tarkkaan ottaen tapahtunut? Onko käynyt niin että jotain UTF-x ollaan luettu kuin ascii-tekstiä?

C -kielen standardikirjastossa on joku wifstream ja wcout, jotka käsittelevät unicodeja, mutta ei auttanut tähän ongelmaan.

Kun laitoin
setlocale(LC_CTYPE, "fin");
se muutti väärin näkyviä merkkejä, mutta ei tuonut oikeita merkkejä.

342

Äänestä

Vastaukset

sdfsdfs
2011-02-22 01:44:12
Konsoli käyttää eri merkistöä kuin luetun tekstitiedoston merkistö.

Ratkaisuja on kaksi. Muuttaa lähdemateriaalin merkistön terminaalin kanssa yhteensopivaksi tai sitten kirjoittaa ohjelman joka pystyy käsittelemään lähdemateriaalin merkistöä.

Tässä tapauksessa lähdemateriaali käyttää ilmeisesti UTF-X merkistöä.

Wide kirjastoja käyttämällä pitäisi onnistua käsittelemään "wide" merkistöjä mutta ilmeisesti se on vieläkin ongelmallinen. C ja C:n tulevissa standardeissa tähän tietääkseni puututaan.

http://utfcpp.sourceforge.net/
http://tidy.sourceforge.net/cgi-bin/lxr/source/src/utf8.c
mies..
2011-02-25 19:19:29
Konsolin asetuksista vain näyttämään tekstit UTF-8:na, niin näkyy ääkkösetkin oikein.

UTF-8 on ascii/ansi yhteensopiva.
- sfsdfs
  2011-02-25 21:23:49
  Mutta C/C classit eivät ole.
  
  Char muuttujien sisälle ei mahdu UTF-8 merkkejä.
Merkistöasiaa
2011-04-12 00:29:59
gcc -kääntäjän windows -väännös mingw-gcc saa konsoliin tulostettaessa aikaan juuri tuota.

Windowsissa oletusmerkistö on kiinteäpituuksinen 8 bittiä/merkki ns. Windows-1252. (Joissakin windowsin kieliversioissa oletusmerkistö voi olla muu, mutta silti kiinteäpituuksinen 8 bittiä/merkki, tai esim. kiinan- tai japaninkielisessä windowsissa oletusmerkistö voi olla vanhentunutta tapaa käyttävä muuttuvapituuksinen koodaus). MUTTA: Edelläoleva koskee GUI -sovelluksia. Konsolitilan oletusmerkistö on yleensä suomalaisessa windowsissa 850, mutta asennustavasta riippuen se voi olla myös 437. Jenkkiversioissa olettaisin oletuksen olevan 437.

Windowsin konsolin saa UTF-8 -koodausta käyttäväksi chcp 65001 -komennolla.
Vastaavasti normaaliin paluu sujuu chcp 850 -komennolla.

Tuolla komennolla saa siis hölmösti mingw-gcc:llä käännetyn ohjelman näyttämään järkevältä. Mutta muut ohjelmat ja windowsin komentotilan sisäiset komennot eivät välttämättä osaa hallita tilannetta, jossa chcp:llä on vaihdettu merkkikoodaukseksi muu kuin oletus.

Siksipä tulostuksen uudelleenohjaus tiedostoon tyyliin:

c:\komento >file1.txt

tai kirjoittimelle:

c:\komento >lpt1

saattaa tuottaa yllätyksiä jos merkkivalikoimaksi on vaihdettu muu kuin oletus.

Siksi esittämäni tapa on lähinnä hätävara, jolla huonosti koodatut sovellukset saadaan näyttämään oikeilta, mutta fiksumpaa olisi korjata väärin tehdyt sovellukset.

Windowsin komentotilaa ei ole alunperin suunniteltu tukemaan unicodea, ja esitetty chcp 65001 tuo osittaisen unicode -tuen, mutta rikkoo yhteensopivuutta monessa muussa asiassa.
denzo71
2011-08-23 17:01:45
asettamalla chcp 65001, jotta se tukisi utf-8 merkistöä, aiheuttaa useiden dos-komentojen toimimattomuuden, mm. SET ja COPY, kun ne ajetaan batch-filenä.
Jostain syystä komentorivien alkuosasta leikkautuu merkkejä pois, jolloin tulee erroria ...

Eikö tähän todellakaan ole mitään ratkaisua ?

Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

Takaisin ylös

Luetuimmat keskustelut

Tulipalossa henkilövahinkoja, itsenäisyyspäivä alkoi huonosti, poliisi tiedottaa lisää
Savonlinna https://www.como.fi/uutiset/savonlinna-henkilovahinkoja-tulipalossa-poliisi-tiedottaa-lisaa/
06.12.2025 13:11Savonlinna
162
9357
Ennen ei ollut persuja ja työttömyyttä, lääkäriinkin pääsi
Ennen oli kaikilla töitä Kauppiaille kelpasi kun saivat voittoa Yritystukia ei ollut Lääkäriin pääsi kaikki haluklaat Nu
06.12.2025 12:36Maailman menoa
122
4146
Millaista läheisyyttä
Toivoisit ikävästi kohteesi kanssa?
06.12.2025 10:37Ikävä
114
3942
Somali ei kätellyt Stubbia Linnan juhlissa
Miksei somali osaa noudattaa hyviä käytöstapoja. https://www.iltalehti.fi/viihdeuutiset/a/563a3dea-fa3f-41f3-b64f-406d2
07.12.2025 09:55Maailman menoa
407
3575
Mones päivä kaivattusi on syntynyt?
😁
06.12.2025 13:41Ikävä
55
3413
Antifasismi - mitä se on?
Se on äärivasemmistolaista anarkistista toimintaa joka käyttää fasisminvastaisuutta keppihevosena oikeuttaakseen toimint
06.12.2025 12:18Maailman menoa
43
2740
Kuka on menehtynyt?
https://yle.fi/a/74-20198293 Kuulemani mukaan ryyppyporukka ollut hapualla ja kuolemanenkeli (F.G) eli mies jonka seuras
07.12.2025 10:08Kankaanpää
14
2012
Heräsin taas ikävään
Ja aivan valtavaan haluun. Tahdon sinua R. ❤️
06.12.2025 08:33Ikävä
57
1957
Kauhea ikävä iski
Mietin vain, mitä olet juuri nyt tekemässä. Mietin myös, välittyykö se sinulle, kun olet koko ajan mielessäni, tunnetko
06.12.2025 10:47Ikävä
20
1551
Kemijärven kapungin teknisen osaston johtajat
KossuPekka ja KankaarannanMarkku olivat hyviä näissä tehtävissään. Tulevan vuodenvaihteen jälkeen tulee Kemijärvelle uu
06.12.2025 17:16Kemijärvi
9
1361

Merkistöt - ikuinen ongelma

Vastaukset

Luetuimmat keskustelut

Tulipalossa henkilövahinkoja, itsenäisyyspäivä alkoi huonosti, poliisi tiedottaa lisää

Ennen ei ollut persuja ja työttömyyttä, lääkäriinkin pääsi

Millaista läheisyyttä

Somali ei kätellyt Stubbia Linnan juhlissa

Mones päivä kaivattusi on syntynyt?

Antifasismi - mitä se on?

Kuka on menehtynyt?

Heräsin taas ikävään

Kauhea ikävä iski

Kemijärven kapungin teknisen osaston johtajat

Ilouutinen: Osmo Peltola jo teini-iässä, silti yhdessä Peltsi-isän kanssa taas tv:ssä!

Muutama vuosi sitten oli pulaa hoitohenkilökunnasta

Itsenäisyyspäivää juhlitaan taas tv:ssä - Seuraatko sinä juhlamenoja tai miten itse juhlit?

Gallup: Teetkö piparitaikinan itse vai ostatko kaupasta?

Vihdoin tv:ssä! Katri Helena loistaa jäähyväiskonsertissa - Upea ylistys suomalaiselle ikonille!

Miksi Suomen talous ei kasva ?

Topi Borg paljastaa - Salakuljetti frakkitakissa tätä "taskuhyvää" Linnan juhliin!

Jätetyn ja petetyn tuska: Mieheni olikin homo

Unelmia Italiassa -paljastus: Uusi kausi yllättää - Ralph-poika ja "pikkuveli" Viljo mukana!

HUOM! Amazing Race Suomi esityspäivä ei ole lauantai tällä viikolla - Katso tästä oikea aika!