Merkkien määrä (hello.asm)

Anonyymi

2020-10-23 00:35:42

Miksi SASM assembler esimerkki koodissa EDX -rekisteriin sijoitetaan 29, vaikka tulostettava merkkijono on vain 25 merkkiä pitkä.

%include "io.inc"

section .text
global CMAIN
CMAIN:
mov ebp, esp; for correct debugging
mov edx, 29
mov ecx, msg
mov ebx, 1
mov eax, 4
int 80h
xor eax, eax
ret

SECTION .data
msg db 'Hello World! Minä täällä.', 0Ah

341

Äänestä

Vastaukset

malaire
2020-10-23 01:31:56
En tiedä mitä merkistöä tässä käytetään, mutta esimerkiksi UTF-8:ssa merkki 'ä' vie kaksi tavua.

Jos tässä esimerkissä 'ä' vie kaksi tavua niin merkkijonon pituus on 25 4=29 tavua koska 'ä' kirjaimia on neljä ja loput ovat perus ASCII kirjaimia jotka vievät vain yhden tavun jokainen.

Jos tarkoitus on myös tulostaa lopussa oleva 0Ah eli rivinvaihto, niin minusta pituuden tulisi tässä olla 30 eikä 29.
- Anonyymi
  2020-10-23 01:39:42
  No voi herran pieksut, siinähän se oli, kiitän.
- Anonyymi
  2020-10-23 07:38:20
  "Jos tarkoitus on myös tulostaa lopussa oleva 0Ah eli rivinvaihto, niin minusta pituuden tulisi tässä olla 30 eikä 29."
  
  Näin näyttää olevan, testasin toistamalla tuon tulostamisen kahdesti, ja peräkkäinhän ne meni, jollei tuota yhtä ylimääräistä siihen lisännyt.
  
  %include "io.inc"
  
  section .text
  global CMAIN
  CMAIN:
  mov ebp, esp; for correct debugging
  mov edx, 13
  mov ecx, msg
  mov ebx, 1
  mov eax, 4
  int 80h
  mov eax, 4
  int 80h
  xor eax, eax
  ret
  
  SECTION .data
  msg db 'Hello World!', 0Ah
  
  Tuossa uudelleen saman tulostamiseen, riitti kun alusti int 80h kutsun write tehtävälle (mov eax, 4). Jos olisi käyttänyt mov edx, 12, olisivat tekstit menneet peräkkäin.
- Anonyymi
  2020-10-23 23:38:56
  Anonyymi kirjoitti:
  "Jos tarkoitus on myös tulostaa lopussa oleva 0Ah eli rivinvaihto, niin minusta pituuden tulisi tässä olla 30 eikä 29."
  
  Näin näyttää olevan, testasin toistamalla tuon tulostamisen kahdesti, ja peräkkäinhän ne meni, jollei tuota yhtä ylimääräistä siihen lisännyt.
  
  %include "io.inc"
  
  section .text
  global CMAIN
  CMAIN:
  mov ebp, esp; for correct debugging
  mov edx, 13
  mov ecx, msg
  mov ebx, 1
  mov eax, 4
  int 80h
  mov eax, 4
  int 80h
  xor eax, eax
  ret
  
  SECTION .data
  msg db 'Hello World!', 0Ah
  
  Tuossa uudelleen saman tulostamiseen, riitti kun alusti int 80h kutsun write tehtävälle (mov eax, 4). Jos olisi käyttänyt mov edx, 12, olisivat tekstit menneet peräkkäin.
  Tuohon dynaamisuutta lisäämällä .dataan msg:n alapuolelle muuttuja pituus:
  pituus equ $ - msg
  
  Ja sitten korvaa aikaisemman mov edx:n:
  mov edx, pituus
- Anonyymi
  2020-10-24 00:32:52
  Anonyymi kirjoitti:
  Tuohon dynaamisuutta lisäämällä .dataan msg:n alapuolelle muuttuja pituus:
  pituus equ $ - msg
  
  Ja sitten korvaa aikaisemman mov edx:n:
  mov edx, pituus
  Joo, tuo tekee vaihtelevan pituisten merkkijonojen käsittelyn helpommaksi.
  
  %include "/usr/share/sasm/include/io.inc"
  section .text
  global CMAIN
  CMAIN:
  mov ebp, esp
  mov edx, len
  mov ecx, msg
  mov ebx, 1
  mov eax, 4
  int 80h
  xor eax, eax
  ret
  
  SECTION .data
  msg db 'Hello World!', 0Ah
  len equ $ - msg
  
  Tässä tämä paranneltu versio, joka toimii hienosti, mutta en saa sitä käännettyä komentotulkissa. Tällä SASM -editorillaan se kyllä kääntyy virheettömästi.
- Anonyymi
  2020-10-25 19:23:18
  JOS kyse on linux -käyttöjärjestelmästä (mitä aloittaja ei viitsinyt mainita, vaikka se on olennainen tieto !), niin malaire (23.10.2020) on oikeassa.
  
  Windowsissa taas asia EI OLE näin.
  
  Linuxissa oletusmerkkikoodaus on UTF-8 (tosin hyvin vanhoissa linuxeissa, kuten Debian Sarge, näin ei ole, vaan niissä se voi olla esim. ISO-8859-1, joka on Windows-1252:n osajoukko).
  
  Windowsissa tilanne on monimutkaisempi:
  
  Graafisissa sovelluksissa oletusmerkkikoodaus on Windows-1252 (USA:ssa, Suomessa, ja monessa muussakin Euroopan maassa). Toki esim. Venäjällä ja Thaimaassa oletusmerkkikoodaus on maan oman standardin mukainen, ja nuo maakohtaiset standardit on yleensä laadittu siten, että koodit 0..127 ovat samat kuin jenkki-ASCIIssa, ja koodit 128..255 ovat maan paikallisen kielen kirjoitusmerkkejä.
  Toki Graafisissa sovelluksissa voi vaihtoehtoisesti käyttää UTF16LE -koodattua UNICODEa, jos käyttää aina W -loppuisia API -kutsuja A-loppuisten sijasta. Huomaa, että tässä tapauksessa BMP:hen (Basic Multilingual Page) kuuluvat merkit koodataan yhdellä enkoodausyksiköllä eli 16 bitillä, muut merkit kahdella enkoodausyksiköllä eli yhteensä 32 bitillä.
  
  Windowsin komentorivisovelluksissa oletus on yleensä OEM-850 (voi olla myös OEM-437, riippuen COUNTRY -asetuksesta). Tämä on ilmeisesti MS-DOSin peruja ja on sieltä tullut käytännöksi myös windowsiin.
  
  em. syistä Windowsissa on siis Graafisissa sovelluksissa ja komentorivisovelluksissa eri koodaustapa, jenkki-ASCIIn osalta ovat samoja, mutta jos ei koodata oikein, niin suomalainen käyttäjä huomaa väärän koodauksen siitä, että Ä ja Ö -kirjaimet korvautuvat roskalla.
- Anonyymi
  2023-01-30 19:33:43
  malaireon oikeassa.
  
  koodissa oleva int80h viittaa linuxiin.
  
  Windowsissahan käytetään DLL:ä, ja ms-dosissa vastaava oli int 21h.
  
  Nyky -linuxeissa oletuskoodaus on tosiaankin UTF-8 -enkoodattu unicode.
  
  Vai onko?
  
  Onkohan edes linux kernelissä homma koodattu oikein ?
  
  Kun linuxin eräissä muissa kirjastoissa (olisiko libiconv ?) tai joku muu vastaava, liittyy eri merkkikoodausten väliseen konvertointiin, niin siellä on ollut jo vuosia vakava bugi, eikä tekijöitä pätkääkään kiinnosta korjata huonoa ja väärin toimivaa koodiaan.
  
  Kyse siis siitä, että unicode consortiumin mukaan on vain 1 ainoa UTF-8 -koodaus, eikä ole olemassa mitään vaihtoehtoista UTF-8 koodaustapaa.
  
  Mutta linuxin eräs tunnetuimmista kirjastoista koskien merkkikoodausmuunnoksia on jo vuosia toiminut väärin !
  
  Eli KUN on kyse BMP:n (Basic Multilingual page) ulkopuolisista merkeistä, eli U+10000 koodista eteenpäin (ei siis koske koodeja U+0000 - U+ FFFF), niin nuo kaikki, aina U+10FFFF saakka, kuuluu koodata UTF-8 koodauksella enintään 4:llä tavulla!
  
  Mutta tämä linuxin pellekirjasto enkoodaa ne 6 tavulla, koodaamalla UTF-16 -esitysmuodon HIGH ja LOW -surrogaten kummankin erikseen 3-tavuisella UTF-8 esityksellä, eli 1 merkki = yhteensä 6 tavuinen sekopää-utf-8 -enkoodattu esitys. Ja tämä on unicode consortiumin sääntöjen vastaista.
  
  Saavatkohan ikinä korjattua ???
Anonyymi
2020-10-23 22:36:05
Nämäpä olivatkin hankalia kääntää komentokehotteesta käsin. Pitkän rupeaman hain ohjetta, löytämättä sellaista, joka olisi virheettömästi käännöksen tehnyt.
Anonyymi
2020-10-25 01:51:36
Assembler on tietokoneen ohjelmointikieli, jonka opettelusta ei ole mitään hyötyä.
- Anonyymi
  2023-01-25 10:31:53
  -kääntäjän virheellisen toiminnan selvittäminen vaatii toisinaan assembler-taitoja
  -core dumpista voi nähdä, jos virheen on aiheuttanut esim. muistin virheily eikä kyseessä ole ohjelmointivirhe
  -koodin optimointien ymmärtäminen vaatii assembler-taitoja sulautetuissa, esim. koodin voi joutua optimoimaan kääntäjäparametrilla, mutta rikkinäisen kääntäjän/alustan rajoitteiden tai uutuuden takia käännöksen assembleriin on tehtävä käsin muutoksia, jotta koodi toimisi tai käyttäisi kääntäjästä puuttuvaa - vielä tehokkaampaa mnemonic:ia.
  -sanoisin, että monet selviävät ilman assemblerin opettelua, mutta ilman assembleria ei pysty rakentamaan esim. toimivia kääntäjiä
  -assemblerin opettelusta on se hyöty, että voi alkaa ymmärtää, miksi korkeamman tason kielissä jotkin asiat toimivat hitaasti väärin toteutettuina ja miksi kääntäjäoptimoinnit voivat rikkoa koodia mm. sulautetuissa ja muodostuva assembler pitää toisinaan tietää.
  -ja syitä on paljon muitakin, mm. debuggerit usein näyttää koodisekvenssit ja usein se auttaa hahmottamaan koodin toiminnan ts. miksi koodi on virheellistä
Anonyymi
2023-01-31 06:38:42
itseasiassa voisin heittää koodin pätkää on Star Generator 3.0.

Olen paloillanin en hati löäytäyt tuo tku 534983

joudutte tyytymään johonkin itren moduuleihin eli siis Pythön tai joku muukin pelkle

Sorry
Anonyymi
2023-01-31 06:43:19
https://www.cs.virginia.edu/~evans/cs216/guides/vsasm.html

helppo joku opeyud jossa ei mennä sitten mihinkääö grtagiikkakiihdyttimeni muistin lukitsemiseneeen jen.
Anonyymi
2023-01-31 07:08:29
oikeasti ovat device-driver-ohjelmoijia jotka käyttävät, eli boot-koodi normia jne..

Mitä haluasit tehdä assembyllä oikeasti sitten vaikka piirtää kirjaimia ruudulleP?=

Ketjusta on poistettu 1 sääntöjenvastaista viestiä.

Takaisin ylös

Luetuimmat keskustelut

Mikä teidän jutussa on ongelmana?
Missä meni pieleen?
27.06.2026 08:32Ikävä
136
1270
Kauhavan häiriköijistä
Juttua Iltalehdessä. Pakko sanoa että noi nuoret on kyllä ihan pimeitä. Putkin peltoja jupksevat kiusaamaan kun ei tietä
27.06.2026 16:28Kauhava
34
811
Tehdäänkö tänään toiveista totta?
Poikkea tänä illasta siinä lähellä ja annetaan silmien puhua ja sen jälkeen puhu sinä lopulta mitä ajattelet..
27.06.2026 12:56Ikävä
46
587
Auto ajoi päälle?
Ja pakeni luin iltapäivälehdestä. ! Ken on kuski joka tuollee teki
27.06.2026 07:10Kuusankoski
14
570
Haluan sinut, kuuletko minua.
Haluan sinut. Toivon, että voisimme olla yhdessä. Mietin pystynkö täyttämään toiveesi, olemaan arvoisesi. Voisitko saad
28.06.2026 01:06Ikävä
27
546
Miksi Lapset kiusaa yöllä
Miksi Lapset kiusaa yöllä ihmisiä? Miksi vanhemmat antaa tämän tapahtua? Eikö ne huomaa ettei lapset ole kotona vai eivä
27.06.2026 18:47Kauhava
25
531
Ajatteletko ollenkaan minua
Naiselle, jonka kanssa vahva tunne yhteydestä. Jota kipeästi kaipaan, mutta jota ei juuri näe. Onko siitä jo kolme vuott
27.06.2026 22:36Ikävä
30
516
Hän on tosi
hyvännäköinen. Ei edes ryppyi oo. :D
28.06.2026 16:03Ikävä
24
491
Viimeinen lankafest
Käykää viimeisessä lanka festissä. Ensivuonna sitä ei enää ole. Rahat on loppu. Harmi .
27.06.2026 19:45Puolanka
15
472
Sama ransetti taas!
Keikkui tällä kertaa Honkavaaran tien varressa muutaman sadan metrin päässä Louhenkoskelta.. Otin rekisterin ylös ja ver
27.06.2026 09:15Hyrynsalmi
14
471

Merkkien määrä (hello.asm)

Vastaukset

Anonyymi kirjoitti:

Anonyymi kirjoitti:

Luetuimmat keskustelut

Mikä teidän jutussa on ongelmana?

Kauhavan häiriköijistä

Tehdäänkö tänään toiveista totta?

Auto ajoi päälle?

Haluan sinut, kuuletko minua.

Miksi Lapset kiusaa yöllä

Ajatteletko ollenkaan minua

Hän on tosi

Viimeinen lankafest

Sama ransetti taas!

Taitaa jäädä kotimaiset mansikat ostamatta

Sinkkumiehet hukkaavat tärkeän ässän hihastaan kun

MTV: Uudesta Ensitreffit alttarilla -kaudesta historiallinen uutinen - Iso muutos tulossa

Miksi Suomi on niin surkea jalkapallossa?

Hyvää Uunon ja Uuno Turhapuron nimpparipäivää!

Suomen Yrittäjät täräyttää: Sunnuntain tuplapalkka pois lomat lyhyemmiksi ja arkipyhät palkattomiksi

Jani Wickholm on kuollut

Kumpi on parempi: julkkis- vai taviskisaajat?

Tappio Rydmanille

Näyttääkö Käärijä "närhen munat" ruotsalaisille?