Assembler vs GNU standard lib

Huvikseni yritin disassmbloida gligc-2.28:n strlen rutiinia ja sain puristettua
ulos alla olevan intel-syntaxisen ja NASM:lla käännettävän (nasm -felf64 ...) koodin siitä.
Sitten testasin tätä (nasm'lla tuotettua) koodia linkitettynä staattisesti sitä kutsuvaan
C-koodiin ja vertasin tulosta standard C strlen kutsuihin....

; Tämä ON glibc strlen vieläpä hieman optimoituna,
; eli ei stack-framea ja poistettu kaksi if lausetta.

global as_strlen
section .text

as_strlen:
mov r9, rdi
test dil, 7
je addr_c
cmp BYTE [rdi], 0
jne addr_b
jmp addr_o
addr_a: cmp BYTE [rdi], 0
je addr_g
addr_b: inc rdi
test dil, 7
jne addr_a
addr_c: mov r8, 0xfefefefefefefeff
mov rsi, 0x8080808080808080
jmp addr_f
addr_d: cmp BYTE [rdx-7], 0
je addr_i
cmp BYTE [rdx-6], 0
je addr_j
cmp BYTE [rdx-5], 0
je addr_k
cmp BYTE [rdx-4], 0
je addr_l
cmp BYTE [rdx-3], 0
je addr_m
cmp BYTE [rdx-2], 0
je addr_n
cmp BYTE [rdx-1], 0
je addr_o
addr_e: mov rdi, rdx
addr_f: lea rdx, [rdi 0x8]
mov rax, QWORD [rdx-8]
lea rcx, [rax r8]
not rax
and rax, rcx
test rax, rsi
je addr_e
cmp BYTE [rdx-8], 0
jne addr_d
addr_g: mov rax, rdi
sub rax, r9
ret
xor eax, eax
ret
addr_i: sub rdi, r9
lea rax, [rdi 1]
ret
addr_j: sub rdi, r9
lea rax, [rdi 2]
ret
addr_k: sub rdi, r9
lea rax, [rdi 3]
ret
addr_l: sub rdi, r9
lea rax, [rdi 4]
ret
addr_m: sub rdi, r9
lea rax, [rdi 5]
ret
addr_n: sub rdi, r9
lea rax, [rdi 6]
ret
addr_o: sub rdi, r9
lea rax, [rdi 7]
ret

;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
Ja mitä olivat tulokset?

glibc strlen voitti tämän rutiinin, eli se oli ~ 3-4% nopeampi kuin tämä
vaikka tämä koodi on melkein suora disassembly kyseisestä glibc rutiinista

Jokin pielessä?

4

460

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • Ei välttämättä mikään pielessä.

      C-kieli on käytännössä sitä assembleria mistä ohjelmallisesti tuotetaan optimaalinen tavukoodi prosessorin ajettavaksi ja prosessorivalmistajat optimoivat sitä kääntäjää. Käsin tavukoodin nysvääminen tuskin tuottaa nopeampaa tulosta.

      Käsin tavukoodin nysvääminen yleisesti ottaen ollut sellaista mitä kannattanut välttää viimeiseen asti ja ollut 20v sellainen tilanne, että kääntäjästä parempaa tulosta ei oikein saa missään.

      Itseasiassa 20v sitten oli sellainen kieli kuin Haskell kypsynyt jo niin hyväksi, että sillä pystyi ohjelmointikielen tasolla varmistamaan että ei ole sivuvaikutuksia koodissa joka sitten mahdollistanut optimointeja jotka ovat ihmiselle hyvin vaiketa saada virheettömästi tehtyä. Käytännössä tekeekin semmoista temppua että voi saada helposti tuotettua nopeampaa koodia mitä C:llä, kun jo C:llä sai parempaa koodia mitä käsin tavukoodia nysväämällä.

      • Kyllä kyllä, mutta tuo koodi on SUORA disassembly samasta C-rutiinista


      • tractor kirjoitti:

        Kyllä kyllä, mutta tuo koodi on SUORA disassembly samasta C-rutiinista

        "glibc strlen voitti tämän rutiinin, eli se oli ~ 3-4% nopeampi kuin tämä
        vaikka tämä koodi on melkein suora disassembly kyseisestä glibc rutiinista"

        Sanoit että melkein suora, eli ei identtinen.


    • Anonyymi

      Miten on koodisi alignment? Sillä on helposti 3-4 % merkitys, kun hyppyjä tehdään paljon.

      Mutta missä on repnz scasb, jolla strlen oli aikaisemmin toteutettu? Sitä tehokkaampaa koodia tuskin saa tehtyä luuppaamalla, vaikka hyödyntäisi 64-bittisiä rekistereitä yo. koodin tavoin.

    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. VVM Riikka Purra ministerin asemassaan valehteli ja rikkoi perustuslakia.

      Valtiovarainministeri Riikka Purra (PS) kiisti Ylen ykkösaamussa luvanneensa ennen vaaleja, ettei pienituloisilta leikat
      Politiikka
      15
      6078
    2. Riikan vappumiljardin maksavat sairaat, vanhukset ja kuolleiden omaiset

      Vappumiljardi, eli Riikan päätös laskea yhteisöveroa kaksi prosenttiyksikköä 18 prosenttiin, vie verotuloja noin miljard
      Maailman menoa
      245
      3745
    3. Purra ennen vaaleja: "pienituloisten etuuksista leikkaaminen ei meille käy"

      "...perussuomalaisten ero muun muassa kokoomukseen, joka haluaa leikata pienituloisten etuuksista, se ei meille käy."
      Maailman menoa
      24
      3412
    4. Seiska: Helmi Loukasmäki, 25, rehellisenä Dannystä, 83, ja isosta ikäerosta

      Helmi Loukasmäki, 25, ja Ilkka Danny Lipsanen, 83, ovat pitäneet yhtä jo useamman vuoden. Nyt Helmi kertoo rehellisenä i
      Kotimaiset julkkisjuorut
      39
      3096
    5. Ammattiliittojen jäsenmaksut valtion maksettavaksi

      Ammattiliitot neuvottelvat jäsenilleen paremmat palkat, jotka lisäävät valtio verotuloja. Tästä syystä valton tulee maks
      Maailman menoa
      19
      3034
    6. Uus terveysassema

      Ei taia olla vielä ketjua siitä ni minäpä alotan. Joko sitä ruvettas porukalla nyt mollaamaa ja arvostelemaa ku nii ruma
      Kuhmo
      13
      2815
    7. Toksinen persuvasemmisto

      Kun toksiset ihmiset eivät kykene hallitsemaan sinua, saamaan sinua näkemään asiat niin kuin he haluaa, toimimaan niin k
      Maailman menoa
      19
      2709
    8. Särkyneelle sydämelle

      Särjin sun sydämen En voi lakata itkemästä Minuun tekee kipeää Koska sinuunkin. Että näin.. En ole runoilija😂
      Suhteet
      51
      2385
    9. Purralla luistaa hihna isolla pyörällä, kasetti ei kestä

      ”Purra käy nyt pahasti ylikierroksilla” Nähtiinhän Purran sekoilut jo Lohjan torilla taannoin. Eikö eduskunnassa ole
      Maailman menoa
      27
      1973
    10. Riikka Purra: Autoilu tulee Suomen valtiolle pyöräilyä edullisemmaksi! Siksi pyöräetu poistettiin!

      🐸🐸🐸🐸🐸 Perussuomalaisten trollitehdas kiukkuaa kun Riikka Purra päästi taas sammakoita suustaan että autoilu tulee S
      Maailman menoa
      317
      1643
    Aihe