lc ja UTF-8

unicodaaja

Aika että joku lopulta laittaa vähän Perliäkin tänne, eli miksi seuraava ei toimi?

#!/usr/bin/perl
use utf8;
binmode(STDIN,":utf8");
binmode(STDOUT,":utf8");
$testi="hÖlökyn kÖlKyn";
if($testi=~/(Öl)/i) {
   print lc($1)."
";
}

Tämä tulostaa siis
Öl
Jos tuon $1:n sijoittaa johonkin muuhun muuttujaan ensin, siis
$temp=$1;
print lc($temp)."
";
niin tuo tulee pienellä niin kuin pitäisikin.

5

1134

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • unicodaaja

      Ehkä on totta ettei täällä käy ketään, mutta pidänpä sitten julkista yksinpuhelua...

      Erittäin kummalliseksi em. ongelman tekee se, että jos $1:tä on käsitelty ennen kuin sitä yrittää pienentää, homma toimii. Elikkä demoten:

      #!/usr/bin/perl
      use utf8;
      binmode(STDOUT,":utf8");
      $testi="HÖLÖKYN KÖLKYN";
      $testi=~s/(öl)/lc($1)/eig;
      print $testi."\n";

      Tämä tulostaa:
      HÖlÖKYN KölKYN

      Elikkä homman saa toimimaan jopa näin:

      #!/usr/bin/perl
      use utf8;
      binmode(STDOUT,":utf8");
      $testi="HÖLÖKYN KÖLKYN";
      $testi=~s/(öl)/ignore($1).lc($1)/eig;
      print $testi."\n";

      sub ignore($) {
         local ($_)=@_;
         return "";
      }

      Nyt siis tuloste on:
      HölÖKYN KölKYN

      Ehkä pitäisi ilmoitella bugi... Kyseessä siis:
      $ perl --version

      This is perl, v5.8.0 built for i386-linux-thread-multi

      • Mik

        Niin, onhan tämä hieman hiljainen foorumi.

        Kokeilin selvittää asiaa itsekin, mutta testikoneen perl5.8.0 ei pitänyt koodista ollenkaan, sillä jokainen ääkkönen aiheutti jonkun urputuksen tunnistamattomasta UTF-8 -merkistä. Lisäksi perldoc ei listannut binmodelle toiseksi parametriksi kuin ":raw" ja ":crlf". Jos epäilet perlissä olevan bugin, niin mieti saatko kierrettyä ongelman jollain tapaa.

        return "";, miksei return undef ? Lisävinkkinä suosittelen ehdottomasti option -w ja use strict;in käyttöä kaikissa ohjelmissa.


      • unicodaaja
        Mik kirjoitti:

        Niin, onhan tämä hieman hiljainen foorumi.

        Kokeilin selvittää asiaa itsekin, mutta testikoneen perl5.8.0 ei pitänyt koodista ollenkaan, sillä jokainen ääkkönen aiheutti jonkun urputuksen tunnistamattomasta UTF-8 -merkistä. Lisäksi perldoc ei listannut binmodelle toiseksi parametriksi kuin ":raw" ja ":crlf". Jos epäilet perlissä olevan bugin, niin mieti saatko kierrettyä ongelman jollain tapaa.

        return "";, miksei return undef ? Lisävinkkinä suosittelen ehdottomasti option -w ja use strict;in käyttöä kaikissa ohjelmissa.

        Ääkkösurputus, talleta tiedosto utf-8:na tai poista "use utf8". Onkohan perldocisi jostakin vanhemmasta versiosta? Minun luettelee kyllä ":raw", ":crlf", ":bytes", ":utf8", ":encoding". Kiertohan tuossa jo oli, ja kun homma toimii ASCII-merkeillä ja muillakin kunhan muuttujaan on kerran koskettu, kyseessä lienee aika selkeä bugi. Täytyypä kokeilla päteekö sama homma Windows-koneessa kohta kun sellaisen eteen päädyn.

        Kokeilinpa laittaa -w ja use strict;, halusivat vähän järjestelymuutoksia, joiden jälkeen pelaa samoin kuin ennenkin. Näitä käyttäen return undef; antaa:
        Use of uninitialized value in concatenation (.) or string at lctest2.pl line 11.


      • unicodaaja
        unicodaaja kirjoitti:

        Ääkkösurputus, talleta tiedosto utf-8:na tai poista "use utf8". Onkohan perldocisi jostakin vanhemmasta versiosta? Minun luettelee kyllä ":raw", ":crlf", ":bytes", ":utf8", ":encoding". Kiertohan tuossa jo oli, ja kun homma toimii ASCII-merkeillä ja muillakin kunhan muuttujaan on kerran koskettu, kyseessä lienee aika selkeä bugi. Täytyypä kokeilla päteekö sama homma Windows-koneessa kohta kun sellaisen eteen päädyn.

        Kokeilinpa laittaa -w ja use strict;, halusivat vähän järjestelymuutoksia, joiden jälkeen pelaa samoin kuin ennenkin. Näitä käyttäen return undef; antaa:
        Use of uninitialized value in concatenation (.) or string at lctest2.pl line 11.

        Jos jotakuta sattuu kiinnostamaan, sama ongelma esiintyi siis Windows-versiossa Perl 5.8:sta.


    • unicodaaja

      Päivityksenä, jos jotakuta kiinnostaa, tämä bugi on korjattu Perl-versiossa 5.8.1.

    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Onks sulle väliä, jos jokin kaivattusissa

      ei ole täydellistä? Esim. venytysmerkit, arvet, selluliitti, epäsymmetriset rinnat, vinot hampaat jne?
      Ikävä
      85
      4550
    2. Ei sinussa ollut miestä

      Selvittämään asioita vaan kipitit karkuun kuin pikkupoika.
      Ikävä
      127
      3958
    3. Shokkiyllätys! 31-vuotias Hai asuu vielä "kotona" - Anna-vaimon asenne ihmetyttää: "No ei tämä..."

      Hmmm, mitenhän sitä suhtautuisi, jos aviomies/aviovaimo asuisi edelleen lapsuudenperheensä kanssa? Tuore Ensitreffit-vai
      Ensitreffit alttarilla
      33
      2521
    4. Eikö Marin ollut oikeassa kokoomuksen ja persujen toiminnasta

      Ennen vaaleja Marin kertoi mitä kokoomus tulisi hallituksessa tekemään ja tietysti persut suostuu kaikkeen, mitä kokoomu
      Maailman menoa
      197
      1535
    5. Wiisaat Lappajärvellä iät.

      Nyt nimiä listaan menneistä ja nykyisistä Wiisaista Lappajärveläisistä. Itseäkin voi tuoda esille kaikessa Wiisaudessa.
      Lappajärvi
      12
      1286
    6. Missä Steffe hiihtää?

      Missä reppuli luuraa? Ei ole Seiskassa mitään sekoiluja ollut pariin viikkoon? Onko jo liian kylmä skulata tennistä ulko
      Kotimaiset julkkisjuorut
      22
      1243
    7. Olet elämäni rakkaus

      On ollut monia ihastumisia ja syviäkin tunteita eri naisia kohtaan, mutta sinä olet niistä kaikista ihmeellisin. Olet el
      Ikävä
      36
      1198
    8. Ratkaiseva tekijä kiinnostuksen heräämisessä

      Mikä tekee deittikumppanista kiinnostavan? Mitä piirrettä arvostat / et arvosta?
      Sinkut
      62
      1193
    9. Milloin nainen, milloin?

      Katselet ja tiedän, että myös mieli tekee. Voisit laittaa rohkeasti viestin. Tiedät, että odotan. Ehkä aika ei ole vielä
      Ikävä
      61
      1153
    10. Olen menettänyt yöunet kokonaan

      Nytkin vain tunnin nukkunut. En tiedä johtuuko se sinusta vai tästä palstasta. Olis mukava nähdä oikeasti eikä arvuutel
      Tunteet
      17
      1065
    Aihe