lc ja UTF-8

unicodaaja

Aika että joku lopulta laittaa vähän Perliäkin tänne, eli miksi seuraava ei toimi?

#!/usr/bin/perl
use utf8;
binmode(STDIN,":utf8");
binmode(STDOUT,":utf8");
$testi="hÖlökyn kÖlKyn";
if($testi=~/(Öl)/i) {
   print lc($1)."
";
}

Tämä tulostaa siis
Öl
Jos tuon $1:n sijoittaa johonkin muuhun muuttujaan ensin, siis
$temp=$1;
print lc($temp)."
";
niin tuo tulee pienellä niin kuin pitäisikin.

5

1265

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • unicodaaja

      Ehkä on totta ettei täällä käy ketään, mutta pidänpä sitten julkista yksinpuhelua...

      Erittäin kummalliseksi em. ongelman tekee se, että jos $1:tä on käsitelty ennen kuin sitä yrittää pienentää, homma toimii. Elikkä demoten:

      #!/usr/bin/perl
      use utf8;
      binmode(STDOUT,":utf8");
      $testi="HÖLÖKYN KÖLKYN";
      $testi=~s/(öl)/lc($1)/eig;
      print $testi."\n";

      Tämä tulostaa:
      HÖlÖKYN KölKYN

      Elikkä homman saa toimimaan jopa näin:

      #!/usr/bin/perl
      use utf8;
      binmode(STDOUT,":utf8");
      $testi="HÖLÖKYN KÖLKYN";
      $testi=~s/(öl)/ignore($1).lc($1)/eig;
      print $testi."\n";

      sub ignore($) {
         local ($_)=@_;
         return "";
      }

      Nyt siis tuloste on:
      HölÖKYN KölKYN

      Ehkä pitäisi ilmoitella bugi... Kyseessä siis:
      $ perl --version

      This is perl, v5.8.0 built for i386-linux-thread-multi

      • Mik

        Niin, onhan tämä hieman hiljainen foorumi.

        Kokeilin selvittää asiaa itsekin, mutta testikoneen perl5.8.0 ei pitänyt koodista ollenkaan, sillä jokainen ääkkönen aiheutti jonkun urputuksen tunnistamattomasta UTF-8 -merkistä. Lisäksi perldoc ei listannut binmodelle toiseksi parametriksi kuin ":raw" ja ":crlf". Jos epäilet perlissä olevan bugin, niin mieti saatko kierrettyä ongelman jollain tapaa.

        return "";, miksei return undef ? Lisävinkkinä suosittelen ehdottomasti option -w ja use strict;in käyttöä kaikissa ohjelmissa.


      • unicodaaja
        Mik kirjoitti:

        Niin, onhan tämä hieman hiljainen foorumi.

        Kokeilin selvittää asiaa itsekin, mutta testikoneen perl5.8.0 ei pitänyt koodista ollenkaan, sillä jokainen ääkkönen aiheutti jonkun urputuksen tunnistamattomasta UTF-8 -merkistä. Lisäksi perldoc ei listannut binmodelle toiseksi parametriksi kuin ":raw" ja ":crlf". Jos epäilet perlissä olevan bugin, niin mieti saatko kierrettyä ongelman jollain tapaa.

        return "";, miksei return undef ? Lisävinkkinä suosittelen ehdottomasti option -w ja use strict;in käyttöä kaikissa ohjelmissa.

        Ääkkösurputus, talleta tiedosto utf-8:na tai poista "use utf8". Onkohan perldocisi jostakin vanhemmasta versiosta? Minun luettelee kyllä ":raw", ":crlf", ":bytes", ":utf8", ":encoding". Kiertohan tuossa jo oli, ja kun homma toimii ASCII-merkeillä ja muillakin kunhan muuttujaan on kerran koskettu, kyseessä lienee aika selkeä bugi. Täytyypä kokeilla päteekö sama homma Windows-koneessa kohta kun sellaisen eteen päädyn.

        Kokeilinpa laittaa -w ja use strict;, halusivat vähän järjestelymuutoksia, joiden jälkeen pelaa samoin kuin ennenkin. Näitä käyttäen return undef; antaa:
        Use of uninitialized value in concatenation (.) or string at lctest2.pl line 11.


      • unicodaaja
        unicodaaja kirjoitti:

        Ääkkösurputus, talleta tiedosto utf-8:na tai poista "use utf8". Onkohan perldocisi jostakin vanhemmasta versiosta? Minun luettelee kyllä ":raw", ":crlf", ":bytes", ":utf8", ":encoding". Kiertohan tuossa jo oli, ja kun homma toimii ASCII-merkeillä ja muillakin kunhan muuttujaan on kerran koskettu, kyseessä lienee aika selkeä bugi. Täytyypä kokeilla päteekö sama homma Windows-koneessa kohta kun sellaisen eteen päädyn.

        Kokeilinpa laittaa -w ja use strict;, halusivat vähän järjestelymuutoksia, joiden jälkeen pelaa samoin kuin ennenkin. Näitä käyttäen return undef; antaa:
        Use of uninitialized value in concatenation (.) or string at lctest2.pl line 11.

        Jos jotakuta sattuu kiinnostamaan, sama ongelma esiintyi siis Windows-versiossa Perl 5.8:sta.


    • unicodaaja

      Päivityksenä, jos jotakuta kiinnostaa, tämä bugi on korjattu Perl-versiossa 5.8.1.

    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. VVM Riikka Purra ministerin asemassaan valehteli ja rikkoi perustuslakia.

      Valtiovarainministeri Riikka Purra (PS) kiisti Ylen ykkösaamussa luvanneensa ennen vaaleja, ettei pienituloisilta leikat
      Politiikka
      101
      16616
    2. Me, Suomen kansa, vaadimme Riikka Purran eroa ministerin tehtävästä

      Riikka Purra on toistuvalla valehtelullaan osoittanut olevansa epärehellinen henkilö. Perustuslain kohdassa 60 § edell
      Maailman menoa
      123
      7284
    3. Purra ennen vaaleja: "pienituloisten etuuksista leikkaaminen ei meille käy"

      "...perussuomalaisten ero muun muassa kokoomukseen, joka haluaa leikata pienituloisten etuuksista, se ei meille käy."
      Maailman menoa
      85
      3996
    4. Toksinen persuvasemmisto

      Kun toksiset ihmiset eivät kykene hallitsemaan sinua, saamaan sinua näkemään asiat niin kuin he haluaa, toimimaan niin k
      Maailman menoa
      25
      2975
    5. Rikkaiden ja yritysten veroaleen ei ole varaa

      Ei pieni Suomi pysty elättämään vanhenevaa väestöä nykyisellä veroasteella. Ainakin 5-prosenttiyksikköä pitää kokonaisve
      Maailman menoa
      67
      2662
    6. Hotelli Kainuu konkurssiin

      Vasta laajenivat Eskobarilla ja nyt näin https://www.kainuunsanomat.fi/artikkeli/hotelli-kainuu-hakeutunut-konkurssiin
      Kuhmo
      93
      2123
    7. "Minua ei kiinnosta opiskelu eikä töissä käyminen"

      Voiko lausunnosta päätellä lainkaan mikä puolue saattaisi ajaa tuollaisen kansalaisen elämäntavan mahdollistamista? htt
      Maailman menoa
      98
      2106
    8. Mitä Purra oikeasti sanoi ennen vaaleja...

      ...pienituloisten leikkaamisesta? Tässä se on. "Esimerkiksi se, mistä aiotaan leikata, perussuomalaisten ero muun muass
      Maailman menoa
      125
      2075
    9. Huomentaaaa

      Hyvää huomenta.... Tiiätkö kuinka vaikeata susta on ottaa mitään selvää ja ymmärtää yhtään mitään? Mukavaa päivää... sil
      Ikävä
      38
      2002
    10. Tikkunenällä on kovat luulot itsestään

      Mut ei tarjottavana muuta kuin katkeruutta, ilkeyttä ja ilkeä luonne hyih.. oikea miesten nielijä Onneksi kaivatullani
      Ikävä
      13
      1889
    Aihe