Aihe

Tekstitiedoston rivien käsittely bashissa

Anonyymi

Mikähän olisi näppärin tapa lisätä tekstitiedoston jokaisen rivin eteen tietty määrä merkkejä, kuten välilyöntejä? Pitääkö käydä silmukassa jokainen rivi erikseen, ja echottaa halutut merkit ensin ja perään itse rivi?

Tiedostoa ei tarvitse tai pidä muuttaa, vaan lopputulos on tarkoitus liittää osaksi uutta tiedostoa.

25

<50

    Vastaukset

    • Voihan sitä kokeilla vaikka näinkin:

      input="a.txt" && while IFS= read -r line; do echo "merkit$line" >> b.txt; done < "$input"

      On tuosta varmaan mahdollisuus lyhentääkin jotenkin.
      — a.txt = alkuperäinen tiedosto
      — "merkit$line" = merkit on lisättävät merkit ja $line = luettu rivi vanhasta tiedostosta ja yhdessä muodostavat uuden rivin uuteen tiedostoon.
      — b.txt on uusi tiedosto.

      • mv tiedostoalkup.txt tiedostouus.txt


    • Sedillä käy aika kätevästi. Tuossa on 1234 lisättävä merkkijono.

      sed 's/^/1234/' tiedosto.txt

      • No tuosta se tuskin lyhenee, kokonaisuudessaan tuo SED

        sed 's/^/1234/' a.txt >> b.txt


    • Kiitokset. Tuo sed on juuri sopiva tähän käyttöön.

      Entä mahtaiskohan millä menetelmällä pystyä määrittämään tekstitiedoston viimeisen rivin "aloituskohdan", eli kuinka monta välilyöntiä tai sarkainta on ennen muita merkkejä?

      Aikaisemman kysymyksen tiedoston rivien etumerkkien määrä perustuu toisen tiedoston viimeiseen riviin, lisätään siis sen toisen tiedoston jatkeeksi.

      • Komento awk sopii tuohon käyttöön. Esimerkki laskee tiedoston viimeisen rivin alusta sekä välilyönnit että tabulaattorit. Muokkamalla hakasulkujen välissä olevaa kohtaa voi laskea pelkästään välilyönnit [^ ] tai tabulaattorit [^\t], tai mitä sitten haluaakaan.

        awk -F'[^ ^\t]' 'END{print length($1)}' tiedosto.txt


    • Jos tiedetään kuinka monta kertaa merkki tai merkkijono halutaan tulostaa rivin alkuun, niin sen voi tehdä echo-komennolla:

      echo -e ''$_{1..4}'\b=' \\bloppurivi

      ====loppurivi

      Komentorivissä aaltosulkeiden välissä oleva jälkimmäinen luku (tässä '4') määrittää kuinka monta kertaa merkki/merkkijono (tässä '=') tulostetaan. Kannattaa huomata että rivin loppu pitää tosiaan liittää kiinni kohtaan '...\\b'.

      • Echottaessa muuten jos haluaa käyttää välilyöntiä rivin alussa pitää käyttää välilyönnin heksakoodia 20. Jos laittaa välilyönnin lainausmerkkeihin " ", niin se jää pois alusta. Tuo tulostaa neljä tyhjää rivin alkuun.

        echo -e $(for each in $(seq 1 4); do echo -n "\x20"; done)loppuosa


    • En ole varma mitä halusit, mutta jos se oli, että halusit tietää montako ei näkyvää merkkiä on tiedoston viimeisen rivin alussa, niin näin se vastaus löytyy:

      c=$( sed -n -e '$p' a.txt ) | b=`echo ${c}` | ((x = ${#c}-${#b})) | echo $x

      a.txt on se tiedosto, jonka viimeisestä rivistä näiden ei näkyvien merkkien määrä tässä selvitetään. Muut muuttujat ovat vain laskennan apuna.

      T. Urpo

      • Taas minä ketjutin tuon väärin pitää vaihtaa | merkit näihin &&
        eli tee se näin:

        c=$( sed -n -e '$p' a.txt ) && b=`echo ${c}` && ((x = ${#c}-${#b})) && echo $x

        Tämä ei ollut ensimmäinen ketjutus virheeni, eikä varmaan viimeinenkään. Kun tuollaisen testaa lause lauseelta, ja lopuksi ketjuttaa yksi riviseksi jostain kumman syystä tulee aina laitettua tämä | vaikka pitäisi laittaa tämä &&.

        Kumma ettei kukaan kerinnyt huomauttamaan. Siinä muuten on hieno yksityiskohta, nimittäin echo komento toimii TRIM funktiona ( b=`echo ${c}` ) . ECHO komennon pitäisi tulostaa koko merkkijono, mutta sepä ei sitä teekään silloin kun merkkijonon alussa on välilyöntejä echo jättää ne pois, sen vuoksi tässä saadaan b -muuttujaan suodatettu viimeinen rivi, jonka pituus sitten vähennetään kokonaisesta rivistä ($c).


      • Anonyymi kirjoitti:

        Taas minä ketjutin tuon väärin pitää vaihtaa | merkit näihin &&
        eli tee se näin:

        c=$( sed -n -e '$p' a.txt ) && b=`echo ${c}` && ((x = ${#c}-${#b})) && echo $x

        Tämä ei ollut ensimmäinen ketjutus virheeni, eikä varmaan viimeinenkään. Kun tuollaisen testaa lause lauseelta, ja lopuksi ketjuttaa yksi riviseksi jostain kumman syystä tulee aina laitettua tämä | vaikka pitäisi laittaa tämä &&.

        Kumma ettei kukaan kerinnyt huomauttamaan. Siinä muuten on hieno yksityiskohta, nimittäin echo komento toimii TRIM funktiona ( b=`echo ${c}` ) . ECHO komennon pitäisi tulostaa koko merkkijono, mutta sepä ei sitä teekään silloin kun merkkijonon alussa on välilyöntejä echo jättää ne pois, sen vuoksi tässä saadaan b -muuttujaan suodatettu viimeinen rivi, jonka pituus sitten vähennetään kokonaisesta rivistä ($c).

        Mainittakoon että rivin lopussa ei saa olla välilyöntejä, vai rivin alussa, muutoin lasku antaa virheellisen tuloksen. Eli hiomista jäi jos ken haluaa parantaa.

        T. Urpo


      • Anonyymi kirjoitti:

        Mainittakoon että rivin lopussa ei saa olla välilyöntejä, vai rivin alussa, muutoin lasku antaa virheellisen tuloksen. Eli hiomista jäi jos ken haluaa parantaa.

        T. Urpo

        Mainittakoon että se parannus tulisi kohdistaa juuri tuohon ECHO komennon virheellisen tulostuksen hyödyntämiseen, eli tämä osuus tuli tehdä toisin:

        && b=`echo ${c}` &&

        b$ muuttujaan tulisi siirtää c$ muuttujasta vain edestä TRIMMATTU merkkijono, kun se tässä TRIMMATAAN edestä ja takaa, toimii jos ei rivin loput sisällä välilyöntejä. Tämä meni snoppailuksi tällä kertaa.

        T. Urpo


      • Anonyymi kirjoitti:

        Taas minä ketjutin tuon väärin pitää vaihtaa | merkit näihin &&
        eli tee se näin:

        c=$( sed -n -e '$p' a.txt ) && b=`echo ${c}` && ((x = ${#c}-${#b})) && echo $x

        Tämä ei ollut ensimmäinen ketjutus virheeni, eikä varmaan viimeinenkään. Kun tuollaisen testaa lause lauseelta, ja lopuksi ketjuttaa yksi riviseksi jostain kumman syystä tulee aina laitettua tämä | vaikka pitäisi laittaa tämä &&.

        Kumma ettei kukaan kerinnyt huomauttamaan. Siinä muuten on hieno yksityiskohta, nimittäin echo komento toimii TRIM funktiona ( b=`echo ${c}` ) . ECHO komennon pitäisi tulostaa koko merkkijono, mutta sepä ei sitä teekään silloin kun merkkijonon alussa on välilyöntejä echo jättää ne pois, sen vuoksi tässä saadaan b -muuttujaan suodatettu viimeinen rivi, jonka pituus sitten vähennetään kokonaisesta rivistä ($c).

        Mitä tuon pitäisi tulostaa? Kokeilin ja se tulosti viimeisen rivin ilman alun väilyöntejä ensimmäiseen seuraavaan välilyöntiin saakka.

        Alussa olevien tyhjien määrän saa selville siis esimerkiksi awk:lla.

        awk -F'[^ ^\t]' 'END{print length($1)}' tiedosto.txt


      • Anonyymi kirjoitti:

        Mitä tuon pitäisi tulostaa? Kokeilin ja se tulosti viimeisen rivin ilman alun väilyöntejä ensimmäiseen seuraavaan välilyöntiin saakka.

        Alussa olevien tyhjien määrän saa selville siis esimerkiksi awk:lla.

        awk -F'[^ ^\t]' 'END{print length($1)}' tiedosto.txt

        Toimiihan tuo, mitä sinä höpötät. Tämä on itse tehty, eikä verkosta kopioitu.

        — c=$( sed -n -e '$p' a.txt ) #viimmeinen rivi muuttujaan $c
        — b=`echo ${c}` #muuttuja $c suodatettuna, muuttujaan $b
        — ((x = ${#c}-${#b})) #lasketaan erotus muuttujaan $x
        — echo $x #tulostetaan muuttujan $x arvo.

        T. Urpo


      • Anonyymi kirjoitti:

        Toimiihan tuo, mitä sinä höpötät. Tämä on itse tehty, eikä verkosta kopioitu.

        — c=$( sed -n -e '$p' a.txt ) #viimmeinen rivi muuttujaan $c
        — b=`echo ${c}` #muuttuja $c suodatettuna, muuttujaan $b
        — ((x = ${#c}-${#b})) #lasketaan erotus muuttujaan $x
        — echo $x #tulostetaan muuttujan $x arvo.

        T. Urpo

        Ei toiminut. Tiedostoni viimeinen rivi oli:

        "    drwxr-xr-x 2 jorma jorma 4096 tammi 16 2019 Videos"

        Tuossa on siis alussa neljä välilyöntiä ennen drwx... osuutta. Ja tuo sinun viritelmäsi palautti:

        "drwxr-xr-x: command not found"

        Toimivaksi todettu awk-komentoon perustuva versio taas palauttaa 4.


      • Anonyymi kirjoitti:

        Ei toiminut. Tiedostoni viimeinen rivi oli:

        "    drwxr-xr-x 2 jorma jorma 4096 tammi 16 2019 Videos"

        Tuossa on siis alussa neljä välilyöntiä ennen drwx... osuutta. Ja tuo sinun viritelmäsi palautti:

        "drwxr-xr-x: command not found"

        Toimivaksi todettu awk-komentoon perustuva versio taas palauttaa 4.

        Niin palauttaa tuokin minun tekemä.


      • Anonyymi kirjoitti:

        Niin palauttaa tuokin minun tekemä.

        Ei palauta.


      • Anonyymi kirjoitti:

        Ei palauta.

        Valehtelet


      • Anonyymi kirjoitti:

        Valehtelet

        Turhaan jankkaat. Se virityksesti toimi juuri kuten aikaisemmin mainitsin. En suosittele sinulle uraa tietokoneiden kanssa, jos et edes testauksen alkeita osaa.


      • Anonyymi kirjoitti:

        Turhaan jankkaat. Se virityksesti toimi juuri kuten aikaisemmin mainitsin. En suosittele sinulle uraa tietokoneiden kanssa, jos et edes testauksen alkeita osaa.

        Ei kukaan sinun suosituksiasi kaipaa, usko pois. Tuommoista se on kun toisten tekemiä jaetaan omanaan, ei sitten osata eikä ymmärretä mitään, siitä mitä levitellään, kunhan vaan jankutetaan ja jankutetaan, mistään mitään ymmärtämättä.

        Työnnä ahteriisi ne suosituksesi, ei niillä taitamattoman suosituksilla muuta arvoa ole.


      • Anonyymi kirjoitti:

        Ei kukaan sinun suosituksiasi kaipaa, usko pois. Tuommoista se on kun toisten tekemiä jaetaan omanaan, ei sitten osata eikä ymmärretä mitään, siitä mitä levitellään, kunhan vaan jankutetaan ja jankutetaan, mistään mitään ymmärtämättä.

        Työnnä ahteriisi ne suosituksesi, ei niillä taitamattoman suosituksilla muuta arvoa ole.

        Jotkut osaavat, sinä et.


      • Anonyymi kirjoitti:

        Jotkut osaavat, sinä et.

        Jäkäti jäkäti...


    • Heh. Kyllähän tuo, mutta kuka muistaa ohjelman nimeltä edlin?

      • Mini tuntu heti tutulta, olenhan minä sitä joskus käyttänyt, en vaan muista siitä enää yksityiskohtaisia kokemuksia.

        T. Urpo


      • Minä muistan edlinin, hyvin kankea editoriksi. Edit on paljon parempi MSDOS-ympäristössä.


    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Tiesikö Martina miehensä taustat?

      Turkkilainen miljonääri onkin irakilainen jolla huikea rikostausta? Askarruttaa tiesikö Martina mistä on kyse vai tuliko yllätyksenä. Joka tapauksessa
      Kotimaiset julkkisjuorut
      411
      21966
    2. Greta Thunberg kritisoi Suomen hallitusta

      ”Tämä on epäonnistuminen”. https://www.is.fi/ulkomaat/art-2000006515088.html Thunberg on liittänyt mukaan perustamansa Fridays for Future -liikkeen
      Maailman menoa
      379
      14541
    3. Korona räjähtämässä käsiin 618 uutta tartuntaa 5 uutta kuolemaa

      Marin ja Kiuru karjaisivat kunnille mm. HUS-alueelle viime hetkellä, eivät ne pysty hoitamaan asioitansa vaan tarvitaan Marinin hallituksen tiukkaa oh
      Maailman menoa
      727
      14367
    4. Seiska: Sedu Koskinen vaihtaa nimensä eksoottiseksi Zedu Di Lucaksi!

      No nyt! Ja nimen takana vanha ystävä Andy McCoy... https://www.suomi24.fi/viihde/seiska-sedu-koskinen-vaihtaa-nimensa-eksoottiseksi-zedu-di-lucaksi-ni
      Kotimaiset julkkisjuorut
      101
      10269
    5. Sedu Koskinen aikoo järjestää isot juhlat

      Näihin julkkiksiin ei näköjään päde mitkään lait tai korona tartu. https://www.is.fi/kotimaa/art-2000007637821.html Kyllä esim. taviksen ylioppilas
      Kotimaiset julkkisjuorut
      140
      5837