Tekstin skannaaminen

Tumpelo ?

Miten onnistuu tekstin (käsinkirjoitettu esim.) skannaaminen TEKSTINÄ - ei jpg:nä tms. kuvana.

Käytössä HP Precisioscan Pro ... Kokeillut olen vaikka mitä ja nyt loppu keinot - Apua, kiitos =)

4

588

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • hp-

      tekstinscannausohjelmalla.Asenna ohjelma ja scannaa tekstipaperi

    • Anony427

      Tarvitse OCR ohjelman. Jonkinlainen, yleensä varsin hyvä, löytyy suurella varmuudella skannerin asennuslevyjen mukana.

      [OCR = Optical Character Recognition]

      OCR ohjelmien tarkkuus liikkuu nykyisin 97-99% kieppeillä, kun skannaus on onnistunut. Tämä tarkoittaa että 1-3 per sataa kirjainta kohden tunnistetaan väärin. Eli tunnistusvirheet ovat tavallisia ja joudut editoimaan tekstiä. Lisäksi rivinvaihdot ja tavuviivat voivat aiheuttaa ongelmia.

      OCR ohjelmia käytettäessä siinä on seuraavat työvaiheet:

      1. Skannataan asikirjan teksti, yleensä suurella resoluutiolla mustavalkoisena (siis täysin valkoisia ja mustia pikseleitä sisältävä kuva). B&W kuvan skannaus kestää yleensä vain 15 sekunttia.

      2. Valitaan tunnistus alue, jolta ohjelma yrittää tunnistaa tekstin, tämän vaiheen ohjelma tekee oletuksena automaattisesti, mutta manuaalisesti tekemällä saa ehkä parempia tuloksia.

      3. Tunnistetaan teksti, eli ohjelma analysoi kuvan sisältöä algoritmeillään ja hahmottaa kirjaimet. Tähän menee ehkä 20 sekunttia / A4

      3b. Silmäilen tekstin läpi ja korjaan käsin tunnistusvirheet (ohjelmat merkkaavat yleensä epävarmat sanat, jos käytetään oikolukua, niin ohjelma osaa näyttää myös kirjoitusvirheet). Tähän vaiheeseen ei mene kovin kauan koska virheitä ei yleensä ole kuin muutamia. Uudelleen tunnistus tai uudelleen skannaus ei yleensä auta tunnistustarkkuuteen.

      4. Kopioidaan teksti leikepöydälle tai talletetaan tiedostoon (yleensä itse en käytä suoraa talletusta, vaan kopsaan tekstin leikepöydälle ja liitän Word asiakirjaan).

      Huom! Käytä hieman aikaa asetusten läpikäymiseen erityisesti asikirjan kielen määritys on tärkeää: Englannin kieli on nimittäin usein vakiona päällä, jolloin ä, ö ja å tulkitaan mahdollisesti a:ksi ja o:ksi, jos ohjelmassa ei ole suomea, niin ruotsi löytyy varmasti, joka ajaa saman asian), jotkut ohjelmat osaavat myös käyttää MS Officen oikolukua, joka parantaa tekstin tunnistusta hieman.

      Hienoinen säätö skannauksen tummuuteen auttaa ehkä parantamaan tunnistustarkkuutta ja vähentää kohinaa (kohinan aiheuttamat roskat ohjelma saattaa tulkita pilkuksi ja pisteeksi).

      Skannaus ohjeita:

      Pyri laittamaan skannattava teksti suoraan. Ohjelmat toki osaavat suoristaa kuvan, mutta aina se ei onnistu hyvin ja ohjelmallinen suoristus heikentää hieman tunnistustarkkuutta.

      Pitkässä dokumentissa skannaa useita sivuja peräkkäin (esim. 10) ja vasta sitten tee tekstin tunnistus. Tällä tavoin saavutat selvästi suuremman työskentely nopeuden ja muutenkin ohjelman käyttö on miellyttävämpää, koska ei tarvitse jatkuvasti hyppiä eri työskentely vaiheiden välillä.

      Käytä mieluummin manuaalista tekstialueen määritystä (eli itse vedät tunnistusalueen tunnistettavan tekstin yli), tällöin tunnistus on nopeampaa ja varmempaa, koska ohjelman ei tarvitse analisoida tekstiin kuulumattomia osia (kuvia, varjoja, roskaa). Kuvat kannattaa skannata erikseen kuvankäsittely ohjelmalla.

      • y7y7

        Viimeksi puuhastelin ocr ohjelmien kanssa joskus 6-7 vuotta sitten. Silloin ei ollut toivoakaan, että ne olisivat tunnistaneet käsinkirjoitetun tekstin.

        Pystyvätkö nykyisin? Jos pystyvät, täytyy olla varmaan tosi hyvä käsiala.


      • Blondi
        y7y7 kirjoitti:

        Viimeksi puuhastelin ocr ohjelmien kanssa joskus 6-7 vuotta sitten. Silloin ei ollut toivoakaan, että ne olisivat tunnistaneet käsinkirjoitetun tekstin.

        Pystyvätkö nykyisin? Jos pystyvät, täytyy olla varmaan tosi hyvä käsiala.

        Pystyvät, ainakin jotkut. Tekstausta ja tikkukirjaimia lähinnä luulisin.


    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Poliisi: Kymmenhenkinen pohjalaisperhe ollut vuoden kateissa kansainvälinen etsintäkuulutus Poliis

      Poliisi: Kymmenhenkinen pohjalaisperhe ollut vuoden kateissa – kansainvälinen etsintäkuulutus Poliisi pyytää yleisön apu
      Maailman menoa
      360
      3085
    2. Tässä totuus jälleensyntymisestä - voit yllättyä

      Jumalasta syntyminen Raamatussa ei tässä Joh. 3:3. ole alkukielen mukaan ollenkaan sanaa uudestisyntyminen, vaan pelkä
      Jälleensyntyminen
      302
      1482
    3. En kadu sitä, että kohtasin hänet

      mutta kadun sitä, että aloin kirjoittamaan tänne palstalle. Jollain tasolla se saa vain asiat enemmän solmuun ja tekee n
      Ikävä
      84
      1302
    4. Mitään järkeä?

      Että ollaan erillään? Kummankin pää on kovilla.
      Ikävä
      108
      1301
    5. Noniin rakas

      Annetaanko pikkuhiljaa jo olla, niin ehkä säilyy vienot hymyt kohdatessa. En edelleenkään halua sulle tai kenellekään mi
      Ikävä
      99
      1285
    6. Oisko mitenkään mahdollisesti ihan pikkuisen ikävä..

      ...edes ihan pikkuisen pikkuisen ikävä sulla mua??.. Että miettisit vaikka vähän missähän se nyt on ja oiskohan hauska n
      Ikävä
      59
      1245
    7. Lapuan sanomissa käy rytinä

      Pistivät sitten päätoimittajan pihalle
      Lapua
      48
      1145
    8. Helena Koivu : Ja kohta mennään taas

      Kohta kohtalon päivä lähestyy kuinka käy Helena Koivulle ? Kenen puolella olet? Jos vastauksesi on Helenan niin voisi
      Kotimaiset julkkisjuorut
      80
      1052
    9. Au pair -työ Thaimaassa herättää kiivasta keskustelua somessa: "4cm torakoita, huumeita, tauteja..."

      Au pairit -sarjan uusi kausi herättää keskustelua Suomi24 Keskustelupalvelussa. Mielipiteitä ladataan puolesta ja vastaa
      Tv-sarjat
      24
      941
    10. Oot ihana

      Toivottavasti nähdään sattumalta jonain kesäpäivänä♥️🥺🫂
      Ikävä
      33
      847
    Aihe