Tekstin skannaaminen

Tumpelo ?

Miten onnistuu tekstin (käsinkirjoitettu esim.) skannaaminen TEKSTINÄ - ei jpg:nä tms. kuvana.

Käytössä HP Precisioscan Pro ... Kokeillut olen vaikka mitä ja nyt loppu keinot - Apua, kiitos =)

4

623

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • hp-

      tekstinscannausohjelmalla.Asenna ohjelma ja scannaa tekstipaperi

    • Anony427

      Tarvitse OCR ohjelman. Jonkinlainen, yleensä varsin hyvä, löytyy suurella varmuudella skannerin asennuslevyjen mukana.

      [OCR = Optical Character Recognition]

      OCR ohjelmien tarkkuus liikkuu nykyisin 97-99% kieppeillä, kun skannaus on onnistunut. Tämä tarkoittaa että 1-3 per sataa kirjainta kohden tunnistetaan väärin. Eli tunnistusvirheet ovat tavallisia ja joudut editoimaan tekstiä. Lisäksi rivinvaihdot ja tavuviivat voivat aiheuttaa ongelmia.

      OCR ohjelmia käytettäessä siinä on seuraavat työvaiheet:

      1. Skannataan asikirjan teksti, yleensä suurella resoluutiolla mustavalkoisena (siis täysin valkoisia ja mustia pikseleitä sisältävä kuva). B&W kuvan skannaus kestää yleensä vain 15 sekunttia.

      2. Valitaan tunnistus alue, jolta ohjelma yrittää tunnistaa tekstin, tämän vaiheen ohjelma tekee oletuksena automaattisesti, mutta manuaalisesti tekemällä saa ehkä parempia tuloksia.

      3. Tunnistetaan teksti, eli ohjelma analysoi kuvan sisältöä algoritmeillään ja hahmottaa kirjaimet. Tähän menee ehkä 20 sekunttia / A4

      3b. Silmäilen tekstin läpi ja korjaan käsin tunnistusvirheet (ohjelmat merkkaavat yleensä epävarmat sanat, jos käytetään oikolukua, niin ohjelma osaa näyttää myös kirjoitusvirheet). Tähän vaiheeseen ei mene kovin kauan koska virheitä ei yleensä ole kuin muutamia. Uudelleen tunnistus tai uudelleen skannaus ei yleensä auta tunnistustarkkuuteen.

      4. Kopioidaan teksti leikepöydälle tai talletetaan tiedostoon (yleensä itse en käytä suoraa talletusta, vaan kopsaan tekstin leikepöydälle ja liitän Word asiakirjaan).

      Huom! Käytä hieman aikaa asetusten läpikäymiseen erityisesti asikirjan kielen määritys on tärkeää: Englannin kieli on nimittäin usein vakiona päällä, jolloin ä, ö ja å tulkitaan mahdollisesti a:ksi ja o:ksi, jos ohjelmassa ei ole suomea, niin ruotsi löytyy varmasti, joka ajaa saman asian), jotkut ohjelmat osaavat myös käyttää MS Officen oikolukua, joka parantaa tekstin tunnistusta hieman.

      Hienoinen säätö skannauksen tummuuteen auttaa ehkä parantamaan tunnistustarkkuutta ja vähentää kohinaa (kohinan aiheuttamat roskat ohjelma saattaa tulkita pilkuksi ja pisteeksi).

      Skannaus ohjeita:

      Pyri laittamaan skannattava teksti suoraan. Ohjelmat toki osaavat suoristaa kuvan, mutta aina se ei onnistu hyvin ja ohjelmallinen suoristus heikentää hieman tunnistustarkkuutta.

      Pitkässä dokumentissa skannaa useita sivuja peräkkäin (esim. 10) ja vasta sitten tee tekstin tunnistus. Tällä tavoin saavutat selvästi suuremman työskentely nopeuden ja muutenkin ohjelman käyttö on miellyttävämpää, koska ei tarvitse jatkuvasti hyppiä eri työskentely vaiheiden välillä.

      Käytä mieluummin manuaalista tekstialueen määritystä (eli itse vedät tunnistusalueen tunnistettavan tekstin yli), tällöin tunnistus on nopeampaa ja varmempaa, koska ohjelman ei tarvitse analisoida tekstiin kuulumattomia osia (kuvia, varjoja, roskaa). Kuvat kannattaa skannata erikseen kuvankäsittely ohjelmalla.

      • y7y7

        Viimeksi puuhastelin ocr ohjelmien kanssa joskus 6-7 vuotta sitten. Silloin ei ollut toivoakaan, että ne olisivat tunnistaneet käsinkirjoitetun tekstin.

        Pystyvätkö nykyisin? Jos pystyvät, täytyy olla varmaan tosi hyvä käsiala.


      • Blondi
        y7y7 kirjoitti:

        Viimeksi puuhastelin ocr ohjelmien kanssa joskus 6-7 vuotta sitten. Silloin ei ollut toivoakaan, että ne olisivat tunnistaneet käsinkirjoitetun tekstin.

        Pystyvätkö nykyisin? Jos pystyvät, täytyy olla varmaan tosi hyvä käsiala.

        Pystyvät, ainakin jotkut. Tekstausta ja tikkukirjaimia lähinnä luulisin.


    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Räppäri kuoli vankilassa

      Ei kuulemma ole tapahtunut rikosta. Sama vahinkohan kävi Epsteinille. https://www.hs.fi/suomi/art-2000011840869.html "
      Maailman menoa
      87
      4108
    2. Välillä kyllä tuntuu, että jaat vihjeitä

      Mutta miten niistä voi olla ollenkaan varma? Ja minä saan niistä kimmokkeen luulemaan yhtä sun toista. Eli mitä ajatella
      Ikävä
      24
      2911
    3. No kyllä te luuserit voitte tehdä mitä vaan keskenänne, sitä en ymmärrä miksi pelaat,nainen

      Pisteesi silmissäni, edes ystävätasolla tippui jo tuhannella, kun sain selville pelailusi, olet toisen kanssa, vaikka ol
      Ikävä
      45
      2320
    4. Missä näitte viimeksi?

      Missä näit kaivattua viimeksi ja oliko sähköä ilmassa?
      Ikävä
      34
      1321
    5. Puukotus yöllä

      Oli kaveri hermostunut ja antanut puukosta.
      Sotkamo
      10
      909
    6. 131
      885
    7. rakas J siellä jossain

      Niin ikävä sua. -P. Nainen
      Ikävä
      6
      874
    8. Masan touhut etenee

      Punatiilitalon tietotoimiston mukaan Masa on saanut viimein myytyä kämppänsä ja kaavoittaa uudelle lukaalille tonttia pa
      Äänekoski
      12
      822
    9. Naisten ja miesten tasoeroista

      Oletteko huomanneet, että naisissa ylemmän tason naiset ovat sinkkuja, ja miehissä alemman tason incelit? Toimivat paris
      Ikävä
      124
      766
    10. You've been running and

      so has your mind, I'm thinking of you all the time... 💘
      Ikävä
      11
      760
    Aihe