Miten onnistuu tekstin (käsinkirjoitettu esim.) skannaaminen TEKSTINÄ - ei jpg:nä tms. kuvana.
Käytössä HP Precisioscan Pro ... Kokeillut olen vaikka mitä ja nyt loppu keinot - Apua, kiitos =)
Tekstin skannaaminen
4
623
Vastaukset
- hp-
tekstinscannausohjelmalla.Asenna ohjelma ja scannaa tekstipaperi
- Anony427
Tarvitse OCR ohjelman. Jonkinlainen, yleensä varsin hyvä, löytyy suurella varmuudella skannerin asennuslevyjen mukana.
[OCR = Optical Character Recognition]
OCR ohjelmien tarkkuus liikkuu nykyisin 97-99% kieppeillä, kun skannaus on onnistunut. Tämä tarkoittaa että 1-3 per sataa kirjainta kohden tunnistetaan väärin. Eli tunnistusvirheet ovat tavallisia ja joudut editoimaan tekstiä. Lisäksi rivinvaihdot ja tavuviivat voivat aiheuttaa ongelmia.
OCR ohjelmia käytettäessä siinä on seuraavat työvaiheet:
1. Skannataan asikirjan teksti, yleensä suurella resoluutiolla mustavalkoisena (siis täysin valkoisia ja mustia pikseleitä sisältävä kuva). B&W kuvan skannaus kestää yleensä vain 15 sekunttia.
2. Valitaan tunnistus alue, jolta ohjelma yrittää tunnistaa tekstin, tämän vaiheen ohjelma tekee oletuksena automaattisesti, mutta manuaalisesti tekemällä saa ehkä parempia tuloksia.
3. Tunnistetaan teksti, eli ohjelma analysoi kuvan sisältöä algoritmeillään ja hahmottaa kirjaimet. Tähän menee ehkä 20 sekunttia / A4
3b. Silmäilen tekstin läpi ja korjaan käsin tunnistusvirheet (ohjelmat merkkaavat yleensä epävarmat sanat, jos käytetään oikolukua, niin ohjelma osaa näyttää myös kirjoitusvirheet). Tähän vaiheeseen ei mene kovin kauan koska virheitä ei yleensä ole kuin muutamia. Uudelleen tunnistus tai uudelleen skannaus ei yleensä auta tunnistustarkkuuteen.
4. Kopioidaan teksti leikepöydälle tai talletetaan tiedostoon (yleensä itse en käytä suoraa talletusta, vaan kopsaan tekstin leikepöydälle ja liitän Word asiakirjaan).
Huom! Käytä hieman aikaa asetusten läpikäymiseen erityisesti asikirjan kielen määritys on tärkeää: Englannin kieli on nimittäin usein vakiona päällä, jolloin ä, ö ja å tulkitaan mahdollisesti a:ksi ja o:ksi, jos ohjelmassa ei ole suomea, niin ruotsi löytyy varmasti, joka ajaa saman asian), jotkut ohjelmat osaavat myös käyttää MS Officen oikolukua, joka parantaa tekstin tunnistusta hieman.
Hienoinen säätö skannauksen tummuuteen auttaa ehkä parantamaan tunnistustarkkuutta ja vähentää kohinaa (kohinan aiheuttamat roskat ohjelma saattaa tulkita pilkuksi ja pisteeksi).
Skannaus ohjeita:
Pyri laittamaan skannattava teksti suoraan. Ohjelmat toki osaavat suoristaa kuvan, mutta aina se ei onnistu hyvin ja ohjelmallinen suoristus heikentää hieman tunnistustarkkuutta.
Pitkässä dokumentissa skannaa useita sivuja peräkkäin (esim. 10) ja vasta sitten tee tekstin tunnistus. Tällä tavoin saavutat selvästi suuremman työskentely nopeuden ja muutenkin ohjelman käyttö on miellyttävämpää, koska ei tarvitse jatkuvasti hyppiä eri työskentely vaiheiden välillä.
Käytä mieluummin manuaalista tekstialueen määritystä (eli itse vedät tunnistusalueen tunnistettavan tekstin yli), tällöin tunnistus on nopeampaa ja varmempaa, koska ohjelman ei tarvitse analisoida tekstiin kuulumattomia osia (kuvia, varjoja, roskaa). Kuvat kannattaa skannata erikseen kuvankäsittely ohjelmalla.- y7y7
Viimeksi puuhastelin ocr ohjelmien kanssa joskus 6-7 vuotta sitten. Silloin ei ollut toivoakaan, että ne olisivat tunnistaneet käsinkirjoitetun tekstin.
Pystyvätkö nykyisin? Jos pystyvät, täytyy olla varmaan tosi hyvä käsiala. - Blondi
y7y7 kirjoitti:
Viimeksi puuhastelin ocr ohjelmien kanssa joskus 6-7 vuotta sitten. Silloin ei ollut toivoakaan, että ne olisivat tunnistaneet käsinkirjoitetun tekstin.
Pystyvätkö nykyisin? Jos pystyvät, täytyy olla varmaan tosi hyvä käsiala.Pystyvät, ainakin jotkut. Tekstausta ja tikkukirjaimia lähinnä luulisin.
Ketjusta on poistettu 0 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
Räppäri kuoli vankilassa
Ei kuulemma ole tapahtunut rikosta. Sama vahinkohan kävi Epsteinille. https://www.hs.fi/suomi/art-2000011840869.html "874108Välillä kyllä tuntuu, että jaat vihjeitä
Mutta miten niistä voi olla ollenkaan varma? Ja minä saan niistä kimmokkeen luulemaan yhtä sun toista. Eli mitä ajatella242911No kyllä te luuserit voitte tehdä mitä vaan keskenänne, sitä en ymmärrä miksi pelaat,nainen
Pisteesi silmissäni, edes ystävätasolla tippui jo tuhannella, kun sain selville pelailusi, olet toisen kanssa, vaikka ol452320- 341321
- 10909
- 131885
- 6874
Masan touhut etenee
Punatiilitalon tietotoimiston mukaan Masa on saanut viimein myytyä kämppänsä ja kaavoittaa uudelle lukaalille tonttia pa12822Naisten ja miesten tasoeroista
Oletteko huomanneet, että naisissa ylemmän tason naiset ovat sinkkuja, ja miehissä alemman tason incelit? Toimivat paris124766- 11760