Miten onnistuu tekstin (käsinkirjoitettu esim.) skannaaminen TEKSTINÄ - ei jpg:nä tms. kuvana.
Käytössä HP Precisioscan Pro ... Kokeillut olen vaikka mitä ja nyt loppu keinot - Apua, kiitos =)
Tekstin skannaaminen
4
588
Vastaukset
- hp-
tekstinscannausohjelmalla.Asenna ohjelma ja scannaa tekstipaperi
- Anony427
Tarvitse OCR ohjelman. Jonkinlainen, yleensä varsin hyvä, löytyy suurella varmuudella skannerin asennuslevyjen mukana.
[OCR = Optical Character Recognition]
OCR ohjelmien tarkkuus liikkuu nykyisin 97-99% kieppeillä, kun skannaus on onnistunut. Tämä tarkoittaa että 1-3 per sataa kirjainta kohden tunnistetaan väärin. Eli tunnistusvirheet ovat tavallisia ja joudut editoimaan tekstiä. Lisäksi rivinvaihdot ja tavuviivat voivat aiheuttaa ongelmia.
OCR ohjelmia käytettäessä siinä on seuraavat työvaiheet:
1. Skannataan asikirjan teksti, yleensä suurella resoluutiolla mustavalkoisena (siis täysin valkoisia ja mustia pikseleitä sisältävä kuva). B&W kuvan skannaus kestää yleensä vain 15 sekunttia.
2. Valitaan tunnistus alue, jolta ohjelma yrittää tunnistaa tekstin, tämän vaiheen ohjelma tekee oletuksena automaattisesti, mutta manuaalisesti tekemällä saa ehkä parempia tuloksia.
3. Tunnistetaan teksti, eli ohjelma analysoi kuvan sisältöä algoritmeillään ja hahmottaa kirjaimet. Tähän menee ehkä 20 sekunttia / A4
3b. Silmäilen tekstin läpi ja korjaan käsin tunnistusvirheet (ohjelmat merkkaavat yleensä epävarmat sanat, jos käytetään oikolukua, niin ohjelma osaa näyttää myös kirjoitusvirheet). Tähän vaiheeseen ei mene kovin kauan koska virheitä ei yleensä ole kuin muutamia. Uudelleen tunnistus tai uudelleen skannaus ei yleensä auta tunnistustarkkuuteen.
4. Kopioidaan teksti leikepöydälle tai talletetaan tiedostoon (yleensä itse en käytä suoraa talletusta, vaan kopsaan tekstin leikepöydälle ja liitän Word asiakirjaan).
Huom! Käytä hieman aikaa asetusten läpikäymiseen erityisesti asikirjan kielen määritys on tärkeää: Englannin kieli on nimittäin usein vakiona päällä, jolloin ä, ö ja å tulkitaan mahdollisesti a:ksi ja o:ksi, jos ohjelmassa ei ole suomea, niin ruotsi löytyy varmasti, joka ajaa saman asian), jotkut ohjelmat osaavat myös käyttää MS Officen oikolukua, joka parantaa tekstin tunnistusta hieman.
Hienoinen säätö skannauksen tummuuteen auttaa ehkä parantamaan tunnistustarkkuutta ja vähentää kohinaa (kohinan aiheuttamat roskat ohjelma saattaa tulkita pilkuksi ja pisteeksi).
Skannaus ohjeita:
Pyri laittamaan skannattava teksti suoraan. Ohjelmat toki osaavat suoristaa kuvan, mutta aina se ei onnistu hyvin ja ohjelmallinen suoristus heikentää hieman tunnistustarkkuutta.
Pitkässä dokumentissa skannaa useita sivuja peräkkäin (esim. 10) ja vasta sitten tee tekstin tunnistus. Tällä tavoin saavutat selvästi suuremman työskentely nopeuden ja muutenkin ohjelman käyttö on miellyttävämpää, koska ei tarvitse jatkuvasti hyppiä eri työskentely vaiheiden välillä.
Käytä mieluummin manuaalista tekstialueen määritystä (eli itse vedät tunnistusalueen tunnistettavan tekstin yli), tällöin tunnistus on nopeampaa ja varmempaa, koska ohjelman ei tarvitse analisoida tekstiin kuulumattomia osia (kuvia, varjoja, roskaa). Kuvat kannattaa skannata erikseen kuvankäsittely ohjelmalla.- y7y7
Viimeksi puuhastelin ocr ohjelmien kanssa joskus 6-7 vuotta sitten. Silloin ei ollut toivoakaan, että ne olisivat tunnistaneet käsinkirjoitetun tekstin.
Pystyvätkö nykyisin? Jos pystyvät, täytyy olla varmaan tosi hyvä käsiala. - Blondi
y7y7 kirjoitti:
Viimeksi puuhastelin ocr ohjelmien kanssa joskus 6-7 vuotta sitten. Silloin ei ollut toivoakaan, että ne olisivat tunnistaneet käsinkirjoitetun tekstin.
Pystyvätkö nykyisin? Jos pystyvät, täytyy olla varmaan tosi hyvä käsiala.Pystyvät, ainakin jotkut. Tekstausta ja tikkukirjaimia lähinnä luulisin.
Ketjusta on poistettu 0 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
Poliisi: Kymmenhenkinen pohjalaisperhe ollut vuoden kateissa kansainvälinen etsintäkuulutus Poliis
Poliisi: Kymmenhenkinen pohjalaisperhe ollut vuoden kateissa – kansainvälinen etsintäkuulutus Poliisi pyytää yleisön apu3603085Tässä totuus jälleensyntymisestä - voit yllättyä
Jumalasta syntyminen Raamatussa ei tässä Joh. 3:3. ole alkukielen mukaan ollenkaan sanaa uudestisyntyminen, vaan pelkä3021482En kadu sitä, että kohtasin hänet
mutta kadun sitä, että aloin kirjoittamaan tänne palstalle. Jollain tasolla se saa vain asiat enemmän solmuun ja tekee n841302- 1081301
Noniin rakas
Annetaanko pikkuhiljaa jo olla, niin ehkä säilyy vienot hymyt kohdatessa. En edelleenkään halua sulle tai kenellekään mi991285Oisko mitenkään mahdollisesti ihan pikkuisen ikävä..
...edes ihan pikkuisen pikkuisen ikävä sulla mua??.. Että miettisit vaikka vähän missähän se nyt on ja oiskohan hauska n591245- 481145
Helena Koivu : Ja kohta mennään taas
Kohta kohtalon päivä lähestyy kuinka käy Helena Koivulle ? Kenen puolella olet? Jos vastauksesi on Helenan niin voisi801052Au pair -työ Thaimaassa herättää kiivasta keskustelua somessa: "4cm torakoita, huumeita, tauteja..."
Au pairit -sarjan uusi kausi herättää keskustelua Suomi24 Keskustelupalvelussa. Mielipiteitä ladataan puolesta ja vastaa24941- 33847