Logo Universiteit Utrecht

ICT en Onderzoek

OCR and Humanities

 

Abbyy Fine reader heeft inmiddels een kleine schare fans in de faculteit. Het heeft, vooral voor degenen die een editie moesten verzorgen, al heel wat typewerk bespaard. Abbyy is een OCR (Optical Character Recognition) programma,  software die tekst van een “plaatje”, zoals bijvoorbeeld van een digitale foto, omzet naar tekst die geschikt is om verder te bewerken.  Meestal krijg je (een uitgeklede versie) van zo’n OCR-programma meegeleverd als je een scanner koopt.

Maar Abbyy is extra geschikt voor geesteswetenschappen, vandaar deze schaamteloze reclame. Het is een “lerend” OCR-programma, dat betekent dat je het programma kunt aanleren om fonts die het niet aan boord heeft, toch te lezen.  Zodat je Abbyy oude typografie kunt voeren. Of schrift. Of niet-Westers schrift. Toegegeven, het aanleren van exotisch materiaal kost een aantal dagdelen en is dus alleen efficiënt als je een grote hoeveelheid tekst te lijf moet. Maar dan heb je ook wat. En sinds een aantal jaren is ook het verwerken van oude typografie deels geautomatiseerd, er is een versie die uit de voeten kan met Gotische drukletters.

Voor het programma in het algemeen en trial versies: Zie: http://finereader.abbyy.com/

 Voor Gotisch: http://www.frakturschrift.com/

And in English:

Abbyy Fine Reader is outstanding OCR Software, featuring options which make it especially suited for humanities scholars. Optical Character Recognition, or OCR, is a technology that enables you to convert different types of documents, such as scanned paper documents, PDF files or images captured by a digital camera into editable and searchable data e.g. for editing in Word. You can convert your camera images into electronic text files for editing, archiving, creating new documents and for other purposes.

The FineReader Engine allows you to create and use user patterns, which makes it especially suited to OCR old print or non western languages. Not every OCR program has the power to recognize gothic text. ABBYY Recognition Server has, it enables you to work with black letter fonts.

General information and trial versions:  http://finereader.abbyy.com/

Black letter:  http://www.frakturschrift.com/

U moet ingelogd zijn om een reactie te kunnen plaatsen