[vicsireland] Irish Language Scanning options

  • From: Ronan McGuirk <ronan.p.mcguirk@xxxxxxxxx>
  • To: fb-exchange <fb-exchange@xxxxxxxxxxxxx>, Ilka Stäglin <IlkaStaeglin@xxxxxxxxxxxxxx>, Lina Kouzi <lina.kouzi@xxxxxxx>, vicsireland <vicsireland@xxxxxxxxxxxxx>
  • Date: Tue, 20 Oct 2020 19:25:33 +0100

Hi all,

Just wondering if anyone has any recommendations for the best approach
for Irish language OCR.

You will be aware that using an English language scanning solution
produces very poor results for Irish text. I have been on the
receiving end of files that were effectively unusable.

As far as I am aware, the Microsoft Windows builtin OCR solution, that
integrates with NVDA,  does not support Irish. Or, at any rate, I
haven’t got it to work yet, and it seems that the Irish Language files
from Microsoft that it uses  don’t support scanning.

Recently I have scanned documents with a flatbed scanner to a pdf
image file. I have then converted this to a searchable pdf file with
www.pdfconvertonline.com. This online service has an Irish Language
OCR option and the results are encouraging.

Just wondering if there are any better options out there.

Any suggestions much appreciated,

I am considering Tesseract, though it seems that it doesn’t support
pdf files directly.

Best regards,

Ronan
==========================================================The vicsireland 
mailing list

To unsubscribe at any time send a mail to:

vicsireland-request@xxxxxxxxxxxxx

with the word "unsubscribe", without the quotes in the subject of the message.

To contact the moderator send mail to:

tim.j.culhane@xxxxxxxxx

For mor information on the Visually Impaired Computer Society visit:

http://www.vicsireland.org

Other related posts: