DiGrande.it

Non Vedenti, Braille e Tecnologie di Stampa

Questo sito usa Cookie per personalizzare contenuti e annunci, fornire funzionalità per social media e analizzare i collegamenti. Chiudendo questo banner o continuando la navigazione acconsenti al loro uso.
Leggi la Cookie Policy di DiGrande.it

OCR Riconoscimento Ottico dei Caratteri in Biblos

Pubblicato il 07/08/2019 08:00 
 

Da quando Biblos è nato, nel lontano 2004, ho cercato sempre un Componente che potesse dargli la capacità di Riconoscere il testo delle immagini. Questa funzionalità in gergo si chiama OCR, è un acronimo che in Italiano significa Riconoscimento Ottico dei Caratteri.

Finalmente oggi in Biblos 5 ho aggiunto gli strumenti OCR. In Unione alle funzionalità di Scansione consente di Scandire e Riconoscere il testo di documenti cartacei. Da Biblos 5.27 in poi dentro il menù Strumenti di Biblos si trova il sottomenù OCR. Contiene i comandi: Scandisci Documento, Lettura Documento e Imposta OCR.

La finestra Scandisci Documento permette di Acquisire immagini da Scanner e riconoscerne il testo. Ha un'interfaccia molto semplice in cui è possibile Acquisire più pagine, gestirle, leggerne immediatamente il contenuto. In più il testo riconosciuto può essere inserito nel Documento di Biblos, al fine di editarlo, salvarlo, convertirlo in Audiolibro, stamparlo in Braille.

La finestra Impostazioni OCR permette di scegliere la Lingua predefinita con cui Riconoscere il testo delle immagini. Possono essere attivate anche più lingue. Una Lingua può essere spostata sopra o sotto a un'altra, per stabilirne la priorità. La casella Alta qualità consente di avere una qualità di Riconoscimento maggiore, perché utilizza l'Intelligenza Artificiale offerta dal Motore OCR. L'alta qualità di Riconoscimento comporta una perdita di velocità, perciò ho preferito far scegliere all'utente se attivare o meno questa caratteristica.

Le lingue per ora disponibili sono quelle delle interfacce utente di Biblos. In più ho aggiunto le lingue di Riconoscimento: Esperanto, Greco antico e Latino. Se in futuro si aggiungeranno altre interfacce utente e altri collaboratori stabili, provvederò ad aggiungere le relative lingue OCR.

La funzionalità di Lettura ad alta Voce per ora non è disponibile, in attesa di capire se sia superflua o meno.

Per avere questa nuova funzionalità, è necessario Installare il modulo OCR che ho predisposto e aggiunto tra i download di Biblos. Pertanto nel sito www.digrande.it ora sono presenti due moduli OCR, a 32bit e a 64bit. Bisogna Installare solo quello della propria versione di Biblos.

Il Motore OCR che ho utilizzato è sviluppato e mantenuto da Google e si chiama Tesseract. E' un OCR open source che ha raggiunto una qualità accettabile, tanto da farmi decidere ad aggiungerlo in Biblos. Tuttavia non garantisce gli stessi risultati dei motori OCR più conosciuti (a pagamento), non possiede tutte le loro funzionalità, ma in qualche modo il suo Lavoro lo fa e riesce a produrre buoni risultati. Ci sono dei limiti, come l'impossibilità di dividere automaticamente le pagine doppie. Per ora non è possibile rimediare a queste mancanze. Man mano che il Componente di Google rimedierà a queste lacune, Biblos ne acquisirà tutti i benefici.

L'impegno e lo sforzo che in questi anni sto dedicando a Biblos si manifestano nella qualità di tutta la serie di strumenti e funzionalità che oggi Biblos possiede ed offre. Molte volte sono costretto a rinunciare a delle soluzioni, per il loro costo insostenibile da me privo di risorse economiche esterne, altre volte trovo soluzioni che mi consentono di Programmare e includere strumenti che seguono la mia personale idea di solidarietà, quella che aiuta le persone nella loro Autonomia personale.

Questo ultimo strumento che ho aggiunto va proprio in questa direzione. Immagino che sarà utile a persone, studenti, insegnanti e scuole, all'insegna della crescita personale e professionale.

La collaborazione da parte degli utenti è sempre ben gradita. La contribuzione economica da parte di organizzazioni o aziende sarebbe ben accetta, per dare a Biblos la forza di offrire strumenti sempre più performanti, visto che Biblos raggiunge oggi persone e organizzazioni in più di 80 paesi del mondo che si avvalgono dei suoi strumenti.

Per ulteriore supporto ci si può iscrivere nel Gruppo di Biblos su Facebook.