Visita <a href="http://www.liquida.it/" title="Notizie e opinioni dai blog italiani su Liquida">Liquida</a> e <a href="I widget di Liquida per il tuo blog">Widget</a>

Estrarre testo da un’immagine. Con l’OCR si può. GRATIS!

Varie — Scritto da Michele Di Salvatore (Michele) il 30 novembre 2007 alle 01:41

 


Qualche anno fa ne avevo sentito parlare: un programma in grado di estrarre dalle immagini tutto il testo presente. Cercando in rete, però, non sono riuscito a trovarne uno gratuito e che funzionasse bene.
Il vero difetto di questi programmi è proprio la precisione, o almeno lo era fino a qualche tempo fa. Ieri (finalmente) ne ho trovato uno, anche se solo per caso.

I programmi con questa funzione si chiamano OCR e in rete se ne trovano alcuni freeware. Tra tutti quelli visti vi presento FreeOCR.net,  che a mio avviso è molto semplice da utilizzare.

 

Se vi interressa scaricate il programma, la patch per la lingua italiana e, se non riuscite ad aprire il file della patch, un programma per la gestione dei file compressi come IZArc.

Una volta installato il programma, non avviatelo, ma aprite la patch e copiate i file dell’archivio

 


nella sotto-cartella del programma “tesseract essdata”. Copiati i file, avviate il programma e dalla schermata principale

 

 


scegliete dal menu a tendina, in alto a destra, la lingua italiana.

 

Ora siete pronti ad estrapolare il testo dalle vostre immagini, facendo click su “Open”, o dalle scansioni, cliccando su “Scan”. Selezionata l’immagine, avviate l’analisi col pulsante “OCR” e attendete, una volta comparso il testo nella schermata di destra, analizzatelo e modificatelo, perché sicuramente non sarà perfetto. Apportate le modificate, fate click su “Save Text” e il gioco è fatto. Semplice no?

Un’ottima alternativa a questo programma è TopOCR, sempre gratuito ma credo funzioni molto meglio, da provare.

Autore: Michele Di Salvatore (Michele)

Michele Di Salvatore è amministratore e fondatore di DylanBlog.com. Oltre a ciò è autore di diversi articoli su questo e diversi altri blog, per cui ha collaborato per breve tempo. Attualmente è studente di Ingegneria delle Telecomunicazioni a tempo pieno presso il Politecnico di Milano e nel poco tempo libero si occupa di sviluppo web e blogging.

Qualcos'altro di interessante da leggere:

    2 commenti

  • Manu scrive:

    Ciao…..ho provato questo programma ma devo dire ke sono rimasto deluso……se scannerizzo la pagina di una rivista e poi provo ad estratte tutto il testo presente, il software va in panico perchè tenta di tradurre in testo anke le immagini della pagina……il risultato è ke nn si capisce nnt……… :neutral: :cry:

  • @Manu – Ciao, come ti ho detto nella guida, è necessario che la qualità dell’immagine sia decente, tra l’altro è normale che prelevi il testo presente anche nelle immagini, è un software quindi non riconosce la differenza. Inoltre prova a utilizzare il software che ho citato alla fine, funziona meglio :)

Aggiungi un commento

Personalizza il tuo avatar!
Vai su Gravatar.com, inserisci la tua mail e carica la tua immagine personale.

Ti è consentito usare questi tag HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Trackbacks

Aggiungi un Trackback