Top

Estrarre Testo dalle Immagini: I Migliori Servizi Di OCR OnLine

I software  OCR (dall’inglese optical character recognition) sono programmi dedicati alla conversione di un’immagine contenente testo (solitamente acquisite tramite scanner) in testo digitale modificabile tramite un normale software di editing.

Fino a qualche anno fa questo tipo di software si trovava principalmente a pagamento (o integrato nelle applicazioni di gestione degli scanner o stampanti multifunzione), le versioni gratuite erano poche, non funzionavano benissimo, e spesso supportavano solo l’inglese (causando grossi problemi a testi che hanno caratteri accentati come l’italiano).

Servizi Online di OCR: Come Estrarre Testo da Immagini e pdf

Ultimamente, però, ci sono diverse alternative, ad esempio l’ottimo Tesseract-ocr (disponibile in ambiente Linux/Unix). Per la maggior parte degli utenti però, non vale la pena scaricare un software per l’ocr, visto l’uso sporadico. Un’ottima alternativa per chi facesse un’uso occasionale di questo software è l’utilizzo di alcuni servizi on line.

  1. http://www.newocr.com/: Ottimo tool che non richiede la registrazione e non ha alcun limite di caricamento; supporta 29 lingue, tra cui l’italiano, e accetta vari formati, anche pdf multipagina; riconosce il testo anche con layout a più colonne.
  2. http://www.free-ocr.com/: Accetta vari formati in ingresso ma in uscita solo txt. Supporta molte lingue, tra cui l’italiano. Si possono convertire fino a 10 file all’ora ciascuno di dimensione inferiore a 2 megabytes.
  3. http://www.onlineocr.net/: E’ utilizzabile senza registrazione, ma per avere tutte le funzionalità è necessario registrarsi. Supporta molte lingue tra cui l’italiano. Utilizza un sistema di crediti che possono essere guadagnati (o acquistati).
  4. http://finereader.abbyyonline.com/en: Richiede la registrazione. All’atto della registrazione concede un numero gratuito di pagine da convertire, è ovviamente possibile acquistare pagine aggiuntive secondo i prezzi indicati. Riconosce e ricrea la formattazione delle pagine e supporta varie lingue, tra cui l’italiano. Riconosce e restituisce vari formati.

Va detto che il compito che si prefigge il software ocr è piuttosto complicato, il risultato dipende da vari fattori: la qualità della scansione, il tipo e la dimensione del font, la formattazione della pagina…In molti casi sarà comunque necessaria la revisione del documento.

 

email
Related Posts Plugin for WordPress, Blogger...

Non perdere l'opportunità di ricevere il meglio di Ziogeek!


Commenti


Fatal error: Uncaught Exception: 12: REST API is deprecated for versions v2.1 and higher (12) thrown in /home/ziogeek/public_html/wp-content/plugins/seo-facebook-comments/facebook/base_facebook.php on line 1273