Como Convertir Texto en Papel a Formato Digital: Tecnología OCR

6
6261
texto en papel a formato digital

Muchas veces tenemos en la oficina tantos documentos en papel que su almacenamiento y recuperación puede ser un verdadero infierno.

O cuando nos dan apuntes y terminamos llenas de cajas con material de cada materia. Si bien hay gente que todavía se resiste a leer en formato digital, las ventajas son enormes.

La tecnología OCR (Reconocimiento Óptico de Caracteres) no es una novedad, existen desde hace al menos 10 años, pero ahora son cada vez más rápidos y precisos.

Básicamente el proceso consiste en escanear el texto que tenemos en formato papel y, en vez de guardar un enorme archivo .jpg por cada página, lo pasamos por un software y el programa interpreta el gráfico como texto, conservando además el formato de tablas y dibujos que tenga el documento original.

En muchas bibliotecas de los EE.UU. además de la fotocopiadora tradicional, está la “máquina de PDFs”, para cuando necesitamos un capítulo de un libro, en vez de fotocopiarlo, obtenemos un archivo PDF totalmente digital en el mismo tiempo que lleva hacer una fotocopia.

Las ventajas son muchas:

  1. En vez de tener una fotocopia, tenemos un texto editable (podemos cambiar el texto, hacer búsquedas, etc.)
  2. Ocupa mucho menos lugar y podemos tener sistemas de almacenamiento (por eje. Discos duros portátiles, CDs, etc.) catalogados para una rápida búsqueda. Aprovecho a apuntar que la clasificación de documentos es todo un tema que dejo para otra ocasión.

Hay muchos software pago y gratuito. En esta ocasión voy a compartir una lista de software gratuito para que comiences a probar el sistema:

Software gratuito de OCR

¿Usas o conoces algún otro? Por favor comparte tu experiencia debajo.