martes, 24 de junio de 2014

OCR: Reconocimiento óptico de caracteres

¡Hola!

El proceso OCR transforma los textos que son una imagen (como por ejemplo, los documentos en PDF, JPG o PNG), en documentos que podemos usar con un procesador de textos. Esto es muy útil porque así podremos trabajar sobre el texto. Los traductores podréis saber cuántas palabras tiene el documento. Podréis saber aproximadamente el tiempo que tardaréis en traducirlo y, si también tenéis que hacer un presupuesto o una factura, podréis indicar a vuestro cliente cuánto le costará la traducción. Yo empecé a investigar sobre OCR cuando tuve que emitir una factura a partir de un documento en PDF.

Una vez que hayáis instalado el programa para el OCR, yo utilizo gscan2pdf, tendréis que abrir un documento o, si lo tenéis en papel, tendréis que escanearlo primero.


A continuación tendréis que abrir el documento en el programa, seleccionar en «herramientas» la opción «OCR». Aparecerá una ventana en la que tendréis que seleccionar el motor OCR, el lenguaje del texto original y después «iniciar OCR». Todas las palabras del documento aparecerán en la ventana «Resultado del OCR». Llegados a este punto podréis copiar y pegar el texto en un procesador de textos. Después de eso ya podréis trabajar sobre vuestro texto.






Además de los programas de OCR, también hay páginas web en las que podréis cambiar vuestros documentos en PDF, PNG o JPG para poder utilizarlos en un procesador de textos (y si eres traductor, poder traducirlo con más facilidad).

Aquí os dejo tres ejemplos, que descubrí gracias a una publicación de Milica Aćimović en la comunidad de Traducción:



y


Saludos. 

1 comentario: