Definición de OCR

OCROCR remite a una tecnología capaz de hacer un reconocimiento de los caracteres impresos en papel mediante un escáner. La misma hizo posible que un texto impreso pudiese ser trasladado a un archivo de texto para habilitar una posible edición. Así, se posibilita ahorrar tiempo cuando es necesario incorporar datos a un ordenador, puesto que se evita trasladar manualmente toda la información. Para hacer uso de esta tecnología es necesario contar con un escáner que capte la imagen del documento en papel; una vez que se tome una captura del documento, el software podrá comenzar con el reconocimiento.

El OCR es extremadamente útil cuando los datos que se deben trasladar a un fichero editable tienen una gran extensión. Así, la edición de textos digitalizados pudo ser resuelta con una tecnología que compara cada carácter con una base de datos, generando el texto pertinente. No obstante, la misma dista de ser perfecta. Son muchas las ocasiones en las que el texto editable tiene caracteres extraños y necesita una revisión. A pesar de lo incomodo de esta situación, al menos requiere un tiempo significativamente menor que una traslación manual completa. En este sentido cabe decir que la detección de incongruencias es bastante sencilla, con el mero corrector de un procesador de textos podría solucionarse la mayoría de los problemas.

La capacidad de reconocer el texto fue aumentando con el paso del tiempo. En efecto, existe una evolución clara en lo que respecta a la exactitud con la que el programa puede representar la imagen en texto editable. Luego de un reconocimiento de palabras, los programas más avanzados suelen intentar comparar el texto con un diccionario de palabras, sacando por descarte los errores observados. Este tipo de mejoras logró que la exactitud se mantenga en porcentajes elevados. De seguir la tendencia, quizá en un futuro próximo pueda contarse con programas de eficiencia casi absoluta en este sentido.

Cabe hacer la aclaración que existen distintos tipos de textos a reconocer por programas de este calibre. En efecto, hay una gran distancia en reconocer texto impreso y texto manuscrito, cada persona tiende a generar caracteres que son propios y que difícilmente puedan contrastarse con una biblioteca. No obstante, a pesar que la exactitud es menor en este tipo de experiencias, es importante hacer notar que también se han logrado muchos progresos, avances que sin lugar a dudas continuarán en el futuro.

Definición Siguiente >>