Extraer el texto de una imagen con JavaScript y Tesseract.js – Aplicación web

Hace algún tiempo presenté el uso de la librería de JavaScript llamada Tesseract.Js, la cual sirve para extraer el texto de una imagen o convertir una imagen a texto.

Aparte de extraer el texto de una imagen también lo puede hacer de una foto o de una imagen escaneada como lo vimos en la demostración de Tesseract OCR.

En el post en donde hablo de la librería prometí que haría una app para demostrar el funcionamiento y uso, y es justamente lo que vengo a presentar hoy: una aplicación web que sirve para extraer el texto de una imagen.

Funciona en Firefox y Google Chrome en Windows y Android, no he probado en otros navegadores.

La app web

He utilizado la plantilla de arranque de Bootstrap 4 que presenté hace algún tiempo. Lo demás son cosas simples como mostrar una vista previa de la imagen seleccionada.

Puedes probar y usar la app en este enlace y visitar el código fuente en este otro.

Su uso es sencillo: cargamos una imagen y esperamos a que se extraiga el texto. La velocidad depende del poder del dispositivo.

Así se ve en Chrome:

Conversor de imagen a texto en Chrome

Y así en Firefox:

Conversor de imagen a texto en Firefox

El funcionamiento es el mismo en ambos navegadores.

Extraer el texto de una imagen con JavaScript y Tesseract.js – Aplicación web

Por parzibyte Tiempo de lectura: 1 min
0