Digitalizacion-De-Imagenes

En este post vamos a ver cómo convertir imágenes a texto; es decir, leer el texto que está dentro de una imagen; ya sea una foto de un libro, una captura de pantalla o una imagen escaneada. A esto se le llama digitalización de textos, reconocimiento óptico de caracteres u OCR. Vamos a usar Tesseract OCR, el cual es un proyecto open source que trata sobre un motor de reconocimiento de texto en imágenes. Recuerda que ya vimos cómo se instala y configura en Windows 10 y en Ubuntu. Vamos a probar el reconocimiento óptico de caracteres con muchas imágenes, es decir, leer el texto de una imagen ya sea desde una captura de pantalla o una foto, incluso desde un escaneo. Cabe mencionar que la captura es de una nota que tomé del libro La rebelión de Atlas cuando Dagny conoce, al fin, a John Galt. ...

Tesseract OCR es un proyecto open source que trata sobre un motor de reconocimiento de texto en imágenes. Está disponible para Mac, Windows y Linux. Hay buenas noticias para los hispanohablantes, pues Tesseract OCR tiene soporte para el español y la verdad es que me ha dejado maravillado con su precisión de reconocimiento. En este post vamos a ver cómo instalar Tesseract OCR en Windows 10 para digitalizar imágenes, ya sea escaneos, fotos o capturas; cualquier imagen conteniendo texto será válida. Resumiendo, vamos a ver: Cómo instalar Tesseract OCR en Windows Descargar el soporte para el idioma español Agregar Tesseract OCR a PATH de Windows Probar instalación de Tesseract No te preocupes, este es un post inicial que sentará las bases para otros proyectos y demostraciones. Lo primero es instalar, descargar y configurar Tesseract, y lo segundo es usarlo. Nota: si ya has instalado Tesseract mira cómo se usa aquí. ...

Digitalizacion-De-Imagenes

Reconocimiento óptico de caracteres con Tesseract OCR

Instalar Tesseract OCR en Windows 10 para el reconocimiento de texto en imágenes