Instalar Tesseract OCR + Idioma español en Ubuntu

Anteriormente en mi blog vimos cómo instalar Tesseract OCR en Windows 10 con los modelos para detectar el idioma español en el texto dentro de la imagen. Tesseract OCR es un motor de reconocimiento óptico de caracteres, es decir, un motor que extrae el texto de una imagen, o digitaliza el contenido de una imagen, un escaneo, una foto o una captura de pantalla. En este post vamos a ver cómo instalar Tesseract OCR en Ubuntu, además del idioma español o mejor dicho los modelos para trabajar con el idioma español. ...

mayo 19, 2019 · 1 min · 213 palabras · Parzibyte

Instalar Tesseract OCR en Windows 10 para el reconocimiento de texto en imágenes

Tesseract OCR es un proyecto open source que trata sobre un motor de reconocimiento de texto en imágenes. Está disponible para Mac, Windows y Linux. Hay buenas noticias para los hispanohablantes, pues Tesseract OCR tiene soporte para el español y la verdad es que me ha dejado maravillado con su precisión de reconocimiento. En este post vamos a ver cómo instalar Tesseract OCR en Windows 10 para digitalizar imágenes, ya sea escaneos, fotos o capturas; cualquier imagen conteniendo texto será válida. Resumiendo, vamos a ver: Cómo instalar Tesseract OCR en Windows Descargar el soporte para el idioma español Agregar Tesseract OCR a PATH de Windows Probar instalación de Tesseract No te preocupes, este es un post inicial que sentará las bases para otros proyectos y demostraciones. Lo primero es instalar, descargar y configurar Tesseract, y lo segundo es usarlo. Nota: si ya has instalado Tesseract mira cómo se usa aquí. ...

mayo 12, 2019 · 3 min · 568 palabras · Parzibyte