OCR Archivos - Parzibyte's blog

OCR con PHP - Detectar texto de una imagen

Extraer texto de imagen con PHP y Tesseract – OCR

2 comentarios / linux, OCR, php, web, windows / parzibyte

En este post de programación en PHP te mostraré cómo extraer el texto de imágenes o mejor dicho cómo usar Tesseract OCR desde este lenguaje, de modo que podamos digitalizar el texto de una imagen usando PHP. Al final esto que te muestro es un simple wrapper o una envoltura, ya que si bien vamos […]

Extraer texto de imagen con PHP y Tesseract – OCR Leer más »

Extraer el texto de una imagen con JavaScript y Tesseract.js – Aplicación web

2 comentarios / Bootstrap 4, HTML, javascript, OCR, Software y sistemas, web / parzibyte

Hace algún tiempo presenté el uso de la librería de JavaScript llamada Tesseract.Js, la cual sirve para extraer el texto de una imagen o convertir una imagen a texto. Aparte de extraer el texto de una imagen también lo puede hacer de una foto o de una imagen escaneada como lo vimos en la demostración

Extraer el texto de una imagen con JavaScript y Tesseract.js – Aplicación web Leer más »

Reconocimiento óptico de caracteres con JavaScript y Tesseract.js

7 comentarios / javascript, OCR, web / parzibyte

Ya estamos en otro post sobre el reconocimiento óptico de caracteres, que no es otra cosa más que detectar el texto que existe dentro de una imagen, es decir, extraer el texto de una imagen. Lo hicimos con Tesseract OCR en Windows y Linux, pero ahora lo haremos en un lenguaje de programación que se

Reconocimiento óptico de caracteres con JavaScript y Tesseract.js Leer más »

Reconocimiento óptico de caracteres con Tesseract OCR

6 comentarios / linux, OCR, Ubuntu, windows / parzibyte

En este post vamos a ver cómo convertir imágenes a texto; es decir, leer el texto que está dentro de una imagen; ya sea una foto de un libro, una captura de pantalla o una imagen escaneada. A esto se le llama digitalización de textos, reconocimiento óptico de caracteres u OCR. Vamos a usar Tesseract

Reconocimiento óptico de caracteres con Tesseract OCR Leer más »

Instalar Tesseract OCR + Idioma español en Ubuntu

Dejar un comentario / linux, OCR, Ubuntu / parzibyte

Anteriormente en mi blog vimos cómo instalar Tesseract OCR en Windows 10 con los modelos para detectar el idioma español en el texto dentro de la imagen. Tesseract OCR es un motor de reconocimiento óptico de caracteres, es decir, un motor que extrae el texto de una imagen, o digitaliza el contenido de una imagen,

Instalar Tesseract OCR + Idioma español en Ubuntu Leer más »

Instalar Tesseract OCR en Windows 10 para el reconocimiento de texto en imágenes

4 comentarios / OCR, windows / parzibyte

Tesseract OCR es un proyecto open source que trata sobre un motor de reconocimiento de texto en imágenes. Está disponible para Mac, Windows y Linux. Hay buenas noticias para los hispanohablantes, pues Tesseract OCR tiene soporte para el español y la verdad es que me ha dejado maravillado con su precisión de reconocimiento. En este

Instalar Tesseract OCR en Windows 10 para el reconocimiento de texto en imágenes Leer más »