Hoy vamos a ver cómo convertir una imagen a escala de grises usando el lenguaje de programación Python.
Básicamente vamos a tomar una imagen a color, obtener sus pixeles y modificarlos a mano (sin librerías) para aplicar la escala de grises.
Finalmente vamos a guardar la imagen ya procesada.
Requisitos
Necesitas Python y PIP. Cuando tengas pip instala numpy e imageio con: pip install numpy imageio
No es obligatorio usar numpy (pero el ejercicio sí lo requiere, así que lo he usado), basta con imageio para obtener los pixeles de la imagen como una matriz así como lo hice cuando trabajé con esteganografía en Python.
Vamos a trabajar con una imagen BMP pero cualquier imagen que pueda ser convertida a matriz debería funcionar.
Convirtiendo pixel a escala de grises en Python
Primero veamos el algoritmo general. Vamos a tener una matriz (de 2 dimensiones) y en cada elemento de la matriz habrá una lista con 3 valores que representan los 3 niveles del color: rojo, verde y azul, esto es básicamente un pixel.
Para que un pixel sea de una tonalidad gris, sus 3 niveles de RGB deben ser iguales. Entonces ya tenemos el primer punto: debemos igualar los 3 niveles.
Pero no vamos a poner un único gris a la imagen; vamos a poner varias tonalidades de gris dependiendo de los colores originales. Para que esto suceda vamos a promediar los tres valores y colocarlos al pixel.
Por ejemplo, si tenemos un pixel con 200,100,224
debemos sacar el promedio (que sería 174.666, redondeado a 174
) y colocar ese valor para los 3 niveles.
Entonces el pixel cambiaría de ser (recuerda que es R, G, B) [200, 100, 224]
a [174, 174, 174]
. Y vamos a hacer eso para cada pixel dentro de la imagen.
Función para convertir imagen a escala de grises
Ya te expliqué con palabras, ahora veamos el código en Python que va a tomar una matriz de pixeles RGB y convertirlos a escala de grises, de modo que al final tendremos una imagen en escala de grises:
def escala_grises(nombre_imagen):
matriz = leer_imagen(nombre_imagen)
ancho = len(matriz[0])
alto = len(matriz)
for y in range(alto):
for x in range(ancho):
pixel = matriz[y][x]
# El doble / es para dividir y redondear a entero
promedio = (pixel[0] + pixel[1] + pixel[2])//3
matriz[y][x][0] = promedio
matriz[y][x][1] = promedio
matriz[y][x][2] = promedio
return matriz
Como puedes ver estamos obteniendo el promedio en la línea 9, ya después asignamos el promedio al índice 0, 1 y 2 que corresponden a los colores del pixel Red, Green y Blue.
La función lee la imagen como una matriz, pero para ello necesita funciones adicionales que vemos a continuación ya con el código completo:
"""
https://parzibyte.me/blog
"""
import numpy as np
import imageio
NOMBRE_IMAGEN = "travel.bmp"
def leer_imagen(ruta):
return np.array(imageio.imread(ruta), dtype='int').tolist()
def guardar_imagen(ruta, matriz):
return imageio.imwrite(ruta, np.array(matriz, dtype="uint8"))
def escala_grises(nombre_imagen):
matriz = leer_imagen(nombre_imagen)
ancho = len(matriz[0])
alto = len(matriz)
for y in range(alto):
for x in range(ancho):
pixel = matriz[y][x]
# El doble / es para dividir y redondear a entero
promedio = (pixel[0] + pixel[1] + pixel[2])//3
matriz[y][x][0] = promedio
matriz[y][x][1] = promedio
matriz[y][x][2] = promedio
return matriz
guardar_imagen("travel_escala_grises.bmp", escala_grises(NOMBRE_IMAGEN))
Al ejecutar el script (siempre y cuando la imagen exista) la salida es correcta, y con eso estaremos aplicando el filtro de escala de grises a una imagen con Python:
Por aquí te dejo con más tutoriales de Python.