Reducir tamaño de PDF con Python - Comprimir
En este post te voy a enseñar una manera de reducir el tamaño de un PDF usando Python. Lo que te presentaré aquí no es magia, la reducción del tamaño del PDF va a depender de la composición del mismo.
Si el PDF tiene varias imágenes, entonces su tamaño será reducido considerablemente. El enfoque que voy a usar es convertir el PDF a imágenes, comprimir cada imagen y volver a crear el PDF.
Seguramente existen otras maneras de comprimir un PDF pero te cuento que este método me funcionó con un PDF que tenía varias imágenes en alta calidad.
Para comprimir un PDF con Python simplemente seguimos las instrucciones que mencioné al principio:
Ya he dedicado un post completo y a fondo a cada operación. Te recomiendo que revises cada post completo si tienes dudas. Recuerda que vas a necesitar Python y pip además de instalar:
pip install img2pdf
pip install pypdfium2
pip install pillow
El código queda así:
import pypdfium2 as pdfium
from pathlib import Path
from PIL import Image
import img2pdf
import os
nombre_pdf = "pesado.pdf"
nombre_pdf_comprimido = "comprimido.pdf"
nombre_pdf_sin_extension = Path(nombre_pdf).stem
escala = 2 # Escala para convertir PDF a imagen
"""
Extraer cada página del PDF como imagen
"""
pdf = pdfium.PdfDocument(nombre_pdf)
cantidad_paginas = len(pdf)
imagenes = []
for indice_pagina in range(cantidad_paginas):
numero_pagina = indice_pagina+1
nombre_imagen = f"{nombre_pdf_sin_extension}_{numero_pagina}.jpg"
imagenes.append(nombre_imagen)
print(f"Extrayendo página {numero_pagina} de {cantidad_paginas}")
pagina = pdf.get_page(indice_pagina)
imagen_para_pil = pagina.render(scale=escala).to_pil()
imagen_para_pil.save(nombre_imagen)
imagenes_comprimidas = []
"""
Comprimir imágenes.
Entre menor calidad, menos peso del PDF resultante
"""
calidad = 70
for nombre_imagen in imagenes:
print(f"Comprimiendo {nombre_imagen}...")
nombre_imagen_sin_extension = Path(nombre_imagen).stem
nombre_imagen_salida = nombre_imagen_sin_extension + \
"_comprimida" + nombre_imagen[nombre_imagen.rfind("."):]
imagen = Image.open(nombre_imagen)
imagen.save(nombre_imagen_salida, optimize=True, quality=calidad)
imagenes_comprimidas.append(nombre_imagen_salida)
"""
Escribir imágenes en un nuevo PDF
"""
print("Creando PDF comprimido...")
with open(nombre_pdf_comprimido, "wb") as documento:
documento.write(img2pdf.convert(imagenes_comprimidas))
"""
Eliminar imágenes temporales
"""
for imagen in imagenes + imagenes_comprimidas:
os.remove(imagen)
Tengo un PDF que pesa 11.9 MB, al comprimirlo con este script de Python usando una calidad de 70 y una escala de 2, he logrado reducirlo a 280 KB.
La reducción de tamaño no es magia; como te comenté anteriormente, su funcionamiento se basa en convertir cada página a imagen y después comprimirla. Si tu PDF no tiene muchas imágenes, probablemente no veas diferencias.
El código que está expuesto aquí puede ser colocado en un Bot de Telegram, así puedes ofrecer a los usuarios una interfaz fácil de usar multiplataforma para comprimir un PDF desde Telegram:
El día de hoy vamos a ver cómo restablecer la impresora térmica GOOJPRT PT-210 a…
Hoy voy a enseñarte cómo imprimir en una impresora térmica conectada por USB a una…
En este post voy a enseñarte a programar un servidor web en Android asegurándonos de…
En este post te quiero compartir un código de C++ para listar y cancelar trabajos…
Gracias a WebAssembly podemos ejecutar código de otros lenguajes de programación desde el navegador web…
Revisando y buscando maneras de imprimir un PDF desde la línea de comandos me encontré…
Esta web usa cookies.