Procesamiento inteligente de documentos

  • 2025
  • Completado

Fue una colaboración estrecha con un cliente, en el que desarrollamos un sistema que permite comparar grandes volúmenes de documentos y detectar automáticamente cambios entre versiones. Lo diseñamos para que nuestros clientes puedan revisar rápidamente diferencias importantes, reduciendo un proceso que antes tomaba semanas a solo minutos.

¿Cómo lo hicimos?

Durante la elaboración del proyecto se adoptaron diferentes estrategias:

  1. Extracción y normalización de datos: Usamos pdfplumber y Azure Document Intelligence para procesar PDFs y tablas, incluyendo OCR para documentos escaneados y conversión de tablas a CSV.

  2. Refinamiento inteligente: Normalizamos y organizamos la información para evitar comparaciones erróneas y asegurar resultados precisos.

  3. Potenciación con LLMs: Incorporamos modelos de lenguaje de última generación (OpenAI) para etiquetar y comparar secciones complejas donde los métodos tradicionales fallan, detectando similitudes y diferencias en contexto más amplio.

Resultados

La combinación de los diferentes tipos de herramientas utilizadas nos permitió crear un programa sólido, que se ejecuta cada mes y donde nuestro cliente puede ver de un vistazo rápido las diferencias entre sus documentos, agilizando un proceso que antes podía llevarle semanas terminarlo.