Procesamiento inteligente de documentos
- 2025
- Completado
Fue una colaboración estrecha con un cliente, en el que desarrollamos un sistema que permite comparar grandes volúmenes de documentos y detectar automáticamente cambios entre versiones. Lo diseñamos para que nuestros clientes puedan revisar rápidamente diferencias importantes, reduciendo un proceso que antes tomaba semanas a solo minutos.
¿Cómo lo hicimos?
Durante la elaboración del proyecto se adoptaron diferentes estrategias:
Extracción y normalización de datos: Usamos pdfplumber y Azure Document Intelligence para procesar PDFs y tablas, incluyendo OCR para documentos escaneados y conversión de tablas a CSV.
Refinamiento inteligente: Normalizamos y organizamos la información para evitar comparaciones erróneas y asegurar resultados precisos.
Potenciación con LLMs: Incorporamos modelos de lenguaje de última generación (OpenAI) para etiquetar y comparar secciones complejas donde los métodos tradicionales fallan, detectando similitudes y diferencias en contexto más amplio.
Resultados
La combinación de los diferentes tipos de herramientas utilizadas nos permitió crear un programa sólido, que se ejecuta cada mes y donde nuestro cliente puede ver de un vistazo rápido las diferencias entre sus documentos, agilizando un proceso que antes podía llevarle semanas terminarlo.