Guía práctica
De PDF a Excel con IA: cómo automatizar la extracción de documentos y saber cuándo necesitas software a medida
Aprende a extraer datos de facturas, albaranes y PDFs con IA — prompt incluido, ejemplos reales, y una forma honesta de saber cuándo el método manual ya no escala.
El problema: documentos que alguien convierte en datos a mano
En la mayoría de empresas, hay alguien que abre un PDF, lee lo que pone, y lo escribe en otro sitio. En un Excel, en un ERP, en el software de contabilidad, en un CRM. Todos los días. Con todas las facturas, albaranes, formularios o documentos que llegan.
Es un trabajo que no requiere criterio — solo atención. Y por eso es exactamente el tipo de trabajo que la IA puede hacer, o al menos reducir de forma significativa.
Esta guía explica cómo hacerlo de forma práctica, qué herramientas usar, cuáles son los límites reales del método manual, y cuándo tiene sentido dar el paso a una automatización real.
Qué procesos encajan con este enfoque
No todos los documentos son iguales. Antes de invertir tiempo, conviene saber si tu proceso encaja.
Encajan bien
- Facturas de proveedor (PDF, imagen, escaneado) → Excel, ERP o software contable
- Albaranes de entrega → registro de stock o cruce con pedidos
- Formularios recibidos por email → base de datos o CRM
- Contratos o presupuestos → extracción de condiciones clave (plazos, importes, fechas)
- Documentación de clientes (DNI, nóminas, justificantes) → expedientes o checklist de completitud
No encajan bien con el método manual
- Documentos sin texto legible (imágenes muy borrosas, escritura a mano sin digitalizar)
- Documentos donde el criterio de extracción requiere interpretación contable o legal caso a caso
- Procesos donde necesitas que la IA actúe en tiempo real, conectada a otros sistemas, sin intervención humana
Si tu proceso encaja en la primera lista, sigue leyendo.
Cómo hacerlo manualmente con IA: el método paso a paso
Lo que necesitas
- ChatGPT (GPT-4 o superior) o Claude — cualquiera de los dos funciona
- El documento original: adjunta el PDF directamente, o pega el texto si el documento lo permite
- El destino de los datos: una hoja de Excel o Google Sheets donde pegar el resultado
No necesitas instalar nada ni tener conocimientos técnicos.
Paso 1 — Adjunta el documento y usa este prompt
Abre ChatGPT o Claude, adjunta la factura o el documento, y pega este prompt:
Extrae de esta factura los siguientes campos: - Proveedor (nombre o razón social) - NIF del proveedor - Fecha de emisión - Número de factura - Base imponible - Tipo de IVA (%) - Importe de IVA - Total factura - Fecha de vencimiento (si aparece) - Concepto o descripción del servicio/producto Devuelve el resultado en formato tabla con dos columnas: Campo y Valor. Marca como "dudoso" cualquier campo que no esté claro, que falte o que no cuadre (por ejemplo, si el total no coincide con base + IVA).
La clave está en la última instrucción: que la IA marque lo que no cuadra, en vez de inventarse un valor plausible. Un campo marcado como "dudoso" es información útil. Un campo inventado es un error silencioso.
Paso 2 — Valida lo marcado como dudoso
La IA devuelve una tabla con los campos extraídos. Revisa solo lo marcado como dudoso:
- Total no cuadra con base + IVA — puede ser un error del proveedor, un redondeo o un campo mal leído. Comprueba el original antes de pagar.
- NIF ilegible o incompleto — solicita la factura corregida al proveedor.
- Fecha de vencimiento ausente — añádela tú según las condiciones pactadas con ese proveedor.
- Concepto genérico — amplíalo con la referencia de pedido si la tienes.
Lo que no está marcado como dudoso no requiere tu atención — solo copiarlo al destino. El objetivo es concentrar tu tiempo en los casos que realmente lo necesitan.
Paso 3 — Llévalo a Excel
Copia la tabla que devuelve la IA y pégala en tu hoja de Excel. Si usas Google Sheets, puedes pedirle a la IA que devuelva el resultado en formato CSV para facilitar el pegado.
Para facturas repetidas del mismo proveedor, una vez que el prompt funciona bien para ese formato, el proceso de cada factura se reduce a tres acciones: adjuntar, copiar, pegar.
¿Quieres una plantilla de Excel lista para recibir estos datos, con las reglas de validación ya configuradas?
Solicita el diagnóstico y te la enviamosLos límites del método manual
Este método funciona. Pero tiene un techo claro que conviene conocer antes de depender de él.
- El tiempo sigue siendo tuyo. Aunque cada factura tarde 2 minutos en vez de 10, con 100 facturas al mes sigues dedicando más de 3 horas a un proceso que no aporta criterio — solo atención.
- No hay validación cruzada entre documentos. Si necesitas cruzar la factura con su albarán, o detectar que un NIF ya facturó ese número antes, tienes que hacerlo tú. La IA extrae de un documento a la vez — no conecta datos entre varios.
- No se integra con tus herramientas. El resultado es una tabla que copias a mano. No va directamente al ERP, al software contable, ni al CRM.
- La calidad depende del documento. Un escaneado en baja resolución o una foto torcida puede generar más campos dudosos de lo normal. Funciona bien con la mayoría de documentos estándar — pero no con todos.
Cuándo conviene dar el paso al software automático
El método manual tiene sentido como punto de partida: te permite confirmar que el proceso es automatizable y cuantificar el tiempo que dedicas. Pero llega un momento en que deja de ser la solución — y ese momento depende de tu volumen y de adónde van los datos.
- Más de 50 documentos al mes procesados a mano Por debajo de ese volumen, el ahorro del método manual puede ser suficiente. Por encima, el tiempo dedicado empieza a representar un coste que ya justifica una automatización real.
- El destino es un ERP, CRM o software contable La integración directa — sin copiar y pegar — es lo que marca la diferencia operativa real: los datos llegan validados y en el formato correcto, sin intervención humana.
- Necesitas validación cruzada entre documentos Cruzar facturas con albaranes, detectar duplicados, verificar que los importes cuadran entre distintos sistemas — eso no se puede hacer documento a documento. Requiere un flujo que conecte todos los datos.
Si te reconoces en alguno de estos tres puntos, el siguiente paso no es optimizar el prompt — es automatizar el flujo.
¿Tu proceso ya supera el umbral del método manual?
Hacemos un diagnóstico de proceso de 20-30 minutos — sin coste y sin compromiso. Al final sabes exactamente qué se puede automatizar, qué no, y qué implicaría hacerlo.