El punto de partida que nadie quiere admitir
En 2026, la mayoría de comités de dirección en España tienen en su agenda la palabra IA. Pocos tienen una pregunta más concreta que "¿qué hacemos con esto?". El resultado más habitual: una consultora externa que entrega 80 diapositivas, un proyecto interno que muere en el segundo sprint, o un piloto con ChatGPT en el departamento de marketing que nadie sabe si funciona.
Esta guía baja al suelo. Cinco pasos concretos, con tiempos y coste estimado, para pasar de "tenemos que hacer algo con IA" a "este proceso X ahorra Y horas y cuesta Z euros al mes".
Paso 1 · Mapear procesos antes de elegir modelos
El error más caro que hemos visto en proyectos de IA es empezar por la herramienta. Alguien decide que Claude o GPT-4 son "el futuro" y arranca un piloto sin haber mapeado antes qué proceso concreto quiere atacar.
Orden correcto:
- Listar tareas repetitivas de alto volumen. No proyectos estratégicos, tareas. "Categorizar 200 tickets al día", "generar 50 informes semanales", "responder 30 emails tipo al día".
- Estimar coste actual. Horas × coste/hora × frecuencia. Si una tarea cuesta menos de 500 €/mes en horas humanas, probablemente no merece la pena automatizarla aún.
- Medir reglas y varianza. Una tarea con reglas claras y poca varianza entre casos es candidato ideal. Una tarea con muchos casos borde y criterio humano crítico, mejor dejarla para más tarde.
El output de este paso es una lista priorizada con 5-10 candidatos, cada uno con su ahorro potencial y su complejidad estimada. Sin esta lista, todo lo demás es ruido.
Paso 2 · Elegir piloto correcto (no el más sexy)
Una vez tienes la lista priorizada, la tentación es atacar el proceso más visible o más impresionante. Error. Para el primer piloto elige el caso que tenga:
- ROI medio-alto (no tiene que ser el mayor)
- Riesgo bajo (si el agente se equivoca, el impacto es limitado)
- Feedback rápido (puedes medir si funciona en 4-6 semanas, no 6 meses)
- Apoyo interno (alguien del equipo quiere que salga bien y puede dar tiempo)
En la práctica, los pilotos que funcionan suelen ser categorización de emails, extracción de datos de documentos, generación de borradores de respuesta estándar, o clasificación de tickets de soporte de nivel 1. Poco glamour, alto impacto.
Paso 3 · Arquitectura mínima viable
Un agente IA en producción necesita cinco componentes mínimos:
- Modelo (Claude, GPT, Llama). Decisión técnica, no de marketing.
- Herramientas autorizadas (APIs internas, bases de datos, email).
- Guardrails: qué puede y qué no puede hacer. Por contrato técnico.
- Log auditable: cada decisión queda registrada.
- Kill switch: un botón que para el flujo en segundos.
Cualquier agente en producción sin estos cinco componentes es un incidente esperando suceder. No es negociable.
Paso 4 · Medición antes y después
Define métricas antes de arrancar el piloto. Después es tarde: sesgo de confirmación garantizado.
Métricas típicas:
- Horas/semana ahorradas (medido contra baseline humano)
- Tasa de error o de rechazo (el agente propone algo, ¿se aprueba?)
- Tiempo de ciclo (desde que entra la tarea hasta que se cierra)
- Coste marginal (coste del modelo + infra por operación)
- Intervención humana (% de casos que requirieron ajuste manual)
Un piloto sin métricas es una anécdota. Con métricas, es un caso de negocio replicable.
Paso 5 · Escalar sin romper
Si el piloto funciona, el instinto es extenderlo en todas direcciones a la vez. Mal plan. El escalado tiene tres dimensiones y hay que atacarlas una a una:
- Volumen: pasar de 100 casos/día a 1.000. Requiere optimización de coste del modelo y monitorización.
- Variedad: añadir casos borde al alcance. Requiere más guardrails y testing.
- Geografía / equipo: extender a otros departamentos. Requiere formación y ajuste a sus procesos específicos.
Escalar las tres a la vez garantiza que algo se rompa y se desconfíe del sistema. Una por una, con puerta de decisión entre cada una, funciona.
Cuánto cuesta realmente
Rango realista para una empresa mediana española (50-500 empleados) implementando su primer caso de uso de IA en 2026:
- Diagnóstico inicial: 6.000 - 12.000 €
- Piloto funcional (4-6 semanas): 15.000 - 35.000 €
- Escalado a producción: 30.000 - 80.000 €
- Operación mensual (modelo + infra + soporte): 1.500 - 8.000 €/mes
Con un piloto bien elegido, el payback típico es 3-6 meses. Si alguien te promete retorno en menos de 2 meses, desconfía.
Los 5 errores que vemos repetirse
- Empezar por la herramienta. "Vamos a montar ChatGPT interno" antes de saber qué problema resuelve.
- Confundir POC con piloto. Un script que funciona en demo no es un sistema en producción.
- Automatizar procesos rotos. Si el proceso está mal definido, automatizarlo solo amplifica el problema.
- Sin compliance desde día 1. Añadir RGPD y AI Act al final es 10× más caro que integrarlos desde el diseño.
- Sin métricas acordadas. Sin baseline claro, no hay forma de saber si lo que construiste aporta.
El atajo honesto
Si quieres evitar el 80% de los errores típicos, un diagnóstico externo de 2-3 semanas te da el mapa de oportunidades priorizado, te identifica los procesos candidatos y te saca del bloqueo de la página en blanco. Cuesta entre 6.000 y 12.000 €. Ahorra meses de dar vueltas.
Nosotros hacemos ese diagnóstico. Aquí los detalles. No es imprescindible contratarnos a nosotros, pero sí contratar a alguien que no venda solo la herramienta — que venga con método.