Todos los servicios

Servicio · Sistemas autónomos

Sistemas autónomos auditables. No chatbots.

No vendemos agentes. Vendemos ingeniería que, cuando el problema lo pide, compone sistemas autónomos sobre LLMs con rol acotado, acceso controlado y log auditable. Si tu caso no necesita un agente, te decimos qué necesita. No automatizamos por automatizar.

01 — El problema

Confusión en el mercado.

01

Todo se llama agente.

Desde un chatbot de FAQ hasta un sistema que ejecuta operaciones financieras. Sin definiciones claras, no hay criterio para evaluar riesgo ni ROI.

02

Opacidad peligrosa.

Proveedores venden "agentes" cuyo comportamiento no se puede explicar ni auditar. En producción, eso es un incidente esperando suceder.

03

Expectativas infladas.

Vendedores prometen agentes que hacen "todo". Lo que entregan son prompts encadenados que se rompen al primer caso borde real.

02 — Cómo los construimos

Diseño de rol, no de chat.

Antes de escribir código, definimos qué hace el agente, qué herramientas puede invocar, qué datos ve y qué decisiones escalan a un humano. Todo por escrito, firmado antes de empezar.

  1. 01

    Diseño del rol

    Workshop con tu equipo: tareas, límites, fallback humano, criterios de éxito. Output: spec firmada del agente.

  2. 02

    Construcción acotada

    Agente implementado sobre Claude API u otro modelo según caso. Herramientas (tools) limitadas a lo acordado. Tests adversariales.

  3. 03

    Pilotaje supervisado

    2-4 semanas con humano revisando 100% de las salidas. Afinamos prompts, añadimos guardrails, medimos precisión.

  4. 04

    Operación gradual

    Paso progresivo a autonomía. Dashboard en tiempo real de coste, precisión, intervenciones humanas. Kill switch disponible.

03 — Qué recibes

Agente, playbook y control.

Uno o varios agentes

Cada uno con rol específico (clasificar tickets, procesar facturas, responder consultas nivel 1). No un único agente que hace todo.

Playbook operativo

Manual de qué hace el agente, cómo pedirle cosas, cuándo debe intervenir un humano, cómo escalar problemas.

Dashboard de control

Visibilidad en vivo de ejecuciones, coste por operación, tasa de error, intervenciones humanas. Transparencia total.

Log auditable

Cada acción del agente queda registrada: input, decisión, output, coste. Exportable para auditoría interna o externa.

Kill switch

Botón operativo para desactivar el agente en caliente. Recurso obligatorio: si algo se rompe, paras el flujo en segundos.

Actualizaciones

Cuando salen modelos mejores o cambian las regulaciones, actualizamos el agente sin reescribir desde cero.

04 — Casos

Resultados reales.

05 — Preguntas frecuentes

Lo que nos preguntan.

  1. 01 ¿Qué diferencia hay entre un agente IA y un chatbot?

    Un chatbot responde con texto. Un agente ejecuta acciones: llama APIs, modifica bases de datos, envía correos, invoca herramientas. Tiene objetivos, herramientas autorizadas y la capacidad de decidir qué pasos dar para cumplir una tarea.

  2. 02 ¿Puedo controlar lo que hace el agente?

    Sí, completamente. Definimos por contrato qué herramientas tiene disponibles, qué datos ve, qué decisiones autoriza a tomar y qué debe escalar a un humano. El agente no puede salir de esos límites técnicos.

  3. 03 ¿Qué pasa si el agente toma una mala decisión?

    Cada decisión se registra con su input y output. Si detectamos un error, podemos desactivar el agente (kill switch), analizar el log y corregir. En fases de autonomía supervisada, un humano revisa cada acción antes de ejecutarse.

  4. 04 ¿Cuál es el coste operativo de un agente en producción?

    Tres componentes: coste por operación del modelo (varía según tarea y proveedor), infraestructura (depende de volumen y latencia exigida) y mantenimiento evolutivo. En casos con volumen, suele ser un orden de magnitud más barato que el equivalente humano. Calculamos el desglose con cifras reales en el diagnóstico.

  5. 05 ¿Cumple con el AI Act y RGPD?

    Sí por diseño: evaluación de impacto, minimización de datos, registro de decisiones, derecho a revisión humana en categorías de alto riesgo. Documentación lista para la AEPD si toca.

  6. 06 ¿Usáis Claude Code o vuestros propios agentes?

    Ambos según caso. Claude Code (Anthropic) para tareas de ingeniería; agentes propios construidos sobre Claude API u otros modelos para casos de negocio. Elegimos por adecuación técnica, no por preferencia comercial.

06 — Empecemos

Hablemos de tu operación.

Cuéntanos qué cuesta más de lo que debería. Te respondemos con un plan concreto, plazos realistas y un sí o un no claro.

contacto@plantekia.com