De chatbots a agentes autónomos: lo que tu comité debe entender antes de delegar procesos a una IA

En septiembre de 2025, Gartner publicó su primer Hype Cycle dedicado en exclusiva a la IA agentic. Su veredicto, traducido al lenguaje del comité, fue rotundo: la curva de adopción más agresiva de los últimos años, con menos del 17% de organizaciones que de verdad tienen agentes desplegados y más del 40% de los proyectos camino del fracaso antes de 2027. Dos meses después, McKinsey publicó su State of AI 2025, basado en una encuesta a 1.993 organizaciones de 105 países. Solo el 6% se gana la etiqueta de AI high performer, con un impacto en EBIT superior al 5%. El 23% dice estar escalando algún agente, casi siempre acotado a una o dos funciones.

Dos lecturas independientes, mismo año, misma conclusión: la ola es real y la mayoría de lo que está llegando al comité como agente autónomo todavía no lo es del todo.

Lo que cambia cuando pasas de chatbot a agente

Un chatbot responde; un agente actúa. La frase resume el cambio y esconde la consecuencia real.

Un chatbot del tipo que las pymes han desplegado entre 2023 y 2025 toma una entrada (una pregunta del cliente, un brief de marketing), genera una salida (un texto, una respuesta) y devuelve el control a un humano. El humano firma, envía y carga con el acierto o con el error. La IA actúa como asistente; el directivo o el empleado conserva la última palabra en cada paso.

Un agente, tal como lo definen tanto Gartner como McKinsey en sus informes recientes, es un sistema basado en un modelo fundacional capaz de planificar pasos, ejecutarlos contra sistemas reales (CRM, ERP, correo, ficheros, APIs externas), evaluar resultados intermedios y volver a intentarlo. En esa definición están todos los problemas nuevos. Planificar significa decidir. Ejecutar significa actuar con consecuencias. Evaluar significa juzgar su propio trabajo. Cada uno de esos verbos, antes, era de un empleado o de un mando.

La consecuencia operativa: cuando una pyme pasa de chatbot a agente, está cambiando de modelo organizativo. El asistente se sustituye por una función con cuenta de resultados implícita, sin que nadie haya firmado todavía un cambio en el organigrama.

Lo que dicen los datos primarios

Las fuentes serias enfrían rápido la conversación.

Gartner, Hype Cycle for Agentic AI (septiembre de 2025). Solo el 17% de las organizaciones tiene IA agentic desplegada. Más del 60% espera desplegarla en los próximos dos años. Más del 40% de los proyectos agentic fracasará antes de 2027 por problemas de gobierno, seguridad y coste, según la propia previsión de Gartner. La firma sitúa esta tecnología en el Pico de Expectativas Infladas del Hype Cycle, una posición que conviene leer dos veces antes de firmar un proyecto plurianual.

McKinsey, State of AI 2025 (noviembre de 2025, 1.993 organizaciones en 105 países). El 88% usa IA en al menos una función de negocio. Pero solo el 23% declara estar escalando un sistema agentic en alguna parte de la empresa, y la inmensa mayoría de quienes escalan lo hacen en una o dos funciones, no en toda la organización. Solo el 6% de las empresas se califica como AI high performer, con un impacto en EBIT superior al 5%. El otro 94% suma horas de comité y gasto en proveedores sin retorno declarado.

La cifra que más conviene grabarse, porque resume la pregunta que el comité tendrá que contestar a sus accionistas o a su consejo, es esta de McKinsey: el 39% de las empresas con IA reporta algún impacto en EBIT, y solo el 6% lo reporta superior al 5%. Entre ese 6% y el resto está, literalmente, la diferencia entre haber decidido bien y haber comprado humo caro.

"La curva de adopción es la más agresiva entre las tecnologías emergentes recientes, y al mismo tiempo los despliegues totalmente autónomos no están listos para la mayoría de los entornos empresariales. Lo que vive en producción son agentes acotados a tareas concretas, no agentes de propósito general."

Cuatro niveles de "agente" que te están vendiendo

Cuando un proveedor llega al comité con una solución "agentic", lo primero útil es saber en qué nivel está jugando. Sin ese mapa, todo suena igual y los precios igualan por arriba.

1. Chatbot maduro. Un modelo conversacional integrado con tu CRM o tu base de conocimiento. Responde, redacta, resume. No actúa, no decide. Es lo que la mayoría de pymes desplegó entre 2023 y 2025. Útil y barato, ya no representa una ventaja diferencial. Si te lo venden como "agente" en 2026, hay un sobreprecio inflado por el bombo.

2. Copiloto con autorización paso a paso. El sistema propone una acción concreta (mandar un correo, crear una factura, actualizar un campo) y un humano aprueba cada paso. Es donde están la inmensa mayoría de los "agentes" en producción en pymes europeas hoy. El humano sigue siendo el cuello, pero ya no escribe, solo valida. Tiene retorno medible y riesgo controlado, y es el lugar sensato para empezar.

3. Agente acotado con autonomía limitada. El sistema actúa dentro de un perímetro definido por reglas duras (presupuesto máximo, dominios permitidos, tipos de operación, horario humano). Decide y ejecuta sin pedir permiso en cada paso, pero está vigilado por excepción. Funciona en casos muy delimitados, por ejemplo triaje de tickets, conciliaciones contables sencillas o primer borrador de respuestas comerciales rutinarias. Es lo que Gartner llama task-specific agents y proyecta que estará integrado en el 40% de las aplicaciones empresariales a finales de 2026, desde menos del 5% actual.

4. Agente plenamente autónomo de propósito general. Toma objetivos abstractos ("aumenta la cuota en el segmento X") y decide qué pasos dar, con qué proveedores externos hablar y qué presupuesto comprometer. No existe todavía a nivel comercial maduro, y los pocos pilotos públicos viven en grandes corporaciones con equipos de control dedicados. Cualquier proveedor que lo venda hoy a una pyme está, en el mejor de los casos, contando una intención de roadmap.

La utilidad de este mapa es doble. Permite, primero, traducir la propuesta del proveedor al nivel real al que pertenece. Y, segundo, exigir el precio del nivel correspondiente y no el del bombo de feria.

Las cinco preguntas antes de delegar un proceso a un agente

Cuando el comité va a aprobar la delegación de un proceso a un sistema autónomo, antes de hablar del proveedor o del modelo conviene contestar cinco cosas. No hay metodología corta que evite estas cinco; las acabas pagando después si no las despachas antes.

1. ¿Es reversible la acción que vamos a delegar? Reservar una sala, redactar un borrador o crear un ticket: reversible. Confirmar un pago, firmar un pedido, comunicar un precio a un cliente o ejecutar una baja en RRHH: irreversible. El primer perímetro de un agente en una pyme debe construirse exclusivamente sobre acciones reversibles. La autonomía sobre acciones irreversibles llega después de meses de historial limpio y de controles de excepción que funcionan de verdad, no en el piloto.

2. ¿Qué autoridad y qué presupuesto le estamos dando, en cifras? Si el agente puede gastar, tiene que haber un techo en euros por operación, por día y por mes, no una recomendación en una nota interna. Si el agente puede negociar condiciones, tiene que haber rangos claros que no pueda cruzar. Sin esos límites duros, el comité está aprobando una tarjeta corporativa sin límite a una entidad cuya capacidad de decisión, a día de hoy, nadie del comité entiende del todo.

3. ¿Cómo vamos a auditar lo que hizo y por qué? Trazabilidad significa la capacidad de responder a un cliente, a un proveedor, a un auditor o a un juez por qué el sistema hizo lo que hizo y con qué información de partida. Antes de delegar, el comité tiene que ver en una demo real cómo se reconstruye una decisión concreta del agente. Si la respuesta del proveedor es "tenemos logs en JSON", la respuesta del comité es no.

4. ¿Qué pasa si el agente entra en bucle o se atasca? Los agentes pueden, y de hecho lo hacen, repetir intentos costosos contra APIs de pago (modelos, datos, mensajería) hasta que alguien lo nota. Sin un kill-switch claro y sin alertas de gasto anómalo configuradas antes de empezar, una factura sorprendente al cierre de mes es la versión amable del problema.

5. ¿Quién responde si el agente comete un error contractual con un cliente? El proveedor del agente casi siempre limita su responsabilidad al precio del servicio en sus términos contractuales. La responsabilidad civil frente al cliente final, frente al regulador sectorial y frente al consejo se queda en la pyme. Esa frontera tiene que estar escrita y aceptada por el comité antes del piloto, no descubrirse después de la primera incidencia.

Cinco preguntas no son una metodología; son una mesa de filtro. Una propuesta que no las contesta vuelve a estudio. Una propuesta que sí las contesta merece, al menos, el coste de evaluarla en serio.

Tres riesgos nuevos que no existían con chatbots

Pasar de chatbot a agente abre tres categorías de riesgo que con asistentes pasivos sencillamente no estaban en el mapa.

Exfiltración silenciosa de datos. Un agente que combina varios sistemas internos puede acabar enviando información a APIs externas en patrones que ninguna política de DLP clásica detecta. La fuga deja de ser un correo torpe y se convierte en un flujo legítimo desde el punto de vista del firewall y catastrófico desde el punto de vista del cliente. El control sale del firewall y entra en el diseño del propio agente, en sus permisos efectivos y en su trazabilidad. Es trabajo de comité con asesoramiento legal, antes de la implementación.

Acción irreversible no auditada. Un chatbot mal usado produce texto que un humano podía corregir antes de enviarlo. Cuando un agente mal acotado se equivoca, actúa por su cuenta: cancela una suscripción del cliente equivocado, devuelve un pago duplicado o envía una notificación a una lista entera. El daño es operativo y reputacional al mismo tiempo, y la responsabilidad sigue siendo del directivo que firmó la delegación, no del modelo.

Coste sin techo. Los costes de inferencia, de uso de APIs externas y de almacenamiento de contextos largos pueden escalar de forma no lineal cuando un agente repite intentos o consulta varios modelos en cascada. Sin techos contractuales con el proveedor y sin alertas internas, el piloto de tres meses puede acabar costando como un servicio anual. El director financiero tiene que estar en la mesa desde el día uno, no aparecer cuando llegue la factura.

Ninguna de estas tres categorías cabe en la agenda de IT solo. Las tres son del comité.

Por dónde empezar si eres una pyme

La trampa más fácil ahora mismo es saltar del chatbot al agente acotado de tipo (3) en seis meses, sin haber pasado nunca por el copiloto serio de tipo (2). La diferencia de retorno y de riesgo entre los dos saltos es grande.

Trimestre uno. Inventario serio. Qué casos en tu empresa hoy son reversibles, repetitivos y tienen una métrica de negocio clara. Conciliación de facturas, primer borrador de respuestas comerciales típicas, redacción de actas, triaje inicial de tickets. Esos son los candidatos a copiloto con autorización paso a paso. Nada más.

Trimestre dos. Elegir dos casos del inventario y desplegar un copiloto con tres líneas duras: límite de operaciones por día, validación humana obligatoria por paso, trazabilidad que el comité pueda revisar en cinco minutos. Medir el tiempo ahorrado, la tasa de error y el coste de inferencia contra una línea base real, no contra una promesa del proveedor.

Trimestre tres. Solo si los dos casos pasan el corte (ahorro real, error contenido, coste predecible) se evalúa subir uno de ellos a agente acotado de tipo (3). Con kill-switch, techo de gasto y plan de respuesta a incidentes documentado. El otro se mantiene como copiloto o se cierra sin drama.

Trimestre cuatro. Lectura completa. Qué procesos ganan al ser delegados, cuáles no y qué decisiones internas (organigrama, KPIs por departamento, perfil de las nuevas contrataciones) hay que ajustar el año siguiente. Aquí se decide si la empresa entra en serio en la curva o se mantiene en copiloto un año más, una respuesta perfectamente válida si los datos no apoyan otra cosa.

Doce meses, una lectura honesta, ninguna apuesta cuyo fracaso comprometa una línea de negocio. Es el ritmo que las cifras de Gartner y McKinsey hacen recomendable; el bombo de feria pide ir más rápido, los datos piden esto.

La conversación que abre Shift Directivo

Los proveedores que están llegando al comité este año vienen entrenados para vender el nivel (4) al precio del nivel (4). Si el comité no tiene mapa, paga ese precio por algo más cercano al nivel (2). Si lo tiene, negocia el alcance real y se ahorra al menos un año de gasto sin retorno.

Esa lectura, la de cómo un equipo directivo se forma para distinguir copiloto de agente, agente acotado de agente plenamente autónomo y promesa comercial de capacidad probada, es la que trabajamos en el servicio de replanteamiento de la mentalidad directiva y, en concreto, en Shift Directivo, el programa presencial de Stradiax para directivos que quieren llevarse, en noventa días, criterio propio sobre dónde y cómo introducir agentes en su empresa sin firmar el contrato equivocado.

La próxima vez que una solución "agentic" llegue a tu comité, antes de preguntar qué modelo usa, pásala por la taxonomía de cuatro niveles y por las cinco preguntas. Si el proveedor se cae en alguna, busca otro proveedor o aplaza la decisión hasta que las cifras de Gartner y McKinsey cambien en una dirección distinta a la actual.

De chatbots a agentes autónomos: lo que tu comité debe entender antes de delegar procesos a una IA

Lo que cambia cuando pasas de chatbot a agente

Lo que dicen los datos primarios

Cuatro niveles de "agente" que te están vendiendo

Las cinco preguntas antes de delegar un proceso a un agente

Tres riesgos nuevos que no existían con chatbots

Por dónde empezar si eres una pyme

La conversación que abre Shift Directivo

Stradiax Editorial Board

Un email. Una vez por semana. Sin ruido.

Relacionados

La IA ya no es un tema de IT: lo que el Banco de España le está diciendo a tu comité

Tu dinero de IA va a la capa equivocada

IA sin departamento de IT: tu hoja de ruta de ROI en 90 días