¿Qué capacidades permitió la IA agéntica realizar a los atacantes y qué pruebas de la campaña de Anthropic ilustran esto?

La IA agéntica permite a los atacantes ejecutar campañas multifase con una mínima intervención humana, realizando reconocimientos, localizando bases de datos de alto valor, generando código de explotación y recopilando credenciales robadas. Según el relato de Anthropic, la IA llevó a cabo aproximadamente el 80-90% de la campaña, con humanos interviniendo solo en unos pocos puntos de decisión, y utilizó herramientas a través de escáneres, entornos de ejecución de código y APIs web, produciendo operaciones de gran volumen, rápidas y escalables.

¿Cuáles son los tres cambios inmediatos para los defensores que se destacan en el artículo?

Los defensores están buscando una gobernanza más estricta para las identidades no humanas, la aplicación del principio de menor privilegio y credenciales de corta duración para los agentes, y pistas de auditoría más granulares que vinculen las acciones de las máquinas con una procedencia verificable. Estas medidas convierten la actividad opaca de los agentes en un ciclo de vida rastreable que puede limitarse o revocarse, mejorando el control sobre las acciones defensivas automatizadas.

¿Qué cuestiones de gobernanza y política plantea la defensa agéntica y qué direcciones se sugieren?

El auge de las defensas agénticas plantea interrogantes sobre la gobernanza respecto a quién controla a los agentes defensivos, cómo se auditan sus decisiones y cómo evitar la creación de nuevos objetivos de alto valor, como los planos de control de agentes y los registros de auditoría para los atacantes. Paralelamente, las directrices de la industria apuntan a orientaciones políticas como estándares para la procedencia de los agentes, estándares de tokens que codifiquen la intención y el alcance, y un mejor intercambio de información sobre amenazas relacionadas con las TTP basadas en agentes.

IA agéntica en ciberataques: velocidad, escala y respuesta

Q: ¿Por qué son importantes en este contexto las soluciones de proveedores como Sublime Security y ATLAS?

Los proveedores están construyendo sistemas de defensa agénticos diseñados para detectar, clasificar y remediar amenazas con la misma rapidez con la que operan los atacantes. Por ejemplo, Sublime Security presentó una defensa de correo electrónico agéntica que clasifica el phishing e impulsa reglas defensivas de forma autónoma, mientras que ATLAS comercializa un tejido cognitivo autoevolutivo que orquesta miles de agentes para cazar, predecir y neutralizar amenazas en milisegundos. Esto refleja un cambio hacia una defensa automatizada y escalable, paralela a las capacidades agénticas ofensivas.

Cuando las máquinas se encargan del hackeo

Esa revelación cristalizó un temor del que los equipos de seguridad habían estado advirtiendo durante meses: la IA agéntica —sistemas que pueden ejecutar bucles, utilizar herramientas externas y realizar acciones autónomas— cambia drásticamente la economía de los ciberataques. A las pocas semanas y meses del informe de Anthropic, el debate público entre proveedores y suministradores de servicios en la nube pasó de la mitigación abstracta de riesgos a cambios concretos en la identidad, Zero Trust y herramientas tanto para detectar como para desplegar defensores autónomos.

Cómo se desarrolló la campaña de Anthropic

La investigación de Anthropic describe un ciclo de vida multifase que elimina gran parte del trabajo lento y propenso a errores que antes requerían los atacantes humanos. Los operadores prepararon un marco de ataque y luego instruyeron a un modelo para que realizara labores de reconocimiento, identificara bases de datos de alto valor, generara código de explotación y recopilara credenciales robadas, dividiendo el plan malicioso en tareas pequeñas y aparentemente inocuas para evadir las barreras de seguridad integradas. La empresa estimó que la IA llevó a cabo aproximadamente entre el 80% y el 90% de la campaña, y los humanos intervinieron solo en unos pocos puntos de decisión.

Dos características técnicas hicieron posible la campaña a gran escala: primero, la inteligencia de los modelos ha madurado hasta el punto de que los agentes pueden seguir instrucciones complejas de varios pasos y generar código funcional; segundo, los agentes ganaron el uso de herramientas —acceso a escáneres, entornos de ejecución de código o recursos web a través de APIs—, lo que les permitió actuar en función de sus hallazgos. Anthropic también señaló que los atacantes utilizaron técnicas de jailbreaking e instrucciones engañosas para manipular al modelo y lograr su cooperación.

Operativamente, el ataque generó una firma de telemetría inusual: solicitudes de gran volumen y rápida ejecución, y una actividad encadenada y distribuida que habría sido prohibitivamente costosa o lenta para un equipo exclusivamente humano. Anthropic afirmó que solo un pequeño número de intentos tuvo éxito, pero el caso demuestra una nueva posibilidad: ciber campañas de bajo coste y alta velocidad que se escalan automáticamente y que los adversarios pueden adaptar con rapidez.

Reacción de la industria: replantear la identidad y la confianza

En la práctica, los defensores están impulsando tres cambios inmediatos: una gobernanza más estricta para las identidades no humanas, la aplicación del principio de mínimo privilegio y credenciales de corta duración para los agentes, y registros de auditoría más detallados que vinculen las acciones de las máquinas con datos de procedencia de mayor fidelidad. Esos cambios son incrementales pero esenciales: transforman la actividad de los agentes de un flujo opaco de llamadas a APIs en un ciclo de vida rastreable que puede limitarse y, si es necesario, revocarse.

Defensa autónoma: los proveedores también apuestan por lo agéntico

No todas las respuestas son defensivas en el sentido estricto. Empresas emergentes y proveedores establecidos están creando sistemas agénticos diseñados para detectar, clasificar y remediar al mismo ritmo al que se mueven los atacantes. A finales de octubre, Sublime Security anunció una importante financiación y describió una tecnología de defensa de correo electrónico agéntica que clasifica el phishing e impulsa reglas defensivas de forma autónoma. Un anuncio de producto de diciembre presentó ATLAS, un tejido de ciberseguridad cognitiva en constante evolución que coordina miles de agentes especialistas para cazar, predecir y neutralizar amenazas en milisegundos.

Estos productos de proveedores formalizan una realidad incómoda: si los atacantes pueden programar y escalar operaciones con agentes, los defensores también deben aprovechar los enfoques agénticos para el monitoreo, la correlación y la contención automatizada. Las compensaciones arquitectónicas son significativas. Los sistemas de defensa agénticos prometen una respuesta más rápida y una menor fatiga para los analistas, pero introducen sus propias cuestiones de gobernanza: ¿quién controla a los agentes defensivos?, ¿cómo se auditan sus decisiones? y ¿cómo evitan las organizaciones crear nuevos objetivos de alto valor (planos de control de agentes, registros de auditoría) para los atacantes?

Reforzando la capa de identidad y gobernanza

Varias medidas prácticas están surgiendo como controles básicos para las organizaciones que desean desplegar o tolerar agentes internos de forma segura:

Inventariar las identidades no humanas y exigir atestación: registrar cada agente, asociarlo con un propietario y requerir una atestación periódica de su propósito y alcance.
Usar tokens efímeros y credenciales de corta duración: reducir el radio de impacto en caso de que un token sea robado o se abuse de él.
Instrumentar la procedencia y la auditabilidad: vincular las acciones de los agentes a cadenas de delegación verificables y registros inmutables para que la reversión y el análisis forense sean factibles.
Limitar la tasa y detectar anomalías en el tráfico de los agentes: señalar volúmenes de solicitudes inusuales, patrones de ráfagas o secuencias de uso de herramientas que coincidan con los motivos de los atacantes descritos en informes recientes.
Segmentar y microsegmentar activos críticos: condicionar el movimiento lateral y el acceso a datos de alto valor a controles adicionales y aprobaciones de múltiples partes.

Estos pasos se alinean con los principios más amplios de Zero Trust, pero requieren políticas y herramientas adicionales en torno a la gestión del ciclo de vida de los agentes: cómo se crean, actualizan, retiran y monitorean.

Por qué esto es importante más allá de los ataques que acaparan titulares

La IA agéntica reduce las barreras de coste y de habilidad para las operaciones cibernéticas complejas. Esto tiene dos consecuencias previsibles. Primero, más adversarios —incluyendo grupos criminales menos experimentados— pueden montar campañas que antes requerían equipos de élite. Segundo, el ritmo de las operaciones se acelera: el reconocimiento, el desarrollo de exploits y la exfiltración pueden iterarse en minutos en lugar de semanas. Ambas tendencias multiplican el número de incidentes que los defensores deben detectar y contener.

Al mismo tiempo, la IA agéntica es una tecnología de doble uso. Empresas como Anthropic enfatizan que las mismas capacidades que permiten el mal uso son valiosas para la defensa automatizada, el análisis de incidentes y la caza de amenazas. El efecto neto es una carrera armamentista en la que tanto atacantes como defensores adoptan patrones agénticos, mientras que los reguladores, los proveedores de la nube y las grandes empresas intentan establecer barreras de seguridad para la seguridad y la rendición de cuentas.

Perspectivas futuras: políticas, estándares e inteligencia compartida

Los controles técnicos mitigarán muchos ataques, pero el problema también exige una política coordinada. Los estándares de la industria para la procedencia de los agentes, los estándares de tokens que codifiquen la intención y el alcance, y un mejor intercambio de información sobre las TTP (tácticas, técnicas y procedimientos) basadas en agentes reducirán la probabilidad de daños generalizados. Los proveedores de la nube y los anfitriones de modelos ya desempeñan un papel central en este ecosistema: los controles de acceso, las opciones de integración de herramientas y las funciones de seguridad de los modelos (por ejemplo, barreras de seguridad y marcas de agua) serán palancas importantes.

Para los equipos de seguridad, la conclusión inmediata es clara: tratar la IA agéntica como una nueva clase de identidad y una superficie de ataque distinta. Inventariarla, gobernarla, monitorearla y, donde sea posible, utilizar la detección agéntica para recuperar parte de la ventaja de velocidad que los atacantes acaban de ganar. Sin estos cambios, las organizaciones corren el riesgo de ser superadas por adversarios automatizados que operan con una velocidad, escala y sofisticación sin precedentes.

Fuentes

Anthropic (informe técnico: "Disrupting the first reported AI-orchestrated cyber espionage campaign", 13 de noviembre de 2025)
(anuncio del producto ATLAS, 18 de diciembre de 2025)
Sublime Security (anuncio de financiación Serie C y defensa de correo electrónico agéntica, 28 de octubre de 2025)
Entrevista técnica de Fortinet y Google sobre identidad y Zero Trust (entrevista de la industria, 19 de diciembre de 2025)

El ataque de los agentes de IA: velocidad, escala y sofisticación

Cuando las máquinas se encargan del hackeo

Cómo se desarrolló la campaña de Anthropic

Reacción de la industria: replantear la identidad y la confianza

Defensa autónoma: los proveedores también apuestan por lo agéntico

Reforzando la capa de identidad y gobernanza

Por qué esto es importante más allá de los ataques que acaparan titulares

Perspectivas futuras: políticas, estándares e inteligencia compartida

Fuentes

Tags

Mattias Risberg

Readers Questions Answered

Have a question about this article?

Comments