prompts adversarios
Técnicas que manipulan las entradas para inducir comportamientos inseguros o no deseados en los modelos.
Articles about prompts adversarios
AI Agents Orchestrate First Large-Scale Cyberattack
Militant Groups Embrace AI Tools
Senators Warn After AI-Driven Cyberattack