adversariële prompts
Technieken die invoer manipuleren om onveilig of ongewenst gedrag bij modellen uit te lokken.
Articles about adversariële prompts
AI Agents Orchestrate First Large-Scale Cyberattack
Militant Groups Embrace AI Tools
Senators Warn After AI-Driven Cyberattack