arXiv cs.CL·19 mai 2026

Multilingual jailbreaking of LLMs using low-resource languages

Signal

Hype

En 3 lignesÉtude arXiv montrant que les conversations multi-tours en langues africaines peu dotées (afrikaans, kiswahili, isiXhosa, isiZulu) contournent les garde-fous de sécurité des LLM commerciaux. Tests sur ChatGPT, Claude, DeepSeek, Gemini et Grok révèlent des taux de jailbreak de 52,7% à 83,6% selon le modèle. La qualité de traduction est le facteur critique.

Lire la source

Ton avis ?

Sécurité IA Alignement Benchmarks Papers

Résumé généré par Claude — vérifié par l'humain

Multilingual jailbreaking of LLMs using low-resource languages

Autres angles sur ce sujet