Retour au feed
arXiv cs.CL·

Can Factual Opinions Be Edited (Manipulated) in Large Language Models?

Signal
72
Hype
28
En 3 lignesNouvelle étude arXiv sur l'édition de faits opinionnés dans les LLM. Benchmark FOE avec 261 personnalités publiques, 19 catégories de sujets, 2,178 enregistrements d'opinions. Les méthodes actuelles échouent à préserver la cohérence entre opinion éditée et preuves générées. Proposition d'une méthode Self-Generated Evidence-Aligned pour l'alignement opinion-preuves.
Lire la source
Ton avis ?
PapersÉvaluationsSécurité IAAlignement

Résumé généré par Claude — vérifié par l'humain