Retour au feed
arXiv cs.AI·

TriEval: A Resource-Efficient Pipeline for LLM Bias, Toxicity, and Truthfulness Assessment

Signal
72
Hype
25
En 3 lignesTriEval est un pipeline d'évaluation des LLM testant simultanément biais, toxicité et véracité avec ressources minimales. Compatible open-source et closed-source, il fonctionne sur laptop sans GPU. Testé sur Llama 3 8B, Mistral 7B, Gemma 2 9B et Claude Haiku, révélant des différences toxicité/véracité entre modèles.
Lire la source
Ton avis ?
ÉvaluationsSécurité IAOpen sourceLlamaMistral

Résumé généré par Claude — vérifié par l'humain