Retour au feed
arXiv cs.AI·

Task Abstention for Large Language Models in Code Generation

Signal
72
Hype
18
En 3 lignesMéthode pour que les LLM refusent de générer du code quand ils risquent d'halluciner. Utilise une règle d'abstention calibrée basée sur le test d'hypothèses multiples, évalue la cohérence via l'exécution du code. Garantie théorique distribution-free. Testé sur plusieurs LLM open-source.
Lire la source
Ton avis ?
Génération de codeSécurité IAÉvaluationsPapers

Résumé généré par Claude — vérifié par l'humain