Retour au feed
arXiv cs.AI·

Improving BM25 Code Retrieval Under Fixed Generic Tokenization: Adaptive q-Log Odds as a Drop-In BM25 Fix

Signal
72
Hype
15
En 3 lignesAmélioration de BM25 pour la récupération de code via une transformation q-logarithmique de l'IDF (Indice de Fréquence Inverse). Sur CoIR CodeSearchNet Go, NDCG@10 passe de 0.2575 à 0.4874 (+89.3%). La méthode est un drop-in fix sans coût de latence, paramétrée par la densité hapax du corpus.
Lire la source
Ton avis ?
Génération de codeRAGBenchmarks

Résumé généré par Claude — vérifié par l'humain