Improving BM25 Code Retrieval Under Fixed Generic Tokenization: Adaptive q-Log Odds as a Drop-In BM25 Fix
Signal
72
Hype
15
En 3 lignesAmélioration de BM25 pour la récupération de code via une transformation q-logarithmique de l'IDF (Indice de Fréquence Inverse). Sur CoIR CodeSearchNet Go, NDCG@10 passe de 0.2575 à 0.4874 (+89.3%). La méthode est un drop-in fix sans coût de latence, paramétrée par la densité hapax du corpus.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain