Retour au feed
Reddit r/MachineLearning·

Tested chunking + embeddings data from 3 production websites. [P]

Signal
72
Hype
15
En 3 lignesÉtude empirique de RAG sur 3 sites en production (Intercom, HubSpot, KPMG) avec chunking et embeddings tiérés. Résultats : 31% de chunks HIGH/MEDIUM chez Intercom, 32% HubSpot, 8% KPMG. Pondération par tier (HIGH ×1.20) réordonne le top-k. Métrique proposée : « yield score » prédit la qualité du corpus avant génération.
Lire la source
Ton avis ?
RAGEmbeddingsÉvaluations

Résumé généré par Claude — vérifié par l'humain