Topic

#Recherche vectorielle

La recherche vectorielle consiste à retrouver des données similaires en comparant leurs représentations numériques (embeddings) dans un espace mathématique. Pinecone, par exemple, est une base de données spécialisée dans ce type de recherche.

40Articles

11Sources

66Signal moyen

arXiv cs.CL·18 juin

Lost in a Single Vector: Improving Long-Document Retrieval with Chunk Evidence Aggregation

DICE améliore la récupération de documents longs en fragmentant le texte, encodant chaque chunk indépendamment, puis agrégant les vecteurs en une seule représentation. Sur LongEmbed, les gains atteignent 90.0 pour Dream Passkey >4k (vs 30.0) et 74.0 pour Needle >4k (vs 23.3). L'approche réduit l'indice de dilution d'évidence (EDI) dans 92.8% des cas.

RAG Embeddings Recherche vectorielle

SIG

HYP

arXiv cs.AI·15 juin

Hyperdimensional computing for structured querying on tabular data embeddings

Approche utilisant Hyperdimensional Computing (HDC) et Holographic Reduced Representations pour embeddings de données tabulaires. Dérive des seuils de similarité interprétables pour requêtes structurées (égalité/inégalité), évalue sur deux datasets réels contre baseline EmbDI. HDC détecte fiablement les requêtes sans résultats.

Embeddings Recherche vectorielle Papers

SIG

HYP

Reddit r/LocalLLaMA·11 juin

I built a graph-memory layer on top of turbovec for local/constrained RAG — looking for feedback

Développeur propose turbo-graph, fork de turbovec ajoutant une couche GraphMemoryIndex pour RAG contraint en local. Adresse limitations du search vectoriel pur : filtres tenant, contraintes temporelles/tags, voisinages graphe, rerank, explicabilité. Alpha, ciblé RAG privé où les contraintes sont critiques.

RAG Recherche vectorielle Open source

SIG

HYP

arXiv cs.CL·11 juin

When More Documents Hurt RAG: Mitigating Vector Search Dilution with Domain-Scoped, Model-Agnostic Retrieval

RAG se dégrade sur collections hétérogènes : la recherche vectorielle perd sa capacité discriminante (Wyoming DOT : 75% → 40% en passant de 54 à 1 128 docs). MASDR-RAG propose le domain scoping via métadonnées organisationnelles, améliorant P@10 de 0,77 à 0,86 (p<0,05). Multi-agent orchestration crée un paradoxe précision-fidélité.

RAG Recherche vectorielle Multi-agents

SIG

HYP

GitHub Trending·9 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> chroma-core /</span> chroma

Chroma est une infrastructure de recherche vectorielle pour applications IA. Le projet GitHub trending propose des outils de stockage et requête de vecteurs d'embeddings pour RAG et systèmes basés sur des modèles de langage.

Recherche vectorielle Embeddings RAG

SIG

HYP

Reddit r/MachineLearning·8 juin

Memanto vs SQLite R_A_G Benchmark Results - Cloud vs Local Memory Systems [P]

Benchmark comparatif entre Memanto (système mémoire cloud) et SQLite RAG custom sur le dataset LoCoMo. Memanto atteint 90% de précision en 1.878s vs 80% en 2.680s pour SQLite. L'analyse révèle que SQLite souffre de limites API (HTTP 429), tandis que Memanto bénéficie d'une architecture découplée résiliente aux quotas partagés.

RAG Benchmarks Recherche vectorielle

SIG

HYP

GitHub Trending·7 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> RyanCodrai /</span> turbovec

TurboVec est un index vectoriel construit sur TurboQuant, écrit en Rust avec liaisons Python. Optimisé pour les recherches vectorielles haute performance.

Recherche vectorielle Embeddings Open source

SIG

HYP

GitHub Trending·7 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> RyanCodrai /</span> turbovec

TurboVec est un index vectoriel construit sur TurboQuant, écrit en Rust avec liaisons Python. Optimisé pour la recherche vectorielle haute performance.

Recherche vectorielle Embeddings Open source

SIG

HYP

arXiv cs.CL·5 juin

Executable Schema Contracts: From Automatic Ingestion to Multi-Source Retrieval

Système automatisant la découverte de schémas exécutables à partir de données multi-sources hétérogènes (tables, documents, fichiers semi-structurés). Le schéma sert de contrat partagé pour construire un graphe de connaissances et router les requêtes via un agent multi-outils (recherche structurée, traversée de graphe, vector search). Améliore les baselines sur quatre benchmarks QA en zéro-shot.

RAG Agents IA Multi-agents

SIG

HYP

Hacker News (AI)·4 juin

Inside FAISS: Billion-Scale Similarity Search

Article technique sur FAISS, la bibliothèque Meta pour la recherche de similarité à l'échelle du milliard. Couvre l'architecture interne, les algorithmes d'indexation et les optimisations pour requêtes massives.

Recherche vectorielle Embeddings Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·4 juin

I Built a Practical Guide to LLM Engineering: RAG, Retrieval, Rerankers, and Evaluation

Guide pratique open-source sur les patterns d'ingénierie LLM : RAG, recherche hybride, rerankers, évaluation. Couvre pré-filtrage, scoring en mémoire vs bases vectorielles, batching, nettoyage. Exemples Python inclus. L'auteur souligne que la qualité du harness d'ingénierie égale celle du modèle pour les solutions en production.

RAG Recherche vectorielle Embeddings

SIG

HYP

arXiv cs.AI·1 juin

Vector Linking via Cross-Model Local Isometric Consistency

Méthode pour établir des correspondances entre vecteurs d'embeddings produits par différents encodeurs. Exploite la cohérence géométrique locale des encodeurs contrastifs entraînés indépendamment : les distances courtes sont préservées à un facteur d'échelle près. Utilise un hachage géométrique itératif basé sur des ancres appairées pour récupérer les liens vectoriels. Code disponible.

Embeddings Recherche vectorielle Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·29 mai

Comparing Vector search libraries

Benchmark comparatif de bibliothèques de recherche vectorielle (FAISS, Scann, Usearch) sur vitesse, mémoire et précision. Tests sur 500 à 1 million d'échantillons. Résultats et code disponibles sur GitHub.

Recherche vectorielle Benchmarks Open source

SIG

HYP

arXiv cs.CL·29 mai

OmniRetrieval: Unified Retrieval across Heterogeneous Knowledge Sources

OmniRetrieval est un framework qui unifie la récupération d'information sur des sources hétérogènes (texte non structuré, tables relationnelles, graphes de connaissances). Il traduit les requêtes en langage naturel en requêtes natives pour chaque source, testé sur 13 datasets et 309 bases de connaissances.

RAG Recherche vectorielle Papers

SIG

HYP

Vercel AI Blog·28 mai

Amazon OpenSearch Serverless is now available in the Vercel Marketplace

Amazon OpenSearch Serverless intègre la Vercel Marketplace avec configuration automatique et gestion unifiée. L'intégration supporte recherche vectorielle, lexicale, hybride et agentic. Crédits AWS $100 offerts pour les nouveaux comptes.

Agents IA Recherche vectorielle Infrastructure

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> meilisearch /</span> meilisearch

Meilisearch est un moteur de recherche API ultra-rapide offrant une recherche hybride alimentée par l'IA pour sites et applications.

Recherche vectorielle Embeddings Outils

SIG

HYP

Reddit r/LocalLLaMA·27 mai

I made a small tool to inspect retrieval results before feeding them into RAG

Outil local pour inspecter les résultats de recherche avant leur intégration dans un pipeline RAG. Analyse la diversité des sources, doublons, fraîcheur, risques SEO/GEO et différences entre fournisseurs (Brave, Serper, Tavily, Exa). Permet de filtrer les résultats non pertinents avant le contexte du modèle.

RAG Recherche vectorielle Outils

SIG

HYP

Reddit r/MachineLearning·26 mai

Tomesphere, 3M paper pages with TLDRs, peer reviews, code, and a SPECTER2 similarity graph [P]

Tomesphere indexe 3 millions de papiers arxiv/OpenAlex avec TLDRs Gemini, avis pairs OpenReview, repos GitHub, graphe de citations (250M arêtes) et graphe sémantique SPECTER2 (768D pgvector). Quatre modes de ranking : Influential, Recent, Hidden gems, Nearest. Extension Chrome pour arxiv. Accès gratuit, sans inscription.

Papers Embeddings Recherche vectorielle

SIG

HYP

Reddit r/MachineLearning·25 mai

Aiki my local Wikipedia Retrieval-Augmented Generation system [R]

Aiki est un outil léger de RAG local permettant de discuter avec Wikipedia hors ligne. Il télécharge et segmente les articles Wikipedia, utilise un retriever TF-IDF + cosine similarity personnalisé, supporte l'expansion de requêtes via liens Wikipedia, et génération optionnelle de réponses par LLM. Dépendances minimales, exécution entièrement locale.

RAG Recherche vectorielle Open source

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> qdrant /</span> qdrant

Qdrant est une base de données vectorielle haute performance conçue pour les applications IA à grande échelle. Disponible en open-source et en cloud.

Recherche vectorielle Embeddings Infrastructure

SIG

HYP

Latent Space·22 mai

[AINews] New AI Infra unicorns: Exa, Modal, TurboPuffer

Trois startups d'infrastructure IA atteignent le statut de licorne : Exa (recherche vectorielle), Modal (plateforme cloud) et TurboPuffer (cache distribué). Levées de fonds majeures confirmant la consolidation du marché de l'infra IA.

Infrastructure Financements Recherche vectorielle

SIG

HYP

arXiv cs.CL·21 mai

DIVE: Embedding Compression via Self-Limiting Gradient Updates

DIVE compresse les embeddings de LLM via des adaptateurs légers avec perte triplet auto-limitante et contrastive NT-Xent. Surpasse Matryoshka-Adaptor, Search-Adaptor et SMEC sur 6 datasets BEIR à tous les ratios de compression. Implémentation open-source 14M paramètres.

Embeddings Recherche vectorielle Papers

SIG

HYP

arXiv cs.CL·21 mai

Beyond Semantic Similarity: A Two-Phase Non-Parametric Retrieval Workflow for Corporate Credit Underwriting

Système RAG deux phases pour l'analyse de crédit corporate : phase 1 combine recherche lexicale et dense multilingue ; phase 2 applique contrôleur adaptatif et scoring LLM-as-Judge basé sur l'utilité analytique plutôt que similarité sémantique. Déploiement on-premise sur corpus multilingue propriétaire. En production : temps d'analyse réduit de plusieurs heures à 3 minutes pour 800+ analystes.

RAG Recherche vectorielle Embeddings

SIG

HYP

GitHub Trending·20 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> lance-format /</span> lance

Lance est un format lakehouse ouvert pour l'IA multimodale. Convertit depuis Parquet en 2 lignes de code avec accès aléatoire 100x plus rapide, indexation vectorielle et versioning. Compatible Pandas, DuckDB, Polars, PyArrow, PyTorch.

Recherche vectorielle Embeddings Open source

SIG

HYP

arXiv cs.AI·19 mai

RAG-based EEG-to-Text Translation Using Deep Learning and LLMs

Pipeline RAG pour décoder du texte à partir de signaux EEG en utilisant un encodeur EEG aligné sur des embeddings sémantiques, une étape de récupération vectorielle et un LLM. Sur le dataset ZuCo, la méthode surpasse la baseline aléatoire avec une similarité cosinus de 0.181±0.022 vs 0.139±0.029 (amélioration de 30.45%), sans teacher forcing à l'inférence.

RAG Embeddings Recherche vectorielle

SIG

HYP

arXiv cs.CL·19 mai

Infini-News: Efficiently Queryable Access to 1.3 Billion Processed Common Crawl News Articles

Infini-News indexe 1,35 milliard d'articles de CC-News (août 2016 à présent) avec extraction de métadonnées, détection de langue (GlotLID, lingua, CommonLingua) et attribution géographique (83,4% couverts). Les index Infini-gram permettent des recherches textuelles en sub-seconde sur l'archive complète.

RAG Recherche vectorielle Benchmarks

SIG

HYP

arXiv cs.AI·19 mai

Long Context Modeling with Ranked Memory-Augmented Retrieval

ERMAR (Enhanced Ranked Memory Augmented Retrieval) est un framework pour gérer efficacement les contextes longs dans les modèles de langage. Il utilise un mécanisme de scoring de pertinence et un modèle de re-ranking pointwise pour les embeddings clé-valeur, inspiré par les techniques learning-to-rank. Résultats SOTA sur benchmarks standards avec meilleure scalabilité.

RAG Raisonnement Benchmarks

SIG

HYP

arXiv cs.CL·19 mai

RAG-based EEG-to-Text Translation Using Deep Learning and LLMs

Pipeline RAG pour décoder du texte à partir de signaux EEG au niveau de la phrase. Combine un encodeur EEG aligné sur des embeddings sémantiques, une récupération vectorielle et un LLM pour raffiner les phrases. Sur le dataset ZuCo, amélioration de 30,45% vs baseline aléatoire (cosine similarity 0.181 vs 0.139).

RAG Embeddings Recherche vectorielle

SIG

HYP

arXiv cs.AI·19 mai

IVF-TQ: Streaming-Robust Approximate Nearest Neighbor Search via a Codebook-Free Residual Layer

IVF-TQ propose un index IVF avec couche résiduelle sans codebook : rotation aléatoire fixe + quantification scalaire Lloyd-Max précomputée. Réduit la dégradation en streaming (Deep-10M : -0.80pp vs IVF-PQ -3.23pp). Code disponible.

Recherche vectorielle Benchmarks Papers

SIG

HYP

arXiv cs.AI·19 mai

Surface-Form Neural Sparse Retrieval: Robust Fuzzy Matching for Industrial Music Search

Amazon Music déploie un système de récupération neurale sparse robuste pour la recherche musicale à grande échelle. Le système gère les fautes de frappe, transpositions et variations phonétiques avec 91,4% de recall@10 sur 6M documents, surpassant les trigrammes (57,7%). Architecture inference-free avec tokenization subword granulaire (max 3 chars) et zéro latence en ligne.

RAG Embeddings Recherche vectorielle

SIG

HYP

Hugging Face Blog·19 mai

Introducing the Ettin Reranker Family

Hugging Face présente la famille de modèles Ettin Reranker, conçus pour améliorer la pertinence des résultats de recherche et RAG. Ces rerankers optimisent le classement des documents après une première phase de récupération.

RAG Recherche vectorielle Outils

SIG

HYP

ActuIA·24 sept.

MongoDB ouvre la recherche vectorielle à ses éditions autogérées

MongoDB active la recherche vectorielle sur ses éditions autogérées (self-managed). L'annonce du 19 septembre lors de MongoDB.local NYC élargit l'accès aux capacités de recherche vectorielle au-delà des offres cloud.

Recherche vectorielle RAG Outils

SIG

HYP

Hugging Face Blog·4 sept.

Welcome EmbeddingGemma, Google's new efficient embedding model

Google lance EmbeddingGemma, un modèle d'embedding efficace basé sur Gemma. Le modèle offre des performances compétitives avec une empreinte mémoire réduite, optimisé pour les tâches de recherche vectorielle et RAG.

Gemini Embeddings RAG

SIG

HYP

OpenAI Blog·21 juin

OpenAI acquires Rockset

OpenAI acquiert Rockset, une plateforme de base de données vectorielles et d'indexation en temps réel. Cette acquisition renforce les capacités d'infrastructure d'OpenAI pour supporter ses applications IA à grande échelle.

Recherche vectorielle Infrastructure Business

SIG

HYP

Hugging Face Blog·22 mars

Binary and Scalar Embedding Quantization for Significantly Faster & Cheaper Retrieval

Hugging Face présente une technique de quantification des embeddings en binaire et scalaire pour accélérer et réduire les coûts de la recherche vectorielle. La méthode compresse les représentations denses tout en maintenant la qualité de la récupération d'information.

Embeddings Recherche vectorielle RAG

SIG

HYP

Hugging Face Blog·23 févr.

🪆 Introduction to Matryoshka Embedding Models

Hugging Face présente les modèles d'embedding Matryoshka, qui permettent de réduire dynamiquement la dimensionnalité des vecteurs sans réentraînement. Cette approche offre flexibilité et efficacité pour les applications RAG et recherche vectorielle.

Embeddings Recherche vectorielle RAG

SIG

HYP

OpenAI Blog·25 janv.

New embedding models and API updates

OpenAI lance de nouveaux modèles d'embedding et met à jour son API. Les modèles offrent une meilleure performance et des coûts réduits pour les applications de recherche vectorielle et RAG.

OpenAI Embeddings RAG

SIG

HYP

Hugging Face Blog·13 juil.

Building a Playlist Generator with Sentence Transformers

Hugging Face présente un générateur de playlist utilisant Sentence Transformers pour encoder les préférences musicales en vecteurs. Le système compare les embeddings des chansons et recommande des titres similaires via recherche vectorielle.

Embeddings Recherche vectorielle RAG

SIG

HYP

Hugging Face Blog·23 juin

Getting Started With Embeddings

Guide d'introduction aux embeddings : représentations vectorielles de texte, images ou données. Explique les cas d'usage (RAG, recherche sémantique, clustering) et comment utiliser les modèles d'embedding via Hugging Face.

Embeddings RAG Recherche vectorielle

SIG

HYP

Hugging Face Blog·16 mars

Image search with 🤗 datasets

Hugging Face intègre la recherche d'images dans sa plateforme datasets. Les utilisateurs peuvent désormais indexer et interroger des collections d'images via des embeddings vectoriels, facilitant la découverte et l'organisation de données visuelles à grande échelle.

Recherche vectorielle Embeddings Outils

SIG

HYP