Logo LeBonLLM
Carnet de code et de réflexions autour de l’IA générative à la française
codecorpuscontributionsconversationscurationlexiquefaqrecherche
Communauté

Pour échanger, demandez l’accès au :

Infolettre

Nous avons le projet d’une infolettre, seriez-vous intéressé ?

Misc
XLinkedInMentions légales
Contact

Recherche sémantique avec DuckDB

05/06/2024

Tags : IA, AI, embeddings, RAG, duckdb

Date de récolte : [[2024-06-05-mercredi]]

A Hybrid information retriever with DuckDB

Mon avis :

J'ai sélectionné cet article avant tout parce que j'adore les embeddings et j'adore DuckDB, et qu'il combine les deux.

L'article présente la recherche hybride, c'est-à-dire qui combine recherche sémantique s'appuyant sur un embedding de chaque document sur lequel porte la recherche (ce qui ne marche qu'à condition que le modèle d'embedding soit capable de bien résumer un document en un seul vecteur), et recherche lexicale s'appuyant sur le plein texte de chaque document. DuckDB est utilisé comme backend pour stocker les embeddings, le plein texte, et calculer les meilleurs documents candidats pour chaque recherche.

URL : https://aetperf.github.io/2024/05/30/A-Hybrid-information-retriever-with-DuckDB.html