Daily Shaarli

All links of one day in a single page.

December 3, 2023

Better RAG with Active Retrieval Augmented Generation FLARE

Une autre méthode pour améliorer un RAG.

Ici après une première récupération et injection de documents, on va utiliser chaque phrase du LLM pour récupérer de nouveaux documents potentiels à ingérer lors de la génération.

Cela permet d'aller récupérer et injecter d'autres concepts qui ressortent lors des phases de restitution du LLM.

Advanced RAG: Precise Zero-Shot Dense Retrieval with HyDE

HyDE est une méthode pour améliorer la recherche d'un RAG.

Concrètement on prend la demande d'origine et on va générer plusieurs documents à partir de cette demande.

Ces documents vont avoir des champs sémantiques différents pour espérer retrouver un nombre plus importants de documents.

Par exemple, avec la demande suivante "Est-il possible d'ajouter un module de formation obligatoire à un utilisateur?"

Si on a 3 sources de données avec des profils rédacteurs différents alors on va demander à GPT de générer des réponses imaginaires:

  • Github: "écrit une réponse hypothétique à cette demande du point de vue d'un développeur"
  • Notion: "écrit une réponse hypothétique à cette demande du point de vue d'un Product Owner"