Search: [papers] - Dernières news des IA Génératives

Chain-of-Table: Evolving Tables in the Reasoning Chain for Table Understanding

Les auteurs proposent une méthode dédiée à l'analyse de données structurées en tableaux. La méthode permet de générer des opérations sur la table en fonction de la question qui permet de transformer les données pour répondre à la question. Grâce à cette chaine d'opérations qui modifient les données itérativement, le LLM parvient à trouver la bonne réponse à l'inverse des méthodes classiques qui analysent directement les données ou génèrent du SQL.

text-ai · papers

January 12, 2024 at 08:46:32 UTC * · permalink

·

https://arxiv.org/pdf/2401.04398.pdf

From Google Gemini to OpenAI Q* (Q-Star): A Survey of Reshaping the Generative Artificial Intelligence (AI) Research Landscape

Une étude synthétisant plus de 300 travaux dans le domaine de l'IA Générative, faisant un état des lieux complet de la recherche de ces dernièeres années, et les évolutions futures. L'étude se focalise sur les avancements dans le domaine des Mixture of Experts, de l'apprentissage multimodale et les avancées spéculatives en AGI.

survey · papers · survey-ai

December 28, 2023 at 12:26:35 UTC * · permalink

·

https://arxiv.org/pdf/2312.10868.pdf

Retrieval-Augmented Generation for Large Language Models: A Survey

Une étude qui récapitule l'ensemble des paradigmes du RAG: le RAG "naïf", les techniques de RAG avancées et le RAG modulaire.

survey-ai · papers

December 26, 2023 at 20:45:21 UTC * · permalink

·

https://arxiv.org/pdf/2312.10997.pdf

Ferret: le MLLM d'Apple

Apple sort un MLLM, Multimodal Large Language Model, capable de comprendre les relations entre les objets d'une image.

image-ai · papers

December 23, 2023 at 19:41:49 UTC * · permalink

·

https://github.com/apple/ml-ferret

AppAgent: Multimodal Agents as Smartphone Users

Les auteurs proposent dans ce papier un framework pour pouvoir contrôler des applications sur un smartphone à partir d'agents. L'outil utilise GPT-4 vision pour analyser les applications et les contrôler. L'utilisateur peut exprimer ses besoins avec un simple prompt ("retouche moi cette photo pour la rendre belle", "envoi un mail...", etc.

image-ai · papers

December 23, 2023 at 12:42:52 UTC * · permalink

·

https://arxiv.org/pdf/2312.13771.pdf