Daily Shaarli

All links of one day in a single page.

January 4, 2024

awesome-ai-agents: A list of AI autonomous agents
thumbnail

Une awesome liste autour des Agents LLM

CrewAI - a framework for orchestrating role-playing, autonomous AI agents.
thumbnail

Un framework un Python qui permet de définir plusieurs Agents puis de leur demander de se coordonner pour résoudre une tâche.

Ils ont notamment une démo assez avancée de génération de landing page avec GPT4 https://github.com/joaomdmoura/crewAI-examples/tree/main/landing_page_generator

Tusk | AI Engineer for Your Product Team

Un autre Agent capable d'écrire du code frontend simple.

Ils proposent un système de ticketing ou des product manager peuvent décrire leurs tickets pour qu'ils soient réalisés par les Agents.

Inkeep - Answer developer questions, instantly.
thumbnail

Un RAG de recherche dans une documentation.

Ça permet de faire une recherche "instantanée" comme avec Algolia par exemple mais aussi un RAG avec réponse en langage naturel à partir des sources/

Big translators layoff at Duolingo

Duolingo a viré la plupart de ses traducteurs car ils utilisent maintenant GPT4.

Le métier de traducteur est en grosse difficulté face aux avancées de la traduction automatique.

Il faut entre 2 et 10 fois moins de personnes pour relire les traductions de l'IA.

De plus en plus de grosses boites traduisent tout leur contenu dans des dizaines de langues sans faire relire par des humains. Github et Microsoft font ça pour toute leur documentation technique par exemple

kapa.ai - ChatGPT for your developer-facing product
thumbnail

Un autre outil de RAG pour la documentation orienté développeurs.

C'est utilisable autant pour les questions internes d'une équipe sur son produit que par des développeurs externes intégrant des API.

OpenVoice: Instant voice cloning by MyShell.
thumbnail

Un modèle de génération de voix capable de cloner les voix.

AppAgent: Multimodal Agents as Smartphone Users, an LLM-based multimodal agent framework designed to operate smartphone apps.
thumbnail

Un Agent capable de manipuler les interfaces graphiques d'un smartphone Android.

Ils utilisent GPT4 pour la réflexion et GPT4V pour la reconnaissance d'image. En connectant l'Agent à un smartphone avec ADB, ils sont capable d'exécuter des actions de clique ou de swipe.

L'Agent inclue un mode "exploration" ou il va interagir en autonomie avec l'application afin de découvrir les fonctionnalités.

Cela ouvre beaucoup de nouvelles possibilités, notamment autour du testing des applications Android.