Daily Shaarli

All links of one day in a single page.

April 10, 2024

Tarifs de l'API Gemini  |  Google AI for Developers

Gemini 1.5 est disponible pour le grand publique.

Non seulement le modèle est très prometteur sur une fenêtre de tokens très entendue (jusqu'à 1 millions de tokens !) mais en plus il est moins cher que GPT4 Turbo avec 7$ vs 10$ le million de tokens en input et 21$ vs 30$ le million de tokens en output.

On retiendra bien sûr la meilleur performance à moindre coût mais on retiendra aussi l'avance de OpenAI qui a sorti GPT 4 il y a 18 mois et GPT4 Turbo il y a 6 mois.

Bref, Gemini est le meilleur modèle de 4e génération jusqu'à l'arrivée de GPT5.

Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs

Un modèle multi-modal créé par Apple qui se spécialise dans la compréhension des UI mobile et autres interfaces graphiques.

Dans la même veine, il y a aussi CogVML

auto-code-rover: Autonomous program improvement

Un autre Agent capable de résoudre des issues GitHub.

Ils font mieux que Devin (13%) avec 22% des issues du SWE-bench résolues