Search: [text-ai] - Dernières news des IA Génératives

Meta Llama 3

On attendait l'annonce de Meta sur la sortie de LlaMa 3 (8B et 70B) et c'est maintenant chose faite :-)

Pas trop de surprise avec un modèle aux performances similaires que tous les autres gros modèles de 4e génération comme GPT4 Turbo, Claude 3 Opus, Mistral 8x22B et Gemini 1.5.

Par contre pour l'instant la fenêtre de contexte n'est que de 8K tokens ce qui est très peu comparer à ce qu'il se fait maintenant. On peut s'attendre à une mise à jour du modèle dans les prochaines semaines pour améliorer ça.

Un autre très bon modèle open source qui aura sa carte à jouer dans les prochains mois avec l'entrainement et le fine tuning de modèles.

Sinon dans les annonces, il y aurait aussi un modèle à 400B paramètres de prévu ce qui est énorme

text-ai · open-source

April 18, 2024 at 23:02:35 UTC * · permalink

·

https://llama.meta.com/llama3/

Mistral 8x22B - Cheaper, Better, Faster, Stronger

Mistral release leur nouveau modèle.

C'est le modèle qui présente le meilleur ratio performances / coût. Bien meilleur que le modèle Command R+ de Cohere par exemple.

Les performances sont bien en dessous de GPT 4 et Claude 3 Opus

Ça reste néanmoins le meilleur modèle Open Source et donc une très bonne base pour du fine tuning par exemple

text-ai · open-source

April 17, 2024 at 23:02:56 UTC * · permalink

·

https://mistral.ai/fr/news/mixtral-8x22b/

Understanding OpenAI’s “Temperature” and “Top_p” Parameters in Language Models

Les paramètres "temperature" et "top_p" contrôlent les choix fait par le LLM pour choisir les tokens les plus probable lors de la génération.

Plus la température est haute, plus le LLM sera à même de choisir des tokens ayant une faible probabilité d'apparaitre.

Top_p définit le nombre de tokens considérés pour la génération, ainsi une valeur élevé permettra au LLM de choisir parmi plus de mots.

prompt-engineering · text-ai

April 16, 2024 at 23:02:32 UTC * · permalink

·

https://medium.com/@1511425435311/understanding-openais-temperature-and-top-p-parameters-in-language-models-d2066504684f

New GPT4 Turbo 2024-04-09

OpenAI sort sa dernière version du modèle GPT4 Turbo avec des performances sensiblement meilleures

Il faut maintenant utiliser le modèle gpt-4-turbo pour être sur de pointer sur la dernière version en date (9 avril 2024).

Les modèles GPT 4 turbo preview ne devraient plus être utilisés.

text-ai

April 14, 2024 at 17:12:51 UTC * · permalink

·

https://platform.openai.com/docs/models/gpt-4-turbo-and-gpt-4

Tarifs de l'API Gemini | Google AI for Developers

Gemini 1.5 est disponible pour le grand publique.

Non seulement le modèle est très prometteur sur une fenêtre de tokens très entendue (jusqu'à 1 millions de tokens !) mais en plus il est moins cher que GPT4 Turbo avec 7$ vs 10$ le million de tokens en input et 21$ vs 30$ le million de tokens en output.

On retiendra bien sûr la meilleur performance à moindre coût mais on retiendra aussi l'avance de OpenAI qui a sorti GPT 4 il y a 18 mois et GPT4 Turbo il y a 6 mois.

Bref, Gemini est le meilleur modèle de 4e génération jusqu'à l'arrivée de GPT5.

text-ai

April 10, 2024 at 23:03:51 UTC · permalink

·

https://ai.google.dev/pricing?hl=fr

FreeAskInternet is a completely free, private and locally running search aggregator & answer generate using LLM

Un projet qui propose une interface de recherche à la Perplexity en local et 100% gratuit en se basant sur l'API publique de ChatGPT.

En gros ça permet de répondre à vos questions en agrégeant les résultats des moteurs de recherche comme un RAG

text-ai

April 9, 2024 at 23:10:50 UTC · permalink

·

https://github.com/nashsu/FreeAskInternet

L’IA Générative au service de la pédagogie

Un article que j'ai écrit sur l'utilisation des LLMs chez Didask et plus généralement sur la manière dont on peut donner des instructions précises à des LLMs pour en faire des experts capables d'exécuter des tâches précises.

Je parle aussi de quelques unes de nos techniques de Prompt Engineering :-)

text-ai

April 8, 2024 at 23:10:37 UTC · permalink

·

https://www.didask.com/post/au-dela-de-chatgpt-lia-generative-au-service-de-la-pedagogie

huggingface/text-generation-inference: Revert license to Apache 2.0

Huggingface passe son moteur d'inférence texte en Apache 2.

C'est une excellente nouvelle car c'est cette techno qui fait tourner HuggingFace.

Ça permet de servir des modèles à travers une API. C'est un Python et en Rust et de gros efforts ont été fait sur la scalabilité.

Cela permet à tout le monde de déployer un système d'inférence robuste au sein de son infrastructure.

text-ai

April 8, 2024 at 23:10:37 UTC · permalink

·

https://github.com/huggingface/text-generation-inference/pull/1714

JetMoE: Reaching LLaMA2 Performance with 0.1M Dollar

Le coût d'entrainement des LLMs a drastiquement baissé en seulement quelques mois.

JetMoE offre des performances similaires à Llama 2 mais avec un coût d'entrainement de seulement 100 000$ vs 5 000 000$ pour Llama 2.

text-ai · training-ai

April 7, 2024 at 19:31:14 UTC · permalink

·

https://research.myshell.ai/jetmoe

Long-context LLMs Struggle with Long In-context Learning

Une étude sur les performances des LLMs sur de longs contexte.

Même si les LLMs supportent des contextes très long maintenant, ce n'est pas un secret que plus il y a de token et moins le LLM est performant.

Dans leur benchmark, GPT4-Turbo s'en sort mieux que les autres mais ils n'ont pas testé Claude 3 ou Gemini 1.5.

Dans un autre benchmark, Gemini 1.5 arrivait à de meilleurs résultats que GPT4-Turbo avec un très long contexte

Ils ont créé un benchmark pour continuer à analyser les performances des LLMs sur de long contextes: LongICLBench

text-ai

April 7, 2024 at 19:31:14 UTC · permalink

·

https://arxiv.org/pdf/2404.02060.pdf

NVIDIA ChatRTX

Nvidia se fait de la pub en lançant une application de RAG locale qui utilise un de ses GPU pour fonctionner.

Sous le capot c'est Llama 2 et une simple DB vectorielle (Faiss).

Bref, plus une démo marketing qu'un vrai produit :-)

text-ai · retrieval-augmented-generation

April 7, 2024 at 19:31:13 UTC · permalink

·

https://www.nvidia.com/en-us/ai-on-rtx/chatrtx/

I've put a complex codebase into a single 120K-token prompt, and asked 7 questions GPT-4 and Gemini 1.5. Here are the results! : singularity

A priori le modèle Gemini de Google s'en sort beaucoup mieux sur des prompts long.

Ici l'auteur pose des question avec la totalité de sa code base dans les 120K tokens du prompt

text-ai

April 7, 2024 at 19:31:13 UTC · permalink

·

https://old.reddit.com/r/singularity/comments/1atjz9v/ive_put_a_complex_codebase_into_a_single/

AutoRFP.ai Pricing

Un Agent LLM qui aide à répondre automatiquement aux questionnaires des grandes entreprises quand on leur vend des solutions SaaS par exemple

text-ai

April 7, 2024 at 19:31:13 UTC · permalink

·

https://autorfp.ai/pricing

Air Canada Has to Honor a Refund Policy Its Chatbot Made Up

Un chatbot d'Air Canada s'est trompé en conseillant une procédure de remboursement rétro-active qui n'existait pas à un client.

Une court a jugé Air Canada responsable de ce que sont chatbot disait.

Moralité attention à ce qu'il sort des LLMs car vous pourrez être tenu responsable

text-ai

April 7, 2024 at 19:31:12 UTC · permalink

·

https://www.wired.com/story/air-canada-chatbot-refund-policy/

Introducing Gemini 1.5, Google's next-generation AI model

Gemini 1.5 arrive avec une fenêtre de contexte jusqu'à 1 million de tokens !

Les performances restent très bonnes malgré la masse de tokens avec 99% de succès au problème de trouver une chaîne de caractère dans le prompt (Needle in a Haystack)

La latence et le prix d'un tel prompt va continuer à pousser les gens vers du RAG pour le moment mais c'est quand même une prouesse technique inimaginable il y a moins d'un an.

text-ai

April 7, 2024 at 19:31:11 UTC · permalink

·

https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/#performance

Self-Rewarding Language Models

Des recherches sur un modèle capable de s'entrainer lui même en se fournissant du feedback à lui même.

Ça me fait penser à de l'apprentissage non-supervisé mais appliqué aux LLMs

text-ai

April 7, 2024 at 19:31:11 UTC · permalink

·

https://huggingface.co/papers/2401.10020

voyage-code-2: Elevate Your Code Retrieval

Voyage AI propose des modèles d'embeddings plus performants que ceux de OpenAI.

Ils sont premier du leaderboard MTEB avec leur modèle voyage-lite-02-instruct (67.13 vs 64.59 pour OpenAI), un benchmark qui mesure la performance de la recherche par embeddings.

Leur nouveau modèle d'embeddings, voyage-code-2, est meilleur que les précédents mais en plus à une fenêtre de contexte de 16K token!

Ce modèle est spécialisé pour le code mais offre aussi de très bonnes performances pour le texte normal

text-ai · embeddings

January 28, 2024 at 23:03:09 UTC · permalink

·

https://blog.voyageai.com/2024/01/23/voyage-code-2-elevate-your-code-retrieval/

New embedding models and API updates

OpenAI dévoile plusieurs nouveautés et particulièrement un nouveau modèle d'embeddings (ada2 datait de fin 2022).

Le modèle est décliné en deux versions:

text-embedding-3-small: 1536 dimensions, 62.3 MTEB
text-embedding-3-large: 3072 dimensions, 64.6 MTEB

Le modèle large est en 4è position du classement MTEB. (Ada2 était à 61 MTEB)

Le prix du small est 5x moins cher que Ada2 (0.00002$ 1K token) et le large est ~ le même prix (0.00013$ pour 1K token)

La fenêtre de contexte est toujours de 8196 token, ce qui est toujours peu par rapport à celle des embeddings VoyageAI (16K) ou même de GPT4

text-ai · embeddings

January 28, 2024 at 23:03:08 UTC · permalink

·

https://openai.com/blog/new-embedding-models-and-api-updates

Poisoned AI went rogue during training and couldn't be taught to behave again in 'legitimately scary' study | Live Science

Dee recherches menées sur l'exploitation des LLMs en tant que vecteur d'attaque.

Des techniques similaire à de l'obfuscation permettent d'apprendre au modèle à cacher ses intention malicieuse.

Par exemple durant les phases de validation, le code généré sera normal puis à partir d'une certaine date le code généré sera malicieux.

Cela peut aussi être déclenché par une instruction spéciale dans le prompt

text-ai · cybersecurite

January 27, 2024 at 23:03:42 UTC · permalink

·

https://www.livescience.com/technology/artificial-intelligence/legitimately-scary-anthropic-ai-poisoned-rogue-evil-couldnt-be-taught-how-to-behave-again

IA. Le bot du Pôle emploi autrichien refuse d’orienter les femmes vers l’informatique

Les biais des LLMs peuvent être très marqués et avoir des conséquences en fonction de l'utilisation faite du LLM.

text-ai

January 24, 2024 at 23:03:11 UTC · permalink

·

https://www.courrierinternational.com/article/ia-le-bot-du-pole-emploi-autrichien-refuse-d-orienter-les-femmes-vers-l-informatique?at_campaign=partage_article_app&at_medium=android