Search: [serverless] - Dernières news des IA Génératives

300 shaares

Filters

Links per page

20 50 100

3 results tagged serverless

GPUs Public Preview: Run AI workloads on H100, A100, L40S, and more

Koyeb est un cloud serverless assez moderne avec un scalling automatique en fonction de pleins de paramètres (RPS, active connections, latence, etc)

Ils proposent maintenant des GPU avec une facturation à la seconde !

C'est super pour l'inférence avec des modèles Open Source. Que ce soit des petits modèles sur un GPU à 0.5$/h ou un LlaMa 3 sur un H100 à 3.30$/h.

serverless

June 21, 2024 at 23:03:09 UTC · permalink

·

https://www.koyeb.com/blog/gpus-public-preview-run-ai-workloads-on-h100-a100-l40s-and-more

Modal - Cloud functions reimagined

Un cloud serverless qui fait tourner des fonctions Python.

Ils ont notamment tout un service de GPU à la demande pour faire tourner des tâches de ML comme de la transcription audio, de l'inférence, etc

Utile dans une démarche GenAI + cloud pour mieux maitriser les coûts

serverless

December 22, 2023 at 23:02:50 UTC * · permalink

·

https://modal.com/

Du nouveau dans Workers AI : bonjour Mistral 7B

Mistral 7B est disponible dans les workers de Cloudflare.

C'est une bonne nouvelle car ces worker sont distribués géographiquement et donc on peut espérer une latence d'inférence optimale n'importe ou dans le monde.

text-ai · serverless

November 22, 2023 at 23:02:40 UTC * · permalink

·

https://blog.cloudflare.com/fr-fr/workers-ai-update-hello-mistral-7b-fr-fr/