Search: [video-ai] - Dernières news des IA Génératives

Luma Dream Machine

Luma AI sort un modèle de génération vidéo d'une qualité comparable à Sora de OpenAI.

Il reste encore des limitations, notamment sur la représentation du mouvement, des objets qui changent entre les frames ou la difficulté à représenter du texte mais le résultat est déjà de très bonne qualité !

La course aux modèles de génération vidéo semble être lancée mais j'ai l'intuition qu'il y aura beaucoup moins de participants que pour le texte ou l'image car les coûts d'entraînement GPU de ces modèles vidéo sont exorbitants

video-ai

June 12, 2024 at 23:03:14 UTC · permalink

·

https://lumalabs.ai/dream-machine

VASA-1 - Microsoft Research

Un modèle d'IA capable de réaliser des clips vidéos de têtes de personnes en incluant des mouvements avancés du visage comme des émotions.

En entrée, il lui suffit d'une image et d'un clip audio.

Impressionnant et en même temps ça fait peur pour les deepfakes

video-ai

April 18, 2024 at 23:02:35 UTC * · permalink

·

https://www.microsoft.com/en-us/research/project/vasa-1/

Open-Sora-Plan: This project aim to reproduce Sora (Open AI T2V model)

Un modèle open source de Text to Video.

Pour l'instant les vidéos générées sont soit courtes en 1024 (<3sec), soit plus longues en 512 (<10sec)

La cohérence de génération n'est pas parfaite non plus mais c'est un bon début!

L'avantage de ce genre de modèle Open Source c'est que la génération offrira beaucoup plus de contrôle qu'avec les modèles "API only" comme Sora.

video-ai · open-source

April 9, 2024 at 23:10:51 UTC · permalink

·

https://github.com/PKU-YuanGroup/Open-Sora-Plan

SadTalker: Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation

Un modèle d'animation des lèvres.

video-ai

April 7, 2024 at 19:31:12 UTC · permalink

·

https://sadtalker.github.io/

Sora - Text to video - OpenAI

Le nouveau modèle de OpenAI pour générer des vidéos.

Ça génère des vidéo de plus d'une minute quasiment sans artefact visible et avec un cohérence complètement maîtrisée entre les trames. C'est juste impressionnant.

Encore une fois OpenAI sort un modèle ayant plusieurs mois d'avance sur ses concurrents

video-ai

April 7, 2024 at 19:31:11 UTC · permalink

·

https://openai.com/sora

FMA-Net: Flow-Guided Dynamic Filtering and Iterative Feature Refinement with Multi-Attention for Joint Video Super-Resolution and Deblurring

Un modèle pour enlever le flou des vidéos.

video-ai

January 15, 2024 at 23:02:39 UTC · permalink

·

https://kaist-viclab.github.io/fmanet-site/

VideoPoet: A large language model for zero-shot video generation

Google sort un nouveau modèle de génération de vidéo.

Le modèle est capable de conserver le style entre chaque image de la séquence pour créer de courtes vidéo.

VideoPoet fonctionne à partir d'un prompt seul ou même une image et d'un prompt.

Toutes les démo sont visibles ici https://sites.research.google/videopoet/

video-ai

December 25, 2023 at 23:02:57 UTC * · permalink

·

https://blog.research.google/2023/12/videopoet-large-language-model-for-zero.html?m=1

Understanding Mixture of Experts

Le nouvel modèle de Mistral AI est un LLM composé de 8 modèles de 7B exploitant ainsi, probablement, l'architecture Mixture of Experts: https://twitter.com/MistralAI/status/1733150512395038967
Il a été d'ailleurs été établi que GPT-4 est un modèle composé de 8 modèles de 220 milliards de paramètres avec un modèle "router" permettant de choisir entre un de ces 8 experts.

Cette vidéo est une présentation complète du concept de Mixture of Experts.

text-ai · video-ai

December 10, 2023 at 19:10:36 UTC * · permalink

·

https://www.youtube.com/watch?v=0U_65fLoTq0