Kyutai : avancées en IA générative et collaborations
Kyutai, laboratoire français d'IA, a évolué en 3 ans avec une équipe passant de 6 à 22 personnes. Il développe des technologies de pointe comme Moshi (voix), MoshiVis (vision) et des world models, utilisées par des entreprises comme CMA CGM et Nvidia.
« On s'est lancés il y a trois ans à six ; on est 22 aujourd'hui, des postdocs aux stagiaires. » — Journal du Net - IA
Que faut-il retenir ?
- Kyutai est passé de 6 à 22 personnes en 3 ans.
- Moshi, un prototype de recherche en speech-to-speech, a été développé par Kyutai.
- Le codec Mimi de Kyutai fonctionne à 12,5 hertz, un frame rate très bas.
- Nvidia utilise PersonaPlex, construit sur Moshi, pour ses applications.
Pourquoi cette nouvelle compte-t-elle ?
Kyutai montre comment un laboratoire open science peut influencer l'industrie avec des technologies comme Moshi et Mimi. Ses collaborations avec des entreprises majeures illustrent l'impact concret de ses recherches en IA générative.
12,5 hertz, le frame rate du codec Mimi de Kyutai.
💬 Alexandre Défossez, Cofondateur et chief exploration officer de Kyutai
Public concerné : entreprises, développeurs
Quelles sont les technologies développées par Kyutai ?
Kyutai a développé Moshi pour la voix, MoshiVis pour la vision et le codec Mimi. Ces technologies sont utilisées par des entreprises comme CMA CGM et Nvidia.