Google lance Gemini 3.1 Flash TTS avec une expression émotionnelle améliorée et des capacités multi-intervenants

Message de Gate News, 17 avril — Google a dévoilé Gemini 3.1 Flash TTS, un modèle avancé de synthèse vocale doté de fonctionnalités d’expression émotionnelle et de contrôle améliorées, le 15 avril. Le nouveau modèle sera déployé progressivement via des API développeur, Vertex AI à destination des entreprises, et des outils de collaboration.

Les capacités clés du modèle incluent des balises audio basées sur le langage naturel pour affiner la vitesse, l’intonation et l’émotion, ainsi qu’un « Director Mode » permettant de spécifier des scènes et les rôles des personnages afin de générer des sorties vocales plus nuancées. Une fonctionnalité multi-intervenants permet de générer un dialogue simultanément, offrant des flux de conversation plus naturels adaptés aux podcasts, aux contenus audio et aux assistants IA. Le modèle prend en charge plus de 70 langues et dialectes, reflétant les accents et les expressions régionales pour des expériences vocales localisées à l’échelle mondiale.

Google a mis l’accent sur les performances et l’efficacité des coûts, obtenant de hauts scores sur des références d’évaluation humaine à l’aveugle tout en réduisant les coûts de calcul grâce à son architecture Flash — conçue pour une adoption à grande échelle en entreprise. L’audio généré inclut le marquage filigrane SynthID pour identifier les contenus générés par IA et lutter contre la désinformation.

Ce mouvement reflète une concurrence de plus en plus forte dans les interfaces vocales. OpenAI combine des fonctionnalités vocales en temps réel avec une IA conversationnelle pour des interactions plus proches de l’humain, tandis que Meta élargit ses investissements dans des personnages IA avec des expériences sociales basées sur la voix. Des observateurs du secteur notent que, bien que le jeu d’acteur et le travail créatif de haut niveau puissent encore rester pilotés par des humains pour le moment, les marchés de production répétitifs et à grande échelle pourraient voir une adoption progressive de l’IA dans le doublage, la publicité et les secteurs des livres audio.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Naver et Kakao devraient publier de solides résultats au T1 alors que les investissements dans l’IA se poursuivent

Naver et Kakao devraient publier de solides résultats au T1 2026, portés par le commerce et la publicité, malgré un impact limité des produits d’IA encore en phase initiale. Les deux entreprises investissent massivement dans des infrastructures d’IA et réorientent leurs stratégies afin d’intégrer l’IA à leurs services existants.

GateNewsIl y a 4m

Anthropic dévoile Claude Opus 4.7 avec des capacités de cybersécurité affaiblies

Anthropic a publié le 16 avril ( à l’heure locale ) une version mise à niveau de son modèle phare, Claude Opus 4.7. Par rapport au modèle Opus 4.6 précédent, Opus 4.7 fait montre de « améliorations significatives » dans les capacités avancées d’ingénierie logicielle, en particulier sur des tâches difficiles, avec plus de rigueur et de cohérence dans des opérations complexes et de longue durée, ainsi qu’une meilleure capacité de vision. Toutefois, Anthropic a volontairement affaibli les capacités d’attaque-défense en cybersécurité du modèle pendant l’entraînement et a introduit des mécanismes de sécurité pour détecter et bloquer automatiquement les demandes interdites ou présentant un risque élevé, avec

CryptoFrontierIl y a 10m

xAI fournira une immense puissance de calcul GPU à Cursor pour l’entraînement de son modèle de code IA

xAI d’Elon Musk fournira de la puissance de calcul à la startup de programmation Cursor, en utilisant des milliers de GPU pour entraîner son nouveau modèle de code. Ce changement renforce le rôle de xAI dans les services informatiques, avec potentiellement une hausse des revenus et la prise en charge des coûts d’exploitation dans un contexte de pertes persistantes.

GateNewsIl y a 11m

Anthropic s’associe à TrendAI pour intégrer les modèles Claude dans la plateforme de sécurité IA en entreprise

TrendAI s’est associé à Anthropic pour intégrer des modèles Claude à sa plateforme, afin d’améliorer la recherche sur les menaces et les opérations de sécurité liées à l’IA. Cette collaboration vise à identifier des vulnérabilités avant la mise en production, ce qui reflète l’évolution de l’industrie vers la sécurité de l’IA.

GateNewsIl y a 34m

OpenAI accepte de payer plus de $20 milliards de dollars pour des puces Cerebras sur trois ans et reçoit une participation au capital

OpenAI a accepté d’acheter pour plus de $20 milliards de dollars de puces IA à Cerebras sur une période de trois ans, en obtenant une participation au capital de l’entreprise, dans le but de réduire les coûts de calcul à mesure qu’elle étend ses services d’IA.

GateNewsIl y a 35m

Le ministre britannique de l’IA critique OpenAI pour avoir suspendu le projet du centre de données Stargate

Le ministre britannique de l’IA a critiqué la décision d’OpenAI de suspendre son projet de centre de données au Royaume-Uni, en la reliant à des problèmes de financement plutôt qu’aux prix de l’énergie. Microsoft prévoit de louer de la capacité sur un autre site, ce qui aura un impact sur les objectifs d’investissement en IA du Royaume-Uni.

GateNewsIl y a 45m
Commentaire
0/400
Aucun commentaire