A Google lança o Gemini 3.1 Flash TTS com expressão emocional melhorada e capacidades de múltiplos locutores

Mensagem da Gate News, 17 de abril — A Google revelou o Gemini 3.1 Flash TTS, um modelo avançado de texto-para-voz com funcionalidades de expressão emocional e controlo melhoradas, a 15 de abril. O novo modelo será lançado progressivamente através de APIs para programadores, do Vertex AI empresarial e de ferramentas de colaboração.

As principais capacidades do modelo incluem etiquetas de áudio baseadas em linguagem natural para afinar a velocidade, a entoação e a emoção, além de um “Director Mode” para especificar cenas e papéis de personagens e gerar saídas vocais mais subtis. Uma funcionalidade de múltiplos locutores permite a geração simultânea de diálogos, possibilitando fluxos de conversa mais naturais adequados para podcasts, conteúdos áudio e assistentes de IA. O modelo suporta mais de 70 línguas e dialetos, refletindo acentos e expressões regionais para experiências de voz localizadas em todo o mundo.

A Google sublinhou o desempenho e a eficiência de custos, obtendo pontuações elevadas em benchmarks de avaliação humana às cegas, ao mesmo tempo que reduz os custos computacionais com a sua arquitetura Flash — concebida para adoção empresarial em grande escala. O áudio gerado inclui marcações de watermark SynthID para identificar conteúdos gerados por IA e combater a desinformação.

A medida reflete a intensificação da concorrência em interfaces de voz. A OpenAI está a combinar funcionalidades de voz em tempo real com IA conversacional para interações mais semelhantes às humanas, enquanto a Meta está a alargar investimentos em personagens de IA com experiências sociais baseadas em voz. Observadores da indústria referem que, embora a atuação de alto nível e o trabalho criativo possam continuar, por agora, a ser impulsionados por humanos, os mercados de produção repetitiva e em grande escala poderão assistir a uma adoção gradual da IA na dobragem, na publicidade e nos setores de audiolivros.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Naver e Kakao Esperam Divulgar Resultados Fortes no 1.º Trimestre à Medida que os Investimentos em IA Continuam

Espera-se que a Naver e a Kakao divulguem resultados financeiros fortes no 1.º trimestre de 2026, impulsionados pelo comércio e pela publicidade, apesar do impacto limitado dos produtos de IA em fase inicial. Ambas as empresas estão a investir significativamente em infraestruturas de IA e a ajustar as suas estratégias para integrar a IA nos serviços existentes.

GateNews4m atrás

Anthropic Releases Claude Opus 4.7 With Weakened Cyber Capabilities

A Anthropic lançou, a 16 de abril, uma versão atualizada do seu modelo de referência, o Claude Opus 4.7, (na hora local). Em comparação com o modelo Opus 4.6 anterior, o Opus 4.7 mostra "melhorias significativas" nas capacidades avançadas de engenharia de software, especialmente em tarefas difíceis, com maior rigor e consistência em operações complexas e de longa duração, além de capacidades de visão melhoradas. No entanto, a Anthropic enfraqueceu deliberadamente as capacidades do modelo de ataque e defesa em cibersegurança durante o treino e introduziu mecanismos de segurança para detetar e bloquear automaticamente pedidos proibidos ou de elevado risco. ## Performance e Benchmarks Nos testes de benchmark, o Opus 4.7 obteve pontuações geralmente superiores às do Opus 4.6 anterior e do GPT-5.4, da concorrência. Ainda assim, a Anthropic sublinhou que as capacidades globais do Opus 4.7 não atingem o do modelo mais poderoso da empresa, o Claude Mythos Preview. Segundo a Anthropic: "Ao implementar e operar estes mecanismos de proteção no mundo real, vamos acumular experiência para, no fim, permitir uma divulgação mais ampla de modelos no nível do Mythos." ## Deploy e Preços O Opus 4.7 já está ativo em todos os produtos Claude e interfaces de API, integrado com os serviços da Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry. Os preços mantêm-se inalterados face ao Opus 4.6: por milhão de tokens de entrada e por milhão de tokens de saída. ## Alterações no Consumo de Tokens Duas alterações no Opus 4.7 face ao Opus 4.6 afetarão o consumo de tokens. Primeiro, o Opus 4.7 utiliza um tokenizador atualizado, melhorando a forma como o modelo processa o texto. No entanto, isto significa que entradas idênticas podem consumir mais tokens — aproximadamente 1 a 1,35 vezes o consumo da geração anterior. Segundo, o Opus 4.7 realiza mais raciocínio com uma "intensidade de pensamento" mais elevada, especialmente em rondas subsequentes de cenários agentic. Isto melhora a fiabilidade em problemas complexos, mas gera tokens de saída adicionais. ![Token consumption increase visualization]https://img-cdn.gateio.im/social/moments-723d799b0a-f046518132-8b7abd-badf29 * Aumento do consumo de tokens do Opus 4.7. Fonte: Anthropic* ## Análise de Mercado e Contexto Analistas descrevem o Opus 4.7 como um modelo "transitório". O analista de investimentos Adam Button referiu que o lançamento do Opus 4.7 reforça a narrativa da Anthropic em torno de "modelos divinos" como o Mythos e confirma o ceticismo do mercado: modelos pagos disponíveis publicamente são, essencialmente, versões "lite" limitadas por mecanismos de segurança. ## Antecedentes da Empresa e Marco Financeiro A Anthropic, fundada em 2021 por antigos empregados da OpenAI, desenvolve a série Claude de modelos de linguagem de grande escala. A 6 de abril, a Anthropic anunciou que as suas receitas anualizadas ARR excederam mil milhões, um aumento significativo face aos mil milhões no final de 2025. A empresa está ativamente a perseguir uma oferta pública inicial. ## Preocupações com o Risco em Cibersegurança Executivos da Anthropic têm repetidamente alertado para o impacto da IA na cibersegurança. De acordo com relatórios datados de 10 de abril hora local, a Secretária do Tesouro dos EUA, Yellen, e o Presidente da Reserva Federal, Powell, realizaram uma reunião de emergência com líderes de Wall Street a 7 de abril para discutir como o mais recente modelo de IA Mythos da Anthropic poderia aumentar os riscos de cibersegurança. A Anthropic afirmou que o Mythos não é adequado para lançamento público porque o modelo poderia ser usado indevidamente por cibercriminosos e espiões. A empresa está a fornecer acesso ao Mythos de forma seletiva a empresas líderes globais de cibersegurança e software.

CryptoFrontier10m atrás

xAI vai disponibilizar enormes recursos de computação com GPUs à Cursor para treino do modelo de código com IA

A xAI de Elon Musk vai fornecer capacidade de computação à startup de programação Cursor, utilizando milhares de GPUs para treinar o seu novo modelo de código. Esta mudança reforça o papel da xAI nos serviços de computação, podendo aumentar as receitas e mitigar os custos operacionais num contexto de perdas contínuas.

GateNews11m atrás

A Anthropic faz parceria com a TrendAI para integrar modelos Claude numa plataforma empresarial de segurança com IA

A TrendAI fez parceria com a Anthropic para integrar modelos Claude na sua plataforma, reforçando a investigação de ameaças e as operações de segurança com IA. Esta colaboração tem como objetivo identificar vulnerabilidades antes de entrarem em produção, refletindo a mudança do setor para a segurança em IA.

GateNews34m atrás

A OpenAI concorda em pagar mais de $20 mil milhões por chips da Cerebras ao longo de três anos, recebendo uma participação acionista

A OpenAI concordou em comprar mais de $20 mil milhões em chips de IA à Cerebras ao longo de três anos, garantindo uma participação acionista na empresa, com o objetivo de reduzir os custos de computação à medida que expande os seus serviços de IA.

GateNews35m atrás

Ministro da IA do Reino Unido critica a OpenAI por suspender o projecto do centro de dados Stargate

O ministro britânico da IA criticou a decisão da OpenAI de suspender o seu projecto de centro de dados no Reino Unido, associando-a a questões de financiamento em vez de preços de energia. A Microsoft está preparada para arrendar capacidade noutro local, afectando as metas de investimento em IA do Reino Unido.

GateNews45m atrás
Comentar
0/400
Nenhum comentário