Google представляет Gemini 3.1 Flash TTS с улучшенным выражением эмоций и возможностями для нескольких спикеров

Сообщение Gate News, 17 апреля — Google представила Gemini 3.1 Flash TTS, усовершенствованную модель преобразования текста в речь с расширенными функциями выражения эмоций и контроля, 15 апреля. Новая модель будет поэтапно внедряться через API для разработчиков, корпоративную платформу Vertex AI и инструменты для совместной работы.

Ключевые возможности модели включают аудиотеги на основе естественного языка для тонкой настройки скорости, интонации и эмоций, а также «Director Mode» для указания сцен и ролей персонажей, чтобы генерировать более нюансированную голосовую подачу. Функция нескольких спикеров позволяет одновременно генерировать диалоги, обеспечивая более естественные сценарии общения, подходящие для подкастов, аудиоконтента и ИИ‑ассистентов. Модель поддерживает более 70 языков и диалектов, отражая региональные акценты и выражения для локализованного голосового опыта по всему миру.

Google подчеркнула производительность и эффективность по стоимости, добившись высоких результатов на бенчмарках слепой оценки людьми, одновременно снижая вычислительные затраты благодаря архитектуре Flash — она предназначена для масштабного корпоративного внедрения. Сгенерированное аудио включает водяной знак SynthID, чтобы идентифицировать контент, сгенерированный ИИ, и бороться с дезинформацией.

Этот шаг отражает усиливающуюся конкуренцию в голосовых интерфейсах. OpenAI объединяет функции реального времени для голоса с разговорным ИИ для взаимодействий, похожих на человеческие, а Meta расширяет инвестиции в ИИ‑персонажей с голосовыми социальными сценариями. Наблюдатели отрасли отмечают, что хотя высокоуровневое актерское мастерство и креативная работа, вероятно, пока останутся в основном ориентированными на людей, повторяющиеся и массовые рынки производства могут постепенно перейти к использованию ИИ в дубляже, рекламе и сегменте аудиокниг.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Naver и Kakao Ожидают Сильные Результаты за 1-й Квартал, Поскольку Инвестиции в ИИ Продолжаются

Naver и Kakao, как ожидается, сообщат о сильных финансовых результатах за 1-й квартал 2026 года, чему будут способствовать развитие коммерции и рекламы, несмотря на ограниченное влияние продуктов ИИ на ранней стадии. Обе компании существенно инвестируют в инфраструктуру ИИ и меняют стратегии, чтобы встроить ИИ в существующие сервисы.

GateNews10м назад

Anthropic представляет Claude Opus 4.7 со снижёнными возможностями кибератак-обороне

Anthropic выпустила обновленную версию своего флагманского модельного решения, Claude Opus 4.7, 16 апреля (по местному времени). По сравнению с предыдущей моделью Opus 4.6, Opus 4.7 демонстрирует «существенные улучшения» в возможностях продвинутой инженерии ПО, особенно в сложных задачах, с повышенной строгостью и c

CryptoFrontier16м назад

xAI предоставит Cursor мощные GPU-вычисления для обучения ИИ-кодовой модели

Elon Musk's xAI предоставит вычислительные мощности стартапу по разработке ПО Cursor, задействовав тысячи GPU для обучения его новой кодовой модели. Этот сдвиг усиливает роль xAI в предоставлении вычислительных сервисов, потенциально увеличивая выручку и помогая покрывать операционные расходы на фоне продолжающихся убытков.

GateNews17м назад

Anthropic сотрудничает с TrendAI, чтобы интегрировать модели Claude в платформу корпоративной ИИ-безопасности

TrendAI сотрудничает с Anthropic, чтобы интегрировать модели Claude в свою платформу, усиливая исследования угроз и операции по кибербезопасности с применением ИИ. Это сотрудничество направлено на выявление уязвимостей до запуска в производство, отражая переход отрасли к обеспечению безопасности ИИ.

GateNews40м назад

OpenAI согласилась заплатить более $20 B миллиардов за чипы Cerebras в течение трех лет и получила долю в капитале

OpenAI согласилась закупить у Cerebras более чем на $20 миллиардов ИИ-чипов в течение трех лет, получив долю в капитале компании и стремясь снизить вычислительные затраты по мере расширения своих услуг в области ИИ.

GateNews40м назад

Министр ИИ Великобритании раскритиковал OpenAI за приостановку проекта дата-центра Stargate

Британский министр по вопросам ИИ раскритиковал решение OpenAI приостановить проект своего дата-центра в Великобритании, связав это с проблемами финансирования, а не с ценами на энергию. Microsoft планирует арендовать мощности на другом объекте, что повлияет на цели Великобритании по инвестициям в ИИ.

GateNews50м назад
комментарий
0/400
Нет комментариев