Google запускає Gemini 3.1 Flash TTS із покращеним емоційним вираженням і багатоголосими можливостями

Повідомлення Gate News, 17 квітня — Google представила Gemini 3.1 Flash TTS, вдосконалену модель тексту в мовлення з розширеними функціями емоційного вираження та керування, 15 квітня. Нову модель буде поступово впроваджено через API для розробників, корпоративний Vertex AI та інструменти для співпраці.

Ключові можливості моделі включають аудіотеги на основі природної мови для точного налаштування швидкості, інтонації та емоції, а також “Director Mode” для вказання сцен і ролей персонажів, щоб генерувати більш нюансовані голосові результати. Багатоголосий режим дає змогу одночасно генерувати діалоги, дозволяючи природніші сценарії розмов, що підходять для подкастів, аудіоконтенту та ШІ-асистентів. Модель підтримує понад 70 мов і діалектів, відображаючи регіональні акценти та вирази для локалізованого голосового досвіду в усьому світі.

Google наголосила на продуктивності та економічній ефективності: досягнено високих показників на сліпих бенчмарках людської оцінки, водночас зменшено обчислювальні витрати завдяки архітектурі Flash — розробленій для масштабованого корпоративного впровадження. Згенерований аудіоконтент містить водяний знак SynthID для ідентифікації контенту, створеного ШІ, та боротьби з дезінформацією.

Цей крок відображає загострення конкуренції в голосових інтерфейсах. OpenAI поєднує функції голосу в реальному часі з розмовним ШІ для взаємодії, схожої на людську, тоді як Meta розширює інвестиції в ШІ-персонажів із соціальним досвідом на основі голосу. Аналітики галузі зазначають, що хоча високорівнева акторська майстерність і творча робота можуть і надалі залишатися керованими людьми, ринки повторюваного та великомасштабного виробництва можуть поступово переходити до використання ШІ в дубляжі, рекламі та сегменті аудіокниг.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Naver і Kakao, як очікується, покажуть сильні результати за Q1, оскільки інвестиції в ШІ тривають

Очікується, що Naver і Kakao повідомлять про сильні фінансові результати за Q1 2026, зумовлені розвитком комерції та реклами, попри обмежений вплив продуктів ШІ на ранній стадії. Обидві компанії суттєво інвестують в інфраструктуру ШІ та змінюють стратегії, щоб інтегрувати ШІ в наявні сервіси.

GateNews4хв. тому

Anthropic випускає Claude Opus 4.7 із послабленими можливостями в кібербезпеці

Anthropic випустила оновлену версію свого флагманського моделі, Claude Opus 4.7, 16 квітня (за місцевим часом). Порівняно з попередньою моделлю Opus 4.6, Opus 4.7 демонструє "значні покращення" у передових можливостях інженерії програмного забезпечення, зокрема під час складних завдань, із підвищеною строгістю та узгодженістю в комплексних тривалих операціях, а також покращеними можливостями бачення. Однак Anthropic навмисно послабила можливості моделі щодо атак і захисту в кібербезпеці під час тренування та запровадила механізми безпеки, які автоматично виявляють і блокують заборонені або високоризикові запити. ## Продуктивність і бенчмарки Під час тестування на бенчмарках Opus 4.7 досягла результатів загалом вищих, ніж попередня Opus 4.6 і конкуруюча GPT-5.4. Водночас Anthropic підкреслила, що загальні можливості Opus 4.7 не відповідають найпотужнішій моделі компанії — Claude Mythos Preview. За даними Anthropic: "Розгортуючи та працюючи з цими захисними механізмами в реальному світі, ми накопичимо досвід, щоб у підсумку забезпечити ширший реліз моделей рівня Mythos." ## Розгортання та ціноутворення Opus 4.7 уже працює в усіх продуктах Claude та інтерфейсах API, інтегрована з Amazon Bedrock, Google Cloud Vertex AI та сервісами Microsoft Foundry. Ціни залишаються незмінними порівняно з Opus 4.6: за мільйон вхідних токенів і за мільйон вихідних токенів. ## Зміни в споживанні токенів Дві зміни в Opus 4.7 порівняно з Opus 4.6 вплинуть на використання токенів. По-перше, Opus 4.7 використовує оновлений токенізатор, покращуючи спосіб, у який модель обробляє текст. Однак це означає, що ідентичні вхідні дані можуть споживати більше токенів — приблизно у 1–1.35 раза порівняно зі споживанням попередньої генерації. По-друге, Opus 4.7 виконує більше міркувань із вищою "інтенсивністю мислення", зокрема в наступних раундах агентних сценаріїв. Це підвищує надійність для складних задач, але генерує додаткові вихідні токени. ![Token consumption increase visualization]https://img-cdn.gateio.im/social/moments-723d799b0a-f046518132-8b7abd-badf29 *Збільшення споживання токенів Opus 4.7. Джерело: Anthropic* ## Аналіз ринку та контекст Аналітики описують Opus 4.7 як модель "перехідного" типу. Інвестиційний аналітик Адам Баттон зазначив, що реліз Opus 4.7 підсилює наратив Anthropic щодо "богоподібних моделей" на кшталт Mythos і підтверджує скепсис ринку: публічно доступні платні моделі по суті є "lite"-версіями, обмеженими механізмами безпеки. ## Передісторія компанії та фінансовий рубіж Anthropic, заснована в 2021 році колишніми співробітниками OpenAI, розробляє серію великих мовних моделей Claude. 6 квітня Anthropic оголосила, що її річний виторг ARR перевищив мільярд, що є суттєвим зростанням порівняно з мільярдами наприкінці 2025 року. Компанія активно працює над первинним публічним розміщенням. ## Питання ризиків у сфері кібербезпеки Керівники Anthropic неодноразово попереджали про вплив ШІ на кібербезпеку. Згідно зі звітами від 10 квітня за місцевим часом, міністр фінансів США Єллен і голова Федеральної резервної системи Пауелл провели екстрену зустріч із лідерами Уолл-стріт 7 квітня, щоб обговорити, як остання модель ШІ Mythos від Anthropic може посилити ризики для кібербезпеки. Anthropic заявила, що Mythos не підходить для публічного релізу, оскільки модель може бути неправильно використана кіберзлочинцями та шпигунами. Компанія вибірково надає доступ до Mythos провідним глобальним компаніям у сфері кібербезпеки та розробці програмного забезпечення.

CryptoFrontier10хв. тому

xAI надасть Cursor масивні обчислювальні потужності GPU для тренування AI-моделі коду

xAI Ілона Маска надасть обчислювальні потужності стартапу для програмування Cursor, використовуючи тисячі GPU для навчання його нового моделі коду. Цей крок посилює роль xAI у сфері обчислювальних сервісів, потенційно збільшуючи доходи та допомагаючи покривати операційні витрати на тлі триваючих збитків.

GateNews11хв. тому

Anthropic співпрацює з TrendAI, щоб інтегрувати моделі Claude в корпоративну платформу безпеки на основі ШІ

TrendAI співпрацює з Anthropic, щоб інтегрувати моделі Claude у свою платформу, посилюючи дослідження загроз і операції з безпеки на основі ШІ. Ця співпраця спрямована на виявлення вразливостей до запуску в продакшн, що відображає зміну в бік AI-безпеки в індустрії.

GateNews34хв. тому

OpenAI погоджується сплатити понад $20 мільярдів доларів США за чипи Cerebras протягом трьох років і отримує частку в капіталі

OpenAI погодився придбати понад $20 мільярдів доларів США в чипах для ШІ в Cerebras протягом трьох років, отримавши частку в капіталі компанії, щоб знизити витрати на обчислення у міру розширення своїх сервісів зі штучного інтелекту.

GateNews35хв. тому

Міністр ШІ Великої Британії розкритикував OpenAI за призупинення проєкту дата-центру Stargate

Міністр ШІ Британії розкритикував рішення OpenAI призупинити проєкт зі створення дата-центру в Ірландії, пов’язавши це з проблемами фінансування, а не з цінами на енергоносії. Microsoft має намір орендувати потужності на іншому майданчику, що вплине на цілі інвестицій Великої Британії в галузі ШІ.

GateNews45хв. тому
Прокоментувати
0/400
Немає коментарів