Google Meluncurkan Gemini 3.1 Flash TTS dengan Ekspresi Emosional yang Ditingkatkan serta Kemampuan Multi-Pembicara

Pesan Gate News, 17 April — Google mengungkap Gemini 3.1 Flash TTS, model text-to-speech canggih dengan fitur ekspresi emosional dan kontrol yang ditingkatkan, pada 15 April. Model baru akan diluncurkan secara bertahap melalui API pengembang, Vertex AI untuk perusahaan, serta alat kolaborasi.

Kemampuan inti model ini mencakup tag audio berbasis bahasa alami untuk penyetelan kecepatan, intonasi, dan emosi, ditambah “Director Mode” untuk menentukan adegan dan peran karakter guna menghasilkan keluaran suara yang lebih bernuansa. Fitur multi-pembicara memungkinkan pembuatan dialog secara simultan, sehingga menghasilkan alur percakapan yang lebih natural dan cocok untuk podcast, konten audio, serta asisten AI. Model ini mendukung lebih dari 70 bahasa dan dialek, mencerminkan aksen dan ekspresi regional untuk pengalaman suara lokal di seluruh dunia.

Google menekankan performa dan efisiensi biaya, meraih skor tinggi pada tolok ukur evaluasi manusia buta (blind) sambil menurunkan biaya komputasi melalui arsitektur Flash—yang dirancang untuk adopsi skala besar di perusahaan. Audio yang dihasilkan menyertakan watermark SynthID untuk mengidentifikasi konten yang dihasilkan AI dan melawan misinformasi.

Langkah ini mencerminkan persaingan yang semakin ketat dalam antarmuka suara. OpenAI menggabungkan fitur suara real-time dengan AI percakapan untuk interaksi yang menyerupai manusia, sementara Meta memperluas investasi pada karakter AI dengan pengalaman sosial berbasis suara. Pengamat industri mencatat bahwa meskipun akting tingkat tinggi dan pekerjaan kreatif mungkin tetap digerakkan manusia untuk saat ini, pasar produksi yang berulang dan berskala besar bisa melihat adopsi AI secara bertahap dalam sektor dubbing, periklanan, dan buku audio.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Naver dan Kakao Diharapkan Melaporkan Hasil Kuartal Pertama yang Kuat karena Investasi AI Berlanjut

Naver dan Kakao diperkirakan akan melaporkan kinerja kuartal pertama 2026 yang kuat, didorong oleh perdagangan dan iklan, meskipun dampaknya terbatas dari produk AI tahap awal. Kedua perusahaan secara signifikan berinvestasi dalam infrastruktur AI dan mengubah strategi untuk mengintegrasikan AI ke layanan yang sudah ada.

GateNews4menit yang lalu

Anthropic Merilis Claude Opus 4.7 dengan Kemampuan Siber yang Dilemahkan

Anthropic merilis versi yang ditingkatkan dari model unggulannya, Claude Opus 4.7, pada 16 April (waktu lokal). Dibandingkan dengan model Opus 4.6 sebelumnya, Opus 4.7 menunjukkan "peningkatan yang signifikan" pada kemampuan rekayasa perangkat lunak tingkat lanjut, terutama untuk tugas-tugas sulit, dengan ketelitian dan konsistensi yang lebih baik pada operasi kompleks yang berjalan lama serta kemampuan visi yang ditingkatkan. Namun, Anthropic sengaja melemahkan kemampuan serangan-pertahanan siber model selama pelatihan dan memperkenalkan mekanisme keselamatan untuk secara otomatis mendeteksi serta memblokir permintaan yang dilarang atau berisiko tinggi, dengan ...

CryptoFrontier10menit yang lalu

xAI Akan Menyediakan Daya Komputasi GPU dalam Skala Besar kepada Cursor untuk Pelatihan Model Kode AI

xAI milik Elon Musk akan menyediakan daya komputasi untuk startup pemrograman Cursor, dengan memanfaatkan ribuan GPU untuk melatih model kode barunya. Pergeseran ini memperkuat peran xAI dalam layanan komputasi, yang berpotensi meningkatkan pendapatan dan menangani biaya operasional di tengah kerugian berkelanjutan.

GateNews11menit yang lalu

Anthropic Bermitra dengan TrendAI untuk Mengintegrasikan Model Claude ke Platform Keamanan AI Perusahaan

TrendAI telah bermitra dengan Anthropic untuk mengintegrasikan model Claude ke dalam platformnya, meningkatkan riset ancaman dan operasi keamanan berbasis AI. Kolaborasi ini bertujuan untuk mengidentifikasi kerentanan sebelum masuk ke produksi, mencerminkan pergeseran industri menuju keamanan AI.

GateNews34menit yang lalu

OpenAI Setuju Membayar Lebih dari $20 Miliar untuk Chip Cerebras Selama Tiga Tahun, Mendapatkan Kepemilikan Saham

OpenAI telah setuju untuk membeli lebih dari $20 miliar chip AI dari Cerebras selama tiga tahun, sekaligus mendapatkan kepemilikan saham di perusahaan tersebut, dengan tujuan menurunkan biaya komputasi saat mereka memperluas layanan AI.

GateNews35menit yang lalu

Menteri AI Inggris Mengkritik OpenAI karena Menghentikan Proyek Pusat Data Stargate

Menteri AI Inggris mengkritik keputusan OpenAI untuk menghentikan proyek pusat data UK-nya, mengaitkannya dengan masalah pembiayaan daripada harga energi. Microsoft akan menyewa kapasitas di lokasi lain, sehingga memengaruhi target investasi AI Inggris.

GateNews45menit yang lalu
Komentar
0/400
Tidak ada komentar