Berita Gate, 27 April — Logan Kilpatrick, manajer produk senior di Google DeepMind dan pemimpin produk untuk Google AI Studio, menyatakan di X bahwa setiap perusahaan yang membangun produk berbasis AI harus menetapkan tolok ukur kustomnya sendiri untuk mengukur performa model AI. Ia menyebutnya sebagai cara untuk membuat peningkatan model "memberi manfaat yang secara tidak proporsional bagi perusahaan Anda" dan mendesak para pendiri serta pemimpin bisnis untuk "mulai besok."

Kebanyakan perusahaan saat ini mengandalkan papan peringkat publik untuk memilih model AI, tetapi papan peringkat ini mengukur kemampuan umum yang sering tidak selaras dengan skenario bisnis tertentu. Kilpatrick mencontohkan perusahaan peninjau kontrak yang paling peduli pada akurasi ekstraksi klausul—sebuah kemampuan yang tidak ada dalam tolok ukur publik, sehingga tidak mungkin menilai performa model pada tugas tersebut. Tolok ukur kustom menawarkan dua keunggulan utama: pertama, tolok ukur ini memungkinkan perusahaan mengevaluasi setiap pembaruan model terhadap tugas bisnis mereka sendiri dan memilih model yang berkinerja terbaik pada kasus penggunaan mereka yang sebenarnya, bukan model dengan peringkat tertinggi secara keseluruhan; kedua, tolok ukur ini memungkinkan perusahaan membagikan set pengujian tersebut kepada penyedia model, sehingga mendorong optimasi berkelanjutan di area yang penting bagi bisnis mereka.

Kilpatrick mencatat bahwa perusahaan seperti Zapier dan Sierra sudah menerapkan pendekatan ini, dengan mengatakan bahwa "ada banyak alpha yang bisa diciptakan di sini."

Lihat Sumber

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.

Berita Terkait

04-27 03:21

OpenAI Bermitra dengan MediaTek dan Qualcomm untuk Mengembangkan Prosesor Ponsel Pintar AI, Foxconn Connector Mulai Produksi pada 2028

04-27 01:13

Sam Altman Menguraikan Lima Prinsip Operasional OpenAI, Menandakan Kemungkinan Pembatasan Kemampuan Model di Masa Depan demi Keselamatan

04-24 12:21

Pendiri NeoSoul Kaelan: Industri AI Harus Membiarkan Mainan Ada, Inovasi Sering Berawal dari Produk Eksperimental

04-24 09:01

Xpeng, Xiaomi Lead In-Car AI Push at Beijing Auto Show

04-24 08:13

Insinyur OpenAI Clive Chan Menantang Rekomendasi Perangkat Keras V4, Mengutip Kesalahan dan Ketidakjelasan Dibanding V3

Analisis Kedalaman

MediaTek meraih pesanan besar Google TPU generasi ke-8! ASIC memanas, mendorong tiga saham konsep mendapatkan manfaat

ChainNewsAbmedia04-27 03:57

JPMorgan: Tokenisasi Akan Mengubah Industri Dana, Tapi “Kasus Penggunaan yang Baik” Masih Butuh Bertahun-tahun

Crypto Frontier04-26 16:19

AI Agent kini bisa secara mandiri mereproduksi makalah akademis yang kompleks: Mollick mengatakan kesalahan lebih banyak berasal dari teks asli manusia, bukan dari AI

ChainNewsAbmedia04-26 03:34

Komentar

0/400

Tidak ada komentar