Google DeepMind 高管:每一家 AI 产品公司都应构建定制基准

Gate News 消息,4月27日——Google DeepMind 高级产品经理、Google AI Studio 产品负责人 Logan Kilpatrick 在 X 上表示,所有构建基于 AI 的产品的公司都应建立各自的定制基准,以衡量 AI 模型的性能。他将其描述为一种方法,用于让模型改进“对贵公司产生不成比例的收益”,并敦促创始人和商业领袖“从明天开始。”

目前,大多数公司依赖公开排行榜来选择 AI 模型,但这些榜单衡量的是通用能力,往往与特定业务场景不匹配。Kilpatrick 举例称,一家合同审查公司最关心的是条款提取的准确性——而这项能力在公开基准中缺失,导致无法评估模型在该任务上的表现。定制基准具有两项关键优势:首先,它们使公司能够针对自身业务任务评估每一次模型更新,并选择在实际使用场景中表现最佳的模型,而不是选择总体排名最高的模型;其次,它们允许公司将这些测试集与模型提供方共享,从而在与业务相关的领域推动持续优化。

Kilpatrick 指出,像 Zapier 和 Sierra 这样的公司已经在采用这种做法,并表示“这里可以创造出大量的 α(超额收益/优势)。”

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

أتمت Kaisar Network اكتمال $4 مليون دولار في التمويل لطبقة 1 للحوسبة اللامركزية للذكاء الاصطناعي

وبحسب ChainCatcher، أكملت Kaisar Network، وهي شبكة لامركزية من طبقة 1 للحوسبة بالذكاء الاصطناعي، ما يعادل $4 مليون دولار من التمويل حتى الآن، بما في ذلك 1 مليون دولار في جولة ما قبل التأسيس الاستراتيجية. ويشمل المستثمرون Merov Capital وStoneBlock وWM Capital وArche Fund وQ42 وUnicorn Ventures. الشبكة

GateNewsمنذ 18 د

المدير المالي لشركة OpenAI يرفض شائعات وجود هدف للإيرادات، ويقول إن الشركة تنفذ أعمالها بأعلى مستوى في 1 مايو

بحسب بلومبرغ، رفضت كبيرة المسؤولين الماليين لدى OpenAI سارة فرير الشائعات في 1 مايو بأن الشركة فاتت أهداف المبيعات الداخلية واحتياجات المستخدمين. وقالت فرير إن الشركة تنفّذ خططها على أعلى مستوى، واصفةً طلب المنتجات بأنه "جدار رأسي". وأشارت إلى أن التنفيذ

GateNewsمنذ 47 د

مستشار ماسك يكشف عن $974B عرض xAI للحصول على أصول مؤسسة غير ربحية مرتبطة بـ OpenAI في المحكمة، ما يثير تدقيقاً جديداً

وبحسب شهادة جيريد بيرتشال في اليوم 4 من دعوى ماسك القضائية ضد OpenAI، كان عرض xAI البالغ 974 مليار دولار لشراء أصول OpenAI غير الربحية يهدف إلى منع سام ألتمان من التقليل من قيمة الأصول أثناء إعادة هيكلة OpenAI. إلا أن القاضية يوفون غونزاليس روجرز تساءلت عن كيفية تمكن بيرتشال من تقديم عرض بقيمة 974 مليار دولار

GateNewsمنذ 1 س

مسك يعترف بأن xAI استخدمت التقطير على نماذج من OpenAI خلال يوم المحاكمة الرابع

وفقاً لـ Beating وThe Verge، في اليوم 4 من المحاكمة بين ماسك وOpenAI، تساءل محامو OpenAI عما إذا كانت xAI قد استخدمت التقطير لتحسين نماذجها باستخدام تقنية OpenAI. قال ماسك في البداية إن "تقريباً جميع شركات الذكاء الاصطناعي تفعل ذلك"، لكن عندما طُولب بإجابة مباشرة، اعترف

GateNewsمنذ 2 س

66.3% من الموظفين الأمريكيين ذوي الدخل المرتفع يستخدمون أدوات الذكاء الاصطناعي في العمل، وفقاً لمسح الاحتياطي الفيدرالي

وفقاً لمسح أجرته الاحتياطي الفيدرالي، يستخدم 66.3% من موظفي الولايات المتحدة الذين يتقاضون أكثر من 200,000 دولار سنوياً أدوات ذكاء اصطناعي في العمل خلال الـ 12 شهراً الماضية، وذلك اعتباراً من 1 مايو. أما في الفئات ذات الدخل الأقل، فينخفض معدل الاستخدام بشكل ملحوظ: 51.6% بالنسبة لمن يتقاضون بين 100,000 و200,000 دولار، و40.2% بالنسبة لمن يتقاضون بين 50,000 و100

GateNewsمنذ 2 س

أطلقت xAI واجهة برمجة التطبيقات Grok 4.3 مع نافذة سياق تصل إلى مليون رمز بسعر 1.25 دولار لكل مليون من رموز الإدخال

وفقاً لـ BlockBeats، أطلقت xAI واجهة برمجة التطبيقات Grok 4.3 في 1 مايو. يدعم النموذج الجديد نافذة سياق تبلغ مليون رمز، ويقدم إدخال/إخراج نصيًا، وإمكانيات متعددة الوسائط، وميزات استدعاء الأدوات. تُسعَّر واجهة برمجة التطبيقات Grok 4.3 بسعر 1.25 دولار لكل مليون رمز إدخال

GateNewsمنذ 2 س
تعليق
0/400
لا توجد تعليقات