أطلقت DeepSeek النسخة التجريبية المفتوحة المصدر V4، وحصلت على درجة تقنية 3206 متفوقة على GPT-5.4

DeepSeek V4開源預覽版

أطلقت DeepSeek رسميًا سلسلة المعاينة V4 في 24 أبريل، مع طرح أوزان النموذج مفتوحة المصدر بموجب ترخيص MIT، وقد تم رفع أوزان النماذج إلى كلٍّ من Hugging Face وModelScope. وفقًا للتقرير التقني الخاص بـ DeepSeek V4، حقق V4-Pro-Max (أقصى وضع قوة استدلال) 3206 نقطة في معيار Codeforces، متفوقًا على GPT-5.4.

مواصفات معماريتي MoE لنموذجين

وفقًا للتقرير التقني الخاص بـ DeepSeek V4، تتضمن سلسلة V4 نموذجين من نماذج الخبراء الهجين (MoE):

V4-Pro: إجمالي المعلمات 1.6T، تنشيط كل توكن 49B، يدعم سياقًا حتى 1M توكن

V4-Flash: إجمالي المعلمات 284B، تنشيط كل توكن 13B، يدعم كذلك سياقًا حتى 1M توكن

وفقًا للتقرير التقني، فإن استدلال FLOPs لكل توكن في سياق 1M لـ V4-Pro تبلغ 27% فقط من V3.2، كما انخفض مخبأ KV إلى 10% من V3.2. ويعود ذلك بشكل أساسي إلى ترقية معمارية آلية الانتباه الهجينة (CSA انتباه متناثر مضغوط + HCA انتباه مضغوط مكثّف). يتجاوز حجم بيانات ما قبل التدريب 32T توكن؛ وقد تم تحديث المُحسِّن التدريبي إلى Muon.

منهجية ما بعد التدريب: التقطير عبر الاستراتيجية المباشرة يحل محل التعلم المعزز الهجين

وفقًا للتقرير التقني الخاص بـ DeepSeek V4، تتمثل التحديثات الأساسية في ما بعد تدريب V4 في استبدال مرحلة التعلم المعزز الهجين (mixed RL) في V3.2 بالكامل بتقطير الاستراتيجية المباشرة (On-Policy Distillation، OPD). يتم تقسيم العملية الجديدة إلى خطوتين: أولاً، يتم تدريب خبراء مجال منفصلين (SFT + GRPO تعزيز تعلّمي) على مجالات مثل الرياضيات والبرمجة وAgent واتباع التعليمات؛ وبعد ذلك، يتم تقطير قدرات أكثر من عشرة خبراء إلى نموذج موحّد باستخدام مُقطِّر OPD متعدد المعلمين، مع محاذاة logit لتجنب تعارض القدرات الشائع في الطرق التقليدية.

كما يقدّم التقرير نموذج مكافأة توليدي (Generative Reward Model، GRM)، وذلك للمهام التي يصعب التحقق منها باستخدام القواعد؛ إذ يتم تدريب النموذج باستخدام كمية صغيرة ومتنوعة من بيانات التعليمات/الوسوم البشرية، ليقوم النموذج في الوقت نفسه بدور التوليد والتقييم.

نتائج الاختبار المعياري: التشفير يتقدم، لكن الاستدلال المعرفي لا يزال بفارق

وفقًا للتقرير التقني الخاص بـ DeepSeek V4، تأتي نتائج المقارنة بين V4-Pro-Max وOpus 4.6 Max وGPT-5.4 xHigh وGemini 3.1 Pro High (مع استبعاد GPT-5.5 وOpus 4.7 اللذين صدرَا مؤخرًا):

Codeforces: 3206 (GPT-5.4: 3168 / Gemini 3.1 Pro: 3052) → أعلى نتيجة في كامل المنافسة

LiveCodeBench: 93.5 → أعلى نتيجة في كامل المنافسة

SWE Verified: 80.6، متأخر عن Opus 4.6 البالغ 80.8 بفارق 0.2 نقطة مئوية

GPQA Diamond: 90.1، متأخر عن Gemini 3.1 Pro البالغ 94.3

SimpleQA-Verified: 57.9، متأخر عن Gemini 3.1 Pro البالغ 75.6

HLE: 37.7، متأخر عن Gemini 3.1 Pro البالغ 44.4

كما يشير التقرير التقني إلى أن المقارنات المذكورة أعلاه لا تتضمن GPT-5.5 وOpus 4.7 المنشورين مؤخرًا، وأن الفجوة بين V4 والنموذج المغلق من الجيل الأحدث بحاجة إلى تحقق من خلال تقييم طرف ثالث.

الأسئلة الشائعة

ما هي شروط ترخيص Open Source لنسخة معاينة DeepSeek V4، وأين يمكن الحصول عليها؟

وفقًا للإعلان الرسمي لـ DeepSeek في 24 أبريل، تُطرح سلسلة V4 كمصدر مفتوح بموجب ترخيص MIT، وتم رفع أوزان النموذج إلى Hugging Face وModelScope، وتُستخدم للأغراض التجارية والأكاديمية.

ما الاختلاف بين حجم معلمات DeepSeek V4-Pro وV4-Flash؟

وفقًا للتقرير التقني الخاص بـ DeepSeek V4، فإن إجمالي معلمات V4-Pro يبلغ 1.6T، وتنشيط كل توكن 49B؛ بينما إجمالي معلمات V4-Flash يبلغ 284B، وتنشيط كل توكن 13B. ويُشغّل كلا النموذجين سياقًا يصل إلى 1M توكن.

ما نتائج المقارنة المعيارية لـ DeepSeek V4-Pro-Max مع GPT-5.4 وGemini 3.1 Pro؟

وفقًا للتقرير التقني الخاص بـ DeepSeek V4، يتفوق V4-Pro-Max في معيار Codeforces (3206 نقطة) وLiveCodeBench (93.5) على GPT-5.4 وGemini 3.1 Pro، لكنه لا يزال متأخرًا عن Gemini 3.1 Pro في المعايير عالية الكثافة المعرفية (GPQA Diamond وSimpleQA-Verified وHLE)؛ كما أن مجموعة المقارنة لا تشمل GPT-5.5 وOpus 4.7.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

تتعاون شركة Claw Intelligence مع Block Sec Arena لتعزيز أمن سلسلة BNB Chain

بحسب الإعلان الرسمي لشركة Block Sec Arena في 30 أبريل، أعلنت Claw Intelligence، وهي منصة Web3 مدعومة بالذكاء الاصطناعي ومبنية على BNB Chain، عن شراكة استراتيجية مع Block Sec Arena لدمج بنية تحتية متقدمة للأمن السيبراني داخل نظامها البيئي. تهدف الشراكة إلى تعزيز p

GateNewsمنذ 1 س

شركة NTT تعلن مبادرة AI x OWN، وتخطط لثلاثة أضعاف سعة توليد الطاقة في اليابان إلى 1 جيجاواط بحلول 2033

في 27 أبريل، أعلن رئيس NTT أكيرا شيماشيدا مبادرة AI x OWN، وهي جهود الشركة لإعادة تصميم بنية الإنترنت لاستخدام الذكاء الاصطناعي في الوقت الفعلي. وتخطط NTT لرفع سعتها المحلية من الطاقة الكهربائية إلى ثلاثة أضعاف من نحو 300 ميغاواط اليوم إلى حوالي 1 جيغاواط بحلول السنة المالية 2033، حيث عملاق الاتصالات

GateNewsمنذ 2 س

منصة الذكاء الاصطناعي Certifyde تُكمل جولة تمويل بذري بقيمة 2 مليون دولار في 1 مايو، بدعم من الرئيس التنفيذي لشركة Ripple براد غارلينغهاوس

بحسب TechfundingNews، أكملت منصة تطبيقات الذكاء الاصطناعي Certifyde جولة تمويل بذري بقيمة 2 مليون دولار في 1 مايو. ومن بين المستثمرين K5 Global وFlamingo Capital، إضافةً إلى مستثمرين ملائكة من بينهم المؤسس المشارك لشركة Honey جورج روان، والرئيس التنفيذي لشركة Ripple براد غارلينغهاوس، والمؤسس المشارك لشركة Nutra رولاند

GateNewsمنذ 3 س

نائب وزير الدفاع الأمريكي لشؤون التكنولوجيا في البنتاغون: لا تزال Anthropic مدرجة في القائمة السوداء، مع استثناءات خاصة لـ Mythos

صرّح كبير مسؤولي التكنولوجيا في وزارة الدفاع الأمريكية (Pentagon technology chief) في 1 مايو أمام الكونغرس قائلاً: «تظل Anthropic على القائمة السوداء، لكن Mythos Preview موضوع آخر»، مانحاً اعترافاً رسمياً بأن وزارة الدفاع تتعامل على نحو مختلف مع العلامة التجارية الرئيسية لـ Anthropic ونموذجها الجديد Mythos. يتوافق هذا الموقف مع ما كشفته Axios في 19 أبريل بأن وكالة الأمن القومي (NSA) كانت قد استخدمت فعلياً Mythos لإيجاد تكيّف/استجابة، كما أنه يرسّخ رسمياً التوجه نحو سياسة «قناة استثناء Mythos»، وهو ما يعني أيضاً أن وزارة الدفاع كانت قد جادلت في المحكمة بأن استخدام أدوات Anthropic قد يهدد الأمن القومي، بما يتناقض داخلياً من زاوية الحجج القانونية مع الممارسات الفعلية الحالية. Anthropic vs Pentagon

ChainNewsAbmediaمنذ 4 س

تغلق 137 Ventures $700M في صناديق جديدة، لتصل الأصول الخاضعة للإدارة إلى 15 مليار دولار

وفقاً لـ ChainCatcher، أكمل 137 Ventures، وهو مستثمر مبكر في SpaceX، مؤخراً جمع تمويل لصندوقين جديدين بإجمالي يتجاوز 700 مليون دولار، ما يرفع أصوله الخاضعة للإدارة إلى أكثر من 15 مليار دولار. سيساند رأس المال الجديد الاستثمارات في وكلاء الذكاء الاصطناعي والروبوتات ودفع الصواريخ.

GateNewsمنذ 4 س

يترتّب ارتفاع ريديت بنسبة 16% مع توقعات قوية للربع الثاني؛ يواجه آبل نقصاً في أجهزة ماك مع تفوق الطلب على الذكاء الاصطناعي على الإمدادات

ارتفع سهم Reddit بنسبة 16% قبل افتتاح السوق يوم الجمعة، بعد أن أصدرت الشركة توقعات إيرادات للربع القادم أعلى من المتوقع. ونمت الزيارات النشطة اليومية بنسبة 17% إلى 126.8 مليون، بينما قفز متوسط الإيراد لكل مستخدم على مستوى العالم بنسبة 44%، مدفوعاً بقدرات الذكاء الاصطناعي التي تعمل على

GateNewsمنذ 4 س
تعليق
0/400
لا توجد تعليقات