في 10 أبريل، نشر المدونة الرسمية لـ DeepSeek مقالًا قدم فيه DeepSeek V4، النموذج الرائد الذي ستطلقه شركة DeepSeek. هذا النموذج لا يتجاوز حدود حجم المعلمات فحسب، بل يعد أيضًا بكفاءة غير مسبوقة. من المتوقع أن يستطيع DeepSeek V4 معالجة تريليون (1T) من المعلمات، ويدعم بشكل أصلي البيانات متعددة الوسائط، بما في ذلك النصوص والصور والفيديو والصوت، وله نافذة سياقية تصل إلى مليون رمز (ما يعادل 15-20 رواية كاملة)، مما يجعله منافسًا مباشرًا لعمالقة الغرب مثل GPT-5.4 من OpenAI وClaude Opus 4.5 من Anthropic. أسعار واجهة برمجة التطبيقات لـ DeepSeek V4 أرخص بمقدار 10-50 مرة من GPT-5.4 وClaude Opus 4.5؛ ومن المتوقع أن يتم إصدار DeepSeek V4 بمصدر مفتوح تحت رخصة Apache 2.0. يمكن لـ DeepSeek V4 العمل محليًا على أنظمة تحتوي على بطاقتي RTX 4090 أو بطاقة RTX 5090 واحدة. بالإضافة إلى ذلك، قدمت DeepSeek ثلاث ابتكارات ثورية لـ DeepSeek V4: 1. ذاكرة إنغرام؛ 2. ارتباطات فرط-محدودة متعددة الأشكال (mHC)؛ 3. آلية انتباه متفرقة (DSA) ومؤشر Lightning. علاوة على ذلك، تشير التصريحات الرسمية لـ DeepSeek إلى أنه بسبب القيود الصارمة على تصدير معالجات الرسوميات عالية الجودة من NVIDIA (مثل B300 وH200)، قامت DeepSeek بتحسين V4 بحيث تعتمد بشكل رئيسي على الرقائق المصنعة في الصين للإخراج. على الرغم من أن التدريب الأولي لا يزال يمكن أن يستخدم معدات NVIDIA (مثل H800)، إلا أن النموذج تم تحسينه بشكل كبير ليعمل على رقائق Huawei Ascend 950PR وCambricon MLU.

شاهد النسخة الأصلية
post-image
post-image
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.31Kعدد الحائزين:2
    0.14%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • تثبيت