DeepSeek V3.1 Terminus مقابل Kimi K2-0905: دليل اختيار الوكيل للربع الرابع 2025
وتيرة الإصدارات والغرض
طرحت DeepSeek تحديث Terminus في 22 سبتمبر 2025، مع تحسينات في الاتساق متعدد اللغات وتحديثات لوكلاء الشيفرة والبحث دون تعطيل واجهات الويب أو التطبيقات أو واجهة البرمجة. أما Moonshot AI فأصدرت Kimi K2-0905 في 5 سبتمبر 2025 كنسخة سبتمبر من عائلة K2، مع تركيز على البرمجة الوكيلية، وتحسين الواجهات الأمامية، ومضاعفة نافذة السياق.
البنية، السياق، وشكل التوزيع
كلا النموذجين يستخدم بنية MoE، لكن لكل منهما اختيارات مختلفة:
| البعد | DeepSeek V3.1 Terminus | Kimi K2-0905 |
|---|---|---|
| المعاملات الكلية / المفعّلة | 685 مليار إجماليًا، نحو 37 مليار مفعّلة لكل رمز | 1 تريليون إجماليًا، 32 مليار مفعّلة لكل استدعاء |
| عدد الخبراء في الطبقة | 9 خبراء | 8 من أصل 384 خبيرًا |
| نافذة السياق | 128 ألف رمز | 256 ألف رمز |
| أنماط التشغيل | Swift (منخفض الكمون) و Think (استدلال عميق) | نمط واحد مهيأ للبرمجة المعتمدة على الأدوات |
| التوزيع | أوزان MIT عبر Hugging Face وModelScope | أوزان MIT مشتقة + خدمات مُدارة رسمية وشركاء |
يحافظ Terminus على نمطي Swift/Think مع نافذة 128 ألف رمز لتحقيق توازن بين السرعة والاستدلال. بينما يضاعف K2-0905 نافذة السياق إلى 256 ألف رمز ويستمر في بنية 1T/32B، ما يمنحه مساحة كافية لمراجعة المستودعات كاملة أو مستندات التصميم الطويلة.
القياسات واستقرار الوكلاء
سجّل Terminus مكاسب على جميع الجبهات مقارنة بنسخة أغسطس:
| المعيار (تكوين الوكيل) | DeepSeek V3.1 (أغسطس 2025) | DeepSeek V3.1 Terminus | Kimi K2-0905 |
|---|---|---|---|
| SWE-bench Multilingual | 54.5 | 57.8 | 55.9 |
| SWE Verified | 66.0 | 68.4 | 69.2 |
| Terminal-bench | 31.3 | 36.7 | 44.5 |
| BrowseComp | 30.0 | 38.5 | غير متوفر |
| LiveCodeBench | 56.4 | 60.0 (تحسّن معدلات النجاح) | 61.0 |
ترسخ هذه القفزات أن تحديث Terminus عالج مشكلة المزج اللغوي ووثّق قوالب الوكلاء. ومع ذلك، يواصل K2-0905 التفوق في Terminal-bench وSWE Verified، بما ينسجم مع تركيزه على سير عمل البرمجة الشاملة.
لقطة تسعير (دولار أمريكي لكل مليون رمز، سبتمبر 2025)
| قناة الوصول | إدخال (ذاكرة مؤقتة) | إدخال (بدون ذاكرة) | إخراج |
|---|---|---|---|
| واجهة DeepSeek بعد 5 سبتمبر | $0.07 | $0.27 | $1.10 |
| Novita بدون خادم لـ K2-0905 | — | $0.60 | $2.50 |
| Groq المستضافة لـ K2-0905 | — | $1.00 | $3.00 |
| بوابة LangDB لـ K2-0905 | — | $0.49 | $1.99 |
أصبحت رسوم Terminus وSwift وThink موحّدة بعد تعديل الأسعار في 5 سبتمبر 2025. أما Kimi فيعتمد سعره على الموزّع: تعرض Novita سعر $0.60 للدخل و$2.50 للخروج، وتقدّم Groq $1.00 و$3.00 مقابل زمن استجابة منخفض، بينما تعلن LangDB عن $0.49 و$1.99 ضمن بوابة موحدة.
ملاحظات حول النظام البيئي والنشر
- نشر مفتوح: يقدّم Terminus أوزان BF16/FP8/FP32 تحت ترخيص MIT، ما يجعله ملائمًا للبيئات ذات المتطلبات التنظيمية أو سيادة البيانات.
- تسريع مُدار: قنوات K2-0905 (Groq، Novita، Kimi Cloud) توفر 60–200+ رمز/ثانية ودعمًا تشغيليًا ضمنيًّا، وهو خيار جذاب للوكلاء الحسّاسين للكمون.
- ثبات متعدد اللغات: ركز تحديث Terminus على إصلاح مزج الإنجليزية بالصينية في قوالب الشيفرة والبحث، ما يقلل الحاجة للتنظيف اليدوي.
- جودة الواجهة الأمامية: تحدد Moonshot تحسن الاستدلال الخاص بمكونات React/Vue، الأمر الذي يخدم فرق التصميم الدقيقة.
قائمة قرار سريعة
- السيناريو الأولي: اختر Terminus إذا كانت جودة الحوار متعدد اللغات والنشر الذاتي من الأولويات. اختر K2-0905 عندما تحتاج إلى نافذة 256K أو أداء أعلى في الأوامر الطرفية.
- تنسيق النماذج: يمكن إسناد التخطيط إلى Terminus (Swift/Think) والتنفيذ إلى Kimi في حلقات البرمجة الطويلة لرفع معدل النجاح.
- التحكم في التكاليف: قارن تكاليف DeepSeek الثابتة مع الأسعار المختلفة لقنوات Kimi (Novita/Groq/LangDB)، إذ قد يتجاوز الفارق أربعة أضعاف.
- الحوكمة: يسمح Terminus بالنشر داخل الشبكات الخاصة بالكامل، بينما يبسّط Kimi المُدار التشغيل لكنه قد يفرض اعتبارات قضائية أو خاصة بالبيانات.
يعتمد الاختيار الصحيح على توقيت الإصدارات، الفروق المعمارية، الأدلة المعيارية، والسعر الفعلي؛ بهذه الصورة يمكن لوحدات الهندسة مطابقة deepseek v3.1 terminus وKimi K2-0905 مع الطبقات الوكيلية الأنسب قبل الدخول في الربع الرابع 2025.