Model Comparison
8 minutes دقيقة قراءة
فريق التحليل الذكي

DeepSeek V3.1 Terminus مقابل Kimi K2-0905: دليل اختيار الوكيل للربع الرابع 2025

وتيرة الإصدارات والغرض

طرحت DeepSeek تحديث Terminus في 22 سبتمبر 2025، مع تحسينات في الاتساق متعدد اللغات وتحديثات لوكلاء الشيفرة والبحث دون تعطيل واجهات الويب أو التطبيقات أو واجهة البرمجة. أما Moonshot AI فأصدرت Kimi K2-0905 في 5 سبتمبر 2025 كنسخة سبتمبر من عائلة K2، مع تركيز على البرمجة الوكيلية، وتحسين الواجهات الأمامية، ومضاعفة نافذة السياق.

البنية، السياق، وشكل التوزيع

كلا النموذجين يستخدم بنية MoE، لكن لكل منهما اختيارات مختلفة:

البعدDeepSeek V3.1 TerminusKimi K2-0905
المعاملات الكلية / المفعّلة685 مليار إجماليًا، نحو 37 مليار مفعّلة لكل رمز1 تريليون إجماليًا، 32 مليار مفعّلة لكل استدعاء
عدد الخبراء في الطبقة9 خبراء8 من أصل 384 خبيرًا
نافذة السياق128 ألف رمز256 ألف رمز
أنماط التشغيلSwift (منخفض الكمون) و Think (استدلال عميق)نمط واحد مهيأ للبرمجة المعتمدة على الأدوات
التوزيعأوزان MIT عبر Hugging Face وModelScopeأوزان MIT مشتقة + خدمات مُدارة رسمية وشركاء

يحافظ Terminus على نمطي Swift/Think مع نافذة 128 ألف رمز لتحقيق توازن بين السرعة والاستدلال. بينما يضاعف K2-0905 نافذة السياق إلى 256 ألف رمز ويستمر في بنية 1T/32B، ما يمنحه مساحة كافية لمراجعة المستودعات كاملة أو مستندات التصميم الطويلة.

القياسات واستقرار الوكلاء

سجّل Terminus مكاسب على جميع الجبهات مقارنة بنسخة أغسطس:

المعيار (تكوين الوكيل)DeepSeek V3.1 (أغسطس 2025)DeepSeek V3.1 TerminusKimi K2-0905
SWE-bench Multilingual54.557.855.9
SWE Verified66.068.469.2
Terminal-bench31.336.744.5
BrowseComp30.038.5غير متوفر
LiveCodeBench56.460.0 (تحسّن معدلات النجاح)61.0

ترسخ هذه القفزات أن تحديث Terminus عالج مشكلة المزج اللغوي ووثّق قوالب الوكلاء. ومع ذلك، يواصل K2-0905 التفوق في Terminal-bench وSWE Verified، بما ينسجم مع تركيزه على سير عمل البرمجة الشاملة.

لقطة تسعير (دولار أمريكي لكل مليون رمز، سبتمبر 2025)

قناة الوصولإدخال (ذاكرة مؤقتة)إدخال (بدون ذاكرة)إخراج
واجهة DeepSeek بعد 5 سبتمبر$0.07$0.27$1.10
Novita بدون خادم لـ K2-0905$0.60$2.50
Groq المستضافة لـ K2-0905$1.00$3.00
بوابة LangDB لـ K2-0905$0.49$1.99

أصبحت رسوم Terminus وSwift وThink موحّدة بعد تعديل الأسعار في 5 سبتمبر 2025. أما Kimi فيعتمد سعره على الموزّع: تعرض Novita سعر $0.60 للدخل و$2.50 للخروج، وتقدّم Groq $1.00 و$3.00 مقابل زمن استجابة منخفض، بينما تعلن LangDB عن $0.49 و$1.99 ضمن بوابة موحدة.

ملاحظات حول النظام البيئي والنشر

  • نشر مفتوح: يقدّم Terminus أوزان BF16/FP8/FP32 تحت ترخيص MIT، ما يجعله ملائمًا للبيئات ذات المتطلبات التنظيمية أو سيادة البيانات.
  • تسريع مُدار: قنوات K2-0905 (Groq، Novita، Kimi Cloud) توفر 60–200+ رمز/ثانية ودعمًا تشغيليًا ضمنيًّا، وهو خيار جذاب للوكلاء الحسّاسين للكمون.
  • ثبات متعدد اللغات: ركز تحديث Terminus على إصلاح مزج الإنجليزية بالصينية في قوالب الشيفرة والبحث، ما يقلل الحاجة للتنظيف اليدوي.
  • جودة الواجهة الأمامية: تحدد Moonshot تحسن الاستدلال الخاص بمكونات React/Vue، الأمر الذي يخدم فرق التصميم الدقيقة.

قائمة قرار سريعة

  1. السيناريو الأولي: اختر Terminus إذا كانت جودة الحوار متعدد اللغات والنشر الذاتي من الأولويات. اختر K2-0905 عندما تحتاج إلى نافذة 256K أو أداء أعلى في الأوامر الطرفية.
  2. تنسيق النماذج: يمكن إسناد التخطيط إلى Terminus (Swift/Think) والتنفيذ إلى Kimi في حلقات البرمجة الطويلة لرفع معدل النجاح.
  3. التحكم في التكاليف: قارن تكاليف DeepSeek الثابتة مع الأسعار المختلفة لقنوات Kimi (Novita/Groq/LangDB)، إذ قد يتجاوز الفارق أربعة أضعاف.
  4. الحوكمة: يسمح Terminus بالنشر داخل الشبكات الخاصة بالكامل، بينما يبسّط Kimi المُدار التشغيل لكنه قد يفرض اعتبارات قضائية أو خاصة بالبيانات.

يعتمد الاختيار الصحيح على توقيت الإصدارات، الفروق المعمارية، الأدلة المعيارية، والسعر الفعلي؛ بهذه الصورة يمكن لوحدات الهندسة مطابقة deepseek v3.1 terminus وKimi K2-0905 مع الطبقات الوكيلية الأنسب قبل الدخول في الربع الرابع 2025.

مقالات ذات صلة

في 13 أبريل 2026، أكدت Moonshot AI رسمياً أن Kimi K2.6 Code Preview قد دخل مرحلة الاختبار التجريبي. يقدم هذا النموذج من الجيل التالي، المبني على بنية MoE بتريليون معامل، تحسينات كبيرة في توليد الأكواد وقدرات الوكلاء.
تعلن OpenClaw عن إتاحة الوصول المجاني إلى نموذج Kimi k2.5 الذي أطلقته Moonshot AI حديثًا لجميع المستخدمين، مما يجعل هذا المزيج أبرز اتجاه تقني في أوائل عام 2026.
يعتمد Kimi k2.5 بنية متعددة الوسائط أصلية (Native Multimodal Architecture)، مما يعني أنه لا يفهم الصور فحسب، بل يدرك أيضًا تدفق الوقت ومنطق التفاعل في مقاطع الفيديو. تتعمق هذه المقالة في ميزته الأساسية 'الترميز المرئي'.