DeepSeek V3.1 Terminus: وكلاء متعددوا اللغات جاهزون للإنتاج
DeepSeek V3.1 Terminus: ما الجديد لبناة الحلول
نظرة على الإصدار
تم إطلاق DeepSeek V3.1 Terminus في 22 سبتمبر 2025 كتطوير موجّه لإصدار 21 أغسطس من DeepSeek V3.1. قامت DeepSeek بالفعل بترقية التطبيق والويب وواجهة البرمجة إلى Terminus، لذلك تستفيد الوكلاء الحالية من التحسينات دون حاجة إلى ترحيل إضافي.
تحسينات متعددة اللغات
تركّز هذه النسخة على تعزيز الاتساق متعدد اللغات. يحتفظ Terminus بنافذة السياق ذات 128 ألف رمز، ويضيف ضبطًا لآليات فك الترميز يقلل الهلوسة عند تبدل اللغات أثناء المحادثة. بالنسبة للفرق التي تبني منتجات عالمية، يعني ذلك وقتًا أقل لإعادة كتابة المطالبات لكل لغة.
أداء الوكلاء
توضح المقاييس التحسن المحقق: يسجل Terminus نتيجة 57.8 في اختبار SWE-bench Multilingual (بعدما كانت 54.5) و62.9 في اختبار MixInstruct 2/8-shot (بعدما كانت 59.2). كما يحقق 68.4 في SWE Verified و91.2 في HumanEval، ما يعكس قدرة استدلال أوسع لدعم سلاسل الوكلاء الأطول.
حزمة الميزات
تظل البنية الأساسية عبارة عن تصميم Mixture-of-Experts بقدرة 685 مليار معلمة، مع تشغيل نحو 37 مليار معلمة لكل رمز. لا يزال بإمكان البناة اختيار وضع Swift (السريع) أو Think (العميق)، إلى جانب أدوات إدارة البيانات والمتجهات المدمجة التي توحّد الاسترجاع والضبط الدقيق داخل منصة واحدة. يمكن اعتماد Terminus دون إعادة بناء خطوط الأنابيب الحالية.
النشر والوصول
تنشر DeepSeek نقاط تحقق Terminus بصيغ BF16 وFP8 (E4M3) وFP32 ضمن ترخيص MIT على Hugging Face، مع مرايا على ModelScope لأحمال العمل في الصين القارية. يسهّل ذلك استهداف مسرّعات مختلفة مع موازنة الدقة والكلفة.
الخطوات التالية
- إعادة تقييم ميزانيات واجهة البرمجة في ضوء أسعار Terminus وSwift وThink المطبقة منذ 5 سبتمبر 2025.
- إعادة تنفيذ اختبارات الأسئلة والأجوبة متعددة اللغات والالتزام بالتعليمات للتحقق من تأثير إعدادات فك الترميز الجديدة.
- تنزيل أحدث نقاط التحقق الخاصة بـ Terminus للاستعداد لعمليات الضبط الدقيق أو التقييم قبل التوسّع في النشر.