DeepSeek V3.1 Terminus: üretime hazır çok dilli ajanlar
DeepSeek V3.1 Terminus: geliştiriciler için öne çıkanlar
Sürüm özeti
DeepSeek V3.1 Terminus, 21 Ağustos sürümünün hedefli bir iyileştirmesi olarak 22 Eylül 2025'te yayınlandı. DeepSeek, uygulama, web ve API katmanlarını Terminus'a taşıdı; bu nedenle mevcut ajanlar ek göç adımı olmadan yeniliklerden faydalanır.
Çok dilli iyileştirmeler
Bu sürüm çok dilli kaliteye odaklanıyor. Terminus, 128 bin token'lık bağlam penceresini korurken, sohbetin dil değiştirdiği durumlarda görülen halüsinasyonları azaltan kod çözücü ayarlamaları sunuyor. Küresel ürünler sunan ekipler için bu, her dil için prompt'u tekrar yazmaya daha az zaman harcamak anlamına gelir.
Ajan performansı
Benchmark sonuçları ilerlemeyi destekliyor: Terminus, SWE-bench Multilingual'de 57,8 (önceden 54,5) ve MixInstruct 2/8-shot'ta 62,9 (önceden 59,2) puana ulaşıyor. Model ayrıca SWE Verified'da 68,4 ve HumanEval'de 91,2 Pass@1 sonuçlarına sahip; bu da daha uzun ajan zincirleri için gereken akıl yürütme gücünü gösteriyor.
Özellik yığını
Temel mimari, token başına yaklaşık 37 milyar parametreyi etkinleştiren 685 milyar parametreli bir Mixture-of-Experts tasarımı olarak kalıyor. Geliştiriciler hâlâ hız odaklı Swift ve derin düşünme odaklı Think çıkarım modları arasında seçim yapabilir ve retrieval ile fine-tuning'i tek kontrol düzleminde birleştiren yerleşik veri ve vektör yönetim araçlarından yararlanabilir. Terminus'u mevcut hatlara yeniden mimari oluşturmadan dahil edebilirsiniz.
Dağıtım ve erişim
DeepSeek, Terminus checkpoint'lerini BF16, FP8 (E4M3) ve FP32 biçimlerinde MIT lisansı altında Hugging Face üzerinde yayınlıyor; anakara Çin iş yükleri için ModelScope aynaları da mevcut. Böylece farklı hızlandırıcı yığınlarını hedeflerken doğruluk ve maliyeti dengede tutmak daha kolay.
Sonraki adımlar
- 5 Eylül 2025'ten beri geçerli olan Terminus, Swift ve Think fiyatlandırmasını dikkate alarak API bütçelerini yeniden değerlendirin.
- Yeni kod çözücü varsayılanlarıyla davranışı doğrulamak için çok dilli QA ve talimat takip testlerini yeniden çalıştırın.
- Geniş ölçekli yayından önce fine-tuning veya değerlendirme hatlarını hazırlamak üzere en güncel Terminus checkpoint'lerini indirin.