Model Update
6 minutes dakika okuma
DeepSeek Insights Team

DeepSeek V3.1 Terminus: üretime hazır çok dilli ajanlar

DeepSeek V3.1 Terminus: geliştiriciler için öne çıkanlar

Sürüm özeti

DeepSeek V3.1 Terminus, 21 Ağustos sürümünün hedefli bir iyileştirmesi olarak 22 Eylül 2025'te yayınlandı. DeepSeek, uygulama, web ve API katmanlarını Terminus'a taşıdı; bu nedenle mevcut ajanlar ek göç adımı olmadan yeniliklerden faydalanır.

Çok dilli iyileştirmeler

Bu sürüm çok dilli kaliteye odaklanıyor. Terminus, 128 bin token'lık bağlam penceresini korurken, sohbetin dil değiştirdiği durumlarda görülen halüsinasyonları azaltan kod çözücü ayarlamaları sunuyor. Küresel ürünler sunan ekipler için bu, her dil için prompt'u tekrar yazmaya daha az zaman harcamak anlamına gelir.

Ajan performansı

Benchmark sonuçları ilerlemeyi destekliyor: Terminus, SWE-bench Multilingual'de 57,8 (önceden 54,5) ve MixInstruct 2/8-shot'ta 62,9 (önceden 59,2) puana ulaşıyor. Model ayrıca SWE Verified'da 68,4 ve HumanEval'de 91,2 Pass@1 sonuçlarına sahip; bu da daha uzun ajan zincirleri için gereken akıl yürütme gücünü gösteriyor.

Özellik yığını

Temel mimari, token başına yaklaşık 37 milyar parametreyi etkinleştiren 685 milyar parametreli bir Mixture-of-Experts tasarımı olarak kalıyor. Geliştiriciler hâlâ hız odaklı Swift ve derin düşünme odaklı Think çıkarım modları arasında seçim yapabilir ve retrieval ile fine-tuning'i tek kontrol düzleminde birleştiren yerleşik veri ve vektör yönetim araçlarından yararlanabilir. Terminus'u mevcut hatlara yeniden mimari oluşturmadan dahil edebilirsiniz.

Dağıtım ve erişim

DeepSeek, Terminus checkpoint'lerini BF16, FP8 (E4M3) ve FP32 biçimlerinde MIT lisansı altında Hugging Face üzerinde yayınlıyor; anakara Çin iş yükleri için ModelScope aynaları da mevcut. Böylece farklı hızlandırıcı yığınlarını hedeflerken doğruluk ve maliyeti dengede tutmak daha kolay.

Sonraki adımlar

  • 5 Eylül 2025'ten beri geçerli olan Terminus, Swift ve Think fiyatlandırmasını dikkate alarak API bütçelerini yeniden değerlendirin.
  • Yeni kod çözücü varsayılanlarıyla davranışı doğrulamak için çok dilli QA ve talimat takip testlerini yeniden çalıştırın.
  • Geniş ölçekli yayından önce fine-tuning veya değerlendirme hatlarını hazırlamak üzere en güncel Terminus checkpoint'lerini indirin.

İlgili Makaleler

Moonshot AI, Kimi K2.6'yı resmi olarak piyasaya sürdü; Code Preview dalını 12 saatlik özerk kodlama oturumları, 300 ajanlı sürüler ve tam yığın oluşturma için tasarlanmış genel kullanıma açık bir modele yükseltti. Ne değişti, ne anlama geliyor ve nasıl kullanılır.
Kimi K2.6 hakkındaki ilginç soru ne yaptığı değil — açıkça hangi tür modeli barındırmak için inşa edildiğidir. 12 saatlik çalışmaları, 300 ajanlı sürüleri ve bağlam sıkıştırıcıyı yük taşıyan altyapı olarak ele aldığınızda K3'ün şekli görünür hale gelir.
13 Nisan 2026'da Moonshot AI, Kimi K2.6 Code Preview'ın beta test aşamasına girdiğini resmi olarak doğruladı. Bir trilyon parametreli MoE mimarisi üzerine inşa edilen bu yeni nesil model, kod üretimi ve ajan yeteneklerinde önemli iyileştirmeler sunuyor.