DeepSeek V3.1 Terminus:プロダクション向け多言語エージェント
DeepSeek V3.1 Terminus:ビルダーのための最新情報
リリース概要
DeepSeek V3.1 Terminus は 2025 年 9 月 22 日に登場し、8 月 21 日版を狙い撃ちでブラッシュアップしました。DeepSeek のアプリ、Web、API はすでに Terminus へ更新されており、既存のエージェントは追加作業なしで改良点を受け取れます。
多言語での進化
今回の Terminus は多言語品質に重点を置いています。128K トークンのコンテキストはそのままに、クロスリンガルな対話での整合性と、質問応答時の幻覚抑制が向上しました。英語要件からローカル実装へ橋渡しするチームほど、プロンプト調整にかかる手間を減らせます。
エージェントの信頼性
指標面でも改善が見られます。Terminus は SWE-bench Multilingual で 57.8(従来版 54.5)、MixInstruct 2/8-shot で 62.9(従来版 59.2)を記録しました。さらに SWE Verified では 68.4、HumanEval Pass@1 では 91.2 を達成し、長いエージェントチェーンに求められる推論力を示しています。
プロダクション対応の機能群
Terminus は 685B パラメータの Mixture-of-Experts バックボーンを継承し、1 トークンあたりおよそ 37B パラメータを動的に活性化します。高速実行向けの Swift モードと深い推論向けの Think モード、そしてデータセット・ベクトル管理を統合したツール群により、既存パイプラインを変えることなく導入できます。
デプロイと入手性
MIT ライセンスのもとで、BF16・FP8(E4M3)・FP32 精度の Terminus チェックポイントが Hugging Face に公開され、ModelScope には中国本土向けミラーが用意されています。クラウド GPU でもオンプレミスのアクセラレータでも、要件に合わせた精度とコストで微調整や蒸留を進められます。
次のステップ
- 2025 年 9 月 5 日に適用された Terminus/Swift/Think の料金を踏まえて API 予算を見直す。
- 多言語 QA や指示追従のテストを再実行し、新しいデコーディング設定での挙動を確認する。
- 最新の Terminus チェックポイントを取得し、大規模展開に向けたファインチューニングや評価を準備する。