Model Update
6 minutes 分読み取り
DeepSeek Insights Team

DeepSeek V3.1 Terminus:プロダクション向け多言語エージェント

DeepSeek V3.1 Terminus:ビルダーのための最新情報

リリース概要

DeepSeek V3.1 Terminus は 2025 年 9 月 22 日に登場し、8 月 21 日版を狙い撃ちでブラッシュアップしました。DeepSeek のアプリ、Web、API はすでに Terminus へ更新されており、既存のエージェントは追加作業なしで改良点を受け取れます。

多言語での進化

今回の Terminus は多言語品質に重点を置いています。128K トークンのコンテキストはそのままに、クロスリンガルな対話での整合性と、質問応答時の幻覚抑制が向上しました。英語要件からローカル実装へ橋渡しするチームほど、プロンプト調整にかかる手間を減らせます。

エージェントの信頼性

指標面でも改善が見られます。Terminus は SWE-bench Multilingual で 57.8(従来版 54.5)、MixInstruct 2/8-shot で 62.9(従来版 59.2)を記録しました。さらに SWE Verified では 68.4、HumanEval Pass@1 では 91.2 を達成し、長いエージェントチェーンに求められる推論力を示しています。

プロダクション対応の機能群

Terminus は 685B パラメータの Mixture-of-Experts バックボーンを継承し、1 トークンあたりおよそ 37B パラメータを動的に活性化します。高速実行向けの Swift モードと深い推論向けの Think モード、そしてデータセット・ベクトル管理を統合したツール群により、既存パイプラインを変えることなく導入できます。

デプロイと入手性

MIT ライセンスのもとで、BF16・FP8(E4M3)・FP32 精度の Terminus チェックポイントが Hugging Face に公開され、ModelScope には中国本土向けミラーが用意されています。クラウド GPU でもオンプレミスのアクセラレータでも、要件に合わせた精度とコストで微調整や蒸留を進められます。

次のステップ

  • 2025 年 9 月 5 日に適用された Terminus/Swift/Think の料金を踏まえて API 予算を見直す。
  • 多言語 QA や指示追従のテストを再実行し、新しいデコーディング設定での挙動を確認する。
  • 最新の Terminus チェックポイントを取得し、大規模展開に向けたファインチューニングや評価を準備する。

関連記事

Moonshot AIがKimi K2.6を正式出荷しました。Code Previewブランチを一般提供モデルへと昇格させ、12時間の自律コーディングセッション、300エージェントのスウォーム、フルスタック生成に対応しています。何が変わったのか、それが何を意味するのか、そしてどう活用するかを解説します。
Kimi K2.6について問うべき興味深い問いは、それが何をするかではなく、どのような種類のモデルを明らかにホストするために構築されているかだ。12時間実行、300エージェントの群れ、コンテキスト圧縮機を荷重を支えるインフラとして捉えると、K3の輪郭が見えてくる。
2026年4月13日、Moonshot AIはKimi K2.6 Code Previewのベータテスト開始を正式に確認しました。1兆パラメータのMoEアーキテクチャを基盤とするこの次世代モデルは、コード生成とエージェント機能で大幅な向上を実現しています。