Model Update
6 minutes 분 읽기
DeepSeek Insights Team

DeepSeek V3.1 Terminus: 프로덕션을 위한 다국어 에이전트

DeepSeek V3.1 Terminus: 빌더를 위한 핵심 업데이트

출시 개요

DeepSeek V3.1 Terminus는 2025년 9월 22일에 공개되었으며, 8월 21일 발표된 DeepSeek V3.1을 정밀하게 다듬은 버전입니다. DeepSeek 앱·웹·API는 이미 Terminus로 전환되었으므로, 기존 에이전트는 추가 마이그레이션 없이 개선사항을 바로 누릴 수 있습니다.

다국어 향상

이번 릴리스는 다국어 품질에 초점을 맞춥니다. 128K 토큰 컨텍스트를 유지하면서, 언어가 전환되는 상황에서 발생하는 환각을 줄이기 위한 디코딩 최적화가 적용되었습니다. 글로벌 시장을 겨냥한 팀이라면 각 언어별로 프롬프트를 반복 수정하는 시간을 크게 줄일 수 있습니다.

에이전트 성능

지표 또한 향상되었습니다. Terminus는 SWE-bench Multilingual에서 57.8점(이전 54.5점), MixInstruct 2/8-shot에서 62.9점(이전 59.2점)을 기록했습니다. SWE Verified 68.4점, HumanEval Pass@1 91.2점도 달성해, 더 긴 에이전트 체인을 운영하기에 필요한 추론 능력을 보여줍니다.

기능 스택

기본 아키텍처는 685B 파라미터의 Mixture-of-Experts 설계를 유지하며, 토큰당 약 37B 파라미터가 활성화됩니다. 빌더는 여전히 Swift(속도 우선)와 Think(심층 추론) 추론 모드를 선택할 수 있고, 통합 데이터 및 벡터 관리 도구를 통해 리트리벌과 파인튜닝을 하나의 제어면에서 다룰 수 있습니다. 덕분에 기존 파이프라인을 다시 설계할 필요가 없습니다.

배포와 접근

DeepSeek은 Terminus 체크포인트를 BF16, FP8(E4M3), FP32 정밀도로 MIT 라이선스 하에 Hugging Face에 공개했으며, 중국 본토 워크로드를 위한 ModelScope 미러도 제공합니다. 원하는 정밀도와 비용 구조에 맞춰 다양한 가속기 환경에서 쉽게 도입할 수 있습니다.

다음 단계

  • 2025년 9월 5일부터 적용된 Terminus·Swift·Think 요금을 반영해 API 예산을 재검토합니다.
  • 새로운 디코딩 설정을 기준으로 다국어 QA 및 지시 준수 테스트를 다시 수행해 동작을 확인합니다.
  • 최신 Terminus 체크포인트를 내려받아 대규모 배포 전에 파인튜닝 또는 평가 파이프라인을 준비합니다.

관련 기사

Moonshot AI가 Kimi K2.6을 공식 출하했습니다. Code Preview 브랜치를 12시간 자율 코딩 세션, 300개 에이전트 스웜, 풀스택 생성에 최적화된 일반 제공 모델로 승격시켰습니다. 무엇이 변했는지, 그 의미는 무엇인지, 어떻게 활용할 수 있는지 살펴봅니다.
Kimi K2.6에 대해 흥미로운 질문은 그것이 무엇을 하는가가 아니다 — 어떤 종류의 모델을 위해 명백히 구축되고 있는가다. 12시간 실행, 300개 에이전트 군집, 컨텍스트 압축기를 하중을 지지하는 인프라로 취급하면 K3의 윤곽이 보이기 시작한다.
2026년 4월 13일, Moonshot AI는 Kimi K2.6 Code Preview가 베타 테스트에 진입했음을 공식 확인했습니다. 1조 파라미터 MoE 아키텍처 기반의 이 차세대 모델은 코드 생성과 에이전트 기능에서 상당한 개선을 제공합니다.