DeepSeek V3.1 Terminus: 프로덕션을 위한 다국어 에이전트
DeepSeek V3.1 Terminus: 빌더를 위한 핵심 업데이트
출시 개요
DeepSeek V3.1 Terminus는 2025년 9월 22일에 공개되었으며, 8월 21일 발표된 DeepSeek V3.1을 정밀하게 다듬은 버전입니다. DeepSeek 앱·웹·API는 이미 Terminus로 전환되었으므로, 기존 에이전트는 추가 마이그레이션 없이 개선사항을 바로 누릴 수 있습니다.
다국어 향상
이번 릴리스는 다국어 품질에 초점을 맞춥니다. 128K 토큰 컨텍스트를 유지하면서, 언어가 전환되는 상황에서 발생하는 환각을 줄이기 위한 디코딩 최적화가 적용되었습니다. 글로벌 시장을 겨냥한 팀이라면 각 언어별로 프롬프트를 반복 수정하는 시간을 크게 줄일 수 있습니다.
에이전트 성능
지표 또한 향상되었습니다. Terminus는 SWE-bench Multilingual에서 57.8점(이전 54.5점), MixInstruct 2/8-shot에서 62.9점(이전 59.2점)을 기록했습니다. SWE Verified 68.4점, HumanEval Pass@1 91.2점도 달성해, 더 긴 에이전트 체인을 운영하기에 필요한 추론 능력을 보여줍니다.
기능 스택
기본 아키텍처는 685B 파라미터의 Mixture-of-Experts 설계를 유지하며, 토큰당 약 37B 파라미터가 활성화됩니다. 빌더는 여전히 Swift(속도 우선)와 Think(심층 추론) 추론 모드를 선택할 수 있고, 통합 데이터 및 벡터 관리 도구를 통해 리트리벌과 파인튜닝을 하나의 제어면에서 다룰 수 있습니다. 덕분에 기존 파이프라인을 다시 설계할 필요가 없습니다.
배포와 접근
DeepSeek은 Terminus 체크포인트를 BF16, FP8(E4M3), FP32 정밀도로 MIT 라이선스 하에 Hugging Face에 공개했으며, 중국 본토 워크로드를 위한 ModelScope 미러도 제공합니다. 원하는 정밀도와 비용 구조에 맞춰 다양한 가속기 환경에서 쉽게 도입할 수 있습니다.
다음 단계
- 2025년 9월 5일부터 적용된 Terminus·Swift·Think 요금을 반영해 API 예산을 재검토합니다.
- 새로운 디코딩 설정을 기준으로 다국어 QA 및 지시 준수 테스트를 다시 수행해 동작을 확인합니다.
- 최신 Terminus 체크포인트를 내려받아 대규모 배포 전에 파인튜닝 또는 평가 파이프라인을 준비합니다.