Yeni Model Sürümü
10 dk dakika okuma
AI Observer

Kimi K2.6 Resmi Olarak Yayında: Ajanlı Kodlama Çağı Üretime Giriyor

Sekiz Günde Önizlemeden GA'ya

26 Nisan 2026'da Moonshot AI, beta test kullanıcılarının Kimi K2.6 Code Preview'u çalıştırdığını e-posta yoluyla sessizce doğruladı. Sekiz gün sonra şirket "Preview" etiketini kaldırarak Kimi K2.6'yı Kimi.com, Kimi Uygulaması, resmi API ve Kimi Code CLI genelinde genel kullanıma açık bir model olarak yayımladı.

Bu, K2 serisi tarihindeki en hızlı önizlemeden GA'ya geçişlerinden biridir; dahili kalite çıtasının çoktan aşıldığını ve ortak değerlendirmelerinin (Vercel, Factory.ai, CodeBuddy) sürümü doğrulamak için yeterince uzun süre çalıştırıldığını gösteren bir sinyal. Temmuz 2025'teki açık kaynak debutundan bu yana K2 yol haritasını takip eden ekipler için K2.6, "ajanlı kodlama"nın demo olmaktan çıkıp altyapıya dönüştüğü sürümdür.

K2.5'e Kıyasla Gerçekte Ne Değişti

Manşet, tek bir kıyaslama noktası değil; süre, kapsam ve koordinasyondur. K2.5 bir kodlama görevini birkaç yüz adım boyunca sürdürebildi. K2.6 ise bunu on iki saat ve dört bin koordineli adım boyunca, tek bir sürüdeki 300'e kadar alt ajana yayarak sürdürecek şekilde tasarlandı.

Ortakların K2.5'e kıyasla bildirdiği farklar:

OrtakBildirilen İyileştirme
CodeBuddyKod üretme doğruluğu +%12, uzun bağlam kararlılığı +%18
Vercelİç Next.js kıyaslamasında >%50 iyileşme
Factory.aiHer iki değerlendirme kıyaslamasında +%15

Bunlar Moonshot'ın kendi pazarlama eğrileri değil; bağımsız üçüncü taraf rakamlar; işte bu yüzden önemli.

Yayımlanan kıyaslama öne çıkanları

  • Terminal-Bench 2.0: %66.7
  • SWE-Bench Pro: %58.6
  • MathVision (Python araç kullanımıyla): %93.2

SWE-Bench Pro, daha kolay "tek dosya düzeltme" sorunlarını filtreleyen daha zorlu bir SWE-Bench kesiti; dolayısıyla %58.6, K2.5'in SWE-Bench Verified'da bildirdiği %76.8 ile doğrudan karşılaştırılamaz. Pro'yu yeni dürüst tavan olarak okuyun.

12 Saatlik Çalışmaları Mümkün Kılan Mimari

K2.6, K2 serisinin Temmuz 2025'ten bu yana taşıdığı trilyon parametreli MoE omurgasını (toplam 1T / etkin 32B / token başına 8'i aktive olan 384 uzman, MLA attention, SwiGLU, MuonClip ile stabilize edilmiş eğitim) korur. Yeni olan, etrafındaki yürütme katmanıdır:

  1. Bağlam penceresi 262.144 tokena yükseltildi. K2.5 Code Preview'daki 256K'dan artırılarak, orta büyüklükte bir monorepoyu test çıktısı ve ajanın kendi not defteriyle birlikte kırpılmadan kaynaklanan sapmalar yaşanmadan tutabilecek kapasiteye ulaştı.
  2. Otomatik bağlam sıkıştırma. Model, pencere sınırına yaklaşırken kendi geçmişini özetler ve gereksiz kısımları ayıklar; böylece 12 saatlik oturumun dokuzuncu saatte kayıplı bir geri çağrıya dönüşmesi önlenir.
  3. Ajan sürü orkestrasyonu. 300'e kadar alt ajanı başlatmak, zamanlamak ve uzlaştırmak için yerel ilkeller. 4.000 adımlı koordinasyon rakamını anlamlı kılan bu yetenektir; tek bir ajan, tutarlı bir planda 4.000 araç çağrısını pratik olarak gerçekleştiremez, ancak denetçi artı çalışan topolojisi bunu yapabilir.
  4. Proaktif özerklik. K2.6, insan sırası beklemek yerine bir görev kuyruğuna karşı 7/24 çalışacak şekilde ayarlanmıştır. Asıl optimizasyon ham verim değil; "takıldım" durumunu tanıyıp ilerleme halüsinasyonu yapmak yerine yeniden planlama ya da eskalasyon yapabilme becerisidir.

Moonshot'ın Gerçekten Piyasaya Sürdüğü Üç Kullanım Senaryosu

Kimi ekibi sürümle birlikte üç referans çalışması yayımladı. Bunları yalnızca pazarlama malzemesi olarak değil, var olma kanıtı olarak okumaya değer.

1. Zig'de çıkarım optimizasyonu

K2.6, Qwen3.5-0.8B'yi yerel olarak Zig'de dağıtarak aynı donanımda LM Studio'nun referans yolundan yaklaşık %20 daha hızlı olan saniyede ~193 token hıza ulaştı. İlginç olan verim rakamı değil; modelin Python veya Rust'a kıyasla eğitim gövdesi son derece küçük bir dil olan Zig'i seçmesine karşın çalışan bir düşük seviyeli çalışma zamanı üretmesidir. Sistem işleri söz konusu olduğunda bu, önem taşıyan yetenek sınırıdır.

2. Gerçek bir kod tabanında performans mühendisliği

Açık kaynaklı exchange-core finansal eşleştirme motoru verildiğinde K2.6, ortanca verimde %185 iyileştirme sağladı. Bu iş; tanımadığı bir Java kod tabanını okumayı, sık erişilen yolları belirlemeyi ve eşleştirme değişmezlerini bozmadan bunları yeniden yazmayı kapsıyordu. Bu, "yeni bir projede kıdemli mühendis" iş yüküdür ve önceki modellerin çoğunun sessizce başarısız olduğu senaryodur; yüzeysel olarak makul görünen ancak doğruluğu gerileyen yamalar üretirler.

3. Tasarımdan koda tam yığın oluşturma

K2.6, animasyonlu tam ön uç arayüzler oluşturuyor ve bunları kimlik doğrulama ile veritabanlarına bağlıyor. Vercel'in Next.js kıyaslamasındaki >%50 iyileşme doğrudan buna karşılık geliyor; App Router, Server Components ve çevresindeki ekosistem, çoğu modelin hâlâ API halüsinasyonu yaşadığı alanlar olup K2.6'nın bu açığı büyük ölçüde kapattığı görülüyor.

K2.6'nın K2 Zaman Çizelgesindeki Yeri

SürümYayım TarihiÖne Çıkan Yetenek
Kimi K2Tem 2025Trilyon parametreli MoE, Apache 2.0 açık kaynak
K2-Instruct-0905Eyl 2025SWE-bench Verified'da %69.2
K2-ThinkingKas 2025Düşünce zinciri akıl yürütme
K2.5Oca 2026Çok modlu + Agent Swarm v1
K2.6 Code Preview13 Nis 2026Uzun vadeli kodlama betası
K2.6 (GA)21 Nis 202612 saatlik çalışmalar, 300 ajanlı sürüler, tam yığın oluşturma

Moonshot, neredeyse bir yıldır 2-3 aylık büyük güncelleme tempusunu koruyor. K2.6, önizleme ile GA arasındaki sürenin aylar yerine günlerle ölçüldüğü ilk sürüm; bu, bir sonraki sürümün (K3) aynı sıkıştırılmış takvimde gelebileceğine işaret etmesi bakımından önemli.

Başlarken

K2.6 bugün dört platformda kullanıma hazır:

  • Kimi.com ve Kimi Uygulaması — ajan sürü çalışmalarını etkileşimli olarak denemenin en hızlı yolu.
  • Resmi API — varsayılan örnekleme temperature=1.0, top_p=1.0. Bu değerleri refleks olarak düşürmeyin; ajanlık döngüsü bu ayarlarla ayarlandı.
  • Kimi Code CLI — uzun vadeli kodlama için önerilen giriş noktası. Araç çağrılarını, dosya sistemi erişimini ve sürü denetçisini varsayılan olarak bağlar.
  • Fiyatlandırma — güncel katmanlar için kimi.com/membership/pricing'i inceleyin. Uzun özerk çalışmalar önemli miktarda token tüketir; isteğe değil, oturuma göre bütçe planlayın.

Uzun çalışmalar için pratik rehber

  • Soru değil, kuyruk verin. K2.6 proaktif çalışma için ayarlandı. Çekebileceği bir görev listesi, tek bir istemin çok üzerinde performans gösterir.
  • Sıkıştırmasına izin verin. Turlar arasında bağlamı manuel olarak kırpmayın; yerleşik sıkıştırıcı, ihtiyaç duyduğu değişmezleri korumada daha başarılıdır.
  • Sürüleri plan düzeyinde denetleyin. 300 alt ajan orkestrasyonu yapıyorsanız, her araç çağrısını değil planı gözden geçirin. Modelin Token Enforcer'ı çağrı formatı doğruluğunu yönetir; sizin işiniz yönü denetlemektir.
  • Claude'dan aşamalı geçiş yapın. API, Anthropic uyumluluğunu korur; dolayısıyla mevcut Claude Code iş akışları, istemleri değiştirmeden önce temel URL'leri değiştirebilir.

Bu Durum K3 Söylentisi Açısından Ne Anlama Geliyor

K2.6'dan önce gündeme gelen Reddit sızıntısı aynı zamanda Kimi K3'ten de söz ediyordu; bu sürümün, önde gelen Amerikan modellerinin ölçeğine ulaşmak amacıyla 3-4 trilyon parametre hedeflediği belirtiliyordu. K2.6 GA sürümü, bu söylentiye daha fazla ağırlık kazandırıyor: 12 saatlik yürütme zarfı ve 300 ajanlı sürü, daha büyük bir temel modele temiz biçimde ölçeklenen yetenekler olup Moonshot, onu değerlendirecek daha büyük bir model gelmeseydi yürütme katmanı altyapısına bu yatırımı yapmazdı.

K2.6 son nokta değil. K3 geldiğinde çalışacağı yeri hazırlamak için inşa edilen bir kablo demeti.


Kaynaklar: kimi.com/blog/kimi-k2-6'daki Moonshot AI resmi sürüm notları, CodeBuddy, Vercel ve Factory.ai ortak açıklamaları ve önceki K2 serisi teknik raporları. Kıyaslama rakamları, 21 Nisan 2026 itibarıyla satıcıların yayımladığı sayıları yansıtmaktadır.

İlgili Makaleler

Kimi K2.7 Code yayınlandı. Bu yazıda Kimi K2.7 ve Kimi Code ilişkisini, 256K bağlamı, thinking modunu, çok modlu girdiyi, agent iş akışlarını, fiyatı ve geliştirici kullanım alanlarını açıklıyoruz.
Kimi Code artık Kimi K2.7 Code ile çalışıyor. Bu rehber kimi-k2.7-code model ID'sini, Claude Code ortam değişkenlerini, Cline/RooCode ayarlarını, API kullanımını, maliyet kontrolünü ve prompt şablonlarını anlatır.
Kimi size herkese açık bir site bağlantısı verdiyse, site paylaşım için zaten yayındadır. Bu rehber Kimi bağlantısını ne zaman kullanacağınızı, kodu ne zaman dışa aktaracağınızı ve siteyi kendi hostinginize nasıl taşıyacağınızı açıklar.