Kimi K2.5 Resmen Yayınlandı: Native Vision ve Agent Swarm'ın Tam Evrimi
Kimi K2.5 Resmen Yayınlandı: Native Vision ve Agent Swarm'ın Tam Evrimi
Native Multimodality'de Yeni Zirveler
Moonshot AI bugün Kimi K2.5'i resmen yayınladı. Bu sadece bir sürüm yinelemesi değil, aynı zamanda Yapay Genel Zekaya (AGI) doğru atılmış sağlam bir adımdır. Kimi K2 üzerine inşa edilen K2.5, tamamen Native Multimodal bir mimari oluşturmak için yaklaşık 15 trilyon (15T) karışık görme ve metin token'ı üzerinde sürekli bir ön eğitimden geçirildi.

Şekil: Kimi K2.5 ve Claude Opus 4.5'in temel yetenekler üzerinde karşılaştırılması, multimodalite ve akıl yürütme alanlarındaki kapsamlı gücünü göstermektedir.
Bu mimari atılım, K2.5'e fiziksel dünya hakkında son derece güçlü bir algı kazandırarak üç ana boyutta yıkıcı yükseltmeler sağlar: Coding with Vision, Agent Swarm ve Office Productivity.
1. Coding with Vision: Ne Görüyorsan Onu Kodlarsın
Kimi K2.5, "bugüne kadarki en güçlü açık kaynaklı kodlama modeli" olarak resmen tanımlanmakta ve özellikle frontend geliştirme alanında hakimiyet göstermektedir.
- Görsel Etkileşimden Koda: K2.5, basit konuşmaları doğrudan eksiksiz frontend arayüzlerine dönüştürebilir, etkileşimli düzenleri ve zengin animasyon efektlerini (kaydırma tetikleyicileri gibi) doğru bir şekilde uygulayabilir.
- Video Olarak Kod: Statik görüntülerin ötesinde, K2.5 video içeriği üzerinde akıl yürüterek web sitelerini yeniden oluşturabilir. Örneğin, bir web sitesindeki etkileşimlerin bir videosunu izleyebilir, ardından altta yatan kod mantığını ve stilini geri yükleyebilir.
- Büyük Ölçekli Görme-Metin Ortak Ön Eğitimi: Bu yetenek, görsel anlama ve metin kodlama yeteneklerinin iyileştirilmesini senkronize eden, geleneksel modellerde bulunan görme ve mantık arasındaki kopukluğu ortadan kaldıran büyük ölçekli ortak ön eğitimden kaynaklanmaktadır.
Dahili değerlendirmelerde, K2.5 karmaşık labirent yol bulma problemlerini çözerek, BFS algoritmasını kullanarak 4.5 megapiksellik bir labirentte en kısa yolu bulmuş ve görselleştirilmiş bir çözüm süreci oluşturarak güçlü görsel akıl yürütme yeteneklerini kanıtlamıştır.
2. Agent Swarm: Ajanların Kovan Zihni (Araştırma Önizlemesi)
Bu, bu güncellemenin en "bilim kurgu" özelliğidir. Kimi K2.5, yapay zekada "tek asker savaşı"ndan "lejyon işbirliği"ne doğru bir paradigma değişikliğini işaret eden Agent Swarm araştırma önizlemesini yayınladı.
- Kendi Kendine Komuta Eden Sürü: K2.5, 100 Alt-ajanı otonom olarak komuta edebilir.
- Devasa Eşzamanlı Yürütme: Karmaşık görevleri işlerken, 1.500'e kadar koordinasyon adımını yönetebilir.
- Verimlilik Çarpımı: Tek ajan moduna kıyasla, Swarm modu uçtan uca yürütme süresini 4.5 kat azaltır.
- PARL Teknolojisi: Bunun çekirdeği, Orkestratörün görevleri paralel alt görevlere ayırdığı Paralel Ajan Takviyeli Öğrenmedir (PARL).
Örneğin, "niş alanlarda 100 en iyi içerik oluşturucuyu bulma" görevinde, K2.5 Swarm paralel olarak arama yapmak için otomatik olarak 100 araştırmacı alt ajan oluşturabilir ve sonunda sonuçları şaşırtıcı bir verimlilikle 300 profil içeren yapılandırılmış bir e-tabloda toplayabilir.
3. Nihai Ofis Üretkenliği
K2.5, yüksek yoğunluklu ve büyük ölçekli ofis girdilerini işleyebilen ajan yeteneklerini gerçek bilgi çalışması senaryolarına getiriyor.
- Çok Yönlü Çıktı: Doğrudan profesyonel belgeler, e-tablolar, PDF'ler ve sunum slaytları oluşturur.
- Ultra Uzun Bağlam İşleme: 100'den fazla sayfalık belgeleri veya 10.000'den fazla kelimelik özetleri yazmayı kolayca halleder.
- Karmaşık İşlemler: Word'de yorum eklemeyi, Excel'de pivot tablolar oluşturmayı ve PDF'lerde LaTeX formülleri yazmayı destekler.
Dahili AI Office kıyaslamasında, K2.5'in performansı önceki nesil düşünme modeline (K2 Thinking) kıyasla %59.3 artarak "oyuncak"tan "alet"e geçişi gerçekten başardı.
Performans Hakimiyeti: Kapsamlı Üstünlük
Çeşitli yetkili kıyaslamalarda, K2.5, "düşünme modlarına" sahip en iyi kapalı kaynak modellerle (Gemini 3 Pro, GPT-5.2, Claude Opus 4.5 vb. dahil) rekabet eden ve hatta onları aşan bir güç göstermiştir:
| Kıyaslama | Alan | Performans Öne Çıkanları |
|---|---|---|
| HLE-Full | Akıl Yürütme | DeepSeek-V3.2'den daha güçlü |
| SWE-Bench Verified | Programlama | %80.9 çözüm oranı, açık kaynak tavanını kırıyor |
| MMMU Pro | Görme | Claude Opus 4.5 seviyesine yakın, lider görsel multimodal anlama kapasitesi |
| BrowseComp | Arama | Agent Swarm modunda önemli performans iyileştirmesi |
Nasıl Deneyimlenir
Şu anda, Kimi K2.5 aşağıdaki platformlara inmiş durumda ve dört mod sunuyor (Instant, Thinking, Agent, Agent Swarm):
- Kimi.com Web Sürümü
- Kimi 智能助手 App (Akıllı Asistan Uygulaması)
- Kimi 开放平台 (API Açık Platformu)
- Kimi Code: VSCode, Cursor vb. ile entegrasyonu destekleyen yepyeni bir terminal kod aracı.
Not: Agent Swarm modu şu anda beta aşamasındadır ve premium kullanıcılara ücretsiz denemeler sunmaktadır.
Bu güncelleme dalgası, yapay zeka rekabetinin boyutunu şüphesiz basit "metin diyaloğu"ndan "görsel eylem" ve "sürü zekası"nın yeni zirvelerine yükseltiyor. Geliştiriciler ve kurumsal kullanıcılar için Kimi K2.5, sadece daha güçlü bir model değil, aynı zamanda karmaşık sorunları çözmek için yepyeni bir silah seti sunuyor.