Kimi K2.5 Officieel Gelanceerd: Volledige Evolutie van Native Vision en Agent Swarm
Kimi K2.5 Officieel Gelanceerd: Volledige Evolutie van Native Vision en Agent Swarm
Nieuwe Hoogten van Native Multimodaliteit
Moonshot AI heeft vandaag officieel Kimi K2.5 gelanceerd. Dit is niet zomaar een versie-iteratie, maar een solide stap richting Artificiële Algemene Intelligentie (AGI). Voortbouwend op Kimi K2, onderging K2.5 continue pre-training op ongeveer 15 biljoen (15T) gemengde visie- en teksttokens om een puur Native Multimodal architectuur te bouwen.

Figuur: Vergelijking van Kimi K2.5 en Claude Opus 4.5 op basiscapaciteiten, wat zijn uitgebreide kracht in de multimodaliteits- en redeneerarena's aantoont.
Deze architecturale doorbraak geeft K2.5 een extreem sterke perceptie van de fysieke wereld, wat disruptieve upgrades mogelijk maakt in drie belangrijke dimensies: Coding with Vision, Agent Swarm en Office Productivity.
1. Coding with Vision: Wat Je Ziet Is Wat Je Codeert
Kimi K2.5 wordt officieel gedefinieerd als het "sterkste open-source coding model tot nu toe", en toont bijzondere dominantie in het frontend ontwikkelingsveld.
- Visuele Interactie naar Code: K2.5 kan eenvoudige conversaties direct omzetten in complete frontend interfaces, waarbij interactieve lay-outs en rijke animatie-effecten (zoals scroll-triggers) nauwkeurig worden geïmplementeerd.
- Video als Code: Naast statische afbeeldingen kan K2.5 websites reconstrueren door te redeneren over video-inhoud. Het kan bijvoorbeeld een video van interacties op een website bekijken en vervolgens de onderliggende codelogica en stijl herstellen.
- Grootschalige Gezamenlijke Visie-Tekst Pre-training: Deze mogelijkheid komt voort uit grootschalige gezamenlijke pre-training, die de verbetering van visueel begrip en tekstcoderingsmogelijkheden synchroniseert, waardoor de ontkoppeling tussen visie en logica die in traditionele modellen wordt gevonden, wordt geëlimineerd.
In interne evaluaties loste K2.5 complexe doolhof-padzoekproblemen op, door het kortste pad in een 4,5-megapixel doolhof te vinden met behulp van het BFS-algoritme en een gevisualiseerd oplossingsproces te genereren, wat zijn krachtige visuele redeneercapaciteiten bewijst.
2. Agent Swarm: De Hive Mind van Agenten (Research Preview)
Dit is de meest "sci-fi" functie van deze update. Kimi K2.5 heeft de Agent Swarm research preview uitgebracht, wat een paradigmaverschuiving in AI markeert van "single-soldier combat" naar "legion collaboration".
- Zelf-gecommandeerde Swarm: K2.5 kan autonoom tot 100 Sub-agenten aansturen.
- Massale Gelijktijdige Uitvoering: Bij het verwerken van complexe taken kan het tot 1.500 coördinatiestappen orkestreren.
- Efficiëntievermenigvuldiging: In vergelijking met de single-agent modus vermindert de Swarm modus de end-to-end uitvoeringstijd met 4,5x.
- PARL Technologie: De kern hiervan is Parallel-Agent Reinforcement Learning (PARL), waarbij de Orchestrator taken opsplitst in parallelle deeltaken.
Bijvoorbeeld, in een taak om "100 top creators in nichevelden te vinden", kan K2.5 Swarm automatisch 100 onderzoeker sub-agenten aanmaken om parallel te zoeken, en uiteindelijk de resultaten aggregeren in een gestructureerde spreadsheet met 300 profielen met verbluffende efficiëntie.
3. Ultieme Kantoorproductiviteit
K2.5 brengt agentcapaciteiten naar echte kenniswerkscenario's, in staat om kantoorinput met hoge dichtheid en op grote schaal te verwerken.
- Veelzijdige Output: Genereert direct professionele documenten, spreadsheets, PDF's en presentatiedia's.
- Ultra-Lange Contextverwerking: Verwerkt eenvoudig documenten van meer dan 100 pagina's of het schrijven van briefs van meer dan 10.000 woorden.
- Complexe Operaties: Ondersteunt het toevoegen van opmerkingen in Word, het maken van draaitabellen in Excel en het schrijven van LaTeX-formules in PDF's.
In de interne AI Office benchmark verbeterde de prestatie van K2.5 met 59,3% in vergelijking met het denkmodel van de vorige generatie (K2 Thinking), waarmee de sprong van "speelgoed" naar "gereedschap" werkelijkheid wordt.
Prestatiedominantie: Uitgebreide Overtreffing
In verschillende gezaghebbende benchmarks heeft K2.5 kracht getoond die rivaliseert met of zelfs de top closed-source modellen met "denkmodi" overtreft (inclusief Gemini 3 Pro, GPT-5.2, Claude Opus 4.5, enz.):
| Benchmark | Domein | Prestatiehoogtepunten |
|---|---|---|
| HLE-Full | Redeneren | Sterker dan DeepSeek-V3.2 |
| SWE-Bench Verified | Programmeren | Oplossingspercentage van 80,9%, breekt door het open-source plafond |
| MMMU Pro | Visie | Leidende visuele multimodale begripscapaciteit, dicht bij Claude Opus 4.5 niveau |
| BrowseComp | Zoeken | Aanzienlijke prestatieverbetering in Agent Swarm modus |
Hoe het te Ervaren
Momenteel is Kimi K2.5 geland op de volgende platforms, met vier modi (Instant, Thinking, Agent, Agent Swarm):
- Kimi.com Webversie
- Kimi 智能助手 App (Smart Assistant App)
- Kimi 开放平台 (API Open Platform)
- Kimi Code: Een gloednieuwe terminal code tool die integratie met VSCode, Cursor, enz. ondersteunt.
Opmerking: Agent Swarm modus bevindt zich momenteel in de bètafase en biedt gratis proefversies aan premium gebruikers.
Deze golf van updates verhoogt ongetwijfeld de dimensie van AI-concurrentie van eenvoudige "tekstdialoog" naar de nieuwe hoogten van "visuele actie" en "swarm intelligentie". Voor ontwikkelaars en zakelijke gebruikers biedt Kimi K2.5 niet alleen een sterker model, maar een geheel nieuwe set wapens voor het oplossen van complexe problemen.