Industry Insight
10 min min di lettura
AI Observer

Kimi K2.5 Rilasciato Ufficialmente: Evoluzione Completa di Visione Nativa e Sciame di Agenti

Kimi K2.5 Rilasciato Ufficialmente: Evoluzione Completa di Visione Nativa e Sciame di Agenti

Nuove Vette della Multimodalità Nativa

Moonshot AI ha rilasciato ufficialmente Kimi K2.5 oggi. Questa non è solo un'iterazione di versione, ma un passo solido verso l'Intelligenza Artificiale Generale (AGI). Basandosi su Kimi K2, K2.5 è stato sottoposto a un pre-addestramento continuo su circa 15 trilioni (15T) di token misti di visione e testo per costruire un'architettura puramente Native Multimodal.

Confronto delle prestazioni tra Kimi K2.5 e Claude Opus 4.5

Figura: Confronto tra Kimi K2.5 e Claude Opus 4.5 sulle capacità di base, che dimostra la sua forza complessiva nelle arene della multimodalità e del ragionamento.

Questa svolta architettonica dota K2.5 di una percezione estremamente forte del mondo fisico, consentendo aggiornamenti dirompenti in tre dimensioni principali: Coding with Vision, Agent Swarm e Office Productivity.

1. Coding with Vision: Quello che vedi è quello che codifichi

Kimi K2.5 è ufficialmente definito come il "modello di codifica open-source più forte fino ad oggi", mostrando un dominio particolare nel campo dello sviluppo frontend.

  • Interazione Visiva a Codice: K2.5 può convertire direttamente semplici conversazioni in interfacce frontend complete, implementando accuratamente layout interattivi e ricchi effetti di animazione (come i trigger di scorrimento).
  • Video come Codice: Oltre alle immagini statiche, K2.5 può ricostruire siti web ragionando sui contenuti video. Ad esempio, può guardare un video di interazioni su un sito web, quindi ripristinare la logica del codice sottostante e lo stile.
  • Pre-addestramento Congiunto Visione-Testo su Larga Scala: Questa capacità deriva dal pre-addestramento congiunto su larga scala, che sincronizza il miglioramento della comprensione visiva e delle capacità di codifica del testo, eliminando la disconnessione tra visione e logica presente nei modelli tradizionali.

Nelle valutazioni interne, K2.5 ha risolto complessi problemi di ricerca del percorso nei labirinti, trovando il percorso più breve in un labirinto da 4,5 megapixel utilizzando l'algoritmo BFS e generando un processo di soluzione visualizzato, dimostrando le sue potenti capacità di ragionamento visivo.

2. Agent Swarm: La Mente Alveare degli Agenti (Anteprima di Ricerca)

Questa è la caratteristica più "sci-fi" di questo aggiornamento. Kimi K2.5 ha rilasciato l'anteprima di ricerca Agent Swarm, segnando un cambiamento di paradigma nell'IA dal "combattimento a soldato singolo" alla "collaborazione di legione".

  • Sciame Autocomandato: K2.5 può comandare autonomamente fino a 100 Sotto-agenti.
  • Esecuzione Simultanea Massiva: Durante l'elaborazione di compiti complessi, può orchestrare fino a 1.500 passaggi di coordinamento.
  • Moltiplicazione dell'Efficienza: Rispetto alla modalità a singolo agente, la modalità Swarm riduce il tempo di esecuzione end-to-end di 4,5 volte.
  • Tecnologia PARL: Il nucleo di questo è il Parallel-Agent Reinforcement Learning (PARL), in cui l'Orchestrator scompone i compiti in sotto-compiti paralleli.

Ad esempio, in un compito per "trovare 100 creatori di spicco in campi di nicchia", K2.5 Swarm può creare automaticamente 100 sotto-agenti ricercatori per cercare in parallelo, aggregando infine i risultati in un foglio di calcolo strutturato contenente 300 profili con un'efficienza sorprendente.

3. Produttività d'Ufficio Definitiva

K2.5 porta le capacità degli agenti in scenari reali di lavoro della conoscenza, in grado di gestire input d'ufficio ad alta densità e su larga scala.

  • Output Versatile: Genera direttamente documenti professionali, fogli di calcolo, PDF e diapositive di presentazione.
  • Elaborazione di Contesti Ultra-Lunghi: Gestisce facilmente documenti di oltre 100 pagine o la scrittura di brief di oltre 10.000 parole.
  • Operazioni Complesse: Supporta l'aggiunta di commenti in Word, la creazione di tabelle pivot in Excel e la scrittura di formule LaTeX nei PDF.

Nel benchmark interno AI Office, le prestazioni di K2.5 sono migliorate del 59,3% rispetto al modello di pensiero della generazione precedente (K2 Thinking), realizzando veramente il salto da "giocattolo" a "strumento".

Dominio delle Prestazioni: Superamento Globale

In vari benchmark autorevoli, K2.5 ha dimostrato una forza che rivaleggia o addirittura supera i migliori modelli closed-source in possesso di "modalità di pensiero" (inclusi Gemini 3 Pro, GPT-5.2, Claude Opus 4.5, ecc.):

BenchmarkDominioPunti Salienti delle Prestazioni
HLE-FullRagionamentoPiù forte di DeepSeek-V3.2
SWE-Bench VerifiedProgrammazioneTasso di risoluzione dell'80,9%, rompendo il soffitto dell'open-source
MMMU ProVisioneCapacità di comprensione multimodale visiva leader, vicina al livello di Claude Opus 4.5
BrowseCompRicercaMiglioramento significativo delle prestazioni in modalità Agent Swarm

Come Sperimentarlo

Attualmente, Kimi K2.5 è sbarcato sulle seguenti piattaforme, offrendo quattro modalità (Instant, Thinking, Agent, Agent Swarm):

  1. Versione Web Kimi.com
  2. Kimi 智能助手 App (App Assistente Intelligente)
  3. Kimi 开放平台 (Piattaforma Aperta API)
  4. Kimi Code: Un nuovo strumento di codice per terminale che supporta l'integrazione con VSCode, Cursor, ecc.

Nota: La modalità Agent Swarm è attualmente in fase beta e offre prove gratuite agli utenti premium.

Questa ondata di aggiornamenti eleva senza dubbio la dimensione della competizione nell'IA dal semplice "dialogo testuale" alle nuove vette dell'"azione visiva" e dell'"intelligenza di sciame". Per gli sviluppatori e gli utenti aziendali, Kimi K2.5 offre non solo un modello più forte, ma un set completamente nuovo di armi per risolvere problemi complessi.

Articoli correlati

Moonshot AI ha ufficialmente rilasciato Kimi K2.6, portando il ramo Code Preview allo stato di modello generalmente disponibile progettato per sessioni di coding autonomo di 12 ore, sciami di 300 agenti e generazione full-stack. Cosa è cambiato, cosa significa e come metterlo al lavoro.
La domanda interessante su Kimi K2.6 non riguarda cosa fa — ma per che tipo di modello è chiaramente stato costruito. Trattate i run da 12 ore, gli sciami di 300 agenti e il compressore di contesto come infrastruttura portante, e la forma di K3 diventa visibile.
Il 13 aprile 2026, Moonshot AI ha confermato ufficialmente che Kimi K2.6 Code Preview è entrato in fase beta. Costruito su un'architettura MoE da un trilione di parametri, questo modello di nuova generazione offre miglioramenti significativi nella generazione di codice e nelle capacità degli agenti.