آفاق جديدة للوسائط المتعددة الأصلية

أطلقت Moonshot AI رسميا Kimi K2.5 اليوم. هذا ليس مجرد تكرار للإصدار ولكنه خطوة قوية نحو الذكاء الاصطناعي العام (AGI). بناء على Kimi K2 خضع K2.5 لتدريب مسبق مستمر على حوالي 15 تريليون (15T) من رموز الرؤية والنص المختلطة لبناء بنية متعددة الوسائط أصلية تماما (Native Multimodal).

مقارنة الأداء بين Kimi K2.5 و Claude Opus 4.5

شكل: مقارنة بين Kimi K2.5 و Claude Opus 4.5 في القدرات الأساسية مما يوضح قوته الشاملة في مجالات الوسائط المتعددة والاستنتاج.

يمنح هذا الاختراق المعماري K2.5 إدراكا قويا للغاية للعالم المادي مما يتيح ترقيات جذرية في ثلاثة أبعاد رئيسية: البرمجة بالرؤية (Coding with Vision) سرب الوكلاء (Agent Swarm) والإنتاجية المكتبية (Office Productivity).

1. البرمجة بالرؤية: ما تراه هو ما تبرمجه

يعرف Kimi K2.5 رسميا بأنه "أقوى نموذج برمجة مفتوح المصدر حتى الآن" حيث يظهر هيمنة خاصة في مجال تطوير الواجهات الأمامية.

التفاعل المرئي إلى كود: يمكن لـ K2.5 تحويل المحادثات البسيطة مباشرة إلى واجهات أمامية كاملة وتنفيذ التخطيطات التفاعلية وتأثيرات الرسوم المتحركة الغنية (مثل مشغلات التمرير) بدقة.
الفيديو ككود: إلى جانب الصور الثابتة يمكن لـ K2.5 إعادة بناء مواقع الويب من خلال الاستنتاج حول محتوى الفيديو. على سبيل المثال يمكنه مشاهدة فيديو للتفاعلات على موقع ويب ثم استعادة منطق الكود الأساسي والنمط.
التدريب المسبق المشترك للرؤية والنص واسع النطاق: تنبع هذه القدرة من التدريب المسبق المشترك واسع النطاق الذي يزامن تحسين الفهم البصري وقدرات كتابة النصوص البرمجية مما يزيل الانفصال بين الرؤية والمنطق الموجود في النماذج التقليدية.

في التقييمات الداخلية قام K2.5 بحل مشكلات البحث عن المسار المعقدة في المتاهات حيث وجد أقصر مسار في متاهة بدقة 4.5 ميجابكسل باستخدام خوارزمية BFS وإنشاء عملية حل مرئية مما يثبت قدراته القوية في الاستنتاج البصري.

2. سرب الوكلاء: العقل الجماعي للوكلاء (معاينة البحث)

هذه هي الميزة الأكثر "خيالا علميا" في هذا التحديث. أصدر Kimi K2.5 معاينة بحث Agent Swarm مما يمثل تحولا في نموذج الذكاء الاصطناعي من "قتال الجندي الواحد" إلى "تعاون الفيلق".

سرب ذاتي القيادة: يمكن لـ K2.5 قيادة ما يصل إلى 100 وكيل فرعي بشكل مستقل.
تنفيذ متزامن ضخم: عند معالجة المهام المعقدة يمكنه تنسيق ما يصل إلى 1500 خطوة تنسيق.
مضاعفة الكفاءة: مقارنة بوضع الوكيل الواحد يقلل وضع السرب وقت التنفيذ من البداية للنهاية بمقدار 4.5 مرة.
تقنية PARL: جوهر هذا هو التعلم المعزز للوكلاء المتوازيين (PARL) حيث يقوم المنسق بتفكيك المهام إلى مهام فرعية متوازية.

على سبيل المثال في مهمة لـ "العثور على 100 منشئ محتوى بارزين في مجالات متخصصة" يمكن لـ K2.5 Swarm إنشاء 100 وكيل بحث فرعي تلقائيا للبحث بالتوازي وتجميع النتائج أخيرا في جدول بيانات منظم يحتوي على 300 ملف تعريف بكفاءة مذهلة.

3. إنتاجية مكتبية مطلقة

يجلب K2.5 قدرات الوكلاء إلى سيناريوهات العمل المعرفي الحقيقية وهو قادر على التعامل مع المدخلات المكتبية عالية الكثافة وواسعة النطاق.

مخرجات متعددة الاستخدامات: يولد مباشرة مستندات احترافية وجداول بيانات وملفات PDF وشرائح عرض تقديمي.
معالجة سياق فائق الطول: يتعامل بسهولة مع المستندات التي تزيد عن 100 صفحة أو كتابة ملخصات تزيد عن 10000 كلمة.
عمليات معقدة: يدعم إضافة التعليقات في Word وإنشاء جداول محورية في Excel وكتابة صيغ LaTeX في ملفات PDF.

في معيار AI Office الداخلي تحسن أداء K2.5 بنسبة 59.3% مقارنة بنموذج التفكير للجيل السابق (K2 Thinking) مما حقق حقا قفزة من "لعبة" إلى "أداة".

هيمنة الأداء: تفوق شامل

في مختلف المعايير الموثوقة أظهر K2.5 قوة تنافس أو حتى تتجاوز أفضل النماذج مغلقة المصدر التي تمتلك "أوضاع التفكير" (بما في ذلك Gemini 3 Pro و GPT-5.2 و Claude Opus 4.5 وما إلى ذلك):

المعيار	المجال	أبرز نقاط الأداء
HLE-Full	الاستنتاج	أقوى من DeepSeek-V3.2
SWE-Bench Verified	البرمجة	معدل حل 80.9% كسر سقف المصدر المفتوح
MMMU Pro	الرؤية	قدرة فهم متعددة الوسائط بصرية رائدة قريبة من مستوى Claude Opus 4.5
BrowseComp	البحث	تحسن كبير في الأداء في وضع Agent Swarm

كيفية تجربته

حاليا وصل Kimi K2.5 إلى المنصات التالية ويقدم أربعة أوضاع (Instant Thinking Agent Agent Swarm):

نسخة الويب Kimi.com
تطبيق Kimi 智能助手 (تطبيق المساعد الذكي)
Kimi 开放平台 (منصة API المفتوحة)
Kimi Code: أداة كود طرفية جديدة تماما تدعم التكامل مع VSCode و Cursor وما إلى ذلك.

ملاحظة: وضع Agent Swarm حاليا في مرحلة تجريبية ويقدم تجارب مجانية للمستخدمين المميزين.

لا شك أن موجة التحديثات هذه ترفع أبعاد منافسة الذكاء الاصطناعي من مجرد "حوار نصي" بسيط إلى آفاق جديدة من "العمل البصري" و"ذكاء السرب". بالنسبة للمطورين ومستخدمي المؤسسات لا يقدم Kimi K2.5 نموذجا أقوى فحسب بل مجموعة جديدة تماما من الأسلحة لحل المشكلات المعقدة.

إطلاق Kimi K2.5 رسميا: تطور كامل للرؤية الأصلية وسرب الوكلاء

آفاق جديدة للوسائط المتعددة الأصلية

1. البرمجة بالرؤية: ما تراه هو ما تبرمجه

2. سرب الوكلاء: العقل الجماعي للوكلاء (معاينة البحث)

3. إنتاجية مكتبية مطلقة

هيمنة الأداء: تفوق شامل

كيفية تجربته

Popular Kimi K2 paths

Kimi K3

Kimi K2.7 Code

Kimi Code

Kimi K3 Status

مقالات ذات صلة