بحث

MiniMax M2.5 تحقق 80% في SWE-Bench كمصدر مفتوح، Kling 3.0 تُحدث ثورة في فيديو الذكاء الاصطناعي، Perplexity تطلق Model Council

MiniMax M2.5 تحقق 80% في SWE-Bench كمصدر مفتوح، Kling 3.0 تُحدث ثورة في فيديو الذكاء الاصطناعي، Perplexity تطلق Model Council

أطلقت MiniMax نموذج M2.5، وهو نموذج حدودي (frontier model) مفتوح المصدر يحقق 80.2% في SWE-Bench Verified. أطلقت Kling نموذجها 3.0 بفيديو 1080p وحوار واقعي. على جانب البحث، تنشر Perplexity ميزة Model Council لتشغيل ثلاثة نماذج في وقت واحد، وتشغل Deep Research على Claude Opus 4.6. أعلنت Mistral عن أكبر هاكاثون عالمي لها بجوائز قدرها 200 ألف دولار.


MiniMax M2.5 — نموذج حدودي مفتوح المصدر

12 فبراير — أعلنت MiniMax عن M2.5، وهو نموذج حدودي مفتوح المصدر مصمم للإنتاجية الواقعية. يُظهر النموذج أداءً هو الأحدث (state-of-the-art) في أربعة مجالات حيوية: البرمجة (coding)، البحث عبر الويب، استدعاء الأدوات الوكيلية (agentic tool calling)، والعمل المكتبي.

BenchmarkScoreCatégorie
SWE-Bench Verified80.2%حل الأخطاء الحقيقية
BrowseComp76.3%البحث والتصفح عبر الويب
BFCL76.8%استدعاء الأدوات الوكيلية
Office Workمحسنإنتاجية المستندات

تضع نتيجة 80.2% في SWE-Bench Verified نموذج M2.5 بين أفضل نماذج البرمجة في جميع الفئات. في BrowseComp، وهو benchmark التصفح الخاص بـ OpenAI، حقق 76.3% — مما يدل على قدرة بحث مستقلة قوية.

تدعي MiniMax تنفيذًا أسرع بنسبة 37% في المهام المعقدة مقارنة بالنماذج المنافسة، بتكلفة 1 دولار أمريكي في الساعة عند 100 tokens/ثانية. الهدف المعلن: جعل توسيع نطاق الوكلاء طويلي الأمد (long-horizon agents) مجديًا اقتصاديًا.

النموذج متاح عبر MiniMax Agent (agent.minimax.io) وواجهة برمجة تطبيقات المطورين (platform.minimax.io). كنموذج حدودي مفتوح المصدر، يضع M2.5 نفسه في مواجهة مباشرة مع النماذج المملوكة الرائدة.

🔗 Annonce MiniMax M2.5


MiniMax Forge — إطار عمل RL لوكلاء الإنتاج

12 فبراير — بالتوازي مع M2.5، نشرت MiniMax إطار العمل Forge، وهو إطار عمل وخوارزمية للتعلم المعزز (RL) قابل للتوسع لتدريب وكلاء الذكاء الاصطناعي للإنتاج.

يعالج Forge مشكلة متكررة في تدريب الوكلاء: عدم استقرار التعلم على نطاق واسع. يقترح إطار العمل نهجًا محسنًا لنمذجة المكافآت (reward modeling) للوكلاء، ويستهدف المطورين وباحثي تعلم الآلة الذين ينشرون وكلاء مستقلين.

يشير الإعلان المزدوج عن M2.5 + Forge إلى طموح MiniMax لتقديم حزمة كاملة لوكلاء الذكاء الاصطناعي: نموذج حدودي + إطار عمل للتدريب.

🔗 Forge sur MiniMax News


Kling 3.0 — « Everyone a Director »

1 فبراير — أطلقت Kling AI نموذجها 3.0، وهو تحديث رئيسي لمحرك توليد الفيديو الخاص بها يتمحور حول مفهوم “Everyone a Director” (الجميع مخرج). يهدف النموذج إلى جعل الإبداع السينمائي متاحًا دون خبرة تقنية.

تتركز التحسينات الرئيسية على الجودة البصرية وواقعية التفاعلات البشرية:

CapacitéDétail
الدقة1080p أصلي
الحوارتعابير وجه وإيماءات واقعية
التساقالحفاظ على النمط البصري في المشاهد الطويلة
المرونةمن التوجيه البسيط إلى لوحة قصصية سينمائية كاملة

ردود الفعل من المجتمع الإبداعي إيجابية، خاصة فيما يتعلق بواقعية الحوارات والقدرة على إنتاج مشاهد بتفاعلات بشرية مقنعة — وهي نقطة ضعف تاريخية لنماذج فيديو الذكاء الاصطناعي.

🔗 Annonce Kling 3.0


Perplexity تطلق Model Council — بحث متعدد النماذج

5 فبراير — نشرت Perplexity ميزة Model Council، وهي وظيفة تنفذ نفس الاستعلام على ثلاثة نماذج حدودية في وقت واحد وتنتج إجابة واحدة مجمعة.

بدلاً من التبديل يدويًا بين النماذج، يقوم Model Council بتشغيل الاستعلام على Claude Opus 4.6 و GPT 5.2 و Gemini 3.0 بالتوازي. يقوم نموذج مُركِّب (synthesizer model) بتحليل النتائج، وحل التعارضات بين الإجابات، وإظهار أين تتقارب النماذج أو تتباعد.

Cas d’usageDétail
الاستثماروجهات نظر متوازنة حول الأسواق
القرارات المعقدةاستراتيجية الشركة، المشتريات الكبرى
العصف الذهنيأفكار إبداعية متنوعة
التحققالتحقق من صحة المعلومات بثقة أكبر

الميزة متاحة فورًا على الويب لمشتركي Perplexity Max. نسخة الهاتف المحمول قيد التطوير.

🔗 Introducing Model Council


Perplexity Deep Research ينتقل إلى Opus 4.6

9 فبراير — أعلنت Perplexity أن Deep Research يعمل الآن على Claude Opus 4.6، مما يحسن النتائج لتصبح الأحدث (state-of-the-art) في المعايير الداخلية والخارجية. تعزز الترقية قدرات الاستدلال في البحث المتعمق.

الميزة متاحة فورًا لمستخدمي Max، مع نشر تدريجي لمستخدمي Pro.

🔗 Annonce Deep Research Opus 4.6


Perplexity تنشر DRACO Benchmark كمصدر مفتوح

4 فبراير — جعلت Perplexity معيار DRACO متاحًا للجمهور، وهو benchmark مفتوح المصدر مصمم لتقييم أدوات البحث العميق (Deep Research). القواعد والمنهجية الكاملة متاحة علنًا.

يتحقق DRACO من أن Perplexity Deep Research يحقق أداءً هو الأحدث (state-of-the-art) في المعايير الخارجية، متفوقًا على أدوات البحث العميق الأخرى في الدقة والموثوقية.

🔗 Annonce DRACO


Mistral تعلن عن أكبر هاكاثون لها — جوائز بقيمة 200 ألف دولار

10 فبراير — أطلقت Mistral AI أكبر هاكاثون عالمي تنظمه على الإطلاق، والمقرر عقده من 28 فبراير إلى 1 مارس 2026.

DétailInformation
التنسيق48 ساعة
المواقعباريس، لندن، نيويورك، سان فرانسيسكو، طوكيو، سنغافورة، سيدني + عبر الإنترنت
الجوائز200 ألف دولار مكافآت
الشركاءNVIDIA, AWS, Weights & Biases, Hugging Face
جوائز خاصةElevenLabs, Hugging Face

يقام الحدث في وقت واحد في 8 مدن وعبر الإنترنت. تشير قائمة الشركاء (NVIDIA, AWS, WandB, Hugging Face) إلى ثقة نظام الذكاء الاصطناعي الرئيسي في منصة Mistral.

🔗 Annonce Mistral Hackathon


Cohere توقع مع Magnus Carlsen كسفير

13 فبراير — أعلنت Cohere عن شراكة مع Magnus Carlsen، بطل العالم في الشطرنج خمس مرات والمصنف الأول عالميًا، كسفير عالمي للعلامة التجارية.

سيشارك Carlsen في حملات الظهور، ومبادرات القيادة الفكرية (thought leadership)، والفعاليات رفيعة المستوى لشركة Cohere. تهدف الشراكة إلى توضيح أوجه التشابه بين الاستراتيجية في الشطرنج ونهج Cohere في الذكاء الاصطناعي للمؤسسات: التركيز على الأساسيات، والتوقع، والمزايا المستدامة.

🔗 Annonce Cohere + Magnus Carlsen


باختصار

12 فبراير — أطلقت Runway ميزة Story Panels، وهي سير عمل (workflow) جديد يسمح بإنشاء أفلام أو إعلانات كاملة من صورة واحدة، مع تماسك الشخصيات والمواقع والأسلوب.

🔗 Runway Story Panels

12-13 فبراير — انضم Mooncake، وهو مخصص ذاكرة PyTorch تم تطويره بشكل مشترك من قبل Moonshot AI (Kimi) و جامعة تسينغ - هوا، إلى نظام PyTorch البيئي. تعمل الأداة على تحسين تقليل ذروة الذاكرة والتجزئة، وهو أمر ذو صلة بنشر نماذج LLM ذات السياق الطويل (long-context).

🔗 Annonce Mooncake

9 فبراير — تسلط Ideogram الضوء على تحرير الصور عبر التلقين (prompt) باللغة الطبيعية، مما يسمح بتعديل الصور المولدة عبر تعليمات نصية بسيطة.

30 يناير — دمجت Perplexity نموذج Kimi K2.5، وهو نموذج الاستدلال مفتوح المصدر من Moonshot AI، لمشتركي Pro و Max. يعمل الاستدلال على البنية التحتية الخاصة بـ Perplexity في الولايات المتحدة.

4 فبراير — أعلنت MiniMax و Hyperbond Studio عن شراكة لتطوير رفقاء ذكاء اصطناعي محادثين مع “Call Me Sensei”، باستخدام واجهات برمجة تطبيقات LLM والوكلاء من MiniMax.


ماذا يعني هذا

يؤكد النصف الأول من فبراير 2026 العديد من الاتجاهات الأساسية. يثبت MiniMax M2.5 أن لاعبًا أقل شهرة يمكنه نشر نموذج مفتوح المصدر ينافس القادة في معايير البرمجة — 80.2% في SWE-Bench Verified هي درجة رائعة لنموذج مفتوح. مع Forge كمكمل، تقدم MiniMax حزمة وكلاء كاملة.

تسرع Perplexity تمايزها مع Model Council، وهو نهج عملي يعترف بأنه لا يوجد نموذج واحد يهيمن على جميع حالات الاستخدام. يعزز دمج Opus 4.6 في Deep Research ونشر DRACO كمصدر مفتوح شفافية ومصداقية المنصة.

يمثل Kling 3.0 تقدمًا في توليد الفيديو بحوارات واقعية — وهي خطوة نحو أدوات إنتاج سينمائي متاحة. على جانب المجتمع، يظهر هاكاثون Mistral بقيمة 200 ألف دولار في 8 مدن نضج نظام المصدر المفتوح الأوروبي.


Sources