أطلقت MiniMax نموذج M2.5، وهو نموذج حدودي (frontier model) مفتوح المصدر يحقق 80.2% في SWE-Bench Verified. أطلقت Kling نموذجها 3.0 بفيديو 1080p وحوار واقعي. على جانب البحث، تنشر Perplexity ميزة Model Council لتشغيل ثلاثة نماذج في وقت واحد، وتشغل Deep Research على Claude Opus 4.6. أعلنت Mistral عن أكبر هاكاثون عالمي لها بجوائز قدرها 200 ألف دولار.
MiniMax M2.5 — نموذج حدودي مفتوح المصدر
12 فبراير — أعلنت MiniMax عن M2.5، وهو نموذج حدودي مفتوح المصدر مصمم للإنتاجية الواقعية. يُظهر النموذج أداءً هو الأحدث (state-of-the-art) في أربعة مجالات حيوية: البرمجة (coding)، البحث عبر الويب، استدعاء الأدوات الوكيلية (agentic tool calling)، والعمل المكتبي.
| Benchmark | Score | Catégorie |
|---|---|---|
| SWE-Bench Verified | 80.2% | حل الأخطاء الحقيقية |
| BrowseComp | 76.3% | البحث والتصفح عبر الويب |
| BFCL | 76.8% | استدعاء الأدوات الوكيلية |
| Office Work | محسن | إنتاجية المستندات |
تضع نتيجة 80.2% في SWE-Bench Verified نموذج M2.5 بين أفضل نماذج البرمجة في جميع الفئات. في BrowseComp، وهو benchmark التصفح الخاص بـ OpenAI، حقق 76.3% — مما يدل على قدرة بحث مستقلة قوية.
تدعي MiniMax تنفيذًا أسرع بنسبة 37% في المهام المعقدة مقارنة بالنماذج المنافسة، بتكلفة 1 دولار أمريكي في الساعة عند 100 tokens/ثانية. الهدف المعلن: جعل توسيع نطاق الوكلاء طويلي الأمد (long-horizon agents) مجديًا اقتصاديًا.
النموذج متاح عبر MiniMax Agent (agent.minimax.io) وواجهة برمجة تطبيقات المطورين (platform.minimax.io). كنموذج حدودي مفتوح المصدر، يضع M2.5 نفسه في مواجهة مباشرة مع النماذج المملوكة الرائدة.
MiniMax Forge — إطار عمل RL لوكلاء الإنتاج
12 فبراير — بالتوازي مع M2.5، نشرت MiniMax إطار العمل Forge، وهو إطار عمل وخوارزمية للتعلم المعزز (RL) قابل للتوسع لتدريب وكلاء الذكاء الاصطناعي للإنتاج.
يعالج Forge مشكلة متكررة في تدريب الوكلاء: عدم استقرار التعلم على نطاق واسع. يقترح إطار العمل نهجًا محسنًا لنمذجة المكافآت (reward modeling) للوكلاء، ويستهدف المطورين وباحثي تعلم الآلة الذين ينشرون وكلاء مستقلين.
يشير الإعلان المزدوج عن M2.5 + Forge إلى طموح MiniMax لتقديم حزمة كاملة لوكلاء الذكاء الاصطناعي: نموذج حدودي + إطار عمل للتدريب.
Kling 3.0 — « Everyone a Director »
1 فبراير — أطلقت Kling AI نموذجها 3.0، وهو تحديث رئيسي لمحرك توليد الفيديو الخاص بها يتمحور حول مفهوم “Everyone a Director” (الجميع مخرج). يهدف النموذج إلى جعل الإبداع السينمائي متاحًا دون خبرة تقنية.
تتركز التحسينات الرئيسية على الجودة البصرية وواقعية التفاعلات البشرية:
| Capacité | Détail |
|---|---|
| الدقة | 1080p أصلي |
| الحوار | تعابير وجه وإيماءات واقعية |
| التساق | الحفاظ على النمط البصري في المشاهد الطويلة |
| المرونة | من التوجيه البسيط إلى لوحة قصصية سينمائية كاملة |
ردود الفعل من المجتمع الإبداعي إيجابية، خاصة فيما يتعلق بواقعية الحوارات والقدرة على إنتاج مشاهد بتفاعلات بشرية مقنعة — وهي نقطة ضعف تاريخية لنماذج فيديو الذكاء الاصطناعي.
Perplexity تطلق Model Council — بحث متعدد النماذج
5 فبراير — نشرت Perplexity ميزة Model Council، وهي وظيفة تنفذ نفس الاستعلام على ثلاثة نماذج حدودية في وقت واحد وتنتج إجابة واحدة مجمعة.
بدلاً من التبديل يدويًا بين النماذج، يقوم Model Council بتشغيل الاستعلام على Claude Opus 4.6 و GPT 5.2 و Gemini 3.0 بالتوازي. يقوم نموذج مُركِّب (synthesizer model) بتحليل النتائج، وحل التعارضات بين الإجابات، وإظهار أين تتقارب النماذج أو تتباعد.
| Cas d’usage | Détail |
|---|---|
| الاستثمار | وجهات نظر متوازنة حول الأسواق |
| القرارات المعقدة | استراتيجية الشركة، المشتريات الكبرى |
| العصف الذهني | أفكار إبداعية متنوعة |
| التحقق | التحقق من صحة المعلومات بثقة أكبر |
الميزة متاحة فورًا على الويب لمشتركي Perplexity Max. نسخة الهاتف المحمول قيد التطوير.
Perplexity Deep Research ينتقل إلى Opus 4.6
9 فبراير — أعلنت Perplexity أن Deep Research يعمل الآن على Claude Opus 4.6، مما يحسن النتائج لتصبح الأحدث (state-of-the-art) في المعايير الداخلية والخارجية. تعزز الترقية قدرات الاستدلال في البحث المتعمق.
الميزة متاحة فورًا لمستخدمي Max، مع نشر تدريجي لمستخدمي Pro.
🔗 Annonce Deep Research Opus 4.6
Perplexity تنشر DRACO Benchmark كمصدر مفتوح
4 فبراير — جعلت Perplexity معيار DRACO متاحًا للجمهور، وهو benchmark مفتوح المصدر مصمم لتقييم أدوات البحث العميق (Deep Research). القواعد والمنهجية الكاملة متاحة علنًا.
يتحقق DRACO من أن Perplexity Deep Research يحقق أداءً هو الأحدث (state-of-the-art) في المعايير الخارجية، متفوقًا على أدوات البحث العميق الأخرى في الدقة والموثوقية.
Mistral تعلن عن أكبر هاكاثون لها — جوائز بقيمة 200 ألف دولار
10 فبراير — أطلقت Mistral AI أكبر هاكاثون عالمي تنظمه على الإطلاق، والمقرر عقده من 28 فبراير إلى 1 مارس 2026.
| Détail | Information |
|---|---|
| التنسيق | 48 ساعة |
| المواقع | باريس، لندن، نيويورك، سان فرانسيسكو، طوكيو، سنغافورة، سيدني + عبر الإنترنت |
| الجوائز | 200 ألف دولار مكافآت |
| الشركاء | NVIDIA, AWS, Weights & Biases, Hugging Face |
| جوائز خاصة | ElevenLabs, Hugging Face |
يقام الحدث في وقت واحد في 8 مدن وعبر الإنترنت. تشير قائمة الشركاء (NVIDIA, AWS, WandB, Hugging Face) إلى ثقة نظام الذكاء الاصطناعي الرئيسي في منصة Mistral.
Cohere توقع مع Magnus Carlsen كسفير
13 فبراير — أعلنت Cohere عن شراكة مع Magnus Carlsen، بطل العالم في الشطرنج خمس مرات والمصنف الأول عالميًا، كسفير عالمي للعلامة التجارية.
سيشارك Carlsen في حملات الظهور، ومبادرات القيادة الفكرية (thought leadership)، والفعاليات رفيعة المستوى لشركة Cohere. تهدف الشراكة إلى توضيح أوجه التشابه بين الاستراتيجية في الشطرنج ونهج Cohere في الذكاء الاصطناعي للمؤسسات: التركيز على الأساسيات، والتوقع، والمزايا المستدامة.
🔗 Annonce Cohere + Magnus Carlsen
باختصار
12 فبراير — أطلقت Runway ميزة Story Panels، وهي سير عمل (workflow) جديد يسمح بإنشاء أفلام أو إعلانات كاملة من صورة واحدة، مع تماسك الشخصيات والمواقع والأسلوب.
12-13 فبراير — انضم Mooncake، وهو مخصص ذاكرة PyTorch تم تطويره بشكل مشترك من قبل Moonshot AI (Kimi) و جامعة تسينغ - هوا، إلى نظام PyTorch البيئي. تعمل الأداة على تحسين تقليل ذروة الذاكرة والتجزئة، وهو أمر ذو صلة بنشر نماذج LLM ذات السياق الطويل (long-context).
9 فبراير — تسلط Ideogram الضوء على تحرير الصور عبر التلقين (prompt) باللغة الطبيعية، مما يسمح بتعديل الصور المولدة عبر تعليمات نصية بسيطة.
30 يناير — دمجت Perplexity نموذج Kimi K2.5، وهو نموذج الاستدلال مفتوح المصدر من Moonshot AI، لمشتركي Pro و Max. يعمل الاستدلال على البنية التحتية الخاصة بـ Perplexity في الولايات المتحدة.
4 فبراير — أعلنت MiniMax و Hyperbond Studio عن شراكة لتطوير رفقاء ذكاء اصطناعي محادثين مع “Call Me Sensei”، باستخدام واجهات برمجة تطبيقات LLM والوكلاء من MiniMax.
ماذا يعني هذا
يؤكد النصف الأول من فبراير 2026 العديد من الاتجاهات الأساسية. يثبت MiniMax M2.5 أن لاعبًا أقل شهرة يمكنه نشر نموذج مفتوح المصدر ينافس القادة في معايير البرمجة — 80.2% في SWE-Bench Verified هي درجة رائعة لنموذج مفتوح. مع Forge كمكمل، تقدم MiniMax حزمة وكلاء كاملة.
تسرع Perplexity تمايزها مع Model Council، وهو نهج عملي يعترف بأنه لا يوجد نموذج واحد يهيمن على جميع حالات الاستخدام. يعزز دمج Opus 4.6 في Deep Research ونشر DRACO كمصدر مفتوح شفافية ومصداقية المنصة.
يمثل Kling 3.0 تقدمًا في توليد الفيديو بحوارات واقعية — وهي خطوة نحو أدوات إنتاج سينمائي متاحة. على جانب المجتمع، يظهر هاكاثون Mistral بقيمة 200 ألف دولار في 8 مدن نضج نظام المصدر المفتوح الأوروبي.