إطلاق مزدوج في القمة: أطلقت Anthropic نموذج Claude Opus 4.6 بسياق 1 مليون رمز (token) وفرق الوكلاء، بينما ترد OpenAI بنموذج GPT-5.3-Codex ومنصة للمؤسسات. تدفع Google بنموذج Gemini 3 على جميع الجبهات، وتستجيب GitHub أخيراً لطلب عمره 8 سنوات.
Claude Opus 4.6: الأحدث (SOTA) في agentic coding وسياق 1M
5 فبراير — أطلقت Anthropic نموذج Claude Opus 4.6، وهو تحديث رئيسي لنموذجها الأكثر ذكاءً. يتقدم النموذج في التخطيط، والجلسات الطويلة، ومراجعة الكود، ويقدم لأول مرة سياقاً بحجم 1 مليون رمز في إصدار تجريبي لنموذج Opus.
| المعيار | النتيجة | التفاصيل |
|---|---|---|
| Terminal-Bench 2.0 | SOTA | أعلى نتيجة في agentic coding |
| Humanity’s Last Exam | SOTA | التفكير متعدد التخصصات |
| GDPval-AA | +144 Elo vs GPT-5.2 | العمل المهني (المالية، القانون) |
| BrowseComp | SOTA | استرجاع المعلومات المعقدة |
| MRCR v2 (8-needle 1M) | 76% | مقابل 18.5% لنموذج Sonnet 4.5 |
ميزات API والمنتج الجديدة
| الميزة | الوصف |
|---|---|
| Agent teams | عدة وكلاء Claude Code على التوازي (معاينة بحثية) |
| Adaptive thinking | يختار النموذج متى يستخدم التفكير العميق |
| Effort controls | 4 مستويات: منخفض، متوسط، مرتفع (افتراضي)، أقصى |
| Context compaction | تلخيص تلقائي للسياق للجلسات الطويلة |
| 128k output tokens | مخرجات أطول في طلب واحد |
| Claude in PowerPoint | معاينة بحثية (Max, Team, Enterprise) |
التسعير: بدون تغيير عند 5 لكل مليون رمز (إدخال/إخراج). تسعير ممتاز ما بعد 200 ألف رمز (10).
التوفر: claude.ai، و API (claude-opus-4-6)، وجميع المنصات السحابية الرئيسية.
مدونات الهندسة: ضوضاء البنية التحتية ومترجم C
نشرت Anthropic مقالين تقنيين في نفس اليوم. الأول يحدد كمية ضوضاء البنية التحتية في معايير agentic coding: في Terminal-Bench 2.0، يمكن لتكوين الموارد وحده أن يخلق فجوات بمقدار 6 نقاط مئوية بين الإعدادات. الثاني يوثق بناء مترجم C بلغة Rust بواسطة 16 وكيل Claude على التوازي: 100,000 سطر من الكود، قادر على تجميع نواة Linux 6.9 على x86 و ARM و RISC-V، في حوالي 2000 جلسة Claude Code مقابل حوالي 20,000 دولار.
Opus 4.6 في GitHub Copilot
في نفس اليوم، أصبح Claude Opus 4.6 متاحاً بشكل عام (GA) في GitHub Copilot عبر Agent HQ، بعد المعاينة العامة التي تم الإعلان عنها في اليوم السابق.
🔗 إعلان Opus 4.6 | ضوضاء البنية التحتية | بناء مترجم C
GPT-5.3-Codex: حدود البرمجة + المعرفة المهنية
5 فبراير — أطلقت OpenAI نموذج GPT-5.3-Codex، الذي يدمج أداء البرمجة في GPT-5.2-Codex مع قدرات التفكير في GPT-5.2، وكل ذلك أسرع بنسبة 25%.
| المعيار | النتيجة |
|---|---|
| SWE-Bench Pro (عام) | 56.8% |
| Terminal-Bench 2.0 | 77.3% |
| OSWorld-Verified | 64.7% |
| GDPval (فوز أو تعادل) | 70.9% |
| Cybersecurity CTF | 77.6% |
| SWE-Lancer IC Diamond | 81.4% |
يعد GPT-5.3-Codex أول نموذج يساهم في إنشائه الخاص: استخدم الفريق إصدارات أولية لتصحيح التدريب وإدارة النشر وتحليل نتائج الاختبار.
ما وراء الكود
ينتج النموذج عروضاً تقديمية وجداول بيانات وتحليل بيانات ويتعامل مع مهام الإنتاجية في بيئة سطح المكتب (64.7% على OSWorld-Verified).
الأمن السيبراني: قدرة عالية
يعد GPT-5.3-Codex أول نموذج يتم تصنيفه بقدرة عالية (High Capability) للأمن السيبراني بموجب إطار عمل الاستعداد الخاص بـ OpenAI، والأول الذي تم تدريبه خصيصاً لتحديد ثغرات البرامج.
🔗 مدونة GPT-5.3-Codex | System Card
OpenAI: منصة Frontier، تطبيقات MCP، الأمن والتكنولوجيا الحيوية
OpenAI Frontier: منصة وكلاء المؤسسات
5 فبراير — أطلقت OpenAI منصة Frontier، لتطوير ونشر وإدارة وكلاء الذكاء الاصطناعي في المؤسسات. يتلقى الوكلاء سياق عمل مشتركاً، وأذونات، ويتعلمون من التجربة.
| الجانب | التفاصيل |
|---|---|
| العملاء الأوائل | HP, Intuit, Oracle, State Farm, Thermo Fisher, Uber |
| شركاء الذكاء الاصطناعي | Abridge, Clay, Ambience, Decagon, Harvey, Sierra |
| النهج | مهندسو النشر المتقدم (FDE) مدمجون في الفرق |
| المعايير | معايير مفتوحة، متوافقة مع الأنظمة الحالية |
ChatGPT: تطبيقات MCP في النسخة التجريبية
5 فبراير — وصلت تطبيقات MCP إلى النسخة التجريبية في ChatGPT Business و Enterprise و Edu. موصلات شركاء جدد: Amplitude و Fireflies و Vercel و Monday.com و Stripe و Hex و Egnyte وغيرهم. يمكن للمؤسسات بناء تطبيقات MCP مخصصة عبر وضع المطور.
Trusted Access for Cyber
5 فبراير — أطلقت OpenAI برنامج Trusted Access for Cyber، وهو برنامج تجريبي للوصول القائم على الثقة للقدرات السيبرانية المتقدمة. يمكن للمستخدمين التحقق من هويتهم على chatgpt.com/cyber. تم تخصيص 10 ملايين دولار من أرصدة API للدفاع السيبراني من خلال برنامج المنح للأمن السيبراني.
GPT-5 يخفض تكلفة تخليق البروتين
5 فبراير — بالشراكة مع Ginkgo Bioworks، تربط OpenAI نموذج GPT-5 بمختبر آلي لتحسين تخليق البروتين الخالي من الخلايا (CFPS). النتيجة: تخفيض بنسبة 40% في تكلفة الإنتاج و تحسن بنسبة 57% في تكلفة الكواشف، بعد اختبار 36,000 تركيبة على 580 لوحة آلية في ست جولات من التجارب.
🔗 OpenAI Frontier | تطبيقات MCP | Trusted Access for Cyber | بروتينات GPT-5
Google: Gemini 3، و Super Bowl، و NotebookLM
Gemini 3: تحديثات و Super Bowl
5-6 فبراير — تدفع Google بنموذج Gemini 3 على جميع الجبهات. يقدم Gemini 3 Flash، الذي تم إطلاقه مؤخراً، تفكيراً بمستوى Pro بسرعة Flash: بنسبة 90.4% على GPQA Diamond و 33.7% على Humanity’s Last Exam (بدون أدوات). يصبح Gemini 3 النموذج الافتراضي لـ AI Overviews في بحث Google.
تقوم Google أيضاً بإعداد إعلان لـ Gemini مدته 60 ثانية لبطولة Super Bowl LX (8 فبراير) — يظهر إعلان “New Home” طفلاً يستعد للانتقال بمساعدة Gemini، موضحاً قدرات البحث في صور Google وتوليد الصور.
NotebookLM: الرسوم البيانية (Infographics) وعروض الشرائح (Slide Decks)
يقوم NotebookLM، المبني الآن على Gemini 3، بطرح الرسوم البيانية وعروض الشرائح للمستخدمين المجانيين والمحترفين (Pro). تعد عروض الشرائح بالفعل ثاني أكثر استوديوهات الإخراج شعبية. يمكن لمستخدمي Ultra إزالة العلامة المائية.
🔗 Gemini 3 Flash | Gemini 3 App | NotebookLM Infographics
GitHub: التعليقات المثبتة على Issues
5 فبراير — أطلقت GitHub التعليقات المثبتة على Issues. أصبح من الممكن الآن تثبيت تعليق في الجزء العلوي من issue من القائمة السياقية. ميزة تم طلبها منذ عام 2017 لتسليط الضوء على القرارات والتحديثات والخطوات التالية الرئيسية في المحادثات الطويلة.
ما يعنيه هذا
سيبقى يوم 5 فبراير 2026 يوماً بارزاً: تطلق Anthropic و OpenAI في وقت واحد نماذج البرمجة الأكثر تقدماً لديهما. يهيمن Claude Opus 4.6 على معايير العمل المهني واسترجاع المعلومات، بينما يتفوق GPT-5.3-Codex في البرمجة الطرفية (terminal coding) واستخدام الكمبيوتر. يدعي كلا النموذجين الوصول إلى الأحدث (SOTA) في Terminal-Bench 2.0 — مقال Anthropic حول ضوضاء البنية التحتية منطقي تماماً.
وبعيداً عن النماذج، تشتد معركة المنصات: تهاجم OpenAI Frontier المؤسسات بوكلاء تم نشرهم في Oracle و Uber، بينما تراهن Anthropic على النظام البيئي للمطورين (GitHub, Xcode, Claude Code). تتقدم Google على جميع الجبهات مع Gemini 3 في البحث و Chrome و NotebookLM، وتجهز لـ Super Bowl لترسيخ Gemini في التيار الرئيسي.
المصادر
- Introducing Claude Opus 4.6
- Quantifying infrastructure noise
- Building a C compiler with parallel Claudes
- Introducing GPT-5.3-Codex
- GPT-5.3-Codex System Card
- Introducing OpenAI Frontier
- Introducing apps in ChatGPT
- Trusted Access for Cyber
- GPT-5 lowers protein synthesis cost
- Gemini 3 Flash
- NotebookLM Infographics
- Pinned comments on GitHub Issues