تنتهي الأسبوع بعد عدة إعلانات مهمة: GPT-5.4 من OpenAI يعزز الاستخدام الحاسوبي (computer use) الأصلي مع 75% على OSWorld ونافذة سياق تبلغ مليون tokens، NotebookLM يقدم Cinematic Video Overviews حيث يلعب Gemini دور المخرج، وCodex يوسّع دعمه إلى Windows مع صندوق رمل (sandbox) أصلي. على صعيد أدوات المطورين، Anthropic يحسّن skill-creator ويطلق HTTP hooks في Claude Code، وGitHub يفعّل Copilot Memory افتراضيًا لجميع مستخدمي Pro.
GPT-5.4 — Computer use أصلي، 1M tokens، أداة البحث
5 مارس 2026 — تطلق OpenAI GPT-5.4، نموذجها frontier للعمل المهني. متوفر في ChatGPT (باسم GPT-5.4 Thinking)، في الـ API (معرّف gpt-5.4) وفي Codex، يجمع هذا النموذج في بنية واحدة قدرات الاستدلال، الترميز وتدفقات العمل الوكيلية (agentic workflows) التي قدمتها النماذج السابقة.
الابتكار التقني الأبرز هو دمج الاستخدام الحاسوبي (computer use) أصليًا: GPT-5.4 يمكنه التفاعل مع واجهات رسومية عبر لقطات الشاشة ولوحة المفاتيح/الفأرة دون ملحقات طرف ثالث. على OSWorld-Verified — الـ benchmark المرجعي للتفاعل مع واجهات برمجية فعلية — يصل GPT-5.4 إلى 75.0 %، مقابل 47.3 % لـ GPT-5.2. نافذة السياق ترتفع إلى 1 million tokens في Codex والـ API.
ميزة أخرى ملحوظة هي tool search: بدلًا من إرسال قائمة كاملة بالأدوات المتاحة عند كل استدعاء، يتلقى النموذج قائمة خفيفة ويبحث عن الأدوات عند الطلب. تقيس OpenAI انخفاضًا بنسبة 47% في استهلاك tokens على تدفقات العمل متعددة الأدوات (مختبرة على Scale MCP Atlas). وضع /fast في Codex يكسب سرعة بمقدار 1.5× عند نفس مستوى الذكاء.
Benchmarks :
| Évaluation | GPT-5.4 | GPT-5.3-Codex | GPT-5.2 |
|---|---|---|---|
| GDPval (travail professionnel) | 83,0 % | 70,9 % | 70,9 % |
| SWE-Bench Pro | 57,7 % | 56,8 % | 55,6 % |
| OSWorld-Verified (computer use) | 75,0 % | 74,0 % | 47,3 % |
| BrowseComp (recherche web) | 82,7 % | 77,3 % | 65,8 % |
| Toolathlon (utilisation d’outils) | 54,6 % | 51,9 % | 46,3 % |
| ARC-AGI-2 (raisonnement abstrait) | 73,3 % | — | 52,9 % |
أسعار الـ API :
| Modèle | Entrée | Sortie |
|---|---|---|
| gpt-5.2 | 1,75 $ / M tokens | 14 $ / M tokens |
| gpt-5.4 | 2,50 $ / M tokens | 15 $ / M tokens |
| gpt-5.2-pro | 21 $ / M tokens | 168 $ / M tokens |
| gpt-5.4-pro | 30 $ / M tokens | 180 $ / M tokens |
GPT-5.4 Thinking متاح اليوم لمشتركي ChatGPT Plus وTeam وPro. سيبقى GPT-5.2 Thinking متاحًا ضمن «Legacy Models» حتى 5 يونيو 2026. على مستوى الأمان، تصنّف OpenAI GPT-5.4 كـ «High cyber capability» ضمن إطار Preparedness Framework الخاص بها. تنشر الشركة في الوقت نفسه CoT-Control، مجموعة تقييم مفتوحة المصدر تقيس قابلية التحكم في سلسلة التفكير لـ 13 نموذج frontier — الدرجات، المنخفضة (0.1% إلى 15.4%)، تشير إلى أن مراقبة سلاسل التفكير تبقى أداة أمان موثوقة.
NotebookLM — Cinematic Video Overviews
4 مارس 2026 — يقدم NotebookLM Cinematic Video Overviews في استديوهاته. تتجاوز هذه الفيديوهات Audio Overviews (صيغة بودكاست) التي أُطلقت في 2024 والقوالب (templates) الفيديو القياسية.
الفكرة: يتموضع Gemini كمخرج. النموذج يحلل مصادر المستخدم، يقرر الصيغة الأنسب (درس تعليمي، وثائقي، إلخ)، يختار النمط البصري، يولّد الصور، ثم ينتقدها ذاتيًا قبل إنتاج النسخة النهائية. الناتج هو فيديو غامر ومخصّص، فريد لكل مجموعة مصادر.
الميزة متاحة لمشتركي Google AI Ultra، بالإنجليزية، منذ 4 مارس 2026. تم تأكيد النشر الكامل للمستخدمين Ultra في نفس اليوم. الوصول لمشتركي Pro مخطط ضمن خارطة الطريق دون جدول زمني محدد. تغريدة الإعلان جمعت 3 ملايين مشاهدة.
OpenAI — Codex على Windows، بحث CoT-Control
Codex متاح على Windows
4 مارس 2026 — تطبيق Codex أصبح متاحًا الآن على Windows، مع صندوق رمل agent أصلي ودعم بيئات التطوير Windows عبر PowerShell. متاحتان مهارتان جديدتان (skills): $aspnet-core لتطبيقات Blazor وASP.NET MVC وRazor Pages، و$winui-app لتطبيقات Windows الأصلية مع WinUI 3.
بحث — قابلية التحكم في سلسلة التفكير
5 مارس 2026 — تنشر OpenAI «Les modèles de raisonnement peinent à contrôler leurs chaînes de pensée, et c’est une bonne chose» (Reasoning models struggle to control their chains of thought, and that’s good). مجموعة التقييم المفتوحة المصدر CoT-Control تقيس قابلية التحكم في سلسلة التفكير لـ 13 نموذج frontier. تتراوح الدرجات بين 0.1% و15.4%، مما يشير إلى أن النماذج الحالية تجد صعوبة في تغيير استدلالها عمدًا لتجاوز أنظمة المراقبة — نتيجة مقدّمة على أنها إيجابية للأمان. تخطط OpenAI لإدراج هذه المقاييس في system cards للنماذج المستقبلية.
Anthropic — Skill-creator وHTTP hooks
Skill-creator مُحسّن
3 مارس 2026 — تنشر Anthropic تحديثًا كبيرًا لأداة skill-creator الخاصة بـ Claude Code وClaude.ai. الإعلان يقدم نوعين رسميين من المهارات (Agent Skills):
| Type | Description | Durabilité |
|---|---|---|
| Capability uplift | يساعد Claude على أداء شيء لا يجيده جيدًا بعد | Peut devenir obsolète si le modèle s’améliore |
| Encoded preference | يشفر عمليات وتفضيلات فريق | Durable, dépend de la fidélité au workflow réel |
الميزات الجديدة: evals (اختبارات آلية) للتحقق من أن المهارة تنتج النتيجة المتوقعة، وضع benchmark لقياس نسبة النجاح، الزمن واستهلاك tokens، ودعم متعدد الوكلاء لتنفيذ التقييمات بالتوازي دون تلوث بين الاختبارات. وضع المقارنة A/B يتيح مواجهة نسختين من المهارة. الـ skill-creator متاح الآن على Claude.ai وCowork؛ وعلى Claude Code يُثبّت كـ plugin.
🔗 Improving skill-creator: Test, measure, and refine Agent Skills
HTTP hooks في Claude Code
4 مارس 2026 — يطلق Claude Code الـ HTTP hooks، بديلًا عن command hooks الموجودين. بدل تنفيذ سكربت شل محلي، يرسل Claude Code حدثًا إلى URL يختاره المستخدم وينتظر ردًا. حالات الاستخدام: بناء تطبيق ويب لعرض التقدم، إدارة الأذونات، أو مزامنة الحالة بين نسخ Claude Code عبر قاعدة بيانات. تعمل HTTP hooks داخل plugins، الوكلاء المخصصين وإعدادات المؤسسات المُدارة.
Gemini CLI v0.32.0 — Generalist Agent افتراضي
3 مارس 2026 — النسخة 0.32.0 من Gemini CLI تُفعّل Generalist Agent افتراضيًا لتحسين التفويض وتوجيه المهام. التحديث يجلب أيضًا توجيه النموذج (Model Steering) مباشرة في workspace، تحسينات على Plan Mode (فتح وتعديل الخطط في محرر خارجي، إدارة التحديد المتعدد للمهام المعقدة)، الإكمال التلقائي التفاعلي في الصدفة، وتحميل متوازي للإضافات لتحسين الأداء عند التشغيل.
GitHub Copilot — Memory افتراضية، الجوال والقياسات
Copilot Memory مفعّلة افتراضيًا
4 مارس 2026 — يفعل GitHub Copilot Memory افتراضيًا لجميع مستخدمي خطط Pro وPro+. الميزة، التي كانت في معاينة اختيارية مدار اشتراك، تسمح لـ Copilot بحفظ معلومات مستمرة على مستوى المستودع: قواعد التكويد، أنماط المعمارية، الاعتمادات الحرجة.
الذكريات محدودة بشكل صارم لمستودع واحد ومُتحقق منها مقابل الشيفرة الحالية قبل التطبيق، مما يمنع استخدام سياق قديم. تنتهي صلاحية هذه الذكريات تلقائيًا بعد 28 يومًا. الميزة مفعّلة على وكيل الترميز، مراجعة الشيفرة وCLI Copilot — المعارف التي يكتشفها وكيل تصبح متاحة فورًا للآخرين. يمكن للمستخدمين تعطيل Copilot Memory في إعداداتهم (Settings > Features > Copilot Memory)؛ والإداريون Enterprise يحتفظون بالتحكم الكامل.
🔗 تمكين Copilot Memory افتراضيًا لمستخدمي Pro وPro+
إشعارات حية للوكلاء في GitHub Mobile
4 مارس 2026 — يتلقى GitHub Mobile إشعارات في الوقت الحقيقي لجلسات وكلاء Copilot. يمكن للمطوّرين متابعة تقدم وكلائهم سواء أُطلقت الجلسة من حاسوب أو من الهاتف.
Grok Code Fast 1 في Copilot Free Auto
4 مارس 2026 — يضيف GitHub Grok Code Fast 1 من xAI إلى اختيار النماذج التلقائي (Auto) في Copilot Free. يمكن لهذا النموذج الآن أن يختاره Copilot خلال جلسات الدردشة في Visual Studio Code، Visual Studio، بيئات تطوير JetBrains، Xcode وEclipse.
🔗 Grok Code Fast 1 في اختيار النموذج التلقائي لـ Copilot Free
قياسات Copilot CLI على مستوى المستخدم
5 مارس 2026 — يوسّع GitHub قياسات استخدام Copilot لتشمل نشاط CLI على مستوى المستخدم. يأتي هذا التحديث بعد إصدار الأسبوع السابق على مستوى المؤسسات. يمكن للإداريين الآن تحديد المستخدمين النشطين على CLI، الاطلاع على عدد الطلبات والجلسات، ومتابعة استهلاك tokens لكل مستخدم.
🔗 قياسات استخدام Copilot — نشاط CLI على مستوى المستخدم
Perplexity — GPT-5.4 وVoice Mode في Computer
GPT-5.4 Thinking متاح على Perplexity
5 مارس 2026 — أصبح GPT-5.4 وGPT-5.4 Thinking متاحين في Perplexity لمشتركي Pro وMax. نسخة Thinking تفعّل الاستدلال الموسّع لـ GPT-5.4 لإجابات أعمق على الاستفسارات المعقدة.
Voice Mode في Perplexity Computer
4 مارس 2026 — تضيف Perplexity وضعًا صوتيًا (Voice Mode) في Perplexity Computer. الواجهة، التي كانت تسمح بالبحث، الترميز ونشر المشاريع، تقبل الآن التعليمات الصوتية مباشرة.
Cohere × Aston Martin F1 — شراكة متعددة السنوات
4 مارس 2026 — تعلن Cohere عن شراكة متعددة السنوات مع فريق Aston Martin Aramco F1. سيحصل كل عضو في الفريق على وصول إلى نماذج المؤسسة ومنصة IA الوكيلية لـ Cohere (North) للعمل في أحد أكثر بيئات البيانات تطلبًا في الرياضة العالمية. يظهر شعار Cohere على سيارة السباق بدءًا من جائزة أستراليا الكبرى 2026.
Black Forest Labs — Self-Flow، بحث متعدد النماذج
4 مارس 2026 — تنشر Black Forest Labs (مخترعي FLUX) Self-Flow في معاينة بحثية. هذه المقاربة تدرب نماذج توليدية متعددة النماذج (صورة، فيديو، صوت، نص) دون الاعتماد على نماذج خارجية للتمثيل، عبر طريقة self-supervised flow matching.
النتائج المعروضة: حتى 2.8× أسرع في التقارب العابر للأنماط، تماسك زمني أفضل في الفيديو، وجودة طباعة أوضح. العروض تتضمن نموذج فيديو بحجم 4B معطيات مدرّب على 6M فيديوهات، نموذج صورة 4B مدرّب على 200M صور، ونموذج صوت-فيديو مشترك. تضع BFL Self-Flow كطريق نحو world models: “Self-Flow opens a path toward world models: combining visual scalability with semantic abstraction for planning and understanding.”
بإيجاز
Runway أطلق hub نماذج موحّدة في 3 مارس، يجمع الوصول إلى نماذج طرف ثالث للصورة، الفيديو، الصوت واللغة مباشرة داخل المنصة. 🔗 إعلان
Claude وصل إلى المركز الأول في App Store iOS في 14 دولة في 5 مارس — أستراليا، النمسا، بلجيكا، كندا، فرنسا، ألمانيا، أيرلندا، إيطاليا، نيوزيلندا، النرويج، سنغافورة، سويسرا، المملكة المتحدة، الولايات المتحدة. 🔗 تغريدة
Manus نشر رسالته السنوية في 5 مارس بمناسبة عامه الأول، مبرزًا شهادات مستخدمين (أم، لغوي يبلغ 86 عامًا، بائعة زهور). 🔗 الرسالة
Grok تجاوز حاجز مليون مراجعة على متجر تطبيقات الولايات المتحدة. 🔗 تغريدة @grok
ماذا يعني ذلك
يؤكد GPT-5.4 أن الاستخدام الحاسوبي (computer use) انتقل من كونه تجريبيًا إلى ميزة مدمجة في نموذج متعدد الاستخدامات. نتيجة 75% على OSWorld-Verified وخفض 47% في tokens عبر tool search هي مقاييس ملموسة لتغيير المنهج: يمكن للوكلاء الذكاء الاصطناعي الآن تشغيل واجهات برامج معقدة دون بنى تحتية متخصصة.
على صعيد أدوات المطورين، تُظهر الأسبوع تقاربًا: Anthropic يحسّن طرق اختبار والإشراف على مهارات الوكلاء، GitHub يفعّل الذاكرة المستمرة لوكلائه في الترميز، وPerplexity يضيف وضع الصوت لوكيل Computer الخاص به. بيئات التشغيل الوكيلية (agentic runtimes) تَثْري بطبقات ذاكرة، قابلية مراقبة (HTTP hooks، إشعارات الهاتف) وتفاعل طبيعي (صوت).
NotebookLM Cinematic Video Overviews تمثل مسارًا مختلفًا: توليد محتوى تعليمي طويل من مصادر شخصية. Gemini كمخرج — يحلل، ينتقد، يعيد تركيب — هو استخدام للذكاء الاصطناعي كأداة إنتاج إبداعي ميتا، أكثر من كونه مساعدًا بسيطًا للتوليد.
المصادر - الإعلان عن GPT-5.4 | OpenAI
- @OpenAI على X
- @OpenAIDevs على X — Codex لنظام Windows
- Codex لنظام Windows | OpenAI Developers
- نماذج الاستدلال CoT-Control | OpenAI
- إعلان NotebookLM على X
- تحسين منشئ المهارات | Anthropic
- خطافات HTTP Claude Code — @dickson_tsai
- Claude #1 في App Store — @RyD0ne
- سجل التغييرات Gemini CLI
- ميزة ذاكرة Copilot مفعّلة الآن افتراضيًا | GitHub
- إشعارات الوكلاء الحية في GitHub Mobile
- Grok Code Fast 1 متاح في Copilot Free Auto | GitHub
- مقاييس Copilot CLI على مستوى المستخدم | GitHub
- GPT-5.4 على Perplexity
- وضع الصوت في Perplexity Computer
- Cohere × Aston Martin F1
- BFL Self-Flow
- Runway Hub متعدد النماذج
- رسالة الذكرى السنوية Manus
- Grok مليون مراجعة على App Store
تمت ترجمة هذا المستند من الإصدار fr إلى اللغة ar باستخدام النموذج gpt-5-mini. لمزيد من المعلومات حول عملية الترجمة، راجع https://gitlab.com/jls42/ai-powered-markdown-translator