يمثل 23 أبريل 2026 يومًا حافلًا: تطلق OpenAI نموذج GPT-5.5 بنسبة 85% على ARC-AGI-2 وبسعر API يبلغ $5/M tokens للإدخال، بينما تفتح Anthropic الذاكرة الدائمة في نسخة تجريبية لوكلائها المُدارين وتنشر تقريرًا ختاميًا عن Claude Code. وفي الوقت نفسه، يقدّم GitHub Copilot سبعة تحديثات خلال ثلاثة أيام، وينشر Kimi K2.6 سربًا (swarm) من 300 وكيل فرعي، وتبرم SpaceX شراكة برمجية مع Cursor.
GPT-5.5: النموذج الريادي من OpenAI
23 أبريل — تطلق OpenAI GPT-5.5، أقوى نموذج لديها حتى الآن، والمصمم للعمل الفعلي والوكلاء. وهو يحسن بشكل ملحوظ البرمجة الوكيلة، واستخدام الحاسوب (computer use)، والعمل المعرفي، والبحث العلمي، مع الحفاظ على زمن استجابة GPT-5.4.
الإتاحة والتسعير
يتوفر GPT-5.5 فورًا لمشتركي ChatGPT Plus وPro وBusiness وEnterprise، وكذلك داخل Codex. وسيصل الوصول عبر API “قريبًا جدًا”.
| العرض | وصول API | الإدخال | الإخراج |
|---|---|---|---|
| GPT-5.5 standard | قريبًا | $5 / M tokens | $30 / M tokens |
| GPT-5.5 Pro | قريبًا | $30 / M tokens | $180 / M tokens |
تصل نافذة السياق في Codex إلى 400K tokens. ويتوفر وضع Fast — أسرع بمقدار 1.5×، وتكلفته 2.5×.
المعايير
| التقييم | GPT-5.5 | GPT-5.4 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 82.7% | 75.1% | 69.4% | 68.5% |
| Expert-SWE (داخلي) | 73.1% | 68.5% | — | — |
| SWE-Bench Pro | 58.6% | 57.7% | 64.3% | 54.2% |
| GDPval | 84.9% | 83.0% | 80.3% | 67.3% |
| OSWorld-Verified | 78.7% | 75.0% | 78.0% | — |
| ARC-AGI-2 | 85.0% | 73.3% | 75.8% | 77.1% |
| FrontierMath Tier 4 | 35.4% | 27.1% | 22.9% | 16.7% |
| CyberGym | 81.8% | 79.0% | 73.1% | — |
| BixBench (bioinformatique) | 80.5% | 74.0% | — | — |
يتصدر GPT-5.5 معظم المعايير، مع استثناء بارز: SWE-Bench Pro حيث يحتفظ Claude Opus 4.7 بالأفضلية (64.3% مقابل 58.6%).
البنية التحتية والأمان
تم تصميم النموذج بالتعاون مع NVIDIA GB200/GB300 NVL72. واستخدم Codex GPT-5.5 لتحسين بنيته التحتية الخاصة، محققًا +20% في سرعة توليد tokens. وعلى صعيد الأمن السيبراني، يُصنَّف GPT-5.5 ضمن فئة High في إطار Preparedness Framework الخاص بـ OpenAI (وليس Critical)؛ كما جرى توسيع برنامج Trusted Access Cyber ليشمله.
البحث العلمي
إلى جانب الكود، ساعد GPT-5.5 في إثبات مبرهنة جديدة حول أعداد رامزي (التوافقيات)، وتم التحقق منها رسميًا في Lean. كما حلّل مجموعة بيانات جينومية تضم 62 عينة و28,000 جينًا في بضع دقائق — وهي مهمة كانت ستحتاج أشهرًا إلى فريق من الباحثين.
« GPT-5.5 is noticeably smarter and more persistent than GPT-5.4, with stronger coding performance and more reliable tool use. »
🇸🇦 GPT-5.5 أذكى بكثير وأكثر مثابرة من GPT-5.4، مع أداء أفضل في البرمجة واستخدام أكثر موثوقية للأدوات. — Michael Truell، الشريك المؤسس والرئيس التنفيذي لـ Cursor
موجة الوكلاء الدائمين
تتقاطع ثلاثة إعلانات كبرى في 23 أبريل حول الوكيل الدائم، القادر على العمل بشكل مستقل لفترات طويلة والاحتفاظ بالسياق من جلسة إلى أخرى.
OpenAI Workspace Agents داخل ChatGPT
22 أبريل — تقدم OpenAI وكلاء مساحة العمل (Workspace Agents) : وكلاء مشتركون تنشئهم فرق العمل مرة واحدة، وتستخدمهم معًا داخل ChatGPT أو Slack، ثم تطورهم تدريجيًا. وبفضل Codex في السحابة، يمكنهم تنفيذ مهام معقدة حتى عندما يكون المستخدم غير متصل. تحل Workspace Agents تدريجيًا محل GPTs، التي تظل متاحة خلال مرحلة الانتقال.
| نوع الوكيل | الوظيفة |
|---|---|
| مدقق البرمجيات | يراجع الطلبات، يقارن السياسات، ينشئ تذاكر IT |
| موجّه ملاحظات المنتج | يراقب Slack/support/forums → تذاكر ذات أولوية |
| مولد التقارير | يستخرج البيانات يوم الجمعة، ينشئ الرسوم البيانية، ملخص |
| وكيل التنقيب | يبحث عن leads، يقيّمها، يكتب emails، يحدّث CRM |
| مسؤول مخاطر الطرف الثالث | يقيّم الموردين، ينتج تقريرًا منظمًا |
متاحة في research preview لخطط Business وEnterprise وEdu وTeachers؛ مجانية حتى 6 مايو 2026، ثم يتم التحصيل بالاعتمادات.
وفقًا لـ Ankur Bhatt (AI Engineering, Rippling)، فإن ما كان يستغرق سابقًا 5 إلى 6 ساعات أسبوعيًا من مندوبي المبيعات يُنفَّذ الآن تلقائيًا في الخلفية على كل فرصة.
Anthropic — ذاكرة لـ Claude Managed Agents
23 أبريل — أصبحت الذاكرة الخاصة بـ Claude Managed Agents متاحة في نسخة تجريبية عامة على Claude Platform. يمكن للوكلاء الآن التعلم من جلسة إلى أخرى بفضل طبقة ذاكرة موضوعة مباشرة فوق نظام ملفات: يستخدم الوكلاء القدرات نفسها في bash وتنفيذ الشيفرة التي يستعملونها أصلًا للمهام الوكيلة.
| الميزة | التفاصيل |
|---|---|
| مخازن قابلة للمشاركة | عدة وكلاء، ونطاقات وصول مختلفة (قراءة فقط / قراءة وكتابة) |
| وصول متزامن | دون الكتابة فوق البيانات بين الجلسات المتوازية |
| سجل تدقيق | أي جلسة، أي وكيل، أي ذاكرة |
| العودة للخلف | إلى أي نسخة سابقة |
| قابلية التصدير | ذاكرات قابلة للإدارة عبر API |
توضح نتائج العملاء الأثر العملي:
| العميل | النتيجة |
|---|---|
| Rakuten | -97% من الأخطاء في المحاولة الأولى، -27% من التكلفة، -34% من زمن الاستجابة |
| Wisedocs | +30% من سرعة التحقق من الوثائق |
| Netflix | استمرارية السياق بين الجلسات دون تحديث يدوي |
| Ando | ذاكرة منصة دون بنية تحتية مخصصة |
Memory in Claude Managed Agents lets us put continuous learning into production at scale. Our agents distill lessons from every session, delivering 97% fewer first-pass errors at 27% lower cost and 34% lower latency.
🇸🇦 تتيح لنا الذاكرة في Managed Agents نقل التعلم المستمر إلى الإنتاج على نطاق واسع. يقوم وكلاؤنا بتقطير الدروس المستفادة من كل جلسة، ما ينتج 97% أقل من الأخطاء في المحاولة الأولى مع 27% أقل من التكلفة و34% أقل من زمن الاستجابة. — Yusuke Kaji، المدير العام للذكاء الاصطناعي للأعمال، Rakuten
Claude Code: تقرير ختامي عن الجودة ونسختان جديدتان
تقرير ختامي وإعادة ضبط الحدود
23 أبريل — نشر فريق Claude Code تقريرًا ختاميًا حول ثلاثة مشكلات جودة تم الإبلاغ عنها خلال الشهر الماضي. وقد تم إصلاحها جميعًا في v2.1.116+. وتمت إعادة ضبط حدود الاستخدام لجميع المشتركين.
Over the past month, some of you reported Claude Code’s quality had slipped. We investigated, and published a post-mortem on the three issues we found. All are fixed in v2.1.116+ and we’ve reset usage limits for all subscribers.
🇸🇦 خلال الشهر الماضي، أبلغ بعضكم عن انخفاض في جودة Claude Code. لقد أجرينا تحقيقًا ونشرنا تقريرًا ختاميًا عن المشكلات الثلاث المحددة. وقد تم إصلاحها جميعًا في v2.1.116+ وأعدنا ضبط حدود الاستخدام لجميع المشتركين. — @ClaudeDevs
v2.1.117 و v2.1.118
| الإصدار | الميزات الرئيسية |
|---|---|
| v2.1.118 | وضع Vim المرئي (v/V) مع التحديد والمشغلات؛ /usage موحّد (يدمج /cost و /stats)؛ سمات مخصصة في /theme؛ hooks تستدعي أدوات MCP عبر type: "mcp_tool"؛ DISABLE_UPDATES صارم؛ وراثة managed settings في Windows عبر WSL |
| v2.1.117 | جهد افتراضي انتقل إلى high لخطتي Pro/Max على Opus 4.6 وSonnet 4.6 (كان medium)؛ إمكانية تفعيل fork للوكالات الفرعية على builds الخارجية؛ استبدال glob/Grep بـ bfs/ugrep مدمجة لعمليات بحث أسرع؛ إصلاح جلسات Opus 4.7 (تم حساب سياق 1M بشكل صحيح)؛ إصلاح Bedrock+Opus 4.7 مع تعطيل thinking |
موصلات Claude جديدة للحياة اليومية
23 أبريل — توسّع Anthropic قائمة الموصلات الخاصة بها لتشمل التطبيقات الاستهلاكية. فمنذ يوليو 2025، كانت أكثر من 200 موصل للأدوات المهنية متاحة؛ ويضيف هذا التحديث 15 خدمة يومية.
| التطبيق | الفئة |
|---|---|
| AllTrails | المشي لمسافات طويلة |
| Audible | كتب صوتية |
| Booking.com | السفر |
| Instacart | التسوق عبر الإنترنت |
| Intuit Credit Karma | التمويل |
| Intuit TurboTax | الضرائب |
| Resy | حجوزات المطاعم |
| Spotify | الموسيقى |
| StubHub | بيع التذاكر |
| Taskrabbit | خدمات منزلية |
| Thumbtack | محترفون محليون |
| TripAdvisor | السفر |
| Uber | النقل |
| Uber Eats | توصيل الطعام |
| Viator | الأنشطة السياحية |
يقترح Claude الآن تلقائيًا الموصلات المناسبة وفقًا لسياق المحادثة. وهي متاحة في جميع الخطط (بما فيها المجانية)، وعلى الويب وسطح المكتب والهاتف المحمول (الهاتف المحمول في beta). لا يوجد أي تموضع مدفوع أو ردود برعاية؛ ولا تُستخدم بيانات أي تطبيق لتدريب النماذج.
GitHub Copilot — سبعة تحديثات خلال ثلاثة أيام
نشر GitHub Copilot سبعة إدخالات في سجل التغييرات بين 22 و23 أبريل.
Chat لطلبات السحب (3 قدرات جديدة)
23 أبريل — يدمج Copilot Chat الآن ثلاث قدرات لطلبات السحب، متاحة عبر github.com/copilot أو زر Copilot على diffs (preview عامة) :
- فهم PR (pull request understanding) : التعليقات، التغييرات، commits والمراجعات مدمجة كسياق
- مراجعة PR : مراجعة منظمة عند الطلب
- ملخص PR : ملخص موجز للتغييرات
🔗 تحسينات Copilot Chat لطلبات السحب
جلسات الوكيل قابلة للإدارة من issues والمشاريع
23 أبريل — أصبح cloud agent قابلاً للإدارة مباشرة من issues ولوحات مشاريع GitHub: مؤشر جلسة في ترويسة issue، ولوحة جانبية للتقدم، وجلسات مفعلة افتراضيًا في جميع عروض المشاريع.
تصحيح منظم لـ stack traces على الويب
23 أبريل — يوجّه Copilot Chat على github.com الآن تحليل stack traces عبر ست خطوات منظمة: ما الذي فشل، لماذا، السبب الجذري، الأدلة المستخرجة من الكود، مستوى الثقة، والتحققات التالية.
إتاحة BYOK VS Code بشكل عام (GA)
22 أبريل — أصبح Bring Your Own Key (أحضِر مفتاح API الخاص بك) متاحًا بشكل عام لمستخدمي Copilot Business وEnterprise في VS Code. يتم دعم Anthropic وGemini وOpenAI وOpenRouter وAzure، وكذلك النماذج المحلية عبر Ollama وFoundry Local. تتم الفوترة مباشرةً عبر المزوّد المختار، خارج حصص Copilot.
C++ Language Server في preview عامة لـ Copilot CLI
22 أبريل — يتوفر Microsoft C++ Language Server (محرك IntelliSense الخاص بـ Visual Studio/VS Code) في preview عامة لـ Copilot CLI. ويوفر بيانات دلالية دقيقة (تعريفات الرموز، المراجع، هياكل الاستدعاءات، الأنواع) بدلًا من البحث التكراري باستخدام grep. المتطلبات: مصادقة Copilot CLI + compile_commands.json.
تعليق التسجيلات الجديدة في Business self-serve
22 أبريل — يوقف GitHub التسجيلات الجديدة بنمط self-serve لـ Copilot Business على خطط GitHub Free وGitHub Team. العملاء الحاليون غير متأثرين.
🔗 إيقاف Business self-serve مؤقتًا
الحقل used_copilot_cloud_agent في مقاييس API
23 أبريل — عقب إعادة تسمية “coding agent” إلى “cloud agent”، تضيف API المقاييس الحقل used_copilot_cloud_agent في تقارير المستخدمين (يوم واحد و28 يومًا متحركة). ويظل الحقل القديم used_copilot_coding_agent معتمدًا حتى 1 أغسطس 2026.
Gemini CLI v0.39.0 وDeep Think لجميع Ultra ### Gemini CLI v0.39.0
23 أبريل — تُصدر Google Gemini CLI v0.39.0، وهي نسخة مستقرة موسومة بـ “Latest”. أبرز ما فيها هو الأمر الجديد /memory inbox لمراجعة واعتماد skills التي يستخرجها CLI تلقائيًا أثناء جلسات العمل.
| الميزة | الوصف |
|---|---|
/memory inbox | مراجعة skills المستخرجة تلقائيًا |
invoke_subagent موحّد | أداة فرعية معاد هيكلتها ضمن واجهة واحدة |
| تنسيق مضغوط | قابلية قراءة أفضل في الوضع المضغوط |
| وضع الخطة — التأكيدات | يلزم الاعتماد قبل تفعيل skills |
| بدء تشغيل أخف | عملية أصلية خفيفة لبدء تشغيل أسرع |
| ترحيل JSONL البثي | تسجيل جلسات الدردشة بصيغة JSONL |
أُضيفت اختصارات لوحة المفاتيح: Ctrl+Backspace للحذف كلمةً بكلمة (Windows Terminal)، Ctrl+Shift+G.
Deep Think مفتوح أمام جميع مشتركي Ultra
22 أبريل — تفتح Google وضع Deep Think (التفكير العميق، extended thinking) أمام جميع مشتركي Gemini Ultra. كان هذا الوضع سابقًا متاحًا بوصول محدود؛ وأصبح الآن متاحًا مباشرة من قائمة الأدوات في تطبيق Gemini (الويب والهاتف المحمول).
Kimi K2.6: سرب من 300 وكيل فرعي ومعايير أداء open-weights
Agent Swarm — 300 وكيلًا فرعيًا متوازيًا
23 أبريل — تطلق Moonshot AI Kimi K2.6 Agent Swarm: نظام قادر على نشر 300 وكيل فرعي بالتوازي عبر 4 000 خطوة لكل تشغيل، مقابل 100 وكيل و1 500 خطوة في K2.5.
| القدرة | K2.5 | K2.6 |
|---|---|---|
| الوكلاء الفرعيون المتوازيون | 100 | 300 |
| الخطوات لكل تشغيل | 1 500 | 4 000 |
| أنواع المخرجات | نص محادثة | 100+ ملفًا حقيقيًا، مراجعات 100 000 كلمة، مجموعات بيانات 20 000 سطر |
يجمع الوكلاء الفرعيون مهارات غير متجانسة: البحث على الويب، تحليل البيانات، البرمجة، الكتابة الطويلة التشكيل، وتوليد العناصر البصرية. متاح على kimi.com/agent-swarm.
المعايير: المركز الأول في open-weights
23 أبريل — يصل Kimi K2.6 إلى المرتبة الأولى بين نماذج open-weights على معيارين:
- Design Arena: في نفس نطاق الأداء الذي يحققه Claude Opus 4.7
- MathArena open (وضع Think): متقدمًا على GLM 5.1
SpaceXAI × Cursor وGrok Imagine
شراكة SpaceXAI × Cursor
22 أبريل — تعلن SpaceXAI (كيان ناتج عن تقارب xAI/SpaceX) وCursor عن شراكة لإنشاء “أقوى ذكاء اصطناعي للبرمجة والعمل المعرفي في العالم”. توفر SpaceX الحاسوب الفائق Colossus (بما يعادل مليون H100)؛ ويمنحها Cursor الحق في الاستحواذ على الشركة لاحقًا في 2026 مقابل $60 مليار، أو دفع $10 مليارات للتعاون وحده.
Grok Imagine — قوالب مخصصة قابلة للمشاركة
22 أبريل — يمكن الآن لمشتركي SuperGrok وPremium+ إنشاء قوالب مخصصة في Grok Imagine ومشاركتها علنًا.
NVIDIA × Google Cloud Next
22 أبريل — في Google Cloud Next (لاس فيغاس)، تعلن NVIDIA وGoogle Cloud عن عدة تطورات كبرى حول البنية التحتية للذكاء الاصطناعي الوكالي.
| الإعلان | التفاصيل |
|---|---|
| مثيلات A5X (Vera Rubin NVL72) | حتى 960 000 GPU من Rubin في عنقود متعدد المواقع، أرخص 10× لكل token، وأعلى 10× في معدل النقل لكل ميغاواط |
| Gemini على Google Distributed Cloud | معاينة مع GPUs Blackwell وBlackwell Ultra — سيادة البيانات |
| Confidential VMs Blackwell | أول عرض للحوسبة السرية (confidential computing) من Blackwell في السحابة العامة |
| Nemotron 3 Super | متاح على منصة Gemini Enterprise Agent Platform |
| NeMo RL API | تعلم معزز (Reinforcement Learning) مُدار وعلى نطاق واسع |
Kling AI Video 3.0 — وضع 4K أصلي
23 أبريل — تطلق Kling AI وضع 4K الأصلي ضمن سلسلة Video 3.0. يتم توليد 4K بنقرة واحدة، من دون خطوة upscaling إضافية. تُحفظ الاتساقية البصرية (الشخصيات، النصوص، الأنماط، الإضاءات) بدقة أصلية للإنتاج عالي المستوى. كما أنه متاح أيضًا عبر fal.ai للشركات.
تنظم Kling AI في الوقت نفسه 4K Short Film Creative Contest، وهي مسابقة عالمية تدعو المبدعين إلى تقديم أفلام قصيرة أُنجزت باستخدام الوضع الجديد.
ChatGPT for Clinicians وOpenAI Privacy Filter
ChatGPT for Clinicians + HealthBench Professional
22 أبريل — تطلق OpenAI ChatGPT for Clinicians، وهي نسخة مجانية للمختصين الصحيين المعتمدين في الولايات المتحدة (الأطباء، الممرضون الممارسون، المساعدون الطبيون، الصيادلة). تتضمن الخدمة الوصول إلى النماذج الحدودية للأسئلة السريرية المعقدة، وskills لسير العمل المتكرر (خطابات الإحالة، الموافقات المسبقة)، والبحث السريري الموثق في الوقت الحقيقي، والتوليد التلقائي لاعتمادات التعليم المستمر (CME). تتوفر معالجة HIPAA اختياريًا عبر اتفاقية.
كما تنشر OpenAI HealthBench Professional، وهو معيار مفتوح يقيم الذكاء الاصطناعي على مهام سريرية حقيقية (أكثر من 700 000 إجابة قيّمها الأطباء). يتفوق GPT-5.4 داخل ChatGPT for Clinicians على الأطباء البشر على هذا المعيار في ظروف غير محددة زمنيًا مع الوصول إلى الويب.
OpenAI Privacy Filter
22 أبريل — تنشر OpenAI Privacy Filter، وهو نموذج open-weight (Apache 2.0) لاكتشاف المعلومات الشخصية القابلة للتحديد (Personally Identifiable Information, PII) وإخفائها في النص. يعمل النموذج محليًا (من دون إرسال أي بيانات إلى خادم)، ويدعم سياقًا من 128K token، ويحقق درجة F1 تبلغ 97.43% على معيار PII-Masking-300k.
| الخاصية | القيمة |
|---|---|
| البنية | مصنف tokens ثنائي الاتجاه (فك ترميز Viterbi مقيّد) |
| الحجم | 1.5B معلمة إجمالية، 50M نشطة |
| السياق | 128 000 token |
| الترخيص | Apache 2.0 (Hugging Face + GitHub) |
| F1 | 97.43% على PII-Masking-300k المصحح |
فئات PII المغطاة: private_person، private_address، private_email، private_phone، private_url، private_date، account_number، secret (كلمات المرور ومفاتيح API).
Perplexity وCohere
Perplexity تدمج Kimi K2.6
23 أبريل — أصبح Kimi K2.6 من Moonshot AI متاحًا الآن لجميع مشتركي Pro وMax في Perplexity.
Cohere — W4A8 جاهز للإنتاج في vLLM
22 أبريل — تعلن Cohere عن دمج استدلالها W4A8 (تكميم 4 بت للأوزان، و8 بت للتفعيلات) في vLLM. النتائج على GPU Hopper مقارنةً بـ W4A16: تحسن بنسبة +58% في زمن الوصول إلى أول token (Time To First Token) وبنسبة +45% في الزمن لكل token خرج (Time Per Output Token). يستهدف الدمج أولًا نماذج MoE Command A واسعة النطاق في الإنتاج.
برقيات سريعة
Suno في المرتبة الأولى في App Store للموسيقى
21 أبريل — تصل Suno، منصة توليد الموسيقى بالذكاء الاصطناعي، إلى المرتبة الأولى في App Store ضمن فئة الموسيقى. يعلن الرئيس التنفيذي Mikey Shulman: «The future of music is one where everyone enjoys creating.」
Anthropic Economic Index Survey
22 أبريل — تطلق Anthropic Anthropic Economic Index Survey، وهي دراسة شهرية تُجرى عبر Anthropic Interviewer على عينة عشوائية من مستخدمي Claude. الهدف هو جمع بيانات نوعية حول الأثر الاقتصادي للذكاء الاصطناعي: المهام المفوضة، مكاسب الإنتاجية، وتطور الأدوار. ستغذي النتائج التقارير المستقبلية لـ Anthropic Economic Index.
Anthropic — وكلاء MCP في الإنتاج: الأرقام
22 أبريل — يوثق مقال تقني من Anthropic فوائد MCP لوكلاء الإنتاج: تتجاوز تنزيلات MCP SDK 300 مليون تنزيل شهريًا، ويقلل البحث عن الأدوات (tool search) من tokens تعريف الأدوات بنسبة 85%، كما تقلل استدعاءات الأدوات البرمجية (programmatic tool calling) استخدام tokens بنسبة 37% في سير عمل متعدد الخطوات معقد.
OpenAI — WebSockets في API Responses: مكسب في زمن الوصول بنسبة 40%
22 أبريل — مقال استرجاعي من OpenAI يشرح كيف يقلل وضع WebSocket في API Responses زمن الوصول في حلقات الوكلاء بنسبة 40%. يحافظ الاتصال المستمر على cache في الذاكرة لحالة الردود السابقة، ما يتجنب إعادة معالجة السجل الكامل في كل استدعاء. وهو مستخدم بالفعل في الإنتاج: Codex، وVercel AI SDK، وCline (+39%)، وCursor (+30%).
Perplexity Research — تدريب نماذج البحث المعزز
22 أبريل — تنشر Perplexity بحثًا حول مسار SFT + RL (Supervised Fine-Tuning + Reinforcement Learning) لتحسين جودة إجابات البحث. النتيجة الأساسية: النماذج من Qwen بعد التدريب اللاحق تحقق دقة واقعية تضاهي نماذج GPT بتكلفة أقل.
ما الذي يعنيه ذلك
يرسم 23 أبريل 2026 اتجاهين متقاربين. من جهة، يؤكد GPT-5.5 أن OpenAI استعادت الصدارة في المعايير الوكالية (Terminal-Bench، ARC-AGI-2، OSWorld) بعد عدة أشهر كانت فيها Claude Opus 4.7 مهيمنة. ويظل الفارق ضيقًا في SWE-Bench Pro، حيث تحتفظ Anthropic بالأفضلية — وهو ما يدل على أن المختبرين يتفقان على الحالات نفسها ذات الأولوية في الاستخدام.
ومن جهة أخرى، يعلن اليوم دخول عصر الوكلاء الدائمين ذوي الذاكرة: إذ تصل OpenAI Workspace Agents وAnthropic Managed Agents Memory وKimi K2.6 Agent Swarm في الوقت نفسه مع مقاربات مختلفة (تكامل Slack، وfilesystem-based، وسرب من الوكلاء الفرعيين)، لكن بهدف واحد — أن يتذكر الوكيل ويتعلم ويتصرف من دون إشراف دائم. وتمنح أرقام Rakuten (-97% من الأخطاء، -27% من التكلفة) أول قياس صناعي للأثر.
تواصل GitHub Copilot استراتيجية التكامل العميق داخل GitHub.com (PR chat، وجلسات الوكلاء من issues، وstack traces المهيكلة) مع الانفتاح على الخارج عبر BYOK. ويشير BYOK VS Code GA إلى أن Copilot يتموضع بقدر ما كواجهة، بقدر ما هو نموذج.
المصادر
- GPT-5.5 — OpenAI
- تغريدة OpenAI GPT-5.5
- وكلاء Workspace — OpenAI
- تغريدة وكلاء Workspace
- ChatGPT للأطباء السريريين
- مرشح الخصوصية من OpenAI
- WebSockets API Responses — OpenAI
- ذاكرة الوكلاء المُدارين — Anthropic
- موصلات الحياة اليومية — Anthropic
- تغريدة الموصلات — @claudeai
- ما بعد الوفاة لـ Claude Code — @ClaudeDevs
- تغريدة @bcherny
- سجل التغييرات لـ Claude Code
- وكلاء الإنتاج MCP — Anthropic
- استطلاع المؤشر الاقتصادي من Anthropic
- تحسينات Copilot Chat في طلبات السحب
- جلسات وكلاء Copilot من المشكلات
- تصحيح تتبعات المكدس في Copilot
- Copilot BYOK VS Code GA
- خادم لغة Copilot C++
- إيقاف التسجيل الذاتي في Copilot Business
- مقاييس وكيل السحابة في Copilot
- Gemini CLI v0.39.0
- Gemini Deep Think Ultra — @GeminiApp
- Kimi K2.6 Agent Swarm — @Kimi_Moonshot
- ساحة تصميم Kimi K2.6
- MathArena Kimi K2.6
- SpaceXAI × Cursor — @SpaceX
- قوالب Grok Imagine — @imagine
- NVIDIA × Google Cloud Next
- Kling AI Video 3.0 Mode 4K
- مسابقة الفيلم القصير 4K من Kling AI
- Perplexity Kimi K2.6
- Perplexity Research Search-Augmented LMs
- Cohere W4A8 vLLM
- Suno رقم 1 في App Store
تمت ترجمة هذا المستند من النسخة fr إلى اللغة ar باستخدام النموذج gpt-5.4-mini. لمزيد من المعلومات حول عملية الترجمة، يُرجى مراجعة https://github.com/jls42/ai-powered-markdown-translator