بحث

OpenAI تطلق GPT-5.5، وAnthropic تفتح الذاكرة أمام Managed Agents، وKimi K2.6 Agent Swarm

OpenAI تطلق GPT-5.5، وAnthropic تفتح الذاكرة أمام Managed Agents، وKimi K2.6 Agent Swarm

يمثل 23 أبريل 2026 يومًا حافلًا: تطلق OpenAI نموذج GPT-5.5 بنسبة 85% على ARC-AGI-2 وبسعر API يبلغ $5/M tokens للإدخال، بينما تفتح Anthropic الذاكرة الدائمة في نسخة تجريبية لوكلائها المُدارين وتنشر تقريرًا ختاميًا عن Claude Code. وفي الوقت نفسه، يقدّم GitHub Copilot سبعة تحديثات خلال ثلاثة أيام، وينشر Kimi K2.6 سربًا (swarm) من 300 وكيل فرعي، وتبرم SpaceX شراكة برمجية مع Cursor.


GPT-5.5: النموذج الريادي من OpenAI

23 أبريل — تطلق OpenAI GPT-5.5، أقوى نموذج لديها حتى الآن، والمصمم للعمل الفعلي والوكلاء. وهو يحسن بشكل ملحوظ البرمجة الوكيلة، واستخدام الحاسوب (computer use)، والعمل المعرفي، والبحث العلمي، مع الحفاظ على زمن استجابة GPT-5.4.

الإتاحة والتسعير

يتوفر GPT-5.5 فورًا لمشتركي ChatGPT Plus وPro وBusiness وEnterprise، وكذلك داخل Codex. وسيصل الوصول عبر API “قريبًا جدًا”.

العرضوصول APIالإدخالالإخراج
GPT-5.5 standardقريبًا$5 / M tokens$30 / M tokens
GPT-5.5 Proقريبًا$30 / M tokens$180 / M tokens

تصل نافذة السياق في Codex إلى 400K tokens. ويتوفر وضع Fast — أسرع بمقدار 1.5×، وتكلفته 2.5×.

المعايير

التقييمGPT-5.5GPT-5.4Claude Opus 4.7Gemini 3.1 Pro
Terminal-Bench 2.082.7%75.1%69.4%68.5%
Expert-SWE (داخلي)73.1%68.5%
SWE-Bench Pro58.6%57.7%64.3%54.2%
GDPval84.9%83.0%80.3%67.3%
OSWorld-Verified78.7%75.0%78.0%
ARC-AGI-285.0%73.3%75.8%77.1%
FrontierMath Tier 435.4%27.1%22.9%16.7%
CyberGym81.8%79.0%73.1%
BixBench (bioinformatique)80.5%74.0%

يتصدر GPT-5.5 معظم المعايير، مع استثناء بارز: SWE-Bench Pro حيث يحتفظ Claude Opus 4.7 بالأفضلية (64.3% مقابل 58.6%).

البنية التحتية والأمان

تم تصميم النموذج بالتعاون مع NVIDIA GB200/GB300 NVL72. واستخدم Codex GPT-5.5 لتحسين بنيته التحتية الخاصة، محققًا +20% في سرعة توليد tokens. وعلى صعيد الأمن السيبراني، يُصنَّف GPT-5.5 ضمن فئة High في إطار Preparedness Framework الخاص بـ OpenAI (وليس Critical)؛ كما جرى توسيع برنامج Trusted Access Cyber ليشمله.

البحث العلمي

إلى جانب الكود، ساعد GPT-5.5 في إثبات مبرهنة جديدة حول أعداد رامزي (التوافقيات)، وتم التحقق منها رسميًا في Lean. كما حلّل مجموعة بيانات جينومية تضم 62 عينة و28,000 جينًا في بضع دقائق — وهي مهمة كانت ستحتاج أشهرًا إلى فريق من الباحثين.

« GPT-5.5 is noticeably smarter and more persistent than GPT-5.4, with stronger coding performance and more reliable tool use. »

🇸🇦 GPT-5.5 أذكى بكثير وأكثر مثابرة من GPT-5.4، مع أداء أفضل في البرمجة واستخدام أكثر موثوقية للأدوات. — Michael Truell، الشريك المؤسس والرئيس التنفيذي لـ Cursor

🔗 إعلان GPT-5.5


موجة الوكلاء الدائمين

تتقاطع ثلاثة إعلانات كبرى في 23 أبريل حول الوكيل الدائم، القادر على العمل بشكل مستقل لفترات طويلة والاحتفاظ بالسياق من جلسة إلى أخرى.

OpenAI Workspace Agents داخل ChatGPT

22 أبريل — تقدم OpenAI وكلاء مساحة العمل (Workspace Agents) : وكلاء مشتركون تنشئهم فرق العمل مرة واحدة، وتستخدمهم معًا داخل ChatGPT أو Slack، ثم تطورهم تدريجيًا. وبفضل Codex في السحابة، يمكنهم تنفيذ مهام معقدة حتى عندما يكون المستخدم غير متصل. تحل Workspace Agents تدريجيًا محل GPTs، التي تظل متاحة خلال مرحلة الانتقال.

نوع الوكيلالوظيفة
مدقق البرمجياتيراجع الطلبات، يقارن السياسات، ينشئ تذاكر IT
موجّه ملاحظات المنتجيراقب Slack/support/forums → تذاكر ذات أولوية
مولد التقاريريستخرج البيانات يوم الجمعة، ينشئ الرسوم البيانية، ملخص
وكيل التنقيبيبحث عن leads، يقيّمها، يكتب emails، يحدّث CRM
مسؤول مخاطر الطرف الثالثيقيّم الموردين، ينتج تقريرًا منظمًا

متاحة في research preview لخطط Business وEnterprise وEdu وTeachers؛ مجانية حتى 6 مايو 2026، ثم يتم التحصيل بالاعتمادات.

وفقًا لـ Ankur Bhatt (AI Engineering, Rippling)، فإن ما كان يستغرق سابقًا 5 إلى 6 ساعات أسبوعيًا من مندوبي المبيعات يُنفَّذ الآن تلقائيًا في الخلفية على كل فرصة.

🔗 Workspace Agents


Anthropic — ذاكرة لـ Claude Managed Agents

23 أبريل — أصبحت الذاكرة الخاصة بـ Claude Managed Agents متاحة في نسخة تجريبية عامة على Claude Platform. يمكن للوكلاء الآن التعلم من جلسة إلى أخرى بفضل طبقة ذاكرة موضوعة مباشرة فوق نظام ملفات: يستخدم الوكلاء القدرات نفسها في bash وتنفيذ الشيفرة التي يستعملونها أصلًا للمهام الوكيلة.

الميزةالتفاصيل
مخازن قابلة للمشاركةعدة وكلاء، ونطاقات وصول مختلفة (قراءة فقط / قراءة وكتابة)
وصول متزامندون الكتابة فوق البيانات بين الجلسات المتوازية
سجل تدقيقأي جلسة، أي وكيل، أي ذاكرة
العودة للخلفإلى أي نسخة سابقة
قابلية التصديرذاكرات قابلة للإدارة عبر API

توضح نتائج العملاء الأثر العملي:

العميلالنتيجة
Rakuten-97% من الأخطاء في المحاولة الأولى، -27% من التكلفة، -34% من زمن الاستجابة
Wisedocs+30% من سرعة التحقق من الوثائق
Netflixاستمرارية السياق بين الجلسات دون تحديث يدوي
Andoذاكرة منصة دون بنية تحتية مخصصة

Memory in Claude Managed Agents lets us put continuous learning into production at scale. Our agents distill lessons from every session, delivering 97% fewer first-pass errors at 27% lower cost and 34% lower latency.

🇸🇦 تتيح لنا الذاكرة في Managed Agents نقل التعلم المستمر إلى الإنتاج على نطاق واسع. يقوم وكلاؤنا بتقطير الدروس المستفادة من كل جلسة، ما ينتج 97% أقل من الأخطاء في المحاولة الأولى مع 27% أقل من التكلفة و34% أقل من زمن الاستجابة. — Yusuke Kaji، المدير العام للذكاء الاصطناعي للأعمال، Rakuten

🔗 ذاكرة Managed Agents


Claude Code: تقرير ختامي عن الجودة ونسختان جديدتان

تقرير ختامي وإعادة ضبط الحدود

23 أبريل — نشر فريق Claude Code تقريرًا ختاميًا حول ثلاثة مشكلات جودة تم الإبلاغ عنها خلال الشهر الماضي. وقد تم إصلاحها جميعًا في v2.1.116+. وتمت إعادة ضبط حدود الاستخدام لجميع المشتركين.

Over the past month, some of you reported Claude Code’s quality had slipped. We investigated, and published a post-mortem on the three issues we found. All are fixed in v2.1.116+ and we’ve reset usage limits for all subscribers.

🇸🇦 خلال الشهر الماضي، أبلغ بعضكم عن انخفاض في جودة Claude Code. لقد أجرينا تحقيقًا ونشرنا تقريرًا ختاميًا عن المشكلات الثلاث المحددة. وقد تم إصلاحها جميعًا في v2.1.116+ وأعدنا ضبط حدود الاستخدام لجميع المشتركين.@ClaudeDevs

v2.1.117 و v2.1.118

الإصدارالميزات الرئيسية
v2.1.118وضع Vim المرئي (v/V) مع التحديد والمشغلات؛ /usage موحّد (يدمج /cost و /stats)؛ سمات مخصصة في /theme؛ hooks تستدعي أدوات MCP عبر type: "mcp_tool"؛ DISABLE_UPDATES صارم؛ وراثة managed settings في Windows عبر WSL
v2.1.117جهد افتراضي انتقل إلى high لخطتي Pro/Max على Opus 4.6 وSonnet 4.6 (كان medium)؛ إمكانية تفعيل fork للوكالات الفرعية على builds الخارجية؛ استبدال glob/Grep بـ bfs/ugrep مدمجة لعمليات بحث أسرع؛ إصلاح جلسات Opus 4.7 (تم حساب سياق 1M بشكل صحيح)؛ إصلاح Bedrock+Opus 4.7 مع تعطيل thinking

🔗 سجل تغييرات Claude Code


موصلات Claude جديدة للحياة اليومية

23 أبريل — توسّع Anthropic قائمة الموصلات الخاصة بها لتشمل التطبيقات الاستهلاكية. فمنذ يوليو 2025، كانت أكثر من 200 موصل للأدوات المهنية متاحة؛ ويضيف هذا التحديث 15 خدمة يومية.

التطبيقالفئة
AllTrailsالمشي لمسافات طويلة
Audibleكتب صوتية
Booking.comالسفر
Instacartالتسوق عبر الإنترنت
Intuit Credit Karmaالتمويل
Intuit TurboTaxالضرائب
Resyحجوزات المطاعم
Spotifyالموسيقى
StubHubبيع التذاكر
Taskrabbitخدمات منزلية
Thumbtackمحترفون محليون
TripAdvisorالسفر
Uberالنقل
Uber Eatsتوصيل الطعام
Viatorالأنشطة السياحية

يقترح Claude الآن تلقائيًا الموصلات المناسبة وفقًا لسياق المحادثة. وهي متاحة في جميع الخطط (بما فيها المجانية)، وعلى الويب وسطح المكتب والهاتف المحمول (الهاتف المحمول في beta). لا يوجد أي تموضع مدفوع أو ردود برعاية؛ ولا تُستخدم بيانات أي تطبيق لتدريب النماذج.

🔗 موصلات الحياة اليومية


GitHub Copilot — سبعة تحديثات خلال ثلاثة أيام

نشر GitHub Copilot سبعة إدخالات في سجل التغييرات بين 22 و23 أبريل.

Chat لطلبات السحب (3 قدرات جديدة)

23 أبريل — يدمج Copilot Chat الآن ثلاث قدرات لطلبات السحب، متاحة عبر github.com/copilot أو زر Copilot على diffs (preview عامة) :

  • فهم PR (pull request understanding) : التعليقات، التغييرات، commits والمراجعات مدمجة كسياق
  • مراجعة PR : مراجعة منظمة عند الطلب
  • ملخص PR : ملخص موجز للتغييرات

🔗 تحسينات Copilot Chat لطلبات السحب

جلسات الوكيل قابلة للإدارة من issues والمشاريع

23 أبريل — أصبح cloud agent قابلاً للإدارة مباشرة من issues ولوحات مشاريع GitHub: مؤشر جلسة في ترويسة issue، ولوحة جانبية للتقدم، وجلسات مفعلة افتراضيًا في جميع عروض المشاريع.

🔗 جلسات الوكيل من issues

تصحيح منظم لـ stack traces على الويب

23 أبريل — يوجّه Copilot Chat على github.com الآن تحليل stack traces عبر ست خطوات منظمة: ما الذي فشل، لماذا، السبب الجذري، الأدلة المستخرجة من الكود، مستوى الثقة، والتحققات التالية.

🔗 تصحيح stack traces

إتاحة BYOK VS Code بشكل عام (GA)

22 أبريل — أصبح Bring Your Own Key (أحضِر مفتاح API الخاص بك) متاحًا بشكل عام لمستخدمي Copilot Business وEnterprise في VS Code. يتم دعم Anthropic وGemini وOpenAI وOpenRouter وAzure، وكذلك النماذج المحلية عبر Ollama وFoundry Local. تتم الفوترة مباشرةً عبر المزوّد المختار، خارج حصص Copilot.

🔗 BYOK VS Code GA

C++ Language Server في preview عامة لـ Copilot CLI

22 أبريل — يتوفر Microsoft C++ Language Server (محرك IntelliSense الخاص بـ Visual Studio/VS Code) في preview عامة لـ Copilot CLI. ويوفر بيانات دلالية دقيقة (تعريفات الرموز، المراجع، هياكل الاستدعاءات، الأنواع) بدلًا من البحث التكراري باستخدام grep. المتطلبات: مصادقة Copilot CLI + compile_commands.json.

🔗 C++ Language Server

تعليق التسجيلات الجديدة في Business self-serve

22 أبريل — يوقف GitHub التسجيلات الجديدة بنمط self-serve لـ Copilot Business على خطط GitHub Free وGitHub Team. العملاء الحاليون غير متأثرين.

🔗 إيقاف Business self-serve مؤقتًا

الحقل used_copilot_cloud_agent في مقاييس API

23 أبريل — عقب إعادة تسمية “coding agent” إلى “cloud agent”، تضيف API المقاييس الحقل used_copilot_cloud_agent في تقارير المستخدمين (يوم واحد و28 يومًا متحركة). ويظل الحقل القديم used_copilot_coding_agent معتمدًا حتى 1 أغسطس 2026.

🔗 مقاييس cloud agent


Gemini CLI v0.39.0 وDeep Think لجميع Ultra ### Gemini CLI v0.39.0

23 أبريل — تُصدر Google Gemini CLI v0.39.0، وهي نسخة مستقرة موسومة بـ “Latest”. أبرز ما فيها هو الأمر الجديد /memory inbox لمراجعة واعتماد skills التي يستخرجها CLI تلقائيًا أثناء جلسات العمل.

الميزةالوصف
/memory inboxمراجعة skills المستخرجة تلقائيًا
invoke_subagent موحّدأداة فرعية معاد هيكلتها ضمن واجهة واحدة
تنسيق مضغوطقابلية قراءة أفضل في الوضع المضغوط
وضع الخطة — التأكيداتيلزم الاعتماد قبل تفعيل skills
بدء تشغيل أخفعملية أصلية خفيفة لبدء تشغيل أسرع
ترحيل JSONL البثيتسجيل جلسات الدردشة بصيغة JSONL

أُضيفت اختصارات لوحة المفاتيح: Ctrl+Backspace للحذف كلمةً بكلمة (Windows Terminal)، Ctrl+Shift+G.

🔗 Gemini CLI v0.39.0

Deep Think مفتوح أمام جميع مشتركي Ultra

22 أبريل — تفتح Google وضع Deep Think (التفكير العميق، extended thinking) أمام جميع مشتركي Gemini Ultra. كان هذا الوضع سابقًا متاحًا بوصول محدود؛ وأصبح الآن متاحًا مباشرة من قائمة الأدوات في تطبيق Gemini (الويب والهاتف المحمول).

🔗 تغريدة @GeminiApp


Kimi K2.6: سرب من 300 وكيل فرعي ومعايير أداء open-weights

Agent Swarm — 300 وكيلًا فرعيًا متوازيًا

23 أبريل — تطلق Moonshot AI ‏Kimi K2.6 Agent Swarm: نظام قادر على نشر 300 وكيل فرعي بالتوازي عبر 4 000 خطوة لكل تشغيل، مقابل 100 وكيل و1 500 خطوة في K2.5.

القدرةK2.5K2.6
الوكلاء الفرعيون المتوازيون100300
الخطوات لكل تشغيل1 5004 000
أنواع المخرجاتنص محادثة100+ ملفًا حقيقيًا، مراجعات 100 000 كلمة، مجموعات بيانات 20 000 سطر

يجمع الوكلاء الفرعيون مهارات غير متجانسة: البحث على الويب، تحليل البيانات، البرمجة، الكتابة الطويلة التشكيل، وتوليد العناصر البصرية. متاح على kimi.com/agent-swarm.

🔗 تغريدة @Kimi_Moonshot

المعايير: المركز الأول في open-weights

23 أبريل — يصل Kimi K2.6 إلى المرتبة الأولى بين نماذج open-weights على معيارين:

  • Design Arena: في نفس نطاق الأداء الذي يحققه Claude Opus 4.7
  • MathArena open (وضع Think): متقدمًا على GLM 5.1

🔗 Design Arena


SpaceXAI × Cursor وGrok Imagine

شراكة SpaceXAI × Cursor

22 أبريل — تعلن SpaceXAI (كيان ناتج عن تقارب xAI/SpaceX) وCursor عن شراكة لإنشاء “أقوى ذكاء اصطناعي للبرمجة والعمل المعرفي في العالم”. توفر SpaceX الحاسوب الفائق Colossus (بما يعادل مليون H100)؛ ويمنحها Cursor الحق في الاستحواذ على الشركة لاحقًا في 2026 مقابل $60 مليار، أو دفع $10 مليارات للتعاون وحده.

🔗 تغريدة @SpaceX

Grok Imagine — قوالب مخصصة قابلة للمشاركة

22 أبريل — يمكن الآن لمشتركي SuperGrok وPremium+ إنشاء قوالب مخصصة في Grok Imagine ومشاركتها علنًا.

🔗 تغريدة @imagine


NVIDIA × Google Cloud Next

22 أبريل — في Google Cloud Next (لاس فيغاس)، تعلن NVIDIA وGoogle Cloud عن عدة تطورات كبرى حول البنية التحتية للذكاء الاصطناعي الوكالي.

الإعلانالتفاصيل
مثيلات A5X (Vera Rubin NVL72)حتى 960 000 ‏GPU من Rubin في عنقود متعدد المواقع، أرخص 10× لكل token، وأعلى 10× في معدل النقل لكل ميغاواط
Gemini على Google Distributed Cloudمعاينة مع GPUs Blackwell وBlackwell Ultra — سيادة البيانات
Confidential VMs Blackwellأول عرض للحوسبة السرية (confidential computing) من Blackwell في السحابة العامة
Nemotron 3 Superمتاح على منصة Gemini Enterprise Agent Platform
NeMo RL APIتعلم معزز (Reinforcement Learning) مُدار وعلى نطاق واسع

🔗 مدونة NVIDIA × Google Cloud


Kling AI Video 3.0 — وضع 4K أصلي

23 أبريل — تطلق Kling AI وضع 4K الأصلي ضمن سلسلة Video 3.0. يتم توليد 4K بنقرة واحدة، من دون خطوة upscaling إضافية. تُحفظ الاتساقية البصرية (الشخصيات، النصوص، الأنماط، الإضاءات) بدقة أصلية للإنتاج عالي المستوى. كما أنه متاح أيضًا عبر fal.ai للشركات.

تنظم Kling AI في الوقت نفسه 4K Short Film Creative Contest، وهي مسابقة عالمية تدعو المبدعين إلى تقديم أفلام قصيرة أُنجزت باستخدام الوضع الجديد.

🔗 تغريدة @Kling_ai


ChatGPT for Clinicians وOpenAI Privacy Filter

ChatGPT for Clinicians + HealthBench Professional

22 أبريل — تطلق OpenAI ‏ChatGPT for Clinicians، وهي نسخة مجانية للمختصين الصحيين المعتمدين في الولايات المتحدة (الأطباء، الممرضون الممارسون، المساعدون الطبيون، الصيادلة). تتضمن الخدمة الوصول إلى النماذج الحدودية للأسئلة السريرية المعقدة، وskills لسير العمل المتكرر (خطابات الإحالة، الموافقات المسبقة)، والبحث السريري الموثق في الوقت الحقيقي، والتوليد التلقائي لاعتمادات التعليم المستمر (CME). تتوفر معالجة HIPAA اختياريًا عبر اتفاقية.

كما تنشر OpenAI ‏HealthBench Professional، وهو معيار مفتوح يقيم الذكاء الاصطناعي على مهام سريرية حقيقية (أكثر من 700 000 إجابة قيّمها الأطباء). يتفوق GPT-5.4 داخل ChatGPT for Clinicians على الأطباء البشر على هذا المعيار في ظروف غير محددة زمنيًا مع الوصول إلى الويب.

🔗 ChatGPT for Clinicians

OpenAI Privacy Filter

22 أبريل — تنشر OpenAI ‏Privacy Filter، وهو نموذج open-weight (Apache 2.0) لاكتشاف المعلومات الشخصية القابلة للتحديد (Personally Identifiable Information, PII) وإخفائها في النص. يعمل النموذج محليًا (من دون إرسال أي بيانات إلى خادم)، ويدعم سياقًا من 128K token، ويحقق درجة F1 تبلغ 97.43% على معيار PII-Masking-300k.

الخاصيةالقيمة
البنيةمصنف tokens ثنائي الاتجاه (فك ترميز Viterbi مقيّد)
الحجم1.5B معلمة إجمالية، 50M نشطة
السياق128 000 token
الترخيصApache 2.0 (Hugging Face + GitHub)
F197.43% على PII-Masking-300k المصحح

فئات PII المغطاة: private_person، private_address، private_email، private_phone، private_url، private_date، account_number، secret (كلمات المرور ومفاتيح API).

🔗 OpenAI Privacy Filter


Perplexity وCohere

Perplexity تدمج Kimi K2.6

23 أبريل — أصبح Kimi K2.6 من Moonshot AI متاحًا الآن لجميع مشتركي Pro وMax في Perplexity.

🔗 تغريدة @perplexity_ai

Cohere — ‏W4A8 جاهز للإنتاج في vLLM

22 أبريل — تعلن Cohere عن دمج استدلالها W4A8 (تكميم 4 بت للأوزان، و8 بت للتفعيلات) في vLLM. النتائج على GPU Hopper مقارنةً بـ W4A16: تحسن بنسبة +58% في زمن الوصول إلى أول token (Time To First Token) وبنسبة +45% في الزمن لكل token خرج (Time Per Output Token). يستهدف الدمج أولًا نماذج MoE Command A واسعة النطاق في الإنتاج.

🔗 مدونة Cohere W4A8


برقيات سريعة

Suno في المرتبة الأولى في App Store للموسيقى

21 أبريل — تصل Suno، منصة توليد الموسيقى بالذكاء الاصطناعي، إلى المرتبة الأولى في App Store ضمن فئة الموسيقى. يعلن الرئيس التنفيذي Mikey Shulman: «The future of music is one where everyone enjoys creating.」

🔗 تغريدة @suno

Anthropic Economic Index Survey

22 أبريل — تطلق Anthropic ‏Anthropic Economic Index Survey، وهي دراسة شهرية تُجرى عبر Anthropic Interviewer على عينة عشوائية من مستخدمي Claude. الهدف هو جمع بيانات نوعية حول الأثر الاقتصادي للذكاء الاصطناعي: المهام المفوضة، مكاسب الإنتاجية، وتطور الأدوار. ستغذي النتائج التقارير المستقبلية لـ Anthropic Economic Index.

🔗 إعلان الاستبيان

Anthropic — وكلاء MCP في الإنتاج: الأرقام

22 أبريل — يوثق مقال تقني من Anthropic فوائد MCP لوكلاء الإنتاج: تتجاوز تنزيلات MCP SDK 300 مليون تنزيل شهريًا، ويقلل البحث عن الأدوات (tool search) من tokens تعريف الأدوات بنسبة 85%، كما تقلل استدعاءات الأدوات البرمجية (programmatic tool calling) استخدام tokens بنسبة 37% في سير عمل متعدد الخطوات معقد.

🔗 مدونة MCP production agents

OpenAI — WebSockets في API Responses: مكسب في زمن الوصول بنسبة 40%

22 أبريل — مقال استرجاعي من OpenAI يشرح كيف يقلل وضع WebSocket في API Responses زمن الوصول في حلقات الوكلاء بنسبة 40%. يحافظ الاتصال المستمر على cache في الذاكرة لحالة الردود السابقة، ما يتجنب إعادة معالجة السجل الكامل في كل استدعاء. وهو مستخدم بالفعل في الإنتاج: Codex، وVercel AI SDK، وCline (+39%)، وCursor (+30%).

🔗 مقال WebSockets

Perplexity Research — تدريب نماذج البحث المعزز

22 أبريل — تنشر Perplexity بحثًا حول مسار SFT + RL (Supervised Fine-Tuning + Reinforcement Learning) لتحسين جودة إجابات البحث. النتيجة الأساسية: النماذج من Qwen بعد التدريب اللاحق تحقق دقة واقعية تضاهي نماذج GPT بتكلفة أقل.

🔗 Research Perplexity


ما الذي يعنيه ذلك

يرسم 23 أبريل 2026 اتجاهين متقاربين. من جهة، يؤكد GPT-5.5 أن OpenAI استعادت الصدارة في المعايير الوكالية (Terminal-Bench، ARC-AGI-2، OSWorld) بعد عدة أشهر كانت فيها Claude Opus 4.7 مهيمنة. ويظل الفارق ضيقًا في SWE-Bench Pro، حيث تحتفظ Anthropic بالأفضلية — وهو ما يدل على أن المختبرين يتفقان على الحالات نفسها ذات الأولوية في الاستخدام.

ومن جهة أخرى، يعلن اليوم دخول عصر الوكلاء الدائمين ذوي الذاكرة: إذ تصل OpenAI Workspace Agents وAnthropic Managed Agents Memory وKimi K2.6 Agent Swarm في الوقت نفسه مع مقاربات مختلفة (تكامل Slack، وfilesystem-based، وسرب من الوكلاء الفرعيين)، لكن بهدف واحد — أن يتذكر الوكيل ويتعلم ويتصرف من دون إشراف دائم. وتمنح أرقام Rakuten (-97% من الأخطاء، -27% من التكلفة) أول قياس صناعي للأثر.

تواصل GitHub Copilot استراتيجية التكامل العميق داخل GitHub.com (PR chat، وجلسات الوكلاء من issues، وstack traces المهيكلة) مع الانفتاح على الخارج عبر BYOK. ويشير BYOK VS Code GA إلى أن Copilot يتموضع بقدر ما كواجهة، بقدر ما هو نموذج.


المصادر

تمت ترجمة هذا المستند من النسخة fr إلى اللغة ar باستخدام النموذج gpt-5.4-mini. لمزيد من المعلومات حول عملية الترجمة، يُرجى مراجعة https://github.com/jls42/ai-powered-markdown-translator