أسبوع حافل لوكلاء الذكاء الاصطناعي
من 21 إلى 23 يناير 2026، العديد من الإعلانات الكبرى المتعلقة بـ coding agents والبنية التحتية. أطلقت Anthropic خدمة Claude في Excel ونشرت ثلاث مقالات حول الأنظمة متعددة الوكلاء، وقدمت OpenAI تفاصيل حول البنية الداخلية لـ Codex وبنيتها التحتية PostgreSQL، وجعلت Qwen نموذج تحويل النص إلى كلام مفتوح المصدر، وأضافت Runway ميزة Image to Video إلى Gen-4.5.
Anthropic: Claude في Excel وClaude Code
Claude في Excel
23 يناير — أصبح Claude متاحًا الآن في Microsoft Excel في إصدار تجريبي. يتيح التكامل تحليل مصنفات Excel الكاملة مع صيغها المتداخلة والتبعيات بين علامات التبويب.
الميزات:
- فهم المصنف بالكامل (الصيغ، التبعيات متعددة علامات التبويب)
- شروحات مع استشهادات على مستوى الخلية
- تحديث الافتراضات مع الحفاظ على الصيغ
متاح لمشتركي Claude Pro وMax وTeam وEnterprise.
Claude Code v2.1.19: نظام Tasks
23 يناير — يقدم الإصدار 2.1.19 نظام Tasks، وهو نظام جديد لإدارة المهام للمشاريع المعقدة متعددة الجلسات.
We’re turning Todos into Tasks in Claude Code. Tasks are a new primitive that help Claude Code track and complete more complicated projects and collaborate on them across multiple sessions or subagents.
🇸🇦 نحن نحول Todos إلى Tasks في Claude Code. المهام (Tasks) هي عنصر أساسي جديد يساعد Claude Code على تتبع وإكمال المشاريع الأكثر تعقيدًا والتعاون عليها عبر جلسات متعددة أو وكلاء فرعيين. — Thariq (@trq212)، فريق Claude Code Anthropic
ميزات Tasks:
| الجانب | التفاصيل |
|---|---|
| التخزين | ~/.claude/tasks (ملفات، تسمح ببناء أدوات عليها) |
| التعاون | CLAUDE_CODE_TASK_LIST_ID=name claude للمشاركة بين الجلسات |
| التبعيات | مهام ذات تبعيات ومعوقات مخزنة في البيانات الوصفية |
| البث | يتم بث تحديث المهمة إلى جميع الجلسات في نفس Task List |
| التوافق | يعمل مع claude -p وAgentSDK |
ما الفائدة منه: في مشروع معقد (إعادة هيكلة ملفات متعددة، ترحيل، ميزة طويلة)، يمكن لـ Claude تقسيم العمل إلى مهام، وتتبع ما تم إنجازه وما تبقى. تستمر المهام على القرص — فهي تنجو من ضغط السياق، وإغلاق الجلسة، وإعادة التشغيل. يمكن لعدة جلسات أو وكلاء فرعيين التعاون في نفس قائمة المهام في الوقت الفعلي.
في الممارسة: يقوم Claude بإنشاء المهام (TaskCreate)، ويسردها (TaskList)، ويحدث حالتها (TaskUpdate: pending ← in_progress ← completed). مثال على إعادة هيكلة المصادقة:
#1 [completed] ترحيل تخزين الجلسة إلى Redis
#2 [in_progress] تنفيذ تدوير رمز التحديث (refresh token)
#3 [pending] إضافة اختبارات تكامل OAuth
#4 [pending] تحديث وثائق API
يتم تخزين المهام في ~/.claude/tasks/ ويمكن مشاركتها بين الجلسات عبر CLAUDE_CODE_TASK_LIST_ID.
ميزات جديدة أخرى في v2.1.19:
- اختصار
$0،$1للوسائط في الأوامر المخصصة - تفرع جلسة VSCode والترجيع للجميع
- Skills بدون أذونات تعمل دون موافقة
CLAUDE_CODE_ENABLE_TASKS=falseللتعطيل المؤقت
🔗 CHANGELOG Claude Code | سلسلة @trq212
Claude Code v2.1.18: اختصارات لوحة المفاتيح القابلة للتخصيص
الإصدار السابق الذي يضيف القدرة على تكوين اختصارات لوحة المفاتيح حسب السياق وإنشاء تسلسلات وترية (chord sequences).
الأمر: /keybindings
⚠️ ملاحظة: هذه الميزة حاليًا في مرحلة المعاينة وليست متاحة لجميع المستخدمين.
Petri 2.0: عمليات تدقيق المحاذاة الآلية
22 يناير — نشرت Anthropic أداة Petri 2.0، وهو تحديث لأداة التدقيق السلوكي الآلي لنماذج اللغة.
ما الفائدة منه: يختبر Petri ما إذا كان LLM يمكن أن يتصرف بشكل إشكالي — التلاعب، الخداع، التحايل على القواعد. تقوم الأداة بإنشاء سيناريوهات واقعية وتراقب استجابات النموذج لاكتشاف السلوكيات غير المرغوب فيها قبل حدوثها في الإنتاج.
| التحسين | الوصف |
|---|---|
| 70 سيناريو جديد | مكتبة بذور موسعة لتغطية المزيد من الحالات الحدودية |
| تخفيفات الوعي بالتقييم | يجب ألا يعرف النموذج أنه قيد الاختبار — وإلا فإنه يكيف سلوكه. تعمل Petri 2.0 على تحسين واقعية السيناريوهات لتجنب هذا الاكتشاف. |
| مقارنات الحدود | نتائج التقييم للنماذج الحديثة (Claude، GPT، Gemini) |
مدونة: متى تستخدم (أو لا تستخدم) الأنظمة متعددة الوكلاء
23 يناير — نشرت Anthropic دليلاً عمليًا حول البنيات متعددة الوكلاء. الرسالة الرئيسية: لا تستخدم وكلاء متعددين كخيار افتراضي.
We’ve seen teams invest months building elaborate multi-agent architectures only to discover that improved prompting on a single agent achieved equivalent results.
🇸🇦 لقد رأينا فرقًا تستثمر شهورًا في بناء بنيات معقدة متعددة الوكلاء فقط لتكتشف أن التلقين المحسن (prompting) على وكيل واحد حقق نتائج مماثلة.
تحدد المقالة 3 حالات حيث يضيف تعدد الوكلاء قيمة حقيقية:
| الحالة | المشكلة | حل متعدد الوكلاء |
|---|---|---|
| تلوث السياق | يولد الوكيل بيانات ضخمة يكون ملخصها فقط مفيدًا لاحقًا | يسترجع الوكيل الفرعي 2000 رمز من السجل، ويعيد فقط “تم تسليم الطلب” للوكيل الرئيسي |
| التوازي | إجراء العديد من عمليات البحث المستقلة | قم بتشغيل 5 وكلاء بالتوازي على 5 مصادر مختلفة بدلاً من معالجتها بالتسلسل |
| التخصص | كثرة الأدوات (أكثر من 20) في وكيل واحد تضعف قدرته على اختيار الأداة المناسبة | الفصل إلى وكلاء متخصصين: واحد لإدارة علاقات العملاء، وواحد للتسويق، وواحد للمراسلة |
الفخ الذي يجب تجنبه: التقسيم حسب نوع العمل (وكيل يخطط، وآخر ينفذ، وآخر يختبر). كل عملية تسليم تفقد السياق وتقلل الجودة. من الأفضل أن يتعامل وكيل واحد مع ميزة من البداية إلى النهاية.
التكلفة الحقيقية: 3-10 أضعاف الرموز المميزة مقارنة بوكيل واحد لنفس المهمة.
مقالات أخرى في السلسلة:
Building agents with Skills (22 يناير)
بدلاً من بناء وكلاء متخصصين حسب المجال، تقترح Anthropic بناء skills: مجموعات من الملفات (سير العمل، البرامج النصية، أفضل الممارسات) التي يحملها وكيل عام عند الطلب.
الإفصاح التدريجي في 3 مستويات:
| المستوى | المحتوى | الحجم |
|---|---|---|
| 1 | البيانات الوصفية (الاسم، الوصف) | ~50 رمزًا |
| 2 | ملف SKILL.md الكامل | ~500 رمز |
| 3 | الوثائق المرجعية | 2000+ رمز |
يتم تحميل كل مستوى فقط إذا لزم الأمر. النتيجة: يمكن للوكيل امتلاك مئات المهارات (skills) دون إشباع سياقه.
Eight trends 2026 (21 يناير)
تحدد Anthropic 8 اتجاهات لتطوير البرمجيات في عام 2026.
الرسالة الرئيسية: ينتقل المهندسون من كتابة الكود إلى تنسيق الوكلاء الذين يكتبون الكود.
فارق بسيط مهم: يتم استخدام الذكاء الاصطناعي في حوالي 60% من العمل، ولكن يمكن تفويض 0-20% فقط بالكامل — يظل الإشراف البشري ضروريًا.
| الشركة | النتيجة |
|---|---|
| Rakuten | Claude Code على قاعدة كود vLLM (12.5 مليون سطر)، 7 ساعات من العمل المستقل |
| TELUS | أسرع بنسبة 30%، توفير 500 ألف ساعة |
| Zapier | 89% اعتماد الذكاء الاصطناعي، 800+ وكيل داخلي |
OpenAI: بنية Codex والبنية التحتية
Unrolling the Codex agent loop
23 يناير — تفتح OpenAI كواليس Codex CLI. المقال الأول من سلسلة حول العمل الداخلي لوكيل البرمجيات الخاص بهم.
ما نتعلمه:
حلقة الوكيل بسيطة من الناحية النظرية: يرسل المستخدم طلبًا ← يولد النموذج استجابة أو يطلب أداة ← ينفذ الوكيل الأداة ← يستأنف النموذج بالنتيجة ← حتى الاستجابة النهائية. من الناحية العملية، تكمن التفاصيل الدقيقة في إدارة السياق.
التخزين المؤقت للموجه (Prompt caching) — مفتاح الأداء:
تضيف كل دورة محادثة محتوى إلى الموجه. بدون تحسين، يكون تربيعيًا في الرموز المرسلة. يسمح التخزين المؤقت للموجه بإعادة استخدام العمليات الحسابية من الدورات السابقة. الشرط: يجب أن يكون الموجه الجديد بادئة دقيقة للقديم. تفصل OpenAI المزالق التي تكسر التخزين المؤقت (تغيير ترتيب أدوات MCP، تعديل التكوين في منتصف المحادثة).
الضغط التلقائي:
عندما يتجاوز السياق عتبة معينة، يستدعي Codex /responses/compact الذي يعيد نسخة مضغوطة من المحادثة. يحتفظ النموذج بفهم كامن عبر encrypted_content غير شفاف.
Zero Data Retention (ZDR):
بالنسبة للعملاء الذين لا يريدون تخزين بياناتهم، يسمح encrypted_content بالحفاظ على استنتاج النموذج بين الدورات دون تخزين البيانات من جانب الخادم.
المقال الأول من سلسلة — ستغطي المقالات التالية بنية CLI، وتنفيذ الأدوات، وsandboxing.
🔗 Unrolling the Codex agent loop | Codex GitHub
Scaling PostgreSQL: 800 مليون مستخدم لـ ChatGPT
22 يناير — تفصل OpenAI كيف يقوم PostgreSQL بتشغيل ChatGPT وAPI لـ 800 مليون مستخدم بملايين الطلبات في الثانية.
| المقياس | القيمة |
|---|---|
| المستخدمون | 800 مليون |
| الإنتاجية | ملايين الطلبات في الثانية (QPS) |
| النسخ المتماثلة | ~50 نسخة قراءة متعددة المناطق |
| زمن انتقال p99 | رقم مزدوج بالمللي ثانية من جانب العميل |
| التوفر | Five-nines (99.999%) |
البنية:
- خادم Azure PostgreSQL المرن الأساسي الفردي
- PgBouncer لتجميع الاتصالات (زمن انتقال الاتصال: 50 مللي ثانية ← 5 مللي ثانية)
- تم ترحيل أعباء العمل كثيفة الكتابة إلى Azure Cosmos DB
- قفل ذاكرة التخزين المؤقت للحماية من عواصف فقدان ذاكرة التخزين المؤقت
- النسخ المتماثل المتتالي قيد الاختبار ليتجاوز 100 نسخة متماثلة
SEV-0 PostgreSQL الوحيد في الأشهر الـ 12 الماضية: أثناء الإطلاق الفيروسي لـ ChatGPT ImageGen (100 مليون مستخدم جديد في أسبوع واحد، حركة الكتابة x10).
Qwen: Qwen3-TTS مفتوح المصدر
22-23 يناير — أصدرت Alibaba Qwen3-TTS كمصدر مفتوح بموجب ترخيص Apache 2.0.
| الميزة | التفاصيل |
|---|---|
| الترخيص | Apache 2.0 |
| استنساخ الصوت | نعم |
| دعم MLX-Audio | متاح |
التثبيت:
uv pip install -U mlx-audio --prerelease=allow
Runway: Gen-4.5 Image to Video
21 يناير — أضافت Runway ميزة Image to Video إلى Gen-4.5.
| الميزة | الوصف |
|---|---|
| Image to Video | تحويل صورة إلى فيديو سينمائي |
| التحكم في الكاميرا | تحكم دقيق في الكاميرا |
| سرد متماسك | سرد متماسك بمرور الوقت |
| اتساق الشخصية | الشخصيات التي تظل متسقة |
متاح لجميع خطط Runway المدفوعة. عرض مؤقت: خصم 15%.
ماذا يعني هذا
يصادف هذا الأسبوع نضج أدوات coding agents. ينشر العملاقان (Anthropic وOpenAI) وثائق فنية مفصلة حول بنية وكلائهم — وهي علامة على أن السوق ينتقل من مرحلة “العرض التجريبي” إلى مرحلة “الإنتاج”.
على جانب البنية التحتية، تُظهر مقالة PostgreSQL من OpenAI أن بنية أساسية واحدة يمكن أن تصمد على نطاق مئات الملايين من المستخدمين مع التحسينات الصحيحة.
يفتح وصول Claude إلى Excel جبهة جديدة: الذكاء الاصطناعي المدمج مباشرة في أدوات الإنتاجية اليومية.