بحث

أخبار الذكاء الاصطناعي 23 يناير 2026: Claude في Excel، وTasks Claude Code، وحلقة وكيل Codex

أخبار الذكاء الاصطناعي 23 يناير 2026: Claude في Excel، وTasks Claude Code، وحلقة وكيل Codex

أسبوع حافل لوكلاء الذكاء الاصطناعي

من 21 إلى 23 يناير 2026، العديد من الإعلانات الكبرى المتعلقة بـ coding agents والبنية التحتية. أطلقت Anthropic خدمة Claude في Excel ونشرت ثلاث مقالات حول الأنظمة متعددة الوكلاء، وقدمت OpenAI تفاصيل حول البنية الداخلية لـ Codex وبنيتها التحتية PostgreSQL، وجعلت Qwen نموذج تحويل النص إلى كلام مفتوح المصدر، وأضافت Runway ميزة Image to Video إلى Gen-4.5.


Anthropic: Claude في Excel وClaude Code

Claude في Excel

23 يناير — أصبح Claude متاحًا الآن في Microsoft Excel في إصدار تجريبي. يتيح التكامل تحليل مصنفات Excel الكاملة مع صيغها المتداخلة والتبعيات بين علامات التبويب.

الميزات:

  • فهم المصنف بالكامل (الصيغ، التبعيات متعددة علامات التبويب)
  • شروحات مع استشهادات على مستوى الخلية
  • تحديث الافتراضات مع الحفاظ على الصيغ

متاح لمشتركي Claude Pro وMax وTeam وEnterprise.

🔗 Claude في Excel


Claude Code v2.1.19: نظام Tasks

23 يناير — يقدم الإصدار 2.1.19 نظام Tasks، وهو نظام جديد لإدارة المهام للمشاريع المعقدة متعددة الجلسات.

We’re turning Todos into Tasks in Claude Code. Tasks are a new primitive that help Claude Code track and complete more complicated projects and collaborate on them across multiple sessions or subagents.

🇸🇦 نحن نحول Todos إلى Tasks في Claude Code. المهام (Tasks) هي عنصر أساسي جديد يساعد Claude Code على تتبع وإكمال المشاريع الأكثر تعقيدًا والتعاون عليها عبر جلسات متعددة أو وكلاء فرعيين.Thariq (@trq212)، فريق Claude Code Anthropic

ميزات Tasks:

الجانبالتفاصيل
التخزين~/.claude/tasks (ملفات، تسمح ببناء أدوات عليها)
التعاونCLAUDE_CODE_TASK_LIST_ID=name claude للمشاركة بين الجلسات
التبعياتمهام ذات تبعيات ومعوقات مخزنة في البيانات الوصفية
البثيتم بث تحديث المهمة إلى جميع الجلسات في نفس Task List
التوافقيعمل مع claude -p وAgentSDK

ما الفائدة منه: في مشروع معقد (إعادة هيكلة ملفات متعددة، ترحيل، ميزة طويلة)، يمكن لـ Claude تقسيم العمل إلى مهام، وتتبع ما تم إنجازه وما تبقى. تستمر المهام على القرص — فهي تنجو من ضغط السياق، وإغلاق الجلسة، وإعادة التشغيل. يمكن لعدة جلسات أو وكلاء فرعيين التعاون في نفس قائمة المهام في الوقت الفعلي.

في الممارسة: يقوم Claude بإنشاء المهام (TaskCreate)، ويسردها (TaskList)، ويحدث حالتها (TaskUpdate: pending ← in_progress ← completed). مثال على إعادة هيكلة المصادقة:

#1 [completed] ترحيل تخزين الجلسة إلى Redis
#2 [in_progress] تنفيذ تدوير رمز التحديث (refresh token)
#3 [pending] إضافة اختبارات تكامل OAuth
#4 [pending] تحديث وثائق API

يتم تخزين المهام في ~/.claude/tasks/ ويمكن مشاركتها بين الجلسات عبر CLAUDE_CODE_TASK_LIST_ID.

ميزات جديدة أخرى في v2.1.19:

  • اختصار $0، $1 للوسائط في الأوامر المخصصة
  • تفرع جلسة VSCode والترجيع للجميع
  • Skills بدون أذونات تعمل دون موافقة
  • CLAUDE_CODE_ENABLE_TASKS=false للتعطيل المؤقت

🔗 CHANGELOG Claude Code | سلسلة @trq212


Claude Code v2.1.18: اختصارات لوحة المفاتيح القابلة للتخصيص

الإصدار السابق الذي يضيف القدرة على تكوين اختصارات لوحة المفاتيح حسب السياق وإنشاء تسلسلات وترية (chord sequences).

الأمر: /keybindings

⚠️ ملاحظة: هذه الميزة حاليًا في مرحلة المعاينة وليست متاحة لجميع المستخدمين.

🔗 وثائق Keybindings


Petri 2.0: عمليات تدقيق المحاذاة الآلية

22 يناير — نشرت Anthropic أداة Petri 2.0، وهو تحديث لأداة التدقيق السلوكي الآلي لنماذج اللغة.

ما الفائدة منه: يختبر Petri ما إذا كان LLM يمكن أن يتصرف بشكل إشكالي — التلاعب، الخداع، التحايل على القواعد. تقوم الأداة بإنشاء سيناريوهات واقعية وتراقب استجابات النموذج لاكتشاف السلوكيات غير المرغوب فيها قبل حدوثها في الإنتاج.

التحسينالوصف
70 سيناريو جديدمكتبة بذور موسعة لتغطية المزيد من الحالات الحدودية
تخفيفات الوعي بالتقييميجب ألا يعرف النموذج أنه قيد الاختبار — وإلا فإنه يكيف سلوكه. تعمل Petri 2.0 على تحسين واقعية السيناريوهات لتجنب هذا الاكتشاف.
مقارنات الحدودنتائج التقييم للنماذج الحديثة (Claude، GPT، Gemini)

🔗 Petri 2.0 | GitHub


مدونة: متى تستخدم (أو لا تستخدم) الأنظمة متعددة الوكلاء

23 يناير — نشرت Anthropic دليلاً عمليًا حول البنيات متعددة الوكلاء. الرسالة الرئيسية: لا تستخدم وكلاء متعددين كخيار افتراضي.

We’ve seen teams invest months building elaborate multi-agent architectures only to discover that improved prompting on a single agent achieved equivalent results.

🇸🇦 لقد رأينا فرقًا تستثمر شهورًا في بناء بنيات معقدة متعددة الوكلاء فقط لتكتشف أن التلقين المحسن (prompting) على وكيل واحد حقق نتائج مماثلة.

تحدد المقالة 3 حالات حيث يضيف تعدد الوكلاء قيمة حقيقية:

الحالةالمشكلةحل متعدد الوكلاء
تلوث السياقيولد الوكيل بيانات ضخمة يكون ملخصها فقط مفيدًا لاحقًايسترجع الوكيل الفرعي 2000 رمز من السجل، ويعيد فقط “تم تسليم الطلب” للوكيل الرئيسي
التوازيإجراء العديد من عمليات البحث المستقلةقم بتشغيل 5 وكلاء بالتوازي على 5 مصادر مختلفة بدلاً من معالجتها بالتسلسل
التخصصكثرة الأدوات (أكثر من 20) في وكيل واحد تضعف قدرته على اختيار الأداة المناسبةالفصل إلى وكلاء متخصصين: واحد لإدارة علاقات العملاء، وواحد للتسويق، وواحد للمراسلة

الفخ الذي يجب تجنبه: التقسيم حسب نوع العمل (وكيل يخطط، وآخر ينفذ، وآخر يختبر). كل عملية تسليم تفقد السياق وتقلل الجودة. من الأفضل أن يتعامل وكيل واحد مع ميزة من البداية إلى النهاية.

التكلفة الحقيقية: 3-10 أضعاف الرموز المميزة مقارنة بوكيل واحد لنفس المهمة.

مقالات أخرى في السلسلة:

Building agents with Skills (22 يناير)

بدلاً من بناء وكلاء متخصصين حسب المجال، تقترح Anthropic بناء skills: مجموعات من الملفات (سير العمل، البرامج النصية، أفضل الممارسات) التي يحملها وكيل عام عند الطلب.

الإفصاح التدريجي في 3 مستويات:

المستوىالمحتوىالحجم
1البيانات الوصفية (الاسم، الوصف)~50 رمزًا
2ملف SKILL.md الكامل~500 رمز
3الوثائق المرجعية2000+ رمز

يتم تحميل كل مستوى فقط إذا لزم الأمر. النتيجة: يمكن للوكيل امتلاك مئات المهارات (skills) دون إشباع سياقه.

🔗 Building agents with Skills


تحدد Anthropic 8 اتجاهات لتطوير البرمجيات في عام 2026.

الرسالة الرئيسية: ينتقل المهندسون من كتابة الكود إلى تنسيق الوكلاء الذين يكتبون الكود.

فارق بسيط مهم: يتم استخدام الذكاء الاصطناعي في حوالي 60% من العمل، ولكن يمكن تفويض 0-20% فقط بالكامل — يظل الإشراف البشري ضروريًا.

الشركةالنتيجة
RakutenClaude Code على قاعدة كود vLLM (12.5 مليون سطر)، 7 ساعات من العمل المستقل
TELUSأسرع بنسبة 30%، توفير 500 ألف ساعة
Zapier89% اعتماد الذكاء الاصطناعي، 800+ وكيل داخلي

🔗 Eight trends 2026


OpenAI: بنية Codex والبنية التحتية

Unrolling the Codex agent loop

23 يناير — تفتح OpenAI كواليس Codex CLI. المقال الأول من سلسلة حول العمل الداخلي لوكيل البرمجيات الخاص بهم.

ما نتعلمه:

حلقة الوكيل بسيطة من الناحية النظرية: يرسل المستخدم طلبًا ← يولد النموذج استجابة أو يطلب أداة ← ينفذ الوكيل الأداة ← يستأنف النموذج بالنتيجة ← حتى الاستجابة النهائية. من الناحية العملية، تكمن التفاصيل الدقيقة في إدارة السياق.

التخزين المؤقت للموجه (Prompt caching) — مفتاح الأداء:

تضيف كل دورة محادثة محتوى إلى الموجه. بدون تحسين، يكون تربيعيًا في الرموز المرسلة. يسمح التخزين المؤقت للموجه بإعادة استخدام العمليات الحسابية من الدورات السابقة. الشرط: يجب أن يكون الموجه الجديد بادئة دقيقة للقديم. تفصل OpenAI المزالق التي تكسر التخزين المؤقت (تغيير ترتيب أدوات MCP، تعديل التكوين في منتصف المحادثة).

الضغط التلقائي:

عندما يتجاوز السياق عتبة معينة، يستدعي Codex /responses/compact الذي يعيد نسخة مضغوطة من المحادثة. يحتفظ النموذج بفهم كامن عبر encrypted_content غير شفاف.

Zero Data Retention (ZDR):

بالنسبة للعملاء الذين لا يريدون تخزين بياناتهم، يسمح encrypted_content بالحفاظ على استنتاج النموذج بين الدورات دون تخزين البيانات من جانب الخادم.

المقال الأول من سلسلة — ستغطي المقالات التالية بنية CLI، وتنفيذ الأدوات، وsandboxing.

🔗 Unrolling the Codex agent loop | Codex GitHub


Scaling PostgreSQL: 800 مليون مستخدم لـ ChatGPT

22 يناير — تفصل OpenAI كيف يقوم PostgreSQL بتشغيل ChatGPT وAPI لـ 800 مليون مستخدم بملايين الطلبات في الثانية.

المقياسالقيمة
المستخدمون800 مليون
الإنتاجيةملايين الطلبات في الثانية (QPS)
النسخ المتماثلة~50 نسخة قراءة متعددة المناطق
زمن انتقال p99رقم مزدوج بالمللي ثانية من جانب العميل
التوفرFive-nines (99.999%)

البنية:

  • خادم Azure PostgreSQL المرن الأساسي الفردي
  • PgBouncer لتجميع الاتصالات (زمن انتقال الاتصال: 50 مللي ثانية ← 5 مللي ثانية)
  • تم ترحيل أعباء العمل كثيفة الكتابة إلى Azure Cosmos DB
  • قفل ذاكرة التخزين المؤقت للحماية من عواصف فقدان ذاكرة التخزين المؤقت
  • النسخ المتماثل المتتالي قيد الاختبار ليتجاوز 100 نسخة متماثلة

SEV-0 PostgreSQL الوحيد في الأشهر الـ 12 الماضية: أثناء الإطلاق الفيروسي لـ ChatGPT ImageGen (100 مليون مستخدم جديد في أسبوع واحد، حركة الكتابة x10).

🔗 Scaling PostgreSQL


Qwen: Qwen3-TTS مفتوح المصدر

22-23 يناير — أصدرت Alibaba Qwen3-TTS كمصدر مفتوح بموجب ترخيص Apache 2.0.

الميزةالتفاصيل
الترخيصApache 2.0
استنساخ الصوتنعم
دعم MLX-Audioمتاح

التثبيت:

uv pip install -U mlx-audio --prerelease=allow

🔗 Qwen3-TTS على X


Runway: Gen-4.5 Image to Video

21 يناير — أضافت Runway ميزة Image to Video إلى Gen-4.5.

الميزةالوصف
Image to Videoتحويل صورة إلى فيديو سينمائي
التحكم في الكاميراتحكم دقيق في الكاميرا
سرد متماسكسرد متماسك بمرور الوقت
اتساق الشخصيةالشخصيات التي تظل متسقة

متاح لجميع خطط Runway المدفوعة. عرض مؤقت: خصم 15%.

🔗 Runway على X


ماذا يعني هذا

يصادف هذا الأسبوع نضج أدوات coding agents. ينشر العملاقان (Anthropic وOpenAI) وثائق فنية مفصلة حول بنية وكلائهم — وهي علامة على أن السوق ينتقل من مرحلة “العرض التجريبي” إلى مرحلة “الإنتاج”.

على جانب البنية التحتية، تُظهر مقالة PostgreSQL من OpenAI أن بنية أساسية واحدة يمكن أن تصمد على نطاق مئات الملايين من المستخدمين مع التحسينات الصحيحة.

يفتح وصول Claude إلى Excel جبهة جديدة: الذكاء الاصطناعي المدمج مباشرة في أدوات الإنتاجية اليومية.


المصادر