検索

Claude Code のルーティン、Gemini Robotics-ER 1.6、GLM-5.1 のオープンソース化

Claude Code のルーティン、Gemini Robotics-ER 1.6、GLM-5.1 のオープンソース化

2026年4月14日は、AI 支援の開発ツールにとって内容の濃い一日でした。Anthropic は Claude Code にルーティンを導入し、スケジューリングや webhook を通じて、PC を起動したままにしなくてもワークフロー全体を自動化できるようにしました。Google DeepMind は、Boston Dynamics と共同開発した新しい産業向け知覚機能を備えた Gemini Robotics-ER 1.6 を公開しました。Z.ai は MIT ライセンスで GLM-5.1 を公開し、SWE-Bench Pro のオープンソースモデルで1位にランクインしました。GitHub Copilot には、3クリックでの競合解決、US/EU データレジデンシー、サードパーティエージェント向けのモデル選択という3つの便利な機能が追加されました。


Claude Code のルーティン — 事前研究 (research preview)

4月14日 — Anthropic は Claude Code のルーティン を research preview として公開しました。ルーティンとは、プロンプト、リポジトリ、コネクタを使って一度だけ設定する自動化で、その後はユーザーがログインしたままにしなくても自律的に実行されます。

利用可能なトリガーは3種類です。

種類トリガー使用例
スケジュール実行 (Scheduled)Cron(毎時、夜間、毎週)Linear のバグを夜間にトリアージし、修正 PR を作成
API専用エンドポイントへの HTTP POST 呼び出しDatadog のアラート → 自動トリアージ + 修正案の下書き
WebhookGitHub イベント(PR、push など)開かれた各 PR に対する自動コードレビュー

各ルーティンには独自のエンドポイントと認証トークンがあります。API ルーティンは、既存のあらゆるパイプライン(アラート、デプロイフック、社内ツール)に統合できます。Webhook ルーティンは、定義されたフィルターに一致する各 PR ごとに新しいセッションを開始し、その後の更新(コメント、CI 失敗)をセッションに取り込みます。

“Configure a routine once (a prompt, a repo, and your connectors), and it can run on a schedule, from an API call, or in response to an event. Routines run on our web infrastructure, so you don’t have to keep your laptop open.”

🇯🇵 ルーティンは一度だけ設定できます(プロンプト、リポジトリ、そしてコネクタ)。すると、スケジュール、API 呼び出し、またはイベントへの応答に基づいて実行できます。ルーティンは私たちの web インフラ上で動作するので、PC を起動したままにしておく必要はありません。@claudeai による X 投稿

利用可能性と制限:

プランルーティン/日
Pro5
Max15
Team / Enterprise25

Claude Code web が有効なすべての有料プラン(Pro、Max、Team、Enterprise)で利用できます。上限を超えても、追加利用は可能です。ルーティンは、対話セッションと同様にサブスクリプションのクレジットを消費します。

文書化されたユースケース:

  • バックログ管理:夜間トリアージ、ラベリング、Slack 要約
  • ドキュメントの乖離 (docs drift):マージ済み PR の週次スキャン、更新が必要なページの検出
  • デプロイ後検証:各 release 後のスモークテスト (smoke checks)
  • SDK の移植:Python の各マージ済み PR から Go SDK への移植を自動実行

🔗 Anthropic ブログ 🔗 発表ツイート


Claude Code v2.1.105 — PreCompact フック、プラグインモニター、/proactive

4月11日から13日Claude Code 2.1.105 版には、いくつかの注目すべき改善が追加されました。

機能説明
path 用の EnterWorktree パラメータ現在のリポジトリの既存 worktree に切り替え可能
PreCompact フックフックが compaction をブロックできるようになりました(終了コード 2 または {"decision":"block"}
プラグイン向け background monitorsplugin manifest 内の monitors キー — セッション開始時に自動で arm されます
/proactive/loop の新しいエイリアス
ブロックされた Streams API の中止データが5分間ない場合に中止 + 非ストリーミングモードで再試行
ネットワークエラーメッセージ静かなスピナーの代わりに、再試行メッセージを即時表示
長いファイルの表示非常に長い single-line 書き込み(例:minified JSON)は UI 上で切り詰められます
改良された /doctorステータスアイコン + f キーで、検出された問題を Claude に修正させる

4月14日2.1.107 版では UI の改善が追加されました。長い操作中に (thinking hints) の進行インジケータがより早く表示されるようになり、視覚的なフィードバックがないまま待たされる感覚が軽減されます。

🔗 Claude Code CHANGELOG


Anthropic — Vas Narasimhan が取締役会に参加

4月14日 — Anthropic の Long-Term Benefit Trust(LTBT)は、Vas Narasimhan を取締役会に नियुक्तしました。医師兼科学者であり Novartis の CEO である彼は、世界でも最も規制の厳しい業界の一つで、35件以上の革新的医薬品の開発と承認を監督してきました。

この任命により、Trust が指名した取締役が現在では取締役会の過半数を占めます。LTBT は、メンバーが Anthropic に金銭的利害を一切持たない独立機関であり、その役割は商業的成功と長期的な公益使命のバランスを保つことです。

🔗 Anthropic の発表


Gemini Robotics-ER 1.6 — 産業向け知覚と安全性

4月14日 — Google DeepMind は、ロボティクス向けの体現的推論 (embodied reasoning) モデルのアップデート版 Gemini Robotics-ER 1.6 を公開しました。このモデルは視覚・空間理解を強化し、ロボットが現実のタスクをより自律的に計画・実行できるようにします。内部のロボティクス benchmark では、Gemini Robotics-ER 1.5 と Gemini 3.0 Flash を上回っています。

新機能:

機能説明
空間ポインティング (Pointing)オブジェクトの検出とカウント、関係推論(小さい/大きい)、軌跡と把持点、複雑な制約
マルチビュー成功検出複数のカメラ角度を解析し、タスクが本当に完了したかを確認
計器読み取り円形ゲージや透明チューブ (sight glasses) を読み取る — 産業検査向けに Boston Dynamics と共同開発
安全性(ASIMOV v2 benchmark)安全指示の遵守に関して、テストされた全モデルの中で最高スコア

計器読み取り機能は、産業設備の検査に使われるロボット Spot のために Boston Dynamics と協力したことから生まれました。これは空間推論とコード実行を組み合わせ、高精度で圧力計を解釈します。

提供状況: Gemini API(gemini-robotics-er-1.6-preview)、Google AI Studio、GitHub Colab のスターターノートブック。

🔗 Google DeepMind ブログ 🔗 発表ツイート


GLM-5.1 — Z.ai がエージェント型モデルを MIT ライセンスで公開

4月7日 (見逃していた発表 — 先週のスキャンでは見落とされていました) — Z.ai(旧 ZhipuAI)は、エージェント型コーディング (agentic coding) 向けの新しい旗艦モデル GLM-5.1 を MIT ライセンスのオープンソースとして公開しました。

コード benchmark における性能:

BenchmarkGLM-5.1GLM-5Claude Opus 4.6GPT-5.4Gemini 3.1 Pro
SWE-Bench Pro58,455,157,357,754,2
NL2Repo42,735,949,841,333,4
Terminal-Bench 2.063,556,265,468,5

GLM-5.1 は、SWE-Bench Pro、Terminal-Bench、NL2Repo で オープンソース1位 かつ 世界3位 にランクインしています。

重要な違いは、長い horizon です。 GLM-5 を含む従来モデルは、最初は急速に性能が向上しますが、その後は頭打ちになります。GLM-5.1 は、はるかに長い horizon にわたるエージェント型タスクでも有効性を維持するよう設計されており、数千回のツール呼び出しを通じて戦略を洗練させながら、8時間 自律的に作業できます。

この能力を示す3つのシナリオ:

  • 600イテレーションでのベクトルデータベース最適化:GLM-5.1 は VectorDBBench で毎秒21,500リクエストを達成し、50ラウンドの1回のセッションで得られた最高結果の6倍となりました。
  • 1,000回以上のラウンドにわたる GPU カーネル最適化:KernelBench レベル3で3.6倍の高速化。
  • 8時間で Linux デスクトップを構築:自然言語の簡単な指示から、GLM-5.1 はブラウザ内に完全なデスクトップ環境(ファイルエクスプローラ、ターミナル、エディタ、システムモニター)を生成します。

提供状況: HuggingFace の open source weight(zai-org/GLM-5.1)、api.z.ai と BigModel.cn の API、Claude Code、Cline、Roo Code、Kilo Code、OpenCode に対応。

🔗 GLM-5.1 ブログ 🔗 発表ツイート


Codex CLI v0.120.0 — エージェントのリアルタイム配信

4月11日0.120.0 版の Codex CLI が stable 版として公開されました。いくつかの機能改善が追加されています。

機能詳細
Realtime V2バックグラウンドのエージェント進行状況をリアルタイムで配信し、以降の応答をキューに入れる
改良された TUI hooksアクティブな hooks を個別に表示し、完了した hooks の履歴を軽量化
ステータス内の thread タイトルカスタム TUI ステータスに、リネームされた thread のタイトルを含められる
code-mode 出力スキーマcode-mode のツール宣言に outputSchema MCP の詳細が含まれるようになりました
SessionStart hooks/clear によって作成されたセッションと開始・再開を区別

この版には、いくつかのバグ修正も含まれています。権限昇格された Windows sandbox の処理、TLS WebSocket 接続時の panic、ツール検索結果の順序保持などです。

🔗 Release v0.120.0


GitHub Copilot — 3つの新機能

サードパーティエージェント向けのモデル選択

4月14日 — github.com 上で、Claude(Anthropic)および Codex(OpenAI)エージェントでタスクを開始する際にモデルを選択できるようになりました。

Agent利用可能なモデル
ClaudeClaude Sonnet 4.6、Claude Opus 4.6、Claude Sonnet 4.5、Claude Opus 4.5
CodexGPT-5.2-Codex、GPT-5.3-Codex、GPT-5.4

既存の Copilot サブスクリプション(Business または Enterprise)に含まれますが、管理者は企業または組織レベルで対応するポリシーを有効にする必要があります。

🔗 モデル選択の changelog

3クリックでの merge conflict 解決

4月13日 — merge conflict のある pull request に新しい “Fix with Copilot” ボタンが表示されます。3クリックで、Copilot cloud agent が conflict を解決し、build と tests が通ることを確認し、その後は分離された cloud 環境から push します。PR 内の @copilot の記述は、失敗した GitHub Actions workflow の修正や code review コメントへの対応にも使えます。すべての有料 Copilot プランで利用可能です。

🔗 merge conflicts の changelog

US/EU データレジデンシーと FedRAMP 対応

4月13日 — GitHub Copilot は US および EU の地域向けデータレジデンシーに対応しました。すべての推論と関連データは、指定された地理的範囲内に留まります。米国政府向け顧客は、FedRAMP Moderate 準拠の恩恵も受けます。data-resident のリクエストには premium requests の乗数に10%の追加料金がかかります。Gemini モデルはまだサポートされていません(GCP にはまだデータレジデンシー対応の推論エンドポイントがありません)。日本とオーストラリアは2026年のロードマップに入っています。

🔗 データレジデンシーの changelog


生成メディア — Runway、Luma、MiniMax、ElevenLabs

Runway Characters をビデオ通話で利用

4月14日 — Runway は Characters のアップデートを展開し、AI アバターを Zoom、Google Meet、Teams のビデオ通話に参加させられるようにしました。手順は、Character を選択または作成 → 会議リンクを貼り付け → “Join Meeting” をクリック、です。この機能は、当初は3月9日から開発者向け API として提供されていましたが、現在は Runway アプリからすべてのユーザーが利用できます。

🔗 Runway のツイート

Luma — 音声入力とロゴアニメーション

4月14日 — Luma Labs は2つの新機能を発表しました。アプリ内の 音声入力(ユーザーが話すと、説明が生成プロンプトに変換される)と、シネマティックなロゴアニメーション(ロゴをアップロードすると、エージェントがブランディング向けのアニメーション導入を生成)です。

🔗 音声入力のツイート · ロゴアニメーションのツイート

MiniMax — エージェント向けの3つの open source Music Skills

4月14日 — MiniMax は、エージェント向けに3つの Music Skills を open source で公開しました。minimax-music-gen(プロンプトから曲全体を生成し、original、instrumental、cover を自動選択)、buddy-sings(AI エージェントがボーカルの相棒として歌う)、Playlist curation(ユーザーのライブラリからプレイリストを編成)です。これらのコンポーネントは M2.7 エージェントへの統合を想定しています。

🔗 MiniMax のツイート

ElevenLabs — 2026年第1四半期に1億ドルの純経常収益

4月13日 — CEO の Mati Staniszewski は、ElevenLabs が 2026年第1四半期に 1億ドル超の純年間経常収益 を追加したと発表しました。これは同社にとって過去最高の四半期です。成長は企業パートナーシップ(Klarna、Revolut、Deutsche Telekom、Toyota)によって牽引されました。

🔗 ElevenLabs CEO のツイート


これが意味すること

Claude Code のルーティンは、開発ツールのパラダイム転換を示しています。ツールはもはや対話的な要求に応答するだけではなく、プロジェクトのインフラ内で計画的または反応的に նախաձեռնすることができます。scheduled + webhook の組み合わせにより、Claude Code は最小限の設定コストでリポジトリ上の常駐エージェントへと変わります。

オープンソースの面では、GLM-5.1 は中国のエージェント型モデルがコード系 benchmark において最良の proprietary モデルと同等の水準に達したことを示しています。 8時間にわたる自律作業のホライズンを維持できる能力 — 何千ものツール呼び出しを伴っても — は、従来のモデルが1回のセッションでは扱えない集中的な最適化タスクに対して、具体的な可能性を開きます。

Gemini Robotics-ER 1.6 は別の潮流を示しています。現実世界の物理的制約に適応した汎用AIモデルであり、ソフトウェアとハードウェア(Boston Dynamics/Spot)の協働によって、産業用計器の読み取りのような新しい能力を生み出しています。


出典

この文書は、モデル gpt-5.4-mini を使用して fr 版から ja 言語へ翻訳されました。翻訳プロセスの詳細については、https://gitlab.com/jls42/ai-powered-markdown-translator をご覧ください