ai-powered-markdown-translatorfrからjaへgpt-5.4-miniで翻訳された記事。
2026年5月19日は、AIにとってニュース満載の日です。Andrej KarpathyはAnthropicに参加するため表舞台を去り、Google I/O 2026ではGemini 3.5シリーズを中心としたエージェント時代の発表群が披露され、xAIはOffice文書生成を備えたGrok Skillsを展開し、Cohereはバイオ医薬分野で戦略的買収を行いました。並行して、OpenAIはAIコンテンツの来歴を強化し、生成メディアの世界には新しい機能が加わりました。
Andrej KarpathyがAnthropicに参加
5月19日 — Andrej KarpathyはXでAnthropicに参加したと発表しました。このニュースは数時間で1,130万回以上の表示、10万2,000件の「いいね」、1万3,000件の共有を生み出し、この採用がコミュニティに与えた影響の大きさを示す例外的な反応となりました。
“Personal update: I’ve joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.”
🇯🇵 個人的なお知らせです。Anthropicに参加しました。今後数年のLLM最前線は、特に多くを学べるものになると思います。チームに加わり、R&Dに戻れることをとても楽しみにしています。教育には今も深く情熱を持っており、適切な時期にこの仕事を再開するつもりです。 — @karpathy on X
Karpathyは、この分野で最もよく知られた人物の一人です。経歴は、Stanfordでの博士号取得、OpenAIの創設メンバー、TeslaでのAI責任者、その後はnanoGPTシリーズや、数百万人が受講した機械学習講座で知られる独立研究者としての活動に及びます。
Anthropicへの加入は、フロンティア研究所間の競争が激化するまさにその時期に、基礎研究チームを大きく強化するものです。元OpenAIの人物がAnthropicに移る――この業界の人材動向に関して強いシグナルです。
Anthropicは彼の具体的な役職を明らかにしていません。この発表は、Code with Claude Londonイベントと同日開催の複数の主要発表と重なりました。
Google I/O 2026 — Gemini 3.5のエージェント時代
5月19日 — Google I/O 2026が本日開催され、中心テーマはGeminiのエージェント時代(agentic Gemini era)です。Googleは基調講演で、Geminiが自律的・能動的・持続的に行動できる能力を中心に据えた一連の発表をまとめて公開しました。
“Three years ago, Gemini started by understanding the world. With Gemini 2, models learned to think and reason. Late last year, Gemini 3 brought any idea to life. Today, we’re continuing that journey with our Gemini 3.5 series, starting with Gemini 3.5 Flash, delivering frontier performance for agents and coding.”
🇯🇵 「3年前、Geminiは世界を理解することから始まりました。Gemini 2では、モデルが考え、推論することを学びました。昨年末、Gemini 3はあらゆるアイデアに命を吹き込みました。今日、私たちはGemini 3.5シリーズでこの歩みを続けます。まずはGemini 3.5 Flashから始め、エージェントとコーディングに最先端の性能を提供します。」 — @GoogleAI on X
I/O 2026基調講演の主な発表は次のとおりです。
| 発表 | カテゴリ |
|---|---|
| Gemini 3.5 Flash | 新モデル(エージェント + coding) |
| Gemini Omni | マルチモーダル動画モデル |
| Gemini Spark | 24/7の個人エージェント |
| Daily Brief | カスタム朝のエージェント |
| Neural Expressive | 新しいアプリデザイン |
| Managed Agents API | 開発者向けAntigravityインフラ |
| Google AI Studio | エージェント用テンプレートで刷新 |
Gemini 3.5 Flash — エージェントのための速度と知能
5月19日 — Gemini 3.5 Flashは、新世代3.5の最初のモデルです。最先端の知能(frontier intelligence)と超高速の実行(lightning-fast action)を両立するよう設計されており、とくにエージェント用途とコーディング用途に最適化されています。
Gemini 3.5 Flashは、Antigravityエージェント(Managed Agents API)とGemini Sparkの基盤エンジンです。Gemini APIおよびGoogle AI Studioで、5月19日から利用できます。
| 世代 | 主要機能 |
|---|---|
| Gemini 1 | 世界の理解 |
| Gemini 2 | 推論と思考 |
| Gemini 3 | マルチモーダル生成 |
| Gemini 3.5 Flash | エージェント、coding、超高速 |
このモデルは、発売当日からGitHub Copilotでも一般提供(generally available)されています。対象プランはPro、Pro+、Business、Enterpriseです。GitHubは、Flashの速度でPro級に近い性能、効率的なツール使用、高速な応答時間、高いキャッシュ効率を報告しています。展開は段階的で、Copilot EnterpriseおよびBusinessの管理者は設定でGemini 3.5 Flashポリシーを有効にする必要があります。
| Copilot属性 | 値 |
|---|---|
| 対象プラン | Pro, Pro+, Business, Enterprise |
| 対応IDE | VS Code, Visual Studio, JetBrains, Xcode, Eclipse, GitHub Mobile |
| プレミアム倍率 | 14×(暫定、変更の可能性あり) |
Gemini Omni — 何からでも、何でも作る
5月19日 — Google DeepMindはGemini Omniを発表しました。これは「動画から始めて、何からでも何でも作れるモデルへの第一歩」と位置づけられています。Geminiの知能と、Googleの生成メディアシステム(Veo、Imagen)を組み合わせています。
“We’re dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video. It combines Gemini’s intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing.”
🇯🇵 「Gemini Omniを発表します。これは、動画から始めて、何からでも何でも作れるモデルへの第一歩です。Geminiの知能と、私たちの生成メディアシステムを組み合わせ、世界理解、マルチモダリティ、編集における大きな飛躍を表しています。」 — @GoogleDeepMind on X
Geminiアプリでは、Gemini Omniにより、テキスト・画像・既存動画からの高品質な映画的動画生成、自然な会話による動画編集(映画的ズーム、簡単なプロンプトによる背景変更)、ユーザーに似たカスタムAIアバターの作成、組み込みテンプレートのワンタップ適用が可能になります。
提供状況: 5月19日から順次展開。対象は世界中のGoogle AI Plus、Pro、Ultra加入者です。
Gemini Spark — 24/7の個人エージェント
5月19日 — Googleは、24時間365日利用できる個人AIエージェントGemini Sparkを発表しました。これはGeminiの性質を根本から変えるもので、ユーザーが端末を閉じていてもバックグラウンドで動く、受動的なアシスタントから能動的なパートナーへの移行を意味します(クラウドアーキテクチャ)。
Sparkは、Antigravityインフラ上のGemini 3.5 Flashで動作します。Workspaceツール(Gmail、Docs、Slides、Calendar)に深く統合されています。
| 機能 | 詳細 |
|---|---|
| 繰り返しタスク | 自動トリガー(例: 月次明細の分析) |
| スキル学習 | ユーザーの指示に基づく |
| 完全なワークフロー | 会議要約 → Google Doc → フォローアップメール |
| MCP接続 | Canva、OpenTable、Instacartが初日から利用可能 |
| ユーザー制御 | 影響の大きい操作の前に確認を要求 |
提供状況: 今週は信頼性検証テスト、翌週に米国のGoogle AI Ultra加入者向けベータ開始。Gemini macOSアプリへの搭載は2026年夏の予定です。
Gemini APIのManaged Agents — 開かれたAntigravityインフラ
5月19日 — GoogleはGemini APIにManaged Agentsを導入し、開発者が単一行のコードで、分離された一時的なLinux環境にエージェントをデプロイできるようにしました。このインフラは、Gemini 3.5 Flash上に構築されたAntigravityエージェントによって支えられています。
これは、Google内部のエージェントインフラを外部開発者に開放するものです。最初のManaged AgentはDeep Research(2025年12月)でしたが、現在は開発者自身が作成できます。
| 開発者向け機能 | 詳細 |
|---|---|
| デプロイ | 1回のAPI呼び出し — リモートLinux環境 |
| 機能 | Webナビゲーション、コード実行、ファイル管理 |
| カスタマイズ | AGENTS.md と SKILL.md |
| 永続セッション | 完全な状態復元 |
| 再利用可能なエージェント | client.agents.create() で登録 |
| Enterprise | Gemini Enterprise Agent Platform(プライベートプレビュー) |
提供状況: Gemini APIで5月19日夜からプレビュー開始。Google AI Studioではテンプレートを利用可能です。
Claude Managed Agents — 自己ホスト型サンドボックスとMCPトンネル
5月19日 — Code with Claude Londonイベントに合わせて、AnthropicはClaude Managed Agents向けに2つの主要機能を発表しました。
Self-hosted sandboxes(公開ベータ) — Claudeエージェントは、顧客のインフラ上でホストされるサンドボックス内で実行できるようになりました。チームは、機密ファイル、パッケージ、サービスを自社の管理範囲内に保ちつつ、既存のネットワークポリシー、監査ログ、セキュリティツールをそのまま利用できます。
MCP tunnels(研究プレビュー) — エージェントは、公開せずにプライベートネットワーク内のMCPサーバーへアクセスできます。MCPトンネルはClaude Consoleから管理され、Managed AgentsとMessages APIの両方でサポートされています。
| 機能 | ステータス | 提供元 |
|---|---|---|
| Self-hosted sandboxes | 公開ベータ | Cloudflare, Daytona, Modal, Vercel |
| MCP tunnels | 研究プレビュー(申請ベースのアクセス) | Claude Console経由 |
Grok Skills — 永続的な専門知識とOffice文書
5月18日 — xAIはGrok 4.3向けにSkillsを発表しました。これは永続的な記憶機能で、Grokが好み、書式ルール、ワークフローの手順を一度学べば、その後のすべての会話に適用できるようにするものです。
“I’m leveling up my Skills. Automate your workflows and get things done in record time with prebuilt and custom Skills.”
🇯🇵 「Skillsによって、私は能力を高めています。事前構築済みおよびカスタムのSkillsでワークフローを自動化し、記録的な速さでタスクをこなしましょう。」 — @grok on X
| 文書タイプ | 機能 |
|---|---|
Word (.docx) | 完全な書式設定で作成・編集(見出し、表、箇条書き) |
| PowerPoint | 視覚的な階層と話者ノート付きのスライド |
| Excel | 数式、色分けされたセクション、明確な構造 |
| 作成、結合、分割、抽出 | |
| Skill Creator | 会話を通じた新しいカスタムskillsの構築 |
Skillsはgrok.com、iOS、Androidで利用できます。ユーザーのカスタムskillsは、既定で組み込まれているskillsより常に優先されます。
CohereがReliant AIを買収 — バイオ医薬向けの主権AI
5月19日 — Cohereは、モントリオールとベルリンに拠点を持つバイオ医薬向けAI企業Reliant AIの買収を発表しました。この取引は、ヘルスケアとライフサイエンス分野におけるCohereの主権AI(sovereign AI)戦略を強化します。
“Healthcare represents one of the most consequential opportunities for AI and it demands secure, sovereign, and domain-specific systems.”
🇯🇵 ヘルスケアは、AIにとって最も重要な機会のひとつであり、安全で、主権があり、分野特化型のシステムを必要とします。 — Aidan Gomez, Co-Founder & CEO, Cohere
買収の内容:
| 要素 | 詳細 |
|---|---|
| チーム | バイオ医薬に特化したトップレベルの研究者 |
| データ | 独自の生体医療データベース |
| 技術 | インテリジェントな研究ワークベンチ(intelligent research workbench) |
| 移管される顧客 | GSK, Medicus Pharma, Kyowa Kirin |
新製品: North for Pharma — Cohereは、R&D、臨床開発、科学分析に取り組むバイオ医薬チーム向けに設計されたエージェント型AIシステムの開発を発表しました。これは、金融・通信分野向けに既に提供している「North」スイートを拡張するものです。
Karl Moritz Hermann(Reliant AIの元CEO)は、ベルリンでVP of AI Verticalizationsに就任します。Marc Bellemare(共同創業者、Canada CIFAR AI Chair、Mila)は、モントリオールでVP of Modellingに就任します。
KPMG × Anthropic — グローバル提携(従業員27万6,000人、138か国)
5月19日 — 世界最大級のプロフェッショナルサービス企業の一つであるKPMGは、Anthropicとのグローバル戦略提携を発表しました。同社はClaudeをDigital Gatewayプラットフォームに統合し、138か国にまたがる27万6,000人超の全従業員にClaudeを提供します。
主な重点領域は、Digital Gatewayに統合されたClaude CoworkとManaged Agents、税務・法務向けの新ツール、KPMGがプライベートエクイティファンド向けにAnthropicの優先パートナーになること、そしてKPMGのチームがClaude Code(KPMG Blaze経由)を使って老朽化したITシステムを近代化することです。
“Building an AI agent to help clients adjust to changing tax regulations used to take weeks and required teams to switch between multiple tools and chat windows. With Cowork and Managed Agents integrated in Digital Gateway, that same capability takes minutes.”
🇯🇵 税制改正に適応するためのAIエージェントを顧客向けに作るには、以前は数週間かかり、複数のツールを行き来する必要がありました。ですが、CoworkとManaged AgentsがDigital Gatewayに統合されたことで、同じ機能が今では数分で実現します。 — Rema Serafi, Vice-President Tax, KPMG US
この展開は、KPMG米国での2年間にわたる社内導入の上に成り立っています。
Gemini App — Neural Expressive と Daily Brief
5月19日 — Geminiアプリに2つの大きな新機能が追加されます。
Neural Expressive は、AI時代のための新しいデザイン言語です。滑らかなアニメーション、鮮やかな色、新しいタイポグラフィ、触覚フィードバックを備えます。Gemini Live(音声会話)体験は、メインインターフェースに直接統合され、入力と会話の切り替えがシームレスになります。5月19日から、Web、Android、iOSで全ユーザーにグローバル展開されます。
Daily Brief は、Gmail、Calendar、ユーザーの優先事項に基づいて、毎朝カスタム要約を生成するエージェントです。単なる要約にとどまらず、整理し、優先順位を付け、具体的な次のアクションを提案します。米国から開始して、Plus、Pro、Ultra加入者向けに順次展開されます。
OpenAI — C2PA、SynthID、公開検証ツール
5月19日 — OpenAIは、AI生成コンテンツの来歴に対する多層的アプローチを発表し、相互補完的な3つの仕組みを組み合わせます。
| 仕組み | 対象範囲 | 改変への耐性 |
|---|---|---|
| C2PAメタデータ | 画像、音声、動画 | 中(削除可能) |
| SynthID透かし(Google DeepMind) | 画像のみ | 高 |
| openai.com/verifyツール | OpenAI生成コンテンツ | N/A |
OpenAIは現在、Google DeepMindの目に見えないデジタル透かしSynthIDを、ChatGPT、Codex、OpenAI APIで生成されるすべての画像に統合しています。SynthIDは、画像ピクセル内に起源情報を知覚不可能な形で直接エンコードし、一般的な多くの加工(トリミング、フィルター、圧縮)に耐えます。公開ツールopenai.com/verifyでは、誰でも画像をアップロードしてSynthID透かしの有無を検出できます。現時点ではOpenAIコンテンツに限定したプレビューです。
NVIDIA Sana WM — 単一GPU上のワールドモデル
5月19日 — NVIDIA AI が Sana WM(ワールドモデル)を発表しました。1枚の画像、テキスト説明、そしてカメラの軌跡から、このモデルは一貫性があり制御可能な動画を生成します。しかも、すべて単一GPU上で動作します。
アーキテクチャは、Hybrid Linear Attention、Dual-Branch Camera Control、Two-Stage Generation Pipeline、Robust Annotation Pipeline の4つの革新に基づいています。プロジェクトは完全にオープンソースです(論文 + コード + モデル)。
Wan2.7-Image — カラーパレット制御
5月19日 — Alibaba は、Wan2.7-Image 向けの カラーパレット制御(Palette Control)を発表しました。この機能により、どんな画像からでも色のパレットを抽出し、まるで芸術的な傑作のように、それを新しい作品へ適用できます。wan.video 上で直接利用可能です。この発表は X 上で 529,742 回の閲覧を獲得しました。
ElevenLabs — 教育向けのアルベルト・アインシュタインの声
5月19日 — ElevenLabs は、再現された アルベルト・アインシュタイン の声を、教育専用の会話エージェントとして自社プラットフォームに導入すると発表しました。このエージェントは、音声AIが学習をよりインタラクティブで、アクセスしやすく、多言語対応にできることを示しています。デモは start.elevenlabs.io で利用できます。教師は Impact プログラムを通じて無料の Pro プランにアクセスできます。
同時に、ElevenLabs は ポーランド でのパイロットも発表しました。今夏、医療公共サービス(NFZ)に音声エージェントを導入します。
xAI Grok が OpenClaw に統合 — マルチメッセージング対応のローカル・オープンソース・エージェント
5月19日 — xAI は、Grok を OpenClaw に統合すると発表しました。OpenClaw は、個人向けのオープンソースかつローカルファーストのエージェントです。Grok および X Premium の加入者は、Mac Mini、ラップトップ、Raspberry Pi など、どのようなハードウェアでも動作する OpenClaw 内で Grok を利用でき、WhatsApp、Telegram、Slack、Discord、Signal、iMessage に接続できます。
🔗 xAI の発表
Z.ai GLM-5.1 — オープンソース SWE-Bench Pro 1位、MIT、コンテキスト 200K
5月18日 — Z.ai(Zhipu AI)は GLM-5.1 を OrcaRouter 上で利用可能にしました。このモデルは、SWE-Bench Pro(実環境でのコード修復ベンチマーク)においてオープンソースモデルの中で首位を主張しており、一部のプロプライエタリモデルをも上回っています。MIT ライセンス、200K トークンのコンテキスト、長期にわたるエージェント的コーディング(long-horizon agentic coding)向けに設計されています。
速報
-
The Problem Solvers(Anthropic) — Claude を使って構築する創業者たちを描く新しい動画シリーズ。最初のエピソードは Scott Wu(Cognition/Devin)と Kay Zhu(Genspark)。🔗 claude.com/problem-solvers
-
Manus × Higgsfield(MCP コネクタ) — Manus は MCP 経由で Higgsfield を統合し、クリエイターに画像/動画生成へのプロ仕様の制御をワークフロー内で提供します。🔗 manus.im/blog
-
OpenAI Guaranteed Capacity — 企業が 1〜3 年のコミットメントを通じて OpenAI の計算資源へのアクセスを予約できる新しい提供で、期間に応じて割引が拡大します。🔗 openai.com
-
Perplexity Computer — Rho — Rho は、Slack、Notion、Jira、Figma、Google Docs を監視する Perplexity Computer により、週次会議時間を 90% 削減し、12 週間で 120 時間を節約しました。🔗 X 上の Perplexity
それが意味すること
Managed Agents の収束。 Google と Anthropic は、ほぼ同時刻に、同じ名前の同様のインフラ、すなわち Managed Agents を発表しました。Google では、Gemini API 経由で公開される Antigravity であり、1回の呼び出しで分離された Linux サンドボックス内にエージェントを展開できます。Anthropic では、self-hosted sandboxes(Cloudflare、Daytona、Modal、Vercel)と、プライベートネットワーク向けの MCP トンネルです。この収束は偶然ではありません。生のモデルと最終アプリケーションの間に、新しい標準化された AI インフラ層が立ち上がりつつあることを示しています。
エンタープライズAIは主権を中心に構造化される。 Cohere による Reliant AI の買収、Digital Gateway における KPMG-Anthropic の連携、そして OpenAI Guaranteed Capacity の提供は、同じ動きを描いています。大規模組織は、自らの領域内で、自らのデータ、自らのセキュリティルール、そして複数年にわたる容量保証を備えた AI システムを求めています。2026年、“sovereign”(主権的) はエンタープライズAIのキーワードになりました。
長期エージェント的コーディングの競争。 Gemini 3.5 Flash(エージェント + コーディングに最適化)、Z.ai の GLM-5.1(オープンソース SWE-Bench Pro 1位、コンテキスト 200K)、Grok Skills(永続ワークフロー)—— いずれも同じユースケースを狙っています。つまり、人間の介入なしに、複雑なタスクを何時間も処理し続けるエージェントです。GitHub Copilot はリリース当日に Gemini 3.5 Flash を統合しており、開発者向けツールが新しいモデルをどれほど速く吸収するかを示しています。
AIコンテンツにおける来歴と信頼。 OpenAI が発表した C2PA + SynthID + openai.com/verify の組み合わせ(Google DeepMind の SynthID を含む)は、前例のない多層的アプローチを示しています。つまり、文脈のためのメタデータ、改変後でも持続する不可視の透かし、そして検証のための公開ツールです。生成コンテンツの追跡可能性へ向かうこの動きは、OpenAI、Google、そして C2PA 連合によって共同で推進され、徐々に業界標準になりつつあります。
参考資料
- Karpathy の X
- Claude Managed Agents の更新
- Anthropic × KPMG
- Google I/O 2026 — Gemini アプリの次なる進化
- GoogleAI の X — Gemini 3.5
- GoogleDeepMind の X — Gemini Omni
- Managed Agents API Gemini
- GitHub Copilot — Gemini 3.5 Flash GA
- GitHub の X — Gemini 3.5 Flash
- Grok Skills
- Cohere が Reliant AI を買収
- OpenAI コンテンツ来歴
- NVIDIA Sana WM
- Wan2.7-Image Palette Control
- ElevenLabs Einstein
- xAI Grok × OpenClaw
- Z.ai GLM-5.1