検索

オランダでGrokが禁止、Gemini 3.1 Flash Live、Codexのネイティブplugin

アムステルダム裁判所は、xAIに対してGrokで同意のない性的画像を生成・配布することをオランダ国内で禁止し、違反した場合は1日あたり**€100 000**の罰金を命じました。同じ日、Googleは90以上の言語でリアルタイム音声会話を可能にするGemini 3.1 Flash Liveを発表し、OpenAIはCodexにネイティブplugin(Slack、Figma、Notion、Gmail)を導入、AnthropicはClaude Codeのオートモード設計に関する技術記事を公開しました。Cohere、Mistral、Sunoの発表も加わり、今週は情報が集中しました。


xAI:アムステルダム裁判所がGrokのヌード生成を禁止

3月27日 — アムステルダム地方裁判所はxAIに対し、オランダ国内で同意のない性的画像を生成または配布することを禁じる決定を下しました。従わない場合、罰金は1日あたり€100 000、上限は€1,000万です。

この決定は、オランダのNGO OfflimitsとVictims Support Fundによる共同訴訟を受けたものです。Center for Countering Digital Hate(CCDH)によれば、Grokは11日間で300万件の性的画像を生成し、そのうち23,000件が未成年を含んでいました。Offlimitsは、Grokが被写体の地理的所在を考慮しないため、その影響は世界的だと指摘しています。

この判決は、同日可決されたAIによる性的ディープフェイクの禁止を求める欧州議会の決議と並び、規制の収束を示す強いシグナルです。これはxAIに直接対峙する欧州での初の判決となります。

🔗 CNBC:オランダ裁判所がGrokのヌード画像を禁止 🔗 The Record Media:オランダ裁判所がxAIに罰金を警告


Gemini 3.1 Flash Live:90+言語でのリアルタイム音声

3月26日 — GoogleはGemini 3.1 Flash Liveを発表しました。これはリアルタイム会話向けのマルチモーダルモデルで、音声、画像、動画、テキストを扱い、コンテキストウィンドウは128 000 token、対応言語は90以上です。

前世代に比べて、会話を2倍長く維持し、バックグラウンドノイズや環境音への耐性が向上し、複雑なシステム指示の遵守精度が上がり、会話中に外部ツールをより確実にトリガーします。生成されるすべての音声にはSynthIDが付与されます。

機能詳細
Fenêtre de contexte128 000 tokens
Langues90+
Conversations2× plus longues qu’avant
WatermarkingSynthID sur tous les audios

提供方法: 開発者向けはGoogle AI StudioのLive API、ユーザー向けはGemini LiveおよびSearch Live(200+か国)、企業向けはVertex AIを通じて。Search Liveはさらに200以上の国と地域へのアクセスを拡大し、Google Lensの動画サポートも含みます。

🔗 Google公式発表


Gemini:ChatGPTとClaudeからのメモリと履歴のインポート

3月26日 — GoogleはGeminiアプリ内で他のAIアシスタントからの移行を容易にするインポートツールを提供開始しました。

利用可能な機能は2つです:

  1. メモリのインポート(“Add Memory”):GeminiがChatGPT、Claude、またはCopilotに入力するためのプロンプトを提案します。生成された応答(他アシスタントが保持する個人情報の要約)をコピー&ペーストすると、Geminiがそこから好みや興味、位置情報などを抽出します。
  2. 履歴のインポート(“Import Chats”):ChatGPTまたはClaudeからエクスポートした.zipファイル(最大5GB)をアップロードできます。過去の会話が検索可能になり、Geminiで続きが利用できます。

🔗 Googleブログ:Geminiに乗り換える


Gemini CLI v0.35.2:デフォルトのサブエージェント、Vim改善—Proアクセスは制限

3月25–26日 — Gemini CLIの安定版v0.35.2がリリースされ、複数の注目機能が導入されました。

機能説明
Subagents activés par défaut並列タスクのスケジューリング+コード分割
Raccourcis clavier personnalisableskeybindingsのサポート、リテラル文字、Kittyプロトコル
Mode Vim amélioréMotions X, ~, r, f/F/t/T;レジスタを用いたコピー&ペースト
SandboxManager unifiébubblewrap/seccompによるツール隔離(Linux)
Découverte de contexte JITfilesystemツール向け最適化ロード
gRPC natifネイティブ統合とプロトコルルーティング

重要な方針変更: 3月25日以降、無料ユーザーはGemini Flashのみの利用に制限され、Gemini Proへのアクセスは有料プラン(ProおよびUltra)に限定されます。コミュニティからの反発が大きく、Googleは不正利用検知も強化しています:Gemini CLIのOAuth認証をサードパーティソフトで利用すると制限がかかる可能性があります。

🔗 Gemini CLI チェンジログ 🔗 コミュニティ議論


Gemini Drop 2026年3月:Personal Intelligence無料化とLyria 3 Pro

3月27日 — 月次アップデート「Gemini Drops」の2026年3月版で、Geminiアプリに今月導入された新機能が発表されました。

機能説明提供範囲
Personal Intelligence gratuitGmail、Photos、YouTube接続で旅行やプロジェクトの計画支援無料、米国
Gemini Live amélioréGemini 3.1 Flash Liveに基づき、コンテキストが2倍長く全ユーザー
Import ChatGPT/Claudeメモリと履歴の転送全ユーザー
Lyria 3 Pro最大3分の音楽生成、写真→アンサンブル化有料購読者
Google TVGeminiの視覚応答とナレーションGoogle TV

🔗 Gemini Drop 2026年3月


Codex:Slack、Figma、Notion、Gmail向けネイティブplugin

3月26–27日 — OpenAIはCodexにpluginをファーストクラス機能として展開しました。開発者は日常的に使うツールをCodexに手動設定なしで接続できます。

Plugin利用ケース
Slackメッセージ送信、チャンネルの閲覧
Figmaデザインへのアクセス、コード生成
Notionページの読み書き
Gmailメールの読み取り・作成

pluginはCodex起動時に自動で同期され、コマンド/pluginsでアクセスできます。インストールとアンインストールはTUI経由で行い、認証管理も組み込まれています。

3月27日、OpenAIはワンクリックで利用できる実用的なユースケースギャラリーを公開しました:iOSアプリ構築、データセット解析、レポートやプレゼン資料の生成など。Codex v0.117.0のチェンジログには、プロンプト内でのplugin参照サポートなど技術的詳細が記載されています。

🔗 Codexのpluginドキュメント 🔗 ツイート:@OpenAIDevs


Anthropic:Claude Codeのオートモード設計を解説

3月26日 — AnthropicはClaude Codeのオートモード(auto mode)設計に関する技術ブログ記事を公開しました(Engineeringブログ)。

対処すべき問題: Claude Codeのユーザーは「承認疲れ(approval fatigue)」に直面しており、統計では要求される許可の93%が承認されていることから、一定の自動化が安全に可能であることが示唆されています。

解決策:二層の分類器

オートモードはモデル(Sonnet 4.6)に基づく2段階の保護で構成されています:

  1. 入力層:prompt injection probe(プロンプトインジェクション検出プローブ)がツールの出力を分析し、エージェントに届く前に評価します。
  2. 出力層:トランスクリプト分類器が提案された各アクションを2段階プロセスで評価してから実行します。
レベルアクションの種類処理
Tier 1安全なツール(ファイル読み取り、検索)分類器不要で直接通過
Tier 2プロジェクト内ファイルの変更分類器を迂回(バージョン管理でレビュー可能)
Tier 3危険な操作(シェルコマンド、外部操作)分類器による完全評価

性能指標:

ステップ偽陽性率(実トラフィック)偽陰性率(リスクのある行動)
ステップ1(高速)8.5%6.6%
フルパイプライン0.4%17%

フルパイプラインでの偽陽性率0.4%は、オートモードが誤って作業を中断することがほとんどないことを示しています。偽陰性率17%は、分類器が危険を検出してもユーザーが付与した許可の範囲を誤って解釈するケースを反映しています。

“New on the Engineering Blog: How we designed Claude Code auto mode. Many Claude Code users let Claude work without permission prompts. Auto mode is a safer middle ground: we built and tested classifiers that make approval decisions instead.”

🇯🇵 Engineeringのブログ:Claude Codeのオートモードをどのように設計したか。多くのユーザーは、許可の要求を求めずにClaudeに作業を任せています。オートモードはより安全な妥協策です:承認の判断を代行する分類器を構築してテストしました。Xの@AnthropicAI

🔗 Claude Code auto mode:許可要求をスキップするより安全な方法


GitHub Copilot:マージコンフリクト解決とエージェントの可視化

3月26日 — GitHub Copilotに2つの大きなアップデートが入り、チームのワークフローが向上します。

マージコンフリクト解決: プルリクエストのコメントで@copilotを指定すると、Copilotにコンフリクト解消を指示できます。エージェントはクラウド環境で作業し、コンフリクトを解決し、ビルドとテストが通ることを確認してから変更をプッシュします。Copilotの有料プランで利用可能(Business/Enterpriseは管理者による有効化が必要)。

IssuesとProjectsでのエージェント可視化: Copilot、Claude、CodexなどのコードエージェントがIssueにアサインされると、サイドバーのassignee欄にセッションが表示され、リアルタイムの状態(待機、実行中、レビュー待ち、完了)が確認できます。Projectsのテーブル・ボードビューでもセッションが見えるようになります(“View menu > Show agent sessions”で有効化)。

🔗 Copilotがマージコンフリクトを解決 🔗 IssuesとProjectsでのエージェント活動


GitHub:新しいPRダッシュボードとCopilot for Jira

3月25–26日 — 開発者向けの追加改善が2件発表されました。

Pull Requestsダッシュボード(パブリックプレビュー): github.com/pulls上の再設計されたダッシュボードは、レビュー要請中、修正が必要、マージ準備済みといった注目すべきPRを集約します。カスタム保存ビュー、高度なフィルタ(オートコンプリーション付き)、AND/ORクエリのサポートも備わっています。Feature Preview設定から有効化できます。

Copilot for Jira: パブリックプレビュー以降、改善が進みました:Jira上で直接モデルの選択、PRタイトルとブランチ名にJiraチケット番号を自動挿入、MCPサーバー経由でConfluenceページへのアクセス(PATで設定可能)などが追加されています。

🔗 新しいPRダッシュボード 🔗 Copilot for Jiraの改善


Cohere Transcribe:オープンソースASRランキングで首位

3月26日 — Cohereは自社初の自動音声認識(ASR)モデル、Cohere Transcribeを発表しました。Apache 2.0でオープンソース化され、英語のOpen ASRランキングで即座に首位に立ちました。

本モデルは2BパラメータのFast-Conformer Transformerエンコーダ・デコーダアーキテクチャに基づき、パラメータの90%以上をエンコーダに割り当て、オートレグレッシブな計算を最小化する軽量デコーダで速度を最大化しています。50万時間の音声-転写ペアで学習されています。

モデル平均WER
Cohere Transcribe5.42
Zoom Scribe v15.47
IBM Granite 4.0 1B5.52
NVIDIA Canary Qwen 2.5B5.63
OpenAI Whisper Large v37.44

WER(Word Error Rate)が5.42%でトップに立ち、推論速度は同規模の競合より3×高速とされています。対応言語は14言語(フランス語、ドイツ語、アラビア語、標準中国語、日本語、韓国語など)です。

注意点: 本モデルはコードスイッチング(音声中の言語切替)を想定しておらず、非発話音を転写する可能性があるため、VAD(Voice Activity Detection)フィルタの併用が推奨されます。

🔗 Cohereブログ:Transcribe 🔗 Hugging Face上のモデル


Suno v5.5:パーソナルボイス、カスタムモデル、適応的嗜好

3月26日 — Sunoは音楽生成ツールのv5.5をリリースし、パーソナライズに焦点を当てた3つの新機能を導入しました。

機能説明提供範囲
Voices自分の歌声をキャプチャしてプライベートに使用全ユーザー
Custom Models自作曲からのファインチューニング、最大3モデルPro/Premier加入者
My Tasteジャンルやムードの嗜好を適応的に学習全ユーザー

これらは音楽業界と連携して開発される次世代モデルの基盤になるとされています。

🔗 Sunoブログ v5.5


Mistral Voxtral TTS:3秒で声のクローン、open-weight

3月23日(報道は26–27日) — MistralはVoxtral TTSを公開しました。これは同社初のopen-weightなText-to-Speechモデルで、voxtral-tts-2603は40億パラメータ規模で、対応言語は9言語(英語、フランス語、ドイツ語、スペイン語、オランダ語、ポルトガル語、イタリア語、ヒンディー語、アラビア語)です。

公表されているレイテンシは典型構成で70 ms(サンプル10秒+500文字)。音声クローンはわずか3秒の参照音声から可能とされます。自然さではVoxtralがElevenLabs Flash v2.5を上回り、ElevenLabs v3と同等に到達するとMistralは述べています。モデルは一般的なノートPC、ミドルレンジGPU、あるいはハイエンドなモバイル端末でも動作可能です。 アクセス: Hugging Faceで公開されているウェイト(Creative Commonsライセンス)と、Mistral StudioのAPI経由で1000文字あたり0.016ドルで利用可能。Le Chatでのvoice mode統合も利用可能。

🔗 Mistral Voxtral 発表


xAI:SuperGrok Lite が月額10ドル、動画ストーリーは15秒に

3月25日 — xAIがGrokに関する2つの新発表を行った。

SuperGrok Lite: 現在限定テスト中の月額10ドルの新しいサブスクリプションプラン。無料プランよりチャットセッションの長さが2倍、AIエージェント、そして解像度480p(最大6秒)の動画生成が含まれる。無料プランとSuperGrok Standard(月額30ドル)の中間に位置するプラン。

Grok ImagineによるVideo stories: Grok Imagineは現在、音声同期、BGM、効果音付きの「動画ストーリー」を720pで15秒生成できる。Elon Muskは動画に「doubler la mise」(注力を倍にする)すると述べた。この発表は同じ週にOpenAIがSoraを閉鎖したことを受けたもの。

🔗 Bloomberg:xAI doubling down on AI videos


Kimi/Moonshot AI、香港での上場を検討

3月26日 — モデルKimiを提供する中国企業Moonshot AIは、Bloombergによると香港証券取引所での上場を検討している。アドバイザリーバンクはCICCとGoldman Sachsで、目標評価額は約180億ドル、進行中の資金調達は最大10億ドルに上る。既存の株主にはAlibaba、Tencent、5Y Capitalが含まれる。IPOのスケジュールは未確定。

🔗 Bloomberg:Moonshot considers Hong Kong IPO


NVIDIA GTC:プロプライエタリとオープンは対立しない

3月25日 — GTC 2026の場で、NVIDIAと業界リーダー(Mistral、Perplexity、Cursor、Reflection AI、LangChain)は、AIの未来はオープンモデルとプロプライエタリモデルの補完性にあると主張した。Jensen HuangはNVIDIAの立場を「Proprietary versus open is not a thing. It’s proprietary and open.」と要約した。

ブログ記事は、企業向けにマルチモデル、マルチクラウド、マルチモーダルのオーケストレーションの必要性を強調している。NVIDIAはHugging Face上で最大の組織となり、オープンソースへのコミットを確認した。

🔗 NVIDIAブログ:AI Open and Proprietary


Claude Code v2.1.85 と v2.1.84:条件付きhooksとWindows向けPowerShell

3月26–27日 — Claude Codeの新バージョンが2つ公開された。

v2.1.85(3月27日): hooks設定に条件付きフィールド if を導入し、特定のコマンドやファイルに対してのみhookをトリガー可能にした。また、MCP補助スクリプト用の環境変数、スケジュールタスク向けの書き起こしにタイムスタンプ追加、RFC 9728準拠のOAuthサポート、PreToolUse hooksが AskUserQuestion を満たすために updatedInput を返すことが可能になった。

v2.1.84( ~3月26日): WindowsでのPowerShellがopt-in previewとしてネイティブツールで利用可能、タスク作成時に発火するhook TaskCreatedWorktreeCreate に対するHTTPサポート、75分の非アクティブ後に表示される戻りプロンプト。macOS/Linux上の公式プラグインスクリプトの権限に関するバグ修正も含む。

🔗 Tweet @lydiahallie — v2.1.85


Z.ai GLM-5.1、すべてのCoding Plan加入者に提供

3月27日 — Z.ai(智浦科技)は、GLM-5.1がGLM Coding Planのすべての加入者(Lite、Pro、Maxのいずれのティアでも)にアクセス可能になったと発表した。

🔗 PANews:GLM-5.1 Coding Plan


Genspark、Grok Imagineをビデオエージェントに統合

3月26日 — GensparkはGrok Imagine(マルチイメージ生成と動画拡張)をGenspark AI Video Agentに統合。ユーザーは最大7枚の画像を使って動画を作成するか、既存の動画を最大10秒まで延長できる。

🔗 Tweet @genspark_ai


Meta SAM 3.1:同時に最大16物体をリアルタイム追跡、速度2倍

3月27日 — Metaはビデオでの物体検出と追跡向けモデル、Segment Anything Model 3のアップデートであるSAM 3.1を公開した。中心的な革新は「オブジェクトの多重化(object multiplexing)」で、従来のように物体ごとに別々に処理するのではなく、全ての物体を単一のフォワードパスで処理する。結果として、最大16個の物体を同時に扱え、GPU H100上でフレームレートが16から32fpsに倍増し、メモリ使用量も大幅に削減される。

アーキテクチャはすべての物体で計算を共有するエンコーダ/デコーダのMux-Demuxを採用。多数の要素があるシーンでの精度を向上させるグローバル推論(global reasoning)メカニズムも備える。SAM 3.1はSAM 3の直接的な置き換え(drop-in replacement)で、APIの変更は不要。

モデルはオープンソースで公開:チェックポイントはHugging Faceでダウンロード可能、ソースコードはGitHubで更新、研究論文が公開され、インタラクティブデモも利用可能。

🔗 Metaブログ:SAM 3.1 🔗 GitHubコード 🔗 Tweet @AIatMeta


Meta TRIBE v2:人間の脳活動のデジタルツイン

3月26日 — MetaはTRIBE v2を公開。これは神経活動の「デジタルツイン」として設計された予測型基盤モデルで、ほぼどんな音、画像、テキストに対しても高解像度のfMRI反応を予測し、従来手法に比べて70倍の解像度向上を達成する。700人以上の被験者データで訓練されており、再訓練なしで新しい被験者、言語、タスクに対してゼロショット(zero-shot)で動作する。目的は神経科学者が被験者実験を行わずに仮説を迅速に検証できるようにし、神経疾患研究を加速すること。モデル、コード、論文はCC BY-NCライセンスで公開されている。

🔗 Metaブログ:TRIBE v2 🔗 Tweet @AIatMeta


それが意味すること

アムステルダムの裁判所の決定は規制上の転換点を示す:欧州の管轄でGrokが生成したコンテンツに対して直接xAIを有罪とした初めてのケースであり、抑止力のある罰金が科された。同日に欧州議会がディープフェイクの性的なものに関する投票を行ったことと合わせ、生成AIプロバイダすべてに徐々に適用される法的枠組みが形成されつつある。

開発者ツールの面では、今週は統合を巡る競争が浮き彫りになった:Codexのネイティブplugin、Copilotのマージ競合解決とIssues/Projectsでのエージェント可視化、Claude Codeの条件付きhooks。AIアシスタントは既存のワークフローに置き換わるよりも深く統合される方向に進んでいる。

また、無料CLIでのGemini Proへのアクセス制限は、CLIツールにおける無償の寛容期間が縮小し始めていることを示すシグナルだ。GeminiはかつてのGitHub Copilotと同様に、上位機能にサブスクリプションを必要とするフリーミアムモデルへ収束している。

最後に、Kimiの香港上場検討による180億ドルの評価は中国のAIセクターでの高評価を示し、MistralはVoxtral TTSでオープンウェイトのモデルをプロプライエタリ音声合成サービスの代替として位置づけ続けている。


出典

この文書は fr 版から ja 言語へ gpt-5-mini モデルを使用して翻訳されました。翻訳プロセスの詳細については https://gitlab.com/jls42/ai-powered-markdown-translator をご覧ください。