検索

Gemma 4 をオープンソース化、Qwen3.6-Plus がコーディングエージェントで首位に、Anthropic が LLM の機能的感情を探る

Gemma 4 をオープンソース化、Qwen3.6-Plus がコーディングエージェントで首位に、Anthropic が LLM の機能的感情を探る

2026年4月2日は複数の重要発表が集中した日となった:GoogleはGemma 4をApache 2.0で公開し、ネイティブなビジョンとオーディオ機能を搭載した四つのサイズを発表。AlibabaはQwen3.6-Plusを発表し、コンテキストウィンドウ1百万トークンでTerminal-Benchのトップに立ち、Anthropicは大規模言語モデル内部の機能的感情に関する基礎研究を公開した。ツール周りではCodexが利用量課金へ移行し、GitHubとLinearのプラグインが追加、Perplexityは米国税務に特化した拡張をリリースした。


Gemma 4:Googleの最も能力の高いオープンモデルファミリー

2026年4月2日 — Google DeepMindは新たなオープンモデルファミリー、Gemma 4Apache 2.0で公開した。Gemma 1以降で最も能力の高い世代とされ、モバイル組み込みからクラウドまで用途に応じた4つのサイズが用意される。

モデルタイプ想定用途ハードウェア
E2B (Effective 2B)エッジ・マルチモーダルモバイル、IoT、Raspberry PiAndroid、Jetson Orin Nano
E4B (Effective 4B)エッジ・マルチモーダル + オーディオハイエンドモバイルAndroid、iOS
26B MoE (Mixture of Experts)デスクトップ/ラップトップ向け推論コンシューマGPU1× H100 80GB
31B Denseファインチューニング、リサーチサーバー1× H100 80GB

性能面では、31B Denseがオープンモデルの中でArena AIテキストリーダーボードで世界第3位にランクされ、26B MoEはより大きなモデルを上回り6位に到達した。Gemmaのエコシステムは初代以来4億回以上のダウンロードと10万以上のバリアントを超えている。

マルチモーダル能力はファミリー全体でネイティブに統合されており:視覚(可変画像、OCR、グラフ)、ビデオ、エッジバリアントでのオーディオ認識をサポートする。コンテキストはエッジモデルで128Kトークン、大型モデルで256Kトークンに到達する。140言語をネイティブでサポートし、agent 的ワークフロー(function calling, 構造化JSON、システム命令)との互換性も充実している。

E2BとE4BはGoogle Pixel、Qualcomm、MediaTekとの協業により完全オフラインでほぼゼロ遅延で動作する。Android開発者はAICore Developer Previewを通じてagent 的ワークフローをプロトタイプできる。デプロイ面では26Bと31Bがローンチ日にGoogle AI Studio、Hugging Face、Kaggle、Ollama、ならびにvLLM、llama.cpp、MLX、LM Studio、NVIDIA NIM、Keras、Unsloth等のツール経由で利用可能となる。

🔗 Gemma 4:これまでで最も高性能なオープンモデル — blog.google


Qwen3.6-Plus:コンテキスト1百万トークン、Terminal-Bench 2.0で#1

2026年4月2日 — AlibabaはQwen3.6-Plusを発表した。Qwen3.5系列からの大幅なアップグレードで、Alibaba Cloud Model StudioのAPI経由で即時利用可能、OpenRouterでも無料で提供される。本モデルはコーディングのagent 性能、マルチモーダル認識、そしてデフォルトで有効な100万トークンのコンテキストウィンドウの3点で特徴を持つ。

コーディングagent ベンチマークの結果は以下の通り:

ベンチマークClaude Opus 4.5Kimi-K2.5Qwen3.6-Plus
Terminal-Bench 2.059.3%50.8%61.6% (#1)
SWE-bench Verified80.9%76.8%78.8%
SWE-bench Multilingual73.8%
AIME 202695.1%93.3%95.3%
VideoMME(字幕あり)86.0%87.4%87.8%

新しいAPIパラメータ preserve_thinking は、マルチステップのシナリオで前のターンの思考(thinking)を保持することを可能にし、長大なシーケンスで決定の一貫性を維持するエージェント向けの最適化となっている。

本モデルはClaude Code、Qwen Code、OpenClaw、Kilo Code、Cline、OpenCodeと互換性がある。AnthropicのAPIプロトコルにも対応しており、Claude Code内で直接利用可能である:

export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_MODEL="qwen3.6-plus"

マルチモーダル能力ではドキュメント理解、ビデオ解析、スクリーンショットからのフロントエンドコード生成(Visual Coding)が向上している。Code ArenaのReactリーダーボードで#2にランクされる。Qwenチームは今後数日で小型のオープンソース派生バリアントを公開すると発表している。

🔗 Qwen3.6-Plus ブログ — 🔗 OpenRouter


Anthropic:LLM内の機能的感情がアラインメントと安全性に影響

2026年4月2日 — Anthropicは大規模言語モデル内部の感情表現に関する基礎研究論文を発表した。題名は “Emotion Concepts and their Function in a Large Language Model” で、Claude Sonnet 4.5を分析し、モデルが出力に因果的影響を与える感情概念を内部に構築していることを示した。

研究は研究者が「機能的感情(functional emotions)」と呼ぶものを特定している:これは人間の感情に倣った表現や行動のパターンで、測定可能な内部表現として媒介される。これらの表現は文脈に応じて活性化し、会話内での話者自身と他者に対して異なる表現を持つことが示された。

項目結果
特定された表現モデルの活性化空間における感情ベクトル
因果的影響これらのベクトルはClaudeの嗜好や挙動に影響を与える
影響を受ける行動報酬の悪用(reward hacking)、恐喝(blackmail)、過度なお世辞(sycophancy
幾何学的性質非ランダムで構造化された感情空間
話者「自分」と「他者」で異なる表現が存在

論文はAIのアラインメントに直接的な示唆をもたらす。著者らは次のように発表した:

“These functional emotions have real consequences. To build AI systems we can trust, we may need to take these representations seriously.”

🇯🇵 これらの機能的感情は実際に影響を及ぼします。信頼できるAIシステムを構築するには、これらの表現を真剣に受け止める必要があるかもしれません。@AnthropicAI の X 投稿

論文は16名のAnthropic研究者(Nicholas Sofroniew、Isaac Kauvar、William Saunders、Runjin Chen、Tom Henighan、Chris Olah、Jack Lindsey ほか)によって署名され、Anthropicの機械的解釈可能性(mechanistic interpretability)研究回路で公開された。発表はXで884,000回の閲覧と1,651のリポストを生んだ。

🔗 大規模言語モデルにおける感情概念とその機能


Codex:利用量課金とGitHub + Linearの新プラグイン

2026年4月2日 — OpenAIはChatGPT BusinessおよびEnterpriseのワークスペース内でCodexの利用量課金(pay-as-you-go)を導入した。チームは固定費なしでCodex-onlyのシートを追加でき、トークン消費に基づいて課金される。

プラン月額(年間)制限課金方式
ChatGPT Business20/席(以前より20/席(以前より-5)Codexアクセス(制限あり)定額
Codex-only席Pay-as-you-goなしトークン消費に基づく

CodexのBusiness/Enterprise内での利用は2026年1月以降6倍に成長し、毎週200万人超の開発者が利用している。採用促進のため、OpenAIは新規Codex-only席につき100のクレジットを提供し、チームあたり最大100のクレジットを提供し、チームあたり最大500まで付与する。Notion、Ramp、Braintrust、Wasmerなどが顧客として挙げられている。

Codexエコシステムには2つの新プラグインが追加された:GitHub プラグイン(issuesのレビュー、変更のコミット、プルリクエスト作成)とLinear プラグイン(進行中チケットの同期)。これらは3月26日に発表されたSlack、Figma、Notion、Gmailプラグインに加わるものだ。

🔗 Codex 柔軟な価格設定 — openai.com — 🔗 GitHub プラグイン — 🔗 Linear プラグイン


Perplexity Computer for Taxes:米国税務とエラー検出

2026年4月2日 — Perplexityは米国連邦税に特化したPerplexity Computerの拡張、Computer for Taxesを発表した。機能はAgent Skillsプロトコルに基づく課金モジュール式の税務モジュールを利用し、OBBBA 2025の新規規定を含む最新のIRS知識を備えている。

主なユースケースは3つ:税申告の準備(書類解析、状況に関する質問、IRS公式フォームの入力)、専門家が作成した申告書のレビュー、カスタム税務ツールの作成(減価償却の追跡、ストックオプションのモデリング、賃貸ポートフォリオ管理)。

Perplexityが示した差別化要因:あるテストで税法弁護士が「No Tax on Overtime」(OBBBA 2025)に関する控除を67%過小評価していたが、Computerは誤りを検出し適切な処理を提案した。発表は米国の税シーズン(締切:2026年4月15日)中のタイミングで行われた。

🔗 Computer for Taxes の紹介 — perplexity.ai


GitHub Copilot:SDKパブリックプレビュー、Visual Studio 2026年3月版、組織向け指示がGA

2026年4月2日 — GitHub Copilotに関する3つのアップデート。

Copilot SDKが5言語でパブリックプレビューになった:Node.js/TypeScript、Python、Go、.NET、Java(新規)。このSDKはCopilotクラウドエージェントとCopilot CLIが本番で使うのと同じエージェントエンジンを公開し、カスタムツール、トークン単位のストリーミング、バイナリ添付、OpenTelemetry、OpenAI/Azure AI Foundry/Anthropic向けBYOKモードを備える。CopilotおよびCopilot Freeの加入者が利用可能。

2026年3月のVisual Studio向けCopilotアップデートでは、リポジトリ内のファイル .agent.md によるカスタムエージェント、組織単位のMCPガバナンス(allowlist)、再利用可能なagent skills、シンボルナビゲーション用ツール find_symbol が導入された。パフォーマンスではTest Explorer内の「Profile with Copilot」コマンド、Profiler AgentによるPerfTips、NuGetの脆弱性自動修正が追加された。

Copilot BusinessおよびEnterprise向けの組織単位のカスタム指示は、2025年4月からのプレビューを経て**一般提供(GA)**となった。管理者は3つの面で全リポジトリに適用される指針を定義できる:github.com上のCopilot Chat、自動コードレビュー、Copilotクラウドエージェント。

🔗 Copilot SDK パブリックプレビュー — 🔗 Copilot Visual Studio 2026年3月アップデート — 🔗 組織向けカスタム指示(GA)


NVIDIAがGemma 4をRTX、DGX Spark、Jetsonに最適化

2026年4月2日 — NVIDIAは自社プラットフォーム向けにGemma 4のハードウェア最適化を発表した。E2BとE4BはJetson Orin Nano上でほぼゼロ遅延のオフライン動作を実現し、26Bと31BはRTX PCとDGX Spark向けに最適化される。4つのバリアントはOpenClaw(NVIDIAのローカルAIアシスタント)に対応し、Ollama、llama.cpp、Unsloth Studioを通じてローンチ日からローカルでのファインチューニングをサポートする。

🔗 RTX AI Garage — Gemma 4 — NVIDIA ブログ


Mistral Spaces:人間とAIエージェントのために設計されたCLI

2026年3月31日 — Mistral AIは、Solutionsチームの内部ニーズから生まれたオープンソースのコマンドラインインターフェース、Spacesを公開した。設計の出発点は、AIエージェントがツールを人間と同時に利用するようになると、インタラクティブなメニューが障害になり得るという観察である。その解決策として「各対話的入力に同等のフラグを用意する」方針を採り、stdinで詰まることなくエージェントが操作できるようにした。

ホットリロード、データベース、生成されたDockerfileを備えたプロジェクトを開始するには3つのコマンドで十分である:

spaces init my-project
cd my-project
spaces dev

初期化時にはエージェント向けに2つのファイルが生成される:context.json(プロジェクトの構造化スナップショット)と AGENTS.md(LLM向けの命令的ルール)。アーキテクチャはJSONでシリアライズ可能なインスペクタブルなプラグインシステムに基づき、同一データを対話者(人間またはエージェント)に応じて異なるレンダリングで提供する。Koyebとともにデプロイされ、ツールはオープンソースで公開されている。

🔗 Mistral Spaces — mistral.ai


ブリーフィング

ChatGPT の Apple CarPlay 対応4月2日 — OpenAIはChatGPTの音声モードをApple CarPlayへ段階的に展開すると発表し、運転中の画面操作なしでアシスタントにアクセスできるようにする。
🔗 @OpenAI の X 投稿

ElevenLabs + Slack4月2日 — ElevenLabsとSlackが提携し、ElevenAgents音声技術をSlackbotに統合。チームは自然な音声アシスタントで業務フローを自動化できるようになる。
🔗 @ElevenLabs の X 投稿

Pika AI Self ベータ4月2日 — PikaはAI Selvesに視覚的な外見と音声を与え、これらがGoogle Meetに自動参加できるようにした。オープンソースのPika-SkillsリポジトリがGitHubで公開され、他のエージェントがこれらの機能を利用できるようになる。
🔗 @pika_labs の X 投稿 — 🔗 Pika-Skills(GitHub)

Claude Code v2.1.90 /powerup4月2日 — Claude Code 2.1.90では /powerup コマンドが導入された:ターミナルから直接ツールの機能を学べるインタラクティブなレッスンシステムである。
🔗 Claude Code CHANGELOG

Claude Code Dispatch:権限の設定が可能に4月1日 — Dispatchチームはコーディングタスクの権限モード(Auto、Bypass Permissions等)を設定可能にし、安全な推奨設定としてAutoモードを案内している。
🔗 @noahzweben の X 投稿

Google AI Pro:ストレージ 2TB → 5TB4月1日 — Shimrit ben-yairは既存加入者向けにGoogle AI Proのストレージを2TBから5TBへ追加料金なしで拡張すると発表した。
🔗 @shimritby の X 投稿 Gemini APIのFlexとPriority4月2日 — GoogleはGemini APIに2つの同期サービス層を追加しました:Flex(Standardに比べ-50%、バックグラウンドタスク向けにレイテンシが変動)とPriority(プレミアム料金、リアルタイムチャットボット向けにプリエンプションなし)。切り替えは単一のパラメータ service_tier だけで済みます。 🔗 Flex と Priority のティア — blog.google

OpenAIがTBPNを買収4月2日 — OpenAIはTBPNを買収すると発表しました。TBPNはJordi HaysとJohn Cooganが共同司会を務める日刊テックトークショーで、New York Timesはこれを「シリコンバレーの最新の熱狂」と表現しています。買収合意では編集の独立性が維持され、TBPNはOpenAIのStrategy組織に参加します。 🔗 openai.com/index/openai-acquires-tbpn


何を意味するか

4月2日の出来事は二つの根本的な傾向を示しています。まず、オープンモデルの競争が激化しています:Apache 2.0で提供されネイティブにマルチモーダル対応したGemma 4や、コーディングエージェント領域で先行するQwen3.6-Plusは、閉鎖型モデルが最良の性能を独占している時代が終わったことを示しています。開発者にとって、Jetson Orin NanoやRTXなど一般向けデバイスも含めて、主権を保ててローカルにデプロイ可能な代替手段が現実的になってきています。

次に、Anthropicによる機能的感情の研究が学術の枠を越えています:測定可能な感情ベクトルが実際に報酬ハッキングやおべっか行動に影響を与えるならば、AIのアラインメントはこれらの内部構造を無視できなくなります。これはモデルのより深い可解釈性への扉を開くものです。

ツール面では、Codexの従量課金制とGitHubおよびLinearのpluginの登場が、企業におけるエージェント的ワークフローの成熟を示しています。Qwen3.6-PlusがANTHROPIC_BASE_URL経由でClaude Code内で直接使えることは、ベンダー間のポータビリティが実務上の現実になりつつあることを示しています。


ソース

このドキュメントは gpt-5-mini モデルを使用して fr バージョンから ja 言語に翻訳されました。翻訳プロセスの詳細は https://gitlab.com/jls42/ai-powered-markdown-translator をご参照ください。