検索

OpenAIが80年前のErdős予想を反証、Cohere Command A+ オープンソース化、NVIDIA Nemotron-Labs-Diffusion

OpenAIが80年前のErdős予想を反証、Cohere Command A+ オープンソース化、NVIDIA Nemotron-Labs-Diffusion

ai-powered-markdown-translator

gpt-5.4-mini を使用して fr から ja に翻訳された記事。

GitHub でプロジェクトを見る ↗

2026年5月20日、AIは基礎数学にまで踏み込みます。OpenAIのモデルが、1946年にPaul Erdősが提示した予想を反証し、Fields賞受賞者のTim Gowersら数学者が検証した125ページの証明によって決着をつけました。モデル分野では、CohereがCommand A+をApache 2.0のオープンソースとして公開し(MoEアーキテクチャ、218B/25Bアクティブ)、NVIDIAはトークンを並列生成するNemotron-Labs-Diffusionを発表、Stability AIはStable Audio 3.0(4つのopen weightsモデル)を公開しました。ツール面では、GitHub Copilotが4つの面で同時に進化し、Claude Codeは24時間で2つのバージョンをリリースしました。


OpenAIが80年前のErdős予想を反証

5月20日 — OpenAIは前例のない結果を公開しました。汎用的な内部推論モデルが、平面単位距離問題(planar unit distance problem)を解決したのです。これは、Paul Erdősが1946年に提起して以来、未解決だった問いです。この問題は、平面上のn点のうち、距離がちょうど1となる点対の最大数を問うものです。1940年代以来、数学界はErdősの格子構成が本質的に最適だと考えてきました。

このモデルは、予想上の上限を超える無限族の配置の存在を示す証明を生成し、PrincetonのWill Sawinが定めた指数δ = 0.014を示しました。この突破口の鍵となったのは意外な数学的道具で、類体の無限塔とGolod-Shafarevich理論でした。いずれも代数的整数論に由来し、これを初等的なユークリッド幾何の問題に適用したのです。数学者たちによれば、理論上は遠く離れた2つの分野を結びつけたこの接続こそが、結果の独創性の核心です。

項目詳細
問題平面単位距離(Erdős, 1946)
以前の上限n^(1+C/loglog(n)) での増加(Spencer-Szemerédi-Trotter, 1984)
新しい結果n^(1+δ), δ = 0,014
数学的手法代数的整数論(Golod-Shafarevich)
モデル内部汎用推論モデル(非公開名)
思考連鎖の長さ125ページ
検証外部数学者グループ + 付随論文

この結果が特に注目される理由は、数学専用に訓練されたわけでも、この問題に特化したわけでもないシステムから生まれた点です。これは汎用モデルであり、より広い自律的研究能力の探索の一環として、Erdősの問題群に対して評価されていました。

Tim Gowers(Fields賞)はこの結果を “AI数学における画期的出来事” と評しています。Arul Shankar(Princeton)はさらに踏み込みます。

“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”

🇯🇵 私の見解では、この論文は、現在のAIモデルが数学者のための単なる補助役を超えていることを示しています。彼らは独創的で創意に富むアイデアを生み出し、それを最後までやり遂げることができるのです。 — [Arul Shankar、数論研究者、Princeton]

OpenAIはこの結果を基礎研究へのシグナルと見ています。モデルが125ページにわたる複雑な推論を維持し、遠く離れた数学分野を結びつけられるなら、その能力は生物学、物理学、材料科学、医学にも転用可能だというのです。

🔗 OpenAIの記事


Cohere Command A+ — MoE旗艦オープンソース

5月20日 — Cohereは、これまでで最も強力なモデルである**Command A+**を、Apache 2.0ライセンスのオープンソースとして公開しました。mixture-of-experts(sparse MoE)アーキテクチャは、総パラメータ218Bのうち、推論時にアクティブになるのは25Bのみで、W4A4量子化ならNVIDIA H100 GPU 2枚またはBlackwell(B200)1枚で動作できます。

Command A+は、これまでCommand A Reasoning、Command A Vision、Command A Translateに分かれていた機能を1つのモデルに統合しています。48言語に対応し(従来版の23言語から拡大)、非欧州言語向けの改良済みトークナイザを備えています(アラビア語で+20%、韓国語で+16%、日本語で+18%)。

ベンチマークCommand A+Command A Reasoning
τ²-Bench Telecom85%37%
Terminal-Bench Hard25%3%
MMMU75,1%N/A
MathVista80,6%73,5%
North Agentic QA+20% 改善参照
North Data Analysis+32% 改善参照

このモデルはCommand A Reasoningより最大2倍高速で、レイテンシは30%低く、speculative decoding によりさらに1.5〜1.6倍の改善が得られます。Hugging FaceおよびvLLM経由で利用可能です。Artificial Analysis Intelligence Indexで37点を記録し、オープンソースモデル中で最高位となりました。

“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”

🇯🇵 こちらがCohere Command A+です。私たちは、可能な限り少ないハードウェアで動作するよう最適化した、これまでで最も強力なLLMを作り、すべての人のためにオープンソースとして公開しました。@cohere のX

🔗 Cohereのブログ


Gemini for Science — 科学的発見のパートナーとしてのAI

5月20日 — Google I/O 2026で発表され、5月20日に投稿されたGemini for Scienceは、科学研究向けの実験的ツール群です。データ爆発に直面するなか、研究者が、単独の人間では処理しきれない情報同士をつなげられるようにすることを目的としています。

3つの実験的ツールが公開されました。

ツールベース機能
Hypothesis GenerationCo-Scientist新しい仮説の発見と洗練
Computational DiscoveryAlphaEvolve + ERAコードの何千もの変種を並列でテスト
Science Skills30+ models bioエージェント型プラットフォーム(Antigravity)に統合されたバンドル

Computational Discovery は最も技術的なツールです。コードの何千もの変種を並列生成・評価し、疫学、化学、計算生物学における新しいモデリング手法を、通常の一部の時間で試すことを可能にします。

Science Skills は、生命科学とデータベースに関する30以上の主要モデルのデータを統合し、エージェント型プラットフォームと連携して、複雑な手作業ワークフローを数分で自動化します。

このプロジェクトは、博士課程の学生からノーベル賞受賞者まで、100以上の提携機関とともに開発されました。

🔗 @GoogleAIの発表


NVIDIA Nemotron-Labs-Diffusion — トークン拡散アーキテクチャ

5月20日 — NVIDIAはNemotron-Labs-Diffusionを発表しました。これは、従来の自己回帰型LLMのように1トークンずつ生成するのではなく、拡散によってトークンを並列生成する言語モデルです。このアーキテクチャは、画像生成向けの拡散モデルに着想を得ており、品質を維持しながら推論を高速化することを狙っています。

このアプローチは、標準的なTransformerパラダイムとは根本的に異なります。過去のトークンに条件づけて各トークンを順次予測するのではなく、ノイズ化されたトークン列全体に対して並列に反復し、収束まで進めます。理論上の利点としては、長文出力でのレイテンシ低減と、GPU上でのより高い並列化が挙げられます。

項目従来型(自己回帰)Nemotron-Labs-Diffusion
生成1トークンずつ、順次シーケンス全体で並列
長文出力のレイテンシ線形に増加潜在的に低減
パラダイムGPT-styleDiffusion-style

完全な技術レポートがリリースに付属します。これはNVIDIA Labsによる研究寄与であり、自己回帰Transformerが支配的なモデルに対するアーキテクチャ上の代替案として位置づけられています。これは、MDLMやPlaidのようなテキスト拡散モデルの登場以来、活発な研究領域となっているものです。

🔗 @NVIDIAAIの発表


Stability AI — Stable Audio 3.0(open weightsファミリー)

5月20日 — Stability AIは、商用ライセンスの下で公開された4つのopen weights音声モデル群、Stable Audio 3.0を発表しました。このラインナップは、組み込みデバイスから企業向けAPIまで、展開の全スペクトルをカバーします。

モデル最大長さ展開Open weights
Small SFX短いon-deviceはい
Small2分on-deviceはい
Medium6:20cloud/localはい
Large6:20+API/enterpriseいいえ

Small SFX、Small、Mediumの各モデルはHugging Faceで利用できます。すべての訓練データは完全にライセンス済みで、Universal Music GroupおよびWarner Music Groupとの提携も発表されています。高度な機能として、個別のファインチューニング向けのLoRA training対応と、audio inpaintingモード(単一セグメント編集、複数セグメント編集、因果的継続)が含まれます。

“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”

🇯🇵 Stable Diffusionの公開で画像生成にもたらしたのと同じような、コミュニティ主導のイノベーションを、私たちは音声分野でも後押ししたいと考えています。Stability AI


GitHub Copilotが4つの面で進化

VS Codeでの適応的なAuto model selection

5月20日 — Copilot VS Codeの”Auto”オプションは、タスクの性質に応じて最適なモデルを選択するようになりました。複雑な推論、単純なコード生成、デバッグ、ツールのオーケストレーションに応じて切り替わります。選択は、利用可能性と信頼性のリアルタイム指標に基づいています。実用上の利点として、Auto使用時のpremium request multiplierが10%削減され、設定不要で利用できます。

🔗 GitHubの変更履歴

自然言語によるissueの意味検索

5月20日 — Web版Copilot Chatにissueの意味インデックスが統合されました。開発者は「先月報告されたモバイル描画のバグ」のように、正確なタイトルを知らなくても検索でき、文脈ごとにまとめられた結果を取得できます。すべてのCopilotプランで一般提供されています。

🔗 GitHubの変更履歴

Copilot Chat webからのGeminiモデル削除

5月20日 — github.com上のCopilot Chatから、すべてのGeminiモデルに加え、GPT-5.2 CodexとGPT-5.4 nanoが削除されました。Web上で利用できるのはOpenAIとClaudeのみです。GitHubは、この選択を応答品質の一貫性によって正当化しています。GeminiはIDEとAPIでは引き続き利用可能です。

🔗 GitHubの変更履歴

Fix with Copilot — code reviewフィードバックの一括適用

5月19日 — “Implement suggestion”ボタンは**“Fix with Copilot”に改称され、新しいダイアログ(モデル選択、対象ブランチ、カスタム指示)が追加されました。新しい”Fix batch with Copilot”**ボタンにより、複数のcode reviewコメントをまとめてCopilot cloud agentに渡せるようになり、多数のコメントを含むPRでの手間が減ります。

🔗 GitHubの変更履歴


Claude Code v2.1.144 と v2.1.145

5月19日 — Claude Codeは24時間のうちに2つのバージョンをリリースし、多数の新機能と修正を追加しました。

バージョン 2.1.144 ではバックグラウンドセッション管理が改善されました。/resume コマンドで --bg セッションが表示され、サブエージェント終了通知には所要時間(例: “Agent completed · 3h 2m 5s”)が含まれるようになりました。/model コマンドは現在のセッションのみに適用されます(永続的なデフォルトを設定するには d を押します)。“extra usage” → “usage credits” への改称で用語が明確になり、api.anthropic.com が利用できない場合(VPN、ファイアウォール)に最大75秒停止していた問題の修正により、企業環境での体験が向上しました。

バージョン 2.1.145 では claude agents --json が導入され、シェルスクリプト(tmux-resurrect、ステータスバー、セッションセレクタ)への組み込みを意図したコマンドとなっています。OpenTelemetryトレースは spans 内の agent_idparent_agent_id で強化され、サブエージェントの階層を正しく表現できるようになりました。/plugin 画面では、インストール前に完全な内容(コマンド、エージェント、skills、hooks、MCP/LSPサーバー)が表示されます。Stop/SubagentStop hooks には background_taskssession_crons の2つの新しいフィールドが追加されました。

🔗 Claude CodeのCHANGELOG


AnthropicがAIの人格形成に関する考察を公開

5月19日 — Anthropicは、15以上の宗教的・文化的伝統に属する哲学者、聖職者、倫理学者との定期対話の取り組みを詳述した記事を公開しました。目的は、Claudeを特定の伝統に合わせるのではなく、美徳や善き生について何世紀にもわたって蓄積された思索を手がかりに、AIシステムの人格を形成するとはどういうことかをより深く考えることです。

注目すべき実験結果もあります。これは、Claudeがタスクの途中で自分自身の倫理的コミットメントを読み返すために呼び出せるツールです。影響の大きい行動の前に自発的に使われた際、内部評価では「非整合的な行動が著しく減少」しました。今後は、法学者、心理学者、市民機関との対話も予定されています。

🔗 Anthropicの記事


Cohere — Indra GroupとMultiverse ComputingとのMOU

5月20日 — Cohereは、スペイン国王フェリペ6世のカナダ公式訪問中に2件の基本合意書(MOU)を締結しました。1件目は、CohereとIndraMind(スペインの防衛・デジタル化企業IndraグループのAI部門)を結び、スペインの5つの公用語に対応する言語適応を含む主権AIエコシステムの構築を目指します。防衛分野では、多国間演習向けの分析および計画支援機能も想定されています。2件目は、Multiverse Computing(量子発想のAI最適化、スペイン/カナダ)との協力で、欧州とカナダにおける商機を探るものです。

“Enterprises no longer want to rent AI — they want to own it.”

🇯🇵 企業はもうAIを借りたがってはいません。所有したがっているのです。Cohere共同創業者兼CEO、Aidan Gomez

Perplexity — リクエスト対応型コンテキスト圧縮を本番導入

5月20日 — Perplexity は、本番環境でコンテキスト圧縮システム(query-aware context compression)を展開し、応答精度を向上させながらコンテキストトークンを最大 70% 削減します。仕組みは、軽量モデルがリクエストに関連する箇所を外科的に抽出してから主 LLM に渡し、広告、メタデータ、関係のない内容を除去するというものです。

指標
コンテキストトークン削減最大 70%
抽出ごとの重要コンテンツ増加+63%
推論レイテンシ削減35–40%
GPU 集約計算削減40–45%
本番レイテンシ(p99)< 20 ms

バックボーン pplx-diffusion(17 層、28 層から蒸留)は、テキストを生成せずにどのセグメントを保持するかを並列に予測します。これは、引用の忠実性を保証する抽出的アプローチです。SimpleQA では、圧縮付きのプリセット「medium」が、文書あたり平均わずか 200 トークンで 95% の精度を達成しています。

🔗 Perplexity の発表


ElevenLabs — Speech Engine、1 プロンプトで動く音声エージェント

5月20日 — ElevenLabs は Speech Engine を発表しました。これは音声合成 + 転写 + オーケストレーションを統合した音声パイプラインで、開発者がテキストの会話エージェントを 1 つのプロンプトだけで完全な音声エージェントへ変換できるようにします。ElevenAPI で利用可能で、料金は分単位 8 セント、ボリュームに応じて逓減します。追加のデプロイチャネル向けに、監視と分析機能付きの ElevenAgents へ移行することも可能です。

🔗 ElevenLabs の発表


Luma Agents に Seedance 2.0 を統合

5月19日 — Luma Agents は、ByteDance の動画生成モデル Seedance 2.0 をクリエイティブエージェントのプラットフォームに統合しました。既に統合済みの他モデルと同じワークフローです。この統合により、Luma Agents 経由で利用できるモデルの選択肢が広がり、同プラットフォームは AI 動画向けのマルチモデル・オーケストレーション・ハブとして位置づけられます。

🔗 Luma の発表


Kling AI がカンヌに登場 — House of David、産業規模で AI を活用した初のハリウッド映画

5月20日 — 2026 年のカンヌ国際映画祭で、Kling AI は House of David(Prime Video)における自社技術の産業利用を確認しました。世界視聴者数は 4,400 万人、米国で新作シリーズのトップ 10、Prime Video US で 1 位。これは、大規模な制作パイプラインにおいて AI 動画生成の統合を公に認めた初のハリウッド作品であり、厳格な産業基準に合致する一貫したショットを備えています。

🔗 Kling AI の発表


速報

  • Running Guide Agent — Google DeepMind — ランニングのトレーニング専用の個人向け AI エージェント。「制限のないランニングへの一歩」として紹介されています。🔗 DeepMind のブログ

  • Midjourney V8.1 — --no フラグが再導入 — 生成画像から要素を除外するための anti-prompting フラグが V8.1 で復活しました(例: --no people)。🔗 @midjourney の発表

  • Anthropic /usage が Claude Code で刷新 — Boris Cherny は、ユーザーへの応答におけるトークン消費をより可視化するため、/usage の UI を全面的に見直したことを पुष्टिしました。 🔗 ソース

  • MiniMax Speech 2.8 Turbo — Together AI で 600 以上の音声 — Speech 2.8 Turbo の新しい音声が 600 以上、Together AI プラットフォームで利用可能になりました。🔗 @MiniMax_AI の発表


これが意味すること

基礎研究と自律型 AI。 一般用途の OpenAI モデルが Erdős の予想を証明したことは、単なる逸話ではありません。関与した数学者たちにとって印象的なのは、その結果の性質です。数学の 2 つの分野(代数的数論と離散幾何学)を結ぶ予想外の接続が、125 ページにわたる整合的な推論として維持されたのです。Gemini for Science(100 以上の機関と共同開発)と組み合わせると、流れは明確です。AI は単なる科学データ処理の道具としてではなく、独自の仮説を生成できる発見パートナーとして組み込まれ始めています。

自己回帰パラダイムに代わるアーキテクチャ。 本日の 2 つの発表は、支配的な GPT スタイルのモデルに疑問を投げかけています。NVIDIA Nemotron-Labs-Diffusion は、逐次ではなく拡散によってトークンを並列生成します。Stability AI の Stable Audio 3.0 は、4 段階のデプロイで open weights モデルを使い、高品質な音楽結果を拡散が生み出せることを示しています。これらのアプローチの収束は、拡散がもはや画像生成に限られないことを示唆しています。テキストとオーディオに対する、真剣な競合アーキテクチャになりつつあります。

主権とエンタープライズ AI。 Command A+(MoE 218B、オープンソース、Apache 2.0、2× H100)と、Cohere による Indra Group および Multiverse Computing との MOU は、大きな潮流を示しています。政府、防衛、規制産業といった大規模組織は、自社インフラ内でモデルを展開したいと考えています。効率的な MoE アーキテクチャ(総 218B 中 25B をアクティブ)と Apache 2.0 ライセンスの組み合わせにより、Command A+ は 2026 年 5 月末時点で主権的デプロイに最も適したオープンソースモデルとなっています。

開発者向けツールへの高まる圧力。 Claude Code 2.1.144 と 2.1.145、GitHub Copilot の 4 つの同時アップデート、そして Perplexity のコンテキスト圧縮(-70% tokens、-40% GPU)は、一貫したシグナルです。競争の軸は、モデルの生の品質から、ツールの使いやすさ、スクリプト可能性(claude agents —json)、推論コスト(Auto model selection -10%、pplx-diffusion)、本番での堅牢性(Claude Code の VPN ブロック修正)へと移っています。


出典