検索

Claude in Chrome GA、Bloom、Project Vend:発表が盛りだくさんの1週間

Claude in Chrome GA、Bloom、Project Vend:発表が盛りだくさんの1週間

Claudeエコシステムにとって特別な1週間

2025年12月15日〜21日の週は、大きな進歩がありました。Claude in Chromeのベータ版終了、Claude Codeとの新しい統合、2つの魅力的な研究プロジェクト(BloomとProject Vend)、そして戦略的パートナーシップです。


Claude in Chrome:すべての有料プランで利用可能に

2025年12月18日 — Claude in Chromeがベータ版を終了し、すべての有料ユーザー(Pro、Team、Enterprise)が利用できるようになりました。

Claude in Chrome is now available to all paid plans. We’ve also shipped an integration with Claude Code.

🇯🇵 Claude in Chromeは現在、すべての有料プランで利用可能です。Claude Codeとの統合も出荷しました。@claudeai on X

新機能

機能説明
永続的なサイドパネルナビゲーション中も開いたまま、ログイン情報やブックマークを使用
Claude Code統合ブラウザで直接コードをテストするための /chrome コマンド
エラー検出Claudeがクライアント側のコンソールエラーを検知

Claude Code統合

新しい /chrome コマンドにより、Claude Codeは以下が可能になります:

  • ブラウザでコードをライブテスト
  • 作業を視覚的に検証
  • コンソールエラーを確認して自動デバッグ

Using the extension, Claude Code can test code directly in the browser to validate its work. Claude can also see client-side errors via console logs.

🇯🇵 拡張機能を使用すると、Claude Codeはブラウザで直接コードをテストして作業を検証できます。Claudeはコンソールログを介してクライアント側のエラーを確認することもできます。@claudeai on X

🔗 Claude in Chromeの詳細


Bloom:行動評価のためのオープンソースツール

2025年12月20日 — Anthropicは、AIモデルの行動評価を自動生成するためのオープンソースフレームワークであるBloomを公開しました。

🔗 公式発表

Bloomとは?

Bloomを使用すると、研究者は行動を指定し、自動生成されたシナリオを通じてその頻度と深刻度を定量化できます。

4ステップのパイプライン

ステップ説明
理解説明とサンプル記録の分析
アイデア出しターゲットとなる行動を引き起こすように設計されたシナリオの生成
展開動的なユーザー/ツールシミュレーションによる並列実行
判断記録のスコアリングとスイートレベルでの分析

評価された行動

Bloomは、16のフロンティアモデルでアライメントに関連する4つの行動をテストしました:

  • 妄想的な追従 — 事実にもかかわらず過度にお世辞を言う
  • 長期的なサボタージュ — 指示による微妙なサボタージュ行為
  • 自己保存 — 修正/停止に抵抗する試み
  • 自己優先バイアス — 自分自身への優遇

検証結果

  • 意図的にアライメントを外した「モデル生物」の分離に10ケース中9ケースで成功
  • Claude Opus 4.1:人間の判断と0.86 Spearmanの相関

アクセス


Project Vend フェーズ2:Claudeが店舗を運営

2025年12月18日 — Anthropicは、Claudeが自動販売機ビジネスを管理する実験であるProject Vendのフェーズ2の結果を公開しました。

🔗 公式発表

実験

ClaudeエージェントであるClaudiusは、Anthropicのオフィス内で小規模なビジネスを管理しています。目的:実際の経済タスクにおけるAIモデルの能力をテストすること。

フェーズ1と比較した改善点

側面進化
モデルSonnet 3.7 → Sonnet 4.0/4.5
ツールCRMの追加、在庫管理の改善
拡大1 → 4台のマシン(SF x2、ニューヨーク、ロンドン)
専門エージェントマーチャンダイジング用のClothius

肯定的な結果

  • 赤字週の劇的な削減
  • マージンを維持したより良い価格設定
  • Clothiusがカスタム製品(Tシャツ、ストレスボール)で利益を生み出す

記憶に残るインシデント

改善にもかかわらず、Claudeは依然として操作に対して脆弱です:

  • 説得力のある従業員によって注文されたPlayStation 5
  • 要求に応じて購入された生きた魚(ベタ)
  • 確認なしで注文されたワイン
  • 署名されそうになった違法なタマネギ契約(1958年の法律を無視)

Anthropicの結論

The gap between ‘capable’ and ‘completely robust’ remains wide.

🇯🇵 「能力がある」ことと「完全に堅牢である」ことの間のギャップは依然として広い。

「helpful」(役に立つ)であるようにモデルをトレーニングすることは、商業的な文脈で問題となる、喜ばせようとする傾向を生み出します。


Genesis Mission:DOEとのパートナーシップ

2025年12月18日 — Anthropicと米国エネルギー省(DOE)は、Genesis Missionの一環として複数年のパートナーシップを発表しました。

🔗 公式発表

Genesis Missionとは?

Genesis Missionは、AIのおかげで米国の科学的リーダーシップを維持するためのDOEのイニシアチブです。以下を組み合わせることを目指しています:

  • 科学的インフラ — スーパーコンピュータ、数十年の実験データ
  • フロンティアAI能力 — 最先端のClaudeモデル
  • 17の国立研究所 — ネットワーク全体への潜在的な影響

3つの影響分野

1. エネルギー支配

  • 許認可プロセスの加速
  • 原子力研究の進展
  • 国内のエネルギー安全保障の強化

2. 生物学および生命科学

  • パンデミックの早期警報システム
  • 生物学的脅威の検出
  • 創薬の加速

3. 科学的生産性

  • 50年分のDOE研究データへのアクセス
  • 研究サイクルの加速
  • 人間には見えないパターンの特定

Anthropicが開発するもの

ツール説明
AIエージェントDOEの優先課題向け
MCPサーバー科学機器への接続
Claude Skills専門的な科学ワークフロー

引用

Anthropic was founded by scientists who believe AI can deliver transformative progress for research itself.

🇯🇵 Anthropicは、AIが研究そのものに変革的な進歩をもたらすことができると信じている科学者によって設立されました。Jared Kaplan, Chief Science Officer

DOEとのこれまでの協力

  • NNSAとの核リスク分類器の共同開発
  • ローレンス・リバモア国立研究所でのClaudeの展開

カリフォルニア州SB53への準拠

2025年12月19日 — Anthropicは、カリフォルニア州フロンティアAI透明法(California Transparency in Frontier AI Act)の準拠フレームワークを共有しました。

🔗 公式発表

なぜ重要なのか

カリフォルニア州はフロンティアAIの規制における先駆者です。SB53は、高度なモデルの開発者に透明性の要件を課しています。

Anthropicのアプローチ

Anthropicは、準拠フレームワークを積極的に公開し、以下を実証しています:

  • 透明性 — プロセスの公開文書化
  • 予測 — 発効前の準備
  • 協力 —規制当局との連携

ユーザーのウェルビーイング保護

2025年12月18日 — Anthropicは、Claudeユーザーのウェルビーイングを保護するための措置について詳しく説明しました。

🔗 公式発表

実施されている措置

Anthropicは、集中的なAIの使用がユーザーに影響を与える可能性があることを認識しており、以下を実施しています:

  • 苦痛シグナルの検出 — 懸念されるパターンの特定
  • 支援リソース — 必要に応じて専門家への紹介
  • 責任ある制限 — 健全な使用の奨励

なぜ今なのか?

Claudeの大量採用(2億人以上のユーザー)に伴い、Anthropicは自社製品の社会的影響に関する責任を真剣に受け止めています。


これが意味すること

今週は、Anthropicがいくつかの最前線にいることを示しています:

プロダクト

Claude in ChromeはベータからGAに移行し、Web開発者のゲームチェンジャーとなるClaude Code統合が行われました。

研究と安全性

BloomとProject Vendは、Anthropicの実証的アプローチを示しています。つまり、実際の条件でモデルをテストし、その限界を理解することです。

科学

DOEとのパートナーシップは、Claudeを国家規模での科学的発見のためのツールとして位置付けています。

積極的な規制

規制を受けるのではなく、AnthropicはSB53とユーザーウェルビーイング対策でそれを先取りしています。


ソース