Anthropic Institute, Perplexity Everything is Computer, OpenAI Responses API: 11. März 2026

Der 11. März 2026 ist ein ereignisreicher Tag: Anthropic gründet ein interdisziplinäres Institut für die öffentliche Debatte über KI, Perplexity bringt seine Vision „Computer“ mit vier gleichzeitigen API auf den Markt, OpenAI veröffentlicht die neuen agentischen Primitiven der Responses API, und Meta beschreibt vier Generationen maßgeschneiderter KI-Chips, die in zwei Jahren entwickelt wurden.

Anthropic Institute: Jack Clark an der Spitze des öffentlichen Nutzens

11. März 2026 — Anthropic startet The Anthropic Institute, eine neue Initiative, um die öffentliche Debatte über die Herausforderungen leistungsfähiger KI voranzubringen. Die Initiative wird von Mitgründer Jack Clark geleitet, der bei Anthropic eine neue Rolle als „Head of Public Benefit“ (Leiter für öffentlichen Nutzen) übernimmt.

Das Institut wird ein interdisziplinäres Team zusammenbringen — Forscher, Ökonomen, Juristen, Fachleute für öffentliche Politik — mit einzigartigem Zugang zu Anthropics Spitzenmodellen. Seine Mission: die gesellschaftlichen, wirtschaftlichen und sicherheitsrelevanten Auswirkungen von KI zu analysieren und zu kommunizieren, während sie sich entwickeln.

Drei erste Neuzugänge wurden angekündigt:

Neuzugang	Werdegang
Matt Botvinick	Resident Fellow, Yale Law School; ehem. Senior Director of Research, Google DeepMind
Anton Korinek	Professor für Wirtschaftswissenschaften (im Sabbatical), Team Economic Research
Zoë Hitzig	Ehem. OpenAI, spezialisiert auf soziale und wirtschaftliche Auswirkungen von KI

Das Institut stützt sich auf bestehende Teams von Anthropic: Frontier Red Team, Societal Impacts, Economic Research. Parallel dazu kündigt Anthropic den Ausbau seines Public-Policy-Teams an, mit Schwerpunkt auf Modelltransparenz, Schutz von Energieverbrauchern, Exportkontrollen und globaler KI-Governance.

Die Gründung dieses Instituts markiert einen bemerkenswerten Schritt: Anthropic strukturiert sein öffentliches Engagement formell und gibt ihm mit einem seiner Mitgründer ein Gesicht.

🔗 Vorstellung des Anthropic Institute

Perplexity: koordinierter Start der Vision „Everything is Computer“

11. März 2026 — Perplexity veröffentlicht gleichzeitig vier Ankündigungen, die einen koordinierten Start rund um seine Vision „Computer“ bilden: KI als persönlicher und beruflicher Computer.

Personal Computer und Enterprise

Der Personal Computer ist ein dedizierter Mac mini, der rund um die Uhr läuft und mit lokalen Anwendungen sowie den Servern von Perplexity verbunden ist. Er agiert als digitaler Proxy des Nutzers — sensible Aktionen erfordern eine ausdrückliche Genehmigung. Warteliste geöffnet.

Der Computer for Enterprise verbindet sich mit Snowflake, Salesforce, HubSpot und Hunderten von Plattformen. Die Skills (skills) sind anpassbar, und die Slack-Integration ermöglicht die Arbeit in DMs oder geteilten Kanälen. Er basiert auf SOC 2 Type II, SAML SSO und Audit-Logs (audit logs). Perplexity nennt eine Zahl aus einer internen Studie mit 16.000 Anfragen: 1,6 Millionen Dollar Einsparung bei Arbeitskosten und 3,25 Arbeitsjahre in 4 Wochen erledigt.

Comet Enterprise ist ein nativer KI-Browser mit Admin-Kontrollen (Berechtigungen nach Domain, Aktionsprotokolle, MDM) und einer Partnerschaft mit CrowdStrike für Schutzmechanismen auf Browser-Ebene.

Perplexity Finance erhält mehr als 40 Live-Finanztools (SEC filings, FactSet, S&P Global, Coinbase, LSEG, Quartr, Polymarket), mit Broker-Anbindung über Plaid zur Analyse eines realen Portfolios.

Premium Sources bietet Zugriff auf Statista, CB Insights und PitchBook direkt in den Such-Feeds — kostenpflichtige Quellen werden automatisch zitiert.

🔗 Everything is Computer

Agent API: vollständige Orchestrierungs-Runtime

Die Agent API ist eine verwaltete Runtime zum Erstellen agentischer Workflows mit integrierter Suche, Tool-Ausführung und Multi-Modell-Orchestrierung. Sie ersetzt in einem einzigen Integrationspunkt einen Modell-Router, eine Suchschicht, einen Embeddings-Anbieter, einen Sandbox-Dienst und einen Monitoring-Stack (monitoring stack).

Integriertes Tool	Fähigkeiten
`web_search`	Filterung nach Domain, Aktualität, Datumsbereich, Sprache, Inhaltsbudget
`fetch_url`	Direkter Abruf von URLs
Benutzerdefinierte Funktionen	Vollständiger Support

Vier optimierte Profile (presets) decken die Anwendungsfälle ab: schnelle Faktensuche, ausgewogene Suche, tiefgehende Multi-Source-Analyse und institutionelle Recherche. Deep Research 2.0 ist über das Profil advanced-deep-research verfügbar — es startet Dutzende von Suchvorgängen pro Anfrage und verarbeitet Hunderte von Dokumenten.

Die Agent API ist modellagnostisch, unterstützt Multi-Modell-Fallback-Ketten (fallback chains) für eine Verfügbarkeit nahe 100 % und ist ab heute verfügbar auf docs.perplexity.ai.

🔗 Agent API

Search API: verbesserte Snippets und benchmark SEAL

Das Update der Search API betrifft die Qualität der Auszüge (snippets) und die Evaluierungsinfrastruktur.

Die neue Pipeline für Markierung auf Fragmentebene (span-level labeling) identifiziert, welche Segmente eines Quelldokuments für eine Anfrage relevant sind. Ergebnis: kleinere und präzisere Auszüge, was die Kosten in token senkt und das Kontextmanagement für nachgelagerte Modelle verbessert.

Der benchmark SEAL testet, ob ein Retrieval-System Fragen beantworten kann, deren Antwort sich im Laufe der Zeit ändert. Perplexity verbessert sich auf SEAL-Hard, während andere Anbieter nachlassen. Das Framework search_evals wird als Open Source auf GitHub aktualisiert.

Weitere Verbesserungen: Multi-Query-Support (bis zu 5 in einer einzigen API-Anfrage), Filterung nach Sprache (ISO-639-1-Code) und Land sowie Python-SDK (pip install perplexityai) mit nativem Support für alle drei API.

🔗 Update der Search API

Sandbox API: isolierte Code-Ausführung für Agenten

Perplexity öffnet seine interne Code-Ausführungsumgebung als eigenständigen Dienst. Jede Session läuft in einem isolierten Kubernetes-Pod mit einem gemounteten persistenten Dateisystem. Unterstützte Sprachen: Python, JavaScript, SQL. Die Installation von Paketen zur Laufzeit (at runtime) ist möglich.

Die Sessions haben einen persistenten Zustand (stateful): Dateien, die in einem Schritt erstellt werden, stehen in den folgenden Schritten zur Verfügung, und lange Workflows können pausieren und Stunden später fortgesetzt werden. Die Sicherheit basiert auf einem Zero-Trust-Modell (zero-trust): kein direkter Netzwerkzugang, ausgehender Traffic über Proxy, Code hat niemals Zugriff auf rohe API-Schlüssel.

Die Sandbox API wird mit demselben API-Schlüssel und denselben Credits in die Agent API integrierbar sein. Status: private Beta in Kürze.

🔗 Sandbox API

OpenAI: Die Responses API erhält eine Computerumgebung für Agenten

11. März 2026 — OpenAI veröffentlicht einen Engineering-Artikel, der die neuen Primitiven der Responses API zum Aufbau zuverlässiger autonomer Agenten beschreibt: Unix shell tool, gehostete Container, native Kontextkomprimierung und wiederverwendbare agent skills.

Das shell tool

Das shell tool ermöglicht dem Modell, über die Kommandozeile mit einem Computer zu interagieren, mit Zugriff auf klassische Unix-Dienstprogramme (grep, curl, awk). Im Gegensatz zum bestehenden Code-Interpreter, der nur Python ausführte, unterstützt das shell tool Go, Java, Node.js und andere Umgebungen. Die Modelle GPT-5.2 und spätere sind darauf trainiert, Shell-Befehle vorzuschlagen.

Die Responses API kann mehrere Shell-Befehle parallel über getrennte Container-Sessions ausführen und wendet ein Ausgabelimit pro Befehl an, um ein Überfüllen des Kontextfensters zu vermeiden.

Gehostete Container

Der Container bildet den Arbeitsbereich des Modells:

Komponente	Beschreibung
Dateisystem	Upload, Organisation und Verwaltung von Ressourcen über Container- und File-APIs
Datenbanken	Strukturierte Speicherung (SQLite) — das Modell fragt Tabellen ab, statt den gesamten Inhalt zu laden
Netzwerkzugang	Zentralisierter Egress-Proxy mit Allowlist, Secret-Injektion nach Domain

Native Kontextkomprimierung

Für Langzeitaufgaben integriert die Responses API einen Mechanismus zur nativen Komprimierung: Die Modelle sind darauf trainiert, eine kompakte und verschlüsselte Darstellung des Gesprächszustands zu erzeugen. Verfügbar serverseitig (konfigurierbarer Schwellenwert) oder über einen Endpoint /compact. Codex nutzt diesen Mechanismus, um lange Coding-Sessions ohne Qualitätsverlust aufrechtzuerhalten.

Agent skills

Skills (Agentenfähigkeiten) konditionieren wiederkehrende Workflow-Muster (workflow patterns) in wiederverwendbaren Bundles: ein Ordner mit einer Datei SKILL.md und den zugehörigen Ressourcen. Die Responses API lädt die skill automatisch in den Kontext, bevor sie den Prompt an das Modell sendet. Skills werden über API verwaltet und versioniert.

Parallel dazu feiert ein Entwickler-Blogbeitrag ein Jahr Responses API mit fünf Kundenfallstudien. Die beiden Veröffentlichungen ergeben ein kohärentes Bild der Entwicklung der Plattform hin zur Agentik.

🔗 Responses API + Computerumgebung 🔗 1 Jahr Responses API

OpenAI: Verteidigungsstrategie gegen prompt injection

11. März 2026 — OpenAI veröffentlicht einen Sicherheitsartikel über die Widerstandsfähigkeit von KI-Agenten gegen Prompt-Injection-Angriffe (prompt injection).

Die ersten Angriffe bestanden darin, direkte Anweisungen in externe Inhalte einzufügen (Wikipedia-Seiten, E-Mails). Mit der Verbesserung der Modelle haben sich diese Angriffe in Richtung Social Engineering (social engineering) entwickelt: überzeugender beruflicher Kontext, simulierte Dringlichkeit, vorgebliche Autorisierung. Ein im Artikel beschriebenes Beispiel aus dem Jahr 2025 zeigte einen erfolgreichen Angriff in 50 % der Fälle auf eine ältere Version von ChatGPT.

OpenAI betrachtet das Problem durch die Linse eines dreigeteilten Systems (Arbeitgeber / Agent / böswilliger Dritter), analog zu einem menschlichen Kundendienstmitarbeiter, der Manipulationsversuchen ausgesetzt ist. Ziel ist nicht, jeden Angriff perfekt zu identifizieren, sondern die Auswirkungen einer erfolgreichen Manipulation zu begrenzen.

Gegenmaßnahme	Beschreibung
Source-Sink-Analyse	Erkennung von Kombinationen aus nicht vertrauenswürdigem Inhalt + gefährlicher Aktion
Safe Url	Erkennt, ob Informationen aus der Unterhaltung an Dritte übertragen würden — fordert Bestätigung an oder blockiert
App-Sandbox	Canvas und ChatGPT Apps erkennen unerwartete Kommunikationen und fordern Zustimmung an

Safe Url gilt auch für Navigationen in Atlas sowie für Suchen und Navigationen in Deep Research.

🔗 KI-Agenten so gestalten, dass sie prompt injection widerstehen

Meta MTIA: vier Generationen von KI-Chips in zwei Jahren

11. März 2026 — Meta veröffentlicht einen ausführlichen technischen Artikel über seine Familie maßgeschneiderter KI-Chips MTIA (Meta Training and Inference Accelerator). In zwei Jahren hat Meta vier aufeinanderfolgende Generationen entwickelt, um Milliarden von Nutzern kostengünstiger zu bedienen.

“AI models are evolving faster than traditional chip development cycles.”

🇩🇪 KI-Modelle entwickeln sich schneller als die Entwicklungszyklen traditioneller Chips.

Generation	Wichtigste Innovation
MTIA 300	Erster Chip, optimiert für Ranking- und Empfehlungssysteme (Ranking & Recommendation), wiederverwendbare modulare Basis
MTIA 400	Weiterentwicklung hin zu GenAI-Workloads, Rack mit 72 Chips in einer einzigen Scale-up-Domäne
MTIA 450	Verdopplung der HBM-Bandbreite, +75 % MX4-FLOPS, Hardware-Beschleunigung für Attention und FFN
MTIA 500	+50 % HBM-Bandbreite gegenüber MTIA 450, Fokus auf GenAI-Inferenz

Die Entwicklung zwischen MTIA 300 und MTIA 500: HBM-Bandbreite um den Faktor 4,5 und FLOPS um den Faktor 25 erhöht. Metas Strategie beruht auf Hochgeschwindigkeitsentwicklung (ein neuer Chip pro Jahr), einem Fokus auf Inferenz statt Pre-Training und einer nativen PyTorch-Integration.

“Mainstream GPUs are typically built for the most demanding workload — large-scale GenAI pre-training — while Meta’s primary need is inference.”

🇩🇪 Mainstream-GPUs werden typischerweise für die anspruchsvollste Workload gebaut — großskaliges GenAI-Pre-Training — während Metas Hauptbedarf in der Inferenz liegt.

Die Architektur des elementaren Prozessors (Processing Element) kombiniert zwei vektorielle RISC-V-Kerne, eine Dot-Product-Engine (Dot Product Engine), eine Special-Function-Unit (Special Function Unit), eine Reduktions-Engine und einen DMA. Der Software-Stack basiert auf PyTorch, vLLM, Triton und dedizierten MTIA-Compilern, mit vLLM-Integration über eine plugin-Architektur.

🔗 Meta MTIA: KI-Chips für Milliarden skalieren

Gemini CLI v0.33.0: erweiterter Plan Mode und A2A-Authentifizierung

11. März 2026 — Gemini CLI veröffentlicht Version v0.33.0, zwei Wochen nach v0.32.0, die den Plan Mode eingeführt hatte.

Kategorie	Neuerungen
Agentenarchitektur	HTTP-Authentifizierung für entfernte A2A-Agenten, Discovery authentifizierter A2A-Agentenkarten
Plan Mode	Integrierte Recherche-Subagenten, Unterstützung von Annotationen für Nutzerfeedback, neuer Unterbefehl `copy`
CLI-Oberfläche	Kompakter Header mit ASCII-Icon, invertierte Anzeige des Kontextfensters, standardmäßig 30 Tage Aufbewahrung für den Chatverlauf

Die Ergänzung der HTTP-Authentifizierung für das A2A-Protokoll (Agent-to-Agent) ist die wichtigste technische Neuerung: Gemini CLI kann nun entfernte Agenten entdecken und sich bei ihnen authentifizieren, wodurch die Grundlagen für eine sichere Multi-Agenten-Orchestrierung gelegt werden.

🔗 Gemini CLI-Changelog

Gemini in Chrome: Expansion nach Indien, Neuseeland und Kanada

11. März 2026 — Google erweitert die KI-Funktionen von Chrome auf drei neue Märkte: Indien, Neuseeland und Kanada.

Gemini in Chrome — der KI-Assistent in der Seitenleiste, basierend auf Gemini 3.1 — ist in diesen Regionen nun auf Mac, Windows und Chromebook Plus verfügbar. Zu den ausgerollten Funktionen gehören: Zugriff auf Gmail, Maps, Calendar und YouTube aus Chrome heraus, übergreifende Analyse mehrerer geöffneter Tabs und Bildtransformation direkt im Browser über Nano Banana 2. Das Update fügt über 50 zusätzliche Sprachen hinzu, darunter Hindi, Französisch und Spanisch.

🔗 Chrome expandiert nach Indien, Neuseeland und Kanada

AlphaEvolve: neue Schranken für 5 Ramsey-Zahlen

11. März 2026 — Pushmeet Kohli (Google DeepMind) gibt bekannt, dass AlphaEvolve neue untere Schranken für 5 klassische Ramsey-Zahlen in der extremalen Kombinatorik aufgestellt hat — Probleme, die so schwierig sind, dass Erdős selbst ihre Komplexität kommentiert hatte, und deren bisher beste Ergebnisse mindestens ein Jahrzehnt zurücklagen.

AlphaEvolve agiert als Meta-Algorithmus, der die erforderlichen Suchverfahren automatisch entdeckt, wo historisch spezifische Algorithmen manuell entworfen werden mussten. Dieses Ergebnis veranschaulicht die Fähigkeiten von AlphaEvolve über die Google-Kernel-Optimierungen hinaus, für die es bereits bekannt war.

🔗 Tweet von Pushmeet Kohli

Gemini Embedding 2: Googles erstes multimodales Embedding

10. März 2026 — Google kündigt Gemini Embedding 2 an, beschrieben als „our most capable and first fully multimodal embedding model“. Es ist Googles erstes nativ multimodales Embedding-Modell, verfügbar für Entwickler über Gemini API und AI Studio.

🔗 Tweet von @googleaidevs

GitHub Copilot: Code-Review aus dem Terminal und JetBrains-Fortschritte

11. März 2026 — Zwei bemerkenswerte Updates für GitHub Copilot.

Code Review aus GitHub CLI v2.88.0

Es ist nun möglich, direkt aus dem Terminal eine Copilot-Code-Review anzufordern. Die Befehle gh pr edit --add-reviewer @copilot (nicht-interaktiver Modus) und gh pr create (interaktiver Modus) integrieren Copilot neben den Teamkollegen. Die Auswahl der Reviewer profitiert von einer dynamischen Suche, was die Performance in großen Organisationen verbessert und Barrierefreiheitsprobleme behebt. Verfügbar in allen Plänen mit Copilot code review — Update auf GitHub CLI v2.88.0 erforderlich.

🔗 Code Review aus GitHub CLI

Agentische Verbesserungen für JetBrains IDEs

Das Update des JetBrains-plugin bringt in die allgemeine Verfügbarkeit (GA): benutzerdefinierte Agenten (custom agents), Subagenten und Planungsagent (plan agent) sowie automatische Modellauswahl für alle Pläne. In der öffentlichen Vorschau (public preview): die Agent-Hooks (userPromptSubmitted, preToolUse, postToolUse, errorOccurred) über eine Datei hooks.json in .github/hooks/ und die Unterstützung der Dateien AGENTS.md und CLAUDE.md.

Weitere Verbesserungen ergänzen das Update: konfigurierbares Auto-Approve pro MCP, Denk-Panel für Modelle mit erweitertem Reasoning, Indikator für die Nutzung des Kontextfensters und Deprecation des Edit-Modus im Menü.

🔗 JetBrains-Verbesserungen

Ein Repository in Copilot im Web erkunden

In der öffentlichen Vorschau: Es ist möglich, die Baumstruktur eines GitHub-Repositorys direkt über die Weboberfläche von Copilot zu erkunden. Ausgewählte Dateien werden dem Chat automatisch als temporäre Referenzen hinzugefügt und können dauerhaft gemacht werden.

🔗 Repository-Erkundung in Copilot

Anthropic Sydney und Claude for Office

Sydney, 4. Büro im Asien-Pazifik-Raum

10. März 2026 — Anthropic kündigt die bevorstehende Eröffnung eines Büros in Sydney an, seines vierten im Asien-Pazifik-Raum (nach Tokio, Seoul und Singapur). Australien liegt weltweit auf Platz 4 bei der Nutzung von Claude.ai pro Kopf; Neuseeland liegt nach demselben Indikator auf Platz 8 (Anthropic Economic Index). Das Büro wird sich zunächst auf Unternehmenskunden, Startups und Forschung konzentrieren.

🔗 Sydney, 4. Büro im Asien-Pazifik-Raum

Claude for Excel und PowerPoint: geteilter Kontext und Office Skills

11. März 2026 — Die Add-ins Claude for Excel und Claude for PowerPoint erhalten zwei wichtige Updates: das Teilen von Kontext zwischen beiden Anwendungen (ein Analyst kann Daten aus einer Excel-Arbeitsmappe extrahieren und sie in einer PowerPoint-Präsentation in einer einzigen Unterhaltung verwenden) und die Einführung von Skills (wiederverwendbare Workflows per Klick) in beiden Add-ins.

Die vorinstallierten Skills decken die häufigsten Anwendungsfälle ab: Formelprüfung, Erstellung von LBO-/DCF-Modellen, Decks zur Wettbewerbslandschaft, Aktualisierung von Präsentationen mit neuen Daten und Review von Investmentbanking-Decks. Die Add-ins sind nun über Amazon Bedrock, Google Cloud Vertex AI und Microsoft Foundry für Compliance-konforme Deployments verfügbar. Verfügbarkeit: Mac und Windows in kostenpflichtigen Plänen (Pro, Max, Team, Enterprise).

🔗 Claude for Excel und PowerPoint

NVIDIA Nemotron 3 Super, ComfyUI und GTC 2026

11. März 2026 — NVIDIA ist rund um die GTC 2026 sehr aktiv.

Nemotron 3 Super bietet einen 5-mal höheren Durchsatz für agentische KI im Vergleich zur vorherigen Generation. Es handelt sich um ein Open-Source-MoE-Modell (Mixture of Experts) mit 120 Milliarden Parametern, optimiert für hochfrequente Inferenz-Workloads.

NVIDIA und ComfyUI haben auf der GDC 2026 (Game Developers Conference) eine Integration angekündigt, die die lokale KI-Videogenerierung für Spieleentwickler und Creator vereinfacht, mit Unterstützung der Modelle FLUX und LTX-Video.

Der NVIDIA-Blog GTC 2026 Live Updates bündelt die Live-Ankündigungen der Konferenz in San Jose — Mistral AI präsentiert in diesem Rahmen ebenfalls seine Frontier-Modelle.

🔗 Nemotron 3 Super 🔗 ComfyUI GDC 🔗 GTC 2026 Live

Kurz notiert

Runway Labs — Runway startet einen internen Inkubator unter der Leitung von Alejandro Matamala Ortiz (Mitgründer, Innovationsdirektor). Runway Labs wird radikal neue Anwendungen für generative Videos und Weltsimulationsmodelle (General World Models) in verschiedenen Branchen prototypisieren: Film, Gesundheit, Bildung, Videospiele, Werbung, Immobilien. Recruiting ist geöffnet.

🔗 Einführung von Runway Labs

Claude Code /btw — Ein neuer Befehl /btw ermöglicht seitliche Unterhaltungen (side chain conversations), während eine Aufgabe ausgeführt wird, ohne die laufende Arbeit zu unterbrechen.

🔗 Tweet von @bcherny

NotebookLM Flashcards — Update für Quizze und Flashcards: Fortsetzen an der Stelle, an der man aufgehört hatte, Nachverfolgung erfolgreich oder falsch beantworteter Flashcards, Möglichkeit zum Löschen oder Mischen von Flashcards.

🔗 Tweet von NotebookLM

Meta Canopy Height Maps v2 — Meta und das World Resources Institute veröffentlichen CHMv2, eine neue Version globaler Karten zur Höhe von Waldkronen. Das Modell DINOv3 (selbstüberwachtes Vision-Modell von Meta) verbessert Genauigkeit und globale Abdeckung. Anwendungen: Klimamigration, Waldrestaurierung, Stadtplanung. Modelle sind Open Source verfügbar.

🔗 Canopy Height Maps v2

Z.ai GLM-5 — GLM-5 ist nun für Lite-Nutzer (kostenlose Stufe) zugänglich, nachdem es seit seinem Start im Februar 2026 Pro-Nutzern vorbehalten war.

🔗 Tweet von @ZixuanLi_

Was das bedeutet

Der 11. März 2026 veranschaulicht zwei grundlegende Trends, die zusammenlaufen.

Der erste ist die Plattformisierung des Agentischen: OpenAI, Perplexity und GitHub veröffentlichen am selben Tag komplementäre Primitive (Shell-Tools, Sandboxes, Agent-Hooks, Code Review). Das Ökosystem strukturiert sich rund um wiederverwendbare Bausteine — Skills, Container, Subagenten —, die es Entwicklern ermöglichen, zuverlässige Agenten zu bauen, ohne die Infrastruktur neu zu erfinden.

Der zweite ist der Wettlauf um kundenspezifisches Silizium: Die Details, die Meta zu seinen vier MTIA-Generationen in zwei Jahren veröffentlicht, offenbaren eine klare Strategie der Unabhängigkeit von Consumer-GPUs, kalibriert für Inferenz in großem Maßstab. Dieselbe Logik treibt NVIDIA dazu, Nemotron 3 Super am selben Tag der GTC zu veröffentlichen, auf der sich die Ankündigungen häufen.

Die Gründung des Anthropic Institute fügt sich in eine diskretere, aber dauerhafte Bewegung ein: Während die Fähigkeiten voranschreiten, strukturieren große KI-Unternehmen ihre Teams für öffentliche Wirkung — nicht mehr als bloße Fassadenkommunikation, sondern als eigenständige Forschungsanstrengung.

Quellen

Dieses Dokument wurde von der Version fr in die Sprache en mit dem Modell gpt-5.5 übersetzt. Weitere Informationen zum Übersetzungsprozess finden Sie unter https://gitlab.com/jls42/ai-powered-markdown-translator