Gemma 4 12B Open Source, Ideogram 4.0 Open Weights, Perplexity Computer unter Windows, Stargate Michigan

Der 3. Juni 2026 bündelt eine Welle bedeutender Open-Source-Ankündigungen: Google veröffentlicht Gemma 4 12B (multimodal, edge, Apache 2.0) und startet Co-Scientist, sein Multi-Agent-System für die wissenschaftliche Forschung. Ideogram gibt die Gewichte seiner Version 4.0 frei. Perplexity bringt seinen Personal-Computer-Agenten auf Windows. OpenAI eröffnet The Barn, ein 1-GW-Datacenter in Michigan. GitHub Copilot liefert ein großes Update für VS Code, JetBrains, Eclipse und die Abrechnung aus. Auf der xAI-Seite ist Grok Imagine 1.5 Preview über API verfügbar, und die Grok-Stimmen kommen auf Vapi.

Gemma 4 12B — Open-Source-multimodell für Laptops

3. Juni — Google bringt Gemma 4 12B auf den Markt, ein vereinheitlichtes multimodales Modell, das dafür entwickelt wurde, direkt auf Laptops und Edge-Geräten zu laufen. Sein wichtigster technischer Unterschied ist die encoderfreie Architektur (encoder-free), die das Deployment vereinfacht und die Softwareabhängigkeiten reduziert. Das Modell wird unter Apache-2.0-Lizenz veröffentlicht, wodurch es frei für kommerzielle und Forschungszwecke nutzbar ist.

Eigenschaft	Wert
Parameter	12 Milliarden
Modalitäten	Text + Bild (vereinheitlicht)
Architektur	Ohne separaten Encoder (encoder-free)
Lizenz	Apache 2.0
Zielhardware	Laptops, Edge Computing
Verfügbarkeit	Ab sofort herunterladbar

Die Ankündigung erzielte 620.000 Aufrufe und 5.000 Likes auf X und ist damit eine der erfolgreichsten Open-Source-Ankündigungen der Woche. Von Google DeepMind erneut gepostet, steht Gemma 4 12B in der Kontinuität der früheren Gemma-Modelle, macht aber einen Sprung nach vorn, indem es Bild und Text in einem einzigen kompakten Modell vereint.

Für Entwickler eröffnet dieses Modell einen konkreten Weg zu multimodalen KI-Anwendungen, die außerhalb der Cloud bereitgestellt werden können — auf Maschinen mit Consumer-GPU, ohne API-Abonnement.

🔗 Launch-Tweet @googlegemma

Google DeepMind Co-Scientist — Multi-Agent-Partner für die wissenschaftliche Forschung

2. Juni — Google DeepMind stellt Co-Scientist vor, ein auf Gemini basierendes Multi-Agent-System, das als echter Partner für die wissenschaftliche Forschung agieren soll. Seine Kernfähigkeit: Hypothesen generieren, diskutieren und weiterentwickeln für komplexe wissenschaftliche Probleme, autonom und mit geringer menschlicher Intervention.

Co-Scientist ist nicht einfach ein Werkzeug zum Zusammenfassen oder für die Dokumentensuche. Es kann originelle Hypothesen vorschlagen, sie intern zwischen Agenten gegeneinander abgleichen und dann verfeinern — ein Zyklus aus Ideation, Debatte und Weiterentwicklung, der bislang menschlichen Forschungsteams vorbehalten war. Das System wurde zusammen mit weltweiten wissenschaftlichen Experten auf spezialisierten Benchmarks evaluiert.

Verfügbarkeit: Früher Zugang für einzelne Forschende über Hypothesis Generation (Warteliste). Zusammenarbeit mit weltweiten wissenschaftlichen Experten läuft, um die Leistung in spezifischen Bereichen zu bewerten.

“We believe AI can be a dedicated research partner to help discover the next breakthrough.”

🇩🇪 Wir glauben, dass KI ein dedizierter Forschungspartner sein kann, der dabei hilft, den nächsten Durchbruch zu entdecken. — @GoogleDeepMind

Die Ankündigung erzielte 144.000 Aufrufe auf X. Im Kontext eines wissenschaftlichen Sektors, der unter Druck steht, Entdeckungszyklen zu beschleunigen, richtet sich Co-Scientist direkt an einzelne Forschende, denen die Ressourcen eines großen Teams fehlen.

🔗 Artikel auf deepmind.google

Ideogram 4.0 — herunterladbare Open-Source-Gewichte, Fine-Tuning möglich

3. Juni — Ideogram kündigt Ideogram 4.0 an, präsentiert als „das beste Open-Source-Bildmodell der Welt“. Die Ankündigung zeichnet sich durch ihre radikal offene Philosophie aus: Die Modellgewichte sind herunterladbar, Entwickler können sie auf ihren eigenen Daten anpassen (fine-tune) und auf ihrer eigenen Infrastruktur bereitstellen.

Aspekt	Detail
Verfügbarkeit	Alle Ideogram-Pläne + API (ab sofort)
Hugging-Face-Gewichte	`ideogram-ai/ideogram-4-nf4`
Demo	huggingface.co/spaces/multimodalart/ideogram4
Fine-Tuning	Für proprietäre Daten erlaubt
Deployment	Eigene Infrastruktur möglich
X-Engagement	396.800 Aufrufe — starke Viralität

Die Ankündigung wurde von Hugging Face aufgegriffen und als Beispiel für den Fortschritt der Qualität offener Modelle gelobt. Der Slogan „Think it. Make it. Own it.“ fasst die Philosophie zusammen: Im Gegensatz zu üblicherweise geschlossenen generativen Bildmodellen (Midjourney, DALL-E, neuere Stable Diffusion) bietet Ideogram 4.0 ein vollständiges Eigentumsmodell für Studios und Entwickler.

Für kreative Teams ist der Nutzen unmittelbar: den Stil auf ihren Daten personalisieren, ohne von einem externen Dienst abhängig zu sein, und intern bereitstellen.

🔗 Ankündigung @ideogram_ai

Perplexity Personal Computer kommt auf Windows

3. Juni — Perplexity kündigt die Verfügbarkeit seines Agenten Personal Computer auf Windows an. Bisher nur auf macOS verfügbar, steht der Agent kurz davor, Microsofts Betriebssystem zu erobern.

“Personal Computer is coming to Windows. Personal Computer for Windows runs on your machine and orchestrates across the apps and files you use every day. We’ll roll out first to paying Max and Enterprise Max subscribers on the waitlist.”

🇩🇪 Personal Computer kommt auf Windows. Personal Computer für Windows läuft auf Ihrer Maschine und orchestriert die Anwendungen und Dateien, die Sie jeden Tag verwenden. Wir werden zunächst an zahlende Max- und Enterprise-Max-Abonnenten auf der Warteliste ausrollen. — @perplexity_ai

Personal Computer läuft lokal auf dem Rechner des Nutzers — er orchestriert die alltäglichen Anwendungen und Dateien, ohne vollständig über die Cloud zu gehen. Dieser hybride lokale/Cloud-Ansatz stellt Perplexity in eine eigene Kategorie neben rein cloudbasierten Agenten: Der Nutzer behält die Kontrolle über sensible Daten.

Der Rollout beginnt für die auf der Warteliste registrierten Max- und Enterprise-Max-Abonnenten über perplexity.ai/personal-computer.

Perplexity Computer — über 400 Integrationen für Unternehmen

Am selben Tag konkretisiert Perplexity den Umfang der Unternehmensfähigkeiten des Agenten: mehr als 400 Tools sind angebunden und decken alle Arten von Unternehmen ab. Zu den genannten Integrationen gehören: Intuit QuickBooks (Buchhaltung), Vercel (Web-Deployment), Shopify (E-Commerce) und Canva (Design).

Diese ergänzende Ankündigung positioniert Perplexity Computer als universellen Unternehmensagenten, der sich in bestehende Arbeitsabläufe integrieren kann, ohne die vorhandenen Tools zu ersetzen.

🔗 Unternehmensintegrationen

Stargate Michigan — The Barn, 1-GW-Datacenter in Saline

1. Juni — OpenAI und Gouverneurin Gretchen Whitmer geben den ersten Spatenstich für The Barn, einen 1-Gigawatt-Datacenter-Campus in Saline, Michigan, bekannt. Das Projekt ist Teil von OpenAIs Stargate-Programm — einem langfristigen Infrastrukturaufbau für fortgeschrittene KI in Partnerschaft mit Oracle, Related Digital, Walbridge und Blackstone.

Metrik	Wert
Kapazität	1 GW
Standort	Saline, Michigan
Bauarbeitsplätze	2.500+ (gewerkschaftlich)
Dauerarbeitsplätze	450
Jobs im County + indirekt	2.500
Investition in das Rec Center	$10M (Oracle + Related Digital)
Prognostizierte Steuereinnahmen	$1 Milliarde (Laufzeit des Pachtvertrags)
Codex-Guthaben für Studierende	bis zu $45M
Förderfähige Studierende	400.000+

Die Zusagen an die Gemeinschaft sind ausdrücklich: Die lokalen Anwohner tragen die Infrastrukturkosten nicht über ihre Stromrechnungen. Die Kühlung arbeitet in einem geschlossenen Kreislauf und verbraucht etwa so viel Wasser wie ein normales Bürogebäude.

Das Michigan-Studentenprogramm bietet bis zu $45 Millionen an Codex-Guthaben für die 400.000 Studierenden der Universitäten, Community Colleges und Berufsschulen des Bundesstaates (18 Jahre und älter, akademisches Jahr 2026–2027).

🔗 Ankündigung auf openai.com

GitHub Copilot in VS Code — Mai-Releases (v1.120–v1.123)

3. Juni — GitHub veröffentlicht die monatliche Copilot-Zusammenfassung für VS Code, die die Versionen v1.120 bis v1.123 abdeckt, die im Verlauf des Mai 2026 ausgeliefert wurden. Dieses grundlegende Update bündelt mehrere Monate Arbeit an Agenten, Synchronisierung und Sicherheit.

Die strukturellen Neuerungen:

Agents-Fenster (stabile Vorschau): agentenorientierte Oberfläche, um gleichzeitig an mehreren Projekten zu arbeiten, mit schneller Navigation und Review der Änderungen
Remote Agents (Vorschau): Ausführung auf entfernten Maschinen per SSH oder Dev Tunnels — Sitzungen bleiben bestehen, selbst wenn der Client die Verbindung trennt
Agent Host Protocol (AHP): offenes Protokoll zur Synchronisierung des Sitzungszustands zwischen mehreren Clients
Session Sync: Chat-Sitzungen werden automatisch mit dem GitHub-Konto synchronisiert und sind zwischen Maschinen und Arbeitsbereichen abrufbar
/chronicle: vergangene Sitzungen abfragen, tägliche Stand-up-Berichte generieren, personalisierte Produktivitätstipps erhalten
Terminal-Sicherheit: Passwörter, PINs und Verifizierungscodes, die im Terminal eingegeben werden, werden niemals an das Sprachmodell übermittelt
Risikobewertung von Befehlen (experimentell): Terminal-Bestätigungen enthalten KI-generierte Risikostufen
BYOK air-gapped: BYOK-Modelle funktionieren in isolierten Umgebungen ohne GitHub-Zugriff
Konfigurierbare Utility-Modelle: Auswahl der Modelle für Titel, Zusammenfassungen, Umbenennungsvorschläge, Commit-Nachrichten und Absichtserkennung
Integrierter Browser: Emulation mobiler Geräte, erweiterte Screenshots (Viewport, ausgewählter Bereich, gesamte Seite), lokale HTML-Vorschau
Mermaid- und YAML-Front-Matter-Rendering: nativ in die Markdown-Vorschau integriert
Komprimierung von Terminalausgaben: ausführliche Muster (Tests, Builds, Linters, Docker, Paketmanager) werden automatisch komprimiert

Das Arbeitsmodell mit mehreren Agenten nimmt Gestalt an: Mehrere Agenten-Sitzungen können parallel im Agents-Fenster laufen, jede mit eigenem Kontext und ihrem in das GitHub-Konto synchronisierten Verlauf.

🔗 VS-Code-Changelog Mai

Copilot Code Review — MCP Skills und Analyseniveau Medium (Public Preview)

2. Juni — GitHub startet in Public Preview zwei wichtige Funktionen für Copilot Code Review, mit denen sich automatische Reviews an Kontext und Komplexität jedes Teams anpassen lassen.

Skills und MCP-Support: Teams können jetzt benutzerdefinierte Agent-Skills (Dateien .github/skills/code-review/SKILL.md) und Verbindungen zu MCP-Servern konfigurieren, um jedes Review mit dem Kontext interner Tools anzureichern — Issue-Tracking, Dokumentation, Service-Kataloge, Incident-Tools. Die MCP-Konfiguration erfolgt über die Repository-Einstellungen → Copilot → MCP servers. Jede bestehende MCP-Konfiguration für den Cloud-Agent gilt automatisch auch für Reviews — eine einmalige Investition, konsistentes Verhalten auf beiden Agenten.

Niveau „Medium“: eine neue mittlere Stufe leitet komplexe Pull Requests an ein Modell mit höherem Reasoning um, das dafür ausgelegt ist, subtile Bugs zu erkennen, Sicherheitslogik zu analysieren und Änderungen über mehrere Services hinweg zu verarbeiten. Die Stufe „Low“ bleibt die schnelle und kostengünstige Standardeinstellung für einfache Änderungen. Medium verbraucht mehr AI Credits als Low, mit klaren Kostensignalen in der Oberfläche. Admins legen das Niveau pro Repository fest.

Die Actions-Workflows sind ebenfalls konfigurierbar, sodass sich die von Copilot für Reviews verwendete Rechenumgebung steuern lässt. Verfügbar für Copilot Pro, Pro+, Business und Enterprise.

🔗 Copilot Code Review gestalten

Copilot CLI und verstärkte agentische Fähigkeiten in JetBrains IDEs

2. Juni — GitHub kündigt die Einführung von Copilot CLI in JetBrains mit einem Agenten-Auswähler an, über den zwischen den Modi Agent (autonom), Ask (schnelle Hilfe), Custom agents (benutzerdefiniert) oder Plan (gemeinsame Planung) gewählt werden kann. Drei neue Befehle erweitern die CLI-Sitzungen:

/remote : eine CLI-Sitzung von github.com oder der mobilen App aus steuern
/compact : den Kontext langer Sitzungen manuell komprimieren
/chronicle : den Verlauf analysieren, Stand-up-Berichte generieren und personalisierte Tipps erhalten

Das Agent-Debugging-Panel (Public Preview) zeigt ein chronologisches Protokoll der Interaktionen — besonders nützlich, um benutzerdefinierte Agenten und komplexe Multi-Agent-Workflows zu debuggen. Der Reasoning-Aufwand von Reasoning-Modellen ist direkt im Modellauswähler konfigurierbar, sodass sich die Analysetiefe an die Aufgabe anpassen lässt.

Die Sitzungen des Cloud Agents sind jetzt in die vereinheitlichte Sitzungsansicht integriert, sodass sich alle Sitzungen (lokal, CLI, Cloud) von einem einzigen Ort aus verwalten lassen. Ein Editor für Agent-Customizations bündelt die Erstellung und Verwaltung von Skills, Instruktionen und Prompts.

Neue Anmeldeoptionen: Google und Apple werden zu den verfügbaren Sign-in-Methoden hinzugefügt. Zu den Funktionen, die den Status GA erreicht haben, gehören: Agent Skills, Agent Hooks, Prompt-Dateien und Anthropic Thinking. Ein gestaffelter Rollout läuft, um Copilot CLI Agent zur Standarderfahrung in JetBrains zu machen.

🔗 Copilot JetBrains Changelog

Abrechnung und Pläne von GitHub Copilot — nutzungsbasierte Abrechnung GA, Copilot Max

1. Juni — GitHub aktiviert seit dem 1. Juni 2026 die nutzungsbasierte Abrechnung (AI Credits) für alle Copilot-Pläne. Jeder Plan enthält ein monatliches Kontingent an AI Credits; darüber hinaus können Nutzer fortfahren, indem sie ein Budget für zusätzliche Ausgaben mit von den Admins definierten Limits konfigurieren.

Strukturelle Änderungen:

Copilot Code Review verbraucht jetzt auch GitHub-Actions-Minuten zusätzlich zu AI Credits — Admins können einen Standard-Runner für alle Reviews auf Organisationsebene konfigurieren, ohne Repo-spezifische Einrichtung
Nutzerbudgets in GA: Organisations- und Unternehmensadmins definieren universelle oder nutzerspezifische Budgets, mit E-Mail-Benachrichtigungen kurz vor Erreichen der Limits
Copilot Max: Upgrade ab heute für bestehende Student-, Pro- und Pro+-Abonnenten verfügbar — höheres Kontingent und höhere Ausgabelimits für intensive Workflows
Neue Anmeldungen ausgesetzt für Student, Pro, Pro+ und Max — Wiedereröffnung in den kommenden Wochen geplant

Hinweis für Enterprise-Teams: Admins müssen das alternative Modell GPT-5.5 über die Modellrichtlinien aktivieren, um das veraltete GPT-4.1 zu ersetzen. Nach der Aktivierung erscheint GPT-5.5 im Modellauswähler von Copilot Chat in VS Code und auf github.com.

🔗 Update zu Abrechnung und Plänen

Grok Imagine 1.5 Preview jetzt in der xAI-API verfügbar

3. Juni — xAI kündigt die Verfügbarkeit von Grok Imagine 1.5 Preview in der xAI-API an, erreichbar unter x.ai/api/imagine. Es handelt sich um ein großes Update der Bildgenerierungsfähigkeit von Grok — Version 1.5 Preview folgt auf Grok Imagine und stellt eine neue Generation des Bildmodells von xAI dar, direkt per API für Entwickler verfügbar.

Aspekt	Detail
Modell	Grok Imagine 1.5 Preview
Zugriff	xAI-API — x.ai/api/imagine
Status	Preview (zum Zeitpunkt des Scans keine offizielle Produktseite)
Verfügbarkeit	Entwickler können es jetzt per API nutzen
X-Engagement	164 800 Aufrufe, ~1 000 Likes

Der Ankündigungstweet stammt vom Account @grok und wurde umgehend von @xai repostet — ein Hinweis auf Priorität für das Team. Grok Imagine war bereits in der Grok-Oberfläche zugänglich, aber die API-Verfügbarkeit der Version 1.5 Preview öffnet die xAI-Bildgenerierung für Entwickler, die sie in ihre Anwendungen integrieren möchten.

Grok Imagine 1.5 Preview ist Teil von xAIs Aufstieg im multimodalen Segment: Am selben Tag erweitern die Sprach-APIs Grok STT und Grok TTS ihre Reichweite durch die Integration mit Vapi. Das xAI-Ökosystem deckt nun Text, Bild und Stimme per API ab und bietet damit eine vollständige Alternative zu den Angeboten von OpenAI und Google in diesem Segment.

🔗 Ankündigung @grok

Grok STT und TTS auf Vapi verfügbar

3. Juni — Die xAI-Sprach-APIs — Grok STT (Spracherkennung) und Grok TTS (Sprachsynthese) — sind jetzt in Vapi, einer Enterprise-Voice-AI-Plattform, integriert. Die im April 2026 gestarteten APIs erweitern damit ihre Reichweite auf Entwickler von Enterprise-Voice-Agenten über Vapi.

Die Ankündigung erzielte 433 300 Aufrufe, 1 100 Likes und 272 Reposts — starkes Engagement für eine technische Integrationsankündigung. Vapi ermöglicht die Erstellung personalisierter Voice-Agents; die Integration von Grok STT/TTS ergänzt dies um die xAI-Sprachmodelle als konkurrierende Option zu denen von ElevenLabs, Deepgram oder OpenAI.

🔗 Grok auf Vapi

NVIDIA CVPR 2026 — Physical-AI-Agent-Skills für AV, Robotik, KI-Vision und Alpamayo 2 Super 32B

3. Juni — Anlässlich der CVPR 2026 (Denver, 3.–7. Juni) präsentiert NVIDIA eine neue Generation von Physical-AI-Agent-Skills, die den gesamten Forschungszyklus für autonome Fahrzeuge, Robotik und KI-Vision abdecken.

Wichtige Ankündigungen für autonome Fahrzeuge:

AlpaGym : Closed-Loop-Reinforcement-Learning-Framework (reinforcement learning), skalierbar auf Tausende von GPUs
OmniDreams : generatives, aktionskonditioniertes World Model
Alpamayo 2 Super : Open-Source-VLA-Modell (Vision-Language-Action) mit 32 Milliarden Parametern für autonomes Fahren auf Stufe 4

Für die Robotik: Isaac Sim 6.0 mit nativen Agent-Connectors, Mobility-Skills, Sim-to-Real-Reinforcement-Learning und Cosmos-H-Surgical-Simulator für die chirurgische Robotik.

Für die KI-Vision: Metropolis-Skills zur Erzeugung synthetischer visueller Anomalien sowie der Skill Defect Image Generation für die industrielle Inspektion.

Der NVIDIA Physical AI Dataset überschreitet 15 Millionen Downloads auf Hugging Face. Die Skills sind auf GitHub und NVIDIA Brev mit kostenlosen Testguthaben auf H100 verfügbar.

🔗 NVIDIA CVPR 2026 Physical AI

NVIDIA Transaction Foundation Models — Revolut, Mastercard, Adyen, Stripe

1. Juni — NVIDIA erläutert, wie große Finanzinstitute auf transaction foundation models zusteuern — Foundation Models, die auf Milliarden proprietärer Finanzereignisse trainiert werden.

Institution	Ansatz	Wichtigstes Ergebnis
Revolut	PRAGMA — 24 Milliarden Ereignisse, 26 Mio. Nutzer, 100+ Länder	Ein einziges Modell übertrifft spezialisierte Modelle (Betrug, Kredit, Empfehlung)
Mastercard	Großes tabellarisches Modell auf Milliarden von Transaktionen (NVIDIA NeMo AutoModel)	Anwendungen: Betrug, Kredit, Loyalität
Adyen	Modelle im Maßstab von $1 Billion an Zahlungen, RL für Conversion	”0,1 % Autorisierung = massiver Effekt”
Stripe	Transaktionaler Verhaltenskontext	$112 Milliarden blockierter Betrug/Jahr, -38 % Betrugsrate

NVIDIA stellt ein Entwicklungsbeispiel „Build Your Own Transaction Foundation Model“ bereit, verfügbar auf AWS SageMaker HyperPod und Nebius AI Cloud.

🔗 NVIDIA Transaction Foundation Models

Anthropic — Partner Network, Cyberbedrohungen und Claude Code /fork

Claude Partner Network — Services Track und Partner Hub

3. Juni — Anthropic erweitert sein Partnernetzwerk um zwei neue Strukturen: den Services Track und den Claude Partner Hub.

Der Services Track ist ein dreistufiges System, das Beratungsunternehmen anhand ihrer tatsächlichen Praxis mit Claude bewertet:

Stufe	Zertifizierte aktive	Eingesetzte Kunden	Öffentliche Referenzen
Select	10+	2+ (12 Monate)	1+
Preferred	100+	15+	3+
Global Premier	1 000+	100+ (3 Regionen)	15+

Der Claude Partner Hub ist ein Portal mit täglicher Aktualisierung des Fortschritts jedes Partners sowie einem MCP-Connector, um Informationen des Hubs direkt aus Claude abzufragen.

Kennzahlen: $100 Millionen in Partner-Training investiert, 40 000+ Bewerbungen seit dem Start im März, 10 000+ zertifizierte Consultants bis heute. Zu den beteiligten Beratungen zählen: Accenture (30 000 geschulte Fachkräfte), Deloitte (470 000 Personen), KPMG (276 000+), Cognizant, PwC.

🔗 Services Track und Partner Hub

MITRE-ATT&CK-Bericht — ein Jahr von durch KI aktivierten Cyberbedrohungen

3. Juni — Das Frontier Red Team von Anthropic veröffentlicht eine Analyse von 832 gesperrten Konten zwischen März 2025 und März 2026, kartiert auf das MITRE-ATT&CK-Framework.

Drei Hauptbefunde:

Kennzahl	Wert
Analysierte Konten	832 (März 2025 – März 2026)
KI-Nutzung zum Schreiben von Malware	560/832 (67,3 %)
Akteure mit mittlerem+ Risiko zu Beginn des Zeitraums	33 %
Akteure mit mittlerem+ Risiko am Ende des Zeitraums	56 % (+1,7×)
Zerschlagene Spionageoperation	November 2025 — Maximalwert 100/100

Agentic Orchestration — ein Modell, das Angriffsschritte autonom miteinander verknüpft — ist im MITRE-ATT&CK-Framework noch nicht abgedeckt. Anthropic hat Gespräche mit MITRE begonnen, um das Framework weiterzuentwickeln, und veröffentlicht diese Daten im Anschluss an Verizons DBIR-2026-Bericht.

🔗 Anthropic-Bericht — KI-Cyberbedrohungen

Claude Code /fork neu gestaltet — Hintergrundagent mit exaktem Kontext

3. Juni — Anthropic ändert das Verhalten von /fork in Claude Code. Das neue /fork startet einen Hintergrundagenten, der den exakten Kontext der aktuellen Sitzung erbt (System-Prompt, Tools, Verlauf, Modell, Prompt-Cache) und sein Ergebnis in die ursprüngliche Sitzung zurückgibt.

Befehl	Verhalten
`/fork` (neu)	Startet einen Hintergrundagenten mit exaktem Kontext + Prompt-Cache → Ergebnis wird in der Sitzung zurückgegeben
`/branch` (ex-/fork)	Kopiert das Transkript in eine neue, manuell gesteuerte Sitzung

Diese Änderung verankert /fork in der Entwicklung von Claude Code hin zu einem Multi-Agent-Arbeitsmodell.

🔗 Tweet @ClaudeDevs

OpenAI Blueprint — demokratische Governance der Frontier-KI

3. Juni — OpenAI veröffentlicht ein Public-Policy-Dokument („Blueprint“), das beschreibt, wie die Vereinigten Staaten einen nachhaltigen föderalen Rahmen für die Governance von Frontier-KI-Systemen aufbauen können.

Strategie in 3 Schritten:

Nationaler Rahmen — auf dem entstehenden Konsens der bundesstaatlichen Gesetze aufbauen (California SB 53, New York RAISE Act, Illinois SB 315)
Stärkung des CAISI — das Center for AI Safety and Innovation zur wichtigsten föderalen Institution für die Sicherheit von Frontier-KI machen
Nationaler Resilienzplan — die Regierung auf Sicherheits- und öffentliche Gefahren vorbereiten, die durch Frontier-KI entstehen

Der Blueprint folgt auf die am Vortag vom Weißen Haus veröffentlichte Executive Order „Promoting Advanced Artificial Intelligence Innovation and Security“.

🔗 OpenAI Blueprint

Gemini CLI v0.45.0 und kreative Wan-Tools

Gemini CLI v0.45.0

3. Juni — Google veröffentlicht die stabile Version v0.45.0 von Gemini CLI mit einer architektonischen Überarbeitung von ContextManager (Kernkomponente für das Management des Gesprächskontexts), um Robustheit und Leistung zu verbessern.

Funktion	Detail
Context Simplification	Größere Überarbeitung des ContextManager
A2A Usage Metadata	Offenlegung der Metadaten im Agent-to-Agent-Protokoll
Termux-Fixes	Behebung endloser Wiederholungs-Schleifen (Android-Umgebung)
PTY resize	Behebung von Größenänderungsfehlern
Topic updates	Erzwingung sequenzieller Ausführung zur Vermeidung von Konflikten

🔗 Changelog Gemini CLI

Wan — neue Skills Extract Line Art und Render

3. Juni — Wan (Video- und Bildmodell des Alibaba Tongyi Lab) veröffentlicht zwei neue kreative Werkzeuge: Extract Line Art (Umwandlung komplexer Visuals in saubere, präzise Strichzeichnungen) und Render (sofortige Transformation von Strichzeichnungen in fertige Visuals). Beide Skills sind auf create.wan.video/lab/skill verfügbar. Die Ankündigung erzeugte innerhalb weniger Stunden fast 600 000 Aufrufe.

🔗 Ankündigung Wan

GPT-4.1 aus Copilot entfernt — ersetzt durch GPT-5.5

2. Juni — GitHub macht die Deaktivierung von GPT-4.1 in allen GitHub-Copilot-Erfahrungen offiziell (Chat, Inline-Edits, Ask- und Agent-Modi, Code-Vervollständigungen), wirksam seit dem 1. Juni 2026. Die empfohlene Alternative ist GPT-5.5. Enterprise-Administratoren müssen den Zugriff auf GPT-5.5 über die Modellrichtlinien in ihren Copilot-Einstellungen aktivieren. Für die Entfernung von GPT-4.1 ist kein manuelles Eingreifen erforderlich.

🔗 GPT-4.1 veraltet

Copilot Code Review für Azure Repos (technische Vorschau)

2. Juni — GitHub startet in technischer Vorschau Copilot Code Review für Azure Repos. Nutzer können Copilot direkt aus einem Azure-DevOps-Pull-Request heraus um eine Prüfung bitten — Inline-Kommentare, Verbesserungsvorschläge, Problemerkennung. Für Azure-DevOps-Kunden ist keine GitHub-Copilot-Lizenz erforderlich. Die Nutzung wird in GitHub AI Credits abgerechnet, unabhängig von bestehenden Copilot-Plänen.

🔗 Copilot Code Review — Azure Repos

Cohere Co/plot — Open-Source-Visualisierungstool für die KI-Forschung

3. Juni — Cohere Labs veröffentlicht co/plot, ein Open-Source-Tool zur Datenvisualisierung für KI-Forscher. Entstanden aus einem konkreten Bedarf bei der Entwicklung von Tiny Aya (mehrsprachiges Modell für 70+ Sprachen), behebt co/plot die Grenzen von Matplotlib (vollständige Neu-Ausführung bei jeder Änderung) und Figma (von den echten Daten entkoppelt).

Das Tool bietet schnelles Prototyping mit einem vordefinierten und anpassbaren Stil, verankert in echten Daten. Veröffentlicht im Geist der Open Science, ist es unter coplot.vercel.app verfügbar.

🔗 Cohere co/plot

Kurznachrichten

Claude Code v2.1.161 — Neue Version: OTEL_RESOURCE_ATTRIBUTES als Metrik-Labels, unabhängige parallel tool calls bei teilweisem Fehler, verbesserte Linux-Zwischenablage (wl-copy/xclip/xsel), /autofix-pr-Fixes in git worktrees. 🔗 Releases
Anthropic unterstützt die KI-Executive Order — Anthropic begrüßt die EO „Promoting Advanced Artificial Intelligence Innovation and Security“ und kündigt die Zusammenarbeit mit dem Weißen Haus bei deren Umsetzung an. 🔗 Tweet AnthropicAI
GitHub Copilot in Eclipse — BYOK für Business und Enterprise verfügbar, überarbeitete Chat-Oberfläche, Skills und Prompt-Dateien, Thinking Blocks, bessere ABAP-Unterstützung. 🔗 Eclipse changelog
NVIDIA Research CVPR — NVIDIA Research präsentiert auf der CVPR 2026 Arbeiten zu fortgeschrittener Greiftechnik, intelligenter autonomer Fahrt und dem Training von Agenten im großen Maßstab. 🔗 NVIDIA Blog
Fun-Realtime-TTS #1 Speech Arena — Fun-Realtime-TTS von Alibaba (Team TONGYI_SpeechAI) erreicht Platz 1 im Speech Arena Leaderboard von Artificial Analysis (Elo 1 219) und lässt Google Gemini 3.1 Flash TTS sowie Inworld Realtime TTS-2 hinter sich. 🔗 Tweet @Ali_TongyiLab
Go by Gopuff — KI-Shopping-Assistent — Start von „Go by Gopuff“, einem persönlichen Shopping-Assistenten, gemeinsam mit xAI entwickelt und von Grok-Modellen (Text, Audio, Bild) für Expresslieferung in wenigen Minuten angetrieben. 🔗 Ankündigung xAI
OpenAI-Teaser „It’s time to fly.“ — OpenAI veröffentlichte einen angepinnten Tweet „It’s time to fly.“ mit eingebettetem Video (68k+ Aufrufe, repostet von @OpenAIDevs). Zum Zeitpunkt des Scans war keine zugehörige Produktseite verfügbar — eine bevorstehende Ankündigung, die noch nicht veröffentlicht wurde. 🔗 Tweet @OpenAI

Was das bedeutet

Die Open-Source-/Open-Weights-Welle gewinnt weiter an Dynamik. Gemma 4 12B (Apache 2.0, Edge, multimodal) und Ideogram 4.0 (downloadbare Gewichte, freies Fine-Tuning) verkörpern einen strukturellen Trend: Große Teams veröffentlichen konkurrenzfähige Modelle unter permissiver Lizenz und verringern so die Distanz zwischen geschlossenen Angeboten und Open-Source-Alternativen. Für Entwickler markiert der 3. Juni einen seltenen Moment, in dem sowohl ein führendes Vision-Modell als auch ein führendes Bildmodell gleichzeitig ohne kommerzielle Hürden zugänglich werden.

Lokale/Desktop-Agents werden zur neuen Wettbewerbsfront. Perplexity Personal Computer unter Windows — das direkt auf der Maschine läuft — beantwortet eine klare Nachfrage: Unternehmen wollen die Autonomie von Agents, ohne ihre sensiblen Daten in die Cloud zu geben. Co-Scientist von DeepMind zielt auf einzelne Forscher mit einem Partner für wissenschaftliches Denken. Das neu gestaltete Claude Code /fork als Multi-Agent-Hintergrundagent ergänzt dieses Bild: Drei unterschiedliche Ökosysteme (Perplexity, Google, Anthropic) konvergieren auf dasselbe Paradigma — ein Agent, der parallel arbeitet, mit reichhaltigem Kontext und ohne ständige menschliche Eingriffe.

GitHub Copilot baut seinen Vorsprung bei Entwickler-Tools aus. Die Juni-Welle — usage-based Billing GA, Copilot Max, Code Review Medium, JetBrains CLI, Session Sync, BYOK Air-Gapped — ist kein Sammelsurium einzelner Funktionen, sondern eine kohärente Plattform, die auf ein Modell zusteuert: ein einziger Agent, zugänglich aus allen IDEs, allen Maschinen, mit einem Kontrollniveau (MCP, Skills, Denkaufwand), das auf jedes Team zugeschnitten ist. Der Ersatz von GPT-4.1 durch GPT-5.5 fügt sich in diese Logik der kontinuierlichen Aufrüstung ein.

Physical AI und KI-Infrastruktur verankern sich in der Realwirtschaft. Stargate Michigan (1 GW, 2 500 gewerkschaftlich organisierte Jobs, $1 Milliarde prognostizierte Steuereinnahmen) und NVIDIA CVPR 2026 (Alpamayo 2 Super 32B für autonomes Fahren auf Level 4, Physical-AI-Datensätze mit 15 Millionen Downloads) zeigen, dass KI aus dem rein softwarebezogenen Bereich in physisch hochintensive Domänen übergeht — Rechenzentren, autonome Fahrzeuge, Robotik. Die Finanzinstitute (Revolut, Mastercard, Adyen, Stripe) folgen derselben Logik: Foundation Models, trainiert auf ihren proprietären Daten, keine generischen APIs.