GPT-5.5 Instant ny standardmodell för ChatGPT, Grok 4.3 på xAI:s API, Anthropic x Blackstone enterprise

Fullspäckad vecka: OpenAI skjuter in GPT-5.5 Instant som direkt ersättare för GPT-5.3 för alla ChatGPT-användare, xAI lanserar Grok 4.3 på sitt API med ett sammanhang på en miljon tokens, och Anthropic tillkännager ett nytt enterprise AI-tjänsteföretag med medgrundarna Blackstone, Hellman & Friedman och Goldman Sachs. På verktygssidan tredubblar GitHub sina säkerhets-GA/förhandsversioner via sin MCP-server, Perplexity lanserar en produkt särskilt för finans-team, och Runway visar videogenagenter i realtid genererade från en enda bild.

GPT-5.5 Instant — ny standardmodell för ChatGPT

5 maj — OpenAI ersätter GPT-5.3 Instant med GPT-5.5 Instant som standardmodell för ChatGPT för alla användare. Utrullningen sker över två dagar.

Dimension	Förbättring jämfört med GPT-5.3 Instant
Hallucinationer (medicin, juridik, finans)	-52,5 %
Felaktiga påståenden (rapporterade av användare)	-37,3 %
Svarens utförlighet	-30,2 % ord i genomsnitt

Modellen förbättrar också bildanalys, STEM-svar och beslutet att använda webbsökning. Svaren är mer koncisa utan att innehållet går förlorat, med mindre överflödig formatering och färre onödiga följdfrågor.

Minneskällor — OpenAI introducerar “memory sources” i alla ChatGPT-modeller: när ett svar anpassas utifrån sparade minnen, tidigare konversationer eller ansluten Gmail ser användaren exakt vilka källor som använts och kan korrigera eller ta bort dem. Personalisering från tidigare konversationer och filer är först endast tillgängligt för Plus- och Pro-prenumeranter (webb), övriga planer följer senare.

Tillgänglighet:

Gradvis utrullning under 2 dagar för alla ChatGPT-användare
Tillgänglig via API under aliaset chat-latest
GPT-5.3 Instant förblir tillgänglig i 3 månader för betalande prenumeranter

🔗 Officiellt tillkännagivande för GPT-5.5 Instant

Grok 4.3 lanseras på xAI:s API — 1M tokens kontext, #1 agentic tool calling

5 maj — xAI meddelar via X lanseringen av Grok 4.3 på xAI:s API (console.x.ai). Modellen presenteras som den snabbaste och smartaste i serien hittills.

Egenskap	Värde
Kontextfönster	1 miljon tokens
Benchmark för agentic tool calling	#1 (@ArtificialAnlys leaderboard)
Benchmark för instruction following	#1 (@ArtificialAnlys leaderboard)
Enterprise-domäner	#1 case law och corporate finance (@ValsAI)
Tillgänglighet	xAI API (console.x.ai) — inte ännu på grok.com

Grok 4.3 is now live on the xAI API. It’s our fastest, most intelligent model to date. It tops the @ArtificialAnlys leaderboards in agentic tool calling and instruction following, and ranks #1 in @ValsAI enterprise domains like case law and corporate finance. Grok 4.3 supports a 1 million token context.

🇸🇪 Grok 4.3 är nu tillgänglig på xAI:s API. Det är vår snabbaste och smartaste modell hittills. Den toppar @ArtificialAnlys-listorna för agentic tool calling och instruction following, och placerar sig som #1 på @ValsAI inom enterprise-domäner som affärsjuridik och företagsfinans. Grok 4.3 stödjer ett sammanhang på en miljon tokens. — @xai på X

Tweeten genererade 25,7 miljoner visningar och 6 029 gilla-markeringar. Notera: ingen dedikerad sida på x.ai/news vid tidpunkten för tillkännagivandet — lanseringen gick uteslutande via X.

Anthropic och Blackstone, Hellman & Friedman, Goldman Sachs — nytt enterprise AI-tjänsteföretag

4 maj — Anthropic, Blackstone, Hellman & Friedman och Goldman Sachs tillkännager skapandet av ett nytt enterprise AI-tjänsteföretag, stöttat av ett konsortium av ytterligare alternativa aktörer.

Målet: att rulla ut Claude i stora företags kärnverksamhet för uppgifter som kräver intensiv ingenjörskonst och djup branschkunskap. Enligt Anthropic överstiger enterprise-efterfrågan på Claude vad en enda distributionsmodell kan absorbera.

Den typiska operativa modellen börjar med ett litet team som arbetar nära kunden för att identifiera flaskhalsar, och bygger sedan Claude-agenter anpassade till verksamheten. Det konkreta exemplet som ges: ett nätverk av medicinska kliniker på flera orter där Claude hanterar klinisk dokumentation, repetitiva administrativa uppgifter och samordning mellan specialiteter, vilket låter klinikerna fokusera på patientvården.

Det nya bolaget går med i Claude Partner Network, vid sidan av Accenture, Deloitte och PwC. Det är ett strukturerande steg i Anthropics enterprise-distributionsstrategi: i stället för att endast sälja API-licenser engagerar sig företaget nu i komplexa operativa utrullningar med finansiella toppartner.

🔗 Officiellt tillkännagivande

Claude-agenter för finansiella tjänster och försäkring

5 maj — Anthropic lanserar tio färdiga agentmallar (ready-to-run) för finansiella tjänster och försäkring. Tillgängliga som plugins i Claude Cowork eller Claude Code, eller som fristående Claude Managed Agents på Claude-plattformen.

Research och kundbearbetning:

Agent	Roll
Pitch builder	Mållistor, jämförbara bolag, pitchbooks
Meeting preparer	Kund- och motpartsbriefar
Earnings reviewer	Läser transkriptioner och uppdaterar modeller
Model builder	Skapar finansiella modeller från filings och data
Market researcher	Sektorbevakning och nyhetssammanfattning

Finans och drift:

Agent	Roll
Valuation reviewer	Granskning av värderingar
General ledger reconciler	Avstämning av huvudbok och beräkningar av NAV
Month-end closer	Månadsbokslut och bokföringsjournaler
Statement auditor	Granskning av finansiella rapporter
KYC screener	Sammanställning av enhetsdossierer och compliance-filtrering

Claude integreras nu i Microsoft Excel, PowerPoint, Word och Outlook (på väg) via tillägg (add-ins). Funktionen Dispatch i Claude Cowork gör det möjligt att tilldela uppgifter via text eller röst varifrån som helst.

Nya datakopplingar: Dun & Bradstreet, Fiscal AI, Financial Modeling Prep, Guidepoint, IBISWorld, SS&C IntraLinks, Third Bridge, Verisk och ett MCP Moody’s (ratings och data för över 6 000 enheter).

Bland de nämnda kunderna: Citadel, FIS, BNY, Carlyle, Mizuho, Travelers, Walleye Capital (100 % av medarbetarna använder Claude Code), Hg, Morningstar, FactSet. Dessa agenter är optimerade för Claude Opus 4.7, som är #1 på benchmarken Vals AI Finance Agent.

🔗 Officiellt tillkännagivande

Perplexity Computer for Professional Finance

5 maj — Perplexity lanserar Computer för professionell finans, en version av Computer särskilt utformad för analys- och investeringsteam: buy-side- och sell-side-analytiker, hedgefonder, private equity.

Dimension	Värde
Inkluderade arbetsflöden	35 (10 segment)
Integrerade dataleverantörer	14 (bland annat Quartr, Fiscal)
Premium MCP-kopplingar	Morningstar, PitchBook, Daloopa, Carbon Arc
Tillgängliga plattformar	Microsoft Teams, Agent API
Kommer snart	Excel add-in
FinSearchComp T1 benchmark	1:a plats (noggrannhet, kostnad, latens)

Team med licensierade abonnemang kan koppla sina egna inloggningsuppgifter via MCP-kopplingar för att få åtkomst till Morningstar, PitchBook, Daloopa och Carbon Arc. Övriga får tillgång till de inbyggda finansverktygen som stöds av 14 dataleverantörer.

Varje numeriskt värde länkas till sin källa: för värden hämtade från SEC-dokument visar Computer beräkningen och pekar på de exakta sidorna i dokumentet. På benchmarken FinSearchComp T1 (tidskritisk datautvinning) placerar sig Perplexity först i noggrannhet, kostnad per korrekt svar och latens — inklusive realtidskurser, kryptopriser och växelkurser.

🔗 Perplexity-blogg — Computer for Professional Finance

Runway Characters — videogenagent i realtid från en enda bild

4 maj — Runway tillkännager Characters, en teknik som gör det möjligt att förvandla en enda bild till en konversationsagent i video i realtid.

Mätvärde	Värde
End-to-end-latens	1,75 sekunder
Videokvalitet	24 fps HD
Krävd bildkälla	1 enda bild
Kallstarter	60× snabbare (peer-to-peer GPU)

Fördröjningen på 1,75 sekunder mäts från det ögonblick användaren slutar tala till karaktärens första svar. Runway publicerade samtidigt två ingenjörsartiklar: den första beskriver arkitekturen för videogenagenten i realtid, den andra förklarar hur peer-to-peer GPU-infrastrukturen (peer-to-peer) delar upp kallstartstiderna med 60.

Avsedda användningsfall inkluderar konversationsagenter, interaktiva karaktärer i realtid och videogränssnitt för applikationer. Tekniken markerar ett skifte från offline-videorendering till synkron interaktion.

🔗 Runway Characters tillkännagivandetweet

GitHub MCP Server — trefaldigt säkerhetslyft

5 maj — GitHub publicerar samtidigt tre säkerhetsuppdateringar för sin MCP-server, alla genomförda samma dag.

Secret scanning GA

Secret scanning via GitHub MCP Server går till allmän tillgänglighet (ut ur preview sedan mars 2026). I GitHub Copilot CLI installeras det med /plugin install advanced-security@copilot-plugins; i VS Code exponerar pluginen advanced-security kommandot /secret-scanning.

Aspekt	Detalj
Status	GA (allmän tillgänglighet)
Tillgänglighet	Repositorier med GitHub Secret Protection aktiverat
Integrationer	Copilot CLI, VS Code, alla MCP-kompatibla IDE:er

MCP-verktygen respekterar nu befintliga anpassningar för push protection — bypass-beteendet är konsekvent med inställningen för repository eller organisation.

🔗 Changelog — Secret scanning GA

Dependency scanning i offentlig förhandsversion

Detekteringen av sårbarheter i beroenden via MCP Server går till offentlig förhandsversion. Systemet frågar GitHub Advisory Database och returnerar strukturerade resultat med påverkade paket, allvarlighetsgrad och rekommenderade korrigerade versioner.

Aspekt	Detalj
Status	Offentlig förhandsversion
Tillgänglighet	Repositorier med Dependabot alerts aktiverat
CLI-aktivering	`copilot --add-github-mcp-toolset dependabot`

🔗 Changelog — Dependency scanning

GitHub Advanced Security × Microsoft Defender for Cloud GA

Integrationen GitHub Advanced Security × Microsoft Defender for Cloud går också till GA. Den korrelerar de distribuerade containeravbildningarna i molnmiljö med GitHub-källkoden, och ger runtime-kontext i säkerhetsvyerna.

Nya filter tillgängliga i organisationsvyn: has:deployment, runtime-risk:internet-exposed, runtime-risk:sensitive-data. Säkerhetskampanjer kan tilldelas direkt till GitHub Copilot-kodningsagenten.

🔗 Changelog — Code-to-cloud GA

Model Spec Midtraining (MSM) — agentisk anpassning minskad från 68 % till 5 %

5 maj — Forskare på Anthropic publicerar “Model Spec Midtraining” (MSM), en metod för anpassning som ligger mellan förträning och alignment fine-tuning (alignment fine-tuning, AFT).

Principen: modellerna tränas på ett syntetiskt corpus av dokument som diskuterar innehållet i deras Model Spec innan de lär sig följa reglerna. Tanken är att förstå varför en regel finns förbättrar robustheten i tillämpningen.

Modell	Felanpassning (endast AFT)	Med MSM + AFT
Qwen2.5-32B	68 %	5 %
Qwen3-32B	54 %	7 %

MSM gör också AFT mycket mer dataeffektivt: 40 till 60 gånger mindre AFT-data behövs för att nå jämförbar prestanda. Författarna visar också att det att förklara motiven bakom reglerna (i stället för att stapla fler underrregler) förbättrar generalisering utanför distributionen.

🔗 MSM-artikel — alignment.anthropic.com

NotebookLM Mind Maps — personalisering, organisering, navigering

5 maj — NotebookLM förbättrar sina tankekartor (Mind Maps) med tre funktioner som rullas ut samtidigt.

Funktion	Beskrivning
Personalisering	Styra kartan med specifika användarinstruktioner
Organisering	Byta namn på och dela Mind Map-kartor direkt
Navigering	Smidiga övergångar mellan noderna

Utrullningen sker gradvis för alla användare. Uppdateringen kompletterar serien av snabba förbättringar i NotebookLM sedan början av april: automatisk organisering av källor (24 april, 100 % utrullning nåddes den 5 maj), integration i Gemini mobilapp (30 april).

🔗 NotebookLM-tweet

Genspark sb-git — Git-server omskriven för AI-agenter

5 maj — Genspark lanserar sb-git, en Git-server omskriven från grunden för AI-agenter. Full Git-semantik: versionshantering, grenar, diff, blame, rollback och push.

Aspekt	Detalj
CLI	`gsk` (init, clone-url, cat, commit)
Kompatibilitet	Claude Code, OpenClaw, alla Git-agenter
Lagring	1 GB (gratis), 10 GB (Plus/Pro)
Konto krävs	Nej — inget GitHub-konto behövs
Tillgänglighet	Omedelbar (webb + mobil)

Inget GitHub-konto krävs, ingen förkonfiguration av repository behövs. Fokus ligger på kompatibilitet med vanliga AI-agenter (Claude Code, OpenClaw) utan installationsfriktion.

🔗 Genspark sb-git-tweet

NVIDIA + ServiceNow — Project Arc, autonom långkörande desktop-agent

5 maj — På ServiceNow-konferensen Knowledge 2026 tillkännagav Jensen Huang och Bill McDermott en utvidgning av sitt partnerskap kring autonoma AI-agenter i företagsmiljö.

ServiceNow lanserar Project Arc, en autonom långkörande desktop-agent utformad för kunskapsarbetare: utvecklare, IT-team, administratörer. Agenten använder NVIDIA OpenShell (sandbox med öppen källkod) för styrning och säkerhet, och ansluter nativt till ServiceNow-plattformen via ServiceNow Action Fabric.

Mätvärde	Värde
Blackwell-effektivitet jämfört med Hopper	50× tokens/watt
Minskning av kostnad per miljon tokens	~35×
Nemotron 3 Super (öppen källkod)	#1 EnterpriseOps-Gym (NOWAI-Bench)
Autonomt lösta ärenden	90 % (ServiceNow + Apriel/Nemotron)

🔗 NVIDIA Blogg — ServiceNow

NVIDIA NemoClaw + OpenClaw — ihållande open source-agent som går förbi React på GitHub

30 april — OpenClaw (skapad av Peter Steinberger) passerade 250 000 GitHub-stjärnor på 60 dagar och gick därmed förbi React för att bli den mest stjärnmärkta projektet på plattformen. NVIDIA samarbetar med communityn för att säkra detta ihållande, self-hosted AI-agentprojekt.

NVIDIA lanserar NemoClaw, en referensimplementation som kan installeras med ett enda kommando och som kombinerar OpenClaw + NVIDIA OpenShell + Nemotron med säkerhetskonfigurationer som stärker standardläget.

Mätvärde	Värde
GitHub-stjärnor OpenClaw	250 000+ (mars 2026)
Tillväxt	#1 GitHub-projekt på 60 dagar (slår React)
Multiplikator för agentinferens vs resonemangs-IA	1 000×
Installation av NemoClaw	1 enda kommando

🔗 NVIDIA-blogg — OpenClaw/NemoClaw

Luma AI Uni-1.1 API — bildgenerering som resonerar kring kreativa briefar

5 maj — Luma AI lanserar Uni-1.1 API, en modell för bildgenerering som är utformad för att resonera kring kreativa briefar snarare än tokens. Till skillnad från traditionella API:er som kräver prompt engineering förstår Uni-1.1 det estetiska sammanhanget i varje visuell tradition och levererar användbara resultat redan vid första försöket.

Angivna användningsfall: modeverktyg, arkitekturrenderingar, manga-pipelines, filmiskt innehåll. Ingen middleware krävs. API:et finns tillgängligt på lumalabs.ai/api.

🔗 Luma AI Uni-1.1-tweeten

ChatGPT Ads Manager self-serve och CPC-budgivning

5 maj — OpenAI utökar sitt annonsprogram med två nyheter: ett self-serve-verktyg (Ads Manager, i beta i USA) och lanseringen av CPC-budgivningsläget (kostnad per klick).

Läge	Status	Beskrivning
CPM (kostnad per tusen visningar)	Befintligt	Tillgängligt sedan programmets lansering
CPC (kostnad per klick)	Nytt	Annonsören betalar endast vid faktiskt klick
Ads Manager self-serve (beta)	Nytt	Tillgängligt för amerikanska annonsörer

Byråpartners: Dentsu, Omnicom, Publicis, WPP. Teknikpartners: Adobe, Criteo, Kargo, Pacvue, StackAdapt. OpenAI har också lanserat en Conversions API och pixelspårning för att mäta efterklickshändelser utan att exponera enskilda konversationer för annonsörer.

🔗 OpenAI:s annonsmeddelande

Perplexity Premium Health Sources

5 maj — Perplexity lanserar Premium Health Sources. Mer än en av tio sökningar på plattformen gäller hälsa. De källor som finns vid lanseringen är NEJM, BMJ Journals och BMJ Best Practice — medicinska referenser som vanligtvis är reserverade för institutionella abonnemang.

I Computer aktiveras dessa källor automatiskt för hälsorelaterade frågor utan manuell urval. Varje svar innehåller spårbara citat. Kommande källor: Micromedex, EBSCOhost, Health Affairs, VisualDx, American Academy of Orthopaedic Surgeons, American Diabetes Association, Springer Publishing.

🔗 Perplexity-bloggen — Premium Health Sources

Kortnyheter

Manus — Automatisk rekommendation av kopplingar — Manus upptäcker nu vilken koppling (Slack, Notion, Gmail, Google Drive) som behövs för att utföra en uppgift och rekommenderar den i konversationen, utan att lämna tråden. Aktiveringen kräver fortfarande användarens bekräftelse. 🔗 källa
Black Forest Labs — FLUX Creator Program — BFL öppnar ett selektivt program för skapare för tidig åtkomst till kommande FLUX-modeller, med förstärkning av deras arbeten via BFL:s kanaler. 🔗 källa
GPT-5.5 Instant System Card — Första System Card för Instant-serien som klassificeras som “High capability” i kategorierna Cybersäkerhet och Biologi & Kemi i OpenAIs Preparedness Framework. Förstärkta skyddsåtgärder har implementerats därefter. 🔗 källa
OpenAI — WebRTC relay+transceiver-arkitektur — OpenAI publicerar en ingenjörsartikel som beskriver ombyggnaden av sin WebRTC-infrastruktur för realtidsröst (ChatGPT Voice, Realtime API), som betjänar mer än 900 miljoner veckovisa användare. Arkitekturen separerar paketrouting (lättviktig, tillståndslös relay) från protokollavslutning (transceiver, med tillstånd), vilket möjliggör en standardiserad Kubernetes-distribution med ett reducerat offentligt UDP-avtryck. 🔗 källa

Vad det betyder

Finans som AI-företagsvärldens främsta lekplats. Inom loppet av 24 timmar publicerade Anthropic, Perplexity och xAI varsin tillkännagivande som uttryckligen riktade sig till finans-team: tio Claude-agentmallar (värdering, KYC, månadsavslut), Computer for Professional Finance med 35 arbetsflöden och 14 dataleverantörer, samt Grok 4.3 som rankas #1 på Vals AI-benchmarken inom företagsfinans och case law. Konvergensen är ingen slump — finans kombinerar stora volymer strukturerade dokument, krav på precision och tolerans för kostnaderna för premiumverktyg, vilket gör området idealiskt för de första driftsättningarna av autonoma agenter med högt affärsvärde.

Kapplöpningen om standardmodellerna. GPT-5.5 Instant minskar hallucinationerna med 52,5 % jämfört med sin närmaste föregångare, och Grok 4.3 når ett kontextfönster på en miljon tokens med uppmätt och publicerad agentisk prestanda. Båda modellerna lanseras samma dag. Frågan handlar inte längre bara om att publicera de bästa akademiska benchmarkresultaten, utan om att vara den modell som laddas som standard i konsumentgränssnitt (ChatGPT) eller aktiveras först i utvecklarpipelines (xAI API).

MCP som säkerhetsstandard för utvecklare. GitHub publicerade samtidigt tre säkerhetsuppdateringar via sin MCP-server (secret scanning GA, dependency scanning i förhandsvisning, code-to-cloud GA). Denna samordnade utrullning förvandlar GitHubs MCP-server till en inbyggd säkerhetsintegrationskanal för kodningsagenter — Copilot CLI, VS Code och alla MCP-kompatibla IDE:er kan nu skanna hemligheter och sårbara beroenden före varje commit, direkt i agentarbetsflödet.

Permanenta agenter och realtidsinfrastruktur. Runway Characters (videoagent med 1,75 s latens från en bild), ServiceNow Project Arc (långkörande desktop-agent), OpenClaw/NemoClaw (250 000 GitHub-stjärnor, 1 000× mer inferreringsbehov än resonemangs-IA) och Genspark sb-git (Git omskrivet för agenter) signalerar alla samma skifte: AI-agenter lämnar den punktvisa frågeeran och går in i den persistenta processernas era, med radikalt olika infrastrukturbehov — tillståndslagring, realtidslatens, inbyggd versionshantering.