Sök

GPT-5.5 Instant ny standardmodell för ChatGPT, Grok 4.3 på xAI:s API, Anthropic x Blackstone enterprise

GPT-5.5 Instant ny standardmodell för ChatGPT, Grok 4.3 på xAI:s API, Anthropic x Blackstone enterprise

ai-powered-markdown-translator

Artikel översatt från fr till sv med gpt-5.4-mini.

Se projektet på GitHub ↗

Fullspäckad vecka: OpenAI skjuter in GPT-5.5 Instant som direkt ersättare för GPT-5.3 för alla ChatGPT-användare, xAI lanserar Grok 4.3 på sitt API med ett sammanhang på en miljon tokens, och Anthropic tillkännager ett nytt enterprise AI-tjänsteföretag med medgrundarna Blackstone, Hellman & Friedman och Goldman Sachs. På verktygssidan tredubblar GitHub sina säkerhets-GA/förhandsversioner via sin MCP-server, Perplexity lanserar en produkt särskilt för finans-team, och Runway visar videogenagenter i realtid genererade från en enda bild.


GPT-5.5 Instant — ny standardmodell för ChatGPT

5 maj — OpenAI ersätter GPT-5.3 Instant med GPT-5.5 Instant som standardmodell för ChatGPT för alla användare. Utrullningen sker över två dagar.

DimensionFörbättring jämfört med GPT-5.3 Instant
Hallucinationer (medicin, juridik, finans)-52,5 %
Felaktiga påståenden (rapporterade av användare)-37,3 %
Svarens utförlighet-30,2 % ord i genomsnitt

Modellen förbättrar också bildanalys, STEM-svar och beslutet att använda webbsökning. Svaren är mer koncisa utan att innehållet går förlorat, med mindre överflödig formatering och färre onödiga följdfrågor.

Minneskällor — OpenAI introducerar “memory sources” i alla ChatGPT-modeller: när ett svar anpassas utifrån sparade minnen, tidigare konversationer eller ansluten Gmail ser användaren exakt vilka källor som använts och kan korrigera eller ta bort dem. Personalisering från tidigare konversationer och filer är först endast tillgängligt för Plus- och Pro-prenumeranter (webb), övriga planer följer senare.

Tillgänglighet:

  • Gradvis utrullning under 2 dagar för alla ChatGPT-användare
  • Tillgänglig via API under aliaset chat-latest
  • GPT-5.3 Instant förblir tillgänglig i 3 månader för betalande prenumeranter

🔗 Officiellt tillkännagivande för GPT-5.5 Instant


Grok 4.3 lanseras på xAI:s API — 1M tokens kontext, #1 agentic tool calling

5 maj — xAI meddelar via X lanseringen av Grok 4.3 på xAI:s API (console.x.ai). Modellen presenteras som den snabbaste och smartaste i serien hittills.

EgenskapVärde
Kontextfönster1 miljon tokens
Benchmark för agentic tool calling#1 (@ArtificialAnlys leaderboard)
Benchmark för instruction following#1 (@ArtificialAnlys leaderboard)
Enterprise-domäner#1 case law och corporate finance (@ValsAI)
TillgänglighetxAI API (console.x.ai) — inte ännu på grok.com

Grok 4.3 is now live on the xAI API. It’s our fastest, most intelligent model to date. It tops the @ArtificialAnlys leaderboards in agentic tool calling and instruction following, and ranks #1 in @ValsAI enterprise domains like case law and corporate finance. Grok 4.3 supports a 1 million token context.

🇸🇪 Grok 4.3 är nu tillgänglig på xAI:s API. Det är vår snabbaste och smartaste modell hittills. Den toppar @ArtificialAnlys-listorna för agentic tool calling och instruction following, och placerar sig som #1 på @ValsAI inom enterprise-domäner som affärsjuridik och företagsfinans. Grok 4.3 stödjer ett sammanhang på en miljon tokens.@xai på X

Tweeten genererade 25,7 miljoner visningar och 6 029 gilla-markeringar. Notera: ingen dedikerad sida på x.ai/news vid tidpunkten för tillkännagivandet — lanseringen gick uteslutande via X.


Anthropic och Blackstone, Hellman & Friedman, Goldman Sachs — nytt enterprise AI-tjänsteföretag

4 maj — Anthropic, Blackstone, Hellman & Friedman och Goldman Sachs tillkännager skapandet av ett nytt enterprise AI-tjänsteföretag, stöttat av ett konsortium av ytterligare alternativa aktörer.

Målet: att rulla ut Claude i stora företags kärnverksamhet för uppgifter som kräver intensiv ingenjörskonst och djup branschkunskap. Enligt Anthropic överstiger enterprise-efterfrågan på Claude vad en enda distributionsmodell kan absorbera.

Den typiska operativa modellen börjar med ett litet team som arbetar nära kunden för att identifiera flaskhalsar, och bygger sedan Claude-agenter anpassade till verksamheten. Det konkreta exemplet som ges: ett nätverk av medicinska kliniker på flera orter där Claude hanterar klinisk dokumentation, repetitiva administrativa uppgifter och samordning mellan specialiteter, vilket låter klinikerna fokusera på patientvården.

Det nya bolaget går med i Claude Partner Network, vid sidan av Accenture, Deloitte och PwC. Det är ett strukturerande steg i Anthropics enterprise-distributionsstrategi: i stället för att endast sälja API-licenser engagerar sig företaget nu i komplexa operativa utrullningar med finansiella toppartner.

🔗 Officiellt tillkännagivande


Claude-agenter för finansiella tjänster och försäkring

5 maj — Anthropic lanserar tio färdiga agentmallar (ready-to-run) för finansiella tjänster och försäkring. Tillgängliga som plugins i Claude Cowork eller Claude Code, eller som fristående Claude Managed Agents på Claude-plattformen.

Research och kundbearbetning:

AgentRoll
Pitch builderMållistor, jämförbara bolag, pitchbooks
Meeting preparerKund- och motpartsbriefar
Earnings reviewerLäser transkriptioner och uppdaterar modeller
Model builderSkapar finansiella modeller från filings och data
Market researcherSektorbevakning och nyhetssammanfattning

Finans och drift:

AgentRoll
Valuation reviewerGranskning av värderingar
General ledger reconcilerAvstämning av huvudbok och beräkningar av NAV
Month-end closerMånadsbokslut och bokföringsjournaler
Statement auditorGranskning av finansiella rapporter
KYC screenerSammanställning av enhetsdossierer och compliance-filtrering

Claude integreras nu i Microsoft Excel, PowerPoint, Word och Outlook (på väg) via tillägg (add-ins). Funktionen Dispatch i Claude Cowork gör det möjligt att tilldela uppgifter via text eller röst varifrån som helst.

Nya datakopplingar: Dun & Bradstreet, Fiscal AI, Financial Modeling Prep, Guidepoint, IBISWorld, SS&C IntraLinks, Third Bridge, Verisk och ett MCP Moody’s (ratings och data för över 6 000 enheter).

Bland de nämnda kunderna: Citadel, FIS, BNY, Carlyle, Mizuho, Travelers, Walleye Capital (100 % av medarbetarna använder Claude Code), Hg, Morningstar, FactSet. Dessa agenter är optimerade för Claude Opus 4.7, som är #1 på benchmarken Vals AI Finance Agent.

🔗 Officiellt tillkännagivande


Perplexity Computer for Professional Finance

5 maj — Perplexity lanserar Computer för professionell finans, en version av Computer särskilt utformad för analys- och investeringsteam: buy-side- och sell-side-analytiker, hedgefonder, private equity.

DimensionVärde
Inkluderade arbetsflöden35 (10 segment)
Integrerade dataleverantörer14 (bland annat Quartr, Fiscal)
Premium MCP-kopplingarMorningstar, PitchBook, Daloopa, Carbon Arc
Tillgängliga plattformarMicrosoft Teams, Agent API
Kommer snartExcel add-in
FinSearchComp T1 benchmark1:a plats (noggrannhet, kostnad, latens)

Team med licensierade abonnemang kan koppla sina egna inloggningsuppgifter via MCP-kopplingar för att få åtkomst till Morningstar, PitchBook, Daloopa och Carbon Arc. Övriga får tillgång till de inbyggda finansverktygen som stöds av 14 dataleverantörer.

Varje numeriskt värde länkas till sin källa: för värden hämtade från SEC-dokument visar Computer beräkningen och pekar på de exakta sidorna i dokumentet. På benchmarken FinSearchComp T1 (tidskritisk datautvinning) placerar sig Perplexity först i noggrannhet, kostnad per korrekt svar och latens — inklusive realtidskurser, kryptopriser och växelkurser.

🔗 Perplexity-blogg — Computer for Professional Finance


Runway Characters — videogenagent i realtid från en enda bild

4 maj — Runway tillkännager Characters, en teknik som gör det möjligt att förvandla en enda bild till en konversationsagent i video i realtid.

MätvärdeVärde
End-to-end-latens1,75 sekunder
Videokvalitet24 fps HD
Krävd bildkälla1 enda bild
Kallstarter60× snabbare (peer-to-peer GPU)

Fördröjningen på 1,75 sekunder mäts från det ögonblick användaren slutar tala till karaktärens första svar. Runway publicerade samtidigt två ingenjörsartiklar: den första beskriver arkitekturen för videogenagenten i realtid, den andra förklarar hur peer-to-peer GPU-infrastrukturen (peer-to-peer) delar upp kallstartstiderna med 60.

Avsedda användningsfall inkluderar konversationsagenter, interaktiva karaktärer i realtid och videogränssnitt för applikationer. Tekniken markerar ett skifte från offline-videorendering till synkron interaktion.

🔗 Runway Characters tillkännagivandetweet


GitHub MCP Server — trefaldigt säkerhetslyft

5 maj — GitHub publicerar samtidigt tre säkerhetsuppdateringar för sin MCP-server, alla genomförda samma dag.

Secret scanning GA

Secret scanning via GitHub MCP Server går till allmän tillgänglighet (ut ur preview sedan mars 2026). I GitHub Copilot CLI installeras det med /plugin install advanced-security@copilot-plugins; i VS Code exponerar pluginen advanced-security kommandot /secret-scanning.

AspektDetalj
StatusGA (allmän tillgänglighet)
TillgänglighetRepositorier med GitHub Secret Protection aktiverat
IntegrationerCopilot CLI, VS Code, alla MCP-kompatibla IDE:er

MCP-verktygen respekterar nu befintliga anpassningar för push protection — bypass-beteendet är konsekvent med inställningen för repository eller organisation.

🔗 Changelog — Secret scanning GA

Dependency scanning i offentlig förhandsversion

Detekteringen av sårbarheter i beroenden via MCP Server går till offentlig förhandsversion. Systemet frågar GitHub Advisory Database och returnerar strukturerade resultat med påverkade paket, allvarlighetsgrad och rekommenderade korrigerade versioner.

AspektDetalj
StatusOffentlig förhandsversion
TillgänglighetRepositorier med Dependabot alerts aktiverat
CLI-aktiveringcopilot --add-github-mcp-toolset dependabot

🔗 Changelog — Dependency scanning

GitHub Advanced Security × Microsoft Defender for Cloud GA

Integrationen GitHub Advanced Security × Microsoft Defender for Cloud går också till GA. Den korrelerar de distribuerade containeravbildningarna i molnmiljö med GitHub-källkoden, och ger runtime-kontext i säkerhetsvyerna.

Nya filter tillgängliga i organisationsvyn: has:deployment, runtime-risk:internet-exposed, runtime-risk:sensitive-data. Säkerhetskampanjer kan tilldelas direkt till GitHub Copilot-kodningsagenten.

🔗 Changelog — Code-to-cloud GA


Model Spec Midtraining (MSM) — agentisk anpassning minskad från 68 % till 5 %

5 maj — Forskare på Anthropic publicerar “Model Spec Midtraining” (MSM), en metod för anpassning som ligger mellan förträning och alignment fine-tuning (alignment fine-tuning, AFT).

Principen: modellerna tränas på ett syntetiskt corpus av dokument som diskuterar innehållet i deras Model Spec innan de lär sig följa reglerna. Tanken är att förstå varför en regel finns förbättrar robustheten i tillämpningen.

ModellFelanpassning (endast AFT)Med MSM + AFT
Qwen2.5-32B68 %5 %
Qwen3-32B54 %7 %

MSM gör också AFT mycket mer dataeffektivt: 40 till 60 gånger mindre AFT-data behövs för att nå jämförbar prestanda. Författarna visar också att det att förklara motiven bakom reglerna (i stället för att stapla fler underrregler) förbättrar generalisering utanför distributionen.

🔗 MSM-artikel — alignment.anthropic.com


NotebookLM Mind Maps — personalisering, organisering, navigering

5 maj — NotebookLM förbättrar sina tankekartor (Mind Maps) med tre funktioner som rullas ut samtidigt.

FunktionBeskrivning
PersonaliseringStyra kartan med specifika användarinstruktioner
OrganiseringByta namn på och dela Mind Map-kartor direkt
NavigeringSmidiga övergångar mellan noderna

Utrullningen sker gradvis för alla användare. Uppdateringen kompletterar serien av snabba förbättringar i NotebookLM sedan början av april: automatisk organisering av källor (24 april, 100 % utrullning nåddes den 5 maj), integration i Gemini mobilapp (30 april).

🔗 NotebookLM-tweet


Genspark sb-git — Git-server omskriven för AI-agenter

5 maj — Genspark lanserar sb-git, en Git-server omskriven från grunden för AI-agenter. Full Git-semantik: versionshantering, grenar, diff, blame, rollback och push.

AspektDetalj
CLIgsk (init, clone-url, cat, commit)
KompatibilitetClaude Code, OpenClaw, alla Git-agenter
Lagring1 GB (gratis), 10 GB (Plus/Pro)
Konto krävsNej — inget GitHub-konto behövs
TillgänglighetOmedelbar (webb + mobil)

Inget GitHub-konto krävs, ingen förkonfiguration av repository behövs. Fokus ligger på kompatibilitet med vanliga AI-agenter (Claude Code, OpenClaw) utan installationsfriktion.

🔗 Genspark sb-git-tweet


NVIDIA + ServiceNow — Project Arc, autonom långkörande desktop-agent

5 maj — På ServiceNow-konferensen Knowledge 2026 tillkännagav Jensen Huang och Bill McDermott en utvidgning av sitt partnerskap kring autonoma AI-agenter i företagsmiljö.

ServiceNow lanserar Project Arc, en autonom långkörande desktop-agent utformad för kunskapsarbetare: utvecklare, IT-team, administratörer. Agenten använder NVIDIA OpenShell (sandbox med öppen källkod) för styrning och säkerhet, och ansluter nativt till ServiceNow-plattformen via ServiceNow Action Fabric.

MätvärdeVärde
Blackwell-effektivitet jämfört med Hopper50× tokens/watt
Minskning av kostnad per miljon tokens~35×
Nemotron 3 Super (öppen källkod)#1 EnterpriseOps-Gym (NOWAI-Bench)
Autonomt lösta ärenden90 % (ServiceNow + Apriel/Nemotron)

🔗 NVIDIA Blogg — ServiceNow


NVIDIA NemoClaw + OpenClaw — ihållande open source-agent som går förbi React på GitHub

30 april — OpenClaw (skapad av Peter Steinberger) passerade 250 000 GitHub-stjärnor på 60 dagar och gick därmed förbi React för att bli den mest stjärnmärkta projektet på plattformen. NVIDIA samarbetar med communityn för att säkra detta ihållande, self-hosted AI-agentprojekt.

NVIDIA lanserar NemoClaw, en referensimplementation som kan installeras med ett enda kommando och som kombinerar OpenClaw + NVIDIA OpenShell + Nemotron med säkerhetskonfigurationer som stärker standardläget.

MätvärdeVärde
GitHub-stjärnor OpenClaw250 000+ (mars 2026)
Tillväxt#1 GitHub-projekt på 60 dagar (slår React)
Multiplikator för agentinferens vs resonemangs-IA1 000×
Installation av NemoClaw1 enda kommando

🔗 NVIDIA-blogg — OpenClaw/NemoClaw


Luma AI Uni-1.1 API — bildgenerering som resonerar kring kreativa briefar

5 maj — Luma AI lanserar Uni-1.1 API, en modell för bildgenerering som är utformad för att resonera kring kreativa briefar snarare än tokens. Till skillnad från traditionella API:er som kräver prompt engineering förstår Uni-1.1 det estetiska sammanhanget i varje visuell tradition och levererar användbara resultat redan vid första försöket.

Angivna användningsfall: modeverktyg, arkitekturrenderingar, manga-pipelines, filmiskt innehåll. Ingen middleware krävs. API:et finns tillgängligt på lumalabs.ai/api.

🔗 Luma AI Uni-1.1-tweeten


ChatGPT Ads Manager self-serve och CPC-budgivning

5 maj — OpenAI utökar sitt annonsprogram med två nyheter: ett self-serve-verktyg (Ads Manager, i beta i USA) och lanseringen av CPC-budgivningsläget (kostnad per klick).

LägeStatusBeskrivning
CPM (kostnad per tusen visningar)BefintligtTillgängligt sedan programmets lansering
CPC (kostnad per klick)NyttAnnonsören betalar endast vid faktiskt klick
Ads Manager self-serve (beta)NyttTillgängligt för amerikanska annonsörer

Byråpartners: Dentsu, Omnicom, Publicis, WPP. Teknikpartners: Adobe, Criteo, Kargo, Pacvue, StackAdapt. OpenAI har också lanserat en Conversions API och pixelspårning för att mäta efterklickshändelser utan att exponera enskilda konversationer för annonsörer.

🔗 OpenAI:s annonsmeddelande


Perplexity Premium Health Sources

5 maj — Perplexity lanserar Premium Health Sources. Mer än en av tio sökningar på plattformen gäller hälsa. De källor som finns vid lanseringen är NEJM, BMJ Journals och BMJ Best Practice — medicinska referenser som vanligtvis är reserverade för institutionella abonnemang.

I Computer aktiveras dessa källor automatiskt för hälsorelaterade frågor utan manuell urval. Varje svar innehåller spårbara citat. Kommande källor: Micromedex, EBSCOhost, Health Affairs, VisualDx, American Academy of Orthopaedic Surgeons, American Diabetes Association, Springer Publishing.

🔗 Perplexity-bloggen — Premium Health Sources


Kortnyheter

  • Manus — Automatisk rekommendation av kopplingar — Manus upptäcker nu vilken koppling (Slack, Notion, Gmail, Google Drive) som behövs för att utföra en uppgift och rekommenderar den i konversationen, utan att lämna tråden. Aktiveringen kräver fortfarande användarens bekräftelse. 🔗 källa

  • Black Forest Labs — FLUX Creator Program — BFL öppnar ett selektivt program för skapare för tidig åtkomst till kommande FLUX-modeller, med förstärkning av deras arbeten via BFL:s kanaler. 🔗 källa

  • GPT-5.5 Instant System Card — Första System Card för Instant-serien som klassificeras som “High capability” i kategorierna Cybersäkerhet och Biologi & Kemi i OpenAIs Preparedness Framework. Förstärkta skyddsåtgärder har implementerats därefter. 🔗 källa

  • OpenAI — WebRTC relay+transceiver-arkitektur — OpenAI publicerar en ingenjörsartikel som beskriver ombyggnaden av sin WebRTC-infrastruktur för realtidsröst (ChatGPT Voice, Realtime API), som betjänar mer än 900 miljoner veckovisa användare. Arkitekturen separerar paketrouting (lättviktig, tillståndslös relay) från protokollavslutning (transceiver, med tillstånd), vilket möjliggör en standardiserad Kubernetes-distribution med ett reducerat offentligt UDP-avtryck. 🔗 källa


Vad det betyder

Finans som AI-företagsvärldens främsta lekplats. Inom loppet av 24 timmar publicerade Anthropic, Perplexity och xAI varsin tillkännagivande som uttryckligen riktade sig till finans-team: tio Claude-agentmallar (värdering, KYC, månadsavslut), Computer for Professional Finance med 35 arbetsflöden och 14 dataleverantörer, samt Grok 4.3 som rankas #1 på Vals AI-benchmarken inom företagsfinans och case law. Konvergensen är ingen slump — finans kombinerar stora volymer strukturerade dokument, krav på precision och tolerans för kostnaderna för premiumverktyg, vilket gör området idealiskt för de första driftsättningarna av autonoma agenter med högt affärsvärde.

Kapplöpningen om standardmodellerna. GPT-5.5 Instant minskar hallucinationerna med 52,5 % jämfört med sin närmaste föregångare, och Grok 4.3 når ett kontextfönster på en miljon tokens med uppmätt och publicerad agentisk prestanda. Båda modellerna lanseras samma dag. Frågan handlar inte längre bara om att publicera de bästa akademiska benchmarkresultaten, utan om att vara den modell som laddas som standard i konsumentgränssnitt (ChatGPT) eller aktiveras först i utvecklarpipelines (xAI API).

MCP som säkerhetsstandard för utvecklare. GitHub publicerade samtidigt tre säkerhetsuppdateringar via sin MCP-server (secret scanning GA, dependency scanning i förhandsvisning, code-to-cloud GA). Denna samordnade utrullning förvandlar GitHubs MCP-server till en inbyggd säkerhetsintegrationskanal för kodningsagenter — Copilot CLI, VS Code och alla MCP-kompatibla IDE:er kan nu skanna hemligheter och sårbara beroenden före varje commit, direkt i agentarbetsflödet.

Permanenta agenter och realtidsinfrastruktur. Runway Characters (videoagent med 1,75 s latens från en bild), ServiceNow Project Arc (långkörande desktop-agent), OpenClaw/NemoClaw (250 000 GitHub-stjärnor, 1 000× mer inferreringsbehov än resonemangs-IA) och Genspark sb-git (Git omskrivet för agenter) signalerar alla samma skifte: AI-agenter lämnar den punktvisa frågeeran och går in i den persistenta processernas era, med radikalt olika infrastrukturbehov — tillståndslagring, realtidslatens, inbyggd versionshantering.


Källor