OpenAI tar in 122 miljarder dollar, Qwen3.5-Omni och 15 dolda funktioner i Claude Code

Tre tillkännagivanden dominerar månadsslutet: OpenAI avslutar den största privata finansieringsrundan i techhistorien med 122 miljarder dollar och en värdering på 852 miljarder, Qwen tar ett steg framåt med en inbyggd omnimodal modell som kan se, höra och koda samtidigt, och ansvarig för Claude Code publicerar en viral tråd som avslöjar 15 mindre kända funktioner i verktyget. Veckan präglas också av lanseringen av Perplexitys Secure Intelligence Institute, nya verktyg i GitHub Copilot och infrastrukturinitiativ hos Runway och NVIDIA.

OpenAI tar in 122 miljarder dollar

31 mars — OpenAI meddelar stängningen av sin senaste finansieringsrunda med 122 miljarder dollar i åtaget kapital, för en post-money värdering på 852 miljarder dollar. Det är en av de största privata finansieringsrundorna i techhistorien.

Rundan leds gemensamt av SoftBank och a16z, med strategiskt deltagande från Amazon, NVIDIA och Microsoft. För första gången har OpenAI utökat deltagandet till individuella investerare via banker, och samlade in mer än 3 miljarder dollar från privatpersoner. ARK Invest kommer också att inkludera OpenAI i flera börshandlade indexfonder (Exchange-Traded Funds / ETF).

Som stöd för denna finansiering publicerar OpenAI tillväxtmetrik:

Indikator	Värde
Aktiva ChatGPT-användare per vecka	900 miljoner
Betalande ChatGPT-abonnenter	50 miljoner
Månadsintäkter	2 miljarder dollar
Tokens behandlade av API (per minut)	15 miljarder
Veckovisa Codex-användare	2 miljoner (+5× på 3 månader)
Månads-tillväxt för Codex	+70%

Företaget beskriver en färdplan centrerad kring en “AI superapp”: ett enhetligt gränssnitt som samlar ChatGPT, Codex, webbsökning och agent-IA. Målet som kommuniceras är att överstiga en miljard aktiva användare per vecka. Företagskunder står redan för 40 % av intäkterna.

GPT-5.4, OpenAIs senaste modell, beskrivs ge förbättringar i resonemang, kodning och i agentiska arbetsflöden (agentic workflows). OpenAIs tillväxt presenteras som fyra gånger snabbare än Googles och Metas i motsvarande fas.

🔗 Officiellt meddelande från OpenAI

Qwen3.5-Omni: inbyggd omnimodal modell

29 mars — Alibaba Qwen lanserar Qwen3.5-Omni, en modell designad nativt för att hantera text, bilder, ljud och video i en och samma enhet. Till skillnad från klassiska multimodala tillvägagångssätt som lägger till modaliteter i lager, behandlar denna modell dessa ingångar samtidigt.

De råa kapaciteterna är betydande: upp till 10 timmars ljud eller 400 sekunder video i 720p nativt, tränad på mer än 100 miljoner timmar data, taligenkänning på 113 språk och uttryck på 36 språk.

Flaggskeppsfunktion: Audio-Visual Vibe Coding

Den mest direkt användbara funktionen är “Audio-Visual Vibe Coding”: användaren beskriver sitt projekt högt framför en kamera, och Qwen3.5-Omni-Plus genererar en fungerande webbplats eller ett spel. Det är en tillämpning av konceptet kodning via intention (vibe coding) utvidgat till ljud och video i realtid.

Jämförande prestanda

Kategori	Qwen3.5-Omni-Plus	Gemini 3.1 Pro
DailyOmni (audio/vision)	84,6	82,7
WorldScene	62,8	65,5
QualocommInteractive	68,5	52,3
OmniClear	64,8	55,5
IFEval (text)	89,7	93,5
MMLU-Redux	94,2	90,0

Modellen presterar bättre än Gemini 3.1 Pro på ljudbenchmarks och är likvärdig på audio-visuell förståelse.

Röstkapaciteter

Finkornig röstkontroll: justering av känsla, takt och volym i realtid
Röstkloning (Voice Cloning) från ett kort prov (ingenjörsdistribution annonserad snart)
Intelligent talartur (Semantic Interruption) som förstår den verkliga avsikten och ignorerar omgivande ljud
Integrerad webbsökning och komplexa function calls

Modellfamilj

Variant	Positionering
Qwen3.5-Omni-Plus	SOTA-prestanda, detaljerad audio-visuell captioning
Qwen3.5-Omni-Plus-Realtime	Voice Control, WebSearch, Voice Clone, Semantic Interruption
Qwen3.5-Omni-Flash	Hastighet
Qwen3.5-Omni-Light	Lättvikts

Åtkomst via chat.qwen.ai (knapparna VoiceChat/VideoChat) och Alibaba Clouds API.

Kompletterande not: Qwen 3.6 Plus Preview finns gratis på OpenRouter under en begränsad tid — interaktionerna samlas in under perioden för att förbättra modellen.

🔗 Tweet @Alibaba_Qwen

15 dolda funktioner i Claude Code

30 mars — Boris Cherny, ansvarig för Claude Code på Anthropic, publicerade en tråd som avslöjar 15 svagt dokumenterade funktioner i verktyget. Tråden nådde 3,6 miljoner visningar, 2 000 delningar och 22 000 likes.

“I wanted to share a bunch of my favorite hidden and under-utilized features in Claude Code. I’ll focus on the ones I use the most. Here goes.”

🇸🇪 Jag ville dela några av mina favoritfunktioner som är lite kända och underutnyttjade i Claude Code. Jag kommer att fokusera på dem jag använder mest. Nu kör vi. — @bcherny på X

Mobilitet och fjärrsessioner

Claude-appen på iOS och Android inkluderar en flik Code som låter dig koda från din telefon
--teleport (eller /teleport) gör det möjligt att byta en molnsession till en lokal maskin; /remote-control låter dig styra en lokal session från vilken enhet som helst
Cowork Dispatch: säker fjärrstyrning av Claude Desktop App från mobilen, med åtkomst till MCP (Model Context Protocol), webbläsaren osv.

Automatisering

/loop och /schedule gör det möjligt att starta Claude automatiskt med bestämda intervall, upp till en vecka — Cherny använder /loop 5m /babysit för kontinuerliga automatiska kodgranskningar och rebase
Hooks (SessionStart, PreToolUse, etc.) låter dig injicera deterministisk logik i agentens cykel, till exempel för att routa tillståndsfrågor till WhatsApp

Parallellisering

/batch distribuerar arbete till tiotals, hundratals eller till och med tusentals agenter parallellt — användbart för storskaliga kodmigreringar
claude -w startar parallella sessioner i separata git worktrees

Daglig produktivitet

/btw tillåter att ställa en snabb fråga medan en agent arbetar, utan att avbryta pågående uppgift
/branch låter dig fork:a en session; eller via CLI: claude --resume <session-id> --fork-session
--agent gör det möjligt att definiera anpassade agenter i .claude/agents/ med ett promptsystem och konfigurerbara verktyg
--add-dir / /add-dir ger Claude åtkomst till flera mappar eller repo samtidigt
--bare snabbar upp SDK-uppstart upp till 10× (undviker laddning av CLAUDE.md, inställningar och MCP-servrar)
/voice aktiverar röstinmatning (mellanslag i CLI, dedikerad knapp i Desktop, diktering på iOS)
Chrome-extension (beta): Claude Code + Chrome för att testa webbappar, debugga console logs och automatisera webbläsaren

🔗 Hela tråden @bcherny

Claude Code: auto mode utvidgat till Enterprise och API

30 mars — Auto mode i Claude Code, lanserat 24 mars för Pro- och Max-användare, finns nu tillgängligt på Enterprise-planen och för utvecklare som använder API:et. Denna funktion låter Claude själv fatta beslut om att godkänna åtgärder (skriva filer, köra bash-kommandon) istället för att fråga användaren vid varje steg.

För att aktivera i en Enterprise- eller API-miljö:

claude --enable-auto-mode

Auto mode bygger på interna klassificerare som bedömer risken för varje åtgärd innan den utförs, och erbjuder en balans mellan det permissiva läget (--dangerously-skip-permissions) och manuella godkännanden.

30 mars — Cowork Dispatch kan nu starta kodningsuppgifter med en specifik modell, angiven direkt i naturligt språk i instruktionen.

🔗 Tweet @claudeai

Perplexity lanserar Secure Intelligence Institute

31 mars — Perplexity lanserar Secure Intelligence Institute (SII), ett forskningslaboratorium dedikerat till säkerhet, sekretess och trygghet för avancerade AI-system. Institutet leds av Dr. Ninghui Li — Samuel D. Conte Professor vid Purdue University, ACM- och IEEE-fellow, tidigare ordförande för ACM SIGSAC — med akademiska partners inkluderande Dan Bonehs grupp för tillämpad kryptografi och Neil Gongs Gong Lab.

SII publicerar tre första arbeten:

Publikation	Typ	Beskrivning
BrowseSafe	Open-source benchmark	14 700+ verkliga attackscenarier, 14 riskkategorier för AI-browsing
Säkring av agenters NIST/CAISI	Policy	Svar på RFI (Request for Information) om säkring av autonoma agenter
Building Security Into Comet	Arkitektur	Djupförsvar för AI-browsaren Comet

SII omvandlar sin forskning till konkreta förbättringar i Perplexitys system och delar arbetet med AI-ekosystemet.

🔗 Secure Intelligence Institute

Cohere och Ensemble: LLM specialiserat på Revenue Cycle Management för vården

31 mars — Cohere och Ensemble tillkännager bygget av det första stora native LLM:et för Revenue Cycle Management (RCM) i den amerikanska vårdsektorn.

Ensemble erbjuder en end-to-end-lösning för sjukhus och medicinska grupper, från bokning till slutlig fakturering. Till skillnad från konkurrenter som kapslar in generella LLM i specialiserade prompts, är denna modell helt skräddarsydd på Cohere-familjen Command.

Domän	Kapacitet
Finansiellt	Förutsägelse av avslag före inlämning, kontinuerlig kvalitetskontroll av fakturering
Kliniskt	Dokumentationshjälp vid vårdplats, sammanställning av ärendedossier
Agentiskt	Orkestrering av flerstegiga RCM-processer

Modellen tränades på Cohere-pretrainingdata, Ensembles operationella loggar, offentliga RCM-källor och expertannoteringar. Ett domänspecifikt benchmark tas fram gemensamt för att mäta prestandan mot generella LLM på verkliga RCM-uppgifter.

🔗 Cohere-bloggen

GitHub Copilot: agent-first utveckling och Slack-integration

31 mars — Tyler McGoffin, senior researcher på Copilot Applied Science-teamet hos GitHub, delar erfarenheter från bygget av ett internt verktyg där Copilot är huvudsaklig kodningsagent. Verktyget automatiserar analys av agenters beteenden på benchmarks som TerminalBench2 och SWEBench-Pro.

Beskrivna praxis: användning av läget /plan innan kodning, skapande av “contract tests” som bara en människa kan ändra, detaljerade prompts istället för korta, och veckovis automatisk underhåll via /plan Review the code for any missing tests.... Slutsatsen: goda ingenjörsegenskaper (planering, kontext, kommunikation) är desamma för effektivt samarbete med en IA-agent.

30 mars — GitHub-appen för Slack integrerar nu Copilot för att skapa GitHub-issues direkt från Slack i naturligt språk. Skriv @GitHub i valfri kanal och beskriv arbetet.

Funktion	Detalj
Skapande i naturligt språk	Beskrivning → strukturerade issues (titel, kropp, assignade, labels, milestones)
Under-issues	Bryt ner arbete i parent/child-issues från ett enda meddelande
Konversationsläge	Iterera på issue innan skapande

31 mars — GitHub presenterar Copilot SDK för att integrera agentiska arbetsflöden i tredjepartsapplikationer enligt tre arkitekturmodeller.

🔗 GitHub-bloggen - Agent-driven development 🔗 GitHub Changelog - Skapa issues från Slack

Runway: investeringsfond och startup-program

31 mars — Runway lanserar två parallella initiativ.

Runway Fund är en investeringsfond för early-stage-startups inom AI, media och världssimulering. Initialt åtagande upp till 10 miljoner dollar, med investeringar upp till 500 000 dollar i pre-seed/seed. Fokus på tre områden: AI-forskning (världsmodeller och generativ AI), nya applikationer (applikationslager ovanpå LLMs) och nya medier/innehåll. Investeringar har redan gjorts i Cartesia, LanceDB och Tamarind Bio.

Runway Builders är ett acceleratorprogram för startups från seed till Serie C som bygger produkter med generativ video och realtidskonverserande AI. Deltagarna får API-krediter, högsta rate limits och åtkomst till ett privat community.

🔗 Runway Fund 🔗 Runway Builders

NVIDIA och Emerald AI: flexibla AI-fabriker på elnätet

31 mars — NVIDIA och Emerald AI presenterar på CERAWeek ett nytt angreppssätt för AI-fabriker: att behandla dem som flexibla tillgångar i elnätet snarare än statiska laster. Arkitekturen bygger på NVIDIA Vera Rubin DSX och Emerald AI:s plattform Conductor.

Energipartners som annonserats: AES, Constellation, Invenergy, NextEra Energy, Nscale Energy och Vistra. Relaterade tillkännagivanden:

Maximo: robotiserad solinstallationsanläggning på 100 MW i drift i Bellefield med NVIDIA Isaac Sim
TerraPower + SoftServe: digital twin i NVIDIA Omniverse för att minska projekttider för Natrium-kärnkraftverk
Adaptive Construction Solutions: nationellt utbildningsprogram för byggande av AI-fabriker
GE Vernova, Schneider Electric, Vertiv: validerade reference designs för Vera Rubin

Jensen Huang beskriver energi som grundlagret i en “femlagers AI-tårta” (five-layer AI cake).

🔗 NVIDIA-bloggen - AI Factories

Kort

Gemini Live på Gemini 3.1 Flash Live — 30 mars — Google bekräftar utrullningen av modellen Gemini 3.1 Flash Live i appen Gemini Live, tillgänglig för alla användare. Denna övergång (tillkännagiven 26 mars) ger mer naturliga röstkonversationer och bättre noggrannhet i bullriga miljöer. 🔗 Tweet @GeminiApp

Manus: kontroll från telefon för Desktop — 30 mars — Manus lägger till möjligheten att styra Desktop-appen från sin smartphone: starta uppgifter, få åtkomst till filer och starta arbetsflöden utan att röra datorn. 🔗 Tweet @ManusAI

Midjourney V8 teaser — 29 mars — David Holz (grundare av Midjourney) tillkännager en version som är “radikalt annorlunda” av V8, “kommer mycket snart”. Ingen datum angivet. 🔗 Tweet @DavidSHolz

Claude Code v2.1.87 — Fixar en bugg i Cowork Dispatch där meddelanden inte levererades. 🔗 CHANGELOG GitHub

Vad det betyder

OpenAIs finansieringsrunda till en värdering på 852 miljarder markerar en vändpunkt: vid sådana siffror vidgas gapet mellan de ledande aktörerna och resten av sektorn på ett strukturellt sätt. Med 900 miljoner veckovisa användare och ett mål på en miljard framstår ChatGPT som en massinfrastruktur, inte bara en teknologiprodukt.

Lanseringen av Qwen3.5-Omni illustrerar den ökande konkurrensen kring omnimodala modeller. Audio-Visual Vibe Coding representerar en konkret utveckling av kodning efter intention (vibe coding) — att gå från text till röst och video som huvudsakligt gränssnitt till generativ AI.

När det gäller utvecklarverktyg avslöjar Boris Chernys tråd att Claude Code har samlat avancerade funktioner (massiv parallellisering med /batch, automatisering via hooks, distribuerade sessioner) som förblev okända på grund av brist på synlig dokumentation. Utvidgningen av auto mode till Enterprise-planerna följer en klassisk bana: verifiering i preview, följt av successiv utrullning.

Slutligen signalerar skapandet av Secure Intelligence Institute av Perplexity och Cohere:s initiativ inom sjukvården en trend: aktörer i andra ledet försöker särskilja sig på specialiserade vertikaler (AI-säkerhet, reglerad vård) snarare än att konkurrera rakt på sak med generella modeller.

Källor

Detta dokument har översatts från fr-versionen till språket sv med hjälp av modellen gpt-5-mini. För mer information om översättningsprocessen, se https://gitlab.com/jls42/ai-powered-markdown-translator