Tre tillkännagivanden dominerar månadsslutet: OpenAI avslutar den största privata finansieringsrundan i techhistorien med 122 miljarder dollar och en värdering på 852 miljarder, Qwen tar ett steg framåt med en inbyggd omnimodal modell som kan se, höra och koda samtidigt, och ansvarig för Claude Code publicerar en viral tråd som avslöjar 15 mindre kända funktioner i verktyget. Veckan präglas också av lanseringen av Perplexitys Secure Intelligence Institute, nya verktyg i GitHub Copilot och infrastrukturinitiativ hos Runway och NVIDIA.
OpenAI tar in 122 miljarder dollar
31 mars — OpenAI meddelar stängningen av sin senaste finansieringsrunda med 122 miljarder dollar i åtaget kapital, för en post-money värdering på 852 miljarder dollar. Det är en av de största privata finansieringsrundorna i techhistorien.
Rundan leds gemensamt av SoftBank och a16z, med strategiskt deltagande från Amazon, NVIDIA och Microsoft. För första gången har OpenAI utökat deltagandet till individuella investerare via banker, och samlade in mer än 3 miljarder dollar från privatpersoner. ARK Invest kommer också att inkludera OpenAI i flera börshandlade indexfonder (Exchange-Traded Funds / ETF).
Som stöd för denna finansiering publicerar OpenAI tillväxtmetrik:
| Indikator | Värde |
|---|---|
| Aktiva ChatGPT-användare per vecka | 900 miljoner |
| Betalande ChatGPT-abonnenter | 50 miljoner |
| Månadsintäkter | 2 miljarder dollar |
| Tokens behandlade av API (per minut) | 15 miljarder |
| Veckovisa Codex-användare | 2 miljoner (+5× på 3 månader) |
| Månads-tillväxt för Codex | +70% |
Företaget beskriver en färdplan centrerad kring en “AI superapp”: ett enhetligt gränssnitt som samlar ChatGPT, Codex, webbsökning och agent-IA. Målet som kommuniceras är att överstiga en miljard aktiva användare per vecka. Företagskunder står redan för 40 % av intäkterna.
GPT-5.4, OpenAIs senaste modell, beskrivs ge förbättringar i resonemang, kodning och i agentiska arbetsflöden (agentic workflows). OpenAIs tillväxt presenteras som fyra gånger snabbare än Googles och Metas i motsvarande fas.
🔗 Officiellt meddelande från OpenAI
Qwen3.5-Omni: inbyggd omnimodal modell
29 mars — Alibaba Qwen lanserar Qwen3.5-Omni, en modell designad nativt för att hantera text, bilder, ljud och video i en och samma enhet. Till skillnad från klassiska multimodala tillvägagångssätt som lägger till modaliteter i lager, behandlar denna modell dessa ingångar samtidigt.
De råa kapaciteterna är betydande: upp till 10 timmars ljud eller 400 sekunder video i 720p nativt, tränad på mer än 100 miljoner timmar data, taligenkänning på 113 språk och uttryck på 36 språk.
Flaggskeppsfunktion: Audio-Visual Vibe Coding
Den mest direkt användbara funktionen är “Audio-Visual Vibe Coding”: användaren beskriver sitt projekt högt framför en kamera, och Qwen3.5-Omni-Plus genererar en fungerande webbplats eller ett spel. Det är en tillämpning av konceptet kodning via intention (vibe coding) utvidgat till ljud och video i realtid.
Jämförande prestanda
| Kategori | Qwen3.5-Omni-Plus | Gemini 3.1 Pro |
|---|---|---|
| DailyOmni (audio/vision) | 84,6 | 82,7 |
| WorldScene | 62,8 | 65,5 |
| QualocommInteractive | 68,5 | 52,3 |
| OmniClear | 64,8 | 55,5 |
| IFEval (text) | 89,7 | 93,5 |
| MMLU-Redux | 94,2 | 90,0 |
Modellen presterar bättre än Gemini 3.1 Pro på ljudbenchmarks och är likvärdig på audio-visuell förståelse.
Röstkapaciteter
- Finkornig röstkontroll: justering av känsla, takt och volym i realtid
- Röstkloning (Voice Cloning) från ett kort prov (ingenjörsdistribution annonserad snart)
- Intelligent talartur (Semantic Interruption) som förstår den verkliga avsikten och ignorerar omgivande ljud
- Integrerad webbsökning och komplexa function calls
Modellfamilj
| Variant | Positionering |
|---|---|
| Qwen3.5-Omni-Plus | SOTA-prestanda, detaljerad audio-visuell captioning |
| Qwen3.5-Omni-Plus-Realtime | Voice Control, WebSearch, Voice Clone, Semantic Interruption |
| Qwen3.5-Omni-Flash | Hastighet |
| Qwen3.5-Omni-Light | Lättvikts |
Åtkomst via chat.qwen.ai (knapparna VoiceChat/VideoChat) och Alibaba Clouds API.
Kompletterande not: Qwen 3.6 Plus Preview finns gratis på OpenRouter under en begränsad tid — interaktionerna samlas in under perioden för att förbättra modellen.
15 dolda funktioner i Claude Code
30 mars — Boris Cherny, ansvarig för Claude Code på Anthropic, publicerade en tråd som avslöjar 15 svagt dokumenterade funktioner i verktyget. Tråden nådde 3,6 miljoner visningar, 2 000 delningar och 22 000 likes.
“I wanted to share a bunch of my favorite hidden and under-utilized features in Claude Code. I’ll focus on the ones I use the most. Here goes.”
🇸🇪 Jag ville dela några av mina favoritfunktioner som är lite kända och underutnyttjade i Claude Code. Jag kommer att fokusera på dem jag använder mest. Nu kör vi. — @bcherny på X
Mobilitet och fjärrsessioner
- Claude-appen på iOS och Android inkluderar en flik Code som låter dig koda från din telefon
--teleport(eller/teleport) gör det möjligt att byta en molnsession till en lokal maskin;/remote-controllåter dig styra en lokal session från vilken enhet som helst- Cowork Dispatch: säker fjärrstyrning av Claude Desktop App från mobilen, med åtkomst till MCP (Model Context Protocol), webbläsaren osv.
Automatisering
/loopoch/schedulegör det möjligt att starta Claude automatiskt med bestämda intervall, upp till en vecka — Cherny använder/loop 5m /babysitför kontinuerliga automatiska kodgranskningar och rebase- Hooks (
SessionStart,PreToolUse, etc.) låter dig injicera deterministisk logik i agentens cykel, till exempel för att routa tillståndsfrågor till WhatsApp
Parallellisering
/batchdistribuerar arbete till tiotals, hundratals eller till och med tusentals agenter parallellt — användbart för storskaliga kodmigreringarclaude -wstartar parallella sessioner i separata git worktrees
Daglig produktivitet
/btwtillåter att ställa en snabb fråga medan en agent arbetar, utan att avbryta pågående uppgift/branchlåter dig fork:a en session; eller via CLI:claude --resume <session-id> --fork-session--agentgör det möjligt att definiera anpassade agenter i.claude/agents/med ett promptsystem och konfigurerbara verktyg--add-dir//add-dirger Claude åtkomst till flera mappar eller repo samtidigt--baresnabbar upp SDK-uppstart upp till 10× (undviker laddning av CLAUDE.md, inställningar och MCP-servrar)/voiceaktiverar röstinmatning (mellanslag i CLI, dedikerad knapp i Desktop, diktering på iOS)- Chrome-extension (beta): Claude Code + Chrome för att testa webbappar, debugga console logs och automatisera webbläsaren
Claude Code: auto mode utvidgat till Enterprise och API
30 mars — Auto mode i Claude Code, lanserat 24 mars för Pro- och Max-användare, finns nu tillgängligt på Enterprise-planen och för utvecklare som använder API:et. Denna funktion låter Claude själv fatta beslut om att godkänna åtgärder (skriva filer, köra bash-kommandon) istället för att fråga användaren vid varje steg.
För att aktivera i en Enterprise- eller API-miljö:
claude --enable-auto-mode
Auto mode bygger på interna klassificerare som bedömer risken för varje åtgärd innan den utförs, och erbjuder en balans mellan det permissiva läget (--dangerously-skip-permissions) och manuella godkännanden.
30 mars — Cowork Dispatch kan nu starta kodningsuppgifter med en specifik modell, angiven direkt i naturligt språk i instruktionen.
Perplexity lanserar Secure Intelligence Institute
31 mars — Perplexity lanserar Secure Intelligence Institute (SII), ett forskningslaboratorium dedikerat till säkerhet, sekretess och trygghet för avancerade AI-system. Institutet leds av Dr. Ninghui Li — Samuel D. Conte Professor vid Purdue University, ACM- och IEEE-fellow, tidigare ordförande för ACM SIGSAC — med akademiska partners inkluderande Dan Bonehs grupp för tillämpad kryptografi och Neil Gongs Gong Lab.
SII publicerar tre första arbeten:
| Publikation | Typ | Beskrivning |
|---|---|---|
| BrowseSafe | Open-source benchmark | 14 700+ verkliga attackscenarier, 14 riskkategorier för AI-browsing |
| Säkring av agenters NIST/CAISI | Policy | Svar på RFI (Request for Information) om säkring av autonoma agenter |
| Building Security Into Comet | Arkitektur | Djupförsvar för AI-browsaren Comet |
SII omvandlar sin forskning till konkreta förbättringar i Perplexitys system och delar arbetet med AI-ekosystemet.
🔗 Secure Intelligence Institute
Cohere och Ensemble: LLM specialiserat på Revenue Cycle Management för vården
31 mars — Cohere och Ensemble tillkännager bygget av det första stora native LLM:et för Revenue Cycle Management (RCM) i den amerikanska vårdsektorn.
Ensemble erbjuder en end-to-end-lösning för sjukhus och medicinska grupper, från bokning till slutlig fakturering. Till skillnad från konkurrenter som kapslar in generella LLM i specialiserade prompts, är denna modell helt skräddarsydd på Cohere-familjen Command.
| Domän | Kapacitet |
|---|---|
| Finansiellt | Förutsägelse av avslag före inlämning, kontinuerlig kvalitetskontroll av fakturering |
| Kliniskt | Dokumentationshjälp vid vårdplats, sammanställning av ärendedossier |
| Agentiskt | Orkestrering av flerstegiga RCM-processer |
Modellen tränades på Cohere-pretrainingdata, Ensembles operationella loggar, offentliga RCM-källor och expertannoteringar. Ett domänspecifikt benchmark tas fram gemensamt för att mäta prestandan mot generella LLM på verkliga RCM-uppgifter.
GitHub Copilot: agent-first utveckling och Slack-integration
31 mars — Tyler McGoffin, senior researcher på Copilot Applied Science-teamet hos GitHub, delar erfarenheter från bygget av ett internt verktyg där Copilot är huvudsaklig kodningsagent. Verktyget automatiserar analys av agenters beteenden på benchmarks som TerminalBench2 och SWEBench-Pro.
Beskrivna praxis: användning av läget /plan innan kodning, skapande av “contract tests” som bara en människa kan ändra, detaljerade prompts istället för korta, och veckovis automatisk underhåll via /plan Review the code for any missing tests.... Slutsatsen: goda ingenjörsegenskaper (planering, kontext, kommunikation) är desamma för effektivt samarbete med en IA-agent.
30 mars — GitHub-appen för Slack integrerar nu Copilot för att skapa GitHub-issues direkt från Slack i naturligt språk. Skriv @GitHub i valfri kanal och beskriv arbetet.
| Funktion | Detalj |
|---|---|
| Skapande i naturligt språk | Beskrivning → strukturerade issues (titel, kropp, assignade, labels, milestones) |
| Under-issues | Bryt ner arbete i parent/child-issues från ett enda meddelande |
| Konversationsläge | Iterera på issue innan skapande |
31 mars — GitHub presenterar Copilot SDK för att integrera agentiska arbetsflöden i tredjepartsapplikationer enligt tre arkitekturmodeller.
🔗 GitHub-bloggen - Agent-driven development 🔗 GitHub Changelog - Skapa issues från Slack
Runway: investeringsfond och startup-program
31 mars — Runway lanserar två parallella initiativ.
Runway Fund är en investeringsfond för early-stage-startups inom AI, media och världssimulering. Initialt åtagande upp till 10 miljoner dollar, med investeringar upp till 500 000 dollar i pre-seed/seed. Fokus på tre områden: AI-forskning (världsmodeller och generativ AI), nya applikationer (applikationslager ovanpå LLMs) och nya medier/innehåll. Investeringar har redan gjorts i Cartesia, LanceDB och Tamarind Bio.
Runway Builders är ett acceleratorprogram för startups från seed till Serie C som bygger produkter med generativ video och realtidskonverserande AI. Deltagarna får API-krediter, högsta rate limits och åtkomst till ett privat community.
🔗 Runway Fund 🔗 Runway Builders
NVIDIA och Emerald AI: flexibla AI-fabriker på elnätet
31 mars — NVIDIA och Emerald AI presenterar på CERAWeek ett nytt angreppssätt för AI-fabriker: att behandla dem som flexibla tillgångar i elnätet snarare än statiska laster. Arkitekturen bygger på NVIDIA Vera Rubin DSX och Emerald AI:s plattform Conductor.
Energipartners som annonserats: AES, Constellation, Invenergy, NextEra Energy, Nscale Energy och Vistra. Relaterade tillkännagivanden:
- Maximo: robotiserad solinstallationsanläggning på 100 MW i drift i Bellefield med NVIDIA Isaac Sim
- TerraPower + SoftServe: digital twin i NVIDIA Omniverse för att minska projekttider för Natrium-kärnkraftverk
- Adaptive Construction Solutions: nationellt utbildningsprogram för byggande av AI-fabriker
- GE Vernova, Schneider Electric, Vertiv: validerade reference designs för Vera Rubin
Jensen Huang beskriver energi som grundlagret i en “femlagers AI-tårta” (five-layer AI cake).
🔗 NVIDIA-bloggen - AI Factories
Kort
Gemini Live på Gemini 3.1 Flash Live — 30 mars — Google bekräftar utrullningen av modellen Gemini 3.1 Flash Live i appen Gemini Live, tillgänglig för alla användare. Denna övergång (tillkännagiven 26 mars) ger mer naturliga röstkonversationer och bättre noggrannhet i bullriga miljöer. 🔗 Tweet @GeminiApp
Manus: kontroll från telefon för Desktop — 30 mars — Manus lägger till möjligheten att styra Desktop-appen från sin smartphone: starta uppgifter, få åtkomst till filer och starta arbetsflöden utan att röra datorn. 🔗 Tweet @ManusAI
Midjourney V8 teaser — 29 mars — David Holz (grundare av Midjourney) tillkännager en version som är “radikalt annorlunda” av V8, “kommer mycket snart”. Ingen datum angivet. 🔗 Tweet @DavidSHolz
Claude Code v2.1.87 — Fixar en bugg i Cowork Dispatch där meddelanden inte levererades. 🔗 CHANGELOG GitHub
Vad det betyder
OpenAIs finansieringsrunda till en värdering på 852 miljarder markerar en vändpunkt: vid sådana siffror vidgas gapet mellan de ledande aktörerna och resten av sektorn på ett strukturellt sätt. Med 900 miljoner veckovisa användare och ett mål på en miljard framstår ChatGPT som en massinfrastruktur, inte bara en teknologiprodukt.
Lanseringen av Qwen3.5-Omni illustrerar den ökande konkurrensen kring omnimodala modeller. Audio-Visual Vibe Coding representerar en konkret utveckling av kodning efter intention (vibe coding) — att gå från text till röst och video som huvudsakligt gränssnitt till generativ AI.
När det gäller utvecklarverktyg avslöjar Boris Chernys tråd att Claude Code har samlat avancerade funktioner (massiv parallellisering med /batch, automatisering via hooks, distribuerade sessioner) som förblev okända på grund av brist på synlig dokumentation. Utvidgningen av auto mode till Enterprise-planerna följer en klassisk bana: verifiering i preview, följt av successiv utrullning.
Slutligen signalerar skapandet av Secure Intelligence Institute av Perplexity och Cohere:s initiativ inom sjukvården en trend: aktörer i andra ledet försöker särskilja sig på specialiserade vertikaler (AI-säkerhet, reglerad vård) snarare än att konkurrera rakt på sak med generella modeller.
Källor
- OpenAI - Påskyndar nästa fas av AI
- Tweet OpenAI - Kapitalanskaffning
- Tweet Alibaba Qwen - Qwen3.5-Omni
- Tråd Boris Cherny - 15 funktioner i Claude Code
- Tweet @claudeai - Auto mode Enterprise
- Tweet @noahzweben - Dispatch-modell
- CHANGELOG Claude Code GitHub
- Perplexity - Secure Intelligence Institute
- Tweet Perplexity - SII
- Cohere-blogg - LLM RCM för sjukvård
- GitHub-blogg - Agentdriven utveckling
- GitHub-changelog - Skapa ärenden från Slack
- Runway Fund
- Runway Builders
- NVIDIA-blogg - AI-fabriker
- Tweet @GeminiApp - Gemini Live 3.1 Flash
- Tweet @ManusAI - Telefonkontroll
- Tweet @DavidSHolz - Midjourney V8
- Tweet @OpenRouter - Qwen 3.6 Plus Preview
Detta dokument har översatts från fr-versionen till språket sv med hjälp av modellen gpt-5-mini. För mer information om översättningsprocessen, se https://gitlab.com/jls42/ai-powered-markdown-translator