GPT-5.4 mini et nano lanserade av OpenAI, Mistral ansluter sig till NVIDIA:s Nemotron Coalition, Perplexity Comet Enterprise tillgängligt

Den 17 mars 2026 präglas av NVIDIA GTC och flera större lanseringar. OpenAI släpper GPT-5.4 mini och nano, sina mest kapabla kompakta modeller hittills, som närmar sig den fullständiga modellen på flera benchmarks. NVIDIA Nemotron Coalition växer med att Mistral AI och Perplexity ansluter sig. Samtidigt öppnar Perplexity Comet Enterprise med fullständig MDM-styrning, Claude Code v2.1.77 dubblar genereringsgränsen för Opus 4.6, och GitHub, Anthropic, Google och OpenAI går samman för att finansiera open source-säkerhet med 12,5 miljoner dollar.

GPT-5.4 mini et nano : les modèles compacts d’OpenAI

17 mars — OpenAI lanserar GPT-5.4 mini och GPT-5.4 nano, sina mest högpresterande kompakta modeller hittills. Dessa två varianter för in GPT-5.4:s kapacitet i format optimerade för högvolymsarbetslaster, med lägre latens och lägre kostnad.

GPT-5.4 mini förbättrar GPT-5 mini avsevärt på kod, resonemang, multimodal förståelse och användning av verktyg, samtidigt som den körs mer än två gånger snabbare. Den närmar sig prestandan hos den fullständiga GPT-5.4-modellen på flera viktiga utvärderingar, inklusive SWE-Bench Pro och OSWorld-Verified.

GPT-5.4 nano är den minsta och billigaste versionen i GPT-5.4-familjen, utformad för uppgifter där snabbhet och kostnad är viktigast: klassificering, dataextraktion, rangordning och enkla kod-subagenter.

Évaluation	GPT-5.4	GPT-5.4 mini	GPT-5.4 nano	GPT-5 mini
SWE-Bench Pro (public)	57,7 %	54,4 %	52,4 %	45,7 %
Terminal-Bench 2.0	75,1 %	60,0 %	46,3 %	38,2 %
Toolathlon	54,6 %	42,9 %	35,5 %	26,9 %
GPQA Diamond	93,0 %	88,0 %	82,8 %	81,6 %
OSWorld-Verified	75,0 %	72,1 %	39,0 %	42,0 %

Användningsfallen delas in i tre register: kodassistenter (GPT-5.4 mini utmärker sig i snabba kodningsflöden, felsökningsloopar, frontend-generering), subagenter (i Codex kan GPT-5.4 delegera deluppgifter till GPT-5.4 mini med endast 30 % av GPT-5.4-kvoten), och gränssnittsstyrning (computer use), där GPT-5.4 mini snabbt tolkar skärmdumpar av täta gränssnitt.

Modèle	Disponibilité	Prix entrée	Prix sortie	Contexte
GPT-5.4 mini	API, Codex, ChatGPT Free/Go	0,75 $/million tokens	4,50 $/million tokens	400 000 tokens
GPT-5.4 nano	API uniquement	0,20 $/million tokens	1,25 $/million tokens	—

I ChatGPT är GPT-5.4 mini tillgänglig för Free- och Go-användare via funktionen “Thinking” i + -menyn. För betalda planer fungerar den som reservmodell när GPT-5.4 Thinking når sin hastighetsgräns.

🔗 Introduktion till GPT-5.4 mini och nano

NVIDIA GTC 2026 : la Nemotron Coalition et Dynamo 1.0

NVIDIAs konferens GTC, som pågick från den 16 mars, blev katalysatorn för flera stora branschnyheter: bildandet av en öppen koalition kring frontier open source-modeller, produktionssättning av ett inferensoperativsystem och tillkännagivandet av en datablå för fysisk AI.

Mistral rejoint la NVIDIA Nemotron Coalition

16 mars — Mistral AI tillkännager ett strategiskt partnerskap med NVIDIA för att samutveckla frontier open source-AI-modeller. Mistral blir grundande medlem i NVIDIA Nemotron Coalition, och kombinerar sin frontier-arkitektur med NVIDIAs beräkningsinfrastruktur och utvecklingsverktyg.

Aspect	Détail
Rôle Mistral	Grundande medlem, frontier-arkitektur + fullstack AI-erbjudande
Apport NVIDIA	GPU-infrastruktur + utvecklingsverktyg
Objectif	Samutveckla öppna modeller på frontier-nivå

🔗 Mistrals tillkännagivande på X

Perplexity rejoint également la coalition

16 mars — Perplexity tillkännager också sin anslutning till samma NVIDIA Nemotron Coalition. Viktiga punkter: Perplexity finjusterar olika öppna modeller för varje steg i sin svarspipeline (frågeanalys, resonemang, slutligt svar). Modellen Nemotron 3 Super (120 miljarder parametrar, MoE-arkitektur) är nu tillgänglig i Perplexitys sökfält, Agent API och Perplexity Computer.

🔗 Perplexitys blogg – Nemotron Coalition 🔗 NVIDIA:s tillkännagivande

Dynamo 1.0 : le système d’exploitation d’inférence passe en production

16 mars — NVIDIA tillkännager på GTC produktionen av Dynamo 1.0, presenterat som “inferensoperativsystemet” (inference operating system) för AI-fabriker (AI factories). Dynamo höjer inferensprestandan på Blackwell-GPU:er med upp till 7x jämfört med icke-optimerade implementationer. Övergången till v1.0 markerar dess resa från experimentell fas till industriell produktion.

🔗 NVIDIA:s tillkännagivande om Dynamo 1.0

Physical AI Data Factory Blueprint

16 mars — NVIDIA avslöjar Physical AI Data Factory Blueprint: en referensarkitektur för att omvandla accelererad beräkning till högkvalitativa träningsdata för robotik, AI-visionsagenter och autonoma fordon. Denna blueprint gör det möjligt för företag att syntetiskt generera träningsdata för fysisk AI i stor skala.

🔗 NVIDIA:s tillkännagivande om Physical AI

Cohere + NVIDIA : IA souveraine sur DGX Spark

16 mars — Cohere och NVIDIA går samman för att utveckla suverän, säker och effektiv AI, även detta tillkännagivet på GTC. Två huvudspår: NVIDIA ecosystem-native-modeller (anpassade modeller optimerade för den senaste NVIDIA-arkitekturen, riktade mot specialiserade enterprise-workloads) och North på DGX Spark (Cohere-agentplattformen North blir tillgänglig på NVIDIA DGX Spark, lokalt och med låg latens för känsliga data). Målsektorerna är finans, hälso- och sjukvård samt offentlig sektor.

🔗 Cohere-bloggen – suverän AI med NVIDIA

Perplexity Comet Enterprise : gouvernance MDM et intégration CrowdStrike

17 mars — Perplexity lanserar Comet Enterprise för alla Enterprise-prenumeranter. AI-webbläsaren går över till företagsversion med fullständig distributionsstyrning.

Fonctionnalité	Description
Déploiement MDM	Tyst installerare, utrullning på tusentals datorer, granskningsloggar
Télémétrie granulaire	Spårning per användare
CrowdStrike Falcon	Skydd mot nätfiske, upptäckt av exfiltrering (skärmdumpar, nedladdningar)
Intervention temps réel	Möjlig via CrowdStrike-integration
Confidentialité	Perplexity tränar aldrig sina modeller på enterprise-data

Bland de första användarna finns företag på Fortune-listan, AWS, AlixPartners, Gunderson Dettmer och Bessemer Venture Partners. De dokumenterade användningsfallen omfattar förberedelse av kundmöten (nyheter i realtid), analys av SOW-kontrakt, finansiella beräkningar och branschforskning.

🔗 Perplexitys blogg – Comet Enterprise

Claude Code v2.1.77 : 64k tokens par défaut pour Opus 4.6

17 mars — Claude Code v2.1.77 släpps med en betydande ökning av genereringsgränserna och flera kritiska buggfixar.

Modèle	Limite par défaut	Limite maximale
Claude Opus 4.6	64 000 tokens	128 000 tokens
Claude Sonnet 4.6	—	128 000 tokens

Standardgränsen för Opus 4.6 fördubblas (från 32k till 64k tokens), vilket möjliggör mycket längre svar utan extra konfiguration.

Nouvelles fonctionnalités :

allowRead i sandboxes: ny konfigurationsinställning för filesystem som gör det möjligt att åter tillåta läsning i områden som omfattas av en denyRead-regel. Användbart för finmaskiga säkerhetskonfigurationer.
/copy N: kommandot /copy accepterar nu ett valfritt index — /copy 2 kopierar det näst föregående svaret från assistenten utan att navigera i historiken.

Corrections notables :

“Always Allow” på sammansatta bash-kommandon: regeln sparades för hela strängen (cd src && npm test) i stället för per underkommando. Åtgärdat.
Auto-updater: startade parallella nedladdningar vid upprepade öppningar och stängningar av fönstret, vilket kunde samla tiotals gigabyte i minnet. Åtgärdat.
--resume som trunkerar historiken: ett race condition mellan minnesextraktionsskrivningar och huvudtranskriptet kunde leda till tyst trunkering. Åtgärdat.
Hooks PreToolUse som kringgår reglerna deny: en hook som returnerade "allow" kringgick behörighetsreglerna deny, inklusive företagsadministrerade inställningar. Viktig säkerhetsfix.

🔗 CHANGELOG Claude Code

Article technique : comment l’équipe Claude Code utilise les Skills

17 mars — Thariq (@trq212), ingenjör i Claude Code-teamet på Anthropic, publicerar “Lessons from Building Claude Code: How We Use Skills”, den andra artikeln i serien efter “Seeing like an Agent” (27 februari, 3,6 miljoner visningar).

Artikeln dokumenterar hur Skills har blivit en av de mest använda utbyggnadspunkterna i Claude Code — flexibla, enkla att underhålla och som gör det möjligt för team att definiera återanvändbara arbetsflöden direkt i sin utvecklingsmiljö. Boris Cherny (@bcherny), ansvarig för Claude Code, delade artikeln och kallade den “Really great writeup”. Författaren meddelar också den kommande publiceringen av en iMessage-skill med öppen källkod som ett konkret exempel.

“Using Skills well is a skill issue. I didn’t quite realize how much until I wrote this.”

🇸🇪 Att använda Skills väl är en fråga om skicklighet. Jag hade inte insett hur mycket förrän jag skrev den här artikeln. — @trq212 on X

🔗 Publiceringstweet

Codex Security : pourquoi pas de rapport SAST

16 mars — OpenAI publicerar en teknisk artikel som förklarar designvalet bakom Codex Security: varför systemet inte bygger på statisk analys (SAST) som utgångspunkt.

Tillvägagångssättet vilar på fyra pelare: kontextuell läsning (analysera hela kodvägen med repots kontext), riktad mikro-fuzzing (krympa till minsta testbara fragment för att skriva micro-fuzzers), resonemang kring begränsningar (använda en Python-miljö med z3-solver för att formalisera komplexa problem), och validering i sandbox (skilja “det här kan vara ett problem” från “det här är ett problem” med ett kompilerat PoC). Artikeln illustrerar dessa principer med CVE-2024-29041 (Express), en öppen omdirigering där felaktigt formaterade URL:er kringgick allowlist-implementationer.

🔗 Varför Codex Security inte inkluderar en SAST-rapport

Gemini Personal Intelligence : expansion gratuite aux États-Unis

17 mars — Google utökar Personal Intelligence till fler användare gratis i USA. Funktionen, som hittills varit reserverad för betalande prenumeranter, är nu tillgänglig för gratiskonton (free-tier) via tre ytor: AI Mode i Google Search, Gemini-appen (iOS/Android) och tillägget Gemini in Chrome.

Personal Intelligence kopplar säkert samman användarens Google-appar (Gmail, Google Photos, YouTube, Search) för att leverera personliga svar. Exempel: shoppingrekommendationer anpassade till tidigare köp, teknisk hjälp som riktar sig till exakt den köpta enheten (utläst ur Gmail-kvitton), personliga reseplaner baserade på hotellbekräftelser. Användaren väljer vilka appar som ska anslutas och kan när som helst stänga av. Tillgänglig endast för personliga Google-konton (inte Workspace enterprise/utbildning).

🔗 Google-bloggen – Personal Intelligence

AlphaFold Database : millions de nouvelles structures de complexes protéiques

17 mars — Google DeepMind tillkännager en expansion av databasen AlphaFold Database (AFDB) med miljontals nya AI-förutsagda strukturer av proteinkomplex, i samarbete med EMBL-EBI (European Bioinformatics Institute), NVIDIA och Seoul National University. De nya strukturerna omfattar bland annat WHO:s prioriterade bakteriella patogener — de mest farliga och antibiotikaresistenta bakterierna. Denna expansion går från nivån enskilda proteiner till proteinkomplex (interaktioner mellan flera proteiner), ett kvalitativt språng för medicinsk och farmaceutisk forskning.

🔗 Tillkännagivande av Pushmeet Kohli på X

xAI : API Text-to-Speech de Grok et première place en édition vidéo

API Text-to-Speech

16 mars — xAI tillkännager tillgängligheten av Grok Text-to-Speech API, med naturliga och uttrycksfulla röster för utvecklare. LiveKit integrerade denna TTS i LiveKit Inference redan vid lanseringen.

🔗 xAI:s tillkännagivande på X

Grok Imagine #1 en édition vidéo

15 mars — Grok Imagine når första plats i videoredigering på Design Arena-rankingen, med ett Elo på 1290. API:n Imagine är nu tillgängligt för utvecklare. Funktionen omfattar att lägga till, ta bort och byta ut objekt i videoscener.

🔗 Grok-annons på X

Perplexity Computer: full kontroll över Comet och Android

Computer styr Comet utan MCP

16 mars — Computer kan nu ta full kontroll över webbläsaren Comet för att utföra självständiga uppgifter: webbläsaragenten kan komma åt vilken webbplats eller ansluten applikation som helst, utan connecters eller MCP. Tillgängligt för alla Computer-användare på Comet.

🔗 Perplexitys tweet

Computer på Android

16 mars — Perplexity Computer är nu tillgängligt på Android, vilket utökar iOS-lanseringen den 13 mars till alla mobila plattformar.

🔗 Perplexity Android-tweet

Manus: lokal dator och Google Workspace på utvecklarnivå

Manus “My Computer” på macOS och Windows

16 mars — Manus tillkännager “My Computer”, en central funktion i den nya Manus Desktop-appen (macOS och Windows). Tidigare begränsad till en molnbaserad sandlåda kan Manus nu köras direkt på den lokala maskinen via kommandoradsinstruktioner i en lokal terminal — med uttryckligt användargodkännande i varje steg.

Användningsfallen täcker ett brett spektrum: sortera och döp om tusentals filer, skapa inbyggda skrivbordsappar (det nämnda exemplet: en Mac-app för översättning och realtidsundertextning skapad på 20 minuter, utan att öppna Xcode), eller använda den lokala GPU:n för att träna maskininlärningsmodeller. My Computer kompletterar de befintliga molnkopplingarna (Google Calendar, Gmail) i stället för att ersätta dem.

🔗 Manus tweet · 🔗 Manus-blogg

Manus behärskar Google Workspace med precision

17 mars — Manus rullar ut en större uppdatering av sin Google Workspace-koppling, baserad på Google Workspace CLI (ett verktyg med öppen källkod från Googles team). Den tidigare versionen behandlade Google-filer som monolitiska block; den nya versionen möjliggör finmaskiga åtgärder:

Domän	Nya funktioner
Google Docs	Kirurgiska textersättningar, svar på specifika kommentarer
Google Sheets	Läsning över flera kalkylblad, uppdatering av en exakt cell, duplicering av flikar
Google Slides	Redigering av befintliga presentationer (slidens titel, uppdatering av tidslinje)
Google Drive	Oorganisering av mappar

Uppdateringen är gratis och bakåtkompatibel.

🔗 Manus tweet · 🔗 Manus-blogg

GitHub: `/fleet` för massunderhåll och 12,5 M$ för open source

Copilot `/fleet`: underhåll över hela depåflottan

15 mars — GitHub demonstrerar kommandot /fleet i GitHub Copilot. Med en enda instruktion kan utvecklare som hanterar flera repos delegera repetitiva underhållsuppgifter (konfigurationsuppdateringar, beroendefixar) till agenten över hela sin flotta, i stället för repo för repo.

🔗 GitHub-tweet

12,5 M$ för säkerhet i open source

17 mars — GitHub, Anthropic, AWS, Google och OpenAI går samman i ett kollektivt åtagande på 12,5 miljoner dollar till förmån för Alpha-Omega, Linux Foundations program för att säkra ekosystemet kring open source.

Viktiga punkter från GitHub: 280 000+ underhållare på hundratals miljoner offentliga repos kommer att vara berättigade till gratis tillgång till GitHub Copilot Pro. GitHub tillför också 5,5 M$ i Azure-krediter för utbildning. GitHub Secure Open Source Fund, som redan har stöttat 138 projekt, öppnar sin fjärde omgång i slutet av april 2026.

Sammanhanget är betydelsefullt: AI har kraftigt ускорerat upptäckten av sårbarheter, vilket ökar underhållarnas arbetsbörda. Den uttalade målsättningen är att AI ska minska denna börda snarare än öka den.

🔗 GitHub Bloggartikel 🔗 Linux Foundation-annons

Z.ai GLM-5-Turbo: hög hastighet för agentmiljöer

15 mars — Z.ai lanserar GLM-5-Turbo, en snabbvariant av GLM-5 optimerad för agentmiljöer (särskilt OpenClaw). Samma dag tredubblas användningsgränserna för prenumeranter på GLM Coding Plan. Tillgänglig på OpenRouter och via direkt-API:t.

🔗 Z.ai-annons på X

Kimi publicerar ett paper om Attention Residuals

16–17 mars — Moonshot AI publicerar ett forskningspaper om Attention Residuals på arXiv: ett nytt tillvägagångssätt för djup aggregering som ersätter standardiserade residualkopplingar med en återkoppling inspirerad av tids-/djupdualitet (depth-wise aggregation). Analysen visar att detta angreppssätt naturligt dämpar problemen med ökande magnitud hos dolda tillstånd. Elon Musk svarade “Impressive work from Kimi” på tweeten om tillkännagivandet (4,5 miljoner visningar).

🔗 Kimi-tweet · 🔗 arXiv 2603.15031

ElevenLabs × Deloitte: omnikanala agenter för företag

14 mars — ElevenLabs och Deloitte tillkännager ett strategiskt partnerskap som kombinerar plattformen ElevenLabs Agents med Deloittes branschkompetens, för att hjälpa stora företag att införa omnikanala konversationsagenter. Partnerskapet riktar sig mot reglerade företag (finans, hälsa, offentlig sektor). Deloitte bidrar med verksamhetsintegration, ElevenLabs levererar AI-ljudinfrastruktur (röst, transkribering, agenter).

🔗 ElevenLabs-blogg

Kortnyheter

Tongyi Fun-CineForge (Alibaba, 16 mars) — Tongyi Lab öppen källkod för Fun-CineForge, ett AI-system för filmisk dubbning som närmar sig professionell filmkvalitet. Tillgängligt på GitHub, HuggingFace och ModelScope. 🔗 Annonsering på X

Vad det betyder

NVIDIA GTC 2026 kristalliserar en viktig dynamik: flera ledande AI-labb (Mistral, Perplexity, Cohere) samlas kring NVIDIA-infrastrukturen för att samutveckla öppna frontier-modeller eller suveräna utrullningar. Denna sammansmältning kring en öppen koalition står i kontrast till den senaste periodens fragmentering — och signalerar att storskalig förträning har blivit för kostsam för att hanteras i silos.

GPT-5.4 mini bekräftar en tung trend: modeller i “litet format” är inte längre nedbantade versioner utan konkurrenskraftiga alternativ. Med 54,4 % på SWE-Bench Pro mot 57,7 % för fullmodellen, och en 19x lägre kostnad, omdefinierar GPT-5.4 mini förhållandet mellan prestanda och pris för kodningsarbetsflöden.

Den 17 mars illustrerar också den ökande betydelsen av lokala och skrivbordsbaserade agenter: Manus “My Computer” lämnar molnet för att få tillgång till den lokala maskinen, Perplexity Computer tar kontroll över Comet utan MCP, och Claude Code dubblar sitt standardfönster för generering för Opus 4.6. Eran med agenten som bara föreslår ersätts av agenten som faktiskt utför.

Källor

Detta dokument har översatts från versionen fr till språket sv med hjälp av modellen gpt-5.4-mini. För mer information om översättningsprocessen, se https://gitlab.com/jls42/ai-powered-markdown-translator