Sök

GLM-5.2 open-source MIT, Qwen-Robot Suite och NVIDIA Blackwell dominerar MLPerf: den 16 juni 2026 inom AI

GLM-5.2 open-source MIT, Qwen-Robot Suite och NVIDIA Blackwell dominerar MLPerf: den 16 juni 2026 inom AI

ai-powered-markdown-translator

Artikel översatt från fr till sv med gpt-5.4-mini.

Visa projekt på GitHub ↗

16 juni 2026 — Z.ai publicerar MIT-licensierade open-source-vikter för GLM-5.2 (1M-tokenfönster, två resonemangsnivåer), Alibaba Qwen lanserar Qwen-Robot Suite som består av tre grundmodeller för robotik, NVIDIA Blackwell dominerar samtliga MLPerf Training 6.0-benchmarktester — däribland DeepSeek-V3 671B som tränats på 2,02 minuter på 8 192 GPU:er. GitHub tillkännager att Code Quality blir allmänt tillgänglig (general availability) och betald den 20 juli för $10 per aktiv utvecklare och månad, June Pixel Drop lägger till Gemini Omni-video och musikgenerering på Pixel-enheter, och Anthropics ekonomiska forskning kvantifierar för första gången hur yrkesexpertis påverkar Claude Code.


Z.ai GLM-5.2 — MIT-licensierade open-source-vikter tillgängliga

16 juni — Z.ai (tidigare Zhipu AI) publicerar officiellt GLM-5.2:s open-source-vikter under MIT-licens och verkställer därmed tillkännagivandet från den 13 juni. Vikterna finns nu tillgängliga för nedladdning på företagets plattform.

“Introducerar GLM-5.2: Frontier Intelligence, Open Weights

  • Significant improvements in coding and agentic tasks
  • Strong long-horizon capabilities with a 1M context window
  • Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong balance”

🇸🇪 Introduktion av GLM-5.2: Frontlinjeintelligens, öppna vikter. Betydande förbättringar i kodnings- och agentiska uppgifter. Robusta förmågor för långa sekvenser med ett kontextfönster på 1 miljon tokens. Två nivåer av resonemangsinsats: GLM-5.2 (max) tänjer på gränserna, medan GLM-5.2 (high) erbjuder en stark balans.@Zai_org på X

Viktiga punkter om GLM-5.2:

  • Betydande förbättringar i kodnings- (coding) och agentiska uppgifter
  • Kontextfönster på 1 miljon tokens — användbart för storskaliga kodningsagenter och behandling av långa dokument
  • Två kompletterande nivåer av resonemangsinsats
  • Överträffar GLM-5.1 inom kodning, verktygsanvändning och resonemang
  • Tillgänglig via chat.z.ai
VariantResonemangKontextLicens
GLM-5.2 (max)Maximal prestanda1M tokensMIT open-source
GLM-5.2 (high)Stark balans mellan prestanda/hastighet1M tokensMIT open-source

MIT-licensen är den viktigaste markören: den tillåter kommersiell användning utan begränsningar, vilket gör GLM-5.2 direkt användbar för företag som inte kan eller vill vara beroende av amerikanska proprietära modeller. Tweeten nådde 515 000 visningar på några timmar — en stark signal om communityns intresse för open-source frontier-modeller med stora kontextfönster.

🔗 Z.ai-bloggen — GLM-5.2


Qwen-Robot Suite — tre grundmodeller för förkroppsligad robotik

16 juni — Alibaba Qwen tillkännager Qwen-Robot Suite, en komplett stack för förkroppsligad intelligens (embodied intelligence) bestående av tre distinkta och kompletterande grundmodeller: navigation, manipulation och världmodell.

Qwen-RobotNav — specialist på mobil navigation:

  • Enar 5 uppgifter i en enda modell: instruktionsföljning, navigation till målpunkt (point-goal), navigation till målobjekt (object-goal), objektspårning och autonom körning
  • Kontrollerbart observationsprotokoll
  • Verktygsgränssnitt för agentiska system

Qwen-RobotManip — specialist på manipulation:

  • Enat tillstånds-aktionsutrymme för heterogena robotar
  • Delta-poser i kamerareferensram för konsekvent inlärning mellan olika robotkroppar (cross-embodiment)
  • Förtränad på ett open-source-korpus på över 38 100 timmar

Qwen-RobotWorld — fysisk världmodell:

  • En enda modell som täcker över 20 typer av robotkroppar
  • Åtgärdsgränssnitt i naturligt språk
  • Förutspår fysiskt förankrade framtider för manipulation, körning och navigation

Varje modell kan användas självständigt och kan sättas samman som ett verktyg för den fysiska världen. Tillsammans utgör de den lågnivåverktygslåda som behövs för generalistiska agentiska system.

ModellSpecialitetNyckeldata
Qwen-RobotNavFlervalsnavigation (5 enade uppgifter)Verktygsgränssnitt för agentiska system
Qwen-RobotManipCross-embodiment-robotmanipulationOpen-source-korpus 38 100+ timmar
Qwen-RobotWorldFysisk världsmodell20+ typer av robotkroppar

🔗 Qwen-Robot Suite — tillkännagivande


NVIDIA Blackwell dominerar MLPerf Training 6.0 — clean sweep

16 juni — NVIDIA har vunnit samtliga benchmarks i MLPerf Training 6.0, den branschstandard för AI-träning som fastställts av MLCommons-konsortiet. Det är den enda plattformen som har skickat in resultat för varje test, inklusive de två nya benchmarkerna som introducerades i denna utgåva: DeepSeek-V3 (671 miljarder parametrar, MoE-arkitektur) och GPT-OSS-20B.

Prestandan för GB300 NVL72-systemet (72 Blackwell Ultra-GPU:er sammankopplade) är anmärkningsvärd:

ModellPlattformGPUTid
DeepSeek-V3 671B (MoE)GB300 NVL728 1922,02 min
GPT-OSS 20B (MoE)GB300 NVL725127,43 min
Llama 3.1 405BGB200 NVL728 1927,07 min
Llama 3.1 8BGB200 NVL721 0244,46 min
Llama 2 70B LoRAGB300 NVL725120,40 min
FLUX.1 (bildgenerering)GB300 NVL7251217,1 min
DLRM-dcnv2GB300 NVL72640,67 min

Inkluderingen av FLUX.1 (bildgenereringsmodell från Black Forest Labs) i de officiella benchmarks är anmärkningsvärd: den bekräftar att Blackwell-infrastrukturen är den referensstandard som gäller för att träna de mest avancerade bildgenereringsmodellerna.

På mjukvarusidan har NVIDIA infört flera innovationer i NeMo 26.06-stacken: CUDA-grafer för hela iterationer för MoE, kärnfusioner via CuTe DSL, MXFP8-precision för uppmärksamhetsblocket samt optimeringar av MoE-rutern (5× kärnacceleration). Dessa mjukvaruförbättringar har gjort det möjligt att öka DeepSeek-V3:s genomströmning med 1,3× på tre månader utan någon ändring av hårdvaran, från 1 298 till 1 648 TFLOPS/GPU — en påminnelse om att hårdvaruprestanda bara är en del av ekvationen.

🔗 NVIDIA — MLPerf Training 6.0


June Pixel Drop 2026 — Gemini Omni video, musikgenerering, Daily Brief

16 juniJune Pixel Drop 2026 introducerar flera stora funktioner som integrerar Gemini direkt i Pixel-enheter, med en gradvis utrullning som börjar under de kommande veckorna.

Gemini Omni — AI-driven video­skapande och redigering: det räcker att tala naturligt med Gemini för att blanda text, bilder och videor. Det går att börja från noll, remixa innehåll från kamerarullen, använda fördefinierade mallar eller till och med skapa en personlig AI-avatar med användarens utseende och röst.

Musikgenerering i Gemini: användaren beskriver en idé eller importerar ett foto, som omvandlas till ett originalljudspår med sångtext. Stil, röst och tempo kan anpassas från menyn Verktyg → “Skapa musik” i Gemini-appen.

Daily Brief — morgonagent med AI: tillgänglig för alla abonnenter på Google AI Plus, Pro och Ultra (18+, endast USA för närvarande). Denna agent organiserar användarens dag innan hen ens har vaknat. Voice Translate, som översätter samtal i realtid, utökas till Pixel 10a (7 språk inklusive franska).

FunktionTillgänglighetNoter
Gemini Omni-videoPixel (gradvis utrullning)Skapa/remixa via konversation
MusikgenereringPixel (Gemini-app)Ljud + text, anpassningsbart
Daily BriefGoogle AI Plus/Pro/Ultra, 18+, USAMorgonagent med AI
Voice TranslatePixel 10a7 språk + hindi i förhandsversion
Edit with Ask PhotosStorbritannien, Tyskland, Frankrike, Spanien, ItalienFoto­redigering via konversation

🔗 June Pixel Drop 2026 — officiell Google-blogg


GitHub Code Quality — allmänt tillgängligt den 20 juli, $10 per aktiv utvecklare

16 juni — GitHub meddelar att GitHub Code Quality går från offentlig förhandsversion till allmän tillgänglighet (general availability) den 20 juli 2026, som en betald produkt. Mer än 10 000 företag deltog i förhandsversionen.

Prissättning från och med 20 juli:

KomponentPrissättning
Licens per aktiv utvecklare (committer)$10 / aktiv utvecklare / månad
AI-funktioner (Copilot code review, AI-detektering, Copilot Autofix)Användningsbaserad fakturering
Deterministisk analys CodeQLGitHub Actions-minuter

Nya funktioner som finns tillgängliga redan vid GA:

  • Utrullning på organisationsnivå (en enda admin-toggle)
  • Kvalitetsinstrumentpaneler på organisationsnivå
  • Tillämpning av kodtäckning via regelsatser (rulesets)
  • Kvalitetspoäng per repository och per organisation
  • API för aktivering och hantering av resultat

Tillgänglighet: endast GitHub Enterprise Cloud och GitHub Team. Inte tillgängligt på GitHub Enterprise Server. Kunder som vill avbryta före debitering kan inaktivera Code Quality på sina repositories före den 20 juli.

🔗 GitHub Code Quality — GA-tillkännagivande


Anthropic ekonomisk forskning — yrkesexpertis väger tyngre än kodkunskap

16 juni — Anthropic publicerar en ekonomisk studie om användningen av Claude Code, baserad på konfidentiell analys av cirka 400 000 sessioner mellan oktober 2025 och april 2026. De första kvantifierade resultaten om hur expertis avgör framgång med en AI-kodningsagent.

Viktiga resultat från studien (författare: Zoe Hitzig, Maxim Massenkoff, Eva Lyubich, Ryan Heller, Peter McCrory):

IndikatorVärde
Analyserade sessioner~400 000
Unika användare~235 000
TidsperiodOkt 2025 – Apr 2026
Planeringsbeslut (användare)~70 %
Exekveringsbeslut (Claude)~80 %
Genomsnittlig ökning av ekonomiskt värde för uppgifter+25 %
Verifierad framgångsgrad (yrkesexpert)28–33 %
Verifierad framgångsgrad (nybörjare)15 %
Andel felsökningssessioner okt → apr33 % → 19 %

Huvudslutsats: i en typisk session fattar användaren cirka 70 % av planeringsbesluten (vad som ska göras) medan Claude fattar cirka 80 % av exekveringsbesluten (hur det ska göras). Yrkesexperter — inte nödvändigtvis utvecklare — styr Claude mot åtgärdskedjor som är dubbelt så långa med fem gånger mer innehåll per instruktion. Framgångsgraden för icke-tekniska yrken (jurister, chefer, forskare) ligger mindre än 7 procentenheter från mjukvaruingenjörer. Det är förståelsen av verksamhetsproblemet, inte kodbehärskningen, som avgör framgången.

🔗 Anthropic ekonomisk forskning — Claude Code


Anthropic och OpenAI — agenter i produktion och utrullning i Europa

Claude Managed Agents — guide för produktion

16 juni — Anthropics Applied AI-team publicerar en praktisk guide om hur man sätter agenter i produktion med Claude Managed Agents. Inlägget förklarar utvecklingen av interaktionsytor: från klassisk chatbot till planerade, persistenta autonoma agenter med åtkomst till exekveringsmiljöer (stateful runtime environments). Två funktioner tillgängliga sedan 9 juni: körning av agenter enligt definierad planering och lagring av miljövariabler i valv (vaults).

🔗 Bygga med Claude Managed Agents

Claude Code v2.1.178 — granulära behörigheter och inbäddade skills

15 juni — Claude Code v2.1.178 inför syntaxen Tool(param:value) för behörighetsregler — till exempel Agent(model:opus) för att blockera Opus-underagenter. Skills i inbäddade .claude/skills/-kataloger laddas automatiskt när man arbetar i dessa mappar. Auto mode utvärderar nu underagentstart med klassificeraren före start, vilket stänger ett kryphål där en underagent kunde begära en blockerad åtgärd utan föregående granskning.

🔗 Claude Code v2.1.178

Codex-app i EES, Storbritannien och Schweiz — Computer Use, Memories, Chronicle

16 juni — OpenAI rullar ut fyra avancerade Codex-funktioner i Europeiska ekonomiska samarbetsområdet (EES), Storbritannien och Schweiz: Computer Use (macOS + Windows), Codex Chrome-tillägget, Memories och Chronicle.

Computer Use gör det möjligt för Codex att interagera med skrivbordsapplikationer — se, klicka, skriva text. Chrome-tillägget gör det möjligt att utföra uppgifter som kräver anslutet webbläsarkontext, och arbetar över flera flikar i bakgrunden. Memories lagrar återkommande preferenser och repository-konventioner, men är avaktiverad som standard i de tre regionerna av regulatoriska skäl. Chronicle, en opt-in-förhandsvisning som endast är tillgänglig för Pro-prenumeranter på macOS, hjälper Codex att bygga minnen från det senaste skärmkonteksten. Dessa funktioner var redan tillgängliga för Enterprise-användare utanför EES/UK/CH.

🔗 OpenAI — Codex-utrullning EES/UK/Schweiz

OpenAI:s distributionssimulering — förutse beteendet före lansering

16 juni — OpenAI publicerar sin metod Deployment Simulation (distributionssimulering) : spela upp verkliga anonymiserade konversationer från tidigare utrullningar med en kandidatmodell för att upptäcka oönskat beteende innan produktion. Testad på GPT-5-series Thinking-distributioner (~1,3 miljoner konversationer) är det medianbaserade prediktionsfelet 1,5×, klart bättre än syntetiska utvärderingar. Metoden gjorde det möjligt att upptäcka “calculator hacking” (en form av reward hacking) innan GPT-5.1 släpptes.

🔗 Deployment Simulation — OpenAI

Codex CLI 0.140.0 — /usage, /import från Claude Code, Bedrock auth

15 juni — Versionen 0.140.0 av Codex CLI tillför flera betydande funktioner. /usage visar kontoaktivitet för tokens per dag, per vecka och totalt. /import gör det möjligt att selektivt importera konfiguration, projektinställningar och senaste diskussioner från Claude Code — en direkt interoperabilitet mellan två konkurrerande verktyg. codex delete tar bort en session permanent med säkerhetsbekräftelse och rensning av tillhörande underagenter. Den hanterade Amazon Bedrock-autentiseringen lagrar API-nycklar krypterat lokalt och omfattar även OAuth MCP-identifierare. Parallellt kommer tillförlitlighetsfixar för MCP (nya försök vid tillfälliga starter) och automatisk återställning av skadade SQLite-databaser.

🔗 Codex CLI 0.140.0 — release GitHub


Meta AI — AI-läge på Facebook med Muse Spark

16 juni — Meta lanserar nya verktyg för artificiell intelligens på Facebook. AI Mode är ett nytt sökläge drivet av Meta AI (drivet av Muse Spark) som grundar sina svar i det användarna säger offentligt på Metas appar — Grupper, Reels — och ger kontextualiserade insikter i stället för generiska resultat. Tillgängligt från nyhetsflödet eller sök.

Nya kreativa verktyg: delningsförslag från kamerarullen med collage-mallar (cutout templates), videoövergångseffekter, fotoförinställningar (photo presets) som gör det möjligt att virtuellt ändra kläder och frisyr, samt alternativet “Wear It” för att virtuellt bära en sporttröja i Stories. Alla dessa funktioner är opt-in och kan stängas av.

🔗 Meta — nya AI-verktyg på Facebook


NVIDIA SpatialClaw — träningsfri agent för rumsligt resonemang

16 juni — NVIDIA Research publicerar SpatialClaw, en visuell agent för rumsligt resonemang utan extra träning (training-free). I stället för att anropa en fast uppsättning fördefinierade verktyg skriver agenten direkt Python i en beständig kärna, komponerar dynamiskt perceptionsmoduler och reviderar sin strategi steg för steg. Resultaten blir återanvändbara Python-variabler tillsammans med NumPy och SciPy.

Resultat: +11,2 poäng på 20 benchmarks för visuellt rumsligt resonemang jämfört med en nylig föregående agent, konsekvent över 6 olika modellarkitekturer, utan benchmarkspecifik finjustering.

🔗 SpatialClaw — @NVIDIAAI på X


Cohere — inflöde av förfrågningar efter USA:s restriktioner mot Anthropic

15 juni — Cohere, ett kanadensiskt företag inom generativ AI, rapporterar att de får ett stort antal inkommande förfrågningar (inbounds) från företag som söker alternativ efter den amerikanska direktiven som begränsar tillgången till Anthropic (bevakad den 13 juni). Företaget svarade humoristiskt genom att citera Polymarket-tweeten: “The world needs more Canada 🇨🇦”. Tweeten nådde 56 000 visningar och 797 likes. Denna positionering bekräftar att den amerikanska direktiven skapar en direkt affärsmöjlighet för icke-amerikanska suveräna leverantörer.

🔗 Cohere — tweet


GitHub Models tas bort för nya kunder

16 juni — GitHub meddelar en stegvis avveckling av GitHub Models. Från och med den 16 juni har nya kunder (organisationer och företag utan tidigare användning) inte längre tillgång till tjänsten, varken på gratisplaner eller betalplaner. Befintliga kunder med aktiv användning påverkas tills vidare inte och kan fortsätta använda playground, API:et och de tillgängliga modellerna. GitHub klargör att de senare kommer att kommunicera de detaljerade tidslinjerna för den fullständiga nedstängningen. För nya projekt som behöver tillgång till AI-modeller hänvisar GitHub till Azure AI Foundry, som erbjuder en omfattande katalog av modeller.

🔗 GitHub Models retirement


Kortnyheter

  • Claude Code v2.1.179 — 9 stabilitetsfixar (16 juni) : avbrutna anslutningar mitt i strömmen (mid-stream) bevaras, rullning med mushjulet fixad i WSL2 under Windows Terminal och VS Code (regression sedan v2.1.172), Linux-sandboxfix för stora katalogträd. 🔗 v2.1.179

  • Gemini Trusted Tester Program — anmälan öppen : Google öppnar ett begränsat antal platser för power users som vill testa nya Gemini-funktioner innan offentlig lansering. 🔗 Anmälan

  • Gemini — flerspråkig mikrofon 70+ språk (Android och iOS) : mikrofonikonen stöder nu fler än 70 språk med fri blandning utan att ändra inställningar. Meddelande via @joshwoodward (Director of Product, Gemini App).

  • GitHub Code Quality — aktivering av organisation med ett klick (16 juni) : organisationsadministratörer kan aktivera eller inaktivera Code Quality på alla sina repos med en enda växlingsknapp i säkerhetsinställningarna. 🔗 Changelog

  • Copilot usage metrics — berikning med servertelemetri (15 juni) : Copilot Enterprise-användningsrapporter integrerar nu serverupptäckta aktiva användare (utöver klienttelemetri), vilket förbättrar täckningen av DAU i dagliga rapporter och över 28 dagar. 🔗 Changelog

  • Manus — meddelandekö under körning (16 juni) : Manus gör det nu möjligt att lägga meddelanden i kö för att skickas till agenten medan en uppgift pågår. Meddelandena behandlas i ordning när den aktuella uppgiften är klar. 🔗 Meddelande

  • ChatGPT iOS 1.2026.160 (15 juni) : filutforskare för arbetsytor, mappväljare, diff-kontroller, MCP-godkännande via chatt eller globalt, och LaTeX-rendering i meddelanden och Codex-planer.


Vad det betyder

Öppningen av MIT-ägda vikter för GLM-5.2 och de tre robotmodellerna i Qwen-Robot Suite illustrerar accelerationen i det kinesiska open source-utbudet inom de segment där amerikanska aktörer till stor del fortfarande är proprietära. GLM-5.2 med sitt fönster på 1M tokens under MIT-licens etablerar sig direkt som konkurrent till kommersiella modeller för företag som söker ett suveränt alternativ — just den nisch som den amerikanska direktiven som begränsar Anthropic gjorde strategiskt synlig, vilket Cohere:s rapporterade inflöde av förfrågningar bekräftar. Robotik är nästa arena i denna konkurrens: Qwen-Robot Suite erbjuder en komplett stack för navigation-manipulation-världsmodell, medan NVIDIA Researchs SpatialClaw visar att avancerat rumsligt resonemang kan uppnås utan finjustering — två kompletterande angreppssätt som skissar arkitekturen för nästa generations agentiska robotsystem.

På hårdvarusidan bekräftar resultaten från MLPerf Training 6.0 Blackwell-arkitekturens dominans i industriell skala: att träna DeepSeek-V3 (671 miljarder parametrar) på 2 minuter med 8 192 GPU:er är inte en akademisk bedrift, utan en verklig produktionskapacitet i molndatacenter. Mjukvaruvinsten på 1,3× i genomströmning för DeepSeek-V3 på tre månader utan hårdvaruförändring påminner om att kapplöpningen om AI-prestanda lika mycket är en tävling mellan mjukvarustackar (NeMo, CuTe DSL, MXFP8) som mellan chip — en dynamik som förstärker redan dominerande positioner.

Anthropics ekonomiska forskning om Claude Code ger en viktig motintuitiv insikt: expertis inom verksamhetsområdet (juridik, ledarskap, vetenskap) avgör framgången med en kodagent nästan lika mycket som behärskning av kod i sig. De verifierade framgångsgraderna visar ett gap på endast 7 poäng mellan ingenjörer och icke-utvecklare som är experter inom sitt område. Det är en strukturell insikt för produktteam: målgruppen för AI-kodverktyg är inte längre enbart utvecklare, och gränssnittsdesignen måste ta hänsyn till det.

På utvecklarverktygssidan koncentrerar den 16 juni flera konvergerande signaler: GitHub Code Qualitys betalda GA ($10/aktiv utvecklare), tillgängligheten av Codex med Computer Use i EES/UK/Schweiz, Claude Code v2.1.178:s granulära behörigheter och OpenAIs metod Deployment Simulation. Kodkvalitet och distributionssäkerhet går från forskningsämnen till fakturerade produkter — en normalisering som speglar den växande mognaden på marknaden för AI-verktyg för utvecklingsteam.


Källor