Sök

Anthropic Institute, Perplexity Everything is Computer, OpenAI Responses API: 11 mars 2026

Anthropic Institute, Perplexity Everything is Computer, OpenAI Responses API: 11 mars 2026

Den 11 mars 2026 är en intensiv dag: Anthropic skapar ett tvärvetenskapligt institut för den offentliga debatten om AI, Perplexity rullar ut sin “Computer”-vision med fyra API samtidigt, OpenAI publicerar de nya agentiska primitiverna i Responses API, och Meta beskriver fyra generationer specialutvecklade AI-chip som tagits fram på två år.


Anthropic Institute: Jack Clark i spetsen för public benefit

11 mars 2026 — Anthropic lanserar The Anthropic Institute, en ny satsning för att föra den offentliga debatten om de utmaningar som kraftfull AI medför framåt. Initiativet leds av medgrundaren Jack Clark, som tar en ny roll som “Head of Public Benefit” (ansvarig för public benefit) på Anthropic.

Institutet kommer att samla ett tvärvetenskapligt team — forskare, ekonomer, jurister, specialister inom offentlig policy — med unik tillgång till Anthropics mest avancerade modeller. Dess uppdrag: att analysera och kommunicera AI:s samhälleliga, ekonomiska och säkerhetsmässiga effekter i takt med att de utvecklas.

Tre första rekryteringar har tillkännagivits:

RekrytBakgrund
Matt BotvinickResident Fellow, Yale Law School; tidigare Senior Director of Research, Google DeepMind
Anton KorinekProfessor i ekonomi (tjänstledig), teamet Economic Research
Zoë HitzigTidigare OpenAI, specialiserad på AI:s sociala och ekonomiska effekter

Institutet bygger vidare på Anthropics befintliga team: Frontier Red Team, Societal Impacts, Economic Research. Parallellt tillkännager Anthropic en utökning av sitt Public Policy-team, med fokus på modelltransparens, skydd för energikonsumenter, exportkontroller och global AI-styrning.

Skapandet av detta institut markerar ett viktigt steg: Anthropic strukturerar formellt sitt offentliga engagemang och ger det ett ansikte genom en av sina medgrundare.

🔗 Introducing The Anthropic Institute


Perplexity: samordnad lansering av visionen “Everything is Computer”

11 mars 2026 — Perplexity publicerar samtidigt fyra tillkännagivanden som tillsammans utgör en samordnad lansering kring dess “Computer”-vision: AI som personlig och professionell dator.

Personal Computer och Enterprise

Personal Computer är en dedikerad Mac mini som körs dygnet runt, ansluten till lokala applikationer och Perplexitys servrar. Den fungerar som användarens digitala proxy — känsliga åtgärder kräver uttryckligt godkännande. Väntelista öppen.

Computer for Enterprise ansluter till Snowflake, Salesforce, HubSpot och hundratals plattformar. Kompetenserna (skills) kan anpassas, och Slack-integrationen gör det möjligt att arbeta i DM eller delade kanaler. Den bygger på SOC 2 Type II, SAML SSO och granskningsloggar (audit logs). Perplexity lyfter fram en siffra från en intern studie med 16 000 förfrågningar: en besparing på 1,6 miljoner dollar i arbetskostnader och 3,25 års arbete utfört på 4 veckor.

Comet Enterprise är en AI-native webbläsare med administratörskontroller (behörigheter per domän, åtgärdsloggar, MDM) och ett partnerskap med CrowdStrike för skydd på webbläsarnivå.

Perplexity Finance får 40+ liveverktyg för finans (SEC filings, FactSet, S&P Global, Coinbase, LSEG, Quartr, Polymarket), med mäklaranslutning via Plaid för analys av en verklig portfölj.

Premium Sources ger tillgång till Statista, CB Insights och PitchBook direkt i sökflödena — betalkällor citeras automatiskt.

🔗 Everything is Computer

Agent API: komplett orchestration-runtime

Agent API är en hanterad runtime för att bygga agentiska workflows med integrerad sökning, verktygskörning och orchestration över flera modeller. Den ersätter med en enda integrationspunkt en modellrouter, ett söklager, en embeddings-leverantör, en sandbox-tjänst och en monitoring stack.

Integrerat verktygKapacitet
web_searchFiltrering efter domän, färskhet, datumintervall, språk, innehållsbudget
fetch_urlDirekt hämtning av URL
Anpassade funktionerFullt stöd

Fyra optimerade profiler (presets) täcker användningsfallen: snabb faktasökning, balanserad sökning, djupgående flerkällsanalys och institutionell forskning. Deep Research 2.0 finns tillgänglig via profilen advanced-deep-research — den startar dussintals sökningar per förfrågan och behandlar hundratals dokument.

Agent API är modellagnostiskt, stöder fallback chains över flera modeller för tillgänglighet nära 100 %, och är tillgängligt idag på docs.perplexity.ai.

🔗 Agent API

Search API: förbättrade snippets och benchmark SEAL

Uppdateringen av Search API handlar om kvaliteten på utdrag (snippets) och utvärderingsinfrastrukturen.

Den nya pipelinen för märkning på fragmentnivå (span-level labeling) identifierar vilka segment i ett källdokument som är relevanta för en förfrågan. Resultatet: mindre och mer precisa utdrag, vilket minskar kostnaderna i tokens och förbättrar kontexthanteringen för nedströmsmodeller.

benchmark SEAL testar om ett hämtningssystem kan besvara frågor vars svar förändras över tid. Perplexity går framåt på SEAL-Hard medan andra leverantörer tappar. Frameworket search_evals uppdateras som open source på GitHub.

Andra förbättringar: stöd för flera förfrågningar (upp till 5 i en enda API-förfrågan), filtrering efter språk (ISO 639-1-kod) och land, samt Python SDK (pip install perplexityai) med inbyggt stöd för de tre API:erna.

🔗 Search API update

Sandbox API: isolerad kodkörning för agenter

Perplexity öppnar sin interna miljö för kodkörning som en fristående tjänst. Varje session körs i en isolerad Kubernetes-pod, med ett monterat persistent filsystem. Språk som stöds: Python, JavaScript, SQL. Installation av paket vid körning (at runtime) är möjlig.

Sessionerna har ett persistent tillstånd (stateful): filer som skapas i ett steg är tillgängliga i nästa steg, och långa workflows kan pausas och återupptas flera timmar senare. Säkerheten bygger på en zero-trust-modell (zero-trust): ingen direkt nätverksåtkomst, utgående trafik via proxy, koden får aldrig åtkomst till råa API-nycklar.

Sandbox API kommer att kunna integreras i Agent API med samma API-nyckel och samma krediter. Status: privat beta inom kort.

🔗 Sandbox API


OpenAI: Responses API får en datormiljö för agenter

11 mars 2026 — OpenAI publicerar en ingenjörsartikel som beskriver de nya primitiverna i Responses API för att bygga tillförlitliga autonoma agenter: shell tool Unix, hostade containrar, native kontextkomprimering och återanvändbara agent skills.

Shell tool

Shell tool låter modellen interagera med en dator via kommandoraden, med tillgång till klassiska Unix-verktyg (grep, curl, awk). Till skillnad från den befintliga kodtolken som bara körde Python stöder shell tool Go, Java, Node.js och andra miljöer. Modellerna GPT-5.2 och senare tränas för att föreslå shell-kommandon.

Responses API kan köra flera shell-kommandon parallellt via separata containersessioner och tillämpar ett utmatningstak per kommando för att undvika att kontextfönstret mättas.

Hostade containrar

Containern utgör modellens arbetsyta:

KomponentBeskrivning
FilsystemUpload, organisering och hantering av resurser via container- och file-API:er
DatabaserStrukturerad lagring (SQLite) — modellen frågar tabellerna i stället för att läsa in allt innehåll
NätverksåtkomstCentraliserad egress-proxy med allowlist, injektion av hemligheter per domän

Native kontextkomprimering

För långvariga uppgifter integrerar Responses API en mekanism för native kontextkomprimering: modellerna tränas för att producera en kompakt och krypterad representation av konversationstillståndet. Tillgänglig på serversidan (konfigurerbar tröskel) eller via en endpoint /compact. Codex använder denna mekanism för att upprätthålla långvariga kodningssessioner utan försämring.

Agent skills

Skills (agentkompetenser) paketerar modeller för repetitiva arbetsflöden (workflow patterns) i återanvändbara bundles: en mapp med en fil SKILL.md och tillhörande resurser. Responses API laddar automatiskt skill i kontexten innan prompten skickas till modellen. Skills hanteras via API och versioneras.

Parallellt firar ett utvecklarblogginlägg ett år med Responses API genom fem kundfallstudier. De två publiceringarna ger en sammanhängande bild av plattformens utveckling mot agentik.

🔗 Responses API + datormiljö 🔗 1 år med Responses API


OpenAI: försvarsstrategi mot prompt injection

11 mars 2026 — OpenAI publicerar en säkerhetsartikel om AI-agenters motståndskraft mot attacker genom prompt injection (prompt injection).

De första attackerna bestod i att lägga in direkta instruktioner i externt innehåll (Wikipedia-sidor, e-post). I takt med att modellerna förbättrats har dessa attacker utvecklats mot social engineering (social engineering): övertygande professionellt sammanhang, simulerad brådska, påstådd auktorisation. Ett exempel från 2025 som beskrivs i artikeln visade en lyckad attack i 50 % av fallen på en äldre version av ChatGPT.

OpenAI betraktar problemet genom ett trepartssystem (arbetsgivare / agent / illvillig tredje part), analogt med en mänsklig kundtjänstmedarbetare som utsätts för manipulationsförsök. Målet är inte att perfekt identifiera varje attack, utan att begränsa effekten av en lyckad manipulation.

MotåtgärdBeskrivning
Source-sink-analysDetektering av kombinationer med opålitligt innehåll + farlig åtgärd
Safe UrlUpptäcker om information från konversationen skulle överföras till en tredje part — begär bekräftelse eller blockerar
App-sandboxCanvas och ChatGPT Apps upptäcker oväntad kommunikation och begär samtycke

Safe Url gäller även navigeringar i Atlas samt sökningar och navigeringar i Deep Research.

🔗 Designing AI agents to resist prompt injection


Meta MTIA: fyra generationer AI-chip på två år

11 mars 2026 — Meta publicerar en teknisk artikel om sin familj av specialutvecklade AI-chip MTIA (Meta Training and Inference Accelerator). På två år har Meta utvecklat fyra successiva generationer för att betjäna miljarder användare till lägre kostnad.

“AI models are evolving faster than traditional chip development cycles.”

🇸🇪 AI-modeller utvecklas snabbare än traditionella chiputvecklingscykler.

GenerationHuvudsaklig innovation
MTIA 300Första chipet optimerat för ranknings- och rekommendationsmodeller (Ranking & Recommendation), återanvändbar modulär bas
MTIA 400Utveckling mot GenAI-workloads, rack med 72 chip i en enda scale-up-domän
MTIA 450Fördubblad HBM-bandbredd, +75 % MX4 FLOPS, hårdvaruacceleration för attention och FFN
MTIA 500+50 % HBM-bandbredd jämfört med MTIA 450, fokus på GenAI-inference

Utvecklingen mellan MTIA 300 och MTIA 500: HBM-bandbredden multipliceras med 4,5 och FLOPS med 25. Metas strategi bygger på utveckling med hög hastighet (ett nytt chip per år), fokus på inference snarare än förträning, och native PyTorch-integration.

“Mainstream GPUs are typically built for the most demanding workload — large-scale GenAI pre-training — while Meta’s primary need is inference.”

🇸🇪 Mainstream-GPU:er är vanligtvis byggda för den mest krävande arbetsbelastningen — storskalig GenAI-förträning — medan Metas främsta behov är inference.

Arkitekturen för den elementära processorn (Processing Element) kombinerar två vektoriella RISC-V-kärnor, en skalärproduktmotor (Dot Product Engine), en enhet för specialfunktioner (Special Function Unit), en reduktionsmotor och DMA. Mjukvarustacken bygger på PyTorch, vLLM, Triton och dedikerade MTIA-kompilatorer, med vLLM-integration via plugin-arkitektur.

🔗 Meta MTIA: skala AI-chip för miljarder


Gemini CLI v0.33.0: förbättrat Plan Mode och A2A-autentisering

11 mars 2026 — Gemini CLI släpper version v0.33.0, två veckor efter v0.32.0 som introducerade Plan Mode.

KategoriNyheter
AgentarkitekturHTTP-autentisering för fjärranslutna A2A-agenter, upptäckt av autentiserade A2A-agentkort
Plan ModeIntegrerade forskningsunderagenter, stöd för annoteringar för användarfeedback, ny underkommando copy
CLI-gränssnittKompakt header med ASCII-ikon, omvänd visning av kontextfönstret, 30 dagars standardlagring för chatthistorik

Tillägget av HTTP-autentisering för A2A-protokollet (Agent-to-Agent) är den viktigaste tekniska nyheten: Gemini CLI kan nu upptäcka och autentisera sig mot fjärragenter, vilket lägger grunden för säker multiagent-orkestrering.

🔗 Gemini CLI-ändringslogg


Gemini i Chrome: expansion till Indien, Nya Zeeland och Kanada

11 mars 2026 — Google utökar Chromes AI-funktioner till tre nya marknader: Indien, Nya Zeeland och Kanada.

Gemini in Chrome — AI-assistenten i sidopanelen, baserad på Gemini 3.1 — är nu tillgänglig på Mac, Windows och Chromebook Plus i dessa regioner. Bland de lanserade funktionerna finns: åtkomst till Gmail, Maps, Calendar och YouTube från Chrome, korsanalys av flera öppna flikar och bildtransformering direkt i webbläsaren via Nano Banana 2. Uppdateringen lägger till 50+ ytterligare språk, inklusive hindi, franska och spanska.

🔗 Chrome expanderar till Indien, Nya Zeeland och Kanada


AlphaEvolve: nya gränser för 5 Ramsey-tal

11 mars 2026 — Pushmeet Kohli (Google DeepMind) meddelar att AlphaEvolve har fastställt nya undre gränser för 5 klassiska Ramsey-tal inom extremal kombinatorik — problem så svåra att Erdős själv kommenterade deras komplexitet, och där de bästa tidigare resultaten var minst ett decennium gamla.

AlphaEvolve fungerar som en meta-algoritm som automatiskt upptäcker de sökprocedurer som behövs, där man historiskt behövde utforma specifika algoritmer manuellt. Resultatet visar AlphaEvolves kapacitet bortom de optimeringar av Google-kernels som det redan var känt för.

🔗 Tweet av Pushmeet Kohli


Gemini Embedding 2: Googles första multimodala embedding

10 mars 2026 — Google tillkännager Gemini Embedding 2, beskriven som “our most capable and first fully multimodal embedding model”. Det är Googles första nativt multimodala embedding-modell, tillgänglig för utvecklare via Gemini API och AI Studio.

🔗 Tweet @googleaidevs


GitHub Copilot: code review från terminalen och JetBrains-framsteg

11 mars 2026 — Två betydande uppdateringar för GitHub Copilot.

Code Review från GitHub CLI v2.88.0

Det är nu möjligt att begära en Copilot-code review direkt från terminalen. Kommandona gh pr edit --add-reviewer @copilot (icke-interaktivt läge) och gh pr create (interaktivt läge) integrerar Copilot tillsammans med teamkamraterna. Valet av granskare får dynamisk sökning, vilket förbättrar prestandan i stora organisationer och åtgärdar tillgänglighetsproblem. Tillgängligt på alla planer som inkluderar Copilot code review — uppdatering till GitHub CLI v2.88.0 krävs.

🔗 Code Review från GitHub CLI

Agentiska förbättringar för JetBrains IDEs

Uppdateringen av JetBrains-pluginen gör följande allmänt tillgängligt (GA): anpassade agenter (custom agents), underagenter och planeringsagent (plan agent), samt automatiskt modellval för alla planer. I offentlig förhandsversion (public preview): agent-hooks (userPromptSubmitted, preToolUse, postToolUse, errorOccurred) via en hooks.json-fil i .github/hooks/, och stöd för AGENTS.md- och CLAUDE.md-filer.

Andra förbättringar kompletterar uppdateringen: konfigurerbart auto-approve per MCP, tankepanel för modeller med utökat resonemang, indikator för användning av kontextfönstret och utfasning av Edit-läget i menyn.

🔗 JetBrains-förbättringar

Utforska ett repo i Copilot på webben

I offentlig förhandsversion: det är möjligt att utforska trädstrukturen i ett GitHub-repo direkt från Copilots webbgränssnitt. Valda filer läggs automatiskt till som tillfälliga referenser i chatten och kan göras permanenta.

🔗 Repo-utforskning i Copilot


Anthropic Sydney och Claude for Office

Sydney, fjärde kontoret i Asien–Stillahavsområdet

10 mars 2026 — Anthropic meddelar att ett kontor snart öppnas i Sydney, deras fjärde i Asien–Stillahavsområdet (efter Tokyo, Seoul och Singapore). Australien ligger på fjärde plats i världen för användning av Claude.ai per capita; Nya Zeeland ligger på åttonde plats enligt samma indikator (Anthropic Economic Index). Kontoret kommer inledningsvis att fokusera på företagskunder, startups och forskning.

🔗 Sydney, fjärde kontoret i Asien–Stillahavsområdet

Claude for Excel och PowerPoint: delad kontext och Office Skills

11 mars 2026 — Add-ins Claude for Excel och Claude for PowerPoint får två viktiga uppdateringar: delning av kontext mellan de två apparna (en analytiker kan extrahera data från en Excel-arbetsbok och använda dem i en PowerPoint-presentation i en enda konversation), och Skills (återanvändbara arbetsflöden med ett klick) kommer till båda add-ins.

De förinstallerade Skills täcker de vanligaste användningsfallen: granskning av formler, byggande av LBO/DCF-modeller, decks för konkurrenslandskap, uppdatering av presentationer med nya data och granskning av investment banking-decks. Add-ins är nu tillgängliga via Amazon Bedrock, Google Cloud Vertex AI och Microsoft Foundry för regelefterlevande distributioner. Tillgänglighet: Mac och Windows på betalda planer (Pro, Max, Team, Enterprise).

🔗 Claude for Excel och PowerPoint


NVIDIA Nemotron 3 Super, ComfyUI och GTC 2026

11 mars 2026 — NVIDIA är mycket aktivt kring GTC 2026.

Nemotron 3 Super erbjuder 5 gånger högre throughput för agentisk AI jämfört med föregående generation. Det är en MoE-modell (Mixture of Experts) med 120 miljarder parametrar i open source, optimerad för högfrekventa inferenslaster.

NVIDIA och ComfyUI tillkännagav under GDC 2026 (Game Developers Conference) en integration som förenklar lokal AI-videogenerering för spelutvecklare och kreatörer, med stöd för modellerna FLUX och LTX-Video.

NVIDIA-bloggen GTC 2026 Live Updates samlar konferensens liveannonseringar från San Jose — Mistral AI presenterar även sina frontier-modeller i detta sammanhang.

🔗 Nemotron 3 Super 🔗 ComfyUI GDC 🔗 GTC 2026 Live


Kort sagt

Runway Labs — Runway lanserar en intern inkubator ledd av Alejandro Matamala Ortiz (medgrundare, innovationschef). Runway Labs kommer att prototypa radikalt nya applikationer för generativ video och världssimuleringsmodeller (General World Models) inom olika sektorer: film, hälsa, utbildning, datorspel, reklam, fastigheter. Rekrytering är öppen.

🔗 Vi presenterar Runway Labs

Claude Code /btw — Ett nytt kommando /btw gör det möjligt att ha sidokonversationer (side chain conversations) medan en uppgift körs, utan att avbryta det pågående arbetet.

🔗 Tweet @bcherny

NotebookLM Flashcards — Uppdatering av quiz och flashcards: återuppta där man slutade, följ upp lyckade eller missade flashcards, möjlighet att ta bort eller blanda flashcards.

🔗 Tweet NotebookLM

Meta Canopy Height Maps v2 — Meta och World Resources Institute publicerar CHMv2, en ny version av globala kartor över skogarnas krontakshöjd. Modellen DINOv3 (Metas självövervakade visionmodell) förbättrar precisionen och den globala täckningen. Tillämpningar: klimatmigration, skogsrestaurering, stadsplanering. Modeller tillgängliga i open source.

🔗 Canopy Height Maps v2

Z.ai GLM-5 — GLM-5 är nu tillgänglig för Lite-användare (gratisnivå), efter att ha varit reserverad för Pro-användare sedan lanseringen i februari 2026.

🔗 Tweet @ZixuanLi_


Vad det betyder

Den 11 mars 2026 illustrerar två djupgående trender som konvergerar.

Den första är plattformiseringen av agentisk AI: OpenAI, Perplexity och GitHub publicerar samma dag kompletterande primitiver (shell tools, sandboxes, agent hooks, code review). Ekosystemet struktureras kring återanvändbara byggblock — skills, containrar, underagenter — som gör det möjligt för utvecklare att bygga tillförlitliga agenter utan att uppfinna infrastrukturen på nytt.

Den andra är kapplöpningen om custom-kisel: detaljnivån som Meta publicerar om sina fyra MTIA-generationer på två år avslöjar en tydlig strategi för oberoende från massmarknads-GPU:er, kalibrerad för inferens i stor skala. Samma logik driver NVIDIA att publicera Nemotron 3 Super samma dag som GTC, där annonseringarna hopar sig.

Skapandet av Anthropic Institute ingår i en mer diskret men varaktig rörelse: i takt med att kapaciteterna utvecklas strukturerar de stora AI-företagen sina team för samhällspåverkan — inte längre som en kommunikativ fasad, utan som en fullvärdig forskningsinsats.


Källor

Detta dokument har översatts från versionen fr till språket sv med hjälp av modellen gpt-5.5. För mer information om översättningsprocessen, se https://gitlab.com/jls42/ai-powered-markdown-translator