Anthropic Institute, Perplexity Everything is Computer, OpenAI Responses API: 2026년 3월 11일

2026년 3월 11일은 매우 바쁜 하루입니다. Anthropic은 강력한 AI가 제기하는 공적 논의를 위한 학제간 연구소를 설립하고, Perplexity는 4개의 API를 동시에 선보이며 “Computer” 비전을 전개하고, OpenAI는 Responses API의 새로운 에이전트형 프리미티브를 공개하며, Meta는 2년 동안 개발한 4세대 custom AI 칩을 자세히 설명합니다.

Anthropic Institute: Jack Clark이 이끄는 공익

2026년 3월 11일 — Anthropic은 강력한 AI가 제기하는 과제에 대한 공적 논의를 진전시키기 위한 새로운 노력인 The Anthropic Institute를 출범합니다. 이 이니셔티브는 공동 창업자 Jack Clark이 이끌며, 그는 Anthropic에서 “Head of Public Benefit”(공익 책임자)이라는 새로운 역할을 맡습니다.

이 연구소는 연구자, 경제학자, 법률가, 공공정책 전문가로 구성된 학제간 팀을 모으고, Anthropic의 최첨단 모델에 대한 독보적인 접근 권한을 갖게 됩니다. 임무는 AI가 발전함에 따라 그 사회적, 경제적, 보안상 영향을 분석하고 전달하는 것입니다.

첫 세 명의 합류 인원이 발표되었습니다.

합류 인원	경력
Matt Botvinick	Resident Fellow, Yale Law School; 전 Google DeepMind Senior Director of Research
Anton Korinek	경제학 교수(안식년), Economic Research 팀
Zoë Hitzig	전 OpenAI, AI의 사회적·경제적 영향 전문

이 연구소는 Anthropic의 기존 팀인 Frontier Red Team, Societal Impacts, Economic Research를 기반으로 합니다. 동시에 Anthropic은 모델 투명성, 에너지 소비자 보호, 수출 통제, 글로벌 AI 거버넌스에 초점을 맞춘 Public Policy 팀의 확대도 발표합니다.

이 연구소의 설립은 주목할 만한 단계입니다. Anthropic이 공적 참여를 공식적으로 구조화하고, 공동 창업자 중 한 명을 통해 그 얼굴을 부여한 것입니다.

🔗 The Anthropic Institute 소개

Perplexity: “Everything is Computer” 비전의 조율된 출시

2026년 3월 11일 — Perplexity는 “Computer” 비전, 즉 개인용 및 업무용 컴퓨터로서의 AI를 중심으로 한 조율된 출시를 이루는 네 가지 발표를 동시에 공개합니다.

Personal Computer 및 Enterprise

Personal Computer는 24시간 작동하는 전용 Mac mini로, 로컬 애플리케이션과 Perplexity 서버에 연결됩니다. 이는 사용자의 디지털 프록시처럼 작동하며, 민감한 작업에는 명시적 승인이 필요합니다. 대기자 명단이 열렸습니다.

Computer for Enterprise는 Snowflake, Salesforce, HubSpot 및 수백 개의 플랫폼에 연결됩니다. 스킬(skills)은 맞춤 설정할 수 있으며, Slack 통합을 통해 DM이나 공유 채널에서 작업할 수 있습니다. SOC 2 Type II, SAML SSO 및 감사 로그(audit logs)를 기반으로 합니다. Perplexity는 16,000개 요청에 대한 내부 연구에서 나온 수치를 제시합니다. 인건비 160만 달러 절감, 4주 만에 3.25년 분량의 작업 완료입니다.

Comet Enterprise는 관리자 제어 기능(도메인별 권한, 작업 로그, MDM)을 갖춘 네이티브 AI 브라우저이며, 브라우저 수준의 보호를 위한 CrowdStrike 파트너십을 포함합니다.

Perplexity Finance는 SEC filings, FactSet, S&P Global, Coinbase, LSEG, Quartr, Polymarket 등 40개 이상의 실시간 금융 도구를 제공하며, 실제 포트폴리오 분석을 위해 Plaid를 통한 브로커 연결을 지원합니다.

Premium Sources는 검색 흐름 안에서 Statista, CB Insights, PitchBook에 직접 접근할 수 있게 해 줍니다. 유료 출처는 자동으로 인용됩니다.

🔗 Everything is Computer

Agent API: 완전한 orchestration runtime

Agent API는 통합 검색, 도구 실행, 멀티 모델 orchestration을 갖춘 에이전트형 workflow를 구축하기 위한 관리형 runtime입니다. 이는 모델 라우터, 검색 계층, embeddings 공급자, sandbox 서비스, monitoring stack을 하나의 통합 지점으로 대체합니다.

통합 도구	기능
`web_search`	도메인, 최신성, 날짜 범위, 언어, 콘텐츠 예산 기준 필터링
`fetch_url`	URL 직접 검색
맞춤 함수	완전 지원

네 가지 최적화 프로필(presets)이 사용 사례를 다룹니다. 빠른 사실 검색, 균형 잡힌 검색, 심층 멀티 소스 분석, 기관용 검색입니다. Deep Research 2.0은 advanced-deep-research 프로필을 통해 사용할 수 있으며, 요청당 수십 건의 검색을 실행하고 수백 개의 문서를 처리합니다.

Agent API는 모델에 구애받지 않으며, 100%에 가까운 가용성을 위해 멀티 모델 fallback chains를 지원하고, docs.perplexity.ai에서 오늘부터 사용 가능합니다.

🔗 Agent API

Search API: 개선된 snippets 및 SEAL benchmark

Search API 업데이트는 발췌문(snippets)의 품질과 평가 인프라에 초점을 맞춥니다.

새로운 fragment 수준 라벨링(span-level labeling) pipeline은 소스 문서의 어떤 segment가 요청과 관련 있는지 식별합니다. 그 결과 더 작고 더 정확한 발췌문이 생성되어 token 비용을 줄이고 downstream 모델의 context 관리를 개선합니다.

SEAL benchmark는 답이 시간에 따라 변하는 질문에 retrieval 시스템이 답할 수 있는지를 테스트합니다. 다른 공급자들이 하락하는 동안 Perplexity는 SEAL-Hard에서 향상됩니다. search_evals framework는 GitHub에서 open source로 업데이트됩니다.

기타 개선 사항으로는 멀티 요청 지원(단일 API 요청에서 최대 5개), 언어(ISO 639-1 코드) 및 국가별 필터링, 그리고 세 API를 모두 네이티브로 지원하는 Python SDK(pip install perplexityai)가 있습니다.

🔗 Search API 업데이트

Sandbox API: 에이전트를 위한 격리된 코드 실행

Perplexity는 내부 코드 실행 환경을 독립형 서비스로 공개합니다. 각 세션은 격리된 Kubernetes pod에서 실행되며, 지속 파일 시스템이 마운트됩니다. 지원 언어는 Python, JavaScript, SQL입니다. 실행 시점(at runtime)의 package 설치도 가능합니다.

세션은 지속 상태(stateful)를 가집니다. 한 단계에서 생성된 파일은 다음 단계에서 사용할 수 있으며, 긴 workflow는 일시 중지한 뒤 몇 시간 후 재개할 수 있습니다. 보안은 zero-trust 모델을 기반으로 합니다. 직접적인 네트워크 접근은 없고, outbound 트래픽은 proxy를 거치며, 코드는 raw API key에 절대 접근하지 않습니다.

Sandbox API는 동일한 API key와 동일한 credit으로 Agent API에 통합할 수 있게 될 예정입니다. 상태: 곧 private beta.

🔗 Sandbox API

OpenAI: Responses API가 에이전트를 위한 컴퓨팅 환경을 갖추다

2026년 3월 11일 — OpenAI는 신뢰할 수 있는 자율 에이전트를 구축하기 위한 Responses API의 새로운 프리미티브를 상세히 설명하는 엔지니어링 글을 공개합니다. Unix shell tool, 호스팅 컨테이너, 네이티브 context compaction, 재사용 가능한 agent skills입니다.

shell tool

shell tool은 모델이 command line을 통해 컴퓨터와 상호작용할 수 있게 하며, grep, curl, awk 같은 classic Unix 유틸리티에 접근할 수 있습니다. Python만 실행하던 기존 code interpreter와 달리 shell tool은 Go, Java, Node.js 및 기타 환경을 지원합니다. GPT-5.2 및 이후 모델은 shell command를 제안하도록 훈련되었습니다.

Responses API는 별도 컨테이너 세션을 통해 여러 shell command를 병렬로 실행할 수 있으며, context window가 포화되는 것을 방지하기 위해 command별 출력 상한을 적용합니다.

호스팅 컨테이너

컨테이너는 모델의 작업 공간을 구성합니다.

구성 요소	설명
파일 시스템	container 및 file APIs를 통한 리소스 업로드, 정리 및 관리
데이터베이스	구조화된 저장소(SQLite) — 모델은 전체 내용을 로드하는 대신 table을 query함
네트워크 접근	허용 목록을 갖춘 중앙화된 egress proxy, 도메인별 secret injection

네이티브 context compaction

장시간 작업을 위해 Responses API는 네이티브 compaction 메커니즘을 통합합니다. 모델은 대화 상태의 compact하고 암호화된 표현을 생성하도록 훈련됩니다. 서버 측에서 사용 가능하며(임계값 설정 가능), 또는 /compact endpoint를 통해 사용할 수 있습니다. Codex는 이 메커니즘을 사용해 성능 저하 없이 장시간 coding session을 유지합니다.

Agent skills

skills(에이전트 스킬)는 반복적인 workflow patterns를 재사용 가능한 bundle로 조건화합니다. 이는 SKILL.md 파일과 관련 리소스가 포함된 폴더입니다. Responses API는 prompt를 모델에 보내기 전에 skill을 context에 자동으로 로드합니다. skills는 API를 통해 관리되며 versioning됩니다.

동시에, 개발자 blog 글은 다섯 가지 고객 사례 연구와 함께 Responses API 1주년을 기념합니다. 두 게시물은 플랫폼이 에이전트형으로 진화하는 모습을 일관되게 보여 줍니다.

🔗 Responses API + 컴퓨팅 환경 🔗 Responses API 1년

OpenAI: prompt injection 방어 전략

2026년 3월 11일 — OpenAI는 prompt injection 공격에 대한 AI 에이전트의 저항성에 관한 보안 글을 공개합니다.

초기 공격은 외부 콘텐츠(Wikipedia 페이지, 이메일)에 직접적인 지시문을 삽입하는 방식이었습니다. 모델이 개선되면서 이러한 공격은 social engineering으로 진화했습니다. 설득력 있는 업무 맥락, 가장된 긴급성, 주장된 승인 등이 활용됩니다. 글에서 설명하는 2025년의 한 예시는 이전 버전의 ChatGPT에서 50%의 성공률을 보인 공격이었습니다.

OpenAI는 이 문제를 삼자 시스템(고용주 / 에이전트 / 악의적 제3자)의 관점에서 다룹니다. 이는 조작 시도에 노출된 인간 고객 서비스 상담원과 유사합니다. 목표는 모든 공격을 완벽하게 식별하는 것이 아니라, 성공한 조작의 영향을 제한하는 것입니다.

대응 조치	설명
source-sink 분석	신뢰할 수 없는 콘텐츠 + 위험한 작업 조합 탐지
Safe Url	대화의 정보가 제3자에게 전달될지 탐지 — 확인을 요청하거나 차단
애플리케이션 sandbox	Canvas 및 ChatGPT Apps가 예상치 못한 통신을 감지하고 동의를 요청

Safe Url은 Atlas의 탐색뿐 아니라 Deep Research의 검색 및 탐색에도 적용됩니다.

🔗 prompt injection에 저항하도록 AI 에이전트 설계하기

Meta MTIA: 2년 만에 4세대 AI 칩

2026년 3월 11일 — Meta는 custom AI 칩 제품군인 MTIA(Meta Training and Inference Accelerator)에 관한 상세 기술 글을 공개합니다. Meta는 2년 만에 수십억 명의 사용자를 더 낮은 비용으로 서비스하기 위해 4세대를 연속 개발했습니다.

“AI models are evolving faster than traditional chip development cycles.”

🇰🇷 AI 모델은 전통적인 칩 개발 주기보다 더 빠르게 진화하고 있습니다.

세대	주요 혁신
MTIA 300	ranking 및 recommendation 모델(Ranking & Recommendation)에 최적화된 첫 번째 칩, 재사용 가능한 모듈형 기반
MTIA 400	GenAI workload로의 진화, 단일 scale-up domain 안에 72개 칩 rack
MTIA 450	HBM bandwidth 2배, MX4 FLOPS +75%, attention 및 FFN hardware acceleration
MTIA 500	MTIA 450 대비 HBM bandwidth +50%, GenAI inference에 집중

MTIA 300에서 MTIA 500까지의 진전은 HBM bandwidth 4.5배, FLOPS 25배 증가입니다. Meta의 전략은 높은 속도의 개발(매년 새로운 칩), pre-training이 아닌 inference 중심, 그리고 PyTorch와의 네이티브 통합에 기반합니다.

“Mainstream GPUs are typically built for the most demanding workload — large-scale GenAI pre-training — while Meta’s primary need is inference.”

🇰🇷 주류 GPU는 일반적으로 가장 demanding한 workload인 대규모 GenAI pre-training을 위해 설계되는 반면, Meta의 주된 필요는 inference입니다.

기본 프로세서 아키텍처(Processing Element)는 두 개의 vector RISC-V core, Dot Product Engine, Special Function Unit, reduction engine, DMA를 결합합니다. software stack은 PyTorch, vLLM, Triton 및 전용 MTIA compiler를 기반으로 하며, plugin 아키텍처를 통한 vLLM 통합을 포함합니다.

🔗 Meta MTIA: 수십억 명을 위한 AI 칩 scaling

Gemini CLI v0.33.0: 강화된 Plan Mode와 A2A 인증

2026년 3월 11일 — Gemini CLI가 Plan Mode를 도입했던 v0.32.0 이후 2주 만에 v0.33.0 버전을 공개했다.

카테고리	새로운 기능
에이전트 아키텍처	원격 A2A 에이전트를 위한 HTTP 인증, 인증된 A2A 에이전트 카드 탐색
Plan Mode	내장 연구 하위 에이전트, 사용자 피드백용 주석 지원, 새로운 하위 명령 `copy`
CLI 인터페이스	ASCII 아이콘이 포함된 컴팩트 헤더, 컨텍스트 창 역순 표시, 채팅 기록 기본 30일 보존

A2A(Agent-to-Agent) 프로토콜을 위한 HTTP 인증 추가가 가장 중요한 기술적 신규 기능이다. Gemini CLI는 이제 원격 에이전트를 탐색하고 인증할 수 있어, 안전한 멀티 에이전트 오케스트레이션의 기반을 마련한다.

🔗 Gemini CLI 변경 로그

Chrome의 Gemini: 인도, 뉴질랜드, 캐나다로 확장

2026년 3월 11일 — Google이 Chrome의 AI 기능을 인도, 뉴질랜드, 캐나다라는 세 신규 시장으로 확대한다.

Gemini 3.1 기반의 사이드 패널 AI 어시스턴트인 Gemini in Chrome은 이제 이 지역의 Mac, Windows, Chromebook Plus에서 사용할 수 있다. 배포된 기능에는 Chrome에서 Gmail, Maps, Calendar, YouTube 접근, 여러 열린 탭의 교차 분석, Nano Banana 2를 통한 브라우저 내 이미지 직접 변환이 포함된다. 이번 업데이트는 힌디어, 프랑스어, 스페인어를 포함해 50개 이상의 추가 언어도 더한다.

🔗 Chrome, 인도·뉴질랜드·캐나다로 확장

AlphaEvolve: 5개의 Ramsey 수에 대한 새로운 경계

2026년 3월 11일 — Pushmeet Kohli(Google DeepMind)는 AlphaEvolve가 극값 조합론에서 5개의 고전적 Ramsey 수에 대해 새로운 하한을 확립했다고 발표했다. 이는 Erdős 자신도 그 복잡성을 언급했을 만큼 어려운 문제들이며, 이전 최고 결과들은 최소 10년 전의 것이었다.

AlphaEvolve는 필요한 탐색 절차를 자동으로 발견하는 메타 알고리즘처럼 작동한다. 역사적으로는 특정 알고리즘을 수작업으로 설계해야 했던 영역이다. 이 결과는 AlphaEvolve가 이미 알려져 있던 Google 커널 최적화를 넘어서는 역량을 보여준다.

🔗 Pushmeet Kohli 트윗

Gemini Embedding 2: Google의 첫 멀티모달 embedding

2026년 3월 10일 — Google이 Gemini Embedding 2를 발표했다. 이는 “our most capable and first fully multimodal embedding model”이라고 설명된다. Google의 첫 네이티브 멀티모달 embedding 모델이며, 개발자는 Gemini API와 AI Studio를 통해 사용할 수 있다.

🔗 @googleaidevs 트윗

GitHub Copilot: 터미널에서의 코드 리뷰와 JetBrains 진전

2026년 3월 11일 — GitHub Copilot에 두 가지 주목할 만한 업데이트가 있었다.

GitHub CLI v2.88.0에서 Code Review

이제 터미널에서 직접 Copilot 코드 리뷰를 요청할 수 있다. gh pr edit --add-reviewer @copilot(비대화형 모드)와 gh pr create(대화형 모드) 명령은 Copilot을 팀원들과 함께 통합한다. 리뷰어 선택에는 동적 검색이 적용되어 대규모 조직에서 성능을 개선하고 접근성 문제를 수정한다. Copilot code review가 포함된 모든 플랜에서 사용할 수 있으며, GitHub CLI v2.88.0으로 업데이트해야 한다.

🔗 GitHub CLI에서 Code Review

JetBrains IDE를 위한 에이전트형 개선

JetBrains plugin 업데이트는 일반 제공(GA)으로 맞춤형 에이전트(custom agents), 하위 에이전트와 계획 에이전트(plan agent), 그리고 모든 플랜에 대한 자동 모델 선택을 제공한다. 공개 미리보기(public preview)로는 .github/hooks/의 hooks.json 파일을 통한 에이전트 hooks(userPromptSubmitted, preToolUse, postToolUse, errorOccurred)와 AGENTS.md 및 CLAUDE.md 파일 지원이 포함된다.

그 밖의 개선 사항도 업데이트에 포함된다. MCP별 구성 가능한 자동 승인, 확장 추론 모델을 위한 사고 패널, 컨텍스트 창 사용량 표시기, 메뉴에서 Edit 모드 사용 중단이다.

🔗 JetBrains 개선 사항

웹의 Copilot에서 저장소 탐색

공개 미리보기로, Copilot 웹 인터페이스에서 GitHub 저장소의 트리 구조를 직접 탐색할 수 있다. 선택한 파일은 채팅에 임시 참조로 자동 추가되며, 영구 참조로 만들 수도 있다.

🔗 Copilot에서 저장소 탐색

Anthropic Sydney와 Claude for Office

Sydney, 아시아태평양 4번째 사무소

2026년 3월 10일 — Anthropic은 Sydney에 사무소를 곧 개설한다고 발표했다. 이는 도쿄, 서울, 싱가포르에 이어 아시아태평양 지역 네 번째 사무소다. 호주는 1인당 Claude.ai 사용량 기준 세계 4위이며, 뉴질랜드는 같은 지표(Anthropic Economic Index)에서 8위다. 이 사무소는 초기에는 기업 고객, 스타트업, 연구에 집중할 예정이다.

🔗 Sydney, 아시아태평양 4번째 사무소

Claude for Excel 및 PowerPoint: 공유 컨텍스트와 Office Skills

2026년 3월 11일 — Claude for Excel 및 Claude for PowerPoint add-in에 두 가지 중요한 업데이트가 적용된다. 두 애플리케이션 간 컨텍스트 공유(분석가가 하나의 대화 안에서 Excel 통합 문서의 데이터를 추출해 PowerPoint 프레젠테이션에 사용할 수 있음)와, 두 add-in에 Skills(한 번의 클릭으로 재사용 가능한 workflows)가 도입되는 것이다.

사전 탑재된 Skills는 가장 빈번한 사용 사례를 포괄한다. 수식 감사, LBO/DCF 모델 구축, 경쟁 환경 덱, 새 데이터로 프레젠테이션 업데이트, 투자은행 덱 리뷰 등이다. add-in은 이제 규정 준수 배포를 위해 Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry를 통해서도 사용할 수 있다. 이용 가능 환경: 유료 플랜(Pro, Max, Team, Enterprise)의 Mac 및 Windows.

🔗 Claude for Excel 및 PowerPoint

NVIDIA Nemotron 3 Super, ComfyUI와 GTC 2026

2026년 3월 11일 — NVIDIA는 GTC 2026을 중심으로 매우 활발하게 움직이고 있다.

Nemotron 3 Super는 이전 세대 대비 에이전트형 AI에 5배 높은 처리량을 제공한다. 이는 1,200억 매개변수의 오픈소스 MoE(Mixture of Experts) 모델로, 고빈도 추론 워크로드에 최적화되어 있다.

NVIDIA와 ComfyUI는 GDC 2026(Game Developers Conference)에서 게임 개발자와 크리에이터를 위한 로컬 AI 동영상 생성을 단순화하는 통합을 발표했다. FLUX 및 LTX-Video 모델을 지원한다.

NVIDIA 블로그 GTC 2026 Live Updates는 San Jose에서 열리는 컨퍼런스의 실시간 발표를 모아 제공한다. 이 자리에서 Mistral AI도 frontier 모델을 소개한다.

🔗 Nemotron 3 Super 🔗 ComfyUI GDC 🔗 GTC 2026 Live

간단히

Runway Labs — Runway가 공동 창업자이자 혁신 책임자인 Alejandro Matamala Ortiz가 이끄는 내부 인큐베이터를 출범한다. Runway Labs는 영화, 의료, 교육, 비디오 게임, 광고, 부동산 등 다양한 분야에서 생성형 동영상과 세계 시뮬레이션 모델(General World Models)을 위한 급진적으로 새로운 애플리케이션을 프로토타이핑할 예정이다. 채용이 열려 있다.

🔗 Runway Labs 소개

Claude Code /btw — 새로운 명령 /btw을 통해 작업이 실행 중인 동안 현재 작업을 중단하지 않고 사이드 대화(side chain conversations)를 할 수 있다.

🔗 @bcherny 트윗

NotebookLM Flashcards — 퀴즈와 flashcards 업데이트: 중단한 지점부터 재개, 성공하거나 실패한 flashcards 추적, flashcards 삭제 또는 섞기 기능.

🔗 NotebookLM 트윗

Meta Canopy Height Maps v2 — Meta와 World Resources Institute가 전 세계 산림 수관 높이 지도인 CHMv2의 새 버전을 공개한다. Meta의 자기지도 비전 모델 DINOv3가 정확도와 전 세계 커버리지를 개선한다. 활용 분야: 기후 이주, 산림 복원, 도시 계획. 모델은 오픈소스로 제공된다.

🔗 Canopy Height Maps v2

Z.ai GLM-5 — GLM-5는 2026년 2월 출시 이후 Pro 사용자에게만 제공되다가 이제 Lite 사용자(무료 등급)도 접근할 수 있다.

🔗 @ZixuanLi_ 트윗

이것이 의미하는 것

2026년 3월 11일은 수렴하는 두 가지 근본적 흐름을 보여준다.

첫 번째는 에이전트형의 플랫폼화다. OpenAI, Perplexity, GitHub는 같은 날 보완적인 primitive(shell tools, sandboxes, agent hooks, code review)를 공개했다. 생태계는 skills, 컨테이너, 하위 에이전트 같은 재사용 가능한 블록을 중심으로 구조화되고 있으며, 개발자가 인프라를 다시 발명하지 않고도 신뢰할 수 있는 에이전트를 구축할 수 있게 한다.

두 번째는 맞춤형 실리콘 경쟁이다. Meta가 2년 동안의 네 세대 MTIA에 대해 공개한 세부 내용은 대중 시장 GPU에 대한 의존에서 벗어나려는 명확한 전략을 보여주며, 대규모 추론에 맞춰 조정되어 있다. 같은 논리가 NVIDIA가 발표가 쏟아지는 GTC 당일 Nemotron 3 Super를 공개하게 만든다.

Anthropic Institute의 설립은 더 조용하지만 지속적인 움직임의 일부다. 역량이 발전하는 가운데, 대형 AI 기업들은 공공 영향 팀을 구조화하고 있다. 더 이상 겉치레식 커뮤니케이션이 아니라, 독립적인 연구 노력으로서다.

출처

이 문서는 gpt-5.5 모델을 사용하여 프랑스어 버전에서 한국어로 번역되었습니다. 번역 과정에 대한 자세한 정보는 https://gitlab.com/jls42/ai-powered-markdown-translator 를 참조하세요.