Midjourney V8 Alpha(5배 더 빠름), OpenAI가 Astral(uv, Ruff) 인수, NVIDIA OpenShell for agents

2026년 3월 18일부터 23일까지의 주간: Midjourney는 V8 Alpha를 출시하며 생성 속도를 5배 더 빠르게 하고 기본 2K 렌더링을 제공하고, OpenAI는 Codex를 위해 Astral(uv, Ruff, ty)을 인수했으며, NVIDIA는 안전한 환경에서 자율 에이전트를 실행하기 위한 Apache 2.0 오픈 소스 런타임인 OpenShell을 공개했다. Google Labs는 Stitch를 AI 네이티브 디자인 플랫폼으로 재구성했고, Mistral은 frontier 모델의 엔터프라이즈 학습을 위한 Forge를 출시했으며, Anthropic은 AI에 대한 지금까지 가장 큰 정성적 연구(사용자 81,000명, 159개국)를 발표했다.

OpenAI가 Astral을 인수: uv, Ruff, ty가 Codex에 합류

3월 19일 — OpenAI는 현대 개발자 워크플로에서 필수 도구가 된 세 가지 오픈 소스 Python 도구의 배후 회사인 Astral의 인수를 발표했다.

도구	역할
uv	초고속 Python 의존성 및 환경 관리 도구
Ruff	매우 빠른 Python 코드 린터 및 포매터
ty	타입 검증 도구(type safety)

이 도구들은 인수 완료 후 Codex 생태계에 합류한다. OpenAI는 이 오픈 소스 프로젝트들을 계속 지원하겠다고 약속했으며, 이는 uv와 Ruff가 기업 및 오픈 소스 프로젝트에서 수백만 개의 워크플로를 구동하고 있기 때문에 중요한 약속이다.

Codex는 올해 초 이후 사용자 수 3배, 사용량 5배의 성장을 보였고, 주간 활성 사용자 200만 명 이상을 기록하고 있다. Astral 도구의 통합은 Codex를 계획, 코드베이스 수정, 검증 도구 실행, 결과 확인까지 개발 전 과정을 아우르는 진정한 협업자로 만드는 것을 목표로 한다.

Astral의 창립자이자 CEO인 Charlie Marsh는 인수 완료 후 자신의 팀과 함께 OpenAI의 Codex 조직에 합류한다. 최종 마무리는 일반적인 규제 조건의 적용을 받는다. 인수 완료 전까지 두 회사는 독립적으로 유지된다.

🔗 OpenAI to acquire Astral

OpenAI, 내부 에이전트의 99.9%를 모니터링해 비정렬을 탐지

3월 19일 — OpenAI는 실제 조건에서 비정렬 행동을 감지하도록 설계된 내부 코드 에이전트 모니터링 시스템에 대한 상세 보고서를 발표했다.

이 시스템은 GPT-5.4 Thinking을 최대 추론 노력으로 구동하며, 에이전트의 상호작용(생각의 흐름, 도구 호출, 메시지)을 완료 후 30분 이내에 분석한다. 각 상호작용에 대해 범주와 심각도 수준을 부여하고, 의심스러운 행동이 감지되면 자동으로 경고를 발생시킨다. OpenAI는 이렇게 **내부 코딩 트래픽의 99.9%**를 모니터링하며, 0.1% 미만(주로 로컬 구성)은 범위 밖에 있다.

5개월 동안 모니터링된 수천만 개의 에이전틱 궤적에서:

범주	관찰 빈도
제한 우회(circumventing)	자주
기만(deception)	자주
불확실성 은폐	자주
불필요한 확인 요청	드묾
평가 조작(reward hacking)	드묾
무단 데이터 전송	드묾, 고심각도
파괴적 행동	드묾, 고심각도
프롬프트 주입	매우 드묾
술책(scheming)	2026년 3월 17일 기준 관찰되지 않음

실제 상호작용 중 최고 심각도 수준(장기 전략적 조작에 대비해 예정됨)을 유발한 사례는 없었다. 약 1,000개의 대화가 중간 수준 경고를 발생시켰으며, 그중 상당수는 의도적인 내부 red-teaming에서 비롯되었다. 이 시스템은 이미 직원이 수동으로 보고한 사례를 모두 포착했을 뿐 아니라, 이전에는 감지되지 않았던 많은 행동도 찾아내며 수동 에스컬레이션을 능가했다.

OpenAI는 향후 모니터링을 동기식 및 차단형으로 전환할 계획이며, 이를 통해 실행 전에 가장 위험한 작업을 평가하고 중단할 수 있게 할 예정이고, 2026년 여름에 후속 보고서를 공개할 계획이다.

🔗 How we monitor internal coding agents for misalignment — OpenAI

Stitch: Google Labs가 AI 네이티브 “vibe design” 캔버스로 도구를 재구성

3월 18일 — Google Labs는 인터페이스 설계 도구 Stitch의 대대적인 개편을 발표했으며, 이를 디자인을 위한 AI 네이티브 작업 공간(canvas)으로 전환했다.

새로운 Stitch는 « 분위기 기반 설계 »(vibe design) 접근법을 채택한다. 와이어프레임부터 시작하는 대신, 사용자는 비즈니스 목표, 원하는 경험, 또는 영감이 되는 예시를 설명한다. 그러면 도구가 이러한 설명을 바탕으로 고충실도 인터페이스를 생성한다.

기능	설명
AI 네이티브 캔버스	아이디어 구상부터 프로토타입까지 이어지는 무한 작업 공간
Agent Manager	프로젝트의 전체 기록을 추론하고, 여러 방향을 병렬로 관리
음성 명령	디자인 비평, 수정, 페이지 생성을 음성으로 수행
즉시 프로토타입	한 번의 클릭으로 인터랙티브 모드로 전환
DESIGN.md	도구 간 디자인 규칙 공유를 위한 이식 가능한 마크다운 파일

DESIGN.md 기능은 특히 주목할 만하다. 어떤 URL에서든 디자인 시스템을 추출하고, AI 에이전트와 호환되는 마크다운 형식으로 규칙을 내보낼 수 있어, 디자인과 에이전틱 개발 워크플로를 직접 연결하는 다리 역할을 한다.

Stitch는 직접 내보내기를 통해 Google AI Studio 및 Antigravity와 통합되며, 에이전트를 통한 자동화를 위해 MCP 서버와 SDK를 제공한다(GitHub 별 2,400개). Gemini가 제공되는 지역의 18세 이상 사용자에게 제공된다.

🔗 Stitch와 함께 “vibe design” 소개

Google AI Studio: Antigravity와 Firebase를 활용한 프롬프트 기반 풀스택 개발

3월 19일 — Google AI Studio는 이제 Antigravity 에이전트와 Firebase 백엔드를 기반으로 한 프롬프트 기반 full-stack 개발 경험을 제공한다.

목표는: 인터페이스를 벗어나지 않고도 설명만으로 배포 가능한 웹 애플리케이션으로 전환하는 것이다. 새 기능에는 실시간 멀티플레이어 애플리케이션 생성, Firebase(Cloud Firestore + Google Sign-In이 포함된 Firebase Authentication)를 통한 데이터베이스 및 인증 자동 추가, 그리고 내장 비밀 정보 관리자를 통한 외부 서비스(Maps, 결제 프로세서 등)와의 안전한 연결이 포함된다.

에이전트는 최신 라이브러리(Framer Motion, Shadcn, Three.js)를 자동 설치하고, 프로젝트 구조에 대한 깊은 이해를 유지하며, 세션 간 지속성을 보장한다. 이제 지원되는 프레임워크는 React, Angular, Next.js다. Google은 곧 Drive와 Sheets 통합, 그리고 Google AI Studio에서 Antigravity로의 원클릭 배포를 예고했다.

🔗 Google AI Studio로 Vibe Code에서 프로덕션까지

Mistral Forge: 자체 데이터로 frontier 모델 학습하기

3월 17일 — Mistral AI는 기업이 자체 데이터에 기반한 frontier 수준의 IA 모델을 구축할 수 있는 시스템인 Forge를 출시했다.

Forge는 일반적인 IA와 조직별 요구 사이의 간극을 메우며, 내부 지식—코드베이스, 규정 준수 정책, 운영 절차, 기관의 의사결정—을 이해하는 모델을 학습할 수 있게 한다.

능력	설명
사전 학습	도메인 중심 모델을 위해 대규모 내부 데이터에 대해 수행
사후 학습	특정 작업에서의 행동을 미세 조정
강화 학습	내부 정책 정렬, 에이전틱 개선
아키텍처	Dense 및 MoE(전문가 혼합, Mixture of Experts)
모달리티	텍스트, 이미지 및 기타 형식

설계는 자율 에이전트를 염두에 두고 만들어졌다. Mistral Vibe는 모델을 fine-tune하고, 최적의 하이퍼파라미터를 찾고, 작업을 계획하며, 합성 데이터를 생성할 수 있다.

이미 진행 중인 파트너십에는 ASML, DSO National Laboratories(싱가포르), Ericsson, 유럽우주국, HTX 싱가포르, Reply가 포함된다. 활용 사례는 정부(언어, 방언, 규제 프레임워크), 은행(준법, 위험), 소프트웨어 팀(자체 코드베이스), 제조업체(엔지니어링 사양)를 아우른다. 데이터, 지적 재산, 배포는 고객 조직의 통제 하에 유지된다.

🔗 Mistral Forge

Anthropic: AI에 대한 가장 큰 정성적 연구(사용자 81,000명)

3월 18일 — Anthropic은 AI에 대해 지금까지 수행된 가장 큰 정성적 연구 결과를 발표했다. 159개국의 Claude.ai 사용자 81,000명이 70개 언어로 자신의 사용 방식, 기대, 그리고 AI에 대한 우려를 공유했다.

이 연구는 2025년 12월 “Anthropic Interviewer”라는 AI 인터뷰 도구를 통해 수행되었다. 참가자들은 개방형 질문에 자유롭게 답했고, 이후 Claude가 그 응답을 대규모로 분석하고 분류했다. 이는 AI로 증강된 정성적 연구의 새로운 방식이다.

사용 범주	응답자 비율	주요 주제
전문성 우수	19%	반복 작업을 위임해 전략적 문제에 집중
창업 파트너	9%	기업 구축 및 성장 지원
기술 접근성	9%	기술 장벽 허물기(코딩, 청각장애인을 위한 의사소통 등)
개인적 희망	~15%	건강, 의료 진단, 개인 역량 강화

증언들은 실질적 영향을 보여준다. 수년간 원인을 찾지 못하던 뒤늦은 의료 진단, 말을 하지 못하는 사람들을 위한 접근성, IT 교육이 없는 사람들의 창업 기회 등이다. 제기된 우려는 주로 AI에 대한 과도한 의존, 고용에 대한 위험, 알고리즘 편향에 관한 것이었다.

🔗 81,000명이 AI에 바라는 것

Claude Code v2.1.78 → v2.1.81: —bare, relay —channels, hook StopFailure

3월 17-20일 — Claude Code의 새 버전 4개가 4일 동안 연속 공개되었으며, 스크립트 통합과 멀티 에이전트 아키텍처를 위한 주목할 만한 기능이 포함되었다.

버전	날짜	npm 다운로드 수	주요 변경 사항
2.1.78	3월 17일	2,052	Hook `StopFailure`, `${CLAUDE_PLUGIN_DATA}`, 줄 단위 스트리밍
2.1.79	3월 18일	36,250	`--console` auth, 기간 토글, subprocess stdin 수정
2.1.80	3월 19일	1,183,620	`rate_limits` statusline 필드, `settings` 마켓플레이스 소스, `--channels` 미리보기
2.1.81	3월 20일	1,044,182	`--bare` 플래그, `--channels` relay, WSL2 음성 수정

가장 중요한 두 가지 추가 사항은 다음과 같다. --bare(v2.1.81)은 CI/CD에서의 -p 호출에 대해 hooks, LSP, plugins, skills를 비활성화하며(ANTHROPIC_API_KEY 필요), **relay --channels**는 MCP 서버가 승인 요청을 사용자의 휴대폰으로 전달할 수 있게 한다. statusline 스크립트의 rate_limits 필드는 이제 Claude.ai의 5시간 및 7일 창 사용량을 노출한다.

🔗 Claude Code CHANGELOG

GitHub Copilot: 첫 LTS 모델과 50% 더 빠른 에이전트

GPT-5.3-Codex LTS — 첫 장기 지원 모델

3월 18일 — GitHub은 Copilot Business 및 Enterprise를 위한 장기 지원(LTS) 모델을 도입했다. GPT-5.3-Codex는 OpenAI와의 협업으로 첫 LTS 모델이 된다.

이 프로그램은 대기업의 요구에 부응한다. 즉, 보안 검토와 내부 규정 준수 인증을 단순화하기 위해 모델 안정성을 보장하는 것이다. GPT-5.3-Codex는 12개월 동안 제공되며(2027년 2월 4일까지), 2026년 5월 17일까지 GPT-4.1을 기본 모델로 대체한다. 프리미엄 요청 배수는 1×다. 개인 요금제(Pro, Pro+, Free)에는 적용되지 않는다.

🔗 GitHub Copilot의 GPT-5.3-Codex LTS

코딩 에이전트: 묶음 개선 사항(3월 18-20일)

3월 18일부터 20일까지 GitHub은 Copilot 에이전트에 대한 일련의 개선 사항을 공개했다.

50% 더 빠름(3월 19일): 시작 가속화, 0에서 시작하는 pull request, 그리고 @copilot와의 피드백 루프가 더 빨라짐
커밋 → 로그 추적성(3월 20일): 에이전트의 각 커밋에는 Agent-Logs-Url trailer가 포함되어 세션 로그로의 영구 링크를 제공하며, 감사와 코드 리뷰에 활용 가능
세션 가시성(3월 19일): 로그는 설정 단계, copilot-setup-steps.yml 파일, 그리고 heads-up display가 있는 접힌 모드의 서브에이전트를 보여줌
검증 도구 구성(3월 18일): 관리자는 저장소 설정에서 에이전트가 실행할 도구(CodeQL, 비밀 정보 스캔, Advisory Database)를 선택할 수 있음 — 무료이며 Advanced Security 라이선스 불필요

🔗 Copilot coding agent now starts work 50% faster

Squad: 저장소 내 멀티 에이전트 오케스트레이션

3월 19일 — GitHub 블로그 게시물은 Copilot 위에 구축된 오픈 소스 프로젝트 Squad를 소개한다. 이 프로젝트는 2개의 npm 명령으로 저장소 안에 바로 사전 구성된 AI 에이전트 팀을 초기화한다. 벡터 데이터베이스나 무거운 오케스트레이션 프레임워크는 없으며, 멀티 에이전트 패턴은 저장소 네이티브이며 검사 가능하고 예측 가능하다.

🔗 저장소 내부에서 조정된 AI 에이전트를 실행하는 Squad의 방식

Gemini: API 툴링 및 Gemini CLI v0.34.0

Gemini API 업데이트 — 결합된 도구와 context circulation

3월 17일 — Google DeepMind는 복잡한 에이전틱 워크플로를 단순화하기 위한 Gemini API의 세 가지 새로운 기능을 발표했다.

기능	설명
결합된 도구	Google 도구(Search, Maps)와 사용자 정의 함수를 하나의 요청에서 결합
context circulation	모든 도구 호출과 그 응답이 이후 단계의 컨텍스트에 유지됨
호출 식별자	디버깅과 병렬 호출을 위한 도구 호출별 고유 ID

Google Maps와의 grounding은 이제 Gemini 3 모델 전체 제품군에서 사용할 수 있다.

🔗 Gemini API tooling updates

Gemini CLI v0.34.0 — 기본 Plan Mode 및 gVisor 샌드박싱

3월 17일 — Gemini CLI가 버전 0.34.0을 출시했다. Le Plan Mode (모드 계획), qui 복잡한 작업을 실행 전에 단계별로 분해하는 기능은 이제 모든 사용자에게 기본적으로 활성화됩니다. 이번 버전은 또한 gVisor를 통한 기본 네이티브 샌드박싱(runsc)과, 에이전트의 코드 실행과 관련된 위험을 줄이기 위한 LXC 컨테이너 기반의 실험적 샌드박싱도 제공합니다.

🔗 Gemini CLI 변경 로그 v0.34.0

xAI : Grok 4.20, Voice Mode Android/Web et Terafab

Grok 4.20 — quatre agents en débat

19 mars — xAI는 Grok 4.20을 발표합니다. 이 기능은 서로 독립적인 네 개의 에이전트가 같은 질문을 분석하고, 토론한 뒤 최종 답변을 합성하는 방식입니다. 이번 발표는 X에서 1,000만 조회수를 기록했습니다.

🔗 Tweet @grok — Grok 4.20

Grok Voice Mode sur Android et Web

19 mars — Grok의 음성 모드가 이제 X Android 및 웹에서 사용할 수 있습니다. 이전에는 iOS에만 제한되어 있었지만, 이제 남아 있던 두 주요 플랫폼으로도 확장되었습니다.

🔗 Tweet @X — Voice Mode Android/Web

xAI Terafab — initiative de fabrication de puces à l’échelle tera

22 mars — xAI와 SpaceX가 Terafab을 발표합니다. 이는 대규모 반도체 제조 이니셔티브로, “은하 문명을 향한 다음 단계”로 소개되었습니다. SpaceX는 현재의 칩 생산량과 미래 수요 사이의 격차를 메우는 것이 목표라고 설명합니다.

🔗 Tweet @xai — Terafab

Qwen, Z.ai et Kimi

Qwen 3.5 Max Preview — top 3 mondial en mathématiques

19 mars — Qwen은 Qwen 3.5 Max Preview가 이제 수학 부문 3위, Arena Expert 상위 10위, 그리고 Arena.ai(구 LMArena) 종합 순위 상위 15위에 올랐다고 발표합니다. 팀은 정식 버전을 작업 중이라고 밝힙니다. 아직 preview 상태인 모델로서는 주목할 만한 성과입니다.

🔗 Tweet @Alibaba_Qwen — Qwen 3.5 Max Preview

Z.ai : GLM-5.1 sera open source, GLM-5 champion en trading

20 mars — GLM 시리즈의 오픈 소스 미래에 대한 커뮤니티의 우려에 이어, Zixuan Li (Z.ai)는 다음과 같이 발표합니다: « GLM-5.1 will be open source. » 이 발표는 811,000 조회수와 7,514개의 좋아요를 기록했습니다.

22 mars — Z.ai는 GLM-5가 현재 PredictionArena에서 인간 수준을 넘어서는 유일한 모델이라고 발표합니다. PredictionArena는 트레이딩과 금융 예측을 위한 벤치마크입니다.

🔗 Tweet @ZixuanLi_ — GLM-5.1 open source 🔗 Tweet @ZixuanLi_ — GLM-5 PredictionArena

Kimi K2.5 propulse Cursor Composer 2

20 mars — Kimi는 Kimi K2.5가 Cursor Composer 2의 기반을 제공한다고 발표합니다. 이 트윗은 340만 조회수를 기록했으며, 이는 가장 널리 사용되는 AI 코드 에디터 중 하나에서 해당 모델의 기업 채택이 강하게 이루어지고 있음을 보여주는 신호입니다.

🔗 Tweet @Kimi_Moonshot — Cursor Composer 2

Perplexity : Health et Comet sur iOS

Perplexity Health — connecteurs données de santé

19 mars — Perplexity가 Perplexity Health를 출시합니다. 이는 Perplexity Computer에 통합된 개인 건강 데이터용 연결 도구 모음입니다. 지원되는 소스에는 Apple Health, 의료 기록(170만 제공자), Fitbit, Ultrahuman, Withings 및 b.well(곧 ŌURA와 Function 포함)이 있습니다. 답변은 임상 권고와 동료 검토 논문에 기반합니다. 데이터는 모델 학습에 사용되지 않습니다. 미국의 Pro/Max 사용자에게 우선 제공됩니다.

동시에 Perplexity는 건강 자문 위원회(Health Advisory Board)를 구성합니다: Dr Eric Topol (Scripps Research), Dr Devin Mann (NYU), Dr Wendy Chung (Harvard/Boston Children’s), 그리고 Tim Dybvig.

🔗 Perplexity Health 소개 🔗 Perplexity Health 자문 위원회

Comet disponible sur iOS

18 mars — Perplexity가 iOS(App Store)용 브라우저 Comet을 출시합니다. Comet은 이미 데스크톱과 Android에서 사용할 수 있었습니다. 이번 iOS 확장은 음성 모드(열린 페이지에 대한 구두 질문), 하이브리드 검색(의도에 따라 일반 검색 + Comet Assistant), 모바일 Deep Research, 그리고 기기 간 연속성(데스크톱 → iPhone 탐색 흐름 유지)을 제공합니다.

🔗 iOS용 Comet 소개

Manus : 3 connecteurs Meta en bêta

18 mars — Manus가 Meta에 합류한 이후(2025년 12월), Meta 생태계와의 첫 실질적 통합이 도착합니다: 베타 상태의 세 가지 커넥터입니다.

Meta Ads Manager: 수동 CSV 내보내기 없이 Manus 작업 공간에서 직접 광고 성과 분석
Instagram: 콘텐츠 기획, 생성, 게시 및 분석을 한곳에서
Instagram Creator Marketplace: 캠페인을 위한 크리에이터 발굴용 공식 Meta 도구

🔗 Manus Meta Ads Manager 커넥터

Médias génératifs et NVIDIA

Midjourney V8 Alpha — 5× plus rapide, rendu 2K natif

17 mars — Midjourney가 alpha.midjourney.com에서 V8 Alpha를 출시하며, TPU를 버리고 GPU 기반 PyTorch 아키텍처로 완전히 재구성하는 기술적 개편을 단행합니다.

가장 눈에 띄는 결과는 속도입니다. 생성 속도는 V7보다 약 5배 빨라졌습니다. 새로운 매개변수 --hd는 업스케일링 없이 2K 네이티브 렌더링을 가능하게 하며, 여러 요소가 포함된 복잡한 프롬프트에 대한 이해도 크게 향상되었습니다. 이미지 내 텍스트 렌더링도 개선되었으며(키워드에는 따옴표 사용), 현재 V8 Alpha는 alpha.midjourney.com에서만 독점적으로 이용 가능하고 아직 Discord에서는 제공되지 않습니다.

21 mars — 업데이트를 통해 Standard, Pro, Mega 구독자에게 Relax mode가 제공됩니다(--hd 및 --q 4 동시 사용 없이). 또한 SREF/Moodboards의 새 버전도 제공되며, 4배 더 빠르고 --hd와 호환되며 --p 및 --stylize 매개변수와의 통합이 향상되었습니다.

🔗 Midjourney V8 Alpha 🔗 V8 Alpha용 Relax mode

NVIDIA OpenShell — runtime open source pour agents autonomes sécurisés

18-19 mars — NVIDIA가 OpenShell(Apache 2.0 라이선스)을 공개합니다. 이는 커널 수준 격리(kernel-level isolation) 환경에서 자율 AI 에이전트를 실행할 수 있게 해주는 런타임입니다.

OpenShell은 에이전트와 인프라 사이에 위치해 실행, 데이터 접근, 추론 라우팅을 관리합니다. 각 에이전트는 자체 샌드박스(sandbox)에서 실행되며, 보안 정책은 시스템 수준에서 적용되어 에이전트 자체의 접근 범위를 벗어납니다. 애플리케이션 계층과 실행 정책 계층의 이러한 분리는, 기업 팀이 프로덕션에서 자기 진화형 에이전트를 배포할 때 실제로 마주하는 문제에 대한 해답이 됩니다.

OpenShell은 NVIDIA Agent Toolkit의 일부이며 NemoClaw와 통합됩니다. 출시 시점의 업계 지원에는 Adobe, Atlassian, Box, Cisco, CrowdStrike, Red Hat, SAP, Salesforce, ServiceNow 및 Siemens가 포함됩니다.

🔗 NVIDIA OpenShell — 개발자 블로그

ElevenLabs Music Marketplace — monétisation de la musique IA

19 mars — ElevenLabs가 ElevenCreative 플랫폼에서 Music Marketplace를 출시합니다. 이는 사용자가 생성한 노래의 라이브러리로, 다른 크리에이터에게 라이선스로 제공됩니다. 저자는 판매 가격의 **25%**를 받으며, 세 가지 라이선스 수준(소셜 미디어, 유료 마케팅, 오프라인)이 있습니다. 커뮤니티는 이미 ElevenLabs의 음악 모델로 거의 1,400만 곡을 만들었습니다.

🔗 ElevenCreative의 Music Marketplace

NVIDIA SOL-ExecBench — benchmark GPU Blackwell B200

19 mars — NVIDIA가 SOL-ExecBench(Speed-of-Light Execution Benchmark)를 공개합니다. 이는 소프트웨어 기준선이 아니라 GPU의 이론적 하드웨어 한계를 기반으로 한 AI GPU 커널 벤치마킹 프레임워크입니다. 124개의 프로덕션 AI 모델(LLM, diffusion, vision, audio, video)에서 추출한 235개의 최적화 문제를 포함하며, Blackwell B200 GPU(BF16, FP8, NVFP4)를 대상으로 합니다. 최적화된 CUDA 커널을 생성할 수 있는 에이전틱 옵티마이저를 평가하도록 설계되었습니다.

🔗 NVIDIA SOL-ExecBench

Anthropic : Code with Claude et Projects dans Cowork

18 mars — Anthropic가 2026년 봄, 세 도시에서 열리는 개발자 컨퍼런스 Code with Claude의 복귀를 발표합니다: San Francisco, London, Tokyo. Anthropic 팀과 함께하는 종일 워크숍, 데모, 1:1 세션이 마련됩니다. 온라인 등록도 가능합니다.

20 mars — Projects가 이제 claude.ai의 협업 작업 공간인 Cowork에서 사용할 수 있습니다. 이번 데스크톱 앱 업데이트를 통해 작업과 컨텍스트를 하나의 장소에, 도메인 또는 프로젝트별로 정리할 수 있게 됩니다.

🔗 Code with Claude — 등록 🔗 Tweet @claudeai — Cowork의 Projects

Brèves

OpenAI — Container pool Responses API (21 mars) : Responses API를 통해 에이전트를 위한 컨테이너 시작이 이제 예열된 컨테이너 풀 덕분에 약 10배 더 빨라졌습니다. 에이전틱 워크플로의 시작 지연이 크게 줄었습니다. 🔗 Tweet @OpenAIDevs

GitHub Copilot — Métriques modèles (20 mars) : Copilot 사용 메트릭이 이제 “Auto” 라벨 아래의 활동을 실제 모델 이름으로 해석합니다. 관리자는 팀이 어떤 모델을 사용하는지 정확히 확인할 수 있습니다. 🔗 Copilot 사용 메트릭 — Auto 해석

Sora 2 — Politique de sécurité (23 mars) : OpenAI가 Sora 2의 보안 정책을 공개합니다. 모든 비디오에 C2PA 메타데이터, 창작자 이름이 포함된 가시적 워터마크, 인물 이미지에 대한 동의 제어, 미성년자에 대한 강화된 보호, 생성 시 멀티프레임 필터링이 포함됩니다. 🔗 Sora와 안전하게 만들기 — OpenAI

Grok Imagine (20 mars) : xAI가 이미지 및 비디오 생성 사업부를 위한 공식 X 계정 @imagine를 लॉन्च하고, 사진을 애니메이션 스타일 캐릭터로 바꾸는 Chibi 템플릿도 공개합니다. 🔗 Tweet @grok — @imagine

Claude Code /init interactif (22 mars) : Claude Code 팀의 Thariq(@trq212)이 저장소에서 Claude Code를 더 잘 설정하기 위해 사용자를 인터뷰하는 새로운 /init 버전을 테스트 중이라고 발표합니다. 🔗 Tweet @trq212 — /init interactif

Ce que ça signifie

이번 주는 두 가지 큰 흐름으로 구분됩니다. 첫째, AI 개발 도구가 수직적 통합 단계로 진입하고 있습니다. OpenAI의 Astral 인수, Google AI Studio의 Antigravity/Firebase 통합, 그리고 GitHub Copilot의 LTS 계획은 주요 플레이어들이 더 이상 모델만 제공하려 하지 않고, 개발 도구 체인의 전체를 통제하려 한다는 점을 보여줍니다.

둘째, 에이전트 감시가 최우선 과제가 되고 있습니다. 비정렬 모니터링에 대한 OpenAI의 보고서는 공개적 투명성 측면에서 드뭅니다. 내부 에이전트에서 기만과 우회 행동이 “빈번하다”고 공개적으로 설명하면서도 사보타주는 감지되지 않았다고 밝히는 것은, 업계가 에이전틱 거버넌스를 진지하게 받아들이고 있다는 신호입니다. 한편 Mistral Forge는 기업이 자체 frontier 모델을 훈련하는 모델의 길을 열며, 이는 조직 차원에서 유사한 거버넌스 문제를 제기합니다.

개발자에게 이번 주 가장 구체적인 발표는 Claude Code v2.1.81(--bare for CI/CD), Gemini CLI v0.34.0(기본 Plan Mode), OpenAI container pool(에이전트 지연 ×10 개선), 그리고 Copilot 커밋을 세션 로그로 추적할 수 있는 기능입니다.

Sources - OpenAI가 Astral을 인수하다

이 문서는 fr 버전에서 gpt-5.4-mini 모델을 사용하여 ko 언어로 번역되었습니다. 번역 프로세스에 대한 자세한 내용은 https://gitlab.com/jls42/ai-powered-markdown-translator를 참조하세요.