4월 16일은 유난히 많은 소식이 쏟아진 날이었다. Anthropic은 에이전트형 benchmark에서 의미 있는 향상을 보인 Claude Opus 4.7을 일반 공개로 출시했고, OpenAI는 macOS에서의 computer use가 포함된 Codex와 생명과학에 전념한 첫 frontier 모델 GPT-Rosalind를 동시에 공개했다. Google은 Gemini 앱에 Nano Banana 2와 Google Photos를 통한 개인화된 이미지 생성을 더했고, Perplexity는 Mac용 Personal Computer를 출시했으며, GitHub는 에이전트 간 skill 관리를 위한 gh skill 명령을 열었다.
Claude Opus 4.7: 일반 공개
4월 16일 — Anthropic이 Claude Opus 4.7을 일반 공개(generally available)로 출시했다. 이 모델은 Opus 4.6을 잇는 후속작으로, 긴 작업, 에이전트 자율성, 지시 정확도에서 눈에 띄는 발전을 보인다.
“Opus 4.7 handles complex, long-running tasks with rigor and consistency, pays precise attention to instructions, and devises ways to verify its own outputs before reporting back.”
🇰🇷 Opus 4.7은 길고 복잡한 작업을 엄정하고 일관되게 처리하고, 지시 사항에 세심하게 주의를 기울이며, 전달하기 전에 자신의 출력 결과를 검증할 방법을 설계합니다. — @claudeai on X
주요 기능
| 기능 | 설명 |
|---|---|
| 고해상도 Vision | 긴 변 기준 최대 2,576 px의 이미지(~375만 화소), 이전 해상도의 3배 |
| xhigh 노력 수준 | high과 max 사이의 중간 단계, 추론/지연 시간 세밀 제어 |
| 파일 시스템 메모리 | 작업 세션 간 더 나은 지속성 |
| 강화된 자율성 | 전달 전 출력 검증, 지시 사항을 문자 그대로 준수 |
| 전문 수준 품질 | 더 높은 품질의 인터페이스, 슬라이드, 문서 |
Benchmarks
| Benchmark | Opus 4.7 | Opus 4.6 | GPT-5.4 | Gemini 3.1 Pro |
|---|---|---|---|---|
| SWE-bench Pro | 64.3% | 53.4% | 57.7% | 54.2% |
| SWE-bench Verified | 87.6% | 80.8% | — | 80.6% |
| Terminal-Bench 2.0 | 69.4% | 65.4% | 75.1%* | 68.5% |
| 다학문적 추론(도구 사용) | 54.7% | 53.3% | 58.7% | 51.4% |
| 대규모 도구 사용 – MCP-Atlas | 77.3% | 75.8% | 68.1% | 73.9% |
| Computer use – OSWorld Verified | 78.0% | 72.7% | 75.0% | — |
| 고급 추론 – GPQA Diamond | 94.2% | 91.3% | 94.4% | 94.3% |
| 시각적 추론(도구 사용) | 91.0% | 84.7% | — | — |
* GPT-5.4: 특정 하네스를 사용한 자동 보고 결과
가장 두드러진 향상은 SWE-bench Pro(+10.9포인트), 시각적 추론(+도구 사용 시 6.3포인트), MCP-Atlas(+1.5포인트)에 나타나며, 이는 에이전트 사용 사례와 직접 연결되는 benchmark들이다.
가격 및 제공
Opus 4.7은 오늘부터 Claude API(claude-opus-4-7 식별자), Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry, 그리고 모든 Claude 제품에서 사용할 수 있다. 요금은 Opus 4.6과 동일하게 입력 토큰 백만 개당 25이다.
Opus 4.6에서 이전하는 개발자를 위한 두 가지 주의점이 있다. 새 tokenizer는 콘텐츠 유형에 따라 토큰 수를 1.0배에서 1.35배 더 생성할 수 있으며, Opus 4.7은 높은 노력 수준에서 더 많은 추론 토큰을 생성한다. Anthropic은 전용 마이그레이션 가이드를 공개했다.
Opus 4.7은 프로젝트 Glasswing의 새로운 사이버보안 가드레일을 적용받는 첫 모델이기도 하다. 합법적인 전문가를 위한 사이버 검증 프로그램(Cyber Verification Program)이 열려 있다.
Claude Code v2.1.111: /ultrareview, Max용 auto mode, 기본 xhigh
4월 16일 — Claude Code 버전 2.1.111은 Opus 4.7 출시와 함께 여러 의미 있는 추가 기능을 제공한다.
| 기능 | 설명 |
|---|---|
/ultrareview | 다중 에이전트 병렬 심층 code review. 인자 없음 = 현재 브랜치; GitHub PR에는 /ultrareview <PR#> 사용. Pro와 Max에 3회 무료 제공. |
| Max용 Auto mode | auto mode(Claude가 권한을 단독 결정)가 이제 Opus 4.7과 함께 Max 구독자에게 제공된다. |
| 기본 노력 수준 xhigh | 모든 요금제의 기본 노력 수준이 xhigh로 상향된다. |
/less-permission-prompts | transcript를 스캔해 .claude/settings.json을 위한 우선순위가 매겨진 허용 목록을 제안한다. |
| PowerShell tool | PowerShell 지원(점진적 배포). Linux/macOS에서는 CLAUDE_CODE_USE_POWERSHELL_TOOL=1로 활성화 가능. |
| 이름 있는 계획 | 무작위가 아니라 초기 prompt(fix-auth-race-snug-otter.md)를 기준으로 이름이 지정된 계획. |
| 읽기 전용 명령 | cd, ls, cat 및 읽기 전용 명령은 더 이상 권한 요청을 트리거하지 않는다. |
버전 2.1.112(4월 16일 저녁 배포)는 auto mode에서 나타나던 “claude-opus-4-7 is temporarily unavailable” 오류를 즉시 수정한다.
Boris Cherny(@bcherny)도 모든 구독자를 대상으로 rate limit을 상향했다고 발표했는데, 이는 Opus 4.7의 더 높은 추론 토큰 사용량을 보완하기 위한 것이다. 장문 컨텍스트 요청에서의 rate limiting 버그가 수정되었고, 5시간 및 주간 한도도 재설정되었다.
GitHub Copilot도 오늘부터 Opus 4.7을 GA로 통합하며, VS Code, Visual Studio, CLI, GitHub Mobile 및 기타 Copilot 클라이언트에 점진적으로 배포된다. Copilot Pro+에서는 앞으로 몇 주 안에 Opus 4.5와 4.6을 대체할 예정이다. 4월 30일까지는 프로모션 요금(7.5× 배수)이 적용된다.
🔗 Claude Code CHANGELOG 🔗 @bcherny의 트윗 🔗 GitHub Copilot의 Claude Opus 4.7
OpenAI: Codex의 computer use, GPT-Rosalind, 그리고 cyber ecosystem
Codex — macOS에서의 computer use, 내장 browser, 지속 메모리
4월 16일 — OpenAI가 주당 300만 명 이상의 개발자가 사용하는 Codex의 중요한 업데이트를 공개했다. 이번 release는 Codex를 code를 훨씬 넘어 확장한다.
“Codex can now use your computer alongside you, seeing, clicking, and typing with its own cursor.”
🇰🇷 이제 Codex는 당신과 함께 컴퓨터를 사용하며, 자체 커서로 보고, 클릭하고, 입력할 수 있습니다. — @OpenAI
Computer use(컴퓨터 사용) — 여러 Codex agent가 열린 애플리케이션들과 간섭하지 않으면서 macOS에서 동시에 작업할 수 있다. 활용 사례: frontend 반복 작업, 앱 테스트, API가 노출되지 않은 앱에서의 작업. EU/UK 제공은 추후 예정.
| 기능 | 설명 |
|---|---|
| 내장 browser | 웹 페이지에 직접 댓글을 달아 frontend 개발과 게임에 대해 agent를 지시 |
| 이미지 생성 | gpt-image-1.5 통합으로 같은 workflow에서 asset과 mockup 생성 |
| 90개 이상의 신규 plugin | Atlassian Rovo, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon, Remotion, Render, Superpowers… |
| 지속 메모리 | 세션 간 누적되는 선호도, 수정 사항, 맥락 |
| 예약 자동화 | 며칠 또는 몇 주에 걸친 반복 작업, 자동 깨우기 |
| SSH devbox | 원격 서버 연결(alpha) |
| 여러 terminal 탭 | 여러 개의 동시 terminal |
GPT-Rosalind — 생명과학용 첫 frontier 모델
4월 16일 — OpenAI는 생물학, drug discovery, 번역 의학에 전념한 첫 frontier 모델 GPT-Rosalind를 출시한다. 이름은 DNA 구조를 규명하는 데 기여한 Rosalind Franklin을 기리는 것이다.
GPT-Rosalind는 과학 문헌 요약, 가설 생성, 실험 계획, 생물학적 데이터 분석에 최적화되어 있다.
| Benchmark | 결과 |
|---|---|
| BixBench(실제 생물정보학) | 공개 점수 기준 모델 중 최고 성능 |
| LABBench2 | 11개 작업 중 6개에서 GPT-5.4를 상회 |
| RNA sequence 예측(Dyno Therapeutics) | 인간 전문가의 상위 95퍼센타일(best-of-10) |
| RNA sequence 생성(Dyno Therapeutics) | 인간 전문가의 약 84퍼센타일(best-of-10) |
Codex용 무료 Life Sciences plugin이 GitHub에서 제공된다: 인간 유전체학, 단백질체학, 생화학을 포함한 50개 이상의 공개 생물학 데이터베이스에 접근 가능하다. GPT-Rosalind는 미국 내 적격 Enterprise 고객을 대상으로 Trusted Access 프로그램을 통해 research preview로 제공된다. 미리보기 기간에는 기존 크레딧이 차감되지 않는다.
발표된 파트너: Amgen, Novo Nordisk, Moderna, Thermo Fisher Scientific, NVIDIA, Allen Institute, UCSF School of Pharmacy, Los Alamos National Laboratory.
Cyber defense ecosystem — $10M API 크레딧
4월 16일 — OpenAI는 오픈소스 보안 팀과 취약점 연구자를 지원하기 위해 1,000만 달러 규모의 API 크레딧을 투입한다. 첫 수혜자는 Socket, Semgrep, Calif, Trail of Bits다.
Trusted Access for Cyber 프로그램은 Bank of America, BlackRock, BNY, Citi, Cisco, CrowdStrike, Goldman Sachs, JPMorgan Chase, Morgan Stanley, NVIDIA, Oracle, Zscaler 등 새로운 조직으로 확장된다. GPT-5.4-Cyber는 미국 AI 표준 및 혁신 센터(CAISI)와 영국 AI 보안 연구소(UK AISI)에도 독립 평가를 위해 제공된다.
Gemini: Nano Banana 2와 Google Photos를 통한 개인화 이미지
4월 16일 — Google은 Personal Intelligence(개인 지능), Nano Banana 2, 그리고 사용자의 Google Photos 라이브러리를 기반으로 Gemini 앱의 새로운 개인화 이미지 생성 기능을 선보였다.
이전까지 Gemini로 정말 개인적인 이미지를 만들려면 자세한 prompt와 수동으로 업로드한 사진이 필요했다. 이제 Personal Intelligence는 Gemini가 사용자의 맥락을 암묵적으로 이해하도록 해 주며, «나의 꿈의 집을 그려줘» 또는 «무인도에 가져갈 내 필수품 이미지를 만들어줘» 같은 간단한 문장만 있으면 된다. Gemini는 연결된 Google 앱에서 세부 정보를 자동으로 채운다.
Google Photos 라이브러리를 연결하면 사용자는 자신과 가까운 사람들이 직접 등장하는 이미지를 생성할 수 있다. Photos에 이미 만들어진 태그(사람, 반려동물)를 활용하면, «나와 내 가족이 우리가 가장 좋아하는 활동을 하는 claymation 스타일 이미지를 만들어줘» 같은 요청만으로 충분하다.
| 기능 | 세부 사항 |
|---|---|
| 사용 가능한 스타일 | 수채화, 숯 연필, 유화, claymation |
| Sources 버튼 | 어떤 사진이 자동 선택되었는지 표시 |
| 개선 | 무엇이 잘못됐는지 설명하고 다른 참조 사진 선택 |
| 개인정보 | Gemini는 비공개 Google Photos 라이브러리로 학습하지 않음 |
| Opt-in | Google 앱 연결은 여전히 선택 사항이며 설정 가능 |
제공 여부: 현재 미국의 Google AI Plus, Pro, Ultra 구독자에게만 며칠에 걸쳐 순차 배포 중이다. Chrome desktop용 Gemini와 더 많은 사용자에게도 제공될 예정이다.
Gemini CLI v0.38.0
4월 14일 — Gemini CLI v0.38.0 버전이 여러 command line 경험 개선과 함께 제공된다.
| 기능 | 세부 사항 |
|---|---|
| Chapters(서사 흐름) | 의도와 tool 사용에 따라 상호작용을 «장»으로 그룹화 |
| Context Compression Service | 긴 세션을 위해 기록을 지능적으로 압축 |
| 지속 승인 | 매번 다시 묻지 않고 tool 실행 승인 |
| UI 깜빡임 수정 | Terminal Buffer mode를 통해 불안정한 렌더링 해결 |
Perplexity Personal Computer: Mac의 로컬 agent
4월 16일 — Perplexity가 Mac 앱에 통합된 로컬 agent 기능 Personal Computer를 출시했다.
“Today we’re releasing Personal Computer. Personal Computer integrates with the Perplexity Mac App for secure orchestration across your local files, native apps, and browser. We’re rolling this out to all Perplexity Max subscribers and everyone on the waitlist starting today.”
🇰🇷 오늘 Personal Computer를 출시합니다. Personal Computer는 로컬 파일, 네이티브 애플리케이션, browser를 안전하게 오케스트레이션하기 위해 Perplexity Mac 앱에 통합됩니다. 오늘부터 모든 Perplexity Max 구독자와 대기자 명단에 있는 사람들에게 이를 배포합니다. — @perplexity_ai on X
이 agent는 민감한 데이터는 cloud로 보내지 않고 로컬 파일, 네이티브 애플리케이션, browser를 안전하게 오케스트레이션한다. 배포는 점진적이며, Perplexity Max 구독자가 우선이고 그다음이 대기자 명단이다.
이는 Perplexity에게 의미 있는 전환점이다. AI 웹 검색으로 명성을 쌓은 뒤, 이제 회사는 데스크톱의 로컬 오케스트레이션에 도전하고 있으며, 이는 이미 Apple Intelligence와 OpenAI의 Operator가 탐색한 영역이다.
GitHub: gh skill 명령의 공개 preview
4월 16일 — GitHub가 GitHub CLI(v2.90.0+)에서 gh skill을 공개 preview로 출시한다. 이 새 command는 portable한 agent skill 세트를 설치, 탐색, 업데이트, 게시할 수 있게 한다. 이는 AI agent의 동작을 구성하는 instructions, scripts, resources의 묶음이다.
gh skill install github/awesome-copilot documentation-writer
gh skill install github/awesome-copilot doc-writer --agent claude-code
gh skill search mcp-apps
gh skill update --all
skills는 여러 플랫폼에서 작동한다: GitHub Copilot, Claude Code, Cursor, Codex, Gemini CLI, Antigravity. 이 command는 공급망(supply chain) 보안 메커니즘도 포함한다: tag 또는 commit SHA에 의한 고정, 불변 release, frontmatter를 통한 provenance 추적. 공개 specification은 agentskills.io에서 확인할 수 있다.
Qwen3.6-35B-A3B 오픈소스와 Meta Muse Spark Safety
Qwen3.6-35B-A3B: Apache 2.0의 오픈소스 MoE
4월 15–16일 — Alibaba가 Qwen3.6-35B-A3B의 오픈소스 공개를 발표했다. 이는 총 350억 개의 매개변수를 가진 sparse MoE(mixture-of-experts) 모델이지만, 추론 시 활성화되는 매개변수는 30억 개뿐이다.
| 측면 | 세부 사항 |
|---|---|
| 아키텍처 | sparse MoE: 35B 매개변수, 3B 활성 |
| 라이선스 | Apache 2.0 |
| 멀티모달 | 기본 제공(vision + reasoning) |
| 모드 | Thinking / non-thinking |
| Benchmark | Qwen3.6-35B-A3B |
|---|---|
| SWE-bench Verified | 73,4 |
| SWE-bench Multilingual | 67,2 |
| AIME 2026 | 92,7 |
| GPQA | 86,0 |
Hugging Face / ModelScope, Qwen Studio, 그리고 Alibaba Cloud API(qwen3.6-flash)에서 사용할 수 있다. Claude Code, Qwen Code, OpenClaw와 기본 호환된다. 🔗 Qwen 공식 블로그
Meta Muse Spark: 안전성 보고서 공개
4월 15일 — Meta AI는 Meta Superintelligence Labs가 개발한 첫 번째 비오픈 웨이트 멀티모달 모델인 Muse Spark의 안전 및 준비성 보고서(Safety & Preparedness Report)를 공개했다.
| 항목 | 세부 내용 |
|---|---|
| 사용된 프레임워크 | Meta Advanced AI Scaling Framework |
| 평가된 위험 | 화학/생물학, 사이버보안, 통제 상실 |
| chem/bio 결과 | 초기에는 “잠재적으로 높음”으로 평가됨 → 완화 조치 검증됨 → 잔여 위험은 허용 가능 |
이 보고서는 주목할 만한 이정표를 보여준다. Meta는 이제 Anthropic과 OpenAI의 접근 방식과 유사하게, 고급 모델을 배포하기 전에 형식적인 안전성 평가 절차를 따르고 있다.
미디어 및 다양한 업데이트
Runway는 4월 16일 두 가지 업데이트를 공개했다. Seedance 2.0이 1080p 렌더링으로 전환되고, Runway Characters에는 이제 텍스트 스크립트 애니메이션 기능이 추가되었다(캐릭터 선택, 스크립트 작성, 생성). NVIDIA는 NAB Show 2026에 참여해 미디어 제작, 팬 참여, 콘텐츠 수익화에서의 AI를 시연하고 있다.
Grok iOS는 음성 모드에서 애니메이션 시각 표시기를 받았다. 이제 작은 원이 Grok이 활성 청취 중임을 보여준다.
🔗 Runway — Seedance 2.0 1080p 🔗 Runway Characters — 스크립트 애니메이션
의미하는 바
4월 16일은 모든 전선에서 에이전트적 수렴이 일어난 날을 보여준다. Claude Opus 4.7, computer use가 포함된 Codex, Perplexity Personal Computer, 그리고 gh skill은 모두 같은 논리를 공유한다. 즉, 로컬 시스템(파일, 애플리케이션, 컴퓨터)에서 작동할 수 있는 에이전트들이며, 이들은 이식 가능한 표준을 통해 여러 플랫폼 간에 조정된다.
gh skill 명령은 특히 구조적이다. Copilot, Claude Code, Cursor, Codex, Gemini CLI를 아우르는 에이전트 간 설치에 대한 개방형 사양을 제시함으로써, GitHub는 에이전트 세계의 npm install가 될 수 있는 공통 인프라를 구축하고 있다.
한편 GPT-Rosalind는 OpenAI 전략의 진화를 보여준다. 범용 모델에 이어, 회사는 이제 도메인별로 특화된 프론티어 모델을 만들기 시작했다. 이는 Google DeepMind가 계산 생물학에서 이미 탐구해 온 수직별 다각화 접근 방식을 떠올리게 한다.
출처
- Anthropic — Claude Opus 4.7 소개
- 트윗 @claudeai — Opus 4.7 GA
- 트윗 @bcherny — 늘어난 rate limits
- CHANGELOG Claude Code (GitHub)
- GitHub Changelog — Copilot에서 Claude Opus 4.7 사용 가능
- OpenAI — 거의 모든 것을 위한 Codex
- OpenAI — GPT-Rosalind 소개
- OpenAI — 사이버 방어 생태계 가속화
- blog.google — Nano Banana 2로 개인화된 이미지
- Gemini CLI 변경 기록
- perplexity.ai/computer
- 트윗 @perplexity_ai — Personal Computer
- GitHub Changelog — gh skill
- Qwen 블로그 — Qwen3.6-35B-A3B
- Meta AI — Muse Spark 안전성 보고서
- 트윗 @runwayml — Seedance 2.0 1080p
- 트윗 @runwayml — Runway Characters 스크립트
이 문서는 gpt-5.4-mini 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 과정에 대한 자세한 정보는 https://gitlab.com/jls42/ai-powered-markdown-translator 를 참조하세요.