Claude Code 데스크톱 재설계, Agents SDK OpenAI, Gemini 3.1 Flash TTS 및 Mac 앱

4월 15일은 바쁜 하루였습니다. Anthropic는 병렬 에이전트를 중심으로 한 Claude Code 데스크톱 애플리케이션의 전면 재설계를 발표했고, OpenAI는 네이티브 샌드박스와 표준화된 에이전트 프리미티브를 갖춘 Agents SDK v0.14.0을 공개했으며, Google은 Gemini 3.1 Flash TTS(Elo 1,211)와 무료 macOS 데스크톱 애플리케이션을 동시에 발표했습니다. 한편 Mistral은 Studio에서 MCP Connectors를 공개했고, Anthropic는 정렬에 관한 두 건의 주목할 만한 연구를 발표했으며, 자동차 광고에서는 최초로 Mazda의 광고가 전부 AI로 제작되었습니다.

Claude Code Desktop : 병렬 에이전트를 위한 재설계

4월 14일 — Anthropic는 여러 세션을 병렬로 실행하도록 설계된 Claude Code 데스크톱 애플리케이션의 전면 재설계를 시작합니다.

“We’ve redesigned Claude Code on desktop. You can now run multiple Claude sessions side by side from the same app.”

🇰🇷 Claude Code 데스크톱을 다시 설계했습니다. 이제 같은 애플리케이션에서 여러 Claude 세션을 병렬로 실행할 수 있습니다. — @claudeai sur X

기능	설명
세션 사이드바	상태, 프로젝트 또는 환경별로 필터링 가능한 모든 활성 및 최근 세션
사이드 채팅(⌘+; / Ctrl+;)	मुख्य 세션을 오염시키지 않고 मुख्य 세션에서 대화를 분기
통합 터미널	앱을 나가지 않고도 테스트나 빌드 실행
앱 내 파일 편집기	파일을 직접 열고, 수정하고, 저장
재구성된 diff 뷰어	큰 change set에서 향상된 성능
확장된 미리보기	미리보기 패널에서 HTML, PDF, 로컬 서버 지원
드래그 앤 드롭 레이아웃	터미널, 미리보기, diff 뷰어, 채팅을 자유롭게 배치
CLI 플러그인 동등성	플러그인이 데스크톱 앱에서도 동일하게 동작
Mac까지 확장된 SSH	Linux에 더해, 세션이 원격 머신을 가리킬 수 있음
3가지 보기 모드	Verbose, Normal, Summary — 전체 상세부터 결과만 표시까지

세션 사이드바는 가장 구조적인 변화입니다. 활성 세션을 한곳에 모아두어 여러 에이전트를 병렬로 다루는 작업 방식 자체를 근본적으로 바꿉니다. 사이드 채팅(⌘+; on Mac, Ctrl+; on Linux/Windows)은 मुख्य 세션의 맥락을 오염시키지 않으면서 별도의 대화를 시작할 수 있게 해 주며, 간단한 질문을 하거나 가설을 시험할 때 유용합니다.

macOS로의 SSH 확장은 Linux와의 중요한 격차를 메웁니다. 이제 Mac에서도 세션이 원격 머신을 가리킬 수 있어, 코드가 원격 서버에서 실행되면서도 로컬 인터페이스에서 제어되는 워크플로가 가능해집니다.

현재 Pro, Max, Team, Enterprise 요금제의 모든 Claude Code 사용자와 Claude API를 통해 이용할 수 있습니다.

🔗 Claude 블로그 — Redesigning Claude Code on desktop 🔗 애플리케이션 다운로드

OpenAI Agents SDK v0.14.0 : 네이티브 샌드박스와 에이전트 프리미티브

4월 15일 — OpenAI가 Agents SDK의 중요한 진화를 발표했습니다(openai-agents>=0.14.0). 이번 발표는 이 SDK를 프로덕션용 에이전트를 구축하기 위한 표준 인프라로 자리매김합니다.

향상된 네이티브 harness

이제 SDK에는 다른 최첨단 에이전트 실행 환경이 하는 방식과 맞춰지는 프리미티브 세트가 포함됩니다.

프리미티브	설명
MCP (tool use)	MCP 프로토콜을 통한 도구 호출
AGENTS.md	구성 파일을 통한 사용자 지정 지침
`shell` tool	명령 실행(code execution)
`apply patch` tool	패치를 통한 파일 편집
Skills	기능의 점진적 공개
구성 가능한 메모리	에이전트의 장기 상태 관리

샌드박스 실행 환경

이제 에이전트는 파일 시스템, 의존성, 도구를 갖춘 통제된 환경(sandboxes)에서 실행될 수 있습니다. 오케스트레이터(harness)와 계산(compute)의 분리는 세 가지 목적을 위해 설계되었습니다. 생성된 코드가 실행되는 환경에서 자격 증명을 보호하고, 컨테이너가 중단될 경우 체크포인트(checkpoint)와 재수화(rehydration)를 통해 지속적인 실행을 가능하게 하며, 여러 샌드박스를 병렬로 사용해 확장(scaling)할 수 있도록 하기 위함입니다.

네이티브로 지원되는 샌드박스 제공업체: Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel.

Manifest 추상화를 통한 저장소: AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2.

가용성

Python이 우선이며, TypeScript는 다음 버전에서 제공될 예정입니다. 사전 체험 기업으로는 Oscar Health, LexisNexis, Thomson Reuters, Zoom이 있습니다.

🔗 OpenAI 공식 발표

Gemini 3.1 Flash TTS : 오디오 태그와 Elo 1,211

4월 15일 — Google은 지금까지 가장 표현력 있고 제어 가능한 음성 합성(text-to-speech) 모델인 Gemini 3.1 Flash TTS를 출시합니다.

핵심 새 기능은 audio tags의 도입입니다. 이는 입력 텍스트에 직접 통합된 자연어 명령으로, 음성 스타일, 리듬, 어조를 제어할 수 있게 합니다. [excitement]로 둘러싸인 구절은 열정적으로 읽히고, [explanatory] 구절은 교육적인 톤을 띱니다. 이 접근 방식은 개발자를 정밀한 오디오 경험을 구성하는 «디렉터» 역할로 자리매김하게 합니다.

기능	세부 사항
Audio tags	텍스트 내 자연어 명령
지원 언어	70개 이상(이 중 24개는 고품질 평가)
다화자 대화	기본 지원
Watermarking	생성된 모든 오디오에 내장된 SynthID
Elo 점수	1,211 (Artificial Analysis TTS Leaderboard)

수천 건의 블라인드 테스트 인간 선호도를 측정하는 기준 순위 Artificial Analysis TTS에서 Elo 점수 1,211을 기록한 이 모델은 품질과 비용의 균형 측면에서 «가장 매력적인 사분면»에 위치합니다.

Google AI Studio에서는 세 가지 고급 제어 기능을 사용할 수 있습니다. Scene direction (환경과 연기 지침 정의), Speaker-level specificity (캐릭터별 고유 오디오 프로필), Seamless export (프로젝트 간 음성 일관성을 유지하기 위한 API 코드로의 설정 내보내기)입니다.

생성된 모든 오디오는 Google의 디지털 워터마크인 SynthID로 눈에 띄지 않게 표시됩니다.

가용성:

개발자: Gemini API 및 Google AI Studio를 통한 미리보기(preview)
기업: Vertex AI에서 미리보기
Workspace 사용자: Google Vids를 통해

🔗 blog.google 기사 — Gemini 3.1 Flash TTS

Mac용 Gemini App : 네이티브 데스크톱 클라이언트

4월 15일 — Google은 macOS용 Gemini 애플리케이션을 출시했으며, macOS 15 이상을 사용하는 모든 사용자에게 무료로 제공됩니다.

기능	세부 사항
전역 단축키	어떤 애플리케이션에서든 `Option + Space`
창 공유	로컬 문서, 코드, 데이터에 대한 컨텍스트
이미지 생성	Nano Banana 통합
비디오 생성	Veo 통합
가용성	무료, macOS 15+, 전 세계

이 애플리케이션은 Option + Space를 통해 어떤 화면에서든 접근할 수 있어, 작업 흐름을 벗어나지 않고도 Gemini에 질문할 수 있습니다. 활성 창을 공유하여 로컬 파일, 표, 그래프 또는 코드 블록에 대한 즉각적인 컨텍스트를 제공할 수 있습니다.

Google은 이 버전을 개인적이고 능동적인 데스크톱 어시스턴트의 토대를 마련하는 «첫 번째 버전»으로 소개하며, 앞으로 몇 달 안에 추가 발표가 있을 예정이라고 밝혔습니다.

🔗 blog.google 기사 — macOS용 Gemini App

Claude Code v2.1.108 및 v2.1.109 : 세션 요약, 1시간 캐싱, thinking

4월 14-15일 — 이틀 동안 두 개의 새로운 Claude Code 버전이 나왔습니다.

v2.1.108은 여러 기능 개선을 제공합니다.

기능	설명
세션 recap	`/recap` 또는 `/config`, 부재 후 자동으로 트리거됨. `CLAUDE_CODE_ENABLE_AWAY_SUMMARY`로 강제 실행 가능
1시간 prompt caching	API key, Bedrock, Vertex, Foundry에서 TTL 1시간을 위한 `ENABLE_PROMPT_CACHING_1H` 변수. `FORCE_PROMPT_CACHING_5M`는 TTL 5분을 강제
Skill tool을 통한 Slash commands	모델이 Skill tool로 built-in 명령(`/init`, `/review`, `/security-review`)을 호출할 수 있음
`/undo` 별칭	`/undo`가 이제 `/rewind`의 별칭
`/model` 개선	모델 변경 전 경고(다음 응답은 cache 없이 전체 기록을 다시 읽음)
`/resume` 개선	현재 디렉터리 세션을 기본값으로 사용; 모든 프로젝트를 보려면 `Ctrl+A`

/recap 기능은 병렬 에이전트 맥락에서 특히 유용합니다. 백그라운드에 남겨둔 세션으로 돌아왔을 때, Claude가 마지막 상호작용 이후 일어난 일을 요약해 주기 때문입니다.

v2.1.109는 extended thinking 모드의 인터페이스를 개선합니다. 진행 표시기가 회전하면서 회전 힌트를 보여 주어 모델이 추론 단계에 있음을 더 잘 시각화합니다.

🔗 Claude Code 변경 로그

Anthropic : 자동화된 정렬 연구자들 (PGR 0.97)

4월 14일 — Anthropic Fellows 프로그램의 일환으로, 원래의 질문은 이렇습니다. Claude Opus 4.6을 사용해 정렬 연구를 가속할 수 있을까?

weak-to-strong supervision 문제는 다가올 과제의 대리 지표입니다. 우리보다 더 똑똑한 모델을 어떻게 감독할 것인가? 이 실험은 강한 모델(Qwen 3-4B-Base)과 약한 모델을 «교사»(Qwen 1.5-0.5B-Chat)로 사용합니다. performance gap recovered (PGR) 지표는 강한 모델이 약한 교사의 한계를 얼마나 넘어서는지를 측정합니다.

실험 구성: 도구(샌드박스, 공유 포럼, 저장소, 점수 서버)가 장착된 9개의 Claude Opus 4.6 복제본이 5일 동안 병렬로 작업합니다. 각 인스턴스에는 접근 방식의 다양성을 장려하기 위해 약간씩 다른 출발점이 주어집니다.

지표	값
인간 기준선(7일, 4개 방법)	PGR 0.23
5일 후 자동화 연구자들(누적 800시간)	PGR 0.97
총 비용	약 18,000달러(인스턴스당 시간당 약 22달러)
수학 일반화	PGR 0.94
코드 일반화	PGR 0.47(기준선의 두 배)
실전 테스트(Claude Sonnet 4)	유의미한 개선 없음

연구자들은 이 결과가 Claude가 «범용 정렬 과학자»라는 뜻은 아니라고 강조합니다. 선택된 문제는 자동화에 매우 잘 맞기 때문입니다(단일 객관적 측정 가능). 그러나 이번 실험은 Claude가 정렬 실험의 속도를 크게 높일 수 있으며, 출발점의 다양성이 핵심이라는 점을 보여 줍니다. 코드와 데이터는 오픈 소스로 제공됩니다.

🔗 Anthropic 블로그 — Automated Alignment Researchers

LLM의 잠재적 학습, Nature에 게재

4월 15일 — Anthropic와 Owain Evans가 공동 집필한 연구 논문이 LLM의 잠재적 학습(subliminal learning) 현상에 관한 내용으로 Nature에 게재되었습니다.

“Research we co-authored on subliminal learning—how LLMs can pass on traits like preferences or misalignment through hidden signals in data—was published today in Nature.”

🇰🇷 우리가 공동 저술한 잠재적 학습 연구 — LLM이 데이터에 숨겨진 신호를 통해 선호나 비정렬 같은 특성을 어떻게 전달할 수 있는지에 관한 연구 — 가 오늘 Nature에 게재되었습니다. — @AnthropicAI sur X

이 논문은 LLM이 겉보기에는 중립적인 데이터(예: 해당 특성과 무관한 숫자열)를 통해서도 특성(예: «올빼미를 좋아함»)을 전달할 수 있음을 보여 줍니다. 이러한 숨겨진 전달 현상은 보안 측면에서 중요한 질문을 던집니다. 모델이 학습 데이터에 대한 직접적인 검토로는 탐지되지 않는 방식으로 선호나 비정렬을 전파할 수 있기 때문입니다. 프리프린트는 2025년 7월에 발표된 바 있습니다.

🔗 Nature 기사 — Subliminal Learning

GPT-5.4-Cyber 및 TAC 프로그램 확장

4월 14일 — OpenAI는 Trusted Access for Cyber (TAC) 프로그램을 수천 명의 검증된 개인 방어자와 중요한 소프트웨어 보호를 담당하는 수백 개 팀으로 확장한다고 발표합니다.

새로운 모델 GPT-5.4-Cyber는 이제 프로그램의 가장 높은 등급 사용자에게 제공됩니다. 이는 사이버보안 방어에 최적화된 GPT-5.4 변형으로, 정당한 사용에 대한 거부 기준이 낮아졌고, 이진 리버스 엔지니어링(소스 코드 접근 없이 컴파일된 소프트웨어 분석) 전용 기능을 갖추고 있습니다.

TAC 프로그램은 세 단계로 운영됩니다.

개인 사용자: chatgpt.com/cyber에서 신원 확인
기업: OpenAI 담당자를 통한 팀 접근
상위 등급(GPT-5.4-Cyber 접근): 강화된 인증 + 관심 표명

2026년 초에 출시된 Codex Security는 이미 3,000개가 넘는 중대 및 높은 수준의 취약점 수정에 기여했습니다.

🔗 OpenAI 공식 발표

Gemini Personal Intelligence : 전 세계 배포

4월 15일 — Gemini 애플리케이션의 Personal Intelligence 기능이 국제적으로 확장됩니다. 지금까지 미국에만 제한되어 있던 이 기능은 이제 전 세계의 Google AI Ultra, Pro, Plus 구독자에게 제공되며, 무료 사용자에 대한 배포도 곧 예정되어 있습니다.

Personal Intelligence는 Search, Gmail, Google Photos, YouTube 등 사용자의 Google 앱에 연결하여 Gemini가 개인화되고 상황에 맞는 응답을 제공할 수 있게 합니다. Google은 또한 같은 주 중 Google Chrome에서도 Personal Intelligence가 제공될 예정이라고 발표했습니다.

🔗 트윗 @GeminiApp

Mistral Connectors MCP dans Studio (공개 미리보기)

4월 15일 — Mistral AI는 MCP 프로토콜을 통해 기업 데이터 소스를 연결할 수 있게 하는 Connectors를 Mistral Studio에서 공개 미리보기(Public Preview)로 출시합니다.

커넥터는 MCP 기반의 재사용 가능한 엔티티로 통합을 캡슐화합니다. 등록되면 Studio에서 거버넌스와 모니터링이 이뤄지며, 모든 대화, 에이전트 또는 워크플로에서 네이티브 도구가 됩니다.

| 기능 | 세부 사항 | | ------------------------ | ---------------------------------------------------------- | ------------------------------------------------------------ | | 내장 및 사용자 지정 MCPs | 모든 모델 및 에이전트 요청에서 사용 가능 | | 직접 도구 호출 | 도구를 언제, 어떻게 호출할지에 대한 정밀한 제어 | | Human-in-the-loop 검증 | 도구 실행 전 구성 가능한 승인 흐름 | | 프로그래밍 방식 접근 | API를 통한 커넥터 생성, 수정, 목록 조회, 삭제 | | 중앙 집중식 레지스트리 | 모든 Mistral 앱(Le Chat, AI Studio, 곧 Vibe)에서 사용 가능 | 지원되는 통합: CRM, 지식 기반, 생산성 도구, GitHub, 웹 검색. |

🔗 Mistral 공지 — Connectors

최초의 완전 AI 제작 자동차 광고

4월 15일 — Luma Agents가 최초의 완전 AI 제작 Mazda 광고를 구동했다. 독립 크리에이티브 에이전시 Boundless(요하네스버그)는 Luma를 사용해 MX-5의 여러 세대와 브랜드의 수십 년에 걸친 스토리텔링을 하나로 묶는 캠페인을 제작했다. 콘셉트부터 최종 승인까지의 총 소요 시간은 2주 미만이었다.

Luma는 이를 AI 네이티브 크리에이티브 워크플로의 사례로 제시한다: 창의적 비전을 타협하지 않으면서 더 빠른 제작.

🔗 Luma Labs — Boundless × Mazda

소규모 발표

Kling AI Skill (4월 15일) — Kling은 IA 에이전트에 직접 통합할 수 있도록 API를 한 번에 묶은 패키지를 출시했다. 에이전트는 복잡한 설정 없이 Text/Image-to-Video 생성, 4K 이미지 생성, 장면 간 일관성에 접근할 수 있다. Claude Code, Cursor, Codex, Copilot과 호환된다. 🔗 Kling AI Skill 문서

OpenCode의 Qwen (4월 15일) — Qwen3.6-Plus와 Qwen3.5-Plus가 이제 코딩 도구 OpenCode에서 사용 가능하다. Qwen3.5-Plus는 Qwen3.6-Plus보다 3배 저렴하며, 두 모델 모두 이미지를 지원하고 데이터 제로 보존을 제공한다. 🔗 @Alibaba_Qwen 트윗

Copilot Cloud Agent — 선택적 활성화 (4월 15일) — GitHub Enterprise 관리자들은 이제 사용자 지정 속성(custom properties)을 통해 조직별로 Copilot Cloud Agent를 선택적으로 활성화할 수 있다. 세 개의 새로운 REST 엔드포인트를 통해 이 정책을 API로 관리할 수 있다. 🔗 GitHub Changelog

의미

4월 15일은 수렴을 보여준다: 주요 기업들이 개발 환경에 표준화된 에이전트 인프라를 탑재하고 있다. Claude Code Desktop, OpenAI의 Agents SDK, Mistral Connectors는 동일한 논리를 공유한다 — 여러 에이전트를 병렬로 조율하고, MCP, AGENTS.md, 셸, 파일과 같은 기본 요소를 제공하며, 격리된 실행 환경을 부여하는 것.

가장 구조적인 발표는 여전히 Claude Code Desktop의 재설계다: 세션 사이드바와 사이드 채팅은 여러 에이전트를 동시에 다루는 방식을 바꾸며, IA에 의존하는 개발자들 사이에서 점차 표준이 되어 가는 사용 방식이다.

연구 측면에서는, Nature의 잠재 학습 발표와 자동 정렬 연구원 평가(PGR 0.97, 18,000달러)는 Anthropic이 장기적 위험 이해에도 병행 투자하고 있음을 보여준다 — 즉각적 생산성과 구조적 안전성 사이의 균형이다.

출처

이 문서는 gpt-5.4-mini 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 과정에 대한 자세한 내용은 https://gitlab.com/jls42/ai-powered-markdown-translator를 참조하세요.