DeepSeek-V4와 GPT-5.5가 IDE를 장악하고, Cohere는 Aleph Alpha와 합병, Claude Code v2.1.119

2026년 4월 25일에는 프론티어 모델과 개발자 도구를 둘러싼 주요 발표가 집중됐다. DeepSeek-V4는 오픈소스로 출시되어 NVIDIA Blackwell에서 무료로 사용할 수 있게 되었다. GPT-5.5는 GitHub Copilot과 OpenAI API에서 정식 제공 단계에 들어갔다. Schwarz Group의 6억 달러 지원을 받는 Cohere + Aleph Alpha 합병은 대서양 횡단형 주권 AI의 기반을 다시 세운다. 도구 측면에서는 Claude Code v2.1.119와 Codex의 Auto-review 모드가 개발 에이전트의 자율성을 확장한다.

DeepSeek-V4 어디서나 사용 가능

출시와 오픈소스

4월 24일 — DeepSeek는 DeepSeek-V4-Pro와 DeepSeek-V4-Flash를 동시에 발표했다. V4-Pro는 1.6조 개 파라미터(활성 490억)를 갖춘 mixture-of-experts 모델로, 100만 token 컨텍스트 윈도우와 최고 수준의 폐쇄형 모델에 견줄 성능을 표방한다. 보다 작은 V4-Flash(284B/활성 13B)는 저지연 사용 사례를 겨냥한다. 두 모델 모두 첫날부터 오픈소스로 공개되었고, API와 데모도 즉시 제공되며, 기술 보고서는 Hugging Face에 게시되었다.

🔗 DeepSeek-V4 발표

API 프로모션과 통합

4월 25일 — DeepSeek는 2026년 5월 5일 15:59 UTC까지 V4-Pro API에 대해 75% 할인 프로모션을 발표했다. Claude Code, OpenCode, OpenClaw 통합도 새 모델을 지원하도록 업데이트되었다.

🔗 DeepSeek-V4-Pro API 프로모션

NVIDIA Blackwell에서 무료로 제공되는 DeepSeek-V4-Pro

4월 24일 — NVIDIA는 build.nvidia.com의 NVIDIA NIM API 인터페이스를 통해 Blackwell에서 DeepSeek-V4-Pro를 무료로 사용할 수 있도록 공개했다. 이 발표는 16만 회 조회를 기록했다. NVIDIA는 또한 vLLM 기반 Blackwell Ultra에서 DeepSeek-V4-Pro의 첫 성능 곡선(Pareto frontier)도 공개했는데, 이는 고성능 배포를 위한 초기 기준점이 된다.

4월 25일 — NVIDIA는 동시에 개발 에이전트를 위한 기존 추론 방식의 한계도 강조했다. “Traditional inference wasn’t built for agentic coding”이라는 표현으로, 현대의 에이전트형 도구가 생성하는 수백 건의 API 호출을 지적했다.

🔗 NVIDIA NIM의 DeepSeek-V4-Pro 🔗 Blackwell Ultra Day 0

GPT-5.5, 프리뷰 단계 종료

GitHub Copilot에서 정식 제공

4월 24일 — GPT-5.5가 GitHub Copilot Pro+, Business, Enterprise 플랜에 순차적으로 배포되고 있다. 제공 범위는 VS Code, Visual Studio, Copilot CLI, cloud agent, github.com, 모바일 앱(iOS 및 Android), JetBrains IDE, Xcode, Eclipse를 포함한다. 프로모션 배수는 7.5×로 설정되었다. Enterprise 및 Business 관리자들은 이를 사용하려면 설정에서 정책을 활성화해야 한다.

🔗 GitHub Copilot 변경로그 — GPT-5.5 GA

개발자 API 접근

4월 24일 — 일반 공개 출시 다음 날, OpenAI는 API에서 GPT-5.5 접근을 열었다. 이 모델은 Responses API와 Chat Completions API를 통해 제공되며, 100만 token 컨텍스트 윈도우를 지원한다. 고정밀 작업용 변형인 GPT-5.5-Pro는 Responses API를 통해서만 접근할 수 있다.

“GPT-5.5 is available in the Responses and Chat Completions APIs with a 1M context window. GPT-5.5-pro is also available in the Responses API for higher-accuracy work.”

🇰🇷 GPT-5.5는 100만 token 컨텍스트 윈도우와 함께 Responses API 및 Chat Completions API에서 사용할 수 있습니다. GPT-5.5-Pro도 고정밀 작업을 위해 Responses API에서 제공됩니다. — @OpenAIDevs

🔗 OpenAI API 발표

Perplexity Max와 Personal Computer의 GPT-5.5

4월 24일 — GPT-5.5는 Perplexity의 Max 구독자에게 제공되며, Personal Computer에서는 Pro 및 Max 플랜의 기본 오케스트레이션 모델로 배포되었다.

🔗 Perplexity 발표

Bio Bug Bounty — 생물안전 보안 프로그램

4월 23일 — OpenAI는 GPT-5.5의 생물안전을 전담하는 버그 바운티 프로그램을 시작했다. AI 보안 또는 생물안전 전문 연구자들은 모델의 생물학적 안전장치를 우회하는 범용 jailbreak를 찾도록 초대받는다. 주요 보상은 첫 성공자에게 25,000 USD가 지급된다. 지원은 2026년 6월 22일까지 가능하며, 테스트는 2026년 4월 28일부터 7월 27일까지 진행되고, 비밀유지계약 하에 초청된 인원만 Codex Desktop의 GPT-5.5에서만 수행할 수 있다.

🔗 GPT-5.5 Bio Bug Bounty

개발자 도구: 확장되는 자율성

Claude Code v2.1.119

4월 25일 — Anthropic은 40개가 넘는 변경 사항을 포함한 대규모 CLI 업데이트인 Claude Code v2.1.119를 공개했다.

영역	변경 사항
Config	`/config`가 `~/.claude/settings.json`에 영구 저장됨
PR	`--from-pr`가 GitLab, Bitbucket, GitHub Enterprise 지원
Hooks	`PostToolUse` + `duration_ms` 필드
PowerShell	permission 모드에서 자동 승인
MCP	subagent 서버 병렬 연결
버그 수정	40+

/config 설정의 지속성은 가장 눈에 띄는 변화다. 테마, 에디터 모드, verbose 수준 같은 선호 설정이 재시작 후에도 유지된다. --from-pr 설정은 이제 GitLab merge-request URL, Bitbucket pull-request URL, GitHub Enterprise를 지원하므로 GitHub.com을 사용하지 않는 팀에도 workflow가 확장된다. PostToolUse 및 PostToolUseFailure hooks는 이제 duration_ms 필드를 받으며, 이는 CI/CD 모니터링에 유용하다. MCP 서버 연결도 이제 병렬로 수행되어 멀티 서버 workflow의 시작 시간이 단축된다.

🔗 Claude Code CHANGELOG

Codex Auto-review — 안전장치를 갖춘 확장 자율성

4월 24일 — OpenAI는 Codex용 새로운 실행 모드인 Auto-review를 발표했다. 이 모드는 Codex가 각 단계마다 승인을 요청하지 않고도 긴 작업을 계속 진행할 수 있게 한다. 별도의 에이전트가 실행 전에 고위험 단계를 평가하므로, 테스트, 컴파일, 장시간 자동화 workflow를 보안 희생 없이 더 매끄럽게 진행할 수 있다.

🔗 Codex Auto-review

JetBrains용 Copilot: Inline Agent Mode 프리뷰

4월 24일 — JetBrains IDE용 Copilot plugin 업데이트에는 여러 기능이 포함되었다. 공개 프리뷰 단계의 inline agent mode(단축키 Shift+Ctrl+I 또는 Shift+Cmd+I), 워터마크 미리보기와 원격 수정 기능이 강화된 Next Edit Suggestions(NES), 그리고 agent 도구 호출에 대한 전역 자동 승인이 추가되었다.

🔗 JetBrains Copilot 변경로그

NVIDIA Dynamo — 에이전트를 위해 재설계된 추론

4월 25일 — NVIDIA는 에이전트형 도구의 부하 프로파일에 대응하기 위해 추론 스택을 재구성한 Dynamo를 공개했다. Claude Code, Codex, Copilot 같은 에이전트는 세션당 수백 건의 API 호출을 연속으로 수행하고 각 단계마다 컨텍스트를 재구성하므로, token당 비용을 끌어올리는 병목이 발생한다. Dynamo는 네 가지 구성 요소를 결합한다. KV cache 인지 routing, 에이전트용 scheduling, 다층 cache, 통합 orchestration이다. NVIDIA는 더 높은 cache 비율과 더 낮은 지연으로 최대 7배의 처리량 향상을 제시했다.

🔗 NVIDIA Dynamo — 에이전트형 추론

주권성과 enterprise 파트너십

Cohere + Aleph Alpha: Schwarz Group의 6억 USD와 함께하는 대서양 횡단 합병

4월 24일 — Cohere(캐나다)와 Aleph Alpha(독일)는 합병 계획을 발표했다. Lidl과 Kaufland의 모기업인 Schwarz Group은 Cohere의 Series E를 위해 구조화 금융 형태로 6억 USD(약 5억 유로)를 투자한다. 결합 플랫폼은 Schwarz Digits의 sovereign cloud인 STACKIT에서 호스팅될 예정이다.

“Sovereign AI for the world. Cohere & Aleph Alpha form transatlantic AI powerhouse anchored in Canada & Germany!”

🇰🇷 세계를 위한 sovereign AI. Cohere와 Aleph Alpha가 캐나다와 독일에 뿌리를 둔 대서양 횡단 AI 강자로 힘을 합칩니다! — X의 @cohere

이 거래는 규제 산업, 정부, 그리고 약 6,000억 USD 규모로 추정되는 sovereign AI 시장을 겨냥한다. 다만 Aleph Alpha 주주 승인이 있어야 최종 확정된다.

Anthropic과 NEC: 첫 일본 글로벌 파트너십

4월 24일 — Anthropic은 NEC Corporation과의 전략적 파트너십을 발표했으며, NEC는 Anthropic의 첫 일본 글로벌 파트너가 되었다. NEC는 전 세계 그룹 내 약 3만 명의 직원에게 Claude를 배포할 예정이다.

항목	세부 내용
대상 직원 수	약 30,000명(전 세계 NEC Group)
배포 제품	Claude, Claude Opus 4.7, Claude Code, Claude Cowork
대상 산업	금융, manufacturing, 사이버보안, 지방정부
프로그램	NEC BluStellar Scenario

내부적으로 NEC는 “Client Zero” 이니셔티브의 일환으로 대규모 AI 엔지니어링 팀을 양성하기 위한 Center of Excellence를 구축하고 있다. 고객 대상 측면에서는 NEC와 Anthropic이 금융, manufacturing, 일본 지방자치단체를 위한 솔루션을 공동 개발할 예정이다.

🔗 Anthropic과 NEC

Meta, 수십억 사용자 규모의 에이전트형 AI를 위해 AWS와 협력

4월 24일 — Meta는 AWS와 계약을 맺고 자사 인프라에 수천만 개의 Graviton5 코어를 통합한다고 발표했다. 목표는 수십억 사용자를 위한 에이전트형 AI의 CPU 집약적 workload를 지원하는 것이다.

🔗 Meta × AWS Graviton5

Gemini: 제품 및 연구 업데이트

Gemini Drops 2026년 4월 — Lyria 3 Pro, Gemini Live v3.1

4월 24일 — Google은 Gemini Drops 10번째 에디션을 공개했다. Lyria 3 Pro는 Gemini 안에서 최대 3분 길이의 음악을 직접 생성할 수 있게 하며, Plus, Pro, Ultra 구독자에게 제공된다. Gemini Live v3.1은 20% 더 빨라졌고, 기억하는 컨텍스트 양은 두 배가 되었다. Personal Intelligence는 국제적으로 확대되지만(유럽경제지역, 스위스, 영국, 한국, 호주, 나이지리아 제외), branching 대화 기능은 사용자 20%에게 배포되었다.

🔗 Gemini Drops 2026년 4월

Gemini Embedding 2 정식 제공

4월 22일 — Gemini Embedding 2가 Gemini API와 Vertex AI에서 정식 제공(GA) 단계에 들어갔다. 이 벡터 표현 모델은 의미 검색, 검색 증강 생성(RAG), 분류를 대상으로 한다.

🔗 Gemini Embedding 2 GA

Decoupled DiLoCo — 멀티리전 분산 학습

4월 23일 — Google DeepMind는 저대역폭 네트워크용 분산 학습 방법인 Decoupled DiLoCo를 발표했다. Gemma 12B는 TPU6e와 TPUv5p를 조합해 미국 내 4개 리전에서 학습되었다. 이 방식은 일반적으로 필요했던 고속 상호연결 없이도 전 세계 규모의 분산형 모델 학습 가능성을 연다.

🔗 Decoupled DiLoCo — Google DeepMind

대안 모델: Qwen과 Grok

Qwen3.6-27B — 에이전트형 코딩을 위한 flagship dense 모델

4월 22일 — Alibaba는 Apache 2.0 라이선스의 오픈소스로 270억 파라미터 dense 모델 Qwen3.6-27B를 공개했다. 작은 크기에도 불구하고, 이 모델은 주요 에이전트형 코딩 benchmark에서 Qwen3.5-397B-A17B를 앞선다. 해당 모델은 3,970억 파라미터 중 170억이 활성화되는 MoE 모델이며, SWE-Bench Verified 점수는 전작의 76.2% 대비 77.2%를 기록했다. 발표에서는 세 가지 축이 강조되었다. 모든 주요 benchmark에서 이전 세대를 능가하는 agentic coding, 강력한 텍스트 및 멀티모달 추론, 그리고 MoE 복잡성 없이 배포 가능한 dense 구조다.

이 모델은 하나의 checkpoint에서 thinking 및 non-thinking 모드를 모두 지원한다. Hugging Face(Qwen/Qwen3.6-27B, FP8 변형 포함)와 ModelScope에서 제공되며, 전용 기술 블로그와 Github도 함께 공개되었다. 이 발표는 X에서 350만 회 조회를 기록했다.

🔗 Qwen3.6-27B 발표

Qwen-Image-2.0-Pro — 전 세계 Text-to-Image 9위

4월 25일 — Alibaba Qwen은 Qwen-Image-2.0-Pro를 공개했으며, Text-to-Image Arena 순위에서 전 세계 9위, 인물화 부문 6위를 기록했다. 이 모델은 Alibaba Cloud API와 ModelScope를 통해 제공된다.

🔗 Qwen-Image-2.0-Pro

Grok Voice Think Fast 1.0 — Tau Voice Bench 1위

4월 23일 — xAI는 grok-voice-think-fast-1.0 모델을 xAI Console API를 통해 출시했다. 이 모델은 추가 지연 없이 추론을 내장한 채 Tau Voice Bench 1위를 주장한다. 이미 Starlink 고객 지원에 프로덕션 배포되었다. 아키텍처는 4월에 발표된 Grok STT/TTS API와 구별되는 통합형 구조다.

🔗 Grok Voice Think Fast 1.0

Grok Imagine — lip sync 개선

4월 25일 — Grok Imagine은 모든 image-to-video 생성에 대해 lip sync와 오디오 품질이 향상되었다고 발표했다.

🔗 Grok Imagine lip sync

미디어 생성과 음성 에이전트

Kling AI 4K — 저해상도에서 네이티브 업스케일링

4월 24일 — Kling AI는 저해상도 소스에서 네이티브 4K로 이미지를 확대하는 기능인 Kling 4K를 출시했다. “Blurry in. 4K out.”이라는 요약 문구와 함께 발표되었고, 582만 회 조회를 기록했다. 이 기능은 Kling Video 3.0과는 별개다.

🔗 Kling AI 4K

Runway, GPT Image 2 통합

4월 24일 — Runway는 자사 비디오 제작 플랫폼에 OpenAI의 GPT Image 2를 통합했다.

🔗 Runway × GPT Image 2

ElevenLabs × Customers Bank — 은행용 음성 에이전트

4월 24일 — ElevenLabs는 Customers Bank(자산 250억 USD)에 ElevenAgents를 배포한다고 발표했다. 세 개의 agent가 배포되었습니다: 24시간 고객 지원, 신규 고객 온보딩, 상담원을 위한 실시간 코칭.

🔗 ElevenLabs × Customers Bank

ElevenLabs — 앰배서더 프로그램

4월 23일 — ElevenLabs가 앰배서더 프로그램 지원 접수를 시작했습니다. 이 프로그램은 Community Builders와 앰배서더 두 단계로 구성되며, 크레딧, 굿즈, 신규 기능 사전 접근 혜택을 제공합니다. 이 발표는 116,000회의 조회수를 기록했습니다.

🔗 ElevenLabs 앰배서더 프로그램

Anthropic 연구: 안전성과 agent

선거 보호 조치 — 평가 결과

4월 24일 — 2026년 미국 중간선거를 앞두고, Anthropic이 선거 보호 조치에 대한 결과를 공개했습니다. Claude Opus 4.7과 Sonnet 4.6은 정치적 응답의 균형을 측정하는 평가에서 각각 95%와 96%를 기록했습니다.

모델	정치적 준수성	영향력 행사 작전 거부	웹 검색 활성화
Opus 4.7	100%	94%	92%
Sonnet 4.6	99.8%	90%	95%

Claude.ai에는 2026년 중간선거 투표에 대한 신뢰할 수 있는 정보로 사용자를 안내하기 위해 TurboVote 배너(비당파적 리소스인 Democracy Works 제공)가 표시될 예정입니다.

🔗 선거 보호 업데이트 — Anthropic

Project Deal — 협상가로서의 Claude agent

4월 24일 — Anthropic이 Craigslist 스타일의 마켓에서 IA agent를 실험한 내부 프로젝트인 Project Deal의 결과를 공개했습니다. 일주일 동안 Claude agent들은 샌프란시스코 사무실 직원들을 대신해 동료 간 물품을 사고파는 역할을 맡았습니다. 총 186건의 deal이 네 가지 모델 구성으로 병렬 진행되어 성사되었습니다.

지표	값
기간	1주
구성	4개 (올-Opus 4.7, 올-Haiku, 2개 혼합)
성사된 deal	186
Opus 대비 Haiku 우위	평균 +2건의 deal, 더 높은 가격
공격적 지시의 효과	통계적으로 유의미하지 않음

“New Anthropic research: Project Deal. We created a marketplace for employees in our San Francisco office—like Craigslist—where Claude agents negotiated deals on their behalf.”

🇰🇷 “Anthropic의 새로운 연구: Project Deal. 우리는 샌프란시스코 사무실 직원들을 위한 마켓플레이스를 만들었습니다 — Craigslist 같은 형태로 — 그곳에서 Claude agent들이 그들을 대신해 deal을 협상했습니다.” — X의 @AnthropicAI

가장 주목할 만한 발견은 공격적인 지시(“강하게 협상하라”)가 결과에 통계적으로 유의미한 영향을 전혀 주지 않았다는 점입니다. 이는 지시를 제대로 따르지 못해서가 아니라, 시장 자체의 제약 때문이었습니다.

🔗 Project Deal — Anthropic

이것이 의미하는 바

4월 25일은 몇 가지 거대한 흐름을 중심으로 한 빠른 재편을 보여줍니다. 프런티어 모델 측면에서 DeepSeek-V4와 GPT-5.5는 자유롭게 접근 가능한 성능의 새로운 기준선을 세웠습니다. 100만 token 컨텍스트는 더 이상 프리미엄 차별점이 아닙니다. NVIDIA Blackwell에서 DeepSeek-V4-Pro가 무료로 제공되고, 여기에 API 75% 할인 프로모션까지 더해지면서, 폐쇄형 모델과의 직접적인 가격 경쟁이 시작됐음을 시사합니다.

개발자 도구 측면에서는 agent 자율성의 확장이 여러 전선에서 동시에 구체화되고 있습니다 — Claude Code v2.1.119, Codex Auto-review, JetBrains의 Inline Agent Mode. 이 업데이트들은 하나의 공통된 목표로 수렴합니다: 위험한 작업에 대해서는 통제 지점을 유지하면서도, 긴 파이프라인에서 인간의 개입을 줄이는 것입니다. 우리를 대신해 행동하는 agent를 위한 법적 프레임워크라는 Project Deal이 제기한 질문은 이런 맥락에서 특히 더 중요한 울림을 가집니다.

Schwarz Group의 6억 USD 지원을 받은 Cohere + Aleph Alpha의 합병은 유럽의 주권형 AI에 가장 구조적인 신호입니다. 이는 전용 cloud 인프라(STACKIT)를 기반으로, 6,000억 USD 규모로 추정되는 시장에서 정부와 규제 산업을 겨냥한 대서양 횡단 사업자를 만들어냅니다. 동시에 진행된 Anthropic + NEC 파트너십은 동일한 주권 논리가 아시아로도 확장되고 있음을 보여줍니다.

출처

이 문서는 gpt-5.4 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 과정에 대한 자세한 정보는 https://gitlab.com/jls42/ai-powered-markdown-translator 를 참조하세요.