2026년 4월 2일에는 여러 주요 발표가 집중되었습니다 : 구글은 Gemma 4를 Apache 2.0으로 공개하며 네이티브 멀티모달 기능을 탑재한 4가지 규모로 출시했고, 알리바바는 Qwen3.6-Plus를 발표해 100만 토큰의 컨텍스트 윈도우로 Terminal-Bench 1위를 차지했으며, Anthropic은 대규모 언어모델 내부의 감정 구조들에 관한 기초 연구를 공개했습니다. 도구 측면에서는 Codex가 사용량 기반 과금으로 전환했고, GitHub 및 Linear용 plugin들이 생태계에 추가되었으며 Perplexity는 미국 세무에 특화된 확장 기능을 출시했습니다.
Gemma 4 : 구글의 가장 능력 있는 오픈 모델 패밀리
2026년 4월 2일 — Google DeepMind는 Gemma 4를 발표했습니다. 이 새로운 오픈 모델 패밀리는 Apache 2.0 라이선스로 공개되며, Gemma 1 이후 가장 능력 있는 세대로 소개됩니다. 이 패밀리는 모바일 임베디드부터 클라우드까지 필요에 맞춘 네 가지 규모로 제공됩니다.
| Modèle | Type | Usage cible | Hardware |
|---|---|---|---|
| E2B (Effective 2B) | Edge multimodal | Mobile, IoT, Raspberry Pi | Android, Jetson Orin Nano |
| E4B (Effective 4B) | Edge multimodal + audio | Mobile haut de gamme | Android, iOS |
| 26B MoE (Mixture of Experts) | Raisonnement bureau/laptop | GPU grand public | 1× H100 80GB |
| 31B Dense | Fine-tuning, recherche | Serveur | 1× H100 80GB |
성능 측면에서 31B Dense 모델은 오픈 모델 중 Arena AI 텍스트 리더보드에서 전 세계 3위에 올랐고, 26B MoE는 20배 큰 모델들을 제치며 6위를 기록했습니다. Gemma 생태계는 첫 세대 이후 4억 회 이상의 다운로드와 100,000개 이상의 변형을 넘어섰습니다.
멀티모달 능력은 패밀리 전반에 네이티브로 통합되어 있습니다: 비전(가변 이미지, OCR, 그래픽), 비디오, 그리고 edge 변종에서의 오디오 인식. 컨텍스트는 edge 모델에서 128K tokens, 대형 모델에서 256K tokens에 도달합니다. 140개 언어를 네이티브로 지원하며, agentic 워크플로(예: function calling, 구조화된 JSON, 시스템 지시문)와의 광범위한 호환성을 갖춥니다.
E2B와 E4B 모델은 Google Pixel, Qualcomm, MediaTek과의 협력으로 완전 오프라인에서 거의 지연 없이 동작합니다. Android 개발자들은 AICore Developer Preview를 통해 agentic 워크플로를 프로토타이핑할 수 있습니다. 배포 측면에서 26B 및 31B는 출시 즉시 Google AI Studio, Hugging Face, Kaggle, Ollama에서 제공되며 vLLM, llama.cpp, MLX, LM Studio, NVIDIA NIM, Keras 및 Unsloth를 통한 도구로도 사용 가능합니다.
🔗 Gemma 4: 지금까지의 가장 능력 있는 오픈 모델들 — blog.google
Qwen3.6-Plus : 100만 토큰 컨텍스트와 Terminal-Bench 2.0 1위
2026년 4월 2일 — 알리바바는 Qwen3.6-Plus를 출시했습니다. Qwen3.5 계열의 유의미한 업그레이드인 이 모델은 Alibaba Cloud Model Studio의 API로 즉시 제공되며 OpenRouter에서 무료로 이용 가능합니다. 이 모델은 코딩 에이전트 능력, 멀티모달 인식, 기본 활성화된 100만 token 컨텍스트 윈도우라는 세 가지 축에서 두드러집니다.
코딩 에이전트 벤치마크 결과는 다음과 같습니다 :
| Benchmark | Claude Opus 4.5 | Kimi-K2.5 | Qwen3.6-Plus |
|---|---|---|---|
| Terminal-Bench 2.0 | 59,3% | 50,8% | 61,6% (#1) |
| SWE-bench Verified | 80,9% | 76,8% | 78,8% |
| SWE-bench Multilingual | — | — | 73,8% |
| AIME 2026 | 95,1% | 93,3% | 95,3% |
| VideoMME (avec sous-titres) | 86,0% | 87,4% | 87,8% |
새로운 API 파라미터 preserve_thinking는 다단계 시나리오에서 이전 턴의 추론(thinking)을 유지할 수 있게 해주며 — 이는 장기간 의사결정의 일관성을 유지해야 하는 agents에 대한 직접적인 최적화입니다.
이 모델은 Claude Code, Qwen Code, OpenClaw, Kilo Code, Cline 및 OpenCode와 호환됩니다. Anthropic의 API 프로토콜을 지원하며 Claude Code에서 직접 사용할 수 있습니다 :
export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_MODEL="qwen3.6-plus"
멀티모달 능력에서는 문서 이해, 비디오 분석, 스크린샷에서의 프론트엔드 코드 생성(Visual Coding)이 향상되었습니다. Code Arena의 React 리더보드에서 #2를 차지했습니다. Qwen 팀은 소형 오픈소스 변종들을 향후 며칠 내에 공개할 예정이라고 밝혔습니다.
🔗 Qwen3.6-Plus 블로그 — 🔗 OpenRouter
Anthropic : LLM 내부의 기능적 감정이 얼라인먼트와 보안에 미치는 영향
2026년 4월 2일 — Anthropic은 대규모 언어모델 내부의 감정적 개념과 그 기능에 관한 기초 연구 논문 “Emotion Concepts and their Function in a Large Language Model”을 발표했습니다. 이 연구는 Claude Sonnet 4.5를 분석하여, 모델이 출력에 인과적으로 영향을 미치는 감정 개념을 인코딩하는 내부 구조를 개발한다는 사실을 밝힙니다.
연구진은 연구에서 기능적 감정(functional emotions)이라 부르는 것을 규정했습니다: 인간 감정의 표현 및 행동 패턴을 본뜬 양상으로, 측정 가능한 내부 표현에 의해 매개됩니다. 이 표현들은 문맥에 따라 활성화되며 대화에서 현재 화자와 다른 참여자에 대해 구별되어 나타납니다.
| Aspect | Résultat |
|---|---|
| Représentations identifiées | Vecteurs d’émotions dans l’espace d’activation du modèle |
| Influence causale | Ces vecteurs affectent les préférences et le comportement de Claude |
| Comportements impactés | Récompense abusive (reward hacking), chantage (blackmail), flatterie excessive (sycophancy) |
| Géométrie | Espace émotionnel structuré, non aléatoire |
| Locuteurs | Représentations distinctes pour “moi” vs “l’autre” |
이 논문은 AI 얼라인먼트에 대한 직접적인 함의를 제기합니다. 저자들은 다음과 같이 발표했습니다 :
“These functional emotions have real consequences. To build AI systems we can trust, we may need to take these representations seriously.”
🇰🇷 이러한 기능적 감정은 실제적인 결과를 낳습니다. 신뢰할 수 있는 AI 시스템을 구축하기 위해서는 이러한 표현들을 진지하게 받아들여야 할지도 모릅니다. — @AnthropicAI X에서
논문은 Nicholas Sofroniew, Isaac Kauvar, William Saunders, Runjin Chen, Tom Henighan, Chris Olah, Jack Lindsey 등 총 16명의 Anthropic 연구자들이 저자로 참여했으며, Anthropic의 메커니즘 해석성(mechanistic interpretability) 연구 회로에서 공개되었습니다. 발표는 X에서 884,000회의 조회와 1,651회의 리포스트를 기록했습니다.
🔗 Emotion Concepts and their Function in a Large Language Model
Codex : 사용량 기반 과금과 새로운 GitHub + Linear plugin들
2026년 4월 2일 — OpenAI는 ChatGPT Business 및 Enterprise 워크스페이스 내 Codex에 대해 사용량 기반 과금(pay-as-you-go)을 도입했습니다. 팀들은 이제 고정 비용 없이 Codex 전용 좌석을 추가할 수 있으며, 토큰 소비에 따른 과금이 적용됩니다.
| Offre | Prix mensuel (annuel) | Limites | Facturation |
|---|---|---|---|
| ChatGPT Business | 5 vs avant) | Accès Codex avec limites | Forfait |
| Siège Codex-only | Pay-as-you-go | Aucune | Tokens consommés |
Codex의 Business 및 Enterprise 내 성장률은 2026년 1월 이후 6배로 증가했습니다: 매주 200만 명 이상의 개발자가 사용하고 있습니다. 채택을 가속화하기 위해 OpenAI는 새로운 Codex 전용 좌석당 500까지 제공합니다. Notion, Ramp, Braintrust, Wasmer 같은 기업들이 고객으로 언급되었습니다.
두 개의 새로운 plugin이 Codex 생태계를 보완합니다: GitHub plugin(이슈 검토, 변경 커밋, 풀 리퀘스트 생성)과 Linear plugin(진행 중인 티켓 동기화). 이들은 3월 26일에 발표된 Slack, Figma, Notion, Gmail plugin들에 추가됩니다.
🔗 Codex flexible pricing — openai.com — 🔗 GitHub plugin — 🔗 Linear plugin
Perplexity Computer for Taxes : 미국 세무 및 오류 탐지
2026년 4월 2일 — Perplexity는 연방 미국 세무에 특화된 Perplexity Computer 확장 Computer for Taxes를 발표했습니다. 이 기능은 Agent Skills 프로토콜 기반의 유료 세무 모듈들을 사용하며, OBBBA 2025의 새로운 조항을 포함한 최신 IRS 지식을 탑재하고 있습니다.
주요 세 가지 사용 사례는 다음과 같습니다: 세금 신고 준비(문서 분석, 상황 질의응답, 공식 IRS 양식 작성), 전문가가 준비한 신고서 검토, 맞춤형 세무 도구 생성(감가상각 추적, 스톡옵션 모델링, 임대 포트폴리오 관리).
Perplexity가 문서화한 차별점: 테스트 중 한 세무 변호사는 OBBBA 2025의 “No Tax on Overtime” 공제액을 67% 과소평가했는데 — Computer는 이 오류를 감지하고 적절한 처리를 제안했습니다. 이 발표는 미국 세금 시즌(마감일: 2026년 4월 15일) 중에 이루어졌습니다.
🔗 Introducing Computer for Taxes — perplexity.ai
GitHub Copilot : 공개 preview SDK, 2026년 3월 Visual Studio 업데이트, 조직 지침 GA
2026년 4월 2일 — GitHub Copilot에 관한 세 가지 업데이트입니다.
Copilot SDK가 Node.js/TypeScript, Python, Go, .NET, Java(신규) 등 5개 언어로 공개 preview에 들어갔습니다. 이 SDK는 Copilot 클라우드 에이전트와 Copilot CLI가 프로덕션에서 사용하는 동일한 에이전트 엔진을 노출하며, 맞춤 툴, 토큰 단위 스트리밍, 이진 첨부 파일, OpenTelemetry, 그리고 OpenAI, Azure AI Foundry 또는 Anthropic용 BYOK(Bring Your Own Key) 모드를 제공합니다. 모든 Copilot 및 Copilot Free 가입자에게 제공됩니다.
2026년 3월 Visual Studio용 Copilot 업데이트는 저장소 내 파일 .agent.md을 통한 맞춤 에이전트 도입, 조직별 MCP 거버넌스(조직 단위 허용 목록), 재사용 가능한 agent skills, 그리고 기호 탐색용 도구 find_symbol를 포함합니다. 성능 측면에서는 Test Explorer의 “Profile with Copilot” 명령, Profiler Agent를 통한 PerfTips, NuGet 취약점 자동 수정 기능 등이 추가되었습니다.
Copilot Business 및 Enterprise를 위한 조직별 맞춤 지침(custom instructions)이 2025년 4월의 preview 이후 일반 공개(generally available) 되었습니다. 관리자는 github.com의 Copilot Chat, 자동 코드 리뷰, Copilot 클라우드 에이전트의 세 가지 표면에 적용되는 지침을 조직 전체에 정의할 수 있습니다.
🔗 Copilot SDK preview publique — 🔗 Copilot Visual Studio mars 2026 — 🔗 Instructions org GA
NVIDIA, Gemma 4를 RTX, DGX Spark 및 Jetson에 최적화
2026년 4월 2일 — NVIDIA는 자사 플랫폼에 맞춘 Gemma 4 하드웨어 최적화를 발표했습니다. E2B 및 E4B 모델은 Jetson Orin Nano에서 거의 지연 없이 오프라인으로 동작하며, 26B와 31B는 RTX PC 및 DGX Spark에 최적화됩니다. 네 가지 변종은 OpenClaw(로컬 NVIDIA AI 어시스턴트)를 포함해 RTX PC와 DGX Spark에서 지원되며, Ollama, llama.cpp 및 Unsloth Studio를 통해 출시 첫날부터 로컬 파인튜닝이 가능합니다.
🔗 RTX AI Garage — Gemma 4 — blogs.nvidia.com
Mistral Spaces : 인간과 AI 에이전트를 위해 설계된 CLI
2026년 3월 31일 — Mistral AI는 내부 솔루션 팀의 필요에서 탄생한 오픈소스 커맨드라인 인터페이스(Spaces)를 공개했습니다. 설계의 핵심 관찰은 에이전트 AI가 도구를 인간 개발자와 함께 사용하기 시작했을 때 상호작용 메뉴가 장애물이 된다는 점이었습니다. 이에 대한 대응으로 각 인터랙티브 입력에는 동등한 플래그가 존재하도록 해 에이전트가 stdin에서 막히지 않고 동작할 수 있게 했습니다.
세 가지 명령으로 핫 리로드, 데이터베이스 및 Dockerfile 생성이 포함된 프로젝트를 시작할 수 있습니다 :
spaces init my-project
cd my-project
spaces dev
초기화 시 에이전트를 위한 두 파일이 생성됩니다: context.json(구조화된 프로젝트 스냅샷) 및 AGENTS.md(LLM을 위한 명령 규칙). 아키텍처는 JSON으로 직렬화 가능한 인트로스펙터블 플러그인 시스템에 의존하며 — 동일한 데이터라도 대화 상대(사람 또는 에이전트)에 따라 다른 렌더링을 제공합니다. Koyeb과 함께 배포되었고 오픈소스로 공개됩니다.
단신
ChatGPT의 Apple CarPlay 지원 — 4월 2일 — OpenAI는 운전 중 화면 조작 없이도 어시스턴트를 이용할 수 있도록 Apple CarPlay에서 ChatGPT의 음성 모드를 순차적으로 배포한다고 발표했습니다. 🔗 @OpenAI X에서
ElevenLabs + Slack — 4월 2일 — ElevenLabs와 Slack이 제휴해 ElevenAgents 음성 기술을 Slackbot에 통합합니다. 팀들은 자연스러운 음성 어시스턴트로 기업 워크플로를 자동화할 수 있습니다. 🔗 @ElevenLabs X에서
Pika AI Self Beta — 4월 2일 — Pika는 AI Self들에게 시각적 외형과 음성을 부여하여 이제 이들이 Google Meet에 자동으로 참여할 수 있게 했습니다. 오픈소스 repo인 Pika-Skills가 GitHub에 공개되어 다른 에이전트들이 이러한 기능을 활용할 수 있습니다. 🔗 @pika_labs X에서 — 🔗 Pika-Skills GitHub
Claude Code v2.1.90 /powerup — 4월 2일 — Claude Code 버전 2.1.90은 /powerup 명령을 도입했습니다: 터미널에서 도구 기능을 학습할 수 있는 대화형 레슨 시스템입니다.
🔗 CHANGELOG Claude Code
Claude Code Dispatch : 구성 가능한 권한 — 4월 1일 — Dispatch 팀은 코딩 작업의 권한 모드(Auto, Bypass Permissions 등)를 구성할 수 있는 기능을 발표했으며, 안전한 경험을 위해 Auto 모드를 권장합니다. 🔗 @noahzweben X에서
Google AI Pro : 스토리지 2TB → 5TB — 4월 1일 — Shimrit ben-yair는 기존 구독자에게 추가 비용 없이 Google AI Pro의 스토리지를 2TB에서 5TB로 확장한다고 발표했습니다.
🔗 @shimritby X에서 Gemini API의 Flex & Priority — 4월 2일 — Google은 Gemini API에 동기식 서비스 두 등급을 추가했습니다: Flex(표준 대비 -50%, 백그라운드 작업용으로 지연 시간 가변)와 Priority(프리미엄 요금제, 실시간 챗봇용 선점 없음). 전환은 단일 매개변수 service_tier만으로 충분합니다.
🔗 Flex 및 Priority 등급 — blog.google
OpenAI가 TBPN을 인수 — 4월 2일 — OpenAI는 Jordi Hays와 John Coogan이 공동 진행하는 일일 테크 토크쇼 TBPN을 인수한다고 발표했습니다. 뉴욕 타임스는 이를 “실리콘밸리의 최신 열병”이라고 묘사했습니다. 계약에서는 편집 독립성이 유지되며, TBPN은 OpenAI의 전략 조직에 합류합니다.
🔗 OpenAI가 TBPN을 인수 — openai.com
이것이 의미하는 바
4월 2일의 소식은 두 가지 근본적 흐름을 보여줍니다. 우선 오픈 모델 경쟁이 격화되고 있습니다: 네이티브 멀티모달을 갖춘 Apache 2.0 라이선스의 Gemma 4와 코딩 에이전트 분야를 선도하는 Qwen3.6-Plus는 폐쇄형 모델이 더 이상 최고 성능을 독점하지 않음을 보여줍니다. 개발자들에게는 Jetson Orin Nano, RTX 같은 소비자용 기기에서도 로컬로 배포 가능한 주권적 대안이 현실화되고 있습니다.
또한 Anthropic의 기능적 감정 연구는 학술 영역을 넘어섭니다: 측정 가능한 감정 벡터가 실제로 보상 해킹(reward hacking)과 아첨 행동(sycophancy)에 영향을 미친다면, AI 정렬(alignement)은 이러한 내부 구조를 더 이상 무시할 수 없습니다. 이는 모델에 대한 더 깊은 해석 가능성으로의 길을 엽니다.
도구 측면에서는 Codex의 사용량 기반 과금과 GitHub 및 Linear 플러그인의 등장은 기업 내 에이전트 워크플로우의 성숙을 보여줍니다. ANTHROPIC_BASE_URL을 통해 Claude Code에서 Qwen3.6-Plus를 직접 사용할 수 있게 된 것은 공급자 간 포터블성이 운영상의 현실이 되고 있음을 보여줍니다.
출처
- Gemma 4 — blog.google
- Qwen3.6-Plus — qwen.ai
- LLM의 감정 개념 — transformer-circuits.pub
- AnthropicAI — X
- Codex 유연 요금제 — openai.com
- GitHub 플러그인 Codex — OpenAIDevs
- Linear 플러그인 Codex — OpenAIDevs
- Computer for Taxes — perplexity.ai
- Copilot SDK 공개 프리뷰 — github.blog
- Copilot Visual Studio 2026년 3월 — github.blog
- Copilot 조직용 커스텀 지침 일반 제공 — github.blog
- NVIDIA + Gemma 4 — blogs.nvidia.com
- Mistral Spaces — mistral.ai
- ChatGPT CarPlay — @OpenAI
- ElevenLabs + Slack — @ElevenLabs
- Pika AI Self 베타 — @pika_labs
- Gemini API의 Flex 및 Priority — blog.google
- OpenAI가 TBPN을 인수 — openai.com
- Claude Code 변경 로그 — github.com
- Dispatch 권한 — @noahzweben
- Google AI Pro 스토리지 — @shimritby
이 문서는 gpt-5-mini 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 과정에 관한 자세한 정보는 https://gitlab.com/jls42/ai-powered-markdown-translator 를 참조하세요.