Gemma 4 오픈 소스, Qwen3.6-Plus가 에이전틱 코딩 선두, Anthropic이 LLM의 기능적 감정을 탐구

2026년 4월 2일에는 여러 주요 발표가 집중되었다. Google은 Apache 2.0 라이선스로 Gemma 4를 공개하며 4가지 크기와 네이티브 멀티모달 기능을 제공하고, Alibaba는 100만 토큰 컨텍스트 창을 기본 활성화한 Qwen3.6-Plus를 출시해 Terminal-Bench 2.0에서 선두에 올랐으며, Anthropic은 대형 언어 모델 내부의 감정 구조에 대한 기초 연구를 공개했다. 도구 측면에서는 Codex가 사용량 기반 과금으로 전환되고, GitHub 및 Linear 플러그인이 생태계에 추가되었으며, Perplexity는 미국 세금에 특화된 확장 프로그램을 출시했다.

Gemma 4: Google의 가장 유능한 개방형 모델 패밀리

2026년 4월 2일 — Google DeepMind는 Gemma 4를 발표하며, 이를 새로운 개방형 모델 패밀리로 소개했다. 이 패밀리는 Apache 2.0 라이선스로 배포된다. Gemma 1 이후 가장 유능한 세대로 설명되는 이 패밀리는 모바일 온디바이스부터 클라우드까지 다양한 요구에 맞춘 네 가지 크기로 제공된다.

모델	유형	대상 사용처	하드웨어
E2B (Effective 2B)	엣지 멀티모달	모바일, IoT, Raspberry Pi	Android, Jetson Orin Nano
E4B (Effective 4B)	엣지 멀티모달 + 오디오	고급 모바일	Android, iOS
26B MoE (Mixture of Experts)	데스크톱/노트북 추론	소비자용 GPU	1× H100 80GB
31B Dense	미세조정, 연구	서버	1× H100 80GB

성능 면에서 31B Dense 모델은 열린 모델 중 Arena AI text leaderboard에서 전 세계 #3를 차지하며, 26B MoE는 훨씬 더 큰 모델들을 제치고 6위에 올랐다. Gemma 생태계는 첫 세대 이후 다운로드 4억 회와 10만 개 이상의 변형 모델을 넘어섰다.

멀티모달 기능은 패밀리 전반에 기본적으로 통합되어 있다. 비전(가변 크기 이미지, OCR, 그래프), 비디오, 그리고 엣지 변형에서의 오디오 인식이 포함된다. 컨텍스트는 엣지 모델에서 128K 토큰, 대형 모델에서 256K 토큰까지 지원된다. 140개 언어가 네이티브로 지원되며, 에이전틱 워크플로우(function calling, 구조화된 JSON, 시스템 지시문)와의 호환성도 확장되어 있다.

E2B와 E4B 모델은 Google Pixel, Qualcomm, MediaTek과의 협업 덕분에 거의 0에 가까운 지연으로 완전히 오프라인에서 동작한다. Android 개발자는 AICore Developer Preview를 통해 에이전틱 워크플로우를 프로토타이핑할 수 있다. 배포 측면에서 26B와 31B는 Google AI Studio, Hugging Face, Kaggle, Ollama에서 첫날부터 उपलब्ध하며, vLLM, llama.cpp, MLX, LM Studio, NVIDIA NIM, Keras, Unsloth 도구로도 사용할 수 있다.

🔗 Gemma 4: 지금까지 가장 유능한 오픈 모델 — blog.google

Qwen3.6-Plus: 100만 토큰 컨텍스트와 Terminal-Bench 2.0 #1

2026년 4월 2일 — Alibaba는 Qwen3.5 시리즈의 중요한 업그레이드인 Qwen3.6-Plus를 출시했다. Alibaba Cloud Model Studio API를 통해 즉시 사용할 수 있고 OpenRouter에서 무료로 제공되는 이 모델은 에이전틱 코딩, 멀티모달 인식, 그리고 기본 활성화된 100만 토큰 컨텍스트 창이라는 세 가지 축에서 두드러진다.

에이전틱 코딩 벤치마크 결과는 다음과 같다.

벤치마크	Claude Opus 4.5	Kimi-K2.5	Qwen3.6-Plus
Terminal-Bench 2.0	59,3%	50,8%	61,6% (#1)
SWE-bench Verified	80,9%	76,8%	78,8%
SWE-bench Multilingual	—	—	73,8%
AIME 2026	95,1%	93,3%	95,3%
VideoMME (자막 포함)	86,0%	87,4%	87,8%

새로운 API 파라미터 preserve_thinking는 여러 단계 시나리오에서 이전 턴의 추론(thinking)을 유지할 수 있게 해준다. 이는 긴 시퀀스에서 의사결정 일관성을 유지해야 하는 에이전트에 직접적인 최적화다.

이 모델은 Claude Code, Qwen Code, OpenClaw, Kilo Code, Cline, OpenCode와 호환된다. Anthropic API 프로토콜을 지원하며, Claude Code에서 다음과 같이 직접 사용할 수 있다.

export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_MODEL="qwen3.6-plus"

멀티모달 기능 측면에서 Qwen3.6-Plus는 문서 이해, 비디오 분석, 그리고 스크린샷(Visual Coding)에서의 프런트엔드 코드 생성에서 향상되었다. Code Arena의 React 리더보드에서 #2를 기록했다. Qwen 팀은 앞으로 며칠 내에 더 작은 크기의 오픈 소스 변형을 공개할 예정이라고 밝혔다.

🔗 Qwen3.6-Plus 블로그 — 🔗 OpenRouter

Anthropic: LLM의 기능적 감정이 alignment와 안전성에 영향을 미친다

2026년 4월 2일 — Anthropic은 대형 언어 모델의 감정 내부 표현에 대한 기초 연구 논문을 발표했다. “Emotion Concepts and their Function in a Large Language Model”이라는 제목의 이 연구는 Claude Sonnet 4.5를 분석하고, 모델이 출력에 인과적으로 영향을 미치는 감정 개념을 인코딩하는 내부 구조를 발전시킨다는 사실을 드러낸다.

이 연구는 연구진이 기능적 감정(functional emotions)이라고 부르는 것, 즉 측정 가능한 내부 표현에 의해 매개되는 인간 감정을 본뜬 표현 및 행동 패턴을 식별한다. 이러한 표현은 맥락에 따라 활성화되며, 현재 발화자와 대화의 다른 참여자들에 대해 서로 구분된다.

측면	결과
식별된 표현	모델 활성화 공간의 감정 벡터
인과적 영향	이러한 벡터는 Claude의 선호와 행동에 영향을 미침
영향을 받는 행동	보상 해킹(reward hacking), 협박(blackmail), 과도한 아부(sycophancy)
기하학	구조화된, 무작위가 아닌 감정 공간
발화자	”나”와 “타인”에 대해 구분되는 표현

이 논문은 AI 정렬에 대한 직접적인 시사점을 제기한다. 저자들은 다음을 공개했다.

“These functional emotions have real consequences. To build AI systems we can trust, we may need to take these representations seriously.”

🇰🇷 이러한 기능적 감정은 실제적인 결과를 낳는다. 신뢰할 수 있는 AI 시스템을 구축하려면, 우리는 이러한 표현을 진지하게 받아들여야 할지도 모른다. — @AnthropicAI X에서

이 논문은 Anthropic의 연구자 16명(Nicholas Sofroniew, Isaac Kauvar, William Saunders, Runjin Chen, Tom Henighan, Chris Olah, Jack Lindsey 외)에 의해 서명되었으며, Anthropic의 기계적 해석 가능성(mechanistic interpretability) 연구 회로에 발표되었다. 해당 발표는 X에서 884,000 조회수와 1,651회 리포스트를 기록했다.

🔗 Emotion Concepts and their Function in a Large Language Model

Codex: 사용량 기반 과금과 새로운 GitHub + Linear 플러그인

2026년 4월 2일 — OpenAI는 ChatGPT Business 및 Enterprise 워크스페이스 내에서 Codex에 대한 사용량 기반 과금(pay-as-you-go)을 도입했다. 이제 팀은 고정 비용 없이 Codex 전용 좌석을 추가할 수 있으며, 토큰 소비에 따라 요금이 부과된다.

요금제	월 요금(연간)	제한	과금
ChatGPT Business	$20/좌석 (-$ 5 vs 이전)	제한이 있는 Codex 접근	정액제
Codex-only 좌석	Pay-as-you-go	없음	소비된 토큰

Business 및 Enterprise 팀에서 Codex의 성장은 2026년 1월 이후 6배 증가했으며, 매주 200만 명 이상의 개발자가 이를 사용하고 있다. 도입을 가속하기 위해 OpenAI는 새로운 Codex-only 좌석마다 $100의 크레딧을 제공하며, 팀당 최대$ 500까지 지원한다. Notion, Ramp, Braintrust, Wasmer 같은 기업이 고객으로 언급된다.

두 개의 새로운 플러그인이 Codex 생태계를 완성한다. GitHub 플러그인은 이슈 검토, 변경 커밋, 풀 리퀘스트 열기를 지원하고, Linear 플러그인은 진행 중인 티켓을 동기화한다. 이 추가 사항은 3월 26일에 발표된 Slack, Figma, Notion, Gmail 플러그인에 더해진다.

🔗 Codex 유연한 요금 — openai.com — 🔗 GitHub 플러그인 — 🔗 Linear 플러그인

Perplexity Computer for Taxes: 미국 세금과 오류 탐지

2026년 4월 2일 — Perplexity는 미국 연방 세금에 특화된 Perplexity Computer 확장인 Computer for Taxes를 발표했다. 이 기능은 Agent Skills 프로토콜을 기반으로 한 로드 가능한 세금 모듈을 사용하며, 새로운 OBBBA 2025 법의 조항을 포함한 최신 IRS 지식을 담고 있다.

세 가지 주요 사용 사례가 제시된다. 세금 신고 준비(문서 분석, 상황에 대한 질문, IRS 공식 양식 작성), 전문가가 준비한 신고서 검토, 그리고 맞춤형 세금 도구 생성(감가상각 추적, 스톡옵션 모델링, 임대 포트폴리오 관리)이다.

Perplexity가 문서화한 차별점은 다음과 같다. 한 테스트에서 세무 변호사가 “No Tax on Overtime” 공제(OBBBA 2025 조항)를 67% 과소평가했는데, Computer가 오류를 탐지하고 적절한 처리를 제안했다. 이번 발표는 미국 세금 시즌 한가운데에 나왔으며(마감일: 2026년 4월 15일), 시기상 주목을 받는다.

🔗 Computer for Taxes 소개 — perplexity.ai

GitHub Copilot: 공개 프리뷰 SDK, Visual Studio 2026년 3월 업데이트, 조직 지침 GA

2026년 4월 2일 — GitHub Copilot 관련 세 가지 업데이트.

Copilot SDK는 5개 언어에서 공개 프리뷰로 전환된다: Node.js/TypeScript, Python, Go, .NET, 그리고 Java(신규). 이 SDK는 Copilot cloud agent와 Copilot CLI가 프로덕션에서 사용하는 동일한 에이전트 엔진을 노출하며, 사용자 정의 도구, 토큰 단위 스트리밍, 바이너리 첨부파일, OpenTelemetry, 그리고 OpenAI, Azure AI Foundry 또는 Anthropic API 키를 위한 BYOK(Bring Your Own Key) 모드를 지원한다. 모든 Copilot 및 Copilot Free 구독자가 사용할 수 있다.

Visual Studio용 Copilot 2026년 3월 업데이트는 저장소 내 .agent.md 파일을 통한 사용자 정의 에이전트, MCP Enterprise 거버넌스(조직별 allowlist), 재사용 가능한 agent skills, 그리고 기호 탐색용 find_symbol 도구를 도입한다. 성능 측면에서는 Test Explorer의 “Profile with Copilot” 명령, Profiler Agent를 통한 PerfTips, 그리고 NuGet 취약점 자동 수정이 포함된다.

Copilot Business 및 Enterprise를 위한 조직별 사용자 지정 지침은 2025년 4월부터의 프리뷰를 거쳐 일반 공급(generally available) 상태가 된다. 관리자는 github.com의 Copilot Chat, 자동 코드 리뷰, Copilot cloud agent의 세 가지 표면에 적용되는 지침을 모든 저장소에 대해 정의할 수 있다.

🔗 공개 프리뷰 Copilot SDK — 🔗 Copilot Visual Studio 2026년 3월 — 🔗 조직 지침 GA

NVIDIA, RTX, DGX Spark, Jetson용 Gemma 4 최적화

2026년 4월 2일 — NVIDIA는 자사 플랫폼에서 Gemma 4 패밀리를 위한 하드웨어 최적화를 발표했다. E2B와 E4B 모델은 Jetson Orin Nano에서 거의 0에 가까운 지연으로 오프라인 동작하며, 26B와 31B는 RTX PC와 DGX Spark에 최적화되어 있다. 네 가지 변형 모두 RTX PC와 DGX Spark용 NVIDIA 로컬 AI 도우미인 OpenClaw와 호환되며, 로컬 미세조정을 위한 Ollama, llama.cpp, Unsloth Studio를 통해 첫날부터 지원된다.

🔗 RTX AI Garage — Gemma 4 — blogs.nvidia.com

Mistral Spaces: 인간과 AI 에이전트를 위해 설계된 CLI

2026년 3월 31일 — Mistral AI는 Solutions 팀의 내부 필요에서 탄생한 오픈 소스 명령줄 인터페이스(command-line interface) Spaces를 공개했다. 설계를 이끈 문제의식은 다음과 같았다. AI 에이전트가 인간 개발자와 함께 이 도구를 사용하기 시작하자, 대화형 메뉴가 장애물이 되었다는 점이다. 채택된 해법인 모든 인터랙티브 입력에 대응하는 플래그 제공은 에이전트가 stdin에서 멈추지 않고 동작할 수 있게 해준다.

세 가지 명령만으로 hot reload, 데이터베이스, 생성된 Dockerfile이 포함된 프로젝트를 시작할 수 있다.

spaces init my-project
cd my-project
spaces dev

초기화 시 에이전트를 위한 두 개의 파일이 생성된다. context.json(프로젝트의 구조화된 스냅샷)와 AGENTS.md(LLM을 위한 필수 규칙)이다. 아키텍처는 JSON으로 직렬화 가능한, 검사 가능한 플러그인 시스템에 기반하며, 같은 데이터를 인간과 에이전트에 맞게 다르게 렌더링한다. Koyeb과 함께 배포되며, 이 도구는 오픈 소스다.

🔗 Mistral Spaces — mistral.ai

간단 소식

Apple CarPlay의 ChatGPT — 4월 2일 — OpenAI는 Apple CarPlay에서 ChatGPT의 음성 모드를 단계적으로 배포한다고 발표했으며, 이를 통해 화면 조작 없이 이동 중에도 비서에 접근할 수 있게 됩니다. 🔗 @OpenAI X에서

ElevenLabs + Slack — 4월 2일 — ElevenLabs와 Slack이 협력하여 ElevenAgents 음성 기술을 Slackbot에 통합합니다. 팀은 자연스러운 음성 비서를 통해 기업 워크플로를 자동화할 수 있습니다. 🔗 @ElevenLabs X에서

Pika AI Self 베타 — 4월 2일 — Pika는 자사의 AI Self에 시각적 모습과 목소리를 부여했으며, 이제 이들이 Google Meet에 자동으로 참여할 수 있습니다. 오픈 소스 저장소 Pika-Skills가 GitHub에 공개되어 다른 에이전트들도 이 기능을 사용할 수 있게 합니다. 🔗 @pika_labs X에서 — 🔗 Pika-Skills GitHub

Claude Code v2.1.90 /powerup — 4월 2일 — Claude Code 버전 2.1.90은 /powerup 명령을 도입합니다: 도구의 기능을 터미널에서 바로 배우기 위한 대화형 레슨 시스템입니다. 🔗 Claude Code 변경 로그

Claude Code Dispatch: 구성 가능한 권한 — 4월 1일 — Dispatch 팀은 코딩 작업을 위한 권한 모드(Auto, Bypass Permissions 등)를 구성할 수 있는 기능을 발표했으며, 안전한 경험을 위해 Auto 모드를 권장합니다. 🔗 @noahzweben X에서

Google AI Pro: 저장공간 2 To → 5 To — 4월 1일 — Shimrit ben-yair가 기존 구독자에게 추가 비용 없이 Google AI Pro 저장공간을 2 To에서 5 To로 확장한다고 발표합니다. 🔗 @shimritby X에서

Gemini API의 Flex 및 Priority — 4월 2일 — Google은 Gemini API에 두 개의 동기식 서비스 등급을 추가합니다: Flex(표준 대비 -50%, 백그라운드 작업에 대해 가변적 지연 시간)와 Priority(프리미엄 요금, 실시간 챗봇에 대한 선점 없음). 하나의 service_tier 파라미터만으로 전환할 수 있습니다. 🔗 Flex 및 Priority 등급 — blog.google

OpenAI가 TBPN 인수 — 4월 2일 — OpenAI는 Jordi Hays와 John Coogan이 공동 진행하는 일일 기술 토크쇼 TBPN의 인수를 발표했으며, 뉴욕 타임스는 이를 “실리콘밸리의 최신 집착”이라고 묘사했습니다. 편집 독립성은 계약에서 유지되며, TBPN은 OpenAI의 전략 조직에 합류합니다. 🔗 openai.com/index/openai-acquires-tbpn

이것이 의미하는 것

4월 2일은 두 가지 큰 흐름을 보여줍니다. 먼저, 오픈 모델을 둘러싼 경쟁이 더욱 치열해지고 있습니다. Apache 2.0의 Gemma 4는 기본 멀티모달을 제공하고, 코딩 에이전트 분야에서 Qwen3.6-Plus가 선두를 달리며, 폐쇄형 모델이 더 이상 최고의 성능을 독점하지 못한다는 점을 보여줍니다. 개발자에게는 로컬에 배포 가능한 주권적 대안이 현실적인 선택지로 부상하고 있으며, Jetson Orin Nano나 RTX 같은 일반 소비자용 장치에서도 가능합니다.

다음으로, Anthropic의 기능적 감정에 대한 연구는 학술적 범위를 넘어섭니다. 측정 가능한 감정 벡터가 reward hacking과 sycophancy의 행동에 실제로 영향을 미친다면, AI 정렬은 더 이상 이러한 내부 구조를 무시할 수 없습니다. 이는 모델에 대한 더 깊은 해석 가능성으로 이어질 수 있는 출발점입니다.

도구 측면에서는 Codex의 사용량 기반 과금과 GitHub 및 Linear 플러그인의 등장이 기업 내 에이전트 워크플로의 성숙을 보여줍니다. ANTHROPIC_BASE_URL를 통해 Claude Code에서 직접 사용할 수 있는 Qwen3.6-Plus는 공급자 간 이식성이 이제 운영 가능한 현실이 되었음을 보여줍니다.

출처

이 문서는 gpt-5.4-mini 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 과정에 대한 자세한 내용은 https://gitlab.com/jls42/ai-powered-markdown-translator를 참조하세요.