OpenAI의 GPT-5.4 mini와 nano 출시, NVIDIA Nemotron Coalition에 합류한 Mistral, 사용 가능한 Perplexity Comet Enterprise

2026년 3월 17일은 NVIDIA GTC와 여러 주요 출시 소식으로 채워졌다. OpenAI는 현재까지 가장 성능이 뛰어난 소형 모델인 GPT-5.4 mini와 nano를 공개했으며, 두 모델은 여러 벤치마크에서 전체 모델에 근접한다. NVIDIA Nemotron Coalition은 Mistral AI와 Perplexity의 합류로 더욱 확대됐다. Perplexity는 동시에 완전한 MDM 거버넌스를 갖춘 Comet Enterprise를 공개했고, Claude Code v2.1.77은 Opus 4.6의 생성 한도를 두 배로 늘렸으며, GitHub, Anthropic, Google, OpenAI는 오픈 소스 보안을 위해 1,250만 달러를 공동 지원했다.

GPT-5.4 mini와 nano: OpenAI의 소형 모델

3월 17일 — OpenAI는 GPT-5.4 mini와 GPT-5.4 nano를 출시했다. 이는 지금까지 가장 성능이 뛰어난 소형 모델이다. 이 두 변형은 고처리량 작업에 최적화된 형태로 GPT-5.4의 기능을 제공하며, 더 낮은 지연 시간과 더 낮은 비용을 갖춘다.

GPT-5.4 mini는 코드, 추론, 멀티모달 이해, 도구 사용에서 GPT-5 mini보다 크게 향상되었으며, 동시에 두 배 이상 빠르게 동작한다. 특히 SWE-Bench Pro와 OSWorld-Verified를 포함한 여러 핵심 평가에서 전체 GPT-5.4 모델의 성능에 근접한다.

GPT-5.4 nano는 GPT-5.4 제품군에서 가장 작고 가장 저렴한 버전으로, 속도와 비용이 중요한 작업인 분류, 데이터 추출, 순위 매기기, 단순 코드 서브에이전트용으로 설계됐다.

Évaluation	GPT-5.4	GPT-5.4 mini	GPT-5.4 nano	GPT-5 mini
SWE-Bench Pro (public)	57,7 %	54,4 %	52,4 %	45,7 %
Terminal-Bench 2.0	75,1 %	60,0 %	46,3 %	38,2 %
Toolathlon	54,6 %	42,9 %	35,5 %	26,9 %
GPQA Diamond	93,0 %	88,0 %	82,8 %	81,6 %
OSWorld-Verified	75,0 %	72,1 %	39,0 %	42,0 %

사용 사례는 세 가지 범주로 나뉜다. 코드 도우미(GPT-5.4 mini는 빠른 코딩 워크플로, 디버깅 루프, 프론트엔드 생성에서 뛰어남), 서브에이전트(Codex에서 GPT-5.4는 GPT-5.4 mini를 사용해 GPT-5.4 쿼터의 30%만으로 하위 작업을 위임할 수 있음), 그리고 인터페이스 제어(computer use)로, 여기서 GPT-5.4 mini는 밀집된 인터페이스의 스크린샷을 빠르게 해석한다.

Modèle	Disponibilité	Prix entrée	Prix sortie	Contexte
GPT-5.4 mini	API, Codex, ChatGPT Free/Go	0,75 $/million tokens	4,50 $/million tokens	400 000 tokens
GPT-5.4 nano	API uniquement	0,20 $/million tokens	1,25 $/million tokens	—

ChatGPT에서 GPT-5.4 mini는 + 메뉴의 “Thinking” 기능을 통해 Free 및 Go 사용자에게 제공된다. 유료 요금제에서는 GPT-5.4 Thinking의 속도 제한에 도달했을 때 대체 모델로 사용된다.

🔗 GPT-5.4 mini와 nano 소개

NVIDIA GTC 2026 : Nemotron Coalition과 Dynamo 1.0

16일부터 열리는 NVIDIA의 GTC 콘퍼런스는 오픈 소스 frontier 모델을 중심으로 한 공개 연합의 결성, 추론 운영 체제의 프로덕션 배포, 물리적 AI를 위한 데이터 청사진 발표 등 여러 주요 발표의 촉매제가 됐다.

Mistral이 NVIDIA Nemotron Coalition에 합류

3월 16일 — Mistral AI는 frontier 오픈 소스 AI 모델을 공동 개발하기 위해 NVIDIA와 전략적 파트너십을 발표했다. Mistral은 NVIDIA의 컴퓨팅 인프라와 개발 도구를 결합한 NVIDIA Nemotron Coalition의 창립 멤버가 된다.

Aspect	Détail
Rôle Mistral	창립 멤버, frontier 아키텍처 + 풀스택 AI 제공
Apport NVIDIA	GPU 인프라 + 개발 도구
Objectif	frontier 수준의 개방형 모델 공동 개발

🔗 X의 Mistral 발표

Perplexity도 연합에 합류

3월 16일 — Perplexity도 같은 NVIDIA Nemotron Coalition에 합류했다고 발표했다. 핵심 내용은 Perplexity가 응답 파이프라인의 각 단계(질의 분석, 추론, 최종 응답)에 맞춰 서로 다른 개방형 모델을 조정한다는 점이다. Nemotron 3 Super 모델(1200억 매개변수, MoE 아키텍처)은 이제 Perplexity 검색창, Agent API, Perplexity Computer에서 사용할 수 있다.

🔗 Perplexity 블로그 – Nemotron Coalition 🔗 NVIDIA 발표

Dynamo 1.0 : 추론 운영 체제의 프로덕션 전환

3월 16일 — NVIDIA는 GTC에서 Dynamo 1.0을 프로덕션에 배포했다고 발표했다. 이는 AI 팩토리(AI factories)를 위한 “추론 운영 체제”(inference operating system)로 소개된다. Dynamo는 최적화되지 않은 배포 대비 Blackwell GPU에서의 추론 성능을 최대 7배까지 끌어올린다. v1.0 전환은 실험 단계에서 산업 생산 단계로의 진입을 의미한다.

🔗 NVIDIA Dynamo 1.0 발표

Physical AI Data Factory Blueprint

3월 16일 — NVIDIA는 Physical AI Data Factory Blueprint를 공개했다. 이는 가속 컴퓨팅을 로보틱스, AI 비전 에이전트, 자율주행 차량을 위한 고품질 학습 데이터로 전환하기 위한 참조 아키텍처다. 이 blueprint를 통해 기업은 물리적 AI를 위한 학습 데이터를 대규모로 합성 생성할 수 있다.

🔗 NVIDIA Physical AI 발표

Cohere + NVIDIA : DGX Spark에서의 주권형 AI

3월 16일 — Cohere와 NVIDIA는 GTC에서 발표된 주권적이고 안전하며 효율적인 AI 개발을 위해 협력한다. 두 가지 주요 축은 NVIDIA ecosystem-native 모델(최신 NVIDIA 아키텍처에 최적화된 맞춤형 모델로, 특화된 enterprise 워크로드를 겨냥함)과 DGX Spark의 North(Cohere의 에이전틱 플랫폼 North가 NVIDIA DGX Spark에서 로컬·저지연으로 민감한 데이터를 다룰 수 있게 제공됨)이다. 주요 대상 산업은 금융, 의료, 공공 부문이다.

🔗 Cohere 블로그 – NVIDIA 주권형 AI

Perplexity Comet Enterprise : MDM 거버넌스와 CrowdStrike 통합

3월 17일 — Perplexity는 모든 Enterprise 구독자를 대상으로 Comet Enterprise를 출시했다. AI 브라우저가 완전한 배포 거버넌스를 갖춘 기업용 버전으로 전환된다.

Fonctionnalité	Description
Déploiement MDM	무음 설치 프로그램, 수천 대의 기기 배포, 감사 로그
Télémétrie granulaire	사용자별 추적
CrowdStrike Falcon	피싱 방지, 데이터 유출 탐지(스크린샷, 다운로드)
Intervention temps réel	CrowdStrike 통합을 통해 가능
Confidentialité	Perplexity는 enterprise 데이터로 모델을 절대 학습하지 않음

초기 사용자에는 Fortune 순위 기업, AWS, AlixPartners, Gunderson Dettmer, Bessemer Venture Partners가 포함된다. 문서화된 사용 사례는 고객 미팅 준비(실시간 뉴스), SOW 계약서 분석, 재무 계산, 업계 리서치 등을 포함한다.

🔗 Perplexity 블로그 – Comet Enterprise

Claude Code v2.1.77 : Opus 4.6의 기본값 64k tokens

3월 17일 — Claude Code v2.1.77가 출시되며 생성 한도가 크게 늘어나고 여러 치명적 버그가 수정됐다.

Modèle	Limite par défaut	Limite maximale
Claude Opus 4.6	64 000 tokens	128 000 tokens
Claude Sonnet 4.6	—	128 000 tokens

Opus 4.6의 기본 한도는 2배로 늘어났다(32k에서 64k tokens로). 추가 설정 없이도 훨씬 더 긴 응답이 가능해진다.

새로운 기능:

allowRead in the sandbox : 파일시스템용 새 설정으로, denyRead 규칙이 적용된 영역에서도 읽기를 다시 허용할 수 있다. 세분화된 보안 구성을 위해 유용하다.
/copy N : /copy 명령이 이제 선택적 인덱스를 받는다 — /copy 2는 기록을 탐색하지 않고도 바로 이전 두 번째 어시스턴트 응답을 복사한다.

주요 수정 사항:

복합 bash 명령에서의 “Always Allow” : 규칙이 하위 명령마다가 아니라 전체 문자열(cd src && npm test)에 저장되던 문제가 수정됐다.
Auto-updater : 창을 반복적으로 열고 닫을 때 병렬 다운로드를 시작해 메모리에 수십 기가바이트가 쌓일 수 있던 문제가 수정됐다.
--resume가 기록을 잘라내던 문제 : 메모리 추출 쓰기와 मुख्य transcript 사이의 경쟁 상태(race condition)로 인해 조용한 잘림이 발생할 수 있던 문제가 수정됐다.
PreToolUse hooks가 deny 규칙을 우회하던 문제 : "allow"를 반환하는 hook가 deny 권한 규칙을 우회했으며, 기업 관리 설정까지 포함됐다. 중요한 보안 수정이다.

🔗 Claude Code CHANGELOG

기술 문서: Claude Code 팀이 Skills를 사용하는 방법

3월 17일 — Anthropic의 Claude Code 팀 엔지니어 Thariq(@trq212)가 *“Lessons from Building Claude Code: How We Use Skills”*를 공개했다. 이는 “Seeing like an Agent” (2월 27일, 조회수 360만 회)에 이어진 두 번째 글이다.

이 글은 Skills가 Claude Code에서 가장 많이 사용되는 확장 포인트 중 하나가 된 과정을 문서화한다. 유연하고 유지보수가 쉬우며, 팀이 개발 환경 안에서 재사용 가능한 워크플로를 직접 정의할 수 있게 해준다. Claude Code 책임자인 Boris Cherny(@bcherny)는 이 글을 “Really great writeup”이라고 평가하며 공유했다. 저자는 또한 실제 사례로 사용할 오픈 소스 iMessage skill을 곧 공개할 예정이라고 밝혔다.

“Using Skills well is a skill issue. I didn’t quite realize how much until I wrote this.”

🇰🇷 Skills를 잘 사용하는 것은 역량의 문제다. 이 글을 쓰기 전까지 나는 그것이 얼마나 중요한지 깨닫지 못했다. — @trq212 sur X

🔗 게시 트윗

Codex Security : 왜 SAST 보고서가 없는가

3월 16일 — OpenAI는 Codex Security의 설계 선택 배경을 설명하는 기술 문서를 공개했다. 왜 이 시스템이 출발점으로 정적 분석(SAST)에 의존하지 않는지에 대한 내용이다.

이 접근법은 네 가지 축으로 구성된다. 맥락적 읽기(저장소 맥락과 함께 전체 코드 경로를 분석), 표적 마이크로 퍼징(마이크로 퍼저를 작성하기 위해 테스트 가능한 가장 작은 조각으로 축소), 제약 조건 추론(z3-solver가 포함된 Python 환경을 사용해 복잡한 문제를 형식화), 그리고 샌드박스 검증(컴파일된 PoC로 “이것은 문제일 수 있다”와 “이것은 문제다”를 구분)이다. 이 글은 CVE-2024-29041(Express)을 예시로 이러한 원칙을 설명한다. 이는 잘못 형식화된 URL이 allowlist 구현을 우회하는 오픈 리디렉션 취약점이다.

🔗 Codex Security에 SAST 보고서가 포함되지 않는 이유

Gemini Personal Intelligence : 미국에서 무료로 확대

3월 17일 — Google은 미국에서 더 많은 사용자에게 Personal Intelligence를 무료로 확대한다. 지금까지 유료 구독자에게만 제공되던 이 기능은 이제 세 가지 경로를 통해 free-tier 계정에서도 사용할 수 있다. Google Search의 AI Mode, Gemini 앱(iOS/Android), 그리고 Chrome의 Gemini 확장 프로그램이다.

Personal Intelligence는 사용자의 Google 앱(Gmail, Google Photos, YouTube, Search)을 안전하게 연결해 개인화된 응답을 제공한다. 예를 들어 과거 구매 내역에 맞춘 쇼핑 추천, Gmail 영수증에서 추출한 정확한 구매 기기를 대상으로 한 기술 지원, 호텔 확인 정보를 바탕으로 한 맞춤형 여행 일정 등이 있다. 사용자는 어떤 앱을 연결할지 선택할 수 있고 언제든 비활성화할 수 있다. 개인 Google 계정에서만 사용 가능하며(Workspace 기업/교육용은 제외) 이용할 수 있다.

🔗 Google 블로그 – Personal Intelligence

AlphaFold Database : 수백만 개의 새로운 단백질 복합체 구조

3월 17일 — Google DeepMind는 EMBL-EBI(유럽 생물정보학 연구소), NVIDIA, 서울대학교와 협력해 AI가 예측한 수백만 개의 새로운 단백질 복합체 구조를 포함하도록 **AlphaFold Database(AFDB)**의 확장을 발표했다. 새 구조는 특히 WHO 우선순위 세균 병원체, 즉 가장 위험하고 항생제 내성이 강한 세균을 포함한다. 이번 확장은 개별 단백질 수준에서 여러 단백질 간 상호작용인 단백질 복합체로 범위를 넓히며, 의학 및 제약 연구에 큰 도약을 의미한다.

🔗 Pushmeet Kohli의 X 발표

xAI : Grok의 Text-to-Speech API와 비디오 편집 1위

Text-to-Speech API

3월 16일 — xAI는 개발자를 위한 자연스럽고 표현력 있는 음성을 제공하는 Grok의 Text-to-Speech API를 공개했다. LiveKit은 출시와 동시에 이를 LiveKit Inference에 통합했다.

🔗 X의 xAI 발표

Grok Imagine, 비디오 편집 1위

3월 15일 — Grok Imagine은 Design Arena 랭킹에서 비디오 편집 1위를 달성했으며, Elo는 1290이다. L’API Imagine는 이제 개발자들이 사용할 수 있습니다. 이 기능은 비디오 장면에서 객체의 추가, 삭제, 교체를 지원합니다.

🔗 X의 Grok 공지

Perplexity Computer: Comet과 Android의 완전 제어

MCP 없이 Comet을 제어하는 Computer

3월 16일 — Computer는 이제 Comet 브라우저를 완전히 제어하여 자율 작업을 실행할 수 있습니다. 브라우저 에이전트는 커넥터나 MCP 없이도 연결된 모든 사이트나 앱에 접근할 수 있습니다. Comet의 모든 Computer 사용자에게 제공됩니다.

🔗 Perplexity 트윗

Android의 Computer

3월 16일 — Perplexity Computer가 이제 Android에서도 제공되어, 3월 13일 iOS 출시가 모든 모바일 플랫폼으로 확대되었습니다.

🔗 Perplexity Android 트윗

Manus: 로컬 데스크톱과 개발자 수준의 Google Workspace

macOS와 Windows의 Manus “My Computer”

3월 16일 — Manus가 새로운 Manus Desktop 앱(macOS 및 Windows)의 핵심 기능인 **“My Computer”**를 발표했습니다. 그동안 클라우드 샌드박스에 제한되어 있던 Manus는 이제 로컬 터미널에서 명령줄 지시를 통해 로컬 머신에서 직접 실행될 수 있으며, 각 단계마다 사용자의 명시적 승인이 필요합니다.

활용 사례는 매우 폭넓습니다. 수천 개의 파일을 정리하고 이름을 바꾸거나, 네이티브 데스크톱 앱을 만들 수 있습니다(예시로는 Xcode를 열지 않고 20분 만에 만든 실시간 번역 및 자막용 Mac 앱이 언급됨). 또는 로컬 GPU를 사용해 머신러닝 모델을 학습할 수도 있습니다. My Computer는 기존의 클라우드 커넥터(Google Calendar, Gmail)를 대체하는 것이 아니라 보완합니다.

🔗 Manus 트윗 · 🔗 Manus 블로그

Manus가 Google Workspace를 정밀하게 다룹니다

3월 17일 — Manus가 Google Workspace CLI(Google 팀의 오픈 소스 도구)를 기반으로 한 Google Workspace 커넥터의 대규모 업데이트를 배포합니다. 이전 버전은 Google 파일을 단일한 블록처럼 처리했지만, 새 버전은 세밀한 작업을 가능하게 합니다.

영역	새로운 기능
Google Docs	정밀한 텍스트 치환, 특정 댓글에 대한 답글
Google Sheets	여러 시트에 걸친 교차 읽기, 정확한 셀 업데이트, 탭 복제
Google Slides	기존 프레젠테이션 편집(슬라이드 제목, 타임라인 업데이트)
Google Drive	폴더 재구성

이 업데이트는 무료이며 이전 버전과 호환됩니다.

🔗 Manus 트윗 · 🔗 Manus 블로그

GitHub: 대규모 유지보수를 위한 `/fleet`와 오픈 소스를 위한 1,250만 달러

Copilot `/fleet`: 전체 저장소 플릿에 걸친 유지보수

3월 15일 — GitHub가 GitHub Copilot에서 /fleet 명령을 시연했습니다. 한 번의 지시로 여러 저장소를 관리하는 개발자들은 반복적인 유지보수 작업(구성 업데이트, 의존성 수정)을 저장소별로가 아니라 전체 플릿에 걸쳐 에이전트에게 맡길 수 있습니다.

🔗 GitHub 트윗

오픈 소스 보안을 위한 1,250만 달러

3월 17일 — GitHub, Anthropic, AWS, Google, OpenAI가 1,250만 달러의 공동 약속을 통해 Alpha-Omega를 지원합니다. Alpha-Omega는 오픈 소스 생태계의 보안을 강화하기 위한 Linux Foundation 프로그램입니다.

GitHub 측 핵심 내용: 수억 개의 공개 저장소에 걸친 28만 명 이상의 유지보수자가 GitHub Copilot Pro 무료 이용 대상이 됩니다. GitHub는 교육을 위해 Azure 크레딧 550만 달러도 추가로 투입합니다. 이미 138개 프로젝트를 지원한 GitHub Secure Open Source Fund는 2026년 4월 말 네 번째 지원 세션을 시작합니다.

맥락도 중요합니다. AI는 취약점 발견 속도를 크게 높였고, 그만큼 유지보수자의 부담도 커졌습니다. 명시된 목표는 AI가 그 부담을 늘리는 것이 아니라 줄이는 것입니다.

🔗 GitHub 블로그 글 🔗 Linux Foundation 공지

Z.ai GLM-5-Turbo: 에이전트 환경을 위한 고속 버전

3월 15일 — Z.ai가 에이전트 환경(특히 OpenClaw)에 최적화된 GLM-5의 고속 변형인 GLM-5-Turbo를 출시했습니다. 같은 날 GLM Coding Plan 구독자의 사용 한도도 3배로 늘어났습니다. OpenRouter와 직접 API를 통해 이용할 수 있습니다.

🔗 X의 Z.ai 공지

Kimi가 Attention Residuals에 대한 논문을 발표

3월 16-17일 — Moonshot AI가 arXiv에 Attention Residuals에 대한 연구 논문을 발표했습니다. 이는 표준 residual connection을 시간/깊이 이중성에서 영감을 받은 recurrence로 대체하는 새로운 깊이별 집계 접근법(depth-wise aggregation)입니다. 분석 결과, 이 접근법은 hidden state의 크기 증가 문제를 자연스럽게 완화하는 것으로 나타났습니다. Elon Musk는 공지 트윗에 “Impressive work from Kimi”라고 답했습니다(조회수 450만 회).

🔗 Kimi 트윗 · 🔗 arXiv 2603.15031

ElevenLabs × Deloitte: 기업을 위한 옴니채널 에이전트

3월 14일 — ElevenLabs와 Deloitte는 대화형 옴니채널 에이전트를 대규모 기업에 배포할 수 있도록, ElevenLabs Agents 플랫폼과 Deloitte의 산업 전문성을 결합하는 전략적 파트너십을 발표했습니다. 이 파트너십은 규제 산업(금융, 의료, 공공 서비스)의 기업을 대상으로 합니다. Deloitte는 업무 통합을 담당하고, ElevenLabs는 AI 오디오 인프라(음성, 전사, 에이전트)를 제공합니다.

🔗 ElevenLabs 블로그

짧은 소식

Tongyi Fun-CineForge(Alibaba, 3월 16일) — Tongyi Lab이 전문 영화 수준의 품질에 근접한 AI 영화 더빙 시스템 Fun-CineForge를 오픈 소스로 공개했습니다. GitHub, HuggingFace, ModelScope에서 이용할 수 있습니다. 🔗 X의 공지

이것이 의미하는 것

NVIDIA GTC 2026은 중요한 흐름을 응축해 보여줍니다. 여러 선도 AI 연구소(Mistral, Perplexity, Cohere)가 NVIDIA 인프라를 중심으로 정렬되며, 개방형 프런티어 모델이나 주권적 배포를 공동 개발하고 있습니다. 이런 개방형 연합 중심의 수렴은 최근의 파편화와 대조되며, 대규모 사전 학습이 이제는 사일로에서 다루기엔 너무 비싸졌음을 보여줍니다.

GPT-5.4 mini는 무거운 흐름 하나를 확인시켜 줍니다. “소형” 모델은 더 이상 성능이 떨어지는 버전이 아니라 경쟁력 있는 대안입니다. SWE-Bench Pro에서 전체 모델의 57.7%에 비해 54.4%를 기록했고, 비용은 19배 저렴합니다. GPT-5.4 mini는 코딩 워크플로에서 성능/가격 비율을 새로 정의합니다.

3월 17일은 로컬 및 데스크톱 에이전트의 부상을 보여주기도 합니다. Manus “My Computer”는 클라우드를 벗어나 로컬 머신에 접근하고, Perplexity Computer는 MCP 없이 Comet을 제어하며, Claude Code는 Opus 4.6의 기본 생성 창을 두 배로 늘렸습니다. 제안만 하던 에이전트의 시대는 실행하는 에이전트의 시대로 넘어가고 있습니다.

출처

이 문서는 gpt-5.4-mini 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 과정에 대한 자세한 내용은 https://gitlab.com/jls42/ai-powered-markdown-translator를 참조하세요.