GPT-5.5 Instant 새로운 ChatGPT 기본값, xAI API의 Grok 4.3, Anthropic x Blackstone 기업용

이번 주는 꽤 바빴다. OpenAI는 모든 ChatGPT 사용자에게 GPT-5.3 Instant를 GPT-5.5 Instant로 직접 대체했고, xAI는 100만 토큰 컨텍스트를 지원하는 Grok 4.3을 API에 출시했으며, Anthropic은 Blackstone, Hellman & Friedman, Goldman Sachs와 공동 설립한 새로운 기업용 AI 서비스 회사를 발표했다. 도구 측면에서는 GitHub가 MCP 서버를 통해 보안 GA/프리뷰를 3배 확장했고, Perplexity는 금융 팀 전용 제품을 출시했으며, Runway는 단일 이미지에서 생성되는 실시간 비디오 에이전트를 공개했다.

GPT-5.5 Instant — ChatGPT의 새로운 기본 모델

5월 5일 — OpenAI가 모든 ChatGPT 사용자에 대해 GPT-5.3 Instant를 GPT-5.5 Instant로 교체하며 ChatGPT의 기본 모델로 지정했다. 배포는 이틀에 걸쳐 진행된다.

차원	GPT-5.3 Instant 대비 개선
환각(의학, 법률, 금융)	-52.5%
부정확한 주장(사용자 신고 기준)	-37.3%
응답 장황함	평균 단어 수 -30.2%

이 모델은 이미지 분석, STEM 응답, 웹 검색 사용 판단도 개선한다. 응답은 핵심을 잃지 않으면서 더 간결해졌고, 불필요한 형식과 쓸데없는 후속 질문도 줄었다.

메모리 소스 — OpenAI가 모든 ChatGPT 모델에 “memory sources”를 도입했다. 저장된 기억, 과거 대화 또는 연결된 Gmail을 바탕으로 응답이 개인화될 때, 사용자는 어떤 소스가 사용되었는지 정확히 확인할 수 있으며 이를 수정하거나 삭제할 수 있다. 과거 대화와 파일을 통한 개인화는 우선 Plus 및 Pro 구독자(web)에만 제공되며, 다른 요금제는 추후 적용된다.

이용 가능 여부:

모든 ChatGPT 사용자에게 2일에 걸쳐 점진적 배포
API에서 chat-latest 별칭으로 사용 가능
GPT-5.3 Instant는 유료 구독자에게 3개월간 계속 사용 가능

🔗 GPT-5.5 Instant 공식 발표

xAI API에 Grok 4.3 출시 — 100만 토큰 컨텍스트, #1 agentic tool calling

5월 5일 — xAI가 X를 통해 xAI API(console.x.ai)에 Grok 4.3 출시를 발표했다. 이 모델은 현재까지 가장 빠르고 가장 똑똑한 제품군 모델로 소개된다.

특성	값
컨텍스트 윈도우	100만 토큰
agentic tool calling 벤치마크	#1 (@ArtificialAnlys leaderboard)
instruction following 벤치마크	#1 (@ArtificialAnlys leaderboard)
enterprise 도메인	#1 case law 및 corporate finance (@ValsAI)
이용 가능 여부	xAI API (console.x.ai) — 아직 grok.com에는 없음

Grok 4.3 is now live on the xAI API. It’s our fastest, most intelligent model to date. It tops the @ArtificialAnlys leaderboards in agentic tool calling and instruction following, and ranks #1 in @ValsAI enterprise domains like case law and corporate finance. Grok 4.3 supports a 1 million token context.

🇰🇷 Grok 4.3이 이제 xAI API에서 사용 가능합니다. 이는 지금까지 우리의 가장 빠르고 가장 똑똑한 모델입니다. 이 모델은 agentic tool calling과 instruction following에서 @ArtificialAnlys 순위표의 최상위에 올랐고, 비즈니스 법률과 기업 금융 같은 enterprise 분야에서 @ValsAI 1위를 차지했습니다. Grok 4.3은 100만 토큰 컨텍스트를 지원합니다. — @xai X에서

이 트윗은 2,570만 조회수와 6,029개의 좋아요를 기록했다. 참고로 발표 시점에는 x.ai/news에 전용 페이지가 없었고, 출시는 X를 통해서만 이뤄졌다.

Anthropic과 Blackstone, Hellman & Friedman, Goldman Sachs — 새로운 기업용 AI 서비스 회사

5월 4일 — Anthropic, Blackstone, Hellman & Friedman, Goldman Sachs가 추가 대체 투자자 컨소시엄의 지원을 받는 새로운 기업용 AI 서비스 회사 설립을 발표했다.

목표는 강한 엔지니어링 역량과 깊은 산업 지식이 필요한 작업을 위해 Claude를 대기업의 핵심 운영에 배치하는 것이다. Anthropic에 따르면 Claude에 대한 enterprise 수요는 단일 배포 모델이 감당할 수 있는 수준을 넘어선다.

전형적인 운영 모델은 소규모 팀이 고객과 긴밀히 협력해 병목 지점을 식별하고, 그 다음 업종에 맞는 Claude 에이전트를 구축하는 방식으로 시작한다. 구체적 예시로는 여러 지점을 둔 의료 네트워크가 제시되었으며, 이곳에서 Claude는 임상 문서화, 반복적인 관리 업무, 전문과 간 조정을 처리해 임상의가 환자 치료에 집중할 수 있도록 한다.

이 새로운 회사는 Accenture, Deloitte, PwC와 함께 Claude Partner Network에 합류한다. 이는 Anthropic의 enterprise 유통 전략에서 구조적인 단계다. 단순히 API 라이선스를 판매하는 데 그치지 않고, 이제 최고 수준의 금융 파트너와 함께 복잡한 운영형 배포에 나선다.

🔗 공식 발표

금융 서비스와 보험을 위한 Claude 에이전트

5월 5일 — Anthropic이 금융 서비스와 보험을 위한 즉시 사용 가능한(ready-to-run) 에이전트 템플릿 10개를 출시했다. 이들은 Claude Cowork 또는 Claude Code의 플러그인으로, 또는 Claude 플랫폼의 독립형 Claude Managed Agents로 사용할 수 있다.

리서치 및 고객 커버리지:

에이전트	역할
Pitch builder	타깃 리스트, comparables, pitchbooks
Meeting preparer	고객 및 상대방 브리핑
Earnings reviewer	실적 발표문 읽기 및 모델 업데이트
Model builder	filing과 데이터로부터 금융 모델 생성
Market researcher	업계 동향 파악 및 뉴스 요약

금융 및 운영:

에이전트	역할
Valuation reviewer	가치평가 검증
General ledger reconciler	회계 조정 및 NAV 계산
Month-end closer	월말 마감 및 회계 분개
Statement auditor	재무제표 검토
KYC screener	엔터티 파일 취합 및 컴플라이언스 필터링

Claude는 이제 Microsoft Excel, PowerPoint, Word, Outlook(진행 중)에 add-ins를 통해 통합된다. Claude Cowork의 Dispatch 기능을 사용하면 어디서든 텍스트나 음성으로 작업을 할당할 수 있다.

새로운 데이터 커넥터: Dun & Bradstreet, Fiscal AI, Financial Modeling Prep, Guidepoint, IBISWorld, SS&C IntraLinks, Third Bridge, Verisk, 그리고 6,000개 이상의 엔터티에 대한 등급 및 데이터를 제공하는 Moody’s MCP.

언급된 고객에는 Citadel, FIS, BNY, Carlyle, Mizuho, Travelers, Walleye Capital(직원 100%가 Claude Code 사용), Hg, Morningstar, FactSet이 포함된다. 이 에이전트들은 Vals AI Finance Agent 벤치마크에서 #1로 평가된 Claude Opus 4.7에 최적화되어 있다.

🔗 공식 발표

Perplexity Computer for Professional Finance

5월 5일 — Perplexity가 금융 전문용 Computer를 출시했다. 이는 buy-side 및 sell-side 애널리스트, 헤지펀드, 사모펀드를 위해 특별히 설계된 Computer 버전이다.

차원	값
포함된 워크플로	35개(10개 세그먼트)
통합 데이터 제공업체	14개(Quartr, Fiscal 포함)
프리미엄 MCP 커넥터	Morningstar, PitchBook, Daloopa, Carbon Arc
사용 가능 플랫폼	Microsoft Teams, Agent API
예정	Excel add-in
FinSearchComp T1 벤치마크	1위(정확도, 비용, 지연 시간)

라이선스가 있는 구독을 보유한 팀은 MCP 커넥터를 통해 자체 자격 증명을 연결하여 Morningstar, PitchBook, Daloopa, Carbon Arc에 접근할 수 있다. 나머지 사용자는 14개 데이터 제공업체를 기반으로 하는 통합 금융 도구를 이용한다.

각 숫자 값은 출처로 연결된다. SEC 문서에서 가져온 값의 경우, Computer는 계산 과정을 보여주고 문서의 정확한 페이지를 가리킨다. FinSearchComp T1 벤치마크(시간 민감 데이터 추출)에서는 Perplexity가 정확도, 정답당 비용, 지연 시간에서 1위를 차지했으며, 실시간 시세, 암호화폐 가격, 환율도 포함된다.

🔗 Perplexity 블로그 — Computer for Professional Finance

Runway Characters — 단일 이미지에서 생성되는 실시간 비디오 에이전트

5월 4일 — Runway가 Characters를 발표했다. 이는 단일 이미지를 실시간 대화형 비디오 에이전트로 바꾸는 기술이다.

지표	값
엔드투엔드 지연 시간	1.75초
비디오 품질	24 fps HD
필요한 이미지 소스	이미지 1장
콜드 스타트	60배 더 빠름(pair-to-peer GPU)

1.75초 지연은 사용자가 말을 멈춘 시점부터 캐릭터의 첫 응답까지를 측정한 것이다. Runway는 동시에 두 개의 엔지니어링 글도 공개했는데, 첫 번째는 실시간 비디오 에이전트의 아키텍처를 설명하고, 두 번째는 peer-to-peer GPU 인프라가 콜드 스타트 시간을 60분의 1로 줄이는 방식을 설명한다.

예상 사용 사례에는 대화형 에이전트, 실시간 인터랙티브 캐릭터, 애플리케이션용 비디오 인터페이스가 포함된다. 이 기술은 오프라인 비디오 렌더링에서 동기식 상호작용으로의 전환을 의미한다.

🔗 Runway Characters 발표 트윗

GitHub MCP Server — 보안 관련 3중 진전

5월 5일 — GitHub가 MCP 서버를 위한 보안 업데이트 3가지를 같은 날 동시에 공개했다.

Secret scanning GA

GitHub MCP Server를 통한 secret scanning이 일반 공개(GA)로 전환된다(2026년 3월 프리뷰 종료). GitHub Copilot CLI에서는 /plugin install advanced-security@copilot-plugins로 설치하며, VS Code에서는 advanced-security 플러그인이 /secret-scanning 명령을 제공한다.

항목	세부 내용
상태	GA(일반 공개)
이용 가능 여부	GitHub Secret Protection이 활성화된 저장소
통합	Copilot CLI, VS Code, 모든 MCP 호환 IDE

이제 MCP 도구는 기존의 push protection 사용자 정의도 따르며, 우회(bypass) 동작은 저장소 또는 조직 설정과 일관된다.

🔗 Changelog — Secret scanning GA

Dependency scanning 공개 프리뷰

MCP Server를 통한 의존성 취약점 탐지가 공개 프리뷰로 전환된다. 시스템은 GitHub Advisory Database를 조회해 영향을 받는 패키지, 심각도, 권장 수정 버전을 포함한 구조화된 결과를 반환한다.

항목	세부 내용
상태	공개 프리뷰
이용 가능 여부	Dependabot alerts가 활성화된 저장소
CLI 활성화	`copilot --add-github-mcp-toolset dependabot`

🔗 Changelog — Dependency scanning

GitHub Advanced Security × Microsoft Defender for Cloud GA

GitHub Advanced Security × Microsoft Defender for Cloud 통합도 GA로 전환된다. 이 기능은 클라우드 환경에 배포된 컨테이너 이미지를 GitHub 소스 코드와 상관시켜 보안 보기에서 런타임 컨텍스트를 제공한다.

조직 보기에서 사용할 수 있는 새 필터: has:deployment, runtime-risk:internet-exposed, runtime-risk:sensitive-data. 보안 캠페인은 GitHub Copilot 코딩 에이전트에 직접 할당할 수 있다.

🔗 Changelog — Code-to-cloud GA

Model Spec Midtraining(MSM) — agentic 정렬 실패율 68%에서 5%로 감소

5월 5일 — Anthropic 연구진이 “Model Spec Midtraining”(MSM)을 발표했다. 이는 사전학습과 정렬 미세조정(alignment fine-tuning, AFT) 사이에 끼워 넣는 정렬 방법이다.

원리는 다음과 같다. 모델이 자신의 Model Spec 내용을 다루는 합성 문서 코퍼스로 먼저 훈련된 뒤, 그 규칙을 따르는 법을 배운다. 핵심 아이디어는 규칙이 존재하는 이유를 이해하면 그 적용의 견고성이 높아진다는 것이다.

모델	잘못 정렬됨(AFT만 사용)	MSM + AFT 적용
Qwen2.5-32B	68%	5%
Qwen3-32B	54%	7%

MSM은 AFT를 데이터 측면에서도 훨씬 효율적으로 만든다. 비슷한 성능을 달성하는 데 필요한 AFT 데이터가 40~60배 적다. 저자들은 또한 규칙의 이유를 설명하는 것(세부 하위 규칙을 계속 늘리는 대신)이 분포 밖 일반화를 개선한다는 점도 보여준다.

🔗 MSM 문서 — alignment.anthropic.com

NotebookLM Mind Maps — 개인화, 정리, 탐색

5월 5일 — NotebookLM이 세 가지 기능을 동시에 배포하며 Mind Maps를 개선했다.

기능	설명
개인화	구체적인 사용자 지시로 지도를 안내
정리	Mind Map을 즉시 이름 변경 및 공유
탐색	노드 간 부드러운 전환

배포는 모든 사용자에게 점진적으로 진행된다. 이번 업데이트는 4월 초부터 이어진 NotebookLM의 빠른 개선 흐름을 완성한다. 여기에는 소스 자동 정리(4월 24일, 5월 5일에 100% 배포 도달)와 Gemini 모바일 앱 통합(4월 30일)이 포함된다.

🔗 NotebookLM 트윗

Genspark sb-git — AI 에이전트를 위해 다시 쓴 Git 서버

5월 5일 — Genspark가 AI 에이전트를 위해 처음부터 다시 작성한 Git 서버 sb-git을 출시했다. Git의 완전한 시맨틱: 버전 관리, 브랜치, diff, blame, rollback, push.

항목	세부 내용
CLI	`gsk` (init, clone-url, cat, commit)
호환성	Claude Code, OpenClaw, 모든 Git 에이전트
저장소	1 GB(무료), 10 GB(Plus/Pro)
계정 필요 여부	없음 — GitHub 계정 불필요
이용 가능 여부	즉시(web + mobile)

GitHub 계정도, 사전 저장소 설정도 필요 없다. 설치 마찰 없이 Claude Code, OpenClaw 같은 일반적인 AI 에이전트와의 호환성에 초점을 맞춘다.

🔗 Genspark sb-git 트윗

NVIDIA + ServiceNow — Project Arc, 자율형 장기 실행 desktop agent

5월 5일 — ServiceNow Knowledge 2026 컨퍼런스에서 Jensen Huang과 Bill McDermott가 기업용 자율 AI 에이전트를 중심으로 한 파트너십 확대를 발표했다.

ServiceNow는 지식 노동자(개발자, IT 팀, 관리자)를 위해 설계된 자율형 장기 실행 desktop agent인 Project Arc를 출시한다. 이 에이전트는 거버넌스와 보안을 위해 NVIDIA OpenShell(오픈소스 샌드박스)을 사용하고, ServiceNow Action Fabric을 통해 ServiceNow 플랫폼에 기본 연결된다.

지표	값
Blackwell 대비 Hopper 효율	50× tokens/watt
백만 토큰당 비용 절감	약 35×
Nemotron 3 Super(오픈 소스)	#1 EnterpriseOps-Gym(NOWAI-Bench)
자율적으로 해결된 티켓	90%(ServiceNow + Apriel/Nemotron)

🔗 NVIDIA Blog — ServiceNow

NVIDIA NemoClaw + OpenClaw — GitHub에서 React를 넘어선 지속형 오픈소스 에이전트

4월 30일 — Peter Steinberger가 만든 OpenClaw는 60일 만에 GitHub 별 250,000개를 돌파하며 React를 제치고 플랫폼에서 가장 많은 별을 받은 프로젝트가 되었습니다. NVIDIA는 이 지속형 self-hosted AI 에이전트 프로젝트를 안전하게 만들기 위해 커뮤니티와 협력하고 있습니다.

NVIDIA는 OpenClaw + NVIDIA OpenShell + Nemotron을 결합하고 기본적으로 강화된 보안 구성으로 제공되는, 한 번의 명령으로 설치 가능한 참조 구현 NemoClaw를 출시합니다.

지표	값
OpenClaw GitHub stars	250,000+ (2026년 3월)
성장	60일 만에 GitHub #1 프로젝트 (React를 추월)
에이전트 추론 vs reasoning AI 배수	1,000×
NemoClaw 설치	1개 명령

🔗 NVIDIA Blog — OpenClaw/NemoClaw

Luma AI Uni-1.1 API — 크리에이티브 브리프를 추론하는 이미지 생성

5월 5일 — Luma AI는 토큰이 아니라 크리에이티브 브리프를 추론하도록 설계된 이미지 생성 모델인 Uni-1.1 API를 출시합니다. 프롬프트 엔지니어링을 필요로 하는 기존 API와 달리, Uni-1.1은 각 시각적 전통의 미학적 맥락을 이해하고 첫 시도부터 바로 활용 가능한 결과를 만들어냅니다.

언급된 사용 사례: 패션 도구, 건축 렌더링, 만화 파이프라인, 영화 콘텐츠. 추가 미들웨어가 필요 없습니다. API는 lumalabs.ai/api에서 제공됩니다.

🔗 Luma AI Uni-1.1 트윗

ChatGPT Ads Manager self-serve 및 CPC bidding

5월 5일 — OpenAI는 두 가지 새로운 기능으로 광고 프로그램을 확장합니다. 하나는 self-serve 도구(미국 베타의 Ads Manager)이고, 다른 하나는 CPC(클릭당 비용) 입찰 모드의 출시입니다.

모드	상태	설명
CPM (천 회 노출당 비용)	기존	프로그램 시작부터 제공됨
CPC (클릭당 비용)	신규	광고주는 실제 클릭 시에만 비용을 지불
Ads Manager self-serve (beta)	신규	미국 광고주에게 제공

에이전시 파트너: Dentsu, Omnicom, Publicis, WPP. 기술 파트너: Adobe, Criteo, Kargo, Pacvue, StackAdapt. OpenAI는 또한 광고주에게 개별 대화를 노출하지 않고도 클릭 후 행동을 측정할 수 있도록 Conversions API와 픽셀 추적도 출시했습니다.

🔗 OpenAI 광고 발표

Perplexity Premium Health Sources

5월 5일 — Perplexity가 프리미엄 건강 소스를 출시합니다. 플랫폼에서 10개 이상의 질의 중 1개가 건강 관련입니다. 출시 시점에 제공되는 소스는 NEJM, BMJ Journals, BMJ Best Practice로, 보통 기관 구독으로만 이용 가능한 의료 참고자료입니다.

Computer에서는 수동 선택 없이 건강 관련 질문에 대해 이 소스들이 자동으로 활성화됩니다. 각 답변에는 추적 가능한 인용이 포함됩니다. 향후 추가될 소스: Micromedex, EBSCOhost, Health Affairs, VisualDx, American Academy of Orthopaedic Surgeons, American Diabetes Association, Springer Publishing.

🔗 Perplexity 블로그 — Premium Health Sources

짧은 소식

Manus — 커넥터 자동 추천 — Manus는 이제 작업을 수행하는 데 필요한 커넥터(Slack, Notion, Gmail, Google Drive)가 무엇인지 감지하여 대화에서 추천하며, 대화 흐름을 벗어나지 않습니다. 활성화는 여전히 사용자 확인이 필요합니다. 🔗 출처
Black Forest Labs — FLUX Creator Program — BFL은 다음 FLUX 모델에 대한 조기 접근을 위해 엄선된 크리에이터 프로그램을 열고, BFL 채널을 통해 그들의 작업을 증폭합니다. 🔗 출처
GPT-5.5 Instant System Card — OpenAI의 Preparedness Framework에서 사이버보안 및 생물학 & 화학 범주에서 “High capability”로 분류된 Instant 라인업의 첫 System Card입니다. 이에 따라 강화된 보호 조치가 구현되었습니다. 🔗 출처
OpenAI — WebRTC relay+transceiver 아키텍처 — OpenAI는 실시간 음성(ChatGPT Voice, Realtime API)을 위한 WebRTC 인프라 재설계를 설명하는 엔지니어링 글을 공개했으며, 이는 주당 9억 명이 넘는 사용자를 지원합니다. 이 아키텍처는 패킷 라우팅(상태 없는 경량 relay)과 프로토콜 종료(상태가 있는 transceiver)를 분리하여, 공개 UDP 부담을 줄인 표준 Kubernetes 배포를 가능하게 합니다. 🔗 출처

이것이 의미하는 바

기업용 AI의 우선 무대가 된 금융. 24시간 만에 Anthropic, Perplexity, xAI는 각각 금융팀을 직접 겨냥한 발표를 내놓았습니다. Claude 에이전트 템플릿 10개(밸류에이션, KYC, 월말 결산), 35개 워크플로와 14개 데이터 공급자를 갖춘 Computer for Professional Finance, 그리고 기업 금융과 case law에서 Vals AI 벤치마크 1위를 차지한 Grok 4.3입니다. 이러한 수렴은 우연이 아닙니다. 금융은 구조화된 문서의 대량 처리, 정확성 요구, 프리미엄 도구 비용에 대한 높은 허용도를 결합하고 있어, 높은 업무 가치를 지닌 자율 에이전트의 초기 배포에 이상적인 환경이 됩니다.

기본 모델을 둘러싼 경쟁. GPT-5.5 Instant는 직전 모델 대비 환각을 52.5% 줄였고, Grok 4.3은 측정 및 공개된 agentic 성능과 함께 100만 토큰 컨텍스트를 제공합니다. 이 두 모델은 같은 날 출시되었습니다. 이제 중요한 것은 단지 최고의 학술 벤치마크를 내놓는 것이 아니라, 일반 사용자 인터페이스(ChatGPT)에서 기본으로 로드되거나 개발자 파이프라인(xAI API)에서 가장 먼저 활성화되는 모델이 되는 것입니다.

개발자 보안 표준으로서의 MCP. GitHub는 MCP 서버를 통해 보안 업데이트 3개를 동시에 출시했습니다(secret scanning GA, dependency scanning 프리뷰, code-to-cloud GA). 이 조율된 배포는 GitHub의 MCP 서버를 코딩 에이전트를 위한 기본 보안 통합 채널로 바꾸며, Copilot CLI, VS Code 및 모든 MCP 호환 IDE는 이제 에이전트 워크플로 안에서 각 커밋 전에 비밀 정보와 취약한 의존성을 스캔할 수 있습니다.

지속형 에이전트와 실시간 인프라. Runway Characters(이미지에서 1.75초 지연의 비디오 에이전트), ServiceNow의 Project Arc(장시간 실행되는 데스크톱 에이전트), OpenClaw/NemoClaw(GitHub 별 250,000개, reasoning AI보다 1,000× 더 많은 추론 수요), Genspark sb-git(에이전트를 위해 다시 작성된 Git)은 모두 같은 전환을 가리킵니다. AI 에이전트는 일회성 질의의 시대를 지나 지속형 프로세스의 시대로 들어가고 있으며, 이에 따라 상태 저장, 실시간 지연, 네이티브 버전 관리와 같은 완전히 다른 인프라 요구가 필요합니다.