2026년 4월 23일은 빡빡한 하루를 기록한다. OpenAI는 입력 API 요금이 $5/M tokens인 GPT-5.5를 출시하며 ARC-AGI-2에서 85%를 달성했고, Anthropic은 Managed Agents용 지속 메모리를 베타로 열고 Claude Code에 대한 포스트모템을 공개했다. 한편 GitHub Copilot은 3일 동안 7개의 업데이트를 제공했고, Kimi K2.6은 300개의 서브에이전트로 이루어진 스웜(swarm)을 배포했으며, SpaceX는 Cursor와 코딩 파트너십을 맺었다.
GPT-5.5: OpenAI의 프런티어 모델
4월 23일 — OpenAI는 실제 업무와 에이전트를 위해 설계된, 지금까지 가장 강력한 모델인 GPT-5.5를 출시했다. 이 모델은 에이전트형 코딩, 컴퓨터 사용(computer use), 지식 작업, 과학 연구를 크게 개선하면서도 GPT-5.4의 지연 시간을 유지한다.
제공 및 가격
GPT-5.5는 ChatGPT Plus, Pro, Business, Enterprise 구독자에게 즉시 제공되며, Codex에서도 사용할 수 있다. API 접근은 “매우 곧” 제공된다.
| 요금제 | API 접근 | 입력 | 출력 |
|---|---|---|---|
| GPT-5.5 standard | 곧 | $5 / M tokens | $30 / M tokens |
| GPT-5.5 Pro | 곧 | $30 / M tokens | $180 / M tokens |
Codex의 컨텍스트 윈도우는 400K tokens에 이른다. Fast 모드 — 1.5배 빠름, 2.5배 비용 — 도 제공된다.
벤치마크
| 평가 | GPT-5.5 | GPT-5.4 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 82.7% | 75.1% | 69.4% | 68.5% |
| Expert-SWE (internal) | 73.1% | 68.5% | — | — |
| SWE-Bench Pro | 58.6% | 57.7% | 64.3% | 54.2% |
| GDPval | 84.9% | 83.0% | 80.3% | 67.3% |
| OSWorld-Verified | 78.7% | 75.0% | 78.0% | — |
| ARC-AGI-2 | 85.0% | 73.3% | 75.8% | 77.1% |
| FrontierMath Tier 4 | 35.4% | 27.1% | 22.9% | 16.7% |
| CyberGym | 81.8% | 79.0% | 73.1% | — |
| BixBench (bioinformatics) | 80.5% | 74.0% | — | — |
GPT-5.5는 대부분의 벤치마크에서 선두를 차지하지만, 주목할 만한 예외가 하나 있다. SWE-Bench Pro에서는 Claude Opus 4.7이 우위를 유지한다(64.3% 대 58.6%).
인프라와 보안
이 모델은 NVIDIA GB200/GB300 NVL72와 공동 설계되었다. Codex는 GPT-5.5를 사용해 자체 인프라를 최적화했으며, 토큰 생성 속도가 +20% 빨라졌다. 사이버보안 측면에서 GPT-5.5는 OpenAI의 Preparedness Framework에서 High로 분류되며(Critical 아님), Trusted Access Cyber 프로그램 적용 범위가 확대되었다.
과학 연구
코드 너머에서도 GPT-5.5는 Ramsey 수(조합론)에 관한 새로운 정리를 증명하는 데 도움을 주었으며, Lean으로 형식 검증되었다. 또한 62개의 샘플과 28,000개의 유전자로 이루어진 유전체 데이터셋을 몇 분 만에 분석했는데, 이는 연구팀이 수행했다면 수개월이 걸렸을 작업이다.
« GPT-5.5 is noticeably smarter and more persistent than GPT-5.4, with stronger coding performance and more reliable tool use. »
🇰🇷 GPT-5.5는 GPT-5.4보다 훨씬 더 똑똑하고 끈질기며, 코딩 성능이 더 좋고 도구 사용도 더 신뢰할 만합니다. — Cursor의 공동 창립자이자 CEO인 Michael Truell
지속형 에이전트의 물결
이 4월 23일에는 자율적으로 장기간 행동하고 세션 간 문맥을 유지할 수 있는 지속형 에이전트를 둘러싼 세 가지 주요 발표가 한데 모였다.
ChatGPT의 OpenAI Workspace Agents
4월 22일 — OpenAI는 워크스페이스 에이전트(Workspace Agents)를 소개했다. 한 팀이 한 번 만들고 ChatGPT나 Slack에서 함께 사용하며 점차 개선하는 공유 에이전트다. 클라우드의 Codex로 구동되며, 사용자가 오프라인일 때도 복잡한 작업을 수행할 수 있다. Workspace Agents는 점진적으로 GPT를 대체하지만, 전환 기간 동안 GPT는 계속 사용할 수 있다.
| 에이전트 유형 | 기능 |
|---|---|
| 소프트웨어 검증자 | 요청을 검토하고, 정책을 비교하며, IT 티켓을 생성 |
| 제품 피드백 라우터 | Slack/지원/포럼을 모니터링 → 우선순위가 지정된 티켓 |
| 보고서 생성기 | 금요일 데이터를 추출하고, 그래프와 요약을 생성 |
| 잠재고객 발굴 에이전트 | 리드를 조사, 평가, 이메일 작성, CRM 업데이트 |
| 제3자 리스크 책임자 | 공급업체를 평가하고, 구조화된 보고서 생성 |
Business, Enterprise, Edu, Teachers용 research preview로 제공되며, 2026년 5월 6일까지 무료이고 이후에는 크레딧으로 과금된다.
Ankur Bhatt(Rippling AI Engineering)에 따르면, 이전에는 영업 담당자들이 주당 5~6시간을 들이던 작업이 이제는 각 기회마다 백그라운드에서 자동으로 실행된다.
Anthropic — Claude Managed Agents용 메모리
4월 23일 — Claude Managed Agents용 메모리가 Claude Platform에서 공개 베타로 제공된다. 이제 에이전트는 파일 시스템 위에 직접 구축된 메모리 계층 덕분에 세션 간 학습할 수 있다. 이 에이전트들은 이미 에이전트 작업에 사용하던 동일한 bash 및 코드 실행 기능을 활용한다.
| 기능 | 세부 사항 |
|---|---|
| 공유 가능한 저장소 | 여러 에이전트, 서로 다른 접근 범위(읽기 전용 / 읽기-쓰기) |
| 동시 접근 | 병렬 세션 간 덮어쓰기 없음 |
| 감사 로그 | 어떤 세션, 어떤 에이전트, 어떤 메모리 |
| 되돌리기 | 이전 버전 어느 것이든 |
| 내보내기 가능성 | API로 관리 가능한 메모리 |
고객 사례는 실제 효과를 보여준다:
| 고객 | 결과 |
|---|---|
| Rakuten | 첫 시도 오류 -97%, 비용 -27%, 지연 -34% |
| Wisedocs | 문서 검증 속도 +30% |
| Netflix | 수동 업데이트 없이 세션 간 문맥 연속성 유지 |
| Ando | 전용 인프라 없이 플랫폼 메모리 구현 |
Memory in Claude Managed Agents lets us put continuous learning into production at scale. Our agents distill lessons from every session, delivering 97% fewer first-pass errors at 27% lower cost and 34% lower latency.
🇰🇷 Managed Agents의 메모리를 통해 대규모로 지속 학습을 프로덕션에 적용할 수 있게 되었습니다. 우리의 에이전트는 각 세션에서 얻은 교훈을 정제해, 첫 시도 오류를 97% 줄이고 비용은 27%, 지연은 34% 줄인 결과를 만들어냅니다. — Rakuten의 Business용 AI 총괄 매니저 Yusuke Kaji
Claude Code: 품질 포스트모템과 두 개의 새로운 버전
포스트모템 및 제한 초기화
4월 23일 — Claude Code 팀은 지난 한 달 동안 보고된 세 가지 품질 문제에 대한 포스트모템을 게시했다. 모든 문제는 v2.1.116+에서 수정되었다. 사용 제한은 모든 구독자에 대해 초기화되었다.
Over the past month, some of you reported Claude Code’s quality had slipped. We investigated, and published a post-mortem on the three issues we found. All are fixed in v2.1.116+ and we’ve reset usage limits for all subscribers.
🇰🇷 지난 한 달 동안 일부 사용자께서 Claude Code의 품질 저하를 보고해 주셨습니다. 저희는 이를 조사하고 확인된 세 가지 문제에 대한 포스트모템을 공개했습니다. 모든 문제는 v2.1.116+에서 수정되었으며, 모든 구독자에 대해 사용 제한을 초기화했습니다. — @ClaudeDevs
v2.1.117 및 v2.1.118
| 버전 | 주요 기능 |
|---|---|
| v2.1.118 | 선택 및 연산자가 포함된 시각적 Vim 모드 (v/V) ; 통합된 /usage (/cost과 /stats를 병합) ; /theme의 사용자 지정 테마 ; type: "mcp_tool"를 통해 MCP 도구를 호출하는 hooks ; 엄격한 DISABLE_UPDATES ; WSL을 통한 Windows managed settings 상속 |
| v2.1.117 | Pro/Max에서 Opus 4.6 및 Sonnet 4.6에 대한 기본 effort가 high로 변경됨(medium였음) ; 외부 빌드에서 활성화 가능한 서브에이전트 fork ; 더 빠른 검색을 위한 내장 glob/Grep가 bfs/ugrep로 대체됨 ; Opus 4.7 세션 수정(1M 컨텍스트가 올바르게 계산됨) ; thinking이 비활성화된 상태의 Bedrock+Opus 4.7 수정 |
일상생활을 위한 새로운 Claude 커넥터
4월 23일 — Anthropic은 커넥터 목록을 소비자용 앱으로 확장했다. 2025년 7월부터는 업무용 도구를 위한 200개 이상의 커넥터가 제공되어 왔으며, 이번 업데이트는 일상 서비스 15개를 추가한다.
| 애플리케이션 | 카테고리 |
|---|---|
| AllTrails | 하이킹 |
| Audible | 오디오북 |
| Booking.com | 여행 |
| Instacart | 온라인 장보기 |
| Intuit Credit Karma | 금융 |
| Intuit TurboTax | 세무 |
| Resy | 레스토랑 예약 |
| Spotify | 음악 |
| StubHub | 티켓 판매 |
| Taskrabbit | 가정 서비스 |
| Thumbtack | 지역 전문가 |
| TripAdvisor | 여행 |
| Uber | 운송 |
| Uber Eats | 음식 배달 |
| Viator | 관광 활동 |
이제 Claude는 대화 맥락에 따라 관련 커넥터를 자동으로 제안한다. 모든 요금제(무료 포함), 웹, 데스크톱, 모바일(모바일은 베타)에서 사용할 수 있다. 유료 배치나 스폰서 응답은 없으며, 앱 데이터는 모델 학습에 사용되지 않는다.
🔗 일상생활 커넥터
GitHub Copilot — 3일 동안 7개의 업데이트
GitHub Copilot은 4월 22일부터 23일 사이에 변경 로그에 7개의 항목을 게시했다.
Pull Request용 채팅(3가지 새 기능)
4월 23일 — Copilot Chat은 이제 pull request를 위한 세 가지 기능을 통합하며, github.com/copilot 또는 diff의 Copilot 버튼을 통해 사용할 수 있다(공개 preview):
- PR 이해 (pull request understanding) : 댓글, 변경 사항, 커밋, 리뷰를 문맥으로 통합
- PR 리뷰 : 요청 시 구조화된 리뷰
- PR 요약 : 변경 사항의 간결한 요약
issues와 프로젝트에서 제어 가능한 에이전트 세션
4월 23일 — 이제 cloud agent를 GitHub issues와 프로젝트 보드에서 직접 제어할 수 있다. 이슈 헤더의 세션 표시기, 진행 상황 사이드 패널, 모든 프로젝트 뷰에서 기본으로 활성화된 세션이 포함된다.
웹에서 스택 트레이스의 구조화된 디버깅
4월 23일 — github.com의 Copilot Chat은 이제 스택 트레이스 분석을 6단계의 구조화된 절차로 안내한다: 무엇이 실패했는지, 왜 실패했는지, 근본 원인, 코드에서 얻은 증거, 신뢰도 수준, 다음 확인 사항.
VS Code용 BYOK GA 제공
4월 22일 — Bring Your Own Key(자신의 API 키를 가져오세요)가 VS Code에서 Copilot Business 및 Enterprise 사용자에게 일반 제공된다. Anthropic, Gemini, OpenAI, OpenRouter, Azure가 지원되며, Ollama와 Foundry Local을 통한 로컬 모델도 지원된다. 청구는 선택한 공급자를 통해 직접 이루어지며, Copilot 할당량과는 별개다.
Copilot CLI용 C++ Language Server 공개 베타
4월 22일 — Microsoft C++ Language Server(Visual Studio/VS Code의 IntelliSense 엔진)가 Copilot CLI용 공개 베타로 제공된다. 이는 반복적인 grep 검색을 대체하여 정의, 심볼 참조, 호출 계층, 타입과 같은 정확한 의미론적 데이터를 제공한다. 필요 조건: Copilot CLI 인증 + compile_commands.json.
새로운 Business self-serve 가입 중단
4월 22일 — GitHub는 GitHub Free 및 GitHub Team 요금제에서 Copilot Business의 새로운 self-serve 가입을 중단한다. 기존 고객은 영향을 받지 않는다.
API 지표의 used_copilot_cloud_agent 필드
4월 23일 — “coding agent” → “cloud agent” 리브랜딩에 따라, API 지표는 사용자 보고서(1일 및 28일 롤링)에 used_copilot_cloud_agent 필드를 추가한다. 기존 used_copilot_coding_agent 필드는 2026년 8월 1일까지 유지된다.
Gemini CLI v0.39.0 및 모든 Ultra를 위한 Deep Think ### Gemini CLI v0.39.0
4월 23일 — Google은 Gemini CLI v0.39.0을 출시했으며, 이 버전은 “Latest”로 표시된 안정 버전이다. 핵심은 작업 세션 중 CLI가 자동으로 추출한 skills를 검토하고 검증하기 위한 새로운 /memory inbox 명령이다.
| 기능 | 설명 |
|---|---|
/memory inbox | 자동 추출된 skills 검토 |
invoke_subagent 통합 | 서브에이전트 도구를 단일 인터페이스로 리팩터링 |
| 컴팩트 포맷 | 컴팩트 모드에서 더 나은 가독성 |
| Plan Mode — 확인 | skills 활성화 전에 검증 필요 |
| 경량화된 시작 | 더 빠른 시작을 위한 경량 부모 프로세스 |
| JSONL 스트리밍 마이그레이션 | JSONL로 채팅 세션 기록 |
추가된 키보드 단축키: Windows Terminal에서 단어 단위 삭제를 위한 Ctrl+Backspace, Ctrl+Shift+G.
Deep Think가 모든 Ultra 구독자에게 개방
4월 22일 — Google은 Deep Think 모드(extended thinking, 심화 추론)를 모든 Gemini Ultra 구독자에게 개방한다. 이 모드는 이전에는 제한된 접근만 가능했으며, 이제 Gemini 앱의 도구 메뉴(web 및 mobile)에서 바로 사용할 수 있다.
Kimi K2.6 : 300개의 서브에이전트와 open-weights 벤치마크의 스웜
Agent Swarm — 300개의 병렬 서브에이전트
4월 23일 — Moonshot AI가 Kimi K2.6 Agent Swarm을 출시한다. 이 시스템은 실행당 4,000단계에 걸쳐 300개의 서브에이전트를 병렬로 배치할 수 있으며, K2.5의 100개 에이전트와 1,500단계보다 크게 향상되었다.
| 기능 | K2.5 | K2.6 |
|---|---|---|
| 병렬 서브에이전트 | 100 | 300 |
| 실행당 단계 | 1 500 | 4 000 |
| 출력 유형 | 채팅 텍스트 | 100개 이상의 실제 파일, 10만 단어 리뷰, 2만 행 데이터셋 |
서브에이전트는 웹 검색, 데이터 분석, 코딩, 장문 작성, 시각적 생성 등 이질적인 역량을 결합한다. kimi.com/agent-swarm에서 제공된다.
벤치마크: open-weights 1위
4월 23일 — Kimi K2.6은 두 개의 벤치마크에서 open-weights 모델 1위를 달성한다.
- Design Arena: Claude Opus 4.7과 같은 성능대
- MathArena open(Think 모드): GLM 5.1보다 앞섬
SpaceXAI × Cursor와 Grok Imagine
SpaceXAI × Cursor 파트너십
4월 22일 — xAI/SpaceX의 제휴에서 나온 조직인 SpaceXAI와 Cursor가 “세계에서 가장 뛰어난 코딩 및 지식 작업용 AI”를 만들기 위한 파트너십을 발표한다. SpaceX는 슈퍼컴퓨터 Colossus(백만 대의 H100에 해당)를 제공하고, Cursor는 2026년 후반에 회사 전체를 600억 달러에 인수할 권리 또는 협력만을 위해 100억 달러를 지불할 권리를 부여한다.
Grok Imagine — 공유 가능한 맞춤 템플릿
4월 22일 — SuperGrok 및 Premium+ 구독자는 이제 Grok Imagine에서 맞춤 템플릿을 만들고 공개적으로 공유할 수 있다.
NVIDIA × Google Cloud Next
4월 22일 — 라스베이거스에서 열린 Google Cloud Next에서 NVIDIA와 Google Cloud는 에이전틱 AI 인프라를 둘러싼 여러 주요 진전을 발표한다.
| 발표 | 상세 |
|---|---|
| A5X 인스턴스 (Vera Rubin NVL72) | 멀티사이트 클러스터에서 최대 960,000개의 Rubin GPU, 토큰당 비용 10배 절감, 메가와트당 처리량 10배 증가 |
| Google Distributed Cloud의 Gemini | Blackwell 및 Blackwell Ultra GPU와 함께 프리뷰 — 데이터 주권 |
| Blackwell Confidential VMs | 퍼블릭 클라우드에서 최초의 Blackwell 기밀 컴퓨팅(confidential computing) 제공 |
| Nemotron 3 Super | Gemini Enterprise Agent Platform에서 제공 |
| NeMo RL API | 대규모 관리형 강화 학습(Reinforcement Learning) |
Kling AI Video 3.0 — 네이티브 4K 모드
4월 23일 — Kling AI가 Video 3.0 시리즈에 네이티브 4K 모드를 출시한다. 4K 생성은 추가 업스케일링 단계 없이 한 번의 클릭으로 이루어진다. 시각적 일관성(캐릭터, 텍스트, 스타일, 조명)은 하이엔드 제작을 위해 네이티브 해상도에서 보장된다. 기업은 fal.ai를 통해서도 사용할 수 있다.
Kling AI는 동시에 4K Short Film Creative Contest를 개최한다. 이 전 세계 공모전은 크리에이터들에게 새 모드로 제작한 단편 영화를 제출하도록 초대한다.
Clinicians용 ChatGPT와 OpenAI Privacy Filter
Clinicians용 ChatGPT + HealthBench Professional
4월 22일 — OpenAI는 미국의 검증된 의료 전문가(의사, 전문 간호사, 의사 보조, 약사)를 위한 무료 버전인 ChatGPT for Clinicians를 출시한다. 이 서비스는 복잡한 임상 질문을 위한 frontier 모델 접근, 반복 작업 흐름용 skills(의뢰서, 사전 승인), 실시간 인용 임상 연구, 그리고 계속 교육(CME) 학점의 자동 생성을 포함한다. HIPAA 처리는 협약을 통해 옵션으로 제공된다.
OpenAI는 또한 실제 임상 작업을 평가하는 개방형 벤치마크인 HealthBench Professional도 공개한다(의사가 평가한 70만 건 이상의 응답). ChatGPT for Clinicians의 GPT-5.4는 웹 접근이 있는 시간 제한 없는 조건에서 이 벤치마크에서 인간 의사를 능가한다.
OpenAI Privacy Filter
4월 22일 — OpenAI는 텍스트에서 개인정보 식별 가능 정보(Personally Identifiable Information, PII)를 탐지하고 가리기 위한 open-weight 모델(Apache 2.0)인 Privacy Filter를 공개한다. 이 모델은 로컬에서 실행되며(데이터가 서버로 전송되지 않음), 128K 토큰의 컨텍스트를 지원하고, PII-Masking-300k 벤치마크에서 97.43%의 F1 점수를 달성한다.
| 특성 | 값 |
|---|---|
| 아키텍처 | 양방향 토큰 분류기(Viterbi 디코딩 제약) |
| 크기 | 총 15억 개 파라미터, 활성 5천만 개 |
| 컨텍스트 | 128 000 토큰 |
| 라이선스 | Apache 2.0 (Hugging Face + GitHub) |
| F1 | 수정된 PII-Masking-300k에서 97.43% |
커버되는 PII 범주: private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret(비밀번호 및 API 키).
Perplexity와 Cohere
Perplexity가 Kimi K2.6을 통합
4월 23일 — Moonshot AI의 Kimi K2.6이 이제 Perplexity의 모든 Pro 및 Max 구독자에게 제공된다.
Cohere — vLLM에서 W4A8 production-ready
4월 22일 — Cohere가 vLLM에 자사의 W4A8 추론(가중치 4비트 양자화, 활성값 8비트)의 통합을 발표한다. Hopper GPU와 W4A16 대비 결과는 첫 토큰까지의 시간(Time To First Token)에서 +58%, 출력 토큰당 시간(Time Per Output Token)에서 +45%이다. 이 통합은 우선적으로 대규모 프로덕션 환경의 MoE Command A 모델을 대상으로 한다.
짧은 소식
음악 앱 스토어 1위의 Suno
4월 21일 — AI 음악 생성 플랫폼 Suno가 음악 카테고리에서 App Store 1위를 차지한다. CEO Mikey Shulman은 다음과 같이 말한다. « The future of music is one where everyone enjoys creating. »
Anthropic Economic Index Survey
4월 22일 — Anthropic이 Anthropic Interviewer를 통해 Claude 사용자 무작위 표본을 대상으로 진행하는 월간 조사인 Anthropic Economic Index Survey를 시작한다. 목표는 AI의 경제적 영향에 대한 질적 데이터를 수집하는 것이다: 위임된 작업, 생산성 향상, 역할의 변화. 결과는 향후 Anthropic Economic Index 보고서에 반영된다.
🔗 조사 발표
Anthropic — 프로덕션에서의 MCP 에이전트: 수치
4월 22일 — Anthropic의 기술 문서는 프로덕션 에이전트에 대한 MCP의 이점을 설명한다. MCP SDK는 월 3억 건 이상의 다운로드를 기록하고, 도구 검색(tool search)은 도구 정의 토큰을 85% 줄이며, 프로그래매틱 도구 호출(programmatic tool calling)은 복잡한 다단계 워크플로에서 토큰 사용량을 37% 줄인다.
OpenAI — Responses API의 WebSockets : 지연 40% 감소
4월 22일 — OpenAI의 회고 기사에서는 Responses API의 WebSocket 모드가 에이전트 루프의 지연을 40% 줄이는 방식을 설명한다. 지속적 연결은 이전 응답 상태의 메모리 내 캐시를 유지하여 매 호출마다 전체 기록을 다시 처리하지 않도록 한다. 이미 프로덕션에서 사용 중인 서비스: Codex, Vercel AI SDK, Cline(+39%), Cursor(+30%).
Perplexity Research — 검색 증강 모델 학습
4월 22일 — Perplexity가 검색 응답 품질을 개선하기 위한 SFT + RL(Supervised Fine-Tuning + Reinforcement Learning) 파이프라인에 대한 연구를 공개한다. 핵심 결과: 후학습된 Qwen 모델이 더 낮은 비용으로 GPT 모델의 사실 정확도에 도달한다.
이것이 의미하는 바
2026년 4월 23일은 두 가지 수렴하는 흐름을 보여준다. 한편으로 GPT-5.5는 몇 달 동안 Claude Opus 4.7이 우세했던 이후 OpenAI가 agentic 벤치마크(Terminal-Bench, ARC-AGI-2, OSWorld)에서 다시 선두를 되찾았음을 확인한다. SWE-Bench Pro에서는 격차가 여전히 좁으며, Anthropic이 우위를 유지한다. 이는 두 연구소가 동일한 우선 사용 사례에 집중하고 있음을 보여주는 신호다.
다른 한편으로, 이날은 기억을 가진 지속형 에이전트의 시대로의 진입을 보여준다. OpenAI Workspace Agents, Anthropic Managed Agents Memory, Kimi K2.6 Agent Swarm이 Slack 통합, filesystem 기반, 서브에이전트 스웜 등 서로 다른 접근법과 함께 동시에 등장하지만, 목표는 같다. 에이전트가 지속적인 감독 없이도 기억하고, 학습하고, 행동하는 것이다. Rakuten 수치(-97% 오류, -27% 비용)는 그 영향에 대한 첫 산업적 척도를 제공한다.
GitHub Copilot은 GitHub.com 내부(PR 채팅, 이슈에서 시작되는 에이전트 세션, 구조화된 스택 트레이스)로 깊게 통합되는 전략을 계속하면서, BYOK를 통해 외부로도 개방하고 있다. BYOK VS Code GA는 Copilot이 모델이라기보다 인터페이스로서의 위치를 점점 더 강화하고 있음을 보여준다.
출처
- GPT-5.5 — OpenAI
- OpenAI GPT-5.5 트윗
- Workspace Agents — OpenAI
- Workspace Agents 트윗
- 임상의를 위한 ChatGPT
- OpenAI 개인정보 필터
- WebSockets API Responses — OpenAI
- 관리형 에이전트 메모리 — Anthropic
- 일상생활용 커넥터 — Anthropic
- 커넥터 트윗 — @claudeai
- Claude Code 사후 분석 — @ClaudeDevs
- @bcherny 트윗
- Claude Code 변경 로그
- MCP 프로덕션 에이전트 — Anthropic
- Anthropic 경제 지수 설문조사
- Copilot Chat PR 개선 사항
- 이슈에서의 Copilot 에이전트 세션
- Copilot 스택 추적 디버깅
- Copilot BYOK VS Code GA
- Copilot C++ 언어 서버
- Copilot Business 셀프 서비스 일시 중지
- Copilot 클라우드 에이전트 메트릭
- Gemini CLI v0.39.0
- Gemini Deep Think Ultra — @GeminiApp
- Kimi K2.6 Agent Swarm — @Kimi_Moonshot
- Kimi K2.6 Design Arena
- Kimi K2.6 MathArena
- SpaceXAI × Cursor — @SpaceX
- Grok Imagine 템플릿 — @imagine
- NVIDIA × Google Cloud Next
- Kling AI Video 3.0 Mode 4K
- Kling AI 4K 단편 영화 공모전
- Perplexity Kimi K2.6
- Perplexity 검색 증강 LMs 연구
- Cohere W4A8 vLLM
- Suno App Store 1위
이 문서는 gpt-5.4-mini 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 과정에 대한 자세한 정보는 https://github.com/jls42/ai-powered-markdown-translator 를 참조하세요.