AI 에이전트를 위한 바쁜 한 주
2026년 1월 21일부터 23일까지, coding agents 및 인프라에 대한 몇 가지 주요 발표가 있었습니다. Anthropic은 엑셀에 클로드를 출시하고 멀티 에이전트 시스템에 대한 세 편의 기사를 게시했으며, OpenAI는 Codex의 내부 아키텍처와 PostgreSQL 인프라를 자세히 설명했고, Qwen은 텍스트 음성 변환 모델을 오픈 소스로 공개했으며, Runway는 Gen-4.5에 Image to Video를 추가했습니다.
Anthropic: 엑셀의 클로드 및 클로드 코드
엑셀의 클로드
1월 23일 — 이제 Microsoft Excel 베타에서 클로드를 사용할 수 있습니다. 이 통합을 통해 중첩된 수식과 탭 간의 종속성이 있는 전체 Excel 통합 문서를 분석할 수 있습니다.
기능:
- 전체 통합 문서 이해(수식, 멀티 탭 종속성)
- 셀 수준 인용이 포함된 설명
- 수식을 유지하면서 가정 업데이트
Claude Pro, Max, Team 및 Enterprise 구독자가 사용할 수 있습니다.
클로드 코드 v2.1.19: Tasks 시스템
1월 23일 — 버전 2.1.19에서는 복잡한 멀티 세션 프로젝트를 위한 새로운 작업 관리 시스템인 Tasks가 도입되었습니다.
We’re turning Todos into Tasks in Claude Code. Tasks are a new primitive that help Claude Code track and complete more complicated projects and collaborate on them across multiple sessions or subagents.
🇰🇷 우리는 클로드 코드에서 Todos를 Tasks로 바꾸고 있습니다. Tasks는 클로드 코드가 더 복잡한 프로젝트를 추적 및 완료하고 여러 세션이나 하위 에이전트에서 협업하는 데 도움이 되는 새로운 기본 요소입니다. — Thariq (@trq212), 클로드 코드 팀 Anthropic
Tasks 기능:
| 측면 | 세부 사항 |
|---|---|
| 저장소 | ~/.claude/tasks (파일, 위에 도구 구축 가능) |
| 협업 | 세션 간 공유를 위한 CLAUDE_CODE_TASK_LIST_ID=이름 claude |
| 종속성 | 메타데이터에 저장된 종속성 및 차단 요소가 있는 Tasks |
| 브로드캐스트 | Task 업데이트가 동일한 Task List의 모든 세션에 브로드캐스트됨 |
| 호환성 | claude -p 및 AgentSDK와 작동 |
용도: 복잡한 프로젝트(다중 파일 리팩토링, 마이그레이션, 긴 기능)에서 클로드는 작업을 태스크로 나누고, 수행된 작업과 남은 작업을 추적할 수 있습니다. 태스크는 디스크에 유지됩니다 — 컨텍스트 압축, 세션 종료 및 재시작 후에도 유지됩니다. 여러 세션 또는 하위 에이전트가 동일한 작업 목록에서 실시간으로 협업할 수 있습니다.
실제: 클로드는 태스크를 생성(TaskCreate)하고, 나열(TaskList)하고, 상태를 업데이트합니다(TaskUpdate: pending → in_progress → completed). 인증 리팩토링의 예:
#1 [completed] 세션 저장소를 Redis로 마이그레이션
#2 [in_progress] 리프레시 토큰 로테이션 구현
#3 [pending] OAuth 통합 테스트 추가
#4 [pending] API 문서 업데이트
태스크는 ~/.claude/tasks/에 저장되며 CLAUDE_CODE_TASK_LIST_ID를 통해 세션 간에 공유할 수 있습니다.
기타 v2.1.19 새로운 기능:
- 사용자 지정 명령의 인수에 대한 약어
$0,$1 - 모든 사용자를 위한 VSCode 세션 포크 및 되감기
- 권한 없는 Skills는 승인 없이 실행됨
- 일시적으로 비활성화하기 위한
CLAUDE_CODE_ENABLE_TASKS=false
🔗 CHANGELOG Claude Code | 스레드 @trq212
클로드 코드 v2.1.18: 사용자 지정 가능한 키 바인딩
컨텍스트별로 키 바인딩을 구성하고 코드 시퀀스를 생성하는 기능을 추가한 이전 버전.
명령: /keybindings
⚠️ 참고: 이 기능은 현재 미리 보기 상태이며 모든 사용자가 사용할 수 있는 것은 아닙니다.
Petri 2.0: 자동화된 정렬 감사
1월 22일 — Anthropic은 언어 모델을 위한 자동화된 행동 감사 도구의 업데이트인 Petri 2.0을 게시했습니다.
용도: Petri는 LLM이 조작, 기만, 규칙 우회와 같이 문제 있는 행동을 할 수 있는지 테스트합니다. 이 도구는 현실적인 시나리오를 생성하고 모델의 반응을 관찰하여 프로덕션에서 발생하기 전에 원치 않는 행동을 감지합니다.
| 개선 사항 | 설명 |
|---|---|
| 70개의 새로운 시나리오 | 더 많은 에지 케이스를 커버하기 위한 확장된 시드 라이브러리 |
| 평가 인식 완화 | 모델은 테스트를 받고 있다는 사실을 알아서는 안 됩니다 — 그렇지 않으면 행동을 조정합니다. Petri 2.0은 이러한 감지를 피하기 위해 시나리오의 사실성을 개선합니다. |
| 프론티어 비교 | 최근 모델(Claude, GPT, Gemini)에 대한 평가 결과 |
블로그: 멀티 에이전트 시스템을 사용해야 할 때(또는 하지 말아야 할 때)
1월 23일 — Anthropic은 멀티 에이전트 아키텍처에 대한 실용적인 가이드를 게시했습니다. 주요 메시지: 기본적으로 멀티 에이전트를 사용하지 마십시오.
We’ve seen teams invest months building elaborate multi-agent architectures only to discover that improved prompting on a single agent achieved equivalent results.
🇰🇷 우리는 팀들이 정교한 멀티 에이전트 아키텍처를 구축하는 데 몇 달을 투자했지만 단일 에이전트에서 개선된 프롬프트가 동등한 결과를 달성했다는 것을 발견하는 것을 보았습니다.
이 기사는 멀티 에이전트가 실제로 가치를 제공하는 3가지 경우를 식별합니다:
| 경우 | 문제 | 멀티 에이전트 솔루션 |
|---|---|---|
| 컨텍스트 오염 | 에이전트가 방대한 데이터를 생성하고 나중에 요약만 유용한 경우 | 하위 에이전트가 2000 토큰의 기록을 검색하고, 메인 에이전트에게 “주문 배송됨”만 반환 |
| 병렬화 | 여러 개의 독립적인 검색 수행 | 순차적으로 처리하는 대신 5개의 다른 소스에서 5개의 에이전트를 병렬로 실행 |
| 전문화 | 단일 에이전트에 너무 많은 도구(20개 이상)가 있으면 올바른 도구를 선택하는 능력이 저하됨 | 전문 에이전트로 분리: CRM용, 마케팅용, 메시징용 |
피해야 할 함정: 작업 유형별 분할(한 에이전트는 계획, 다른 에이전트는 구현, 다른 에이전트는 테스트). 각 인계 과정에서 컨텍스트가 손실되고 품질이 저하됩니다. 단일 에이전트가 처음부터 끝까지 기능을 처리하는 것이 좋습니다.
실제 비용: 동일한 작업에 대해 단일 에이전트보다 3-10배 더 많은 토큰 소모.
시리즈의 다른 기사:
Building agents with Skills (1월 22일)
도메인별로 전문화된 에이전트를 구축하는 대신 Anthropic은 skills 구축을 제안합니다: 제너럴리스트 에이전트가 필요에 따라 로드하는 파일 모음(워크플로, 스크립트, 모범 사례).
3단계의 점진적 공개:
| 레벨 | 콘텐츠 | 크기 |
|---|---|---|
| 1 | 메타데이터(이름, 설명) | ~50 토큰 |
| 2 | 전체 SKILL.md 파일 | ~500 토큰 |
| 3 | 참조 문서 | 2000+ 토큰 |
각 레벨은 필요한 경우에만 로드됩니다. 결과: 에이전트는 컨텍스트를 포화시키지 않고 수백 개의 skills를 가질 수 있습니다.
Eight trends 2026 (1월 21일)
Anthropic은 2026년 소프트웨어 개발을 위한 8가지 트렌드를 식별합니다.
핵심 메시지: 엔지니어는 코드 작성에서 코드를 작성하는 에이전트 조정으로 이동하고 있습니다.
중요한 뉘앙스: AI는 업무의 ~60%에서 사용되지만 0-20%만 완전히 위임될 수 있습니다 — 인간의 감독은 여전히 필수적입니다.
| 회사 | 결과 |
|---|---|
| Rakuten | vLLM 코드베이스(1250만 줄) 상의 Claude Code, 7시간의 자율 작업 |
| TELUS | 30% 더 빠름, 50만 시간 절약 |
| Zapier | 89% AI 채택, 800+ 내부 에이전트 |
OpenAI: Codex 아키텍처 및 인프라
Unrolling the Codex agent loop
1월 23일 — OpenAI는 Codex CLI의 무대 뒤를 공개합니다. 소프트웨어 에이전트의 내부 작동에 대한 시리즈의 첫 번째 기사입니다.
우리가 배우는 것:
에이전트 루프는 이론적으로 간단합니다: 사용자가 요청 전송 → 모델이 응답 생성 또는 도구 요청 → 에이전트가 도구 실행 → 모델이 결과로 재개 → 최종 응답까지. 실제로 미묘한 차이는 컨텍스트 관리에 있습니다.
프롬프트 캐싱 — 성능의 핵심:
대화의 각 턴은 프롬프트에 콘텐츠를 추가합니다. 최적화가 없으면 전송된 토큰에서 2차적입니다. 프롬프트 캐싱을 사용하면 이전 턴의 계산을 재사용할 수 있습니다. 조건: 새 프롬프트는 이전 프롬프트의 정확한 접두사여야 합니다. OpenAI는 캐시를 깨뜨리는 함정(MCP 도구 순서 변경, 대화 중간에 구성 수정)을 자세히 설명합니다.
자동 압축:
컨텍스트가 임계값을 초과하면 Codex는 대화의 압축된 버전을 반환하는 /responses/compact를 호출합니다. 모델은 불투명한 encrypted_content를 통해 잠재적인 이해를 유지합니다.
Zero Data Retention (ZDR):
데이터가 저장되는 것을 원하지 않는 클라이언트를 위해 encrypted_content를 사용하면 서버 측에 데이터를 저장하지 않고 턴 간에 모델의 추론을 보존할 수 있습니다.
시리즈의 첫 번째 기사 — 다음 기사에서는 CLI 아키텍처, 도구 구현 및 샌드박싱을 다룰 것입니다.
🔗 Unrolling the Codex agent loop | Codex GitHub
Scaling PostgreSQL: 8억 명의 ChatGPT 사용자
1월 22일 — OpenAI는 PostgreSQL이 초당 수백만 건의 요청으로 8억 명의 사용자를 위해 ChatGPT와 API를 구동하는 방법을 자세히 설명합니다.
| 지표 | 값 |
|---|---|
| 사용자 | 8억 명 |
| 처리량 | 수백만 QPS |
| 복제본 | ~50 멀티 리전 읽기 복제본 |
| p99 지연 시간 | 클라이언트 측 두 자릿수 ms |
| 가용성 | Five-nines (99.999%) |
아키텍처:
- 단일 기본 Azure PostgreSQL 유연한 서버
- 연결 풀링을 위한 PgBouncer(연결 지연 시간: 50ms → 5ms)
- 쓰기 중심 워크로드를 Azure Cosmos DB로 마이그레이션
- 캐시 미스 스톰으로부터 보호하기 위한 캐시 잠금
- 100개 이상의 복제본을 초과하기 위한 테스트 중인 계단식 복제
지난 12개월 동안 유일한 SEV-0 PostgreSQL: ChatGPT ImageGen의 바이럴 출시 중(일주일 만에 1억 명의 신규 사용자, 쓰기 트래픽 10배).
Qwen: Qwen3-TTS 오픈 소스
1월 22-23일 — Alibaba는 Apache 2.0 라이선스 하에 Qwen3-TTS를 오픈 소스로 출시합니다.
| 기능 | 세부 사항 |
|---|---|
| 라이선스 | Apache 2.0 |
| 음성 복제 | 예 |
| MLX-Audio 지원 | 가능 |
설치:
uv pip install -U mlx-audio --prerelease=allow
Runway: Gen-4.5 Image to Video
1월 21일 — Runway는 Gen-4.5에 Image to Video 기능을 추가합니다.
| 기능 | 설명 |
|---|---|
| Image to Video | 이미지를 영화 같은 비디오로 변환 |
| 카메라 제어 | 정밀한 카메라 제어 |
| 일관된 내러티브 | 시간이 지남에 따라 일관된 내러티브 |
| 캐릭터 일관성 | 일관성을 유지하는 캐릭터 |
모든 Runway 유료 플랜에서 사용할 수 있습니다. 임시 프로모션: 15% 할인.
이것이 의미하는 바
이번 주는 coding agents 도구의 성숙을 나타냅니다. 두 거인(Anthropic과 OpenAI)은 에이전트 아키텍처에 대한 상세한 기술 문서를 게시합니다 — 이는 시장이 “데모” 단계에서 “프로덕션” 단계로 이동하고 있다는 신호입니다.
인프라 측면에서 OpenAI의 PostgreSQL 기사는 단일 기본 아키텍처가 올바른 최적화를 통해 수억 명의 사용자 규모에서 견딜 수 있음을 보여줍니다.
엑셀에 클로드의 도착은 새로운 전선을 엽니다: 일상적인 생산성 도구에 직접 통합된 AI입니다.