AI 뉴스 2026년 1월 23일: 엑셀의 클로드, 클로드 코드 Tasks, Codex 에이전트 루프

AI 에이전트를 위한 바쁜 한 주

2026년 1월 21일부터 23일까지, coding agents 및 인프라에 대한 몇 가지 주요 발표가 있었습니다. Anthropic은 엑셀에 클로드를 출시하고 멀티 에이전트 시스템에 대한 세 편의 기사를 게시했으며, OpenAI는 Codex의 내부 아키텍처와 PostgreSQL 인프라를 자세히 설명했고, Qwen은 텍스트 음성 변환 모델을 오픈 소스로 공개했으며, Runway는 Gen-4.5에 Image to Video를 추가했습니다.

Anthropic: 엑셀의 클로드 및 클로드 코드

엑셀의 클로드

1월 23일 — 이제 Microsoft Excel 베타에서 클로드를 사용할 수 있습니다. 이 통합을 통해 중첩된 수식과 탭 간의 종속성이 있는 전체 Excel 통합 문서를 분석할 수 있습니다.

기능:

전체 통합 문서 이해(수식, 멀티 탭 종속성)
셀 수준 인용이 포함된 설명
수식을 유지하면서 가정 업데이트

Claude Pro, Max, Team 및 Enterprise 구독자가 사용할 수 있습니다.

🔗 Claude in Excel

클로드 코드 v2.1.19: Tasks 시스템

1월 23일 — 버전 2.1.19에서는 복잡한 멀티 세션 프로젝트를 위한 새로운 작업 관리 시스템인 Tasks가 도입되었습니다.

We’re turning Todos into Tasks in Claude Code. Tasks are a new primitive that help Claude Code track and complete more complicated projects and collaborate on them across multiple sessions or subagents.

🇰🇷 우리는 클로드 코드에서 Todos를 Tasks로 바꾸고 있습니다. Tasks는 클로드 코드가 더 복잡한 프로젝트를 추적 및 완료하고 여러 세션이나 하위 에이전트에서 협업하는 데 도움이 되는 새로운 기본 요소입니다. — Thariq (@trq212), 클로드 코드 팀 Anthropic

Tasks 기능:

측면	세부 사항
저장소	`~/.claude/tasks` (파일, 위에 도구 구축 가능)
협업	세션 간 공유를 위한 `CLAUDE_CODE_TASK_LIST_ID=이름 claude`
종속성	메타데이터에 저장된 종속성 및 차단 요소가 있는 Tasks
브로드캐스트	Task 업데이트가 동일한 Task List의 모든 세션에 브로드캐스트됨
호환성	`claude -p` 및 AgentSDK와 작동

용도: 복잡한 프로젝트(다중 파일 리팩토링, 마이그레이션, 긴 기능)에서 클로드는 작업을 태스크로 나누고, 수행된 작업과 남은 작업을 추적할 수 있습니다. 태스크는 디스크에 유지됩니다 — 컨텍스트 압축, 세션 종료 및 재시작 후에도 유지됩니다. 여러 세션 또는 하위 에이전트가 동일한 작업 목록에서 실시간으로 협업할 수 있습니다.

실제: 클로드는 태스크를 생성(TaskCreate)하고, 나열(TaskList)하고, 상태를 업데이트합니다(TaskUpdate: pending → in_progress → completed). 인증 리팩토링의 예:

#1 [completed] 세션 저장소를 Redis로 마이그레이션
#2 [in_progress] 리프레시 토큰 로테이션 구현
#3 [pending] OAuth 통합 테스트 추가
#4 [pending] API 문서 업데이트

태스크는 ~/.claude/tasks/에 저장되며 CLAUDE_CODE_TASK_LIST_ID를 통해 세션 간에 공유할 수 있습니다.

기타 v2.1.19 새로운 기능:

사용자 지정 명령의 인수에 대한 약어 $0, $1
모든 사용자를 위한 VSCode 세션 포크 및 되감기
권한 없는 Skills는 승인 없이 실행됨
일시적으로 비활성화하기 위한 CLAUDE_CODE_ENABLE_TASKS=false

🔗 CHANGELOG Claude Code | 스레드 @trq212

클로드 코드 v2.1.18: 사용자 지정 가능한 키 바인딩

컨텍스트별로 키 바인딩을 구성하고 코드 시퀀스를 생성하는 기능을 추가한 이전 버전.

명령: /keybindings

⚠️ 참고: 이 기능은 현재 미리 보기 상태이며 모든 사용자가 사용할 수 있는 것은 아닙니다.

🔗 Keybindings 문서

Petri 2.0: 자동화된 정렬 감사

1월 22일 — Anthropic은 언어 모델을 위한 자동화된 행동 감사 도구의 업데이트인 Petri 2.0을 게시했습니다.

용도: Petri는 LLM이 조작, 기만, 규칙 우회와 같이 문제 있는 행동을 할 수 있는지 테스트합니다. 이 도구는 현실적인 시나리오를 생성하고 모델의 반응을 관찰하여 프로덕션에서 발생하기 전에 원치 않는 행동을 감지합니다.

개선 사항	설명
70개의 새로운 시나리오	더 많은 에지 케이스를 커버하기 위한 확장된 시드 라이브러리
평가 인식 완화	모델은 테스트를 받고 있다는 사실을 알아서는 안 됩니다 — 그렇지 않으면 행동을 조정합니다. Petri 2.0은 이러한 감지를 피하기 위해 시나리오의 사실성을 개선합니다.
프론티어 비교	최근 모델(Claude, GPT, Gemini)에 대한 평가 결과

🔗 Petri 2.0 | GitHub

블로그: 멀티 에이전트 시스템을 사용해야 할 때(또는 하지 말아야 할 때)

1월 23일 — Anthropic은 멀티 에이전트 아키텍처에 대한 실용적인 가이드를 게시했습니다. 주요 메시지: 기본적으로 멀티 에이전트를 사용하지 마십시오.

We’ve seen teams invest months building elaborate multi-agent architectures only to discover that improved prompting on a single agent achieved equivalent results.

🇰🇷 우리는 팀들이 정교한 멀티 에이전트 아키텍처를 구축하는 데 몇 달을 투자했지만 단일 에이전트에서 개선된 프롬프트가 동등한 결과를 달성했다는 것을 발견하는 것을 보았습니다.

이 기사는 멀티 에이전트가 실제로 가치를 제공하는 3가지 경우를 식별합니다:

경우	문제	멀티 에이전트 솔루션
컨텍스트 오염	에이전트가 방대한 데이터를 생성하고 나중에 요약만 유용한 경우	하위 에이전트가 2000 토큰의 기록을 검색하고, 메인 에이전트에게 “주문 배송됨”만 반환
병렬화	여러 개의 독립적인 검색 수행	순차적으로 처리하는 대신 5개의 다른 소스에서 5개의 에이전트를 병렬로 실행
전문화	단일 에이전트에 너무 많은 도구(20개 이상)가 있으면 올바른 도구를 선택하는 능력이 저하됨	전문 에이전트로 분리: CRM용, 마케팅용, 메시징용

피해야 할 함정: 작업 유형별 분할(한 에이전트는 계획, 다른 에이전트는 구현, 다른 에이전트는 테스트). 각 인계 과정에서 컨텍스트가 손실되고 품질이 저하됩니다. 단일 에이전트가 처음부터 끝까지 기능을 처리하는 것이 좋습니다.

실제 비용: 동일한 작업에 대해 단일 에이전트보다 3-10배 더 많은 토큰 소모.

시리즈의 다른 기사:

Building agents with Skills (1월 22일)

도메인별로 전문화된 에이전트를 구축하는 대신 Anthropic은 skills 구축을 제안합니다: 제너럴리스트 에이전트가 필요에 따라 로드하는 파일 모음(워크플로, 스크립트, 모범 사례).

3단계의 점진적 공개:

레벨	콘텐츠	크기
1	메타데이터(이름, 설명)	~50 토큰
2	전체 SKILL.md 파일	~500 토큰
3	참조 문서	2000+ 토큰

각 레벨은 필요한 경우에만 로드됩니다. 결과: 에이전트는 컨텍스트를 포화시키지 않고 수백 개의 skills를 가질 수 있습니다.

🔗 Building agents with Skills

Eight trends 2026 (1월 21일)

Anthropic은 2026년 소프트웨어 개발을 위한 8가지 트렌드를 식별합니다.

핵심 메시지: 엔지니어는 코드 작성에서 코드를 작성하는 에이전트 조정으로 이동하고 있습니다.

중요한 뉘앙스: AI는 업무의 ~60%에서 사용되지만 0-20%만 완전히 위임될 수 있습니다 — 인간의 감독은 여전히 필수적입니다.

회사	결과
Rakuten	vLLM 코드베이스(1250만 줄) 상의 Claude Code, 7시간의 자율 작업
TELUS	30% 더 빠름, 50만 시간 절약
Zapier	89% AI 채택, 800+ 내부 에이전트

🔗 Eight trends 2026

OpenAI: Codex 아키텍처 및 인프라

Unrolling the Codex agent loop

1월 23일 — OpenAI는 Codex CLI의 무대 뒤를 공개합니다. 소프트웨어 에이전트의 내부 작동에 대한 시리즈의 첫 번째 기사입니다.

우리가 배우는 것:

에이전트 루프는 이론적으로 간단합니다: 사용자가 요청 전송 → 모델이 응답 생성 또는 도구 요청 → 에이전트가 도구 실행 → 모델이 결과로 재개 → 최종 응답까지. 실제로 미묘한 차이는 컨텍스트 관리에 있습니다.

프롬프트 캐싱 — 성능의 핵심:

대화의 각 턴은 프롬프트에 콘텐츠를 추가합니다. 최적화가 없으면 전송된 토큰에서 2차적입니다. 프롬프트 캐싱을 사용하면 이전 턴의 계산을 재사용할 수 있습니다. 조건: 새 프롬프트는 이전 프롬프트의 정확한 접두사여야 합니다. OpenAI는 캐시를 깨뜨리는 함정(MCP 도구 순서 변경, 대화 중간에 구성 수정)을 자세히 설명합니다.

자동 압축:

컨텍스트가 임계값을 초과하면 Codex는 대화의 압축된 버전을 반환하는 /responses/compact를 호출합니다. 모델은 불투명한 encrypted_content를 통해 잠재적인 이해를 유지합니다.

Zero Data Retention (ZDR):

데이터가 저장되는 것을 원하지 않는 클라이언트를 위해 encrypted_content를 사용하면 서버 측에 데이터를 저장하지 않고 턴 간에 모델의 추론을 보존할 수 있습니다.

시리즈의 첫 번째 기사 — 다음 기사에서는 CLI 아키텍처, 도구 구현 및 샌드박싱을 다룰 것입니다.

🔗 Unrolling the Codex agent loop | Codex GitHub

Scaling PostgreSQL: 8억 명의 ChatGPT 사용자

1월 22일 — OpenAI는 PostgreSQL이 초당 수백만 건의 요청으로 8억 명의 사용자를 위해 ChatGPT와 API를 구동하는 방법을 자세히 설명합니다.

지표	값
사용자	8억 명
처리량	수백만 QPS
복제본	~50 멀티 리전 읽기 복제본
p99 지연 시간	클라이언트 측 두 자릿수 ms
가용성	Five-nines (99.999%)

아키텍처:

단일 기본 Azure PostgreSQL 유연한 서버
연결 풀링을 위한 PgBouncer(연결 지연 시간: 50ms → 5ms)
쓰기 중심 워크로드를 Azure Cosmos DB로 마이그레이션
캐시 미스 스톰으로부터 보호하기 위한 캐시 잠금
100개 이상의 복제본을 초과하기 위한 테스트 중인 계단식 복제

지난 12개월 동안 유일한 SEV-0 PostgreSQL: ChatGPT ImageGen의 바이럴 출시 중(일주일 만에 1억 명의 신규 사용자, 쓰기 트래픽 10배).

🔗 Scaling PostgreSQL

Qwen: Qwen3-TTS 오픈 소스

1월 22-23일 — Alibaba는 Apache 2.0 라이선스 하에 Qwen3-TTS를 오픈 소스로 출시합니다.

기능	세부 사항
라이선스	Apache 2.0
음성 복제	예
MLX-Audio 지원	가능

설치:

uv pip install -U mlx-audio --prerelease=allow

🔗 Qwen3-TTS on X

Runway: Gen-4.5 Image to Video

1월 21일 — Runway는 Gen-4.5에 Image to Video 기능을 추가합니다.

기능	설명
Image to Video	이미지를 영화 같은 비디오로 변환
카메라 제어	정밀한 카메라 제어
일관된 내러티브	시간이 지남에 따라 일관된 내러티브
캐릭터 일관성	일관성을 유지하는 캐릭터

모든 Runway 유료 플랜에서 사용할 수 있습니다. 임시 프로모션: 15% 할인.

🔗 Runway on X

이것이 의미하는 바

이번 주는 coding agents 도구의 성숙을 나타냅니다. 두 거인(Anthropic과 OpenAI)은 에이전트 아키텍처에 대한 상세한 기술 문서를 게시합니다 — 이는 시장이 “데모” 단계에서 “프로덕션” 단계로 이동하고 있다는 신호입니다.

인프라 측면에서 OpenAI의 PostgreSQL 기사는 단일 기본 아키텍처가 올바른 최적화를 통해 수억 명의 사용자 규모에서 견딜 수 있음을 보여줍니다.

엑셀에 클로드의 도착은 새로운 전선을 엽니다: 일상적인 생산성 도구에 직접 통합된 AI입니다.