검색

Routines Claude Code, Gemini Robotics-ER 1.6, GLM-5.1 오픈 소스

Routines Claude Code, Gemini Robotics-ER 1.6, GLM-5.1 오픈 소스

2026년 4월 14일은 AI 지원 개발 도구에 있어 밀도 높은 하루를 의미한다. Anthropic은 Claude Code에 루틴을 도입해, 컴퓨터를 켜 둔 채로 두지 않아도 계획 또는 웹훅을 통해 전체 워크플로를 자동화할 수 있게 했다. Google DeepMind는 Boston Dynamics와 함께 개발한 새로운 산업용 인식 기능을 갖춘 Gemini Robotics-ER 1.6을 공개했다. Z.ai는 GLM-5.1을 MIT 라이선스로 공개했으며, SWE-Bench Pro에서 오픈 소스 모델 1위를 차지했다. GitHub Copilot은 세 가지 유용한 기능을 추가했다: 3번 클릭으로 충돌 해결, 미국/EU 데이터 거주, 그리고 타사 에이전트를 위한 모델 선택.


Claude Code의 루틴 — 사전 연구 (research preview)

4월 14일 — Anthropic은 Claude Code의 루틴을 research preview로 출시한다. 루틴은 프롬프트, 저장소, 커넥터를 포함해 한 번만 설정하는 자동화로, 이후 사용자가 연결되어 있지 않아도 자율적으로 실행된다.

세 가지 유형의 트리거를 사용할 수 있다:

유형트리거사용 예시
예약 실행 (Scheduled)Cron(시간별, 야간, 주간)Linear 버그 야간 분류, 수정 PR 생성
API전용 엔드포인트로의 HTTP POST 호출Datadog 경보 → 자동 분류 + 수정 초안
웹훅GitHub 이벤트(PR, push…)열리는 모든 PR에 대한 자동 코드 리뷰

각 루틴은 고유한 엔드포인트와 인증 토큰을 가진다. API 루틴은 기존의 어떤 파이프라인에도 통합될 수 있다(알림, 배포 훅, 내부 도구). 웹훅 루틴은 정의된 필터에 맞는 각 PR마다 새 세션을 시작하고, 이후 업데이트(댓글, 지속적 통합 실패)를 세션에 반영한다.

“Configure a routine once (a prompt, a repo, and your connectors), and it can run on a schedule, from an API call, or in response to an event. Routines run on our web infrastructure, so you don’t have to keep your laptop open.”

🇰🇷 루틴은 한 번만 설정하면 됩니다(프롬프트 하나, 저장소 하나, 그리고 커넥터들). 그러면 일정에 따라, API 호출을 통해, 또는 어떤 이벤트에 대한 응답으로 실행될 수 있습니다. 루틴은 우리의 웹 인프라에서 실행되므로, 컴퓨터를 켜 둘 필요가 없습니다.@claudeai on X

가용성과 제한:

플랜루틴/일
Pro5
Max15
Team / Enterprise25

Claude Code web이 활성화된 모든 유료 플랜(Pro, Max, Team, Enterprise)에서 사용할 수 있다. 할당량을 초과하더라도 추가 사용은 가능하다. 루틴은 대화형 세션과 마찬가지로 구독 크레딧을 소모한다.

문서화된 활용 사례:

  • 백로그 관리: 야간 분류, 라벨링, Slack 요약
  • 문서 드리프트(docs drift): 병합된 PR의 주간 스캔, 업데이트가 필요한 페이지 탐지
  • 배포 후 검증: 각 릴리스 후 스모크 테스트(smoke checks)
  • SDK 포팅: 병합된 각 Python PR이 Go SDK로의 포팅을 자동으로 트리거

🔗 Anthropic 블로그 🔗 공지 트윗


Claude Code v2.1.105 — PreCompact 훅, 플러그인 모니터, /proactive

4월 11일~13일 — Claude Code의 2.1.105 버전은 몇 가지 눈에 띄는 개선을 제공한다:

기능설명
pathEnterWorktree 매개변수현재 저장소의 기존 worktree로 전환할 수 있음
PreCompact 훅이제 훅이 compaction을 차단할 수 있음(종료 코드 2 또는 {"decision":"block"})
플러그인을 위한 백그라운드 모니터plugin manifest의 monitors 키 — 세션 시작 시 자동으로 arm됨
/proactive/loop의 새로운 별칭
중단되는 Streams API 폐기데이터가 5분 동안 없으면 중단 + 비스트리밍 모드로 재시도
네트워크 오류 메시지조용한 스피너 대신 즉시 재시도 메시지 표시
긴 파일 표시매우 긴 single-line 쓰기(예: minified JSON)는 인터페이스에서 잘림
향상된 /doctor상태 아이콘 + Claude에게 감지된 문제를 수정하도록 요청하는 f

4월 14일 — 2.1.107 버전은 인터페이스 개선을 제공한다: 긴 작업 중에 thinking hints가 이제 더 일찍 표시되어 시각적 피드백 없이 기다리는 느낌을 줄여준다.

🔗 Claude Code 변경 로그


Anthropic — Vas Narasimhan이 이사회에 합류

4월 14일 — Anthropic의 Long-Term Benefit Trust(LTBT)는 Vas Narasimhan을 이사회에 임명했다. 의사이자 Novartis의 CEO인 그는 세계에서 가장 엄격하게 규제되는 산업 중 하나에서 35개 이상의 혁신 신약의 개발과 승인 과정을 총괄했다.

이번 임명으로 Trust가 지명한 이사들이 이제 이사회의 과반수를 차지하게 되었다. LTBT는 구성원들이 Anthropic에 어떠한 재정적 이해관계도 갖지 않는 독립 기관이며, 그 역할은 상업적 성공과 장기적 공공 이익이라는 사명 사이의 균형을 유지하는 것이다.

🔗 Anthropic 공지


Gemini Robotics-ER 1.6 — 산업 인식과 안전성

4월 14일 — Google DeepMind는 로봇공학을 위한 구현 추론(embodied reasoning) 모델의 업데이트인 Gemini Robotics-ER 1.6을 공개한다. 이 모델은 시각 및 공간 이해를 향상시켜 로봇이 더 큰 자율성으로 실제 작업을 계획하고 수행할 수 있게 한다. 내부 로봇 벤치마크에서 Gemini Robotics-ER 1.5와 Gemini 3.0 Flash를 능가한다.

새로운 기능:

기능설명
공간 포인팅 (Pointing)객체 탐지 및 개수 세기, 관계 논리(더 작음/더 큼), 궤적 및 파지점, 복잡한 제약 조건
다중 시점 성공 감지여러 카메라 각도를 분석해 작업이 실제로 완료되었는지 확인
계기 판독원형 게이지와 투명 튜브(sight glasses)를 읽음 — 산업 검사용으로 Boston Dynamics와 공동 개발
안전성(ASIMOV v2 벤치마크)안전 지침 준수에서 테스트된 모든 모델 중 최고 점수

계기 판독 기능은 산업 설비 점검에 사용되는 로봇 Spot을 위해 Boston Dynamics와 협력하면서 탄생했다. 이 기능은 공간 추론과 코드 실행을 결합해 압력 게이지를 높은 정확도로 해석한다.

가용성: Gemini API (gemini-robotics-er-1.6-preview), Google AI Studio, 그리고 GitHub Colab의 시작 노트북.

🔗 Google DeepMind 블로그 🔗 공지 트윗


GLM-5.1 — Z.ai가 자사 에이전틱 모델을 MIT 라이선스로 공개

4월 7일 (사후 보도 — 지난주 스캔에서 놓쳤던 공지) — Z.ai(이전의 ZhipuAI)는 에이전틱 코딩(agentic coding)을 위한 새로운 주력 모델 GLM-5.1을 공개했으며, MIT 라이선스 하에 오픈 소스로 사용할 수 있다.

코드 벤치마크 성능:

BenchmarkGLM-5.1GLM-5Claude Opus 4.6GPT-5.4Gemini 3.1 Pro
SWE-Bench Pro58,455,157,357,754,2
NL2Repo42,735,949,841,333,4
Terminal-Bench 2.063,556,265,468,5

GLM-5.1은 SWE-Bench Pro, Terminal-Bench, NL2Repo에서 오픈 소스 1위이자 세계 3위를 차지한다.

핵심 차이: 긴 호라이즌. GLM-5를 포함한 이전 모델들은 처음에는 성능이 빠르게 향상되지만 이후 정체된다. GLM-5.1은 훨씬 더 긴 시간 범위에서 에이전틱 작업을 효율적으로 수행하도록 설계되었다: 수천 번의 도구 호출을 거치며 전략을 다듬으면서 8시간 동안 자율적으로 작업할 수 있다.

세 가지 시나리오가 이 능력을 보여준다:

  • 600회 반복의 벡터베이스 최적화: GLM-5.1은 VectorDBBench에서 초당 21,500개의 요청을 달성해, 50라운드 세션에서 얻은 최고의 결과보다 6배 높다.
  • 1,000회 이상의 라운드에 걸친 GPU 커널 최적화: KernelBench Level 3에서 3.6배 가속.
  • 8시간 만에 Linux 데스크톱 구축: 단순한 자연어 프롬프트에서 시작해, GLM-5.1은 브라우저 안에 완전한 데스크톱 환경을 생성한다(파일 탐색기, 터미널, 에디터, 시스템 모니터).

가용성: HuggingFace의 오픈 소스 가중치 (zai-org/GLM-5.1), api.z.ai 및 BigModel.cn의 API, Claude Code, Cline, Roo Code, Kilo Code, OpenCode와 호환.

🔗 GLM-5.1 블로그 🔗 공지 트윗


Codex CLI v0.120.0 — 에이전트의 실시간 전송

4월 11일 — Codex CLI의 0.120.0 버전이 안정 버전으로 공개된다. 여러 기능적 개선을 제공한다:

기능세부사항
Realtime V2백그라운드 에이전트의 진행 상황을 실시간으로 전송하고, 다음 응답을 대기열에 넣음
향상된 TUI 훅활성 훅이 별도로 표시되고, 완료된 훅의 기록은 간소화됨
상태에 스레드 제목 표시사용자 지정 TUI 상태에 이름이 바뀐 스레드 제목을 포함할 수 있음
code-mode 출력 스키마code-mode 도구 선언에 이제 outputSchema MCP 세부정보가 포함됨
SessionStart 훅/clear로 생성된 세션과 시작 또는 재개를 구분함

이 버전에는 여러 버그 수정도 포함된다: 권한 상승된 Windows sandbox 처리, TLS WebSocket 연결 중 패닉, 도구 검색 결과 순서 보존.

🔗 릴리스 v0.120.0


GitHub Copilot — 세 가지 새로운 기능

타사 에이전트를 위한 모델 선택

4월 14일 — 이제 github.com에서 Claude(Anthropic) 및 Codex(OpenAI) 에이전트로 작업을 시작할 때 모델을 선택할 수 있다.

Agent사용 가능한 모델
ClaudeClaude Sonnet 4.6, Claude Opus 4.6, Claude Sonnet 4.5, Claude Opus 4.5
CodexGPT-5.2-Codex, GPT-5.3-Codex, GPT-5.4

기존 Copilot 구독(Business 또는 Enterprise)에 포함되지만, 관리자는 조직 또는 엔터프라이즈 수준에서 해당 정책을 활성화해야 한다.

🔗 모델 선택 변경 로그

3번 클릭으로 merge 충돌 해결

4월 13일 — merge 충돌이 있는 pull request에 새 “Fix with Copilot” 버튼이 나타난다. 3번의 클릭으로 Copilot cloud agent가 충돌을 해결하고, 빌드와 테스트가 통과하는지 확인한 뒤, 격리된 클라우드 환경에서 푸시한다. PR의 @copilot 언급을 통해 실패한 GitHub Actions 워크플로를 수정하거나 코드 리뷰 댓글을 처리할 수도 있다. 모든 유료 Copilot 플랜에서 사용할 수 있다.

🔗 merge conflicts 변경 로그

US/EU 데이터 거주 및 FedRAMP 준수

4월 13일 — GitHub Copilot은 이제 US 및 EU 지역에 대한 데이터 거주를 지원한다: 모든 추론과 관련 데이터는 지정된 지리적 영역 안에 남아 있다. 미국 정부 고객은 추가로 FedRAMP Moderate 준수를 이용할 수 있다. data-resident 요청에는 premium requests 배수에 10% 할증이 붙는다. Gemini 모델은 아직 지원되지 않는다(GCP는 아직 데이터 거주 추론 엔드포인트를 제공하지 않는다). 일본과 호주는 2026년 로드맵에 있다.

🔗 data residency 변경 로그


생성형 미디어 — Runway, Luma, MiniMax, ElevenLabs

영상 통화에서의 Runway Characters

4월 14일 — Runway는 Characters 업데이트를 배포해 자신의 AI 아바타를 Zoom, Google Meet 또는 Teams 영상 통화에 보낼 수 있게 했다. 절차는 다음과 같다: Character를 선택하거나 생성 → 회의 링크 붙여넣기 → “Join Meeting” 클릭. 이 기능은 원래 3월 9일부터 개발자용 API로 제공되었으며, 이제 Runway 앱의 모든 사용자가 이용할 수 있다.

🔗 Runway 트윗

Luma — 음성 받아쓰기와 로고 애니메이션

4월 14일 — Luma Labs는 두 가지 새로운 기능을 출시한다: 앱 내 음성 받아쓰기(사용자가 말하면 설명이 생성 프롬프트로 변환됨)와 영화적 로고 애니메이션(로고를 업로드하면 에이전트가 브랜딩 지향의 애니메이션 인트로를 생성).

🔗 음성 받아쓰기 트윗 · 로고 애니메이션 트윗

MiniMax — 에이전트를 위한 3개의 오픈 소스 Music Skills

4월 14일 — MiniMax는 에이전트를 위한 세 가지 Music Skills를 오픈 소스로 공개한다: minimax-music-gen(프롬프트에서 전체 곡 생성, 원곡/연주곡/커버 중 자동 선택 포함), buddy-sings(AI 에이전트가 보컬 동반자로서 노래), Playlist curation(사용자 라이브러리에서 플레이리스트 큐레이션). 이 구성 요소들은 M2.7 에이전트에 통합하기 위한 것이다.

🔗 MiniMax 트윗

ElevenLabs — 2026년 1분기 순환 연간 매출 1억 달러

4월 13일 — CEO Mati Staniszewski는 ElevenLabs가 2026년 1분기에 1억 달러 이상의 순환 연간 순매출을 추가했다고 발표한다. 이는 현재까지 최고의 분기다. 성장 동력은 기업 파트너십(Klarna, Revolut, Deutsche Telekom, Toyota)이다.

🔗 ElevenLabs CEO 트윗


이것이 의미하는 바

Claude Code의 루틴은 패러다임 전환을 의미한다: 개발 도구는 더 이상 단지 대화형 요청에만 응답하지 않고, 이제 프로젝트 인프라 안에서 계획된 또는 반응형 이니셔티브를 취할 수 있다. scheduled + webhook의 조합은 Claude Code를 저장소 위의 상시 에이전트로 바꾸며, 최소한의 설정 비용으로 이를 가능하게 한다.

오픈 소스 측면에서 GLM-5.1은 중국의 에이전틱 모델이 코딩 벤치마크에서 최고 수준의 독점 모델에 도달했음을 확인시켜 준다. La capacité à maintenir un horizon de 8 heures de travail autonome — avec des milliers d’appels d’outils — ouvre des possibilités concrètes pour des tâches d’optimisation intensive que les modèles traditionnels ne peuvent pas gérer en une seule session.

Gemini Robotics-ER 1.6 illustre une tendance différente : des modèles d’IA générale adaptés aux contraintes physiques du monde réel, avec une collaboration entre logiciel et hardware (Boston Dynamics/Spot) qui produit des capacités nouvelles comme la lecture d’instruments industriels.


Sources

이 문서는 gpt-5.4-mini 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 과정에 대한 자세한 정보는 https://gitlab.com/jls42/ai-powered-markdown-translator를 참조하세요.