AlphaProof Nexus가 열린 문제 9개를 해결하고, Claude Code Auto Mode가 Pro에 제공되며, Copilot Eclipse가 오픈 소스로 공개되다

이번 주, Google DeepMind는 수십 년 동안 풀리지 않았던 열린 문제를 해결할 수 있는 에이전트인 AlphaProof Nexus로 수학 연구에서 한 단계 도약했습니다. Anthropic 측에서는 Claude Code의 auto mode가 Pro 플랜으로 열리고 Sonnet 4.6이 통합되었습니다. GitHub는 Eclipse용 Copilot 플러그인을 오픈 소스로 공개했고, Alibaba는 Qwen3.7-Max에 implicit cache를 활성화했습니다.

AlphaProof Nexus — AI 에이전트가 수십 년 동안 풀리지 않았던 수학 문제를 해결하다

2026년 5월 25일 — Google DeepMind는 AlphaProof Nexus를 발표했습니다. 이는 Gemini로 구동되는 형식 증명 연구용 에이전트 프레임워크(agentic framework)이며, 5월 21일 arXiv에 제출된 논문(arXiv:2605.22763)이 함께 공개되었습니다.

이 에이전트는 Gemini를 통한 생성과 Lean 증명 언어를 통한 형식 검증이 번갈아 이루어지는 루프에 기반합니다. 이 조합은 생성된 증명의 수학적 엄밀성을 보장합니다. LLM이 제안을 하고, Lean이 이를 검증하거나 거부하며, 에이전트가 반복합니다.

공개된 결과:

분야	결과	맥락
Erdős의 열린 문제	평가된 353개 중 9개 해결	그중 2개는 56년간 미해결
OEIS 추측	492개 중 44개 해결	Online Encyclopedia of Integer Sequences
대수기하학	열린 문제 1개 해결	15년간 미해결
최소-최대 최적화	열린 질문 1개 해결	7년간 미해결

문제 하나를 해결하는 데 드는 비용은 수백 달러 수준으로, 이는 형식 수학 연구에 에이전트 접근법이 경제적으로 얼마나 효율적인지를 보여 주는 규모입니다.

AlphaProof Nexus는 이미 여러 분야의 수학자들과 협력하여 배포되고 있습니다. 분야는 조합론, 그래프 이론, 대수기하학, 양자 광학입니다. 이 작업은 올림피아드 수준의 문제를 대상으로 했던 AlphaProof(2024)의 연장선에 있습니다. AlphaProof Nexus는 연구용 열린 문제를 목표로 하며, 수학적 발견을 위한 자율적 도구로서 AI를 활용하는 단계로의 진전을 보여 줍니다.

“AI agents are advancing research-level math.”

🇰🇷 AI 에이전트가 연구 수준의 수학을 발전시키고 있습니다. — Pushmeet Kohli, Google DeepMind 연구 부사장, X에서

🔗 arXiv 논문 2605.22763

Claude Code v2.1.149 — 카테고리별 `/usage` 세부 정보와 25개 이상의 수정 사항

2026년 5월 23일 — Claude Code 2.1.149 버전이 공개되었으며, 이는 Boris Cherny가 전주에 발표한 카테고리별 /usage breakdown 기능을 현실화한 것입니다.

기능	세부 정보
`/usage` breakdown	카테고리별 소비 세부 정보: skills, sub-agents, plugins, MCP server
`/diff` navigation	키보드 탐색: 화살표 키, `j`/`k`, PgUp/PgDn, Home/End
GFM task lists	Markdown 체크박스 (`[ ]` / `[x]`)가 올바르게 표시됨
Enterprise	새로운 관리형 설정 `allowAllClaudeAIMcps` 매개변수, `managed-mcp.json`용

이 릴리스는 또한 약 20개의 버그를 수정했습니다. 예를 들면 cd에서의 PowerShell 권한 우회, macOS에서 find로 인한 vnode 테이블 소진, managed-settings 대화상자 멈춤, /config의 유령 변경, 누락된 선택적 필드에서의 /insights 충돌, 그리고 도구 호출 사이에 반성 스피너가 호박색으로 남는 문제 등이 있습니다.

같은 날 공개된 2.1.150 버전은 외부에서 보이는 변경 없이 내부 인프라 개선만 제공합니다.

🔗 Claude Code 변경 내역

Claude Code Auto Mode — Pro에서 사용 가능, Sonnet 4.6 통합

2026년 5월 23일 — Anthropic은 Claude Code의 auto mode에 두 가지 확장을 발표했습니다.

“Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7. Shift+tab, and let Claude run.”

🇰🇷 두 가지 auto mode 업데이트: 이제 Pro 플랜에서 사용 가능하며, Opus 4.7와 함께 Sonnet 4.6도 지원됩니다. Shift+tab을 누르고 Claude가 작업하도록 두세요. — X의 @ClaudeDevs

Shift+Tab로 활성화되는 auto mode는 Claude가 각 단계마다 수동 검증 없이 자율적으로 작업을 수행하도록 합니다. 이전에는 상위 플랜에만 제공되었지만, 이제 Pro 구독자도 사용할 수 있습니다. Sonnet 4.6 추가로 인해 긴 세션에서 Opus 4.7보다 더 경제적인 옵션이 제공되며, 자율 모드에서의 크레딧 사용량을 줄여 줍니다.

이 변경 사항에 접근하려면: claude update 또는 Claude desktop 앱을 업데이트하면 됩니다. 이 발표는 X에서 118만 조회수를 기록했습니다.

GitHub Copilot for Eclipse — MIT 라이선스로 오픈 소스 공개

2026년 5월 21일 — GitHub는 Eclipse용 GitHub Copilot 플러그인을 오픈 소스로 공개했으며, GitHub에서 MIT 라이선스로 github.com/microsoft/copilot-for-eclipse 주소에서 이용할 수 있습니다.

모든 기능이 커뮤니티 기여를 위해 공개되었습니다.

기능	상태
Code completion (인라인 완성)	Open source
Next Edit Suggestions (NES)	Open source
Chat (대화 흐름, 도구 호출)	Open source
Agent mode (멀티스텝 에이전트 워크플로)	Open source
Skills 및 prompt files	Open source
BYOK (Bring Your Own Key)	Open source
사용자 지정 에이전트, sub-agents, plan agent, MCP	Open source

이 움직임의 목적은 Eclipse의 열린 생태계 정신에 맞는 투명성과 커뮤니티 혁신입니다. 공개 직후부터 이미 커뮤니티의 기여가 접수되었습니다.

🔗 GitHub Changelog 공지

Qwen3.7-Max — production에서 implicit cache 활성화

2026년 5월 25일 — Alibaba는 에이전트 지향 플래그십 모델인 Qwen3.7-Max에 implicit caching을 활성화했습니다.

이 cache는 모든 API 요청에 대해 자동으로 활성화되며, 코드 수정이 필요하지 않습니다. 개발자는 반복적인 컨텍스트에서 더 빠르고 더 저렴한 요청의 혜택을 즉시 누릴 수 있습니다. 더 높은 수준의 결정적 cache hit rate를 위해 Alibaba는 Alibaba Cloud에 문서화된 explicit cache 사용을 권장합니다.

🔗 @Alibaba_Qwen의 트윗

짧은 소식

홍콩 AIFF의 MiniMax Hailuo AI(HKUST) — HKUST가 주최한 제2회 AI Film Festival에는 80개국에서 1,300건의 출품작이 접수되었습니다. Hailuo AI는 AI 영화의 대중화를 주제로 한 패널에서 Tencent와 Z.ai와 함께 소개되었습니다. 🔗 minimax.io
NVIDIA DGX Spark — 로컬 AI 에이전트 16개 동시 실행 — @NVIDIAAI가 리트윗한 커뮤니티 데모: 2대의 DGX Spark(GB10)와 MiniMax M2.7 NVFP4로 클라우드 API 없이 16개의 AI 에이전트를 동시에 스트리밍 실행했습니다. 🔗 X의 @NVIDIAAI

이것이 의미하는 바

형식 수학 연구에 있어 전환점. AlphaProof Nexus는 하나의 단절점을 보여 줍니다. AI는 더 이상 경시대회 문제나 학술 벤치마크에만 머무르지 않고, 수학자들이 수십 년 동안 풀지 못한 열린 문제에 도전하고 있습니다. Gemini + Lean의 조합은 증명이 단순히 그럴듯한 것이 아니라 올바른지 보장하는 형식 검증 루프를 만듭니다. 문제 하나당 수백 달러라는 비용은 이 접근법이 거대 기업뿐 아니라 연구실에도 충분히 접근 가능해지고 있음을 시사합니다.

Anthropic 측 에이전트 도구의 성숙. Pro 플랜에서의 auto mode 제공과 Sonnet 4.6 통합은 Anthropic이 자율적 에이전트 사용을 일반 사용자에게 제공할 만큼 충분히 안정적이라고 판단했음을 보여 줍니다. 카테고리별 /usage breakdown이 포함된 2.1.149 버전은 복잡한 멀티 에이전트 시스템을 구축하는 개발자들의 구체적인 요구, 즉 자신의 할당량을 정확히 무엇이 소모하는지 이해하여 아키텍처를 최적화하려는 필요에 대응합니다.

개방성 대 소프트웨어 주권. MIT 라이선스로 Eclipse용 Copilot을 오픈 소스로 공개한 것과 Qwen3.7-Max에 implicit cache를 활성화한 것은 개발자를 확보하기 위한 서로 다른 두 전략을 보여 줍니다. GitHub는 Eclipse 생태계와 투명성을 활용해 기업 Java 환경에서 Copilot 채택을 넓히려 합니다. Alibaba는 마찰 없이 비용을 자동으로 줄여 Qwen3.7-Max가 클라우드 대안보다 더 경쟁력 있게 되도록 만듭니다.

생성형 미디어의 산업화가 진전되고 있습니다. 홍콩 AIFF에서의 MiniMax 참여 — 80개국에서 1,300건의 출품작 — 와 DGX Spark에서 16개의 로컬 에이전트를 동시에 시연한 NVIDIA의 데모는, AI 기반 영상 제작이 영화 산업의 전문 워크플로에 축제와 로컬 인프라 양쪽에서 침투하고 있는 생태계를 그려 냅니다.