OpenAI, 80년 된 에르되시의 추측을 반박하다, Cohere Command A+ 오픈소스, NVIDIA Nemotron-Labs-Diffusion

2026년 5월 20일, AI가 기초 수학에 본격적으로 뛰어듭니다. OpenAI 모델 하나가 1946년 폴 에르되시가 제기한 추측을 반박했고, 그 증명은 125쪽 분량으로 필즈상 수상자인 팀 가워스 등 수학자들의 검증을 받았습니다. 모델 측면에서는 Cohere가 Command A+를 Apache 2.0 오픈소스로 공개했고(218B/25B 활성 MoE 아키텍처), NVIDIA는 토큰을 병렬 생성하는 Nemotron-Labs-Diffusion을 출시했으며, Stability AI는 Stable Audio 3.0(오픈 웨이트 4개 모델)을 공개했습니다. 도구 분야에서는 GitHub Copilot이 네 가지 방향으로 동시에 진화했고, Claude Code는 24시간 안에 두 버전을 내놓았습니다.

OpenAI, 80년 된 에르되시의 추측을 반박하다

5월 20일 — OpenAI가 전례 없는 결과를 발표했습니다. 일반 추론용 내부 모델이 평면 단위 거리 문제(planar unit distance problem)를 해결한 것입니다. 이 질문은 폴 에르되시가 1946년에 제기한 이후 계속 열려 있었습니다. 이 문제는 평면에 있는 n개의 점 가운데 정확히 1의 거리에 있는 점쌍의 최대 개수를 묻습니다. 1940년대 이후 수학계는 에르되시의 정사각 격자 구성 방식이 본질적으로 최적이라고 생각해 왔습니다.

이 모델은 Will Sawin(프린스턴)이 세운 δ = 0.014라는 지수로 추정 경계를 넘는 무한한 구성 가족의 존재를 보여 주는 증명을 만들어 냈습니다. 이번 돌파는 예상 밖의 수학적 도구에 기반합니다. 바로 유한체의 무한 클래스 필드 타워와 Golod-Shafarevich 이론이며, 이는 대수적 수론에서 나온 개념을 기초적인 유클리드 기하 문제에 적용한 것입니다. 서로 멀리 떨어져 보이는 두 분야를 연결한 이 점이, 관련 수학자들에 따르면 이번 결과의 독창성의 핵심입니다.

항목	세부 내용
문제	평면 단위 거리 문제(Erdős, 1946)
이전 상한	n^(1+C/loglog(n)) 성장(Spencer-Szemerédi-Trotter, 1984)
새로운 결과	n^(1+δ), δ = 0.014
수학적 도구	대수적 수론(Golod-Shafarevich)
모델	내부 일반 추론 모델(이름 없음)
사고의 연쇄 길이	125쪽
검증	외부 수학자 그룹 + 동반 논문

이 결과가 특히 주목받는 이유는, 수학 전용으로 훈련되었거나 이 문제만을 겨냥한 시스템이 만들어 낸 것이 아니기 때문입니다. 이는 일반 용도의 모델로, 자율적 탐색 역량에 대한 더 넓은 조사의 일환으로 에르되시 문제 모음에서 평가되었습니다.

팀 가워스(필즈상)는 이 결과를 “AI 수학의 이정표”라고 평가합니다. 프린스턴의 아룰 샨카르는 더 나아갑니다.

“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”

🇰🇷 제 생각에, 이 논문은 현재의 AI 모델이 수학자들의 단순한 보조 도구를 넘어섰다는 것을 보여 줍니다 — 그들은 독창적이고 영리한 아이디어를 내고, 그것을 끝까지 완성할 수 있습니다. — [아룰 샨카르, 수론학자, 프린스턴]

OpenAI는 이번 결과를 기초 연구의 신호로 봅니다. 모델이 125쪽에 걸친 복잡한 추론을 유지하고 서로 멀리 떨어진 수학 분야를 연결할 수 있다면, 이러한 능력은 생물학, 물리학, 재료과학, 의학으로도 전이될 수 있다는 것입니다.

🔗 OpenAI 기사

Cohere Command A+ — MoE 플래그십 오픈소스

5월 20일 — Cohere가 자사의 가장 강력한 모델인 **Command A+**를 Apache 2.0 라이선스의 오픈소스로 공개합니다. mixture-of-experts(sparse MoE) 아키텍처는 총 218B 파라미터를 사용하지만 추론 시 활성화되는 것은 25B뿐이어서, W4A4 양자화 기준 NVIDIA H100 GPU 두 장 또는 Blackwell(B200) GPU 한 장에서 실행할 수 있습니다.

Command A+는 이전에 Command A Reasoning, Command A Vision, Command A Translate로 나뉘어 있던 기능을 하나의 모델로 통합합니다. 48개 언어를 지원하며(이전 버전의 23개 대비), 비유럽 언어용으로 개선된 토크나이저를 탑재했습니다(아랍어 +20%, 한국어 +16%, 일본어 +18%).

벤치마크	Command A+	Command A Reasoning
τ²-Bench Telecom	85%	37%
Terminal-Bench Hard	25%	3%
MMMU	75,1%	N/A
MathVista	80,6%	73,5%
North Agentic QA	+20% 개선	기준
North Data Analysis	+32% 개선	기준

이 모델은 Command A Reasoning보다 최대 2배 빠르고 30% 더 낮은 지연 시간을 보이며, speculative decoding으로 추가로 1.5~1.6배의 향상을 제공합니다. Hugging Face와 vLLM에서 사용할 수 있습니다. Artificial Analysis Intelligence Index에서 37점을 받아 오픈소스 모델 중 최고 성능을 기록했습니다.

“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”

🇰🇷 여기 Cohere Command A+가 있습니다 — 우리는 지금까지 만든 것 중 가장 강력한 LLM을 만들었고, 가능한 한 적은 하드웨어로 동작하도록 최적화했으며, 이를 모두를 위해 오픈소스로 공개합니다. — @cohere X에서

🔗 Cohere 블로그

Gemini for Science — 과학적 발견의 파트너로서의 AI

5월 20일 — Google I/O 2026에서 발표되고 5월 20일에 트윗된 Gemini for Science는 과학 연구를 위한 실험적 도구 모음입니다. 데이터 폭증에 대응해, 한 사람이 혼자 처리할 수 없는 정보를 연구자들이 서로 연결할 수 있게 하는 것이 목표입니다.

세 가지 실험적 도구가 공개됩니다.

도구	기반	기능
Hypothesis Generation	Co-Scientist	새로운 가설의 발견과 정교화
Computational Discovery	AlphaEvolve + ERA	수천 개의 코드 변형을 병렬로 테스트
Science Skills	30+ 바이오 모델	에이전틱 플랫폼(항중력)에 통합된 번들

Computational Discovery는 가장 기술적인 도구입니다. 수천 개의 코드 변형을 병렬로 생성하고 평가하여, 전염병학, 화학, 계산 생물학에서 새로운 모델링 접근법을 평소보다 훨씬 짧은 시간 안에 시험할 수 있게 합니다.

Science Skills는 생명과학의 30개 이상 주요 모델과 데이터베이스의 데이터를 통합하고, 에이전틱 플랫폼과 연동해 복잡한 수동 워크플로를 몇 분 만에 자동화할 수 있게 합니다.

이 프로젝트는 박사과정 학생부터 노벨상 수상자까지 100개 이상의 파트너 기관과 함께 개발되었습니다.

🔗 @GoogleAI 발표

NVIDIA Nemotron-Labs-Diffusion — 토큰 확산 아키텍처

5월 20일 — NVIDIA가 Nemotron-Labs-Diffusion을 발표했습니다. 이 언어 모델은 기존의 자기회귀 LLM처럼 한 번에 하나의 토큰을 생성하는 대신, 확산을 통해 토큰을 병렬로 생성합니다. 이 아키텍처는 이미지 생성을 위한 확산 모델에서 영감을 얻었으며, 출력 품질을 유지하면서 추론 속도를 높이는 것을 목표로 합니다.

이 접근법은 표준 transformer 패러다임과 근본적으로 다릅니다. 이전 토큰들을 조건으로 순차적으로 각 토큰을 예측하는 대신, 모델은 노이즈가 섞인 전체 토큰 시퀀스 위에서 병렬로 반복하며 수렴할 때까지 진행합니다. 이론적 장점으로는 긴 출력에서 지연 시간이 줄어들고 GPU에서 병렬화가 더 잘된다는 점이 있습니다.

항목	일반적 방식(자기회귀)	Nemotron-Labs-Diffusion
생성	토큰 단위, 순차적	전체 시퀀스에 대해 병렬
긴 출력의 지연 시간	선형적으로 증가	잠재적으로 감소
패러다임	GPT 스타일	Diffusion 스타일

전체 기술 보고서는 출시와 함께 제공됩니다. 이는 NVIDIA Labs의 연구 기여로, 지배적인 transformer 자기회귀 모델에 대한 구조적 대안으로 제시됩니다. 이는 MDLM과 Plaid 같은 텍스트 확산 모델이 등장한 이후 활발한 연구 영역입니다.

🔗 @NVIDIAAI 발표

Stability AI — Stable Audio 3.0(오픈 웨이트 제품군)

5월 20일 — Stability AI가 상업용 라이선스의 오픈 웨이트 오디오 모델 4개로 구성된 Stable Audio 3.0 제품군을 공개합니다. 이 라인업은 임베디드 기기부터 기업용 API까지, 배포 스펙트럼 전반을 포괄합니다.

모델	최대 길이	배포	오픈 웨이트
Small SFX	짧음	온디바이스	예
Small	2분	온디바이스	예
Medium	6:20	클라우드/로컬	예
Large	6:20+	API/기업용	아니오

Small SFX, Small, Medium 모델은 Hugging Face에서 사용할 수 있습니다. 모든 학습 데이터는 완전히 라이선스를 갖추고 있으며, Universal Music Group 및 Warner Music Group과의 파트너십도 발표되었습니다. 고급 기능으로는 개인화된 fine-tuning을 위한 LoRA training 지원과 오디오 inpainting 모드(단일 세그먼트 편집, 다중 세그먼트, 인과적 continuation)가 포함됩니다.

“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”

🇰🇷 우리는 Stable Diffusion의 출시로 이미지 생성에서 촉발했던 것과 같은, 커뮤니티 주도의 혁신을 오디오에서도 이끌고자 합니다. — Stability AI

GitHub Copilot, 네 가지 방향으로 진화하다

VS Code에서 적응형 Auto model selection

5월 20일 — Copilot VS Code의 “Auto” 옵션은 이제 작업의 성격에 따라 최적의 모델을 선택합니다. 복잡한 추론, 간단한 코드 생성, 디버깅, 도구 오케스트레이션을 기준으로 판단합니다. 선택은 가용성과 신뢰성에 대한 실시간 지표를 바탕으로 이뤄집니다. 실용적 이점으로는 Auto 사용 시 프리미엄 요청 배수에 대해 10%가 줄어들며, 별도 설정은 필요 없습니다.

🔗 GitHub 변경 로그

자연어로 하는 이슈의 의미론적 검색

5월 20일 — 웹의 Copilot Chat에 이슈용 의미론적 인덱스가 통합됩니다. 개발자는 정확한 제목을 몰라도 “지난달에 보고된 모바일 렌더링 버그”처럼 검색해 맥락별로 묶인 결과를 얻을 수 있습니다. 모든 Copilot 요금제에서 일반 제공됩니다.

🔗 GitHub 변경 로그

Copilot Chat 웹에서 Gemini 모델 제거

5월 20일 — 모든 Gemini 모델이 github.com의 Copilot Chat에서 제거되며, GPT-5.2 Codex와 GPT-5.4 nano도 함께 제외됩니다. 웹에서는 OpenAI와 Claude만 남습니다. GitHub는 응답 품질의 일관성을 이유로 들었습니다. Gemini는 IDE와 API에서는 계속 사용할 수 있습니다.

🔗 GitHub 변경 로그

Fix with Copilot — 코드 리뷰 피드백의 일괄 적용

5월 19일 — “Implement suggestion” 버튼이 **“Fix with Copilot”**으로 이름이 바뀌고, 새로운 대화 상자(모델 선택, 대상 브랜치, 사용자 지정 지침)가 추가됩니다. 새로운 “Fix batch with Copilot” 버튼은 여러 코드 리뷰 코멘트를 묶어 Copilot 클라우드 에이전트에 동시에 맡길 수 있게 해, 많은 코멘트가 달린 PR의 마찰을 줄입니다.

🔗 GitHub 변경 로그

Claude Code v2.1.144와 v2.1.145

5월 19일 — Claude Code가 24시간 안에 두 버전을 내놓으며, 상당한 분량의 새 기능과 수정 사항을 포함했습니다.

2.1.144 버전은 백그라운드 세션 관리를 개선합니다. /resume 명령은 이제 --bg 세션을 표시하며, 서브에이전트 종료 알림에는 소요 시간도 포함됩니다(예: “Agent completed · 3h 2m 5s”). /model 명령은 현재 세션에만 적용되며(d를 눌러 영구 기본값을 설정할 수 있음), “extra usage”를 “usage credits”로 바꾸면서 용어가 더 명확해졌습니다. 또한 api.anthropic.com에 접근할 수 없을 때(VPN, 방화벽) 최대 75초 동안 시작이 멈추던 문제를 수정해 기업 환경 경험을 개선했습니다.

2.1.145 버전은 셸 스크립트 통합을 위해 설계된 claude agents --json의 도입이 두드러집니다(tmux-resurrect, 상태 표시줄, 세션 선택기). OpenTelemetry 추적은 span에 agent_id와 parent_agent_id를 포함하도록 확장되어, 서브에이전트의 계층 구조를 올바르게 표현합니다. /plugin 화면은 이제 설치 전에 전체 내용(명령, 에이전트, skills, hooks, MCP/LSP 서버)을 표시합니다. Stop/SubagentStop hooks에는 두 개의 새 필드가 추가됩니다: background_tasks와 session_crons.

🔗 Claude Code 변경 로그

Anthropic, AI의 성격 형성에 대한 논의를 열다

5월 19일 — Anthropic은 15개 이상의 종교 및 문화 전통에서 온 철학자, 성직자, 윤리학자들과 정기적인 대화를 진행하는 이니셔티브를 자세히 설명한 글을 발표했습니다. 목표는 Claude를 특정 전통에 맞추지 않으면서도, 수세기에 걸쳐 축적된 덕과 좋은 삶에 대한 사유를 바탕으로 AI 시스템의 성격을 형성한다는 것이 무엇을 의미하는지에 대한 논의를 풍부하게 하는 것입니다.

실험적 결과 중 하나는 주목할 만합니다. Claude가 작업 중에 호출해 자신의 윤리적 약속을 다시 읽을 수 있는 도구입니다. 영향이 큰 행동을 하기 전에 자발적으로 사용했을 때, 내부 평가에서 “비정렬 행동이 눈에 띄게 줄어드는” 효과를 보였습니다. 향후 단계에는 법률가, 심리학자, 시민 기관과의 교류가 포함될 예정입니다.

🔗 Anthropic 기사

Cohere — Indra Group 및 Multiverse Computing과 MOU 체결

5월 20일 — Cohere가 스페인 국왕 펠리페 6세의 캐나다 국빈 방문 기간에 두 건의 양해각서(MOU)를 체결했습니다. 첫 번째는 Cohere와 IndraMind(스페인의 방산·디지털화 그룹 Indra의 AI 부문)를 연결해, 스페인 5개 공식 언어에 대한 언어 적응을 포함한 주권형 AI 생태계를 구축하는 것입니다. 방위 분야에서는 다국적 훈련을 위한 분석 및 계획 기능도 예정되어 있습니다. 두 번째는 Multiverse Computing(스페인/캐나다 기반의 양자 영감 AI 최적화 기업)과 협력해 유럽과 캐나다에서의 상업적 기회를 모색하는 것입니다.

“Enterprises no longer want to rent AI — they want to own it.”

🇰🇷 기업들은 더 이상 AI를 빌리길 원하지 않습니다 — 그들은 AI를 소유하고 싶어 합니다. — Cohere 공동 창업자 겸 CEO Aidan Gomez

Perplexity — 요청 인식형 컨텍스트 압축의 프로덕션 적용

5월 20일 — Perplexity가 프로덕션에서 컨텍스트 압축 시스템(query-aware context compression)을 배포해, 답변 정확도를 높이면서 컨텍스트 토큰을 최대 70%까지 줄입니다. 원리: 경량 모델이 요청과 관련된 구간만 외과적으로 추출해 주요 LLM에 전달하고, 광고, 메타데이터, 주제와 무관한 콘텐츠는 제거합니다.

지표	값
컨텍스트 토큰 감소	최대 70%
발췌당 핵심 내용 증가	+63%
추론 지연 감소	35–40%
누적 GPU 계산 감소	40–45%
프로덕션 지연(p99)	< 20 ms

백본 pplx-diffusion(17개 레이어, 28개 레이어에서 증류)은 텍스트를 생성하지 않고도 어떤 세그먼트를 유지할지 병렬로 예측하는데, 이는 인용의 충실성을 보장하는 추출형 접근 방식입니다. SimpleQA에서 압축이 적용된 “medium” 프리셋은 문서당 평균 200토큰만으로 95%의 정확도를 달성합니다.

🔗 Perplexity 공지

ElevenLabs — 한 번의 프롬프트로 완성되는 음성 에이전트, Speech Engine

5월 20일 — ElevenLabs가 Speech Engine을 출시했습니다. 이는 음성 합성 + 전사 + 오케스트레이션을 통합한 음성 파이프라인으로, 개발자들이 하나의 프롬프트만으로 텍스트 대화형 에이전트를 완전한 음성 에이전트로 바꿀 수 있게 합니다. ElevenAPI에서 제공되며, 가격은 분당 8센트이고 사용량이 늘수록 단가가 낮아집니다. 추가 배포 채널을 위해 모니터링과 분석 기능이 포함된 ElevenAgents로 마이그레이션할 수 있습니다.

🔗 ElevenLabs 공지

Luma Agents에 Seedance 2.0 통합

5월 19일 — Luma Agents가 바이트댄스의 비디오 생성 모델인 Seedance 2.0을 크리에이티브 에이전트 플랫폼에 통합했습니다. 이미 통합된 다른 모델들과 동일한 워크플로를 사용합니다. 이번 통합으로 Luma Agents를 통해 접근 가능한 모델 선택지가 넓어졌고, AI 비디오를 위한 멀티모델 오케스트레이션 허브로서 플랫폼의 위치가 강화되었습니다.

🔗 Luma 공지

칸에서 선보인 Kling AI — 대규모 산업 수준의 AI를 적용한 첫 할리우드 영화 House of David

5월 20일 — 2026 칸 영화제에서 Kling AI는 House of David(Prime Video)에서 자사 기술이 산업적으로 사용되었음을 확인했습니다. 전 세계 시청자 4,400만 명, 미국 신규 시리즈 톱 10, Prime Video US 1위 기록을 세웠습니다. 이는 대규모 제작 파이프라인에 AI 비디오 생성을 공개적으로 통합했다고 인정한 첫 할리우드 작품으로, 엄격한 산업 표준을 충족하는 일관된 장면 구성을 제공합니다.

🔗 Kling AI 공지

짧은 소식

Running Guide Agent — Google DeepMind — 달리기 훈련에 특화된 개인 AI 에이전트로, “한계 없는 달리기를 향한 한 걸음”으로 소개됨. 🔗 DeepMind 블로그
Midjourney V8.1 — --no 플래그 재도입 — 생성 이미지에서 특정 요소를 제외하기 위한 anti-prompting 플래그가 V8.1에 다시 도입됨(예: --no people). 🔗 @midjourney 공지
Anthropic /usage가 Claude Code에서 개편됨 — Boris Cherny가 사용자 응답 시 토큰 소비를 더 잘 시각화하기 위한 /usage UI 개편을 확인함. 🔗 출처
MiniMax Speech 2.8 Turbo — Together AI의 600개+ 음성 — 이제 600개가 넘는 새로운 Speech 2.8 Turbo 음성이 Together AI 플랫폼에서 사용 가능. 🔗 @MiniMax_AI 공지

이것이 의미하는 바

기초 연구와 자율 AI. 범용 OpenAI 모델이 에르되시 추측을 증명한 것은 단순한 해프닝이 아닙니다. 관련 수학자들에게 인상적인 점은 결과의 성격입니다. 수론과 이산기하라는 두 수학 분야 사이의 예상치 못한 연결이 125페이지에 걸쳐 일관된 추론으로 유지되었다는 것입니다. 100개 이상의 기관과 함께 개발된 Gemini for Science와 결합하면, 추세는 분명합니다. AI는 더 이상 과학 데이터 처리 도구에만 머무르지 않고, 독창적인 가설을 생성할 수 있는 발견의 파트너로 통합되기 시작했습니다.

자기회귀 패러다임의 대안 아키텍처. 오늘의 두 발표는 GPT 스타일의 지배적 모델에 의문을 제기합니다. NVIDIA Nemotron-Labs-Diffusion은 순차적으로가 아니라 확산을 통해 토큰을 병렬 생성합니다. Stability AI의 Stable Audio 3.0은 확산이 4단계 배포 수준에서 오픈 웨이트 모델로도 고품질 음악 결과를 만들어낼 수 있음을 보여줍니다. 이러한 접근의 수렴은 확산이 더 이상 이미지 생성에만 머무르지 않으며, 텍스트와 오디오에 대한 진지한 경쟁 아키텍처가 되고 있음을 시사합니다.

주권과 엔터프라이즈 AI. Command A+(MoE 218B 오픈소스, Apache 2.0, 2× H100)와 Cohere가 Indra Group 및 Multiverse Computing과 체결한 MOU는 하나의 큰 흐름을 보여줍니다. 정부, 국방, 규제 산업 등 대형 조직들은 자사 인프라 내에서 모델을 배포하길 원합니다. 효율적인 MoE 아키텍처(총 218B 중 25B 활성)와 Apache 2.0 라이선스의 조합은 Command A+를 2026년 5월 말 기준 주권형 배포에 가장 적합한 오픈소스 모델로 만듭니다.

개발자 도구에 대한 증가하는 압박. Claude Code 2.1.144와 2.1.145, GitHub Copilot의 네 가지 동시 업데이트, 그리고 Perplexity의 컨텍스트 압축(-70% 토큰, -40% GPU)은 일관된 신호입니다. 경쟁의 중심이 모델의 순수 성능에서 도구의 사용성, 스크립트화 가능성(claude agents —json), 추론 비용(Auto model selection -10%, pplx-diffusion), 그리고 프로덕션 안정성(Claude Code의 VPN 차단 문제 수정)으로 이동하고 있습니다.

OpenAI, 80년 된 에르되시의 추측을 반박하다, Cohere Command A+ 오픈소스, NVIDIA Nemotron-Labs-Diffusion

OpenAI, 80년 된 에르되시의 추측을 반박하다

Cohere Command A+ — MoE 플래그십 오픈소스

Gemini for Science — 과학적 발견의 파트너로서의 AI

NVIDIA Nemotron-Labs-Diffusion — 토큰 확산 아키텍처

Stability AI — Stable Audio 3.0(오픈 웨이트 제품군)

GitHub Copilot, 네 가지 방향으로 진화하다

VS Code에서 적응형 Auto model selection

자연어로 하는 이슈의 의미론적 검색

Copilot Chat 웹에서 Gemini 모델 제거

Fix with Copilot — 코드 리뷰 피드백의 일괄 적용

Claude Code v2.1.144와 v2.1.145

Anthropic, AI의 성격 형성에 대한 논의를 열다

Cohere — Indra Group 및 Multiverse Computing과 MOU 체결

Perplexity — 요청 인식형 컨텍스트 압축의 프로덕션 적용

ElevenLabs — 한 번의 프롬프트로 완성되는 음성 에이전트, Speech Engine

Luma Agents에 Seedance 2.0 통합

칸에서 선보인 Kling AI — 대규모 산업 수준의 AI를 적용한 첫 할리우드 영화 House of David

짧은 소식

이것이 의미하는 바

출처