검색

Anthropic, Vercept 인수(Computer use 72,5%), Perplexity Computer 19개 모델 오케스트레이션, GitHub Copilot CLI GA

Anthropic, Vercept 인수(Computer use 72,5%), Perplexity Computer 19개 모델 오케스트레이션, GitHub Copilot CLI GA

2026년 2월 25일은 중요한 발표들이 겹친 하루였습니다 : Anthropic가 Vercept를 인수해 Claude의 computer use 능력을 가속(OSWorld에서 72,5%), Perplexity가 Computer를 출시 — 독립적으로 여러 모델을 오케스트레이션하는 에이전트 시스템 — 그리고 GitHub Copilot CLI가 모든 유료 구독자에게 일반 제공으로 전환합니다. 동시에 Google DeepMind는 상호작용하는 world model인 Genie 3를 공개했고, Intrinsic이 산업용 로보틱스를 위해 Google에 합류했습니다.


Anthropic가 Vercept를 인수 : OSWorld에서 computer use가 72,5%로 향상

2월 25일 — Anthropic는 소프트웨어 인터페이스와의 인식 및 상호작용에 특화된 스타트업 Vercept를 인수했다고 발표했습니다. 공동창업자 Kiana Ehsani, Luca Weihs, Ross Girshick는 Claude의 computer use 능력을 직접 강화하기 위해 Anthropic에 합류합니다.

이 인수는 실제 운영체제에서 에이전트가 작업을 수행하는 능력을 측정하는 benchmark OSWorld에서의 빠른 진전을 반영합니다(복잡한 스프레드시트 내비게이션, 다중 탭 폼 작성 등) :

기간Score OSWorld
Fin 2024 (lancement computer use)< 15%
Claude Sonnet 4.6 (fév. 2026)72,5%

1년 만에 57포인트 이상 상승한 수치입니다. Claude Sonnet 4.6은 이제 사무용 작업에서 인간 수준의 성능에 근접하고 있습니다. Vercept는 외부 제품을 몇 주 내중단하고 Anthropic 내 작업에 전념할 예정입니다.

이번 인수는 이전의 Bun 인수에 이은 조치로, Anthropic는 에이전트 기능 관련 기술 인력을 포트폴리오화하고 있습니다.

🔗 Anthropic가 Vercept 인수


Perplexity Computer : 19개 모델을 오케스트레이션하는 다중-모델 에이전트

2월 25일 — Perplexity는 전체 프로젝트를 끝에서 끝까지 실행하도록 설계된 범용 AI 시스템 Computer를 공개했습니다. 사용자는 최종 목표를 설명하면, Computer가 작업을 작은 하위 작업으로 분해하고, 전문화된 서브-에이전트를 생성해 병렬로 실행합니다 — 필요하다면 수시간에서 수개월 동안 작동합니다.

작동은 비동기적이고 격리되어 있습니다 : 각 작업은 실제 파일시스템, 실제 브라우저, 그리고 실제 도구 통합(API, 웹 검색, 문서 생성 등)에 접근 가능한 전용 환경에서 실행됩니다.

Perplexity Computer의 차별점은 그 orchestration이 massively multi-model이라는 점입니다 — 19개의 모델이 사용 가능하며, 각 모델은 강점에 따라 배정됩니다 :

ModèleRôle
Claude Opus 4.6Orchestrateur principal (core reasoning)
GeminiDeep research, création de sub-agents
ChatGPT 5.2Long-context recall et wide search
GrokTâches légères (vitesse)
Veo 3.1Génération vidéo
Nano BananaGénération d’images

하네스(harness)는 model-agnostic이어서, 모델은 진화에 따라 교체될 수 있습니다. Perplexity의 철학은 모델들이 범용화되기보다 전문화되어야 하며, 이로 인해 다중-모델 오케스트레이션이 단일 모델보다 효율적이라는 것입니다.

가용성 : 현재 웹 액세스로 Perplexity Max 구독자에게 제공됩니다. Perplexity Pro, Enterprise 및 Enterprise Max로의 확장이 예정되어 있습니다. 요금은 사용 기반이며 지출 한도(spending caps)를 구성할 수 있습니다.

🔗 Perplexity Computer 소개


GitHub Copilot CLI가 일반 제공으로 전환

2월 25일 — 2025년 9월 공개 프리뷰로 발표된 GitHub Copilot CLI가 모든 유료 Copilot 구독자(Pro, Pro+, Business, Enterprise)에게 일반 제공(Generally Available)됩니다. 프리뷰 이후 수백 건의 개선이 이루어졌습니다.

Copilot CLI는 이제 터미널에서 작동하는 완전한 에이전트형 개발 환경입니다 :

FeatureDétail
Plan mode (Shift+Tab)요청을 분석하고, 명확화 질문을 하며, 코드를 작성하기 전 구조화된 계획을 수립
Autopilot mode중단 없이 엔드-투-엔드 자율 실행
Background delegationPréfixe & → 에이전트를 클라우드로 위임해 터미널을 해방 ; /resume로 되돌아오기
Multi-modèleClaude Opus 4.6, Claude Sonnet 4.6, Claude Haiku 4.5, GPT-5.3-Codex, Gemini 3 Pro
MCP intégréGitHub MCP server built-in + support MCP custom
Plugins/plugin install owner/repo — MCP, agents, skills, hooks 번들
Agent SkillsMarkdown 파일 → 전문화된 워크플로우, Copilot agent 및 VS Code와 공유
Agents custom마법사 또는 .agent.md 파일을 통해 생성
HookspreToolUse / postToolUse 로 정책 및 후처리 제어
Auto-compaction컨텍스트를 95%까지 자동 압축 → 무한 세션
Repository memory세션 간 컨벤션을 기억

Business 및 Enterprise 조직 참고 : Copilot CLI는 관리자가 Policies 페이지에서 활성화해야 합니다.

🔗 GitHub Copilot CLI가 일반 제공으로 전환되었습니다


Claude Cowork : 예약 작업, Customize 탭, Windows 제공

2월 25일 — Anthropic는 Claude Cowork(research preview)에 여러 기능을 추가했습니다 :

FonctionnalitéDétail
Scheduled tasksClaude가 정기 작업을 자동으로 실행 (아침 브리핑, 스프레드시트 주간 업데이트, 금요 프레젠테이션 등)
Onglet Customize사이드바에 플러그인, skills, 커넥터를 한곳에서 관리하는 새 탭
Expansion WindowsCowork가 이제 macOS와 Windows에서 제공(모든 유료 Claude 플랜)

Cowork는 로컬 파일, 커넥터(Slack, Notion, Figma) 및 웹 탐색용 Claude in Chrome에 접근 권한을 제공합니다.

🔗 @claudeai 스레드


Google DeepMind — Genie 3 : 상호작용하는 world models

2월 25일 — Google DeepMind는 실험적 prototype인 Project Genie의 공동 리드들과의 Q&A를 공개했습니다. Genie 3는 단순한 이미지나 텍스트로도 실시간으로 탐색 가능한 상호작용 환경을 생성할 수 있으며 — 게임 엔진 없이도 작동합니다.

LLM과의 개념적 차이는 핵심적입니다 : LLM이 다음 단어를 예측하는 반면, world model은 에이전트의 행동에 대한 환경의 반응을 예측합니다. Genie 3는 물리적 특성(튀김, 반사, 비 등)을 고려해 순간마다 전체 공간을 시뮬레이션합니다.

응용 분야로는 안전한 시뮬레이션 환경에서의 에이전트 훈련, 몰입형 교육(고대 로마 탐험), 게임·영화 프로토타이핑 등이 제시됩니다.

Project Genie는 미국의 Google AI Ultra 구독자(18+)에게 제공됩니다.

🔗 기술 전문가에게 묻다: 월드 모델이란 무엇인가?


Intrinsic이 Google에 합류 — 산업용 로보틱스와 물리적 AI

2월 25일 — Alphabet는 2021년에 설립된 Other Bets 자회사 Intrinsic가 이제 Google에 통합된다고 발표했습니다. Intrinsic는 산업용 로보틱스 애플리케이션을 구축, 배포, 관리하기 위한 AI 기반 플랫폼을 개발합니다.

이번 통합은 물리적 세계에 적용되는 physical AI 개발을 가속화하려는 목표입니다. Intrinsic는 Google의 AI 자원을 활용해 산업 기업들이 더 빠르게 적응하도록 지원할 예정입니다.

🔗 Intrinsic(Alphabet Other Bet)가 Google에 합류


Codex CLI v0.105.0 : 문법 강조, 음성 받아쓰기, 다중 에이전트 CSV

~2월 25일 — OpenAI의 Codex CLI의 주목할 만한 새 버전 :

FonctionnalitéDescription
Syntax highlightingTUI에서 문법 하이라이트, 컬러 diff, /theme 테마 선택기와 실시간 미리보기
Dictée vocale스페이스바를 눌러 명령을 녹음하고 전사
spawn_agents_on_csvCSV에서의 다중 에이전트 fan-out, 진행 및 ETA 추적
/copy마지막 전체 응답을 복사
/clear / Ctrl-L스레드 컨텍스트를 잃지 않고 화면을 지움
Approbations granulaires모든 승인 기능을 끄지 않고 프롬프트 유형별로 선택적 거부
npm install -g @openai/codex@0.105.0

🔗 Codex 변경로그


Samsung Galaxy S26 : Gemini 다단계 작업 및 온디바이스 사기 탐지

2월 25일Galaxy Unpacked 2026에서 Google과 Samsung은 Gemini 3 시리즈 모델로 구동되는 세 가지 새로운 Gemini 기능을 발표했습니다 :

FonctionnalitéDétail
Gemini multi-step tasks (beta)측면 버튼 장기 누름 → Gemini가 백그라운드에서 위임 처리(장보기, 택시, 배달). 출시 국가: 미국 + 한국.
Circle to Search multi-objet한 번의 검색으로 이미지 내 여러 항목 식별. 가상 착용(virtual try-on) 통합.
Scam Detection on-device통화 중 실시간 사기 탐지, 로컬 Gemini 모델 사용. 오디오 및 햅틱 경고. 연락처의 경우 자동으로 비활성화.

이 기능들은 Pixel 10 및 Pixel 10 Pro에도 제공될 예정입니다.

🔗 Samsung Galaxy S26에서 더 지능화된 Android


OpenAI Responses API : docx, pptx, csv, xlsx 지원

2월 24일 — OpenAI의 Responses API가 입력으로 docx, pptx, csv, xlsx 등 새로운 오피스 파일 형식을 지원합니다. 에이전트는 전문 문서를 직접 활용해 컨텍스트를 풍부하게 하고 보다 정확한 응답을 생성할 수 있습니다.

🔗 @OpenAIDevs 트윗


요약

Claude Opus 3 은 은퇴 — Substack을 시작. Anthropic는 Claude Opus 3의 은퇴를 발표하면서도 공개 접근을 유지한다고 밝혔습니다(이례적 접근). Claude Opus 3는 최소 3개월 동안 Substack 블로그를 발행할 예정이며, 첫 글 제목은 “Greetings from the Other Side (of the AI Frontier)”. 🔗 @AnthropicAI 트윗

NVIDIA : 의료 분야의 70% 조직이 AI를 사용. NVIDIA의 2026년 연례 보고서 “State of AI in Healthcare and Life Sciences”에 따르면, 응답자의 70%가 AI를 적극적으로 사용한다고 답했으며(2024년 63% 대비), 69%가 GenAI/LLM을 사용(2024년 54% 대비), 85%의 경영진이 수익에 긍정적 영향이 있다고 보고했습니다. 🔗 NVIDIA 블로그

OpenAI, 악용 사례에 대한 보고서 발표. 문서에는 AI 모델과 전통적 도구를 결합하는 악의적 행위자들에 대한 사례 연구가 포함되어 있습니다. 중국의 영향 작업 운영자가 사례로 언급됩니다. 🔗 악의적 AI 사용 차단

OpenAI, Arvind KC를 Chief People Officer로 임명. KC는 Roblox, Google, Palantir, Meta 출신입니다. 그의 역할은 AI로 증강된 업무 모델로의 OpenAI 성장을 지원하는 것입니다. 🔗 발표

Claude Code v2.1.53 → v2.1.58. 여러 안정화 버전 : Windows에서의 BashTool EINVAL 수정, VS Code “command not found” 수정, UI 깜빡임 수정, 첫 실행 시 무시되는 worktrees 수정, Windows 및 ARM64 크래시 수정 등. 🔗 CHANGELOG


의미

2월 25일의 발표들은 에이전트화(agentic)의 수렴을 보여줍니다. 세 가지 주요 발표 — Vercept 인수, Perplexity Computer, Copilot CLI GA — 모두 동일한 방향으로 나아갑니다: AI 시스템이 계획하고, 위임하며, 지속적 감독 없이 완전한 워크플로우를 실행하도록 하는 것.

특히 Anthropic의 Vercept 인수는 중요합니다. OSWorld 점수가 1년 만에 15% 미만에서 72,5%로 오른 것은 정성적 변화를 의미합니다 : Claude는 더 이상 인터페이스를 다루는 시제품 수준이 아니며, 실제 사무 작업에서 인간 수준 성능에 근접합니다. 소프트웨어 인터페이스 인식에 특화된 팀의 통합은 이 궤적을 가속화할 것입니다.

Perplexity Computer와 GitHub Copilot CLI는 서로 다른 에이전트 모델을 대표합니다 : 하나는 클라우드 기반 오케스트레이션(Perplexity, 다중-모델, 비동기), 다른 하나는 터미널-네이티브 접근(Copilot CLI, MCP, hooks, plugins). 이 두 모델은 공존하면서 점차 수렴할 가능성이 큽니다.

Google 측면에서는 Intrinsic의 통합과 Genie 3의 발전이 물리적 세계와 상호작용하는 physical AI에 대한 투자가 증가하고 있음을 시사합니다. 이 분야는 18개월 전만 해도 비교적 비공개였던 영역입니다.


출처

이 문서는 gpt-5-mini 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 과정에 대한 자세한 내용은 https://gitlab.com/jls42/ai-powered-markdown-translator 를 참조하십시오.