검색

Gemma 4 12B 오픈소스, Ideogram 4.0 오픈 웨이트, Windows의 Perplexity Computer, Stargate Michigan

Gemma 4 12B 오픈소스, Ideogram 4.0 오픈 웨이트, Windows의 Perplexity Computer, Stargate Michigan

ai-powered-markdown-translator

gpt-5.4-mini로 fr에서 ko로 번역된 기사.

GitHub에서 프로젝트 보기 ↗

2026년 6월 3일에는 주요 오픈소스 발표가 한꺼번에 쏟아집니다. Google은 Gemma 4 12B(멀티모달, 엣지, Apache 2.0)를 공개하고, 과학 연구를 위한 멀티 에이전트 시스템인 Co-Scientist를 출시합니다. Ideogram은 4.0 버전의 가중치를 공개합니다. Perplexity는 Personal Computer 에이전트를 Windows로 가져옵니다. OpenAI는 미시간에 1 GW 데이터센터인 The Barn을 개시합니다. GitHub Copilot은 VS Code, JetBrains, Eclipse와 과금 전반에 걸친 대규모 업데이트를 내놓습니다. xAI 측에서는 Grok Imagine 1.5 Preview가 API를 통해 उपलब्ध해지고, Grok 음성이 Vapi에 도입됩니다.


Gemma 4 12B — 노트북용 오픈소스 멀티모달 모델

6월 3일 — Google은 Gemma 4 12B를 출시합니다. 이 모델은 노트북과 엣지 컴퓨팅 기기에서 바로 동작하도록 설계된 통합 멀티모달 모델입니다. 기술적으로 가장 두드러진 점은 별도의 인코더가 없는 (encoder-free) 아키텍처로, 배포를 단순화하고 소프트웨어 의존성을 줄여 줍니다. 이 모델은 Apache 2.0 라이선스로 배포되어 상업 및 연구 목적으로 자유롭게 사용할 수 있습니다.

특징
파라미터120억
모달리티텍스트 + 이미지(통합)
아키텍처별도 인코더 없음 (encoder-free)
라이선스Apache 2.0
하드웨어 대상노트북, 엣지 컴퓨팅
제공 여부지금 바로 다운로드 가능

이 발표는 X에서 62만 뷰와 5천 개의 좋아요를 기록하며, 이번 주 가장 큰 반향을 일으킨 오픈소스 발표 중 하나가 되었습니다. Google DeepMind가 재공유한 Gemma 4 12B는 이전 Gemma 모델의 연장선에 있지만, 하나의 컴팩트한 모델에서 비전과 텍스트를 결합했다는 점에서 한 단계 도약했습니다.

개발자들에게 이 모델은 클라우드 밖에서도 배포 가능한 멀티모달 AI 애플리케이션으로 가는 현실적인 경로를 제시합니다. 즉, 일반 소비자용 GPU가 탑재된 머신에서도 API 구독 없이 활용할 수 있습니다.

🔗 출시 트윗 @googlegemma


Google DeepMind Co-Scientist — 과학 연구를 위한 멀티 에이전트 파트너

6월 2일 — Google DeepMind는 Gemini 기반의 멀티 에이전트 시스템인 Co-Scientist를 공개합니다. 이 시스템은 진정한 과학 연구 파트너처럼 작동하도록 설계되었습니다. 핵심 역량은 복잡한 과학 문제에 대해 가설을 자율적으로 생성하고, 토론하고, 발전시키는 것이며, 인간의 개입은 적게 필요합니다.

Co-Scientist는 단순한 요약 도구나 문서 검색 도구가 아닙니다. 독창적인 가설을 제안하고, 에이전트들 사이에서 내부적으로 서로 검증한 뒤, 이를 정교하게 다듬는 것이 가능합니다. 즉, 지금까지는 인간 연구팀만 수행하던 아이디어 생성-토론-진화의 사이클을 구현합니다. 이 시스템은 전 세계 과학 전문가들과 함께 특화 벤치마크로 평가되었습니다.

제공 여부: Hypothesis Generation을 통해 개별 연구자를 위한 사전 체험 접근이 가능합니다(대기자 명단). 특정 분야에 대한 성능 평가를 위해 전 세계 과학 전문가들과의 협업도 진행 중입니다.

“We believe AI can be a dedicated research partner to help discover the next breakthrough.”

🇰🇷 우리는 AI가 다음 돌파구를 발견하는 데 도움을 주는 전담 연구 파트너가 될 수 있다고 믿습니다.@GoogleDeepMind

이 발표는 X에서 14만 4천 뷰를 기록했습니다. 발견 주기를 가속해야 한다는 압박이 큰 과학 분야의 맥락에서, Co-Scientist는 대규모 팀의 자원이 없는 개별 연구자를 직접 겨냥합니다.

🔗 deepmind.google 기사


Ideogram 4.0 — 다운로드 가능한 오픈소스 가중치, 파인튜닝 가능

6월 3일 — Ideogram은 Ideogram 4.0을 발표하며, 이를 “세계 최고의 오픈소스 이미지 모델”이라고 소개합니다. 이 발표는 근본적으로 개방적인 철학으로 주목받습니다. 즉, 모델 가중치를 다운로드할 수 있고, 개발자는 자신의 데이터로 이를 파인튜닝(fine-tune)할 수 있으며, 자체 인프라에 배포할 수도 있습니다.

항목세부사항
제공 여부모든 Ideogram 요금제 + API(지금 바로)
Hugging Face 가중치ideogram-ai/ideogram-4-nf4
Demohuggingface.co/spaces/multimodalart/ideogram4
파인튜닝자체 데이터에 대해 허용
배포개인 인프라 가능
X 참여도39만 6,800뷰 — 높은 바이럴성

이 발표는 Hugging Face에 의해, 열린 모델의 품질이 얼마나 진전했는지를 보여 주는 사례로 재공유되고 지지받았습니다. “Think it. Make it. Own it.”이라는 슬로건은 철학을 잘 요약합니다. 일반적으로 폐쇄형인 이미지 생성 모델(Midjourney, DALL-E, 최근의 Stable Diffusion)과 달리, Ideogram 4.0은 스튜디오와 개발자를 위한 완전한 소유 모델을 제공합니다.

창작 팀에게는 즉각적인 가치가 있습니다. 외부 서비스에 의존하지 않고 자신의 데이터로 스타일을 맞춤화할 수 있으며, 내부에 배포할 수 있습니다.

🔗 @ideogram_ai 발표


Perplexity Personal Computer가 Windows에 등장

6월 3일 — Perplexity는 자사의 에이전트 Personal Computer의 Windows 지원을 발표합니다. 지금까지는 macOS에서만 사용할 수 있었던 이 에이전트가 Microsoft의 운영체제로 영역을 넓힙니다.

“Personal Computer is coming to Windows. Personal Computer for Windows runs on your machine and orchestrates across the apps and files you use every day. We’ll roll out first to paying Max and Enterprise Max subscribers on the waitlist.”

🇰🇷 Personal Computer가 Windows에 등장합니다. Windows용 Personal Computer는 사용자의 기기에서 실행되며, 여러분이 매일 사용하는 애플리케이션과 파일을 조율합니다. 먼저 대기자 명단에 등록한 유료 Max 및 Enterprise Max 구독자에게 배포할 예정입니다.@perplexity_ai

Personal Computer는 사용자의 기기에서 로컬로 실행되며, 일상적인 애플리케이션과 파일을 완전히 클라우드를 거치지 않고 조율합니다. 이러한 하이브리드 로컬/클라우드 접근 방식은 Perplexity를 순수 클라우드 에이전트와 구별되는 범주에 두며, 사용자는 민감한 데이터에 대한 통제권을 유지할 수 있습니다.

배포는 perplexity.ai/personal-computer의 대기자 명단에 등록한 MaxEnterprise Max 구독자부터 시작됩니다.

Perplexity Computer — 기업용 400개 이상의 통합

같은 날, Perplexity는 이 에이전트의 기업 기능 범위를 더 자세히 설명합니다. 모든 유형의 기업을 포괄하는 400개 이상의 도구가 연결되어 있습니다. 언급된 통합에는 Intuit QuickBooks(회계), Vercel(웹 배포), Shopify(전자상거래), Canva(디자인)가 포함됩니다.

이 추가 발표는 Perplexity Computer를 기존 도구를 대체하지 않으면서도 업무 흐름에 통합될 수 있는 범용 기업 에이전트로 자리매김하게 합니다.

🔗 기업용 통합


Stargate Michigan — Saline의 The Barn, 1 GW 데이터센터

6월 1일 — OpenAI와 그레천 휘트머 주지사는 미시간주 Saline에 있는 1기가와트 규모 데이터센터 캠퍼스 The Barn의 기공식을 엽니다. 이 프로젝트는 OpenAI의 Stargate 프로그램의 일환으로, Oracle, Related Digital, Walbridge, Blackstone과의 파트너십을 통해 차세대 AI를 위한 장기 인프라 구축 노력에 속합니다.

지표
용량1 GW
위치Saline, Michigan
건설 일자리2,500개 이상(노조)
상시 일자리450개
카운티 + 간접 일자리2,500개
리크 센터 투자$10M (Oracle + Related Digital)
예상 세수$1 billion(임대 기간)
학생용 Codex 크레딧최대 $45M
자격 학생400,000명 이상

지역 사회에 대한 약속도 분명합니다. 지역 주민들은 전기 요금으로 인프라 비용을 부담하지 않습니다. 냉각은 폐쇄 루프로 운영되며, 물 사용량은 일반적인 사무용 건물과 비슷한 수준입니다.

Michigan 학생 프로그램은 주 내 대학, 커뮤니티 칼리지, 직업학교의 학생 40만 명에게 최대 $45 million의 Codex 크레딧을 제공합니다(18세 이상, 2026-2027 학년도).

🔗 openai.com 발표


GitHub Copilot in VS Code — 5월 릴리스(v1.120–v1.123)

6월 3일 — GitHub는 Copilot for VS Code의 월간 요약을 공개합니다. 이 요약은 2026년 5월 동안 배포된 v1.120부터 v1.123까지의 버전을 다룹니다. 이 핵심 업데이트는 에이전트, 동기화, 보안에 대한 여러 달의 작업을 하나로 묶습니다.

주요 새 기능은 다음과 같습니다.

  • Agents 창(안정적 미리보기): 여러 프로젝트를 동시에 작업하기 위한 agent-first 인터페이스로, 빠른 탐색과 변경 사항 검토 기능 제공
  • 원격 에이전트(미리보기): SSH 또는 Dev Tunnels를 통해 원격 머신에서 실행 — 클라이언트가 연결을 끊어도 세션이 유지됨
  • Agent Host Protocol (AHP): 여러 클라이언트 간 세션 상태 동기화를 위한 개방형 프로토콜
  • 세션 동기화: 채팅 세션이 GitHub 계정으로 자동 동기화되어, 여러 머신과 작업 공간 간에 확인 가능
  • /chronicle: 과거 세션 조회, 일일 스탠드업 보고서 생성, 개인화된 생산성 조언 획득
  • 터미널 보안: 터미널에 입력된 비밀번호, PIN, 인증 코드는 언어 모델에 절대 전달되지 않음
  • 명령 위험도 평가(실험적): 터미널 확인에 AI가 생성한 위험 수준 표시
  • BYOK air-gapped: BYOK 모델은 GitHub 접근이 없는 격리 환경에서도 작동
  • 구성 가능한 유틸리티 모델: 제목, 요약, 이름 변경 제안, 커밋 메시지, 의도 감지에 사용할 모델 선택 가능
  • 내장 브라우저: 모바일 기기 에뮬레이션, 고급 스크린샷(뷰포트, 선택 영역, 전체 페이지), 로컬 HTML 미리보기
  • Mermaid 및 YAML front matter 렌더링: Markdown 미리보기에서 기본적으로 통합
  • 터미널 출력 압축: 장황한 패턴(테스트, 빌드, 린터, Docker, 패키지 관리자)을 자동 압축

멀티 에이전트 작업 방식이 점차 형태를 갖춥니다. 여러 에이전트 세션이 Agents 창에서 병렬로 실행될 수 있으며, 각 세션은 자체 컨텍스트와 GitHub 계정으로 동기화되는 기록을 가집니다.

🔗 VS Code 5월 변경 로그


Copilot Code Review — MCP skills와 Medium 분석 수준(공개 미리보기)

6월 2일 — GitHub는 Copilot code review를 위한 두 가지 주요 기능을 공개 미리보기로 출시합니다. 이를 통해 각 팀의 맥락과 복잡도에 맞게 자동 리뷰를 조정할 수 있습니다.

Skills 및 MCP 지원: 이제 팀은 커스텀 에이전트 스킬(.github/skills/code-review/SKILL.md 파일)과 MCP 서버 연결을 구성해, 내부 도구의 맥락—이슈 추적, 문서, 서비스 카탈로그, 인시던트 도구—를 각 리뷰에 추가할 수 있습니다. MCP 구성은 저장소 설정 → Copilot → MCP servers에서 가능합니다. 클라우드 에이전트에 대한 기존 MCP 구성은 리뷰에도 자동 적용됩니다. 즉, 한 번의 투자로 두 에이전트에 일관된 동작을 제공합니다.

“Medium” 수준: 새로 도입된 중간 단계는 복잡한 풀 리퀘스트를 더 높은 추론 모델로 라우팅하여, 미묘한 버그 감지, 보안 로직 분석, 서비스 간 변경 사항 처리를 수행하도록 설계되었습니다. Low 수준은 단순 변경에 대한 빠르고 경제적인 기본값으로 유지됩니다. Medium은 Low보다 더 많은 AI Credits를 사용하며, 인터페이스에서 비용 신호가 명확하게 표시됩니다. 관리자는 저장소별로 수준을 지정할 수 있습니다.

Actions 워크플로 또한 구성 가능해져, Copilot이 리뷰에 사용할 컴퓨팅 환경을 제어할 수 있습니다. Copilot Pro, Pro+, Business, Enterprise에서 사용할 수 있습니다.

🔗 Shape Copilot Code Review


JetBrains IDE의 Copilot CLI와 강화된 에이전트 기능

6월 2일 — GitHub는 JetBrains에서 Copilot CLI가 제공된다고 발표하며, 에이전트 선택기를 통해 Agent(자율), Ask(빠른 지원), Custom agents(사용자 지정), Plan(협업 계획) 모드를 선택할 수 있게 합니다. 다음의 세 가지 새 명령은 CLI 세션을 더욱 강화합니다.

  • /remote : github.com 또는 모바일 앱에서 CLI 세션 제어
  • /compact : 긴 세션의 컨텍스트를 수동으로 압축
  • /chronicle : 기록 분석, 스탠드업 보고서 생성, 맞춤 조언 획득

에이전트 디버그 패널(공개 미리보기)은 상호작용의 시간순 로그를 보여 줍니다. 특히 커스텀 에이전트와 복잡한 멀티 에이전트 워크플로를 디버깅할 때 유용합니다. 추론 모델의 사고 노력은 모델 선택기에서 직접 설정할 수 있어, 작업에 따라 분석 깊이를 조정할 수 있습니다.

이제 Cloud agent 세션이 통합 세션 보기 안에 포함되어, 로컬, CLI, 클라우드 세션을 한 곳에서 관리할 수 있습니다. 에이전트 커스터마이제이션 편집기는 스킬, 지침, 프롬프트 생성과 관리를 중앙에서 처리합니다.

새로운 로그인 옵션도 추가됩니다. Google과 Apple이 사용 가능한 sign-in 방법에 합류합니다. GA로 전환된 기능에는 agent skills, agent hooks, 프롬프트 파일, Anthropic Thinking이 포함됩니다. JetBrains에서 Copilot CLI agent를 기본 경험으로 만들기 위한 단계적 배포가 진행 중입니다.

🔗 Copilot JetBrains 변경 로그


GitHub Copilot 과금 및 요금제 — 사용량 기반 과금 GA, Copilot Max

6월 1일 — GitHub는 2026년 6월 1일부터 모든 Copilot 요금제에 대해 사용량 기반 과금(AI Credits)을 활성화합니다. 각 요금제에는 월별 AI Credits 할당량이 포함되며, 이를 초과하면 사용자는 관리자가 정의한 한도 내에서 추가 지출 예산을 설정해 계속 사용할 수 있습니다.

구조적 변화는 다음과 같습니다.

  • **Copilot code review가 이제 GitHub Actions 분(minute)**도 AI Credits와 함께 소모합니다 — 관리자는 저장소별 설정 없이 조직 수준에서 모든 리뷰에 사용할 기본 runner를 구성할 수 있습니다
  • 사용자별 예산 GA: 조직 및 기업 관리자는 사용자별 또는 전사 공통 예산을 정의할 수 있으며, 한도에 가까워지면 이메일 알림이 전송됩니다
  • Copilot Max: 기존 Student, Pro, Pro+ 구독자는 오늘부터 업그레이드 가능 — 고강도 워크플로를 위한 더 높은 할당량과 더 높은 지출 한도 제공
  • 신규 가입 일시 중단: Student, Pro, Pro+, Max 신규 가입은 중단되었으며, 재개는 앞으로 몇 주 내로 예정

Enterprise 팀을 위한 주의 사항: 관리자는 더 이상 사용되지 않는 GPT-4.1을 대체하기 위해 모델 정책에서 대체 모델 GPT-5.5를 활성화해야 합니다. 활성화되면 GPT-5.5는 VS Code와 github.com의 Copilot Chat 모델 선택기에 나타납니다.

🔗 과금 및 요금제 업데이트


Grok Imagine 1.5 Preview가 xAI API에서 제공됨

6월 3일 — xAI가 Grok Imagine 1.5 Preview의 xAI API 제공을 발표했으며, x.ai/api/imagine에서 접근할 수 있다. 이는 Grok의 이미지 생성 능력에 대한 주요 업데이트로, 1.5 Preview 버전이 Grok Imagine을 계승하며 개발자가 API를 통해 직접 사용할 수 있는 xAI 이미지 모델의 새로운 세대를 나타낸다.

항목세부 정보
모델Grok Imagine 1.5 Preview
접근xAI API — x.ai/api/imagine
상태Preview (스캔 시점에 공식 제품 페이지 없음)
제공 여부현재 API를 통해 개발자에게 제공
X 반응164,800회 조회, 약 1,000개 좋아요

공개 트윗은 @grok 계정에서 올라왔고 곧바로 @xai가 리포스트했다 — 팀 내 우선순위가 높다는 신호다. Grok Imagine은 이미 Grok 인터페이스에서 사용할 수 있었지만, 1.5 Preview의 API 제공으로 xAI의 이미지 생성 기능이 개발자의 애플리케이션에 통합될 수 있게 되었다.

Grok Imagine 1.5 Preview는 멀티모달 분야에서 xAI의 확장 흐름의 일부다. 같은 날 Grok STT와 Grok TTS 음성 API도 Vapi 통합을 통해 범위를 넓혔다. 이제 xAI 생태계는 API를 통해 텍스트, 이미지, 음성을 아우르며, 이 분야에서 OpenAI와 Google의 제공에 대한 완전한 대안을 제시한다.

🔗 @grok의 발표


Vapi에서 제공되는 Grok STT와 TTS

6월 3일 — xAI의 음성 API인 Grok STT(음성 인식)와 Grok TTS(음성 합성)가 이제 엔터프라이즈 음성 AI 플랫폼인 Vapi에 통합되었다. 2026년 4월에 출시된 이 API들은 이제 Vapi를 통해 엔터프라이즈 음성 에이전트 개발자들에게 범위를 확장한다.

이 발표는 433,300회 조회, 1,100개 좋아요, 272회 리포스트를 기록했다 — 기술 통합 발표치고는 강한 반응이다. Vapi는 맞춤형 음성 에이전트를 만들 수 있게 해주며, Grok STT/TTS 통합은 여기에 ElevenLabs, Deepgram, OpenAI의 대안으로 xAI 음성 모델을 더한다.

🔗 Vapi의 Grok


NVIDIA CVPR 2026 — 자율주행차, 로보틱스, AI 비전 및 Alpamayo 2 Super 32B를 위한 Physical AI 에이전트 스킬

6월 3일CVPR 2026(덴버, 6월 3~7일)을 맞아 NVIDIA는 자율주행차, 로보틱스, AI 비전을 위한 전체 연구 사이클을 포괄하는 차세대 Physical AI 에이전트 스킬을 공개한다.

자율주행차를 위한 핵심 발표:

  • AlpaGym : 수천 개의 GPU로 확장 가능한 폐루프 reinforcement learning 프레임워크
  • OmniDreams : 행동 조건부 생성형 월드 모델
  • Alpamayo 2 Super : 레벨 4 자율주행을 위한 320억 파라미터 오픈소스 VLA(Vision-Language-Action) 모델

로보틱스 분야에서는: 네이티브 에이전트 커넥터가 포함된 Isaac Sim 6.0, 이동성 스킬, sim-to-real 강화학습, 그리고 수술 로보틱스를 위한 Cosmos-H-Surgical-Simulator가 포함된다.

AI 비전 분야에서는: 시각적 이상 징후를 생성하는 Metropolis 스킬과 산업 검사용 Defect Image Generation 스킬이 소개된다.

Physical AI Dataset NVIDIA는 Hugging Face에서 1,500만 회 다운로드를 넘어섰다. 이 스킬들은 GitHub와 NVIDIA Brev에서 사용 가능하며, H100용 무료 체험 크레딧이 제공된다.

🔗 NVIDIA CVPR 2026 Physical AI


NVIDIA Transaction Foundation Models — Revolut, Mastercard, Adyen, Stripe

6월 1일 — NVIDIA는 대형 금융기관들이 어떻게 transaction foundation models — 수십억 개의 독점 금융 이벤트로 학습된 파운데이션 모델 — 쪽으로 수렴하고 있는지 설명한다.

기관접근 방식핵심 결과
RevolutPRAGMA — 240억 이벤트, 2,600만 사용자, 100개 이상 국가단일 모델이 특화 모델(사기, 신용, 추천)을 능가
Mastercard수십억 건의 거래를 위한 대형 테이블형 모델(NVIDIA NeMo AutoModel)적용 분야: 사기, 신용, 로열티
Adyen1조 달러 규모의 결제에 배포된 모델, 전환을 위한 RL”승인율 0.1% = 막대한 영향”
Stripe거래 행동 컨텍스트연간 1,120억 달러의 사기 차단, 사기율 -38%

NVIDIA는 AWS SageMaker HyperPod와 Nebius AI Cloud에서 사용할 수 있는 개발 예제 “Build Your Own Transaction Foundation Model”도 제공한다.

🔗 NVIDIA Transaction Foundation Models


Anthropic — Partner Network, 사이버 위협 및 Claude Code /fork

Claude Partner Network — Services Track 및 Partner Hub

6월 3일 — Anthropic은 두 개의 새로운 구조인 Services TrackClaude Partner Hub를 통해 파트너 네트워크를 확장한다.

Services Track은 Claude를 실제로 얼마나 잘 활용하는지 기준으로 파트너 회사를 세 단계로 평가하는 시스템이다.

등급활성 인증배포된 고객공개 추천사
Select10+2+ (12개월)1+
Preferred100+15+3+
Global Premier1,000+100+ (3개 지역)15+

Claude Partner Hub는 각 파트너의 진행 상황을 매일 업데이트하는 포털이며, Claude에서 Hub 정보를 직접 조회할 수 있는 MCP 커넥터를 제공한다.

핵심 수치: 파트너 교육에 1억 달러 투자, 3월 출시 이후 4만+ 지원, 현재까지 1만+ 인증 컨설턴트. 참여 중인 회사로는 Accenture(3만 명 교육), Deloitte(47만 명), KPMG(27만 6천+), Cognizant, PwC가 있다.

🔗 Services Track 및 Partner Hub


MITRE ATT&CK 보고서 — AI가 활성화한 1년간의 사이버 위협

6월 3일 — Anthropic의 Frontier Red Team은 2025년 3월부터 2026년 3월 사이에 차단된 832개 계정을 분석한 보고서를 공개했으며, 이를 MITRE ATT&CK 프레임워크에 매핑했다.

세 가지 주요 결론:

지표수치
분석된 계정 수832 (2025년 3월 – 2026년 3월)
악성코드 작성에 AI 사용560/832 (67.3%)
기간 초반 중간+ 위험 행위자 비율33%
기간 종료 시 중간+ 위험 행위자 비율56% (+1.7×)
해체된 스파이 활동 작전2025년 11월 — 최고 점수 100/100

에이전트 오케스트레이션 — 공격의 여러 단계를 자율적으로 연쇄 수행하는 모델 — 은 아직 MITRE ATT&CK 프레임워크에 포함되지 않는다. Anthropic은 이 프레임워크를 발전시키기 위해 MITRE와 논의를 시작했으며, Verizon의 DBIR 2026 보고서 후속으로 이 데이터를 공개한다.

🔗 Anthropic 보고서 — AI 사이버 위협


새로 바뀐 Claude Code /fork — 정확한 컨텍스트를 가진 백그라운드 에이전트

6월 3일 — Anthropic이 Claude Code에서 /fork의 동작을 변경한다. 새 /fork은 현재 세션의 컨텍스트(system prompt, 도구, 기록, 모델, prompt cache)를 정확히 상속하는 백그라운드 에이전트를 실행하고, 그 결과를 원래 세션으로 반환한다.

명령동작
/fork (새 기능)정확한 컨텍스트 + prompt cache를 가진 백그라운드 에이전트 실행 → 결과가 세션으로 반환됨
/branch (ex-/fork)transcript를 수동으로 제어되는 새 세션으로 복사

이 변화는 /fork를 Claude Code의 다중 에이전트 작업 모델로의 진화 속에 위치시킨다.

🔗 @ClaudeDevs의 트윗


OpenAI Blueprint — frontier AI의 민주적 거버넌스

6월 3일 — OpenAI는 미국이 frontier AI 시스템을 다루기 위한 지속 가능한 연방 프레임워크를 어떻게 구축할 수 있는지를 설명하는 공공 정책 문서(“blueprint”)를 공개한다.

3단계 전략:

  1. 국가 프레임워크 — 주(州) 법률의 떠오르는 합의안(California SB 53, New York RAISE Act, Illinois SB 315)에 기반하기
  2. CAISI 강화 — AI 안전 및 혁신 센터를 frontier AI 안전을 위한 핵심 연방 기관으로 만들기
  3. 국가 회복력 계획 — frontier AI가 초래하는 국가안보 및 공공 안전 과제에 대응해 정부를 동원하기

이 blueprint는 전날 백악관이 발표한 Executive Order “Promoting Advanced Artificial Intelligence Innovation and Security”에 뒤이어 나왔다.

🔗 OpenAI Blueprint


Gemini CLI v0.45.0 및 Wan 창작 도구

Gemini CLI v0.45.0

6월 3일 — Google은 대화 컨텍스트 관리의 핵심 구성요소인 ContextManager의 아키텍처 개편을 포함한 Gemini CLI의 안정 버전 v0.45.0을 출시해 견고성과 성능을 개선했다.

기능세부 정보
Context SimplificationContextManager의 대규모 개편
A2A Usage MetadataAgent-to-Agent 프로토콜에서 메타데이터 노출
Termux 수정무한 재시도 루프 해결(Android 환경)
PTY resize크기 조정 오류 수정
Topic updates충돌 방지를 위한 순차 실행 강제

🔗 Gemini CLI 변경 로그


Wan — 새로운 Extract Line Art 및 Render 스킬

6월 3일 — Alibaba Tongyi Lab의 비디오 및 이미지 모델 Wan이 두 가지 새로운 창작 도구를 출시했다: Extract Line Art(복잡한 비주얼을 깔끔하고 정확한 선화로 변환)과 Render(선화를 즉시 완성된 비주얼로 변환). 두 스킬 모두 create.wan.video/lab/skill에서 사용할 수 있다. 이 발표는 몇 시간 만에 거의 60만 조회를 기록했다.

🔗 Wan 발표


GPT-4.1이 Copilot에서 제거됨 — GPT-5.5로 대체

6월 2일 — GitHub는 모든 GitHub Copilot 경험(chat, inline 편집, ask 및 agent 모드, 코드 완성)에서 GPT-4.1의 비활성화를 공식화했으며, 이는 2026년 6월 1일부로 적용되었다. 권장 대안은 GPT-5.5다. Enterprise 관리자는 Copilot 설정의 모델 정책을 통해 GPT-5.5 접근을 활성화해야 한다. GPT-4.1 제거를 위해 수동 조치는 필요하지 않다.

🔗 GPT-4.1 deprecated


Azure Repos용 Copilot Code Review (기술 프리뷰)

6월 2일 — GitHub가 Azure Repos용 Copilot code review를 기술 프리뷰로 출시한다. 사용자는 Azure DevOps pull request에서 직접 Copilot 리뷰를 요청할 수 있다 — inline 댓글, 개선 제안, 문제 탐지 포함. Azure DevOps 고객에게는 GitHub Copilot 라이선스가 필요하지 않다. 사용량은 기존 Copilot 플랜과 무관하게 GitHub AI credits로 과금된다.

🔗 Copilot Code Review — Azure Repos


Cohere Co/plot — AI 연구를 위한 오픈 소스 시각화 도구

6월 3일 — Cohere Labs가 AI 연구자를 위한 오픈 소스 데이터 시각화 도구 co/plot을 공개했다. 이는 Tiny Aya(70개 이상의 언어를 지원하는 다국어 모델) 개발 과정에서 실제 필요에 의해 탄생했으며, co/plot은 Matplotlib의 한계(변경 시마다 전체 재실행)와 Figma의 한계(실제 데이터와 분리됨)를 해결한다.

이 도구는 실제 데이터에 기반하면서도 미리 정의되고 사용자 지정 가능한 스타일로 빠른 프로토타이핑을 제공한다. 오픈 사이언스 정신에 따라 공개되었으며 coplot.vercel.app에서 사용할 수 있다.

🔗 Cohere co/plot


브리프

  • Claude Code v2.1.161 — 새 버전: OTEL_RESOURCE_ATTRIBUTES를 메트릭 라벨로 사용, 부분 실패 시 독립적인 parallel tool calls, 개선된 Linux 클립보드(wl-copy/xclip/xsel), git worktree의 /autofix-pr 수정. 🔗 릴리스

  • Anthropic이 Executive Order AI를 지지 — Anthropic은 EO “Promoting Advanced Artificial Intelligence Innovation and Security”를 환영하며, 그 구현을 위해 백악관과 협력하겠다고 발표했다. 🔗 AnthropicAI 트윗

  • Eclipse의 GitHub Copilot — Business 및 Enterprise에서 BYOK 사용 가능, 새로워진 채팅 인터페이스, 스킬 및 프롬프트 파일, 생각 블록(Thinking blocks), 개선된 ABAP 지원. 🔗 Eclipse 변경 로그

  • NVIDIA Research CVPR — NVIDIA Research가 CVPR 2026에서 고급 파지, 지능형 자율주행, 대규모 에이전트 학습에 관한 연구를 발표했다. 🔗 NVIDIA Blog

  • Fun-Realtime-TTS #1 Speech Arena — Alibaba의 Fun-Realtime-TTS(TONGYI_SpeechAI 팀)가 Artificial Analysis의 Speech Arena Leaderboard에서 1위(Elo 1,219)를 차지했으며, Google Gemini 3.1 Flash TTS와 Inworld Realtime TTS-2를 앞섰다. 🔗 @Ali_TongyiLab 트윗

  • Go by Gopuff — AI 쇼핑 어시스턴트 — xAI와 공동 개발한 개인 쇼핑 어시스턴트 “Go by Gopuff” 출시. 몇 분 내 초고속 배송을 위해 Grok 모델(텍스트, 오디오, 이미지)로 구동된다. 🔗 xAI 발표

  • OpenAI 티저 “It’s time to fly.” — OpenAI가 영상이 포함된 고정 트윗 “It’s time to fly.”를 게시했다(68k+ 조회, @OpenAIDevs에 의해 리포스트). 스캔 당시 연결된 제품 페이지는 없었으며 — 아직 공개되지 않은 임박한 발표로 보인다. 🔗 @OpenAI 트윗


이것이 의미하는 것

오픈소스/오픈웨이트 흐름이 더 강해지고 있다. Gemma 4 12B(Apache 2.0, 엣지, 멀티모달)와 Ideogram 4.0(다운로드 가능한 가중치, 자유로운 파인튜닝)은 구조적 흐름을 보여준다: 주요 팀들이 관대한 라이선스 아래 경쟁력 있는 모델을 공개하며, 폐쇄형 제공과 오픈소스 대안 사이의 간극을 줄이고 있다. 개발자에게 6월 3일은 비전 모델과 이미지 모델의 최상위급 사례를 동시에 상업적 제약 없이 사용할 수 있는 드문 순간이다.

로컬/데스크톱 에이전트가 새로운 경쟁 전선이 되고 있다. Windows용 Perplexity Personal Computer는 머신에서 직접 실행되며, 기업이 민감한 데이터를 클라우드에 노출하지 않으면서도 에이전트의 자율성을 원한다는 분명한 수요에 응답한다. DeepMind의 Co-Scientist는 과학적 추론 파트너를 원하는 개별 연구자를 겨냥한다. 다중 에이전트 백그라운드 에이전트로 재구성된 Claude Code /fork은 이 그림을 완성한다: 세 개의 서로 다른 생태계(Perplexity, Google, Anthropic)가 모두 동일한 패러다임 — 풍부한 컨텍스트를 갖고 인간의 지속적 개입 없이 병렬로 일하는 에이전트 — 로 수렴하고 있다.

GitHub Copilot은 개발자 도구 시장에서 우위를 굳히고 있다. 6월의 흐름 — usage-based GA, Copilot Max, Code Review Medium, JetBrains CLI, session sync, BYOK air-gapped — 는 분리된 기능 묶음이 아니라 하나의 일관된 플랫폼이다. 모든 IDE와 모든 머신에서 접근 가능한 단일 에이전트, 그리고 팀별 필요에 맞춘 제어 수준(MCP, skills, 사고 노력)을 향해 나아가는 모델이다. GPT-4.1을 GPT-5.5로 대체한 것도 이러한 지속적 업그레이드 논리의 일부다.

Physical AI와 AI 인프라는 실제 경제에 뿌리내리고 있다. Stargate Michigan(1 GW, 노조 일자리 2,500개, 예상 세수 10억 달러)와 NVIDIA CVPR 2026(레벨 4 자율주행용 Alpamayo 2 Super 32B, 1,500만 다운로드의 Physical AI 데이터셋)은 AI가 순수 소프트웨어 범주를 벗어나 데이터센터, 자율주행차, 로보틱스 같은 고물리 강도 영역으로 들어가고 있음을 보여준다. 금융 기관들(Revolut, Mastercard, Adyen, Stripe)도 같은 논리를 따른다: 범용 API가 아니라 자사 독점 데이터로 학습된 파운데이션 모델이다.


출처