Perplexity Computer가 순항 속도에 진입하고, GLM-5.2가 Together AI에서 무료로 제공되며, 에이전틱 코드 도구가 등장

2026년 6월 21일 주말은 서로 다른 두 가지 흐름을 집약한다. 한편으로 Perplexity Computer는 작업 스레드에 Deep Research와 새로운 탐색 도구를 통합하며 깊이를 더하고, 다른 한편으로 Together AI는 GLM-5.2를 무료로 제공하는 동시에 OpenRouter에서 이 모델의 가장 빠른 추론 제공업체임을 내세운다. 코드 도구 측면에서는 Amp가 자사의 하위 에이전트 Librarian을 크게 개선하고 Custom Agents를 도입하는 한편, v0는 Annotations 모드로 사용자 피드백을 간소화한다.

Perplexity Computer — Deep Research 통합, command panel, 그리고 forking

6월 19일 — Perplexity가 에이전트형 리서치 플랫폼인 Computer의 대폭적인 업데이트를 공개했다. 가장 큰 신규 기능은 Deep Research가 이제 Computer 작업 스레드에서 직접 사용 가능하다는 점이다. 심층 검색 결과는 환경을 벗어나지 않고도 보고서, 스프레드시트, 프레젠테이션, 대시보드, 웹사이트 또는 워크플로로 변환할 수 있다. Perplexity는 “Search as Code”라는 이름의 인프라 덕분에 Computer 내 Deep Research가 최신 벤치마크에서 경쟁 제품을 능가한다고 밝힌다.

기능	설명
Computer의 Deep Research	같은 스레드 안에서 보고서, 스프레드시트, dashboard 또는 workflow로 변환 가능한 심층 검색
Command panel	검색 상자에서 `/`를 통해 모든 모드와 스킬에 빠르게 접근
Forking	전체 컨텍스트를 유지한 채 새 질문으로 스레드를 분기
Inline actions	확인, 명확화, 연결을 검색 상자 안으로 직접 끌어올림
Computer Analytics API	사용량(크레딧, artefacts, workflows, 지속 시간)을 시계열로 조회 — Enterprise
Custom credit limits	관리자(admin)가 멤버 또는 팀별 크레딧 한도를 정의 가능 — Enterprise

/로 접근할 수 있는 command panel은 사용 가능한 모든 모드와 스킬(Deep Research, Plan Mode, 사용자 지정 skills, 조직 skills)을 한곳에 모은다. forking은 원래 스레드의 컨텍스트와 artefacts에 대한 접근을 유지하면서 별도의 스레드에서 후속 질문을 탐색할 수 있게 해 주는 기능으로, 복잡한 프로젝트를 반복 개선할 때 유용한 비회귀 메커니즘이다.

Analytics API와 custom credit limits 기능은 조직을 겨냥한다. 이제 관리자는 API를 통해 Computer 사용량을 모니터링할 수 있고(Snowflake, Hex, Metabase 또는 스프레드시트와 호환), 역할이나 팀별로 크레딧 할당량을 정의할 수 있다.

🔗 Perplexity 변경 기록 — Deep Research, command panel, forking

Together AI가 GLM-5.2를 무료로 배포하고 OpenRouter에서 우위를 점하다

6월 21일 — Together AI가 Z.ai / Zhipu가 MIT 라이선스로 공개한 오픈소스 모델 GLM-5.2를 자사 플랫폼에 배포한다고 발표했다. 이 모델은 API 설정 없이 Together Chat을 통해 무료로 이용할 수 있으며, 북미 지역의 보안 인프라에서 실행된다.

모델	게시자	라이선스	Together AI 접근 방식
GLM-5.2	Z.ai (Zhipu)	MIT (open-source)	무료 — Together Chat, API 설정 없음

이와 함께 Together AI는 OpenRouter에서 GLM-5.2의 가장 빠른 추론 제공업체라고 주장하며, 지연 시간을 유지하면서 GPU당 토큰 수를 극대화하기 위해 장문 컨텍스트 작업 부하(coding, agents)에 집중적으로 최적화했다고 밝힌다.

“Everyone’s trying to find where to test GLM-5.2. You can try it free on Together Chat (link below). No API setup. Just pick GLM-5.2 and start prompting. Served by Together AI on secure North American infrastructure.”

🇰🇷 “많은 분들이 GLM-5.2를 어디서 시험해 볼 수 있는지 찾고 있습니다. 아래 링크의 Together Chat에서 무료로 사용해 보실 수 있습니다. API 설정은 필요 없습니다. GLM-5.2를 선택하고 바로 시작하면 됩니다. Together AI가 북미의 보안 인프라에서 제공합니다.” — @togethercompute

🔗 Together AI — OpenRouter에서 가장 빠른 GLM-5.2 서버

AI 코드 도구 — Amp가 Librarian을 가속화하고 Custom Agents를 출시, v0는 Annotations를 도입

Amp — Librarian 3배 더 빠르고 43% 더 저렴해짐

6월 18일 — Amp가 GitHub에서 코드 검색을 담당하는 하위 에이전트 Librarian을 개선했다. 새 버전은 이전 버전보다 약 3배 더 빠르고 43% 더 저렴하다.

지표	변화
속도	~3배 더 빠름
비용	−43%

Librarian은 심볼, 함수 또는 pattern을 찾기 위해 대규모 코드베이스를 탐색하는 Amp의 내부 에이전트다. 이러한 성능 향상은 코드 검색이 자주 필요한 워크플로에 직접적인 이점을 제공한다.

🔗 Amp — 더 빠른 Librarian

Amp — Custom Agents: 플러그인이 에이전트를 생성하고 제어한다

6월 19일 — Amp가 Custom Agents로 플러그인 시스템을 확장했다. 이제 플러그인은 에이전트를 생성하고, 실행하고, 그 대화 스레드와 계속 상호작용할 수 있다. 이 기능을 통해 추가 인프라 없이 플러그인에서 바로 전문화된 에이전트를 구성할 수 있다.

실용적인 가치는 에이전틱 파이프라인의 구성성이다. 플러그인은 특정 작업(코드 리뷰, 테스트 생성, 의존성 분석)을 위한 전용 에이전트를 트리거하고, 그 결과를 같은 스레드에서 가져올 수 있다. 오케스트레이션하는 플러그인과 실행하는 에이전트의 분리는 명확하게 유지된다.

🔗 Amp — Custom Agents

v0 — Annotations 모드, 폼 내 질문, Apple/Google Pay

6월 19일 — v0(Vercel의 UI 생성 플랫폼)가 여러 새 기능을 공개했다.

기능	설명
Annotations mode	preview에서 요소를 클릭해 번호가 매겨진 댓글을 남기고, 이를 에이전트에 일괄 전송
In-form questions	v0의 명확화 질문이 프롬프트 폼에 표시됨(단일 선택, 다중 선택 또는 skip)
Apple Pay / Google Pay	v0 checkout에서 사용 가능
무제한 즐겨찾기	즐겨찾기 5개 제한 삭제
ZIP 다운로드	읽기 전용 멤버도 chat의 코드를 ZIP으로 다운로드 가능

Annotations 모드는 가장 주목할 만한 신규 기능이다. 시각적 문제를 산문으로 설명하는 대신, 사용자가 preview의 요소를 직접 클릭하고 번호가 매겨진 댓글을 남기면 된다. 모든 댓글은 에이전트에게 일괄 전송된다. 이 접근 방식은 텍스트 설명과 실제 의도 사이의 모호성을 줄여 준다.

🔗 v0 변경 기록

짧은 소식

Claude Code v2.1.185 (6월 20일) — 네트워크 속도 저하 시 표시되는 대기 메시지가 다음과 같이 바뀐다: “Waiting for API response · will retry in …”가 “No response from API · Retrying in …”를 대체한다. 트리거 지연은 10초에서 20초로 늘어난다. 🔗 CHANGELOG

이것이 의미하는 바

개발자를 위한 에이전트형 도구는 점점 더 높은 조합성을 갖추고 있다. Amp의 Custom Agents는 하나의 근본적인 흐름을 보여 준다. AI 개발 환경은 더 이상 단순히 LLM을 에디터에 넣는 데 그치지 않고, 플러그인이 전문화된 에이전트를 오케스트레이션할 수 있도록 하는 원시 요소를 노출하고 있다. Custom Agents가 제공하는 오케스트레이터/실행기 분리는 프로덕션 파이프라인에서 자리 잡고 있는 멀티에이전트 아키텍처에 해당하지만, 배포할 인프라 없이 플러그인 수준에서 접근 가능하게 만든다. Librarian 업데이트(3배, −43%)는 이러한 전문 에이전트 계층이 주 모델과 별개로 최적화될 수 있음을 보여 준다.

오픈소스 모델 추론 경쟁이 한층 격화되고 있다. Together AI가 OpenRouter에서 GLM-5.2의 가장 빠른 서버라는 위치를 적극적으로 홍보하는 것은, 추론 성능이 ML cloud 제공업체의 차별화된 상업적 요소가 되고 있음을 보여 준다. API 설정 없이 Together Chat을 통해 GLM-5.2를 무료로 제공하는 것은 고객 유치 전략이다. 개발자가 채팅을 통해 모델에 익숙해지면 유료 API로 전환하는 과정이 더 직접적이 된다. 이는 HuggingFace와 Replicate가 이전 오픈소스 모델에서 성공적으로 사용했던 방식이기도 하다.

리서치 에이전트 플랫폼은 기업용 통제 계층을 더하고 있다. Perplexity Computer의 새 기능들(Analytics API, 멤버별 credit limits, forking)은 이러한 도구의 조직 도입이 성숙 단계에 들어섰음을 보여 준다. 기업은 비용 통제, 사용 추적 가능성, 반복 작업 중 비회귀 보장을 필요로 한다. 특히 forking은 흥미롭다. 이는 초기 AI 검색 도구에는 없던 컨텍스트 관리 원시 요소로, 이러한 플랫폼을 협업 작업 환경(Git 브랜치, 분리된 토론 스레드)에 더 가깝게 만든다.