ai-powered-markdown-translatorgpt-5.4-mini로 fr에서 ko로 번역된 기사.
2026년 6월 21일 주말은 서로 다른 두 가지 흐름을 집약한다. 한편으로 Perplexity Computer는 작업 스레드에 Deep Research와 새로운 탐색 도구를 통합하며 깊이를 더하고, 다른 한편으로 Together AI는 GLM-5.2를 무료로 제공하는 동시에 OpenRouter에서 이 모델의 가장 빠른 추론 제공업체임을 내세운다. 코드 도구 측면에서는 Amp가 자사의 하위 에이전트 Librarian을 크게 개선하고 Custom Agents를 도입하는 한편, v0는 Annotations 모드로 사용자 피드백을 간소화한다.
Perplexity Computer — Deep Research 통합, command panel, 그리고 forking
6월 19일 — Perplexity가 에이전트형 리서치 플랫폼인 Computer의 대폭적인 업데이트를 공개했다. 가장 큰 신규 기능은 Deep Research가 이제 Computer 작업 스레드에서 직접 사용 가능하다는 점이다. 심층 검색 결과는 환경을 벗어나지 않고도 보고서, 스프레드시트, 프레젠테이션, 대시보드, 웹사이트 또는 워크플로로 변환할 수 있다. Perplexity는 “Search as Code”라는 이름의 인프라 덕분에 Computer 내 Deep Research가 최신 벤치마크에서 경쟁 제품을 능가한다고 밝힌다.
| 기능 | 설명 |
|---|---|
| Computer의 Deep Research | 같은 스레드 안에서 보고서, 스프레드시트, dashboard 또는 workflow로 변환 가능한 심층 검색 |
| Command panel | 검색 상자에서 /를 통해 모든 모드와 스킬에 빠르게 접근 |
| Forking | 전체 컨텍스트를 유지한 채 새 질문으로 스레드를 분기 |
| Inline actions | 확인, 명확화, 연결을 검색 상자 안으로 직접 끌어올림 |
| Computer Analytics API | 사용량(크레딧, artefacts, workflows, 지속 시간)을 시계열로 조회 — Enterprise |
| Custom credit limits | 관리자(admin)가 멤버 또는 팀별 크레딧 한도를 정의 가능 — Enterprise |
/로 접근할 수 있는 command panel은 사용 가능한 모든 모드와 스킬(Deep Research, Plan Mode, 사용자 지정 skills, 조직 skills)을 한곳에 모은다. forking은 원래 스레드의 컨텍스트와 artefacts에 대한 접근을 유지하면서 별도의 스레드에서 후속 질문을 탐색할 수 있게 해 주는 기능으로, 복잡한 프로젝트를 반복 개선할 때 유용한 비회귀 메커니즘이다.
Analytics API와 custom credit limits 기능은 조직을 겨냥한다. 이제 관리자는 API를 통해 Computer 사용량을 모니터링할 수 있고(Snowflake, Hex, Metabase 또는 스프레드시트와 호환), 역할이나 팀별로 크레딧 할당량을 정의할 수 있다.
🔗 Perplexity 변경 기록 — Deep Research, command panel, forking
Together AI가 GLM-5.2를 무료로 배포하고 OpenRouter에서 우위를 점하다
6월 21일 — Together AI가 Z.ai / Zhipu가 MIT 라이선스로 공개한 오픈소스 모델 GLM-5.2를 자사 플랫폼에 배포한다고 발표했다. 이 모델은 API 설정 없이 Together Chat을 통해 무료로 이용할 수 있으며, 북미 지역의 보안 인프라에서 실행된다.
| 모델 | 게시자 | 라이선스 | Together AI 접근 방식 |
|---|---|---|---|
| GLM-5.2 | Z.ai (Zhipu) | MIT (open-source) | 무료 — Together Chat, API 설정 없음 |
이와 함께 Together AI는 OpenRouter에서 GLM-5.2의 가장 빠른 추론 제공업체라고 주장하며, 지연 시간을 유지하면서 GPU당 토큰 수를 극대화하기 위해 장문 컨텍스트 작업 부하(coding, agents)에 집중적으로 최적화했다고 밝힌다.
“Everyone’s trying to find where to test GLM-5.2. You can try it free on Together Chat (link below). No API setup. Just pick GLM-5.2 and start prompting. Served by Together AI on secure North American infrastructure.”
🇰🇷 “많은 분들이 GLM-5.2를 어디서 시험해 볼 수 있는지 찾고 있습니다. 아래 링크의 Together Chat에서 무료로 사용해 보실 수 있습니다. API 설정은 필요 없습니다. GLM-5.2를 선택하고 바로 시작하면 됩니다. Together AI가 북미의 보안 인프라에서 제공합니다.” — @togethercompute
🔗 Together AI — OpenRouter에서 가장 빠른 GLM-5.2 서버
AI 코드 도구 — Amp가 Librarian을 가속화하고 Custom Agents를 출시, v0는 Annotations를 도입
Amp — Librarian 3배 더 빠르고 43% 더 저렴해짐
6월 18일 — Amp가 GitHub에서 코드 검색을 담당하는 하위 에이전트 Librarian을 개선했다. 새 버전은 이전 버전보다 약 3배 더 빠르고 43% 더 저렴하다.
| 지표 | 변화 |
|---|---|
| 속도 | ~3배 더 빠름 |
| 비용 | −43% |
Librarian은 심볼, 함수 또는 pattern을 찾기 위해 대규모 코드베이스를 탐색하는 Amp의 내부 에이전트다. 이러한 성능 향상은 코드 검색이 자주 필요한 워크플로에 직접적인 이점을 제공한다.
Amp — Custom Agents: 플러그인이 에이전트를 생성하고 제어한다
6월 19일 — Amp가 Custom Agents로 플러그인 시스템을 확장했다. 이제 플러그인은 에이전트를 생성하고, 실행하고, 그 대화 스레드와 계속 상호작용할 수 있다. 이 기능을 통해 추가 인프라 없이 플러그인에서 바로 전문화된 에이전트를 구성할 수 있다.
실용적인 가치는 에이전틱 파이프라인의 구성성이다. 플러그인은 특정 작업(코드 리뷰, 테스트 생성, 의존성 분석)을 위한 전용 에이전트를 트리거하고, 그 결과를 같은 스레드에서 가져올 수 있다. 오케스트레이션하는 플러그인과 실행하는 에이전트의 분리는 명확하게 유지된다.
v0 — Annotations 모드, 폼 내 질문, Apple/Google Pay
6월 19일 — v0(Vercel의 UI 생성 플랫폼)가 여러 새 기능을 공개했다.
| 기능 | 설명 |
|---|---|
| Annotations mode | preview에서 요소를 클릭해 번호가 매겨진 댓글을 남기고, 이를 에이전트에 일괄 전송 |
| In-form questions | v0의 명확화 질문이 프롬프트 폼에 표시됨(단일 선택, 다중 선택 또는 skip) |
| Apple Pay / Google Pay | v0 checkout에서 사용 가능 |
| 무제한 즐겨찾기 | 즐겨찾기 5개 제한 삭제 |
| ZIP 다운로드 | 읽기 전용 멤버도 chat의 코드를 ZIP으로 다운로드 가능 |
Annotations 모드는 가장 주목할 만한 신규 기능이다. 시각적 문제를 산문으로 설명하는 대신, 사용자가 preview의 요소를 직접 클릭하고 번호가 매겨진 댓글을 남기면 된다. 모든 댓글은 에이전트에게 일괄 전송된다. 이 접근 방식은 텍스트 설명과 실제 의도 사이의 모호성을 줄여 준다.
🔗 v0 변경 기록
짧은 소식
- Claude Code v2.1.185 (6월 20일) — 네트워크 속도 저하 시 표시되는 대기 메시지가 다음과 같이 바뀐다: “Waiting for API response · will retry in …”가 “No response from API · Retrying in …”를 대체한다. 트리거 지연은 10초에서 20초로 늘어난다. 🔗 CHANGELOG
이것이 의미하는 바
개발자를 위한 에이전트형 도구는 점점 더 높은 조합성을 갖추고 있다. Amp의 Custom Agents는 하나의 근본적인 흐름을 보여 준다. AI 개발 환경은 더 이상 단순히 LLM을 에디터에 넣는 데 그치지 않고, 플러그인이 전문화된 에이전트를 오케스트레이션할 수 있도록 하는 원시 요소를 노출하고 있다. Custom Agents가 제공하는 오케스트레이터/실행기 분리는 프로덕션 파이프라인에서 자리 잡고 있는 멀티에이전트 아키텍처에 해당하지만, 배포할 인프라 없이 플러그인 수준에서 접근 가능하게 만든다. Librarian 업데이트(3배, −43%)는 이러한 전문 에이전트 계층이 주 모델과 별개로 최적화될 수 있음을 보여 준다.
오픈소스 모델 추론 경쟁이 한층 격화되고 있다. Together AI가 OpenRouter에서 GLM-5.2의 가장 빠른 서버라는 위치를 적극적으로 홍보하는 것은, 추론 성능이 ML cloud 제공업체의 차별화된 상업적 요소가 되고 있음을 보여 준다. API 설정 없이 Together Chat을 통해 GLM-5.2를 무료로 제공하는 것은 고객 유치 전략이다. 개발자가 채팅을 통해 모델에 익숙해지면 유료 API로 전환하는 과정이 더 직접적이 된다. 이는 HuggingFace와 Replicate가 이전 오픈소스 모델에서 성공적으로 사용했던 방식이기도 하다.
리서치 에이전트 플랫폼은 기업용 통제 계층을 더하고 있다. Perplexity Computer의 새 기능들(Analytics API, 멤버별 credit limits, forking)은 이러한 도구의 조직 도입이 성숙 단계에 들어섰음을 보여 준다. 기업은 비용 통제, 사용 추적 가능성, 반복 작업 중 비회귀 보장을 필요로 한다. 특히 forking은 흥미롭다. 이는 초기 AI 검색 도구에는 없던 컨텍스트 관리 원시 요소로, 이러한 플랫폼을 협업 작업 환경(Git 브랜치, 분리된 토론 스레드)에 더 가깝게 만든다.