MiniMax는 SWE-Bench Verified에서 80.2%를 달성한 프런티어 오픈 소스 모델 M2.5를 공개했습니다. Kling은 1080p 비디오와 현실적인 대화를 갖춘 3.0 모델을 출시했습니다. 검색 측면에서 Perplexity는 세 가지 모델을 동시에 실행하는 Model Council을 배포하고, Claude Opus 4.6에서 Deep Research를 구동합니다. Mistral은 20만 달러 상금 규모의 세계 최대 해커톤을 발표했습니다.
MiniMax M2.5 — 프런티어 오픈 소스 모델
2월 12일 — MiniMax는 실제 생산성을 위해 설계된 프런티어 오픈 소스 모델 M2.5를 발표했습니다. 이 모델은 코딩, 웹 검색, 에이전트 도구 호출(agentic tool calling), 사무 업무 등 네 가지 핵심 영역에서 최첨단(state-of-the-art) 성능을 보여줍니다.
| Benchmark | Score | Catégorie |
|---|---|---|
| SWE-Bench Verified | 80.2% | 실제 버그 해결 |
| BrowseComp | 76.3% | 웹 검색 및 탐색 |
| BFCL | 76.8% | 에이전트 도구 호출 |
| Office Work | 최적화됨 | 문서 생산성 |
SWE-Bench Verified에서 80.2%라는 점수는 M2.5를 모든 카테고리를 통틀어 최고의 코딩 모델 중 하나로 위치시킵니다. OpenAI의 웹 탐색 benchmark인 BrowseComp에서는 76.3%에 도달하여 강력한 자율 검색 능력을 보여줍니다.
MiniMax는 복잡한 작업에서 경쟁 모델보다 37% 더 빠른 실행 속도를 자랑하며, 비용은 100 tokens/초 속도에서 시간당 1달러(USD)입니다. 목표는 장기(long-horizon) 에이전트의 확장을 경제적으로 실행 가능하게 만드는 것입니다.
이 모델은 MiniMax Agent(agent.minimax.io)와 개발자 API(platform.minimax.io)를 통해 사용할 수 있습니다. 프런티어 오픈 소스 모델로서 M2.5는 주요 독점 모델들과 직접 경쟁하는 위치에 있습니다.
MiniMax Forge — 프로덕션 에이전트를 위한 RL 프레임워크
2월 12일 — M2.5와 함께 MiniMax는 프로덕션 AI 에이전트를 훈련하기 위한 확장 가능한 강화 학습(RL) 프레임워크 및 알고리즘인 Forge를 공개했습니다.
Forge는 에이전트 훈련에서 반복적으로 발생하는 문제인 대규모 학습의 불안정성을 해결합니다. 이 프레임워크는 자율 에이전트를 배포하는 개발자와 ML 연구원을 대상으로 에이전트 보상 모델링(reward modeling)에 최적화된 접근 방식을 제안합니다.
M2.5와 Forge의 동시 발표는 AI 에이전트를 위한 전체 스택(프런티어 모델 + 훈련 프레임워크)을 제공하려는 MiniMax의 야망을 보여줍니다.
Kling 3.0 — « Everyone a Director »
2월 1일 — Kling AI는 비디오 생성 엔진의 주요 업데이트인 3.0 모델을 출시했습니다. 이는 “Everyone a Director(모두가 감독)“라는 컨셉을 중심으로 합니다. 이 모델은 기술적 전문 지식 없이도 영화 제작에 접근할 수 있도록 하는 것을 목표로 합니다.
주요 개선 사항은 시각적 품질과 인간 상호 작용의 현실감에 있습니다.
| Capacité | Détail |
|---|---|
| 해상도 | 네이티브 1080p |
| 대화 | 현실적인 표정과 제스처 |
| 일관성 | 긴 시퀀스에서도 시각적 스타일 유지 |
| 유연성 | 단순한 프롬프트부터 전체 영화 스토리보드까지 |
창작 커뮤니티의 피드백은 긍정적이며, 특히 대화의 현실감과 설득력 있는 인간 상호 작용이 포함된 장면을 제작할 수 있는 능력(AI 비디오 모델의 역사적인 약점)에 대해 높이 평가하고 있습니다.
Perplexity, Model Council 출시 — 멀티 모델 검색
2월 5일 — Perplexity는 동일한 쿼리를 세 개의 프런티어 모델에서 동시에 실행하고 통합된 단일 답변을 생성하는 기능인 Model Council을 배포했습니다.
수동으로 모델을 전환하는 대신, Model Council은 Claude Opus 4.6, GPT 5.2, Gemini 3.0에서 쿼리를 병렬로 실행합니다. 합성 모델(synthesizer model)이 결과를 분석하고, 답변 간의 충돌을 해결하며, 모델이 수렴하거나 발산하는 지점을 보여줍니다.
| Cas d’usage | Détail |
|---|---|
| 투자 | 시장에 대한 균형 잡힌 관점 |
| 복잡한 의사 결정 | 기업 전략, 주요 구매 |
| 브레인스토밍 | 다양한 창의적 아이디어 |
| 검증 | 더 높은 신뢰도로 정보 검증 |
이 기능은 Perplexity Max 가입자를 위해 웹에서 즉시 사용할 수 있습니다. 모바일 버전은 개발 중입니다.
Perplexity Deep Research, Opus 4.6으로 전환
2월 9일 — Perplexity는 Deep Research가 이제 Claude Opus 4.6에서 작동한다고 발표하여, 내부 및 외부 benchmark에서 최첨단(state-of-the-art) 결과를 개선했습니다. 이번 업그레이드는 심층 연구에서의 추론 능력을 강화합니다.
이 기능은 Max 사용자에게 즉시 제공되며, Pro 사용자에게도 점진적으로 배포될 예정입니다.
🔗 Annonce Deep Research Opus 4.6
Perplexity, DRACO Benchmark 오픈 소스로 공개
2월 4일 — Perplexity는 심층 연구(Deep Research) 도구를 평가하기 위해 설계된 오픈 소스 benchmark인 DRACO를 공개했습니다. 평가 기준과 전체 방법론이 공개되었습니다.
DRACO는 Perplexity Deep Research가 외부 benchmark에서 최첨단(state-of-the-art) 성능을 달성했으며, 정확성과 신뢰성 면에서 다른 심층 연구 도구를 능가함을 검증합니다.
Mistral, 사상 최대 해커톤 발표 — 상금 20만 달러
2월 10일 — Mistral AI는 2026년 2월 28일부터 3월 1일까지 열리는, 지금까지 조직된 것 중 세계 최대 규모의 해커톤을 발표했습니다.
| Détail | Information |
|---|---|
| 형식 | 48시간 |
| 장소 | 파리, 런던, 뉴욕, 샌프란시스코, 도쿄, 싱가포르, 시드니 + 온라인 |
| 상금 | 20만 달러 보상 |
| 파트너 | NVIDIA, AWS, Weights & Biases, Hugging Face |
| 특별상 | ElevenLabs, Hugging Face |
이 행사는 8개 도시와 온라인에서 동시에 진행됩니다. 파트너 목록(NVIDIA, AWS, WandB, Hugging Face)은 주요 AI 생태계가 Mistral 플랫폼에 보내는 신뢰를 보여줍니다.
Cohere, Magnus Carlsen과 앰버서더 계약
2월 13일 — Cohere는 체스 세계 챔피언이자 세계 랭킹 1위인 Magnus Carlsen과 글로벌 브랜드 앰버서더 파트너십을 맺었다고 발표했습니다.
Carlsen은 Cohere의 인지도 향상 캠페인, 사고 리더십(thought leadership) 이니셔티브 및 주요 행사에 참여할 예정입니다. 이 파트너십은 체스 전략과 Cohere의 엔터프라이즈 AI 접근 방식(기본에 충실, 수 읽기, 지속적인 이점) 간의 유사점을 보여주는 것을 목표로 합니다.
🔗 Annonce Cohere + Magnus Carlsen
뉴스 브리핑
2월 12일 — Runway는 단일 이미지에서 완전한 영화나 광고를 제작할 수 있는 새로운 워크플로 Story Panels를 출시했습니다. 캐릭터, 장소 및 스타일의 일관성이 유지됩니다.
2월 12-13일 — Moonshot AI(Kimi)와 칭화 대학이 공동 개발한 PyTorch 메모리 할당자 Mooncake가 PyTorch 생태계에 합류했습니다. 이 도구는 메모리 피크 감소 및 단편화를 최적화하며, 긴 컨텍스트(long-context) LLM 배포와 관련이 있습니다.
2월 9일 — Ideogram은 자연어 프롬프트를 통한 이미지 편집을 강조하여, 간단한 텍스트 지시로 생성된 이미지를 수정할 수 있게 했습니다.
1월 30일 — Perplexity는 Pro 및 Max 가입자를 위해 Moonshot AI의 오픈 소스 추론 모델 Kimi K2.5를 통합했습니다. 추론은 미국에 있는 Perplexity 자체 인프라에서 실행됩니다.
2월 4일 — MiniMax와 Hyperbond Studio는 MiniMax의 LLM 및 에이전트 API를 사용하여 “Call Me Sensei”라는 대화형 AI 컴패니언을 개발하기 위한 파트너십을 발표했습니다.
의미하는 바
2026년 2월 상반기는 몇 가지 근본적인 트렌드를 확인시켜 주었습니다. MiniMax M2.5는 덜 알려진 기업도 코딩 benchmark에서 선두 주자와 경쟁하는 오픈 소스 모델을 출시할 수 있음을 증명했습니다. SWE-Bench Verified에서 80.2%는 오픈 모델로서는 놀라운 점수입니다. Forge를 보완적으로 갖춤으로써 MiniMax는 완전한 에이전트 스택을 제안합니다.
Perplexity는 단일 모델이 모든 사용 사례를 지배하지 않는다는 실용적인 접근 방식인 Model Council을 통해 차별화를 가속화하고 있습니다. Deep Research에 Opus 4.6을 통합하고 DRACO를 오픈 소스로 공개한 것은 플랫폼의 투명성과 신뢰성을 강화합니다.
Kling 3.0은 현실적인 대화를 갖춘 비디오 생성의 진보를 보여주며, 이는 접근 가능한 영화 제작 도구로 나아가는 한 걸음입니다. 커뮤니티 측면에서는 8개 도시에서 열리는 상금 20만 달러 규모의 Mistral 해커톤이 유럽 오픈 소스 생태계의 성숙도를 보여줍니다.