MiniMax M2.5 atinge 80% la SWE-Bench în open-source, Kling 3.0 transformă video AI, Perplexity lansează Model Council

MiniMax publică M2.5, un model frontier open-source care atinge 80.2% la SWE-Bench Verified. Kling lansează modelul său 3.0 cu video 1080p și dialog realist. Pe partea de cercetare, Perplexity implementează Model Council pentru a rula trei modele simultan și rulează Deep Research pe Claude Opus 4.6. Mistral anunță cel mai mare hackathon global al său cu premii de 200.000 $.

MiniMax M2.5 — model frontier open-source

12 februarie — MiniMax anunță M2.5, un model frontier open-source conceput pentru productivitate reală. Modelul afișează performanțe state-of-the-art în patru domenii critice: programare (coding), căutare web, apeluri de instrumente agentic și muncă de birou.

Benchmark	Scor	Categorie
SWE-Bench Verified	80.2%	Rezolvarea bug-urilor reale
BrowseComp	76.3%	Căutare și navigare web
BFCL	76.8%	Apeluri de instrumente agentic
Office Work	Optimizat	Productivitate documentară

Scorul de 80.2% la SWE-Bench Verified plasează M2.5 printre cele mai bune modele de programare, la toate categoriile. Pe BrowseComp, benchmark-ul de navigare web al OpenAI, atinge 76.3% — semn al unei capacități solide de căutare autonomă.

MiniMax revendică o execuție cu 37% mai rapidă pe sarcinile complexe comparativ cu modelele concurente, cu un cost de 1 $ USD pe oră la 100 de token-uri/secundă. Obiectivul declarat: a face scalarea agenților long-horizon viabilă economic.

Modelul este disponibil prin MiniMax Agent (agent.minimax.io) și API-ul pentru dezvoltatori (platform.minimax.io). Ca model frontier open-source, M2.5 se poziționează direct în fața modelelor proprietare de top.

🔗 Anunț MiniMax M2.5

MiniMax Forge — framework RL pentru agenți de producție

12 februarie — În paralel cu M2.5, MiniMax publică Forge, un framework și algoritm de învățare prin recompensă (RL) scalabil pentru antrenarea agenților IA de producție.

Forge abordează o problemă recurentă în antrenarea agenților: instabilitatea învățării la scară largă. Framework-ul propune o abordare optimizată pentru reward modeling-ul agenților, vizând dezvoltatorii și cercetătorii în ML care implementează agenți autonomi.

Dublul anunț M2.5 + Forge semnalează ambiția MiniMax de a propune un stack complet pentru agenții IA: model frontier + framework de antrenament.

🔗 Forge pe MiniMax News

Kling 3.0 — « Everyone a Director »

1 februarie — Kling AI lansează modelul său 3.0, o actualizare majoră a motorului său de generare video poziționată în jurul conceptului « Everyone a Director ». Modelul vizează să facă creația cinematică accesibilă fără expertiză tehnică.

Îmbunătățirile principale vizează calitatea vizuală și realismul interacțiunilor umane:

Capacitate	Detaliu
Rezoluție	1080p nativ
Dialog	Expresii faciale și gesturi realiste
Coerență	Stil vizual menținut pe secvențe lungi
Flexibilitate	De la prompt simplu la storyboard cinematic complet

Feedback-ul comunității creative este pozitiv, în special privind realismul dialogurilor și capacitatea de a produce scene cu interacțiuni umane convingătoare — un punct slab istoric al modelelor video IA.

🔗 Anunț Kling 3.0

Perplexity lansează Model Council — căutare multi-model

5 februarie — Perplexity implementează Model Council, o funcționalitate care execută aceeași interogare pe trei modele frontier simultan și produce un singur răspuns sintetizat.

În loc să comute manual între modele, Model Council lansează interogarea în paralel pe Claude Opus 4.6, GPT 5.2 și Gemini 3.0. Un model sintetizator analizează rezultatele, rezolvă conflictele dintre răspunsuri și arată unde modelele converg sau diverg.

Caz de utilizare	Detaliu
Investiții	Perspective echilibrate asupra piețelor
Decizii complexe	Strategie de afaceri, achiziții majore
Brainstorming	Idei creative diversificate
Verificare	Validarea informației cu încredere sporită

Funcționalitatea este disponibilă imediat pe web pentru abonații Perplexity Max. Versiunea mobilă este în dezvoltare.

🔗 Introducing Model Council

Perplexity Deep Research trece la Opus 4.6

9 februarie — Perplexity anunță că Deep Research rulează acum pe Claude Opus 4.6, îmbunătățind rezultatele state-of-the-art pe benchmark-urile interne și externe. Actualizarea întărește capacitățile de raționament în cercetarea aprofundată.

Funcționalitatea este disponibilă imediat pentru utilizatorii Max, cu o implementare progresivă către utilizatorii Pro.

🔗 Anunț Deep Research Opus 4.6

Perplexity publică DRACO Benchmark în open-source

4 februarie — Perplexity face public DRACO, un benchmark open-source conceput pentru a evalua instrumentele de cercetare aprofundată (Deep Research). Grilele de evaluare și metodologia completă sunt disponibile public.

DRACO validează faptul că Perplexity Deep Research atinge performanțe state-of-the-art pe benchmark-urile externe, depășind alte instrumente de cercetare aprofundată în precizie și fiabilitate.

🔗 Anunț DRACO

Mistral anunță cel mai mare hackathon al său — 200.000 $ premii

10 februarie — Mistral AI lansează cel mai mare hackathon global organizat vreodată, programat între 28 februarie și 1 martie 2026.

Detaliu	Informație
Format	48 de ore
Locații	Paris, Londra, New York, San Francisco, Tokyo, Singapore, Sydney + online
Premii	200.000 $ în recompense
Parteneri	NVIDIA, AWS, Weights & Biases, Hugging Face
Premii speciale	ElevenLabs, Hugging Face

Evenimentul se desfășoară simultan în 8 orașe și online. Lista de parteneri (NVIDIA, AWS, WandB, Hugging Face) semnalează încrederea ecosistemului IA major față de platforma Mistral.

🔗 Anunț Mistral Hackathon

Cohere semnează cu Magnus Carlsen ca ambasador

13 februarie — Cohere anunță un parteneriat cu Magnus Carlsen, cvintuplu Campion Mondial la șah și numărul 1 mondial, ca ambasador global al brandului.

Carlsen va participa la campaniile de vizibilitate, inițiativele de thought leadership și evenimentele high-profile ale Cohere. Parteneriatul vizează să ilustreze paralelele între strategia la șah și abordarea Cohere în materie de Enterprise AI: focus pe fundamente, anticipare și avantaje durabile.

🔗 Anunț Cohere + Magnus Carlsen

Pe scurt

12 februarie — Runway lansează Story Panels, un nou workflow care permite crearea de filme sau reclame complete dintr-o singură imagine, cu coerența personajelor, locurilor și stilului.

🔗 Runway Story Panels

12-13 februarie — Mooncake, un alocator de memorie PyTorch co-dezvoltat de Moonshot AI (Kimi) și Universitatea Tsinghua, se alătură ecosistemului PyTorch. Instrumentul optimizează reducerea vârfurilor de memorie și fragmentarea, relevant pentru implementarea LLM long-context.

🔗 Anunț Mooncake

9 februarie — Ideogram pune în evidență editarea de imagini prin prompt în limbaj natural, permițând modificarea imaginilor generate prin instrucțiuni textuale simple.

30 ianuarie — Perplexity integrează Kimi K2.5, modelul de raționament open-source de la Moonshot AI, pentru abonații săi Pro și Max. Inferența rulează pe infrastructura proprie a Perplexity în Statele Unite.

4 februarie — MiniMax și Hyperbond Studio anunță un parteneriat pentru a dezvolta companioni IA conversaționali cu « Call Me Sensei », folosind LLM-urile și API-urile agenților MiniMax.

Ce înseamnă asta

Prima jumătate a lunii februarie 2026 confirmă mai multe tendințe de fond. MiniMax M2.5 dovedește că un actor mai puțin mediatizat poate publica un model open-source care rivalizează cu liderii pe benchmark-urile de programare — 80.2% la SWE-Bench Verified este un scor remarcabil pentru un model deschis. Cu Forge ca o completare, MiniMax propune un stack complet pentru agenți.

Perplexity își accelerează diferențierea cu Model Council, o abordare pragmatică care recunoaște că niciun model unic nu domină toate cazurile de utilizare. Integrarea Opus 4.6 în Deep Research și publicarea DRACO în open-source întăresc transparența și credibilitatea platformei.

Kling 3.0 marchează un avans în generarea video cu dialoguri realiste — un pas către instrumente de producție cinematică accesibile. Pe partea de comunitate, hackathon-ul Mistral cu 200.000 $ în 8 orașe arată maturitatea ecosistemului open-source european.