MiniMax publică M2.5, un model frontier open-source care atinge 80.2% la SWE-Bench Verified. Kling lansează modelul său 3.0 cu video 1080p și dialog realist. Pe partea de cercetare, Perplexity implementează Model Council pentru a rula trei modele simultan și rulează Deep Research pe Claude Opus 4.6. Mistral anunță cel mai mare hackathon global al său cu premii de 200.000 $.
MiniMax M2.5 — model frontier open-source
12 februarie — MiniMax anunță M2.5, un model frontier open-source conceput pentru productivitate reală. Modelul afișează performanțe state-of-the-art în patru domenii critice: programare (coding), căutare web, apeluri de instrumente agentic și muncă de birou.
| Benchmark | Scor | Categorie |
|---|---|---|
| SWE-Bench Verified | 80.2% | Rezolvarea bug-urilor reale |
| BrowseComp | 76.3% | Căutare și navigare web |
| BFCL | 76.8% | Apeluri de instrumente agentic |
| Office Work | Optimizat | Productivitate documentară |
Scorul de 80.2% la SWE-Bench Verified plasează M2.5 printre cele mai bune modele de programare, la toate categoriile. Pe BrowseComp, benchmark-ul de navigare web al OpenAI, atinge 76.3% — semn al unei capacități solide de căutare autonomă.
MiniMax revendică o execuție cu 37% mai rapidă pe sarcinile complexe comparativ cu modelele concurente, cu un cost de 1 $ USD pe oră la 100 de token-uri/secundă. Obiectivul declarat: a face scalarea agenților long-horizon viabilă economic.
Modelul este disponibil prin MiniMax Agent (agent.minimax.io) și API-ul pentru dezvoltatori (platform.minimax.io). Ca model frontier open-source, M2.5 se poziționează direct în fața modelelor proprietare de top.
MiniMax Forge — framework RL pentru agenți de producție
12 februarie — În paralel cu M2.5, MiniMax publică Forge, un framework și algoritm de învățare prin recompensă (RL) scalabil pentru antrenarea agenților IA de producție.
Forge abordează o problemă recurentă în antrenarea agenților: instabilitatea învățării la scară largă. Framework-ul propune o abordare optimizată pentru reward modeling-ul agenților, vizând dezvoltatorii și cercetătorii în ML care implementează agenți autonomi.
Dublul anunț M2.5 + Forge semnalează ambiția MiniMax de a propune un stack complet pentru agenții IA: model frontier + framework de antrenament.
Kling 3.0 — « Everyone a Director »
1 februarie — Kling AI lansează modelul său 3.0, o actualizare majoră a motorului său de generare video poziționată în jurul conceptului « Everyone a Director ». Modelul vizează să facă creația cinematică accesibilă fără expertiză tehnică.
Îmbunătățirile principale vizează calitatea vizuală și realismul interacțiunilor umane:
| Capacitate | Detaliu |
|---|---|
| Rezoluție | 1080p nativ |
| Dialog | Expresii faciale și gesturi realiste |
| Coerență | Stil vizual menținut pe secvențe lungi |
| Flexibilitate | De la prompt simplu la storyboard cinematic complet |
Feedback-ul comunității creative este pozitiv, în special privind realismul dialogurilor și capacitatea de a produce scene cu interacțiuni umane convingătoare — un punct slab istoric al modelelor video IA.
Perplexity lansează Model Council — căutare multi-model
5 februarie — Perplexity implementează Model Council, o funcționalitate care execută aceeași interogare pe trei modele frontier simultan și produce un singur răspuns sintetizat.
În loc să comute manual între modele, Model Council lansează interogarea în paralel pe Claude Opus 4.6, GPT 5.2 și Gemini 3.0. Un model sintetizator analizează rezultatele, rezolvă conflictele dintre răspunsuri și arată unde modelele converg sau diverg.
| Caz de utilizare | Detaliu |
|---|---|
| Investiții | Perspective echilibrate asupra piețelor |
| Decizii complexe | Strategie de afaceri, achiziții majore |
| Brainstorming | Idei creative diversificate |
| Verificare | Validarea informației cu încredere sporită |
Funcționalitatea este disponibilă imediat pe web pentru abonații Perplexity Max. Versiunea mobilă este în dezvoltare.
Perplexity Deep Research trece la Opus 4.6
9 februarie — Perplexity anunță că Deep Research rulează acum pe Claude Opus 4.6, îmbunătățind rezultatele state-of-the-art pe benchmark-urile interne și externe. Actualizarea întărește capacitățile de raționament în cercetarea aprofundată.
Funcționalitatea este disponibilă imediat pentru utilizatorii Max, cu o implementare progresivă către utilizatorii Pro.
🔗 Anunț Deep Research Opus 4.6
Perplexity publică DRACO Benchmark în open-source
4 februarie — Perplexity face public DRACO, un benchmark open-source conceput pentru a evalua instrumentele de cercetare aprofundată (Deep Research). Grilele de evaluare și metodologia completă sunt disponibile public.
DRACO validează faptul că Perplexity Deep Research atinge performanțe state-of-the-art pe benchmark-urile externe, depășind alte instrumente de cercetare aprofundată în precizie și fiabilitate.
Mistral anunță cel mai mare hackathon al său — 200.000 $ premii
10 februarie — Mistral AI lansează cel mai mare hackathon global organizat vreodată, programat între 28 februarie și 1 martie 2026.
| Detaliu | Informație |
|---|---|
| Format | 48 de ore |
| Locații | Paris, Londra, New York, San Francisco, Tokyo, Singapore, Sydney + online |
| Premii | 200.000 $ în recompense |
| Parteneri | NVIDIA, AWS, Weights & Biases, Hugging Face |
| Premii speciale | ElevenLabs, Hugging Face |
Evenimentul se desfășoară simultan în 8 orașe și online. Lista de parteneri (NVIDIA, AWS, WandB, Hugging Face) semnalează încrederea ecosistemului IA major față de platforma Mistral.
Cohere semnează cu Magnus Carlsen ca ambasador
13 februarie — Cohere anunță un parteneriat cu Magnus Carlsen, cvintuplu Campion Mondial la șah și numărul 1 mondial, ca ambasador global al brandului.
Carlsen va participa la campaniile de vizibilitate, inițiativele de thought leadership și evenimentele high-profile ale Cohere. Parteneriatul vizează să ilustreze paralelele între strategia la șah și abordarea Cohere în materie de Enterprise AI: focus pe fundamente, anticipare și avantaje durabile.
🔗 Anunț Cohere + Magnus Carlsen
Pe scurt
12 februarie — Runway lansează Story Panels, un nou workflow care permite crearea de filme sau reclame complete dintr-o singură imagine, cu coerența personajelor, locurilor și stilului.
12-13 februarie — Mooncake, un alocator de memorie PyTorch co-dezvoltat de Moonshot AI (Kimi) și Universitatea Tsinghua, se alătură ecosistemului PyTorch. Instrumentul optimizează reducerea vârfurilor de memorie și fragmentarea, relevant pentru implementarea LLM long-context.
9 februarie — Ideogram pune în evidență editarea de imagini prin prompt în limbaj natural, permițând modificarea imaginilor generate prin instrucțiuni textuale simple.
30 ianuarie — Perplexity integrează Kimi K2.5, modelul de raționament open-source de la Moonshot AI, pentru abonații săi Pro și Max. Inferența rulează pe infrastructura proprie a Perplexity în Statele Unite.
4 februarie — MiniMax și Hyperbond Studio anunță un parteneriat pentru a dezvolta companioni IA conversaționali cu « Call Me Sensei », folosind LLM-urile și API-urile agenților MiniMax.
Ce înseamnă asta
Prima jumătate a lunii februarie 2026 confirmă mai multe tendințe de fond. MiniMax M2.5 dovedește că un actor mai puțin mediatizat poate publica un model open-source care rivalizează cu liderii pe benchmark-urile de programare — 80.2% la SWE-Bench Verified este un scor remarcabil pentru un model deschis. Cu Forge ca o completare, MiniMax propune un stack complet pentru agenți.
Perplexity își accelerează diferențierea cu Model Council, o abordare pragmatică care recunoaște că niciun model unic nu domină toate cazurile de utilizare. Integrarea Opus 4.6 în Deep Research și publicarea DRACO în open-source întăresc transparența și credibilitatea platformei.
Kling 3.0 marchează un avans în generarea video cu dialoguri realiste — un pas către instrumente de producție cinematică accesibile. Pe partea de comunitate, hackathon-ul Mistral cu 200.000 $ în 8 orașe arată maturitatea ecosistemului open-source european.