MiniMax publiceert M2.5, een open-source frontier-model dat 80.2% haalt op SWE-Bench Verified. Kling lanceert zijn 3.0-model met 1080p video en realistische dialoog. Op onderzoeksgebied rolt Perplexity Model Council uit om drie modellen gelijktijdig uit te voeren, en laat Deep Research draaien op Claude Opus 4.6. Mistral kondigt zijn grootste wereldwijde hackathon aan met $200K aan prijzen.
MiniMax M2.5 — open-source frontier-model
12 februari — MiniMax kondigt M2.5 aan, een open-source frontier-model ontworpen voor echte productiviteit. Het model toont state-of-the-art prestaties op vier kritieke gebieden: coderen, web search, agentic tool calls en kantoorwerk.
| Benchmark | Score | Categorie |
|---|---|---|
| SWE-Bench Verified | 80.2% | Oplossen van echte bugs |
| BrowseComp | 76.3% | Web search en navigatie |
| BFCL | 76.8% | Agentic tool calls |
| Office Work | Geoptimaliseerd | Documentproductiviteit |
De score van 80.2% op SWE-Bench Verified plaatst M2.5 bij de beste codeermodellen in alle categorieën. Op BrowseComp, de webnavigatie-benchmark van OpenAI, haalt het 76.3% — een teken van solide autonome zoekcapaciteit.
MiniMax claimt een uitvoering die 37% sneller is op complexe taken in vergelijking met concurrerende modellen, met een kostprijs van $1 USD per uur bij 100 tokens/seconde. Het verklaarde doel: het schalen van long-horizon agents economisch haalbaar maken.
Het model is beschikbaar via MiniMax Agent (agent.minimax.io) en de ontwikkelaars-API (platform.minimax.io). Als een open-source frontier-model positioneert M2.5 zich rechtstreeks tegenover de toonaangevende propriëtaire modellen.
MiniMax Forge — RL-framework voor productie-agents
12 februari — Parallel aan M2.5 publiceert MiniMax Forge, een schaalbaar framework en algoritme voor reinforcement learning (RL) om AI-agents voor productie te trainen.
Forge pakt een terugkerend probleem aan bij het trainen van agents: de instabiliteit van leren op grote schaal. Het framework biedt een geoptimaliseerde aanpak voor reward modeling van agents, gericht op ML-ontwikkelaars en onderzoekers die autonome agents inzetten.
De dubbele aankondiging M2.5 + Forge signaleert de ambitie van MiniMax om een complete stack voor AI-agents aan te bieden: frontier-model + trainingsframework.
Kling 3.0 — « Everyone a Director »
1 februari — Kling AI lanceert zijn 3.0-model, een grote update van zijn videogeneratie-engine gepositioneerd rond het concept « Everyone a Director ». Het model is bedoeld om filmische creatie toegankelijk te maken zonder technische expertise.
De belangrijkste verbeteringen betreffen de visuele kwaliteit en het realisme van menselijke interacties:
| Capaciteit | Detail |
|---|---|
| Resolutie | 1080p native |
| Dialoog | Realistische gezichtsuitdrukkingen en gebaren |
| Coherentie | Visuele stijl behouden over lange sequenties |
| Flexibiliteit | Van eenvoudige prompt tot volledig filmisch storyboard |
De feedback van de creatieve gemeenschap is positief, met name over het realisme van de dialogen en het vermogen om scènes met overtuigende menselijke interacties te produceren — een historisch zwak punt van AI-videomodellen.
Perplexity lanceert Model Council — multi-model search
5 februari — Perplexity rolt Model Council uit, een functie die dezelfde query gelijktijdig op drie frontier-modellen uitvoert en een enkel gesynthetiseerd antwoord produceert.
In plaats van handmatig te schakelen tussen modellen, lanceert Model Council de query parallel op Claude Opus 4.6, GPT 5.2 en Gemini 3.0. Een synthesizer-model analyseert de resultaten, lost conflicten tussen de antwoorden op en toont waar de modellen convergeren of divergeren.
| Gebruikscasus | Detail |
|---|---|
| Investering | Evenwichtige perspectieven op markten |
| Complexe beslissingen | Bedrijfsstrategie, grote aankopen |
| Brainstorming | Gediversifieerde creatieve ideeën |
| Verificatie | Informatie valideren met meer vertrouwen |
De functie is onmiddellijk beschikbaar op het web voor Perplexity Max-abonnees. De mobiele versie is in ontwikkeling.
Perplexity Deep Research gaat naar Opus 4.6
9 februari — Perplexity kondigt aan dat Deep Research nu op Claude Opus 4.6 draait, wat de state-of-the-art resultaten op interne en externe benchmarks verbetert. De upgrade versterkt de redeneercapaciteiten in diepgaand onderzoek.
De functie is onmiddellijk beschikbaar voor Max-gebruikers, met een geleidelijke uitrol naar Pro-gebruikers.
🔗 Aankondiging Deep Research Opus 4.6
Perplexity publiceert DRACO Benchmark als open-source
4 februari — Perplexity maakt DRACO openbaar, een open-source benchmark ontworpen om tools voor diepgaand onderzoek (Deep Research). De rubrics en de volledige methodologie zijn openbaar beschikbaar.
DRACO valideert dat Perplexity Deep Research state-of-the-art prestaties behaalt op externe benchmarks, en andere tools voor diepgaand onderzoek overtreft in nauwkeurigheid en betrouwbaarheid.
Mistral kondigt zijn grootste hackathon aan — $200K aan prijzen
10 februari — Mistral AI lanceert zijn grootste wereldwijde hackathon ooit georganiseerd, gepland van 28 februari tot 1 maart 2026.
| Detail | Informatie |
|---|---|
| Formaat | 48 uur |
| Locaties | Parijs, Londen, New York, San Francisco, Tokio, Singapore, Sydney + online |
| Prijzen | $200K aan beloningen |
| Partners | NVIDIA, AWS, Weights & Biases, Hugging Face |
| Speciale prijzen | ElevenLabs, Hugging Face |
Het evenement vindt gelijktijdig plaats in 8 steden en online. De lijst van partners (NVIDIA, AWS, WandB, Hugging Face) signaleert het vertrouwen van het grote AI-ecosysteem in het Mistral-platform.
🔗 Aankondiging Mistral Hackathon
Cohere tekent Magnus Carlsen als ambassadeur
13 februari — Cohere kondigt een partnerschap aan met Magnus Carlsen, vijfvoudig wereldkampioen schaken en nummer 1 van de wereld, als wereldwijde merkambassadeur.
Carlsen zal deelnemen aan zichtbaarheidscampagnes, thought leadership-initiatieven en high-profile evenementen van Cohere. Het partnerschap heeft als doel de parallellen te illustreren tussen strategie bij schaken en de benadering van Cohere ten aanzien van Enterprise AI: focus op de basis, anticipatie en duurzame voordelen.
🔗 Aankondiging Cohere + Magnus Carlsen
In het kort
12 februari — Runway lanceert Story Panels, een nieuwe workflow die het mogelijk maakt om volledige films of advertenties te maken van één enkele afbeelding, met coherentie van personages, locaties en stijl.
12-13 februari — Mooncake, een PyTorch-geheugenallocator mede-ontwikkeld door Moonshot AI (Kimi) en Tsinghua University, sluit zich aan bij het PyTorch-ecosysteem. De tool optimaliseert de reductie van geheugenpieken en fragmentatie, relevant voor de implementatie van long-context LLM’s.
9 februari — Ideogram benadrukt zijn beeldbewerking via prompt in natuurlijke taal, waardoor het mogelijk is om gegenereerde afbeeldingen aan te passen via eenvoudige tekstinstructies.
30 januari — Perplexity integreert Kimi K2.5, het open-source redeneermodel van Moonshot AI, voor zijn Pro- en Max-abonnees. De inferentie draait op de eigen infrastructuur van Perplexity in de Verenigde Staten.
4 februari — MiniMax en Hyperbond Studio kondigen een partnerschap aan om conversationele AI-metgezellen te ontwikkelen met « Call Me Sensei », gebruikmakend van de LLM’s en agent API’s van MiniMax.
Wat dit betekent
De eerste helft van februari 2026 bevestigt verschillende fundamentele trends. MiniMax M2.5 bewijst dat een minder bekende speler een open-source model kan publiceren dat rivaliseert met de leiders op codeer-benchmarks — 80.2% op SWE-Bench Verified is een opmerkelijke score voor een open model. Met Forge als aanvulling biedt MiniMax een complete agents-stack.
Perplexity versnelt zijn differentiatie met Model Council, een pragmatische aanpak die erkent dat geen enkel model alle gebruikscasussen domineert. De integratie van Opus 4.6 in Deep Research en de publicatie van DRACO als open-source versterken de transparantie en geloofwaardigheid van het platform.
Kling 3.0 markeert een vooruitgang in videogeneratie met realistische dialogen — een stap richting toegankelijke filmische productietools. Aan de gemeenschapskant toont de Mistral-hackathon van $200K in 8 steden de volwassenheid van het Europese open-source ecosysteem.