MiniMax M2.5 bereikt 80% op SWE-Bench in open-source, Kling 3.0 transformeert AI-video, Perplexity lanceert Model Council

MiniMax publiceert M2.5, een open-source frontier-model dat 80.2% haalt op SWE-Bench Verified. Kling lanceert zijn 3.0-model met 1080p video en realistische dialoog. Op onderzoeksgebied rolt Perplexity Model Council uit om drie modellen gelijktijdig uit te voeren, en laat Deep Research draaien op Claude Opus 4.6. Mistral kondigt zijn grootste wereldwijde hackathon aan met $200K aan prijzen.

MiniMax M2.5 — open-source frontier-model

12 februari — MiniMax kondigt M2.5 aan, een open-source frontier-model ontworpen voor echte productiviteit. Het model toont state-of-the-art prestaties op vier kritieke gebieden: coderen, web search, agentic tool calls en kantoorwerk.

Benchmark	Score	Categorie
SWE-Bench Verified	80.2%	Oplossen van echte bugs
BrowseComp	76.3%	Web search en navigatie
BFCL	76.8%	Agentic tool calls
Office Work	Geoptimaliseerd	Documentproductiviteit

De score van 80.2% op SWE-Bench Verified plaatst M2.5 bij de beste codeermodellen in alle categorieën. Op BrowseComp, de webnavigatie-benchmark van OpenAI, haalt het 76.3% — een teken van solide autonome zoekcapaciteit.

MiniMax claimt een uitvoering die 37% sneller is op complexe taken in vergelijking met concurrerende modellen, met een kostprijs van $1 USD per uur bij 100 tokens/seconde. Het verklaarde doel: het schalen van long-horizon agents economisch haalbaar maken.

Het model is beschikbaar via MiniMax Agent (agent.minimax.io) en de ontwikkelaars-API (platform.minimax.io). Als een open-source frontier-model positioneert M2.5 zich rechtstreeks tegenover de toonaangevende propriëtaire modellen.

🔗 Aankondiging MiniMax M2.5

MiniMax Forge — RL-framework voor productie-agents

12 februari — Parallel aan M2.5 publiceert MiniMax Forge, een schaalbaar framework en algoritme voor reinforcement learning (RL) om AI-agents voor productie te trainen.

Forge pakt een terugkerend probleem aan bij het trainen van agents: de instabiliteit van leren op grote schaal. Het framework biedt een geoptimaliseerde aanpak voor reward modeling van agents, gericht op ML-ontwikkelaars en onderzoekers die autonome agents inzetten.

De dubbele aankondiging M2.5 + Forge signaleert de ambitie van MiniMax om een complete stack voor AI-agents aan te bieden: frontier-model + trainingsframework.

🔗 Forge op MiniMax News

Kling 3.0 — « Everyone a Director »

1 februari — Kling AI lanceert zijn 3.0-model, een grote update van zijn videogeneratie-engine gepositioneerd rond het concept « Everyone a Director ». Het model is bedoeld om filmische creatie toegankelijk te maken zonder technische expertise.

De belangrijkste verbeteringen betreffen de visuele kwaliteit en het realisme van menselijke interacties:

Capaciteit	Detail
Resolutie	1080p native
Dialoog	Realistische gezichtsuitdrukkingen en gebaren
Coherentie	Visuele stijl behouden over lange sequenties
Flexibiliteit	Van eenvoudige prompt tot volledig filmisch storyboard

De feedback van de creatieve gemeenschap is positief, met name over het realisme van de dialogen en het vermogen om scènes met overtuigende menselijke interacties te produceren — een historisch zwak punt van AI-videomodellen.

🔗 Aankondiging Kling 3.0

Perplexity lanceert Model Council — multi-model search

5 februari — Perplexity rolt Model Council uit, een functie die dezelfde query gelijktijdig op drie frontier-modellen uitvoert en een enkel gesynthetiseerd antwoord produceert.

In plaats van handmatig te schakelen tussen modellen, lanceert Model Council de query parallel op Claude Opus 4.6, GPT 5.2 en Gemini 3.0. Een synthesizer-model analyseert de resultaten, lost conflicten tussen de antwoorden op en toont waar de modellen convergeren of divergeren.

Gebruikscasus	Detail
Investering	Evenwichtige perspectieven op markten
Complexe beslissingen	Bedrijfsstrategie, grote aankopen
Brainstorming	Gediversifieerde creatieve ideeën
Verificatie	Informatie valideren met meer vertrouwen

De functie is onmiddellijk beschikbaar op het web voor Perplexity Max-abonnees. De mobiele versie is in ontwikkeling.

🔗 Introducing Model Council

Perplexity Deep Research gaat naar Opus 4.6

9 februari — Perplexity kondigt aan dat Deep Research nu op Claude Opus 4.6 draait, wat de state-of-the-art resultaten op interne en externe benchmarks verbetert. De upgrade versterkt de redeneercapaciteiten in diepgaand onderzoek.

De functie is onmiddellijk beschikbaar voor Max-gebruikers, met een geleidelijke uitrol naar Pro-gebruikers.

🔗 Aankondiging Deep Research Opus 4.6

Perplexity publiceert DRACO Benchmark als open-source

4 februari — Perplexity maakt DRACO openbaar, een open-source benchmark ontworpen om tools voor diepgaand onderzoek (Deep Research). De rubrics en de volledige methodologie zijn openbaar beschikbaar.

DRACO valideert dat Perplexity Deep Research state-of-the-art prestaties behaalt op externe benchmarks, en andere tools voor diepgaand onderzoek overtreft in nauwkeurigheid en betrouwbaarheid.

🔗 Aankondiging DRACO

Mistral kondigt zijn grootste hackathon aan — $200K aan prijzen

10 februari — Mistral AI lanceert zijn grootste wereldwijde hackathon ooit georganiseerd, gepland van 28 februari tot 1 maart 2026.

Detail	Informatie
Formaat	48 uur
Locaties	Parijs, Londen, New York, San Francisco, Tokio, Singapore, Sydney + online
Prijzen	$200K aan beloningen
Partners	NVIDIA, AWS, Weights & Biases, Hugging Face
Speciale prijzen	ElevenLabs, Hugging Face

Het evenement vindt gelijktijdig plaats in 8 steden en online. De lijst van partners (NVIDIA, AWS, WandB, Hugging Face) signaleert het vertrouwen van het grote AI-ecosysteem in het Mistral-platform.

🔗 Aankondiging Mistral Hackathon

Cohere tekent Magnus Carlsen als ambassadeur

13 februari — Cohere kondigt een partnerschap aan met Magnus Carlsen, vijfvoudig wereldkampioen schaken en nummer 1 van de wereld, als wereldwijde merkambassadeur.

Carlsen zal deelnemen aan zichtbaarheidscampagnes, thought leadership-initiatieven en high-profile evenementen van Cohere. Het partnerschap heeft als doel de parallellen te illustreren tussen strategie bij schaken en de benadering van Cohere ten aanzien van Enterprise AI: focus op de basis, anticipatie en duurzame voordelen.

🔗 Aankondiging Cohere + Magnus Carlsen

In het kort

12 februari — Runway lanceert Story Panels, een nieuwe workflow die het mogelijk maakt om volledige films of advertenties te maken van één enkele afbeelding, met coherentie van personages, locaties en stijl.

🔗 Runway Story Panels

12-13 februari — Mooncake, een PyTorch-geheugenallocator mede-ontwikkeld door Moonshot AI (Kimi) en Tsinghua University, sluit zich aan bij het PyTorch-ecosysteem. De tool optimaliseert de reductie van geheugenpieken en fragmentatie, relevant voor de implementatie van long-context LLM’s.

🔗 Aankondiging Mooncake

9 februari — Ideogram benadrukt zijn beeldbewerking via prompt in natuurlijke taal, waardoor het mogelijk is om gegenereerde afbeeldingen aan te passen via eenvoudige tekstinstructies.

30 januari — Perplexity integreert Kimi K2.5, het open-source redeneermodel van Moonshot AI, voor zijn Pro- en Max-abonnees. De inferentie draait op de eigen infrastructuur van Perplexity in de Verenigde Staten.

4 februari — MiniMax en Hyperbond Studio kondigen een partnerschap aan om conversationele AI-metgezellen te ontwikkelen met « Call Me Sensei », gebruikmakend van de LLM’s en agent API’s van MiniMax.

Wat dit betekent

De eerste helft van februari 2026 bevestigt verschillende fundamentele trends. MiniMax M2.5 bewijst dat een minder bekende speler een open-source model kan publiceren dat rivaliseert met de leiders op codeer-benchmarks — 80.2% op SWE-Bench Verified is een opmerkelijke score voor een open model. Met Forge als aanvulling biedt MiniMax een complete agents-stack.

Perplexity versnelt zijn differentiatie met Model Council, een pragmatische aanpak die erkent dat geen enkel model alle gebruikscasussen domineert. De integratie van Opus 4.6 in Deep Research en de publicatie van DRACO als open-source versterken de transparantie en geloofwaardigheid van het platform.

Kling 3.0 markeert een vooruitgang in videogeneratie met realistische dialogen — een stap richting toegankelijke filmische productietools. Aan de gemeenschapskant toont de Mistral-hackathon van $200K in 8 steden de volwassenheid van het Europese open-source ecosysteem.