MiniMax M2.5 alcanza el 80% en SWE-Bench open-source, Kling 3.0 transforma el video con IA, Perplexity lanza Model Council

MiniMax publica M2.5, un modelo frontier open-source que alcanza el 80.2% en SWE-Bench Verified. Kling lanza su modelo 3.0 con video 1080p y diálogo realista. En investigación, Perplexity despliega Model Council para ejecutar tres modelos simultáneamente, y ejecuta Deep Research en Claude Opus 4.6. Mistral anuncia su mayor hackathon mundial con $200K en premios.

MiniMax M2.5 — modelo frontier open-source

12 de febrero — MiniMax anuncia M2.5, un modelo frontier open-source diseñado para la productividad real. El modelo muestra un rendimiento state-of-the-art en cuatro áreas críticas: codificación, búsqueda web, llamadas a herramientas agentic y trabajo de oficina.

Benchmark	Puntuación	Categoría
SWE-Bench Verified	80.2%	Resolución de bugs reales
BrowseComp	76.3%	Búsqueda y navegación web
BFCL	76.8%	Llamadas a herramientas agentic
Office Work	Optimizado	Productividad documental

La puntuación del 80.2% en SWE-Bench Verified sitúa a M2.5 entre los mejores modelos de codificación en todas las categorías. En BrowseComp, el benchmark de navegación web de OpenAI, alcanza el 76.3% — señal de una sólida capacidad de búsqueda autónoma.

MiniMax afirma una ejecución 37% más rápida en tareas complejas en comparación con los modelos de la competencia, con un coste de $1 USD por hora a 100 tokens/segundo. El objetivo declarado: hacer económicamente viable el escalado de agentes long-horizon.

El modelo está disponible a través de MiniMax Agent (agent.minimax.io) y la API para desarrolladores (platform.minimax.io). Como modelo open-source frontier, M2.5 se posiciona directamente frente a los principales modelos propietarios.

🔗 Anuncio MiniMax M2.5

MiniMax Forge — framework RL para agentes de producción

12 de febrero — Paralelamente a M2.5, MiniMax publica Forge, un framework y algoritmo de aprendizaje por refuerzo (RL) escalable para entrenar agentes de IA de producción.

Forge aborda un problema recurrente en el entrenamiento de agentes: la inestabilidad del aprendizaje a gran escala. El framework ofrece un enfoque optimizado para el reward modeling de agentes, dirigido a desarrolladores e investigadores de ML que despliegan agentes autónomos.

El doble anuncio M2.5 + Forge señala la ambición de MiniMax de ofrecer un stack completo para agentes de IA: modelo frontier + framework de entrenamiento.

🔗 Forge en MiniMax News

Kling 3.0 — « Everyone a Director »

1 de febrero — Kling AI lanza su modelo 3.0, una actualización importante de su motor de generación de video posicionada bajo el concepto « Everyone a Director » (Todos directores). El modelo busca hacer accesible la creación cinematográfica sin experiencia técnica.

Las principales mejoras se centran en la calidad visual y el realismo de las interacciones humanas:

Capacidad	Detalle
Resolución	1080p nativo
Diálogo	Expresiones faciales y gestos realistas
Coherencia	Estilo visual mantenido en secuencias largas
Flexibilidad	Desde prompt simple hasta storyboard cinematográfico completo

Los comentarios de la comunidad creativa son positivos, especialmente sobre el realismo de los diálogos y la capacidad de producir escenas con interacciones humanas convincentes — un punto débil histórico de los modelos de video IA.

🔗 Anuncio Kling 3.0

Perplexity lanza Model Council — búsqueda multi-modelo

5 de febrero — Perplexity despliega Model Council, una funcionalidad que ejecuta la misma consulta en tres modelos frontier simultáneamente y produce una única respuesta sintetizada.

En lugar de cambiar manualmente entre modelos, Model Council ejecuta la consulta en Claude Opus 4.6, GPT 5.2 y Gemini 3.0 en paralelo. Un modelo sintetizador analiza los resultados, resuelve conflictos entre las respuestas y muestra dónde convergen o divergen los modelos.

Caso de uso	Detalle
Inversión	Perspectivas de mercado equilibradas
Decisiones complejas	Estrategia empresarial, compras importantes
Brainstorming	Ideas creativas diversificadas
Verificación	Validar información con mayor confianza

La funcionalidad está disponible inmediatamente en la web para los suscriptores de Perplexity Max. La versión móvil está en desarrollo.

🔗 Introducing Model Council

Perplexity Deep Research pasa a Opus 4.6

9 de febrero — Perplexity anuncia que Deep Research ahora funciona en Claude Opus 4.6, mejorando los resultados state-of-the-art en benchmarks internos y externos. La actualización refuerza las capacidades de razonamiento en investigación profunda.

La funcionalidad está disponible inmediatamente para usuarios Max, con un despliegue progresivo para usuarios Pro.

🔗 Anuncio Deep Research Opus 4.6

Perplexity publica DRACO Benchmark como open-source

4 de febrero — Perplexity hace público DRACO, un benchmark open-source diseñado para evaluar herramientas de investigación profunda (Deep Research). Las rúbricas y la metodología completa están disponibles públicamente.

DRACO valida que Perplexity Deep Research alcanza un rendimiento state-of-the-art en benchmarks externos, superando a otras herramientas de investigación profunda en precisión y fiabilidad.

🔗 Anuncio DRACO

Mistral anuncia su mayor hackathon — $200K en premios

10 de febrero — Mistral AI lanza su mayor hackathon mundial jamás organizado, programado del 28 de febrero al 1 de marzo de 2026.

Detalle	Información
Formato	48 horas
Ubicaciones	París, Londres, Nueva York, San Francisco, Tokio, Singapur, Sídney + online
Premios	$200K en recompensas
Socios	NVIDIA, AWS, Weights & Biases, Hugging Face
Premios especiales	ElevenLabs, Hugging Face

El evento se lleva a cabo simultáneamente en 8 ciudades y online. La lista de socios (NVIDIA, AWS, WandB, Hugging Face) señala la confianza del ecosistema principal de IA en la plataforma Mistral.

🔗 Anuncio Mistral Hackathon

Cohere ficha a Magnus Carlsen como embajador

13 de febrero — Cohere anuncia una asociación con Magnus Carlsen, cinco veces Campeón Mundial de Ajedrez y número 1 del mundo, como embajador global de la marca.

Carlsen participará en campañas de visibilidad, iniciativas de thought leadership y eventos de alto perfil de Cohere. La asociación busca ilustrar los paralelos entre la estrategia en ajedrez y el enfoque de Cohere hacia la IA empresarial: foco en los fundamentos, anticipación y ventajas sostenibles.

🔗 Anuncio Cohere + Magnus Carlsen

En breve

12 de febrero — Runway lanza Story Panels, un nuevo flujo de trabajo que permite crear películas completas o anuncios a partir de una sola imagen, con coherencia de personajes, lugares y estilo.

🔗 Runway Story Panels

12-13 de febrero — Mooncake, un asignador de memoria PyTorch co-desarrollado por Moonshot AI (Kimi) y la Universidad Tsinghua, se une al ecosistema PyTorch. La herramienta optimiza la reducción de picos de memoria y la fragmentación, relevante para el despliegue de LLM long-context.

🔗 Anuncio Mooncake

9 de febrero — Ideogram destaca su edición de imágenes mediante prompt en lenguaje natural, permitiendo modificar imágenes generadas a través de instrucciones de texto simples.

30 de enero — Perplexity integra Kimi K2.5, el modelo de razonamiento open-source de Moonshot AI, para sus suscriptores Pro y Max. La inferencia se ejecuta en la propia infraestructura de Perplexity en EE. UU.

4 de febrero — MiniMax y Hyperbond Studio anuncian una asociación para desarrollar compañeros de IA conversacionales con « Call Me Sensei », utilizando los LLM y API de agentes de MiniMax.

Lo que esto significa

La primera quincena de febrero de 2026 confirma varias tendencias de fondo. MiniMax M2.5 demuestra que un actor menos publicitado puede publicar un modelo open-source rivalizando con los líderes en benchmarks de codificación — 80.2% en SWE-Bench Verified es una puntuación notable para un modelo abierto. Con Forge como complemento, MiniMax ofrece un stack de agentes completo.

Perplexity acelera su diferenciación con Model Council, un enfoque pragmático que reconoce que ningún modelo único domina todos los casos de uso. La integración de Opus 4.6 en Deep Research y la publicación de DRACO como open-source refuerzan la transparencia y credibilidad de la plataforma.

Kling 3.0 marca un avance en la generación de video con diálogos realistas — un paso hacia herramientas de producción cinematográfica accesibles. En cuanto a la comunidad, el hackathon de Mistral con $200K en 8 ciudades muestra la madurez del ecosistema open-source europeo.