MiniMax publica M2.5, un modelo frontier open-source que alcanza el 80.2% en SWE-Bench Verified. Kling lanza su modelo 3.0 con video 1080p y diálogo realista. En investigación, Perplexity despliega Model Council para ejecutar tres modelos simultáneamente, y ejecuta Deep Research en Claude Opus 4.6. Mistral anuncia su mayor hackathon mundial con $200K en premios.
MiniMax M2.5 — modelo frontier open-source
12 de febrero — MiniMax anuncia M2.5, un modelo frontier open-source diseñado para la productividad real. El modelo muestra un rendimiento state-of-the-art en cuatro áreas críticas: codificación, búsqueda web, llamadas a herramientas agentic y trabajo de oficina.
| Benchmark | Puntuación | Categoría |
|---|---|---|
| SWE-Bench Verified | 80.2% | Resolución de bugs reales |
| BrowseComp | 76.3% | Búsqueda y navegación web |
| BFCL | 76.8% | Llamadas a herramientas agentic |
| Office Work | Optimizado | Productividad documental |
La puntuación del 80.2% en SWE-Bench Verified sitúa a M2.5 entre los mejores modelos de codificación en todas las categorías. En BrowseComp, el benchmark de navegación web de OpenAI, alcanza el 76.3% — señal de una sólida capacidad de búsqueda autónoma.
MiniMax afirma una ejecución 37% más rápida en tareas complejas en comparación con los modelos de la competencia, con un coste de $1 USD por hora a 100 tokens/segundo. El objetivo declarado: hacer económicamente viable el escalado de agentes long-horizon.
El modelo está disponible a través de MiniMax Agent (agent.minimax.io) y la API para desarrolladores (platform.minimax.io). Como modelo open-source frontier, M2.5 se posiciona directamente frente a los principales modelos propietarios.
MiniMax Forge — framework RL para agentes de producción
12 de febrero — Paralelamente a M2.5, MiniMax publica Forge, un framework y algoritmo de aprendizaje por refuerzo (RL) escalable para entrenar agentes de IA de producción.
Forge aborda un problema recurrente en el entrenamiento de agentes: la inestabilidad del aprendizaje a gran escala. El framework ofrece un enfoque optimizado para el reward modeling de agentes, dirigido a desarrolladores e investigadores de ML que despliegan agentes autónomos.
El doble anuncio M2.5 + Forge señala la ambición de MiniMax de ofrecer un stack completo para agentes de IA: modelo frontier + framework de entrenamiento.
Kling 3.0 — « Everyone a Director »
1 de febrero — Kling AI lanza su modelo 3.0, una actualización importante de su motor de generación de video posicionada bajo el concepto « Everyone a Director » (Todos directores). El modelo busca hacer accesible la creación cinematográfica sin experiencia técnica.
Las principales mejoras se centran en la calidad visual y el realismo de las interacciones humanas:
| Capacidad | Detalle |
|---|---|
| Resolución | 1080p nativo |
| Diálogo | Expresiones faciales y gestos realistas |
| Coherencia | Estilo visual mantenido en secuencias largas |
| Flexibilidad | Desde prompt simple hasta storyboard cinematográfico completo |
Los comentarios de la comunidad creativa son positivos, especialmente sobre el realismo de los diálogos y la capacidad de producir escenas con interacciones humanas convincentes — un punto débil histórico de los modelos de video IA.
Perplexity lanza Model Council — búsqueda multi-modelo
5 de febrero — Perplexity despliega Model Council, una funcionalidad que ejecuta la misma consulta en tres modelos frontier simultáneamente y produce una única respuesta sintetizada.
En lugar de cambiar manualmente entre modelos, Model Council ejecuta la consulta en Claude Opus 4.6, GPT 5.2 y Gemini 3.0 en paralelo. Un modelo sintetizador analiza los resultados, resuelve conflictos entre las respuestas y muestra dónde convergen o divergen los modelos.
| Caso de uso | Detalle |
|---|---|
| Inversión | Perspectivas de mercado equilibradas |
| Decisiones complejas | Estrategia empresarial, compras importantes |
| Brainstorming | Ideas creativas diversificadas |
| Verificación | Validar información con mayor confianza |
La funcionalidad está disponible inmediatamente en la web para los suscriptores de Perplexity Max. La versión móvil está en desarrollo.
Perplexity Deep Research pasa a Opus 4.6
9 de febrero — Perplexity anuncia que Deep Research ahora funciona en Claude Opus 4.6, mejorando los resultados state-of-the-art en benchmarks internos y externos. La actualización refuerza las capacidades de razonamiento en investigación profunda.
La funcionalidad está disponible inmediatamente para usuarios Max, con un despliegue progresivo para usuarios Pro.
🔗 Anuncio Deep Research Opus 4.6
Perplexity publica DRACO Benchmark como open-source
4 de febrero — Perplexity hace público DRACO, un benchmark open-source diseñado para evaluar herramientas de investigación profunda (Deep Research). Las rúbricas y la metodología completa están disponibles públicamente.
DRACO valida que Perplexity Deep Research alcanza un rendimiento state-of-the-art en benchmarks externos, superando a otras herramientas de investigación profunda en precisión y fiabilidad.
Mistral anuncia su mayor hackathon — $200K en premios
10 de febrero — Mistral AI lanza su mayor hackathon mundial jamás organizado, programado del 28 de febrero al 1 de marzo de 2026.
| Detalle | Información |
|---|---|
| Formato | 48 horas |
| Ubicaciones | París, Londres, Nueva York, San Francisco, Tokio, Singapur, Sídney + online |
| Premios | $200K en recompensas |
| Socios | NVIDIA, AWS, Weights & Biases, Hugging Face |
| Premios especiales | ElevenLabs, Hugging Face |
El evento se lleva a cabo simultáneamente en 8 ciudades y online. La lista de socios (NVIDIA, AWS, WandB, Hugging Face) señala la confianza del ecosistema principal de IA en la plataforma Mistral.
Cohere ficha a Magnus Carlsen como embajador
13 de febrero — Cohere anuncia una asociación con Magnus Carlsen, cinco veces Campeón Mundial de Ajedrez y número 1 del mundo, como embajador global de la marca.
Carlsen participará en campañas de visibilidad, iniciativas de thought leadership y eventos de alto perfil de Cohere. La asociación busca ilustrar los paralelos entre la estrategia en ajedrez y el enfoque de Cohere hacia la IA empresarial: foco en los fundamentos, anticipación y ventajas sostenibles.
🔗 Anuncio Cohere + Magnus Carlsen
En breve
12 de febrero — Runway lanza Story Panels, un nuevo flujo de trabajo que permite crear películas completas o anuncios a partir de una sola imagen, con coherencia de personajes, lugares y estilo.
12-13 de febrero — Mooncake, un asignador de memoria PyTorch co-desarrollado por Moonshot AI (Kimi) y la Universidad Tsinghua, se une al ecosistema PyTorch. La herramienta optimiza la reducción de picos de memoria y la fragmentación, relevante para el despliegue de LLM long-context.
9 de febrero — Ideogram destaca su edición de imágenes mediante prompt en lenguaje natural, permitiendo modificar imágenes generadas a través de instrucciones de texto simples.
30 de enero — Perplexity integra Kimi K2.5, el modelo de razonamiento open-source de Moonshot AI, para sus suscriptores Pro y Max. La inferencia se ejecuta en la propia infraestructura de Perplexity en EE. UU.
4 de febrero — MiniMax y Hyperbond Studio anuncian una asociación para desarrollar compañeros de IA conversacionales con « Call Me Sensei », utilizando los LLM y API de agentes de MiniMax.
Lo que esto significa
La primera quincena de febrero de 2026 confirma varias tendencias de fondo. MiniMax M2.5 demuestra que un actor menos publicitado puede publicar un modelo open-source rivalizando con los líderes en benchmarks de codificación — 80.2% en SWE-Bench Verified es una puntuación notable para un modelo abierto. Con Forge como complemento, MiniMax ofrece un stack de agentes completo.
Perplexity acelera su diferenciación con Model Council, un enfoque pragmático que reconoce que ningún modelo único domina todos los casos de uso. La integración de Opus 4.6 en Deep Research y la publicación de DRACO como open-source refuerzan la transparencia y credibilidad de la plataforma.
Kling 3.0 marca un avance en la generación de video con diálogos realistas — un paso hacia herramientas de producción cinematográfica accesibles. En cuanto a la comunidad, el hackathon de Mistral con $200K en 8 ciudades muestra la madurez del ecosistema open-source europeo.