Anthropic Institute, Perplexity Everything is Computer, OpenAI Responses API: 11 de marzo de 2026

El 11 de marzo de 2026 es una jornada densa: Anthropic crea un instituto interdisciplinario para el debate público sobre la IA, Perplexity despliega su visión “Computer” con cuatro API simultáneas, OpenAI publica las nuevas primitivas agénticas de la Responses API, y Meta detalla cuatro generaciones de chips de IA custom desarrollados en dos años.

Anthropic Institute: Jack Clark al frente del beneficio público

11 de marzo de 2026 — Anthropic lanza The Anthropic Institute, un nuevo esfuerzo para hacer avanzar el debate público sobre los desafíos planteados por la IA potente. La iniciativa está dirigida por el cofundador Jack Clark, que asume un nuevo rol de “Head of Public Benefit” (responsable del beneficio público) en Anthropic.

El Instituto reunirá a un equipo interdisciplinario — investigadores, economistas, juristas, especialistas en políticas públicas — con un acceso único a los modelos de vanguardia de Anthropic. Su misión: analizar y comunicar los impactos sociales, económicos y de seguridad de la IA a medida que se desarrollan.

Se anunciaron tres primeras incorporaciones:

Incorporación	Trayectoria
Matt Botvinick	Resident Fellow, Yale Law School; ex-Senior Director of Research, Google DeepMind
Anton Korinek	Profesor de economía (en año sabático), equipo Economic Research
Zoë Hitzig	Ex-OpenAI, especializada en los impactos sociales y económicos de la IA

El Instituto se apoya en los equipos existentes de Anthropic: Frontier Red Team, Societal Impacts, Economic Research. En paralelo, Anthropic anuncia la expansión de su equipo Public Policy, centrado en la transparencia de los modelos, la protección de los consumidores de energía, los controles a la exportación y la gobernanza mundial de la IA.

La creación de este Instituto marca una etapa notable: Anthropic estructura formalmente su compromiso público y le da un rostro con uno de sus cofundadores.

🔗 Presentamos The Anthropic Institute

Perplexity: lanzamiento coordinado de la visión “Everything is Computer”

11 de marzo de 2026 — Perplexity publica simultáneamente cuatro anuncios que forman un lanzamiento coordinado alrededor de su visión “Computer”: la IA como ordenador personal y profesional.

Personal Computer y Enterprise

El Personal Computer es un Mac mini dedicado que funciona 24/7, conectado a las aplicaciones locales y a los servidores de Perplexity. Actúa como un proxy digital del usuario: las acciones sensibles requieren una aprobación explícita. Lista de espera abierta.

El Computer for Enterprise se conecta a Snowflake, Salesforce, HubSpot y cientos de plataformas. Las competencias (skills) son personalizables, y la integración con Slack permite trabajar en DM o canales compartidos. Se basa en SOC 2 Type II, SAML SSO y registros de auditoría (audit logs). Perplexity presenta una cifra procedente de un estudio interno de 16 000 consultas: ahorro de 1,6 millones de dólares en costes laborales y 3,25 años de trabajo realizados en 4 semanas.

Comet Enterprise es un navegador IA nativo con controles de administrador (permisos por dominio, registros de acciones, MDM) y una alianza con CrowdStrike para protecciones a nivel del navegador.

Perplexity Finance recibe más de 40 herramientas financieras en directo (SEC filings, FactSet, S&P Global, Coinbase, LSEG, Quartr, Polymarket), con conexión a bróker mediante Plaid para el análisis de una cartera real.

Premium Sources ofrece acceso a Statista, CB Insights y PitchBook directamente en los flujos de búsqueda: las fuentes de pago se citan automáticamente.

🔗 Everything is Computer

Agent API: runtime de orquestación completo

La Agent API es un runtime gestionado para construir workflows agénticos con búsqueda integrada, ejecución de herramientas y orquestación multimodelo. Sustituye en un único punto de integración a un router de modelos, una capa de búsqueda, un proveedor de embeddings, un servicio sandbox y una pila de monitorización (monitoring stack).

Herramienta integrada	Capacidades
`web_search`	Filtrado por dominio, actualidad, rango de fechas, idioma, presupuesto de contenido
`fetch_url`	Recuperación directa de URL
Funciones personalizadas	Soporte completo

Cuatro perfiles optimizados (presets) cubren los casos de uso: búsqueda factual rápida, búsqueda equilibrada, análisis multisource profundo y búsqueda institucional. Deep Research 2.0 está disponible mediante el perfil advanced-deep-research: lanza decenas de búsquedas por consulta y procesa cientos de documentos.

La Agent API es agnóstica respecto a los modelos, soporta cadenas de fallback (fallback chains) multimodelo para una disponibilidad cercana al 100 %, y está disponible hoy en docs.perplexity.ai.

🔗 Agent API

Search API: snippets mejorados y benchmark SEAL

La actualización de la Search API se centra en la calidad de los extractos (snippets) y la infraestructura de evaluación.

El nuevo pipeline de etiquetado a nivel de fragmentos (span-level labeling) identifica qué segmentos de un documento fuente son pertinentes para una consulta. Resultado: extractos más pequeños y más precisos, lo que reduce los costes en token y mejora la gestión del contexto para los modelos posteriores.

El benchmark SEAL prueba si un sistema de recuperación puede responder a preguntas cuya respuesta cambia con el tiempo. Perplexity progresa en SEAL-Hard mientras otros proveedores retroceden. El framework search_evals se actualiza en código abierto en GitHub.

Otras mejoras: soporte multiconsulta (hasta 5 en una sola consulta API), filtrado por idioma (código ISO 639-1) y por país, y SDK Python (pip install perplexityai) con soporte nativo para las tres API.

🔗 Actualización de la Search API

Sandbox API: ejecución de código aislada para agentes

Perplexity abre su entorno interno de ejecución de código como servicio autónomo. Cada sesión se ejecuta en un pod Kubernetes aislado, con un sistema de archivos persistente montado. Lenguajes soportados: Python, JavaScript, SQL. La instalación de paquetes en tiempo de ejecución (at runtime) es posible.

Las sesiones tienen un estado persistente (stateful): los archivos creados en una etapa están disponibles en las etapas siguientes, y los workflows largos pueden pausarse y luego reanudarse horas más tarde. La seguridad se basa en un modelo de confianza cero (zero-trust): sin acceso directo a la red, tráfico saliente mediante proxy, el código nunca accede a las claves API brutas.

La Sandbox API será integrable en la Agent API con la misma clave API y los mismos créditos. Estado: beta privada próximamente.

🔗 Sandbox API

OpenAI: la Responses API recibe un entorno informático para agentes

11 de marzo de 2026 — OpenAI publica un artículo de ingeniería que detalla las nuevas primitivas de la Responses API para construir agentes autónomos fiables: shell tool Unix, contenedores alojados, compactación nativa del contexto y agent skills reutilizables.

El shell tool

El shell tool permite al modelo interactuar con un ordenador mediante la línea de comandos, con acceso a utilidades Unix clásicas (grep, curl, awk). A diferencia del intérprete de código existente, que solo ejecutaba Python, el shell tool admite Go, Java, Node.js y otros entornos. Los modelos GPT-5.2 y posteriores están entrenados para proponer comandos shell.

La Responses API puede ejecutar varios comandos shell en paralelo mediante sesiones de contenedor separadas, y aplica un límite de salida por comando para evitar saturar la ventana de contexto.

Contenedores alojados

El contenedor constituye el espacio de trabajo del modelo:

Componente	Descripción
Sistema de archivos	Upload, organización y gestión de recursos mediante APIs container y file
Bases de datos	Almacenamiento estructurado (SQLite): el modelo consulta las tablas en lugar de cargar todo el contenido
Acceso de red	Proxy egress centralizado con lista de autorizaciones, inyección de secretos por dominio

Compactación nativa del contexto

Para las tareas de larga duración, la Responses API integra un mecanismo de compactación nativa: los modelos están entrenados para producir una representación compacta y cifrada del estado conversacional. Disponible del lado del servidor (umbral configurable) o mediante un endpoint /compact. Codex utiliza este mecanismo para mantener sesiones de codificación de larga duración sin degradación.

Agent skills

Las skills (competencias de agente) condicionan patrones de flujo de trabajo repetitivos (workflow patterns) en bundles reutilizables: una carpeta con un archivo SKILL.md y los recursos asociados. La Responses API carga automáticamente la skill en el contexto antes de enviar el prompt al modelo. Las skills se gestionan mediante API y están versionadas.

En paralelo, una entrada de blog para desarrolladores celebra un año de la Responses API con cinco estudios de caso de clientes. Las dos publicaciones forman un panorama coherente de la evolución de la plataforma hacia lo agéntico.

🔗 Responses API + entorno informático 🔗 1 año de la Responses API

OpenAI: estrategia de defensa contra el prompt injection

11 de marzo de 2026 — OpenAI publica un artículo de seguridad sobre la resistencia de los agentes de IA a los ataques por inyección de prompt (prompt injection).

Los primeros ataques consistían en insertar instrucciones directas en contenidos externos (páginas de Wikipedia, emails). Con la mejora de los modelos, estos ataques han evolucionado hacia la ingeniería social (social engineering): contexto profesional convincente, urgencia simulada, autorización pretendida. Un ejemplo de 2025 descrito en el artículo mostraba un ataque exitoso en el 50 % de los casos sobre una versión antigua de ChatGPT.

OpenAI aborda el problema desde el prisma del sistema tripartito (empleador / agente / tercero malicioso), análogo a un agente humano de atención al cliente expuesto a intentos de manipulación. El objetivo no es identificar perfectamente cada ataque, sino limitar el impacto de una manipulación exitosa.

Contramedida	Descripción
Análisis source-sink	Detección de combinaciones de contenido no fiable + acción peligrosa
Safe Url	Detecta si información de la conversación se transmitiría a un tercero: pide confirmación o bloquea
Sandbox aplicativo	Canvas y ChatGPT Apps detectan comunicaciones inesperadas y solicitan consentimiento

Safe Url también se aplica a las navegaciones en Atlas, así como a las búsquedas y navegaciones en Deep Research.

🔗 Diseñar agentes de IA para resistir el prompt injection

Meta MTIA: cuatro generaciones de chips de IA en dos años

11 de marzo de 2026 — Meta publica un artículo técnico detallado sobre su familia de chips de IA custom MTIA (Meta Training and Inference Accelerator). En dos años, Meta ha desarrollado cuatro generaciones sucesivas para servir a miles de millones de usuarios a menor coste.

“AI models are evolving faster than traditional chip development cycles.”

🇪🇸 Los modelos de IA evolucionan más rápido que los ciclos tradicionales de desarrollo de chips.

Generación	Innovación principal
MTIA 300	Primer chip optimizado para los modelos de clasificación y recomendación (Ranking & Recommendation), base modular reutilizable
MTIA 400	Evolución hacia los workloads GenAI, rack de 72 chips en un único dominio scale-up
MTIA 450	Duplicación del ancho de banda HBM, +75 % de FLOPS MX4, aceleración hardware de attention y FFN
MTIA 500	+50 % de ancho de banda HBM vs MTIA 450, foco en inference GenAI

La progresión entre MTIA 300 y MTIA 500: ancho de banda HBM multiplicado por 4,5 y FLOPS multiplicados por 25. La estrategia de Meta se basa en un desarrollo de alta velocidad (un nuevo chip por año), un foco en inference más que en preentrenamiento, y una integración nativa con PyTorch.

“Mainstream GPUs are typically built for the most demanding workload — large-scale GenAI pre-training — while Meta’s primary need is inference.”

🇪🇸 Las GPU de uso general suelen estar diseñadas para la carga de trabajo más exigente — el preentrenamiento GenAI a gran escala — mientras que la necesidad principal de Meta es la inference.

La arquitectura del procesador elemental (Processing Element) combina dos núcleos RISC-V vectoriales, un motor de producto escalar (Dot Product Engine), una unidad de funciones especiales (Special Function Unit), un motor de reducción y un DMA. La pila de software se basa en PyTorch, vLLM, Triton y compiladores MTIA dedicados, con una integración vLLM mediante arquitectura de plugin.

🔗 Meta MTIA: escalar chips de IA para miles de millones

Gemini CLI v0.33.0: Plan Mode enriquecido y autenticación A2A

11 de marzo de 2026 — Gemini CLI publica la versión v0.33.0, dos semanas después de la v0.32.0, que había introducido el Plan Mode.

Categoría	Novedades
Arquitectura de agentes	Autenticación HTTP para agentes A2A remotos, descubrimiento de tarjetas de agentes A2A autenticados
Plan Mode	Subagentes de investigación integrados, soporte de anotaciones para comentarios de usuarios, nuevo subcomando `copy`
Interfaz CLI	Cabecera compacta con icono ASCII, visualización invertida de la ventana de contexto, retención de 30 días por defecto para el historial de chat

La incorporación de la autenticación HTTP para el protocolo A2A (Agent-to-Agent) es la principal novedad técnica: Gemini CLI ahora puede descubrir y autenticarse ante agentes remotos, sentando las bases de una orquestación multiagente segura.

🔗 Changelog de Gemini CLI

Gemini en Chrome: expansión a India, Nueva Zelanda y Canadá

11 de marzo de 2026 — Google amplía las funcionalidades de IA de Chrome a tres nuevos mercados: India, Nueva Zelanda y Canadá.

Gemini in Chrome — el asistente de IA en el panel lateral, basado en Gemini 3.1 — ya está disponible en Mac, Windows y Chromebook Plus en estas regiones. Entre las funcionalidades desplegadas: acceso a Gmail, Maps, Calendar y YouTube desde Chrome, análisis cruzado de varias pestañas abiertas y transformación de imágenes directamente en el navegador mediante Nano Banana 2. La actualización añade más de 50 idiomas adicionales, entre ellos hindi, francés y español.

🔗 Chrome se expande a India, Nueva Zelanda y Canadá

AlphaEvolve: nuevos límites para 5 números de Ramsey

11 de marzo de 2026 — Pushmeet Kohli (Google DeepMind) anuncia que AlphaEvolve ha establecido nuevos límites inferiores para 5 números de Ramsey clásicos en combinatoria extremal: problemas tan difíciles que el propio Erdős había comentado su complejidad, y cuyos mejores resultados anteriores databan de al menos una década.

AlphaEvolve actúa como un metaalgoritmo que descubre automáticamente los procedimientos de búsqueda necesarios, allí donde históricamente había que diseñar manualmente algoritmos específicos. Este resultado ilustra las capacidades de AlphaEvolve más allá de las optimizaciones de kernels de Google por las que ya era conocido.

🔗 Tweet de Pushmeet Kohli

Gemini Embedding 2: primer embedding multimodal de Google

10 de marzo de 2026 — Google anuncia Gemini Embedding 2, descrito como “our most capable and first fully multimodal embedding model”. Es el primer modelo de embedding nativamente multimodal de Google, disponible para desarrolladores a través de Gemini API y AI Studio.

🔗 Tweet de @googleaidevs

GitHub Copilot: revisión de código desde el terminal y avances en JetBrains

11 de marzo de 2026 — Dos actualizaciones destacadas para GitHub Copilot.

Code Review desde GitHub CLI v2.88.0

Ahora es posible solicitar una revisión de código de Copilot directamente desde el terminal. Los comandos gh pr edit --add-reviewer @copilot (modo no interactivo) y gh pr create (modo interactivo) integran Copilot junto a los compañeros de equipo. La selección de revisores se beneficia de una búsqueda dinámica, lo que mejora el rendimiento en grandes organizaciones y corrige problemas de accesibilidad. Disponible en todos los planes que incluyen Copilot code review; se requiere actualizar a GitHub CLI v2.88.0.

🔗 Code Review desde GitHub CLI

Mejoras agénticas para JetBrains IDEs

La actualización del plugin de JetBrains aporta en disponibilidad general (GA): agentes personalizados (custom agents), subagentes y agente de planificación (plan agent), así como la selección automática de modelo para todos los planes. En vista previa pública (public preview): los hooks de agente (userPromptSubmitted, preToolUse, postToolUse, errorOccurred) mediante un archivo hooks.json en .github/hooks/, y soporte para los archivos AGENTS.md y CLAUDE.md.

Otras mejoras completan la actualización: auto-approve configurable por MCP, panel de pensamiento para modelos con razonamiento extendido, indicador de uso de la ventana de contexto y deprecación del modo Edit en el menú.

🔗 Mejoras en JetBrains

Explorar un repositorio en Copilot en la web

En vista previa pública: es posible explorar el árbol de un repositorio de GitHub directamente desde la interfaz web de Copilot. Los archivos seleccionados se añaden automáticamente como referencias temporales al chat y pueden hacerse permanentes.

🔗 Exploración de repositorio en Copilot

Anthropic Sydney y Claude for Office

Sydney, 4.ª oficina en Asia-Pacífico

10 de marzo de 2026 — Anthropic anuncia la próxima apertura de una oficina en Sydney, su cuarta en Asia-Pacífico (después de Tokio, Seúl y Singapur). Australia ocupa el 4.º puesto mundial en uso de Claude.ai por habitante; Nueva Zelanda ocupa el 8.º según el mismo indicador (Anthropic Economic Index). La oficina se centrará inicialmente en clientes empresariales, startups e investigación.

🔗 Sydney, 4.ª oficina en Asia-Pacífico

Claude for Excel y PowerPoint: contexto compartido y Skills de Office

11 de marzo de 2026 — Los add-ins Claude for Excel y Claude for PowerPoint reciben dos actualizaciones importantes: el intercambio de contexto entre las dos aplicaciones (un analista puede extraer datos de un libro de Excel y utilizarlos en una presentación de PowerPoint en una sola conversación), y la llegada de los Skills (workflows reutilizables con un clic) a ambos add-ins.

Los Skills precargados cubren los casos de uso más frecuentes: auditoría de fórmulas, construcción de modelos LBO/DCF, decks de panorama competitivo, actualización de presentaciones con nuevos datos y revisión de decks de banca de inversión. Los add-ins ya están disponibles a través de Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry para despliegues conformes. Disponibilidad: Mac y Windows en planes de pago (Pro, Max, Team, Enterprise).

🔗 Claude for Excel y PowerPoint

NVIDIA Nemotron 3 Super, ComfyUI y GTC 2026

11 de marzo de 2026 — NVIDIA está muy activo en torno al GTC 2026.

Nemotron 3 Super ofrece un rendimiento 5 veces superior para la IA agéntica en comparación con la generación anterior. Se trata de un modelo MoE (Mixture of Experts) de 120.000 millones de parámetros en open source, optimizado para cargas de inferencia de alta frecuencia.

NVIDIA y ComfyUI anunciaron durante la GDC 2026 (Game Developers Conference) una integración que simplifica la generación de vídeo con IA local para desarrolladores de juegos y creadores, con soporte para los modelos FLUX y LTX-Video.

El blog GTC 2026 Live Updates de NVIDIA reúne los anuncios en directo de la conferencia en San José; Mistral AI también presenta allí sus modelos frontier en este marco.

🔗 Nemotron 3 Super 🔗 ComfyUI GDC 🔗 GTC 2026 en directo

En resumen

Runway Labs — Runway lanza un incubador interno dirigido por Alejandro Matamala Ortiz (cofundador, director de innovación). Runway Labs prototipará aplicaciones radicalmente nuevas para el vídeo generativo y los modelos de simulación del mundo (General World Models) en sectores variados: cine, salud, educación, videojuegos, publicidad, inmobiliario. Reclutamiento abierto.

🔗 Presentamos Runway Labs

Claude Code /btw — Un nuevo comando /btw permite mantener conversaciones laterales (side chain conversations) mientras una tarea está en ejecución, sin interrumpir el trabajo en curso.

🔗 Tweet de @bcherny

NotebookLM Flashcards — Actualización de los cuestionarios y flashcards: reanudación desde donde se dejó, seguimiento de las flashcards acertadas o falladas, posibilidad de eliminar o mezclar las flashcards.

🔗 Tweet de NotebookLM

Meta Canopy Height Maps v2 — Meta y el World Resources Institute publican CHMv2, una nueva versión de los mapas de altura del dosel forestal mundial. El modelo DINOv3 (visión autosupervisada de Meta) mejora la precisión y la cobertura mundial. Aplicaciones: migración climática, restauración forestal, planificación urbana. Modelos disponibles en open source.

🔗 Canopy Height Maps v2

Z.ai GLM-5 — GLM-5 ya está accesible para los usuarios Lite (nivel gratuito), después de haber estado reservado a usuarios Pro desde su lanzamiento en febrero de 2026.

🔗 Tweet de @ZixuanLi_

Lo que significa

El 11 de marzo de 2026 ilustra dos tendencias de fondo que convergen.

La primera es la plataformización de lo agéntico: OpenAI, Perplexity y GitHub publican el mismo día primitivas complementarias (shell tools, sandboxes, agent hooks, code review). El ecosistema se estructura en torno a bloques reutilizables — skills, contenedores, subagentes — que permiten a los desarrolladores construir agentes fiables sin reinventar la infraestructura.

La segunda es la carrera por el silicio custom: el detalle que Meta publica sobre sus cuatro generaciones MTIA en dos años revela una estrategia clara de independencia frente a las GPU de consumo masivo, calibrada para la inferencia a gran escala. La misma lógica empuja a NVIDIA a publicar Nemotron 3 Super el mismo día del GTC, donde los anuncios se acumulan.

La creación del Anthropic Institute se inscribe en un movimiento más discreto pero duradero: a medida que las capacidades progresan, las grandes empresas de IA estructuran sus equipos de impacto público, ya no como una comunicación de fachada, sino como un esfuerzo de investigación en toda regla.

Fuentes

Este documento ha sido traducido de la versión fr al idioma es utilizando el modelo gpt-5.5. Para más información sobre el proceso de traducción, consulte https://gitlab.com/jls42/ai-powered-markdown-translator