Anthropic Institute, Perplexity Everything is Computer, OpenAI Responses API: 11 de março de 2026

O 11 de março de 2026 é um dia intenso: a Anthropic cria um instituto interdisciplinar para o debate público sobre a IA, a Perplexity implementa a sua visão “Computer” com quatro API simultâneas, a OpenAI publica as novas primitivas agênticas da Responses API, e a Meta detalha quatro gerações de chips de IA custom desenvolvidos em dois anos.

Anthropic Institute: Jack Clark à frente do benefício público

11 de março de 2026 — A Anthropic lança The Anthropic Institute, um novo esforço para fazer avançar o debate público sobre os desafios colocados pela IA poderosa. A iniciativa é dirigida pelo cofundador Jack Clark, que assume um novo papel de “Head of Public Benefit” (responsável pelo benefício público) na Anthropic.

O Instituto reunirá uma equipa interdisciplinar — investigadores, economistas, juristas, especialistas em políticas públicas — com acesso único aos modelos de ponta da Anthropic. A sua missão: analisar e comunicar os impactos societais, económicos e de segurança da IA à medida que se desenvolvem.

Foram anunciadas três primeiras contratações:

Contratação	Percurso
Matt Botvinick	Resident Fellow, Yale Law School; ex-Senior Director of Research, Google DeepMind
Anton Korinek	Professor de economia (em licença sabática), equipa Economic Research
Zoë Hitzig	Ex-OpenAI, especializada nos impactos sociais e económicos da IA

O Instituto apoia-se nas equipas existentes da Anthropic: Frontier Red Team, Societal Impacts, Economic Research. Em paralelo, a Anthropic anuncia a expansão da sua equipa Public Policy, centrada na transparência dos modelos, na proteção dos consumidores de energia, nos controlos de exportação e na governação mundial da IA.

A criação deste Instituto marca uma etapa notável: a Anthropic estrutura formalmente o seu compromisso público e dá-lhe um rosto com um dos seus cofundadores.

🔗 Apresentação do The Anthropic Institute

Perplexity: lançamento coordenado da visão “Everything is Computer”

11 de março de 2026 — A Perplexity publica simultaneamente quatro anúncios que formam um lançamento coordenado em torno da sua visão “Computer”: a IA como computador pessoal e profissional.

Personal Computer e Enterprise

O Personal Computer é um Mac mini dedicado que funciona 24 horas por dia, ligado às aplicações locais e aos servidores da Perplexity. Atua como um proxy digital do utilizador — as ações sensíveis exigem aprovação explícita. Lista de espera aberta.

O Computer for Enterprise liga-se ao Snowflake, Salesforce, HubSpot e a centenas de plataformas. As competências (skills) são personalizáveis, e a integração Slack permite trabalhar em DM ou canais partilhados. Assenta em SOC 2 Type II, SAML SSO e registos de auditoria (audit logs). A Perplexity avança um valor proveniente de um estudo interno de 16 000 pedidos: poupança de 1,6 milhões de dólares em custos de mão de obra e 3,25 anos de trabalho realizados em 4 semanas.

Comet Enterprise é um navegador IA nativo com controlos de administrador (permissões por domínio, registos de ação, MDM) e uma parceria com a CrowdStrike para proteções ao nível do navegador.

Perplexity Finance recebe mais de 40 ferramentas financeiras em direto (SEC filings, FactSet, S&P Global, Coinbase, LSEG, Quartr, Polymarket), com ligação a corretora via Plaid para a análise de uma carteira real.

Premium Sources oferece acesso à Statista, CB Insights e PitchBook diretamente nos fluxos de pesquisa — as fontes pagas são citadas automaticamente.

🔗 Everything is Computer

Agent API: runtime de orquestração completo

A Agent API é um runtime gerido para construir workflows agênticos com pesquisa integrada, execução de ferramentas e orquestração multi-modelos. Substitui, num único ponto de integração, um router de modelos, uma camada de pesquisa, um fornecedor de embeddings, um serviço sandbox e uma pilha de monitorização (monitoring stack).

Ferramenta integrada	Capacidades
`web_search`	Filtragem por domínio, atualidade, intervalo de datas, idioma, orçamento de conteúdo
`fetch_url`	Recuperação direta de URL
Funções personalizadas	Suporte completo

Quatro perfis otimizados (presets) cobrem os casos de uso: pesquisa factual rápida, pesquisa equilibrada, análise multi-fontes aprofundada e pesquisa institucional. Deep Research 2.0 está disponível via o perfil advanced-deep-research — lança dezenas de pesquisas por pedido e processa centenas de documentos.

A Agent API é agnóstica em relação aos modelos, suporta cadeias de fallback (fallback chains) multi-modelos para uma disponibilidade próxima de 100%, e está disponível hoje em docs.perplexity.ai.

🔗 Agent API

Search API: snippets melhorados e benchmark SEAL

A atualização da Search API incide na qualidade dos excertos (snippets) e na infraestrutura de avaliação.

O novo pipeline de rotulagem ao nível dos fragmentos (span-level labeling) identifica quais segmentos de um documento-fonte são relevantes para uma consulta. Resultado: excertos mais pequenos e mais precisos, o que reduz os custos em tokens e melhora a gestão do contexto para os modelos a jusante.

O benchmark SEAL testa se um sistema de recuperação consegue responder a perguntas cuja resposta muda ao longo do tempo. A Perplexity progride no SEAL-Hard enquanto outros fornecedores recuam. O framework search_evals é atualizado em open source no GitHub.

Outras melhorias: suporte multi-consultas (até 5 numa única chamada API), filtragem por idioma (código ISO 639-1) e por país, e SDK Python (pip install perplexityai) com suporte nativo das três API.

🔗 Atualização da Search API

Sandbox API: execução de código isolada para agentes

A Perplexity abre o seu ambiente interno de execução de código como serviço autónomo. Cada sessão é executada num pod Kubernetes isolado, com um sistema de ficheiros persistente montado. Linguagens suportadas: Python, JavaScript, SQL. A instalação de packages em tempo de execução (at runtime) é possível.

As sessões têm estado persistente (stateful): os ficheiros criados numa etapa ficam disponíveis nas etapas seguintes, e os workflows longos podem fazer uma pausa e depois retomar horas mais tarde. A segurança assenta num modelo de confiança zero (zero-trust): sem acesso direto à rede, tráfego de saída via proxy, o código nunca tem acesso às chaves API brutas.

A Sandbox API será integrável na Agent API com a mesma chave API e os mesmos créditos. Estado: beta privada em breve.

🔗 Sandbox API

OpenAI: a Responses API recebe um ambiente informático para agentes

11 de março de 2026 — A OpenAI publica um artigo de engenharia que detalha as novas primitivas da Responses API para construir agentes autónomos fiáveis: shell tool Unix, contentores alojados, compactação nativa do contexto e agent skills reutilizáveis.

A shell tool

A shell tool permite ao modelo interagir com um computador via linha de comando, com acesso aos utilitários Unix clássicos (grep, curl, awk). Ao contrário do interpretador de código existente, que só executava Python, a shell tool suporta Go, Java, Node.js e outros ambientes. Os modelos GPT-5.2 e posteriores são treinados para propor comandos shell.

A Responses API pode executar vários comandos shell em paralelo através de sessões de contentor separadas, e aplica um limite de saída por comando para evitar saturar a janela de contexto.

Contentores alojados

O contentor constitui o espaço de trabalho do modelo:

Componente	Descrição
Sistema de ficheiros	Upload, organização e gestão dos recursos via APIs container e file
Bases de dados	Armazenamento estruturado (SQLite) — o modelo interroga as tabelas em vez de carregar todo o conteúdo
Acesso à rede	Proxy egress centralizado com lista de autorizações, injeção de segredos por domínio

Compactação nativa do contexto

Para tarefas de longa duração, a Responses API integra um mecanismo de compactação nativa: os modelos são treinados para produzir uma representação compacta e cifrada do estado conversacional. Disponível do lado do servidor (limiar configurável) ou via um endpoint /compact. O Codex utiliza este mecanismo para manter sessões de programação de longa duração sem degradação.

Agent skills

As skills (competências de agente) condicionam padrões de workflow repetitivos (workflow patterns) em bundles reutilizáveis: uma pasta com um ficheiro SKILL.md e os recursos associados. A Responses API carrega automaticamente a skill no contexto antes de enviar o prompt ao modelo. As skills são geridas via API e versionadas.

Em paralelo, uma publicação no blog de programadores celebra um ano da Responses API com cinco estudos de caso de clientes. As duas publicações formam um quadro coerente da evolução da plataforma rumo ao agêntico.

🔗 Responses API + ambiente informático 🔗 1 ano da Responses API

OpenAI: estratégia de defesa contra a injeção de prompt

11 de março de 2026 — A OpenAI publica um artigo de segurança sobre a resistência dos agentes IA aos ataques por injeção de prompt (prompt injection).

Os primeiros ataques consistiam em inserir instruções diretas em conteúdos externos (páginas Wikipedia, emails). Com a melhoria dos modelos, estes ataques evoluíram para engenharia social (social engineering): contexto profissional convincente, urgência simulada, autorização alegada. Um exemplo de 2025 descrito no artigo mostrava um ataque bem-sucedido em 50% dos casos numa versão antiga do ChatGPT.

A OpenAI aborda o problema pelo prisma do sistema tripartido (empregador / agente / terceiro malicioso), análogo a um agente humano de serviço ao cliente exposto a tentativas de manipulação. O objetivo não é identificar perfeitamente cada ataque, mas limitar o impacto de uma manipulação bem-sucedida.

Contramedida	Descrição
Análise source-sink	Deteção das combinações conteúdo não fiável + ação perigosa
Safe Url	Deteta se informações da conversa seriam transmitidas a um terceiro — pede confirmação ou bloqueia
Sandbox aplicacional	Canvas e ChatGPT Apps detetam comunicações inesperadas e pedem consentimento

Safe Url aplica-se também às navegações no Atlas, bem como às pesquisas e navegações no Deep Research.

🔗 Conceber agentes IA para resistirem à injeção de prompt

Meta MTIA: quatro gerações de chips IA em dois anos

11 de março de 2026 — A Meta publica um artigo técnico detalhado sobre a sua família de chips IA custom MTIA (Meta Training and Inference Accelerator). Em dois anos, a Meta desenvolveu quatro gerações sucessivas para servir milhares de milhões de utilizadores a menor custo.

“AI models are evolving faster than traditional chip development cycles.”

🇵🇹 Os modelos de IA estão a evoluir mais depressa do que os ciclos tradicionais de desenvolvimento de chips.

Geração	Inovação principal
MTIA 300	Primeiro chip otimizado para modelos de classificação e recomendação (Ranking & Recommendation), base modular reutilizável
MTIA 400	Evolução para workloads GenAI, rack de 72 chips num domínio scale-up único
MTIA 450	Duplicação da largura de banda HBM, +75% de FLOPS MX4, aceleração hardware de attention e FFN
MTIA 500	+50% de largura de banda HBM face ao MTIA 450, foco em inference GenAI

A progressão entre MTIA 300 e MTIA 500: largura de banda HBM multiplicada por 4,5 e FLOPS multiplicados por 25. A estratégia da Meta assenta num desenvolvimento de alta velocidade (um novo chip por ano), num foco em inference em vez de pré-treino, e numa integração nativa PyTorch.

“Mainstream GPUs are typically built for the most demanding workload — large-scale GenAI pre-training — while Meta’s primary need is inference.”

🇵🇹 As GPUs generalistas são normalmente construídas para o workload mais exigente — o pré-treino GenAI em grande escala — enquanto a principal necessidade da Meta é inference.

A arquitetura do processador elementar (Processing Element) combina dois núcleos RISC-V vetoriais, um motor de produto escalar (Dot Product Engine), uma unidade de funções especiais (Special Function Unit), um motor de redução e um DMA. A pilha software assenta em PyTorch, vLLM, Triton e compiladores MTIA dedicados, com uma integração vLLM via arquitetura de plugin.

🔗 Meta MTIA: chips IA à escala para milhares de milhões

Gemini CLI v0.33.0: Plan Mode enriquecido e autenticação A2A

11 de março de 2026 — O Gemini CLI publica a versão v0.33.0, duas semanas depois da v0.32.0, que havia introduzido o Plan Mode.

Categoria	Novidades
Arquitetura agentic	Autenticação HTTP para agentes A2A remotos, descoberta de cartões de agentes A2A autenticados
Plan Mode	Subagentes de pesquisa integrados, suporte a anotações para feedback de utilizadores, novo subcomando `copy`
Interface CLI	Cabeçalho compacto com ícone ASCII, exibição invertida da janela de contexto, retenção de 30 dias por padrão para o histórico de chat

A adição da autenticação HTTP para o protocolo A2A (Agent-to-Agent) é a principal novidade técnica: o Gemini CLI agora pode descobrir e autenticar-se junto de agentes remotos, lançando as bases de uma orquestração multiagente segura.

🔗 Changelog Gemini CLI

Gemini no Chrome: expansão para a Índia, a Nova Zelândia e o Canadá

11 de março de 2026 — A Google expande os recursos de IA do Chrome para três novos mercados: Índia, Nova Zelândia e Canadá.

Gemini in Chrome — o assistente de IA no painel lateral, baseado no Gemini 3.1 — agora está disponível em Mac, Windows e Chromebook Plus nessas regiões. Entre os recursos implementados: acesso ao Gmail, Maps, Calendar e YouTube a partir do Chrome, análise cruzada de várias abas abertas e transformação de imagens diretamente no navegador via Nano Banana 2. A atualização adiciona mais de 50 idiomas, incluindo hindi, francês e espanhol.

🔗 Chrome expande-se para a Índia, Nova Zelândia e Canadá

AlphaEvolve: novos limites para 5 números de Ramsey

11 de março de 2026 — Pushmeet Kohli (Google DeepMind) anuncia que o AlphaEvolve estabeleceu novos limites inferiores para 5 números de Ramsey clássicos em combinatória extremal — problemas tão difíceis que o próprio Erdős havia comentado a sua complexidade, e cujos melhores resultados anteriores datavam de pelo menos uma década.

O AlphaEvolve atua como um meta-algoritmo que descobre automaticamente os procedimentos de pesquisa necessários, onde historicamente era preciso conceber manualmente algoritmos específicos. Este resultado ilustra as capacidades do AlphaEvolve para além das otimizações de kernels da Google pelas quais já era conhecido.

🔗 Tweet de Pushmeet Kohli

Gemini Embedding 2: primeiro embedding multimodal da Google

10 de março de 2026 — A Google anuncia o Gemini Embedding 2, descrito como “our most capable and first fully multimodal embedding model”. É o primeiro modelo de embedding nativamente multimodal da Google, disponível para programadores via Gemini API e AI Studio.

🔗 Tweet @googleaidevs

GitHub Copilot: revisão de código a partir do terminal e avanços JetBrains

11 de março de 2026 — Duas atualizações notáveis para o GitHub Copilot.

Code Review a partir do GitHub CLI v2.88.0

Agora é possível solicitar uma revisão de código Copilot diretamente a partir do terminal. Os comandos gh pr edit --add-reviewer @copilot (modo não interativo) e gh pr create (modo interativo) integram o Copilot ao lado dos colegas de equipa. A seleção de revisores beneficia de uma pesquisa dinâmica, o que melhora o desempenho em grandes organizações e corrige problemas de acessibilidade. Disponível em todos os planos que incluem Copilot code review — atualização para o GitHub CLI v2.88.0 necessária.

🔗 Code Review a partir do GitHub CLI

Melhorias agentic para JetBrains IDEs

A atualização do plugin JetBrains traz em disponibilidade geral (GA): agentes personalizados (custom agents), subagentes e agente de planeamento (plan agent), bem como a seleção automática de modelo para todos os planos. Em pré-visualização pública (public preview): os hooks de agente (userPromptSubmitted, preToolUse, postToolUse, errorOccurred) via um ficheiro hooks.json em .github/hooks/, e o suporte a ficheiros AGENTS.md e CLAUDE.md.

Outras melhorias completam a atualização: auto-approve configurável por MCP, painel de pensamento para modelos com raciocínio estendido, indicador de uso da janela de contexto e descontinuação do modo Edit no menu.

🔗 Melhorias JetBrains

Explorar um repositório no Copilot na web

Em pré-visualização pública: é possível explorar a árvore de um repositório GitHub diretamente a partir da interface web do Copilot. Os ficheiros selecionados são automaticamente adicionados como referências temporárias ao chat e podem ser tornados permanentes.

🔗 Exploração de repositório no Copilot

Anthropic Sydney e Claude for Office

Sydney, 4.º escritório na Ásia-Pacífico

10 de março de 2026 — A Anthropic anuncia a abertura em breve de um escritório em Sydney, o seu quarto na Ásia-Pacífico (depois de Tóquio, Seul e Singapura). A Austrália é 4.ª no mundo em utilização do Claude.ai por habitante; a Nova Zelândia é 8.ª segundo o mesmo indicador (Anthropic Economic Index). O escritório concentrar-se-á inicialmente em clientes empresariais, startups e investigação.

🔗 Sydney, 4.º escritório na Ásia-Pacífico

Claude for Excel e PowerPoint: contexto partilhado e Skills Office

11 de março de 2026 — Os add-ins Claude for Excel e Claude for PowerPoint recebem duas atualizações importantes: a partilha de contexto entre as duas aplicações (um analista pode extrair dados de um livro Excel e usá-los numa apresentação PowerPoint numa única conversa) e a chegada dos Skills (workflows reutilizáveis com um clique) aos dois add-ins.

Os Skills pré-carregados cobrem os casos de uso mais frequentes: auditoria de fórmulas, construção de modelos LBO/DCF, decks de panorama competitivo, atualização de apresentações com novos dados e revisão de decks de banca de investimento. Os add-ins estão agora disponíveis via Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry para implementações em conformidade. Disponibilidade: Mac e Windows em planos pagos (Pro, Max, Team, Enterprise).

🔗 Claude for Excel e PowerPoint

NVIDIA Nemotron 3 Super, ComfyUI e GTC 2026

11 de março de 2026 — A NVIDIA está muito ativa em torno da GTC 2026.

Nemotron 3 Super oferece um débito 5 vezes superior para IA agentic em comparação com a geração anterior. Trata-se de um modelo MoE (Mixture of Experts) de 120 mil milhões de parâmetros em open source, otimizado para cargas de inferência de alta frequência.

NVIDIA e ComfyUI anunciaram durante a GDC 2026 (Game Developers Conference) uma integração que simplifica a geração de vídeo por IA local para programadores de jogos e criadores, com suporte aos modelos FLUX e LTX-Video.

O blog da NVIDIA GTC 2026 Live Updates reúne os anúncios em direto da conferência em San Jose — a Mistral AI também apresenta aí os seus modelos frontier neste contexto.

🔗 Nemotron 3 Super 🔗 ComfyUI GDC 🔗 GTC 2026 Live

Em resumo

Runway Labs — A Runway lança uma incubadora interna dirigida por Alejandro Matamala Ortiz (cofundador, diretor de inovação). A Runway Labs irá prototipar aplicações radicalmente novas para vídeo generativo e modelos de simulação do mundo (General World Models) em setores variados: cinema, saúde, educação, videojogos, publicidade, imobiliário. Recrutamento aberto.

🔗 Introducing Runway Labs

Claude Code /btw — Um novo comando /btw permite ter conversas laterais (side chain conversations) enquanto uma tarefa está em execução, sem interromper o trabalho em curso.

🔗 Tweet @bcherny

NotebookLM Flashcards — Atualização dos quizzes e flashcards: retomar de onde se tinha parado, acompanhamento dos flashcards acertados ou falhados, possibilidade de eliminar ou baralhar os flashcards.

🔗 Tweet NotebookLM

Meta Canopy Height Maps v2 — A Meta e o World Resources Institute publicam o CHMv2, uma nova versão dos mapas de altura do dossel florestal mundial. O modelo DINOv3 (visão auto-supervisionada da Meta) melhora a precisão e a cobertura mundial. Aplicações: migração climática, restauração florestal, planeamento urbano. Modelos disponíveis em open source.

🔗 Canopy Height Maps v2

Z.ai GLM-5 — O GLM-5 está agora acessível aos utilizadores Lite (nível gratuito), depois de ter ficado reservado aos utilizadores Pro desde o seu lançamento em fevereiro de 2026.

🔗 Tweet @ZixuanLi_

O que isso significa

O dia 11 de março de 2026 ilustra duas tendências de fundo que convergem.

A primeira é a plataformização da agenticidade: OpenAI, Perplexity e GitHub publicam no mesmo dia primitivas complementares (shell tools, sandboxes, agent hooks, code review). O ecossistema estrutura-se em torno de blocos reutilizáveis — skills, contentores, subagentes — que permitem aos programadores construir agentes fiáveis sem reinventar a infraestrutura.

A segunda é a corrida ao silício custom: o detalhe que a Meta publica sobre as suas quatro gerações MTIA em dois anos revela uma estratégia clara de independência face aos GPU de grande público, calibrada para inferência em grande escala. A mesma lógica leva a NVIDIA a publicar o Nemotron 3 Super no próprio dia da GTC, onde os anúncios se acumulam.

A criação do Anthropic Institute insere-se num movimento mais discreto, mas duradouro: à medida que as capacidades progridem, as grandes empresas de IA estruturam as suas equipas de impacto público — não mais como comunicação de fachada, mas como um esforço de investigação por direito próprio.

Fontes

Este documento foi traduzido da versão fr para a língua pt utilizando o modelo gpt-5.5. Para mais informações sobre o processo de tradução, consulte https://gitlab.com/jls42/ai-powered-markdown-translator