Pesquisar

Project Glasswing e Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

Project Glasswing e Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

A semana de 5 a 9 de abril de 2026 foi dominada por dois anúncios importantes: a Anthropic revelou o Project Glasswing, uma coalizão de onze grandes empresas de tecnologia em torno do Claude Mythos Preview para detectar vulnerabilidades zero-day em grande escala, enquanto a Meta fazia seu retorno com o Muse Spark, seu primeiro modelo não open-weights em um ano. Em paralelo, Google, OpenAI, GitHub e Perplexity publicaram cada uma atualizações notáveis para seus desenvolvedores e usuários.


Project Glasswing e Claude Mythos Preview

7 de abril de 2026 — A Anthropic anunciou o Project Glasswing, uma iniciativa de segurança de software reunindo onze organizações: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, The Linux Foundation, Microsoft, NVIDIA e Palo Alto Networks. A iniciativa se apoia nas capacidades de um novo modelo frontier com acesso restrito: Claude Mythos Preview.

O que o Mythos Preview faz

O modelo demonstrou capacidade de identificar milhares de vulnerabilidades zero-day nos principais sistemas operacionais e browsers web, incluindo algumas que estavam ocultas havia várias décadas. Três exemplos concretos ilustram a dimensão das descobertas:

  • Uma falha de 27 anos no OpenBSD que permite derrubar remotamente qualquer máquina conectada
  • Uma vulnerabilidade de 16 anos no FFmpeg, escondida em uma linha de código testada mais de cinco milhões de vezes sem ser detectada
  • Várias falhas no kernel Linux que permitem escalada de privilégios até o controle total da máquina

Esses exemplos mostram que o Mythos Preview não faz detecção superficial — ele encontra erros de lógica enterrados em bases de código críticas, auditadas continuamente por milhares de pesquisadores há anos.

Benchmarks

O desempenho do Mythos Preview nos benchmarks de referência marca um avanço claro em relação ao Opus 4.6 :

BenchmarkMythos PreviewOpus 4.6
SWE-bench Verified93,9 %80,8 %
SWE-bench Pro77,8 %53,4 %
Terminal-Bench 2.082,0 %65,4 %
SWE-bench Multilingual87,3 %77,8 %
CyberGym (cibersegurança)83,1 %66,6 %
GPQA Diamond94,6 %91,3 %
Humanity’s Last Exam (sem tools)56,8 %40,0 %

O salto no SWE-bench Verified — de 80,8 % para 93,9 % — é particularmente significativo: trata-se do benchmark mais usado para medir a capacidade de um modelo de resolver bugs reais em repositórios open source reais. No CyberGym, dedicado à cibersegurança, o ganho de mais de 16 pontos coloca o Mythos Preview em uma categoria à parte para tarefas de segurança ofensiva e defensiva.

Compromisso financeiro e governança

A Anthropic compromete-se com 100 milhões de dólares em créditos de uso para os parceiros do projeto, acompanhados de 4 milhões de dólares em doações diretas a organizações de segurança open source :

  • US$ 2,5 milhões para Alpha-Omega e a OpenSSF via a Linux Foundation
  • US$ 1,5 milhão para a Apache Software Foundation

Esse nível de compromisso financeiro indica que a Anthropic posiciona o Glasswing como uma iniciativa de longo prazo, e não como uma simples parceria de comunicação. O relatório sobre as vulnerabilidades corrigidas será publicado em até 90 dias.

Disponibilidade e preços

O Mythos Preview não é disponibilizado publicamente de imediato. Uma vez concluída a fase inicial de créditos, o modelo ficará acessível aos participantes pelo preço de US25/US 25/US 125 por milhão de tokens (entrada/saída), via a API Claude, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.

Um relatório técnico detalhado sobre as vulnerabilidades e exploits descobertos está disponível no blog Red Team da Anthropic, e a system card completa foi publicada em anthropic.com.

“This project represents a watershed moment for AI-assisted cybersecurity — not because of what Claude can do today, but because of what it will be able to do as capabilities continue to scale.”

🇵🇹 Este projeto representa um momento decisivo para a cibersegurança assistida por IA — não por causa do que o Claude pode fazer hoje, mas por causa do que ele será capaz de fazer à medida que as capacidades continuam a escalar. — Anúncio oficial da Anthropic

🔗 Project Glasswing · System Card Mythos Preview · Relatório Red Team


Meta Muse Spark: retorno da Meta com um modelo fechado

8 de abril de 2026 — A Meta anunciou o Muse Spark, o primeiro modelo da nova família “Muse”, desenvolvido pela Meta Superintelligence Labs (MSL) — uma nova entidade interna dedicada à pesquisa em IA avançada. Este é o primeiro modelo da Meta desde o Llama 4 em abril de 2025, ou seja, um ano de silêncio, e sobretudo o primeiro modelo da Meta não disponível em open-weights.

Capacidades e posicionamento

O Muse Spark é posicionado como um passo em direção à “superinteligência pessoal” (personal superintelligence). O modelo cobre vários domínios com capacidades avançadas:

DomainDescription
MultimodalPercepção e compreensão visual avançada, integração cruzada de informações visuais
RaciocínioRaciocínio passo a passo, pensar antes de responder (test-time reasoning)
SaúdeAnálise de imagens médicas, recomendações alimentares personalizadas
AgenticCapacidades agentic para tarefas complexas
Contemplating modeOrquestração de vários agentes raciocinando em paralelo (implantação progressiva)

O modelo integra a “compressão de pensamento” (thought compression) para otimizar os tokens de raciocínio, e suporta test-time scaling por meio de vários agentes paralelos. O modo Contemplating, ainda em implantação progressiva, é uma das funcionalidades mais aguardadas: ele permite atribuir vários agentes ao mesmo problema em paralelo, cada um raciocinando de forma independente antes da síntese.

Desempenho

Segundo a Artificial Analysis (8 de abril de 2026), o Muse Spark atinge uma pontuação de 52 no Artificial Analysis Intelligence Index, o que o coloca no top 4 mundial atrás de Gemini 3.1 Pro, GPT-5.4 e Claude Opus 4.6. Um retorno notável para a Meta, que volta diretamente à arena dos melhores modelos frontier.

Arquitetura

A Meta descreve três eixos de scaling para o Muse Spark:

  1. Pré-treinamento: reformulação completa do stack ao longo de nove meses, com melhorias de arquitetura e de dados
  2. Aprendizado por reforço (Reinforcement Learning): amplificação escalável das capacidades pós-pré-treinamento
  3. Test-time reasoning: raciocínio estendido sem aumento de latência graças à paralelização de agentes

Segurança e disponibilidade

A Meta informa ter conduzido avaliações aprofundadas por meio do seu Advanced AI Scaling Framework v2. A Apollo Research realizou avaliações de terceiros em um checkpoint pré-lançamento e constatou comportamentos de recusa sólidos em domínios de alto risco (biologia, etc.).

O Muse Spark está disponível desde 8 de abril em meta.ai e no app Meta AI. O acesso à API está em preview privada para parceiros selecionados — sem acesso público imediato.

🔗 Blog da Meta AI — Muse Spark · Tweet de anúncio · Benchmark da Artificial Analysis


Anthropic: infraestrutura e agentes

Parceria Google + Broadcom — vários gigawatts de TPU a partir de 2027

6 de abril de 2026 — A Anthropic anunciou um acordo com Google e Broadcom envolvendo vários gigawatts de capacidade de computação TPU de nova geração, que deve entrar em operação a partir de 2027. Trata-se do maior compromisso de infraestrutura da história da Anthropic.

O contexto de crescimento é significativo:

  • A receita anualizada (run-rate revenue) agora supera 30 bilhões de dólares, contra cerca de 9 bilhões no fim de 2025
  • Mais de 1.000 clientes corporativos gastam cada um mais de um milhão de dólares por ano, contra 500+ em fevereiro de 2026 — ou seja, uma duplicação em menos de dois meses

“This groundbreaking partnership with Google and Broadcom is a continuation of our disciplined approach to scaling infrastructure: we are building the capacity necessary to serve the exponential growth we have seen in our customer base while also enabling Claude to define the frontier of AI development.”

🇵🇹 Esta parceria inovadora com Google e Broadcom é uma continuação da nossa abordagem disciplinada de ampliação da infraestrutura: estamos construindo a capacidade necessária para atender ao crescimento exponencial que vimos na nossa base de clientes e, ao mesmo tempo, permitir que o Claude defina a fronteira do desenvolvimento de IA. — Krishna Rao, CFO da Anthropic

A maior parte da nova capacidade de computação será instalada nos Estados Unidos, na continuidade do compromisso de novembro de 2025 de investir 50 bilhões de dólares em infraestrutura americana. O Claude continua sendo o único modelo frontier disponível nas três grandes plataformas cloud: AWS Bedrock, Google Cloud Vertex AI e Microsoft Azure Foundry.

🔗 Anúncio da parceria

Managed Agents — arquitetura desacoplada, latência reduzida em 90 %

8 de abril de 2026 — O Engineering Blog da Anthropic publicou um artigo técnico detalhando a arquitetura de Managed Agents, o serviço hospedado para executar agents long-running na plataforma Claude.

A ideia central é o desacoplamento do cérebro (Claude e seu harness) das mãos (sandbox de execução, tools) e da sessão (registro de eventos). Cada componente torna-se uma interface independente, substituível e escalável separadamente.

Resultados medidos do desacoplamento:

MétricaMelhoria
p50 TTFT (tempo até o primeiro token)-60 %
p95 TTFT-90 %

O desacoplamento também resolve dois problemas de segurança: o isolamento de credentials (os tokens OAuth nunca ficam acessíveis a partir do sandbox de execução do código) e a resiliência (se o harness cai, um novo reinicia a partir do último evento de sessão sem perda de contexto).

🔗 Escalando Managed Agents


Google Gemini

Gemini CLI v0.37.0 — Sandbox dinâmico, Chapters e Browser persistente

8 de abril de 2026 — A versão v0.37.0 do Gemini CLI introduz três evoluções para os workflows de desenvolvedores:

FeatureDescription
Dynamic Sandbox ExpansionExpansão dinâmica do sandbox + suporte worktree para Linux e Windows
Chapters (Narrative Flow)Agrupamento temático das tools em “capítulos” para uma melhor estrutura de sessão
Advanced Browser CapabilitiesSessões de browser persistentes e descoberta dinâmica de tools no browser agent

A funcionalidade Chapters traz continuidade narrativa às sessões longas: cada grupo de ações forma um “capítulo” com sua própria lógica, o que facilita o acompanhamento e a retomada de uma sessão complexa. O browser agent ganha persistência — as sessões permanecem ativas entre chamadas, e as tools disponíveis são descobertas dinamicamente.

🔗 Changelog do Gemini CLI

Simulações interativas e modelos 3D no Gemini App

9 de abril de 2026 — O Gemini App agora pode transformar conceitos complexos em visualizações interativas diretamente no chat. Um usuário pode ajustar parâmetros físicos em tempo real (velocidade, gravidade, massa) e ver o efeito em uma simulação funcional — órbita lunar, rotação de moléculas, sistemas dinâmicos. Disponível globalmente com o modelo Pro na barra de prompt. Não disponível para contas Education e Workspace no momento.

🔗 Simulações 3D no Gemini App

Notebooks Gemini — sincronização com NotebookLM

8 de abril de 2026 — A Google lança os Notebooks no Gemini App: espaços de trabalho persistentes que sincronizam Gemini App e NotebookLM para projetos complexos. Os notebooks permitem organizar conversas, instruções personalizadas e arquivos (documentos, PDF). Uma fonte adicionada no Gemini App aparece automaticamente no NotebookLM, e vice-versa. Disponível nesta semana para assinantes Google AI Ultra, Pro e Plus no web. Mobile e acesso gratuito virão em breve.

🔗 Notebooks Gemini + NotebookLM


OpenAI

Novo plano Pro a US$ 100/mês — 5x mais Codex

9 de abril de 2026 — A OpenAI introduz um novo plano Pro a **US100/me^s,posicionadoentreoplanoPlus( US 100/mês**, posicionado entre o plano Plus (~US 20/mês) e o Pro existente a US$ 200/mês. Ele oferece cinco vezes mais uso de Codex do que o plano Plus, concebido para sessões longas e intensivas.

TierPriceCodex Usage
Plus~US$ 20/mêsStandard
Pro (novo)US$ 100/mês5× Plus
Pro (existente)US$ 200/mêsMaximum

Em paralelo, a OpenAI estende a promoção de 2x uso de Codex para assinantes existentes de US$ 200/mês até 31 de maio de 2026 e reinicia seus limites de taxa.

”Next phase of enterprise AI” — nota de Denise Dresser

8 de abril de 2026 — A diretora de receitas (Chief Revenue Officer) Denise Dresser publica um resumo após seus primeiros 90 dias. Pontos principais: a atividade enterprise agora representa mais de 40 % da receita (numa trajetória para a paridade com o público geral no fim de 2026), o Codex ultrapassa 3 milhões de usuários semanais (+5x desde o início de 2026), e o ChatGPT conta com 900 milhões de usuários semanais. A OpenAI apresenta dois eixos estratégicos: OpenAI Frontier (agentes atravessando os sistemas corporativos) e uma superapp de IA unificada para as equipes.

🔗 Next phase of enterprise AI

Safety Fellowship e Child Safety Blueprint

6-8 de abril de 2026 — A OpenAI anuncia duas iniciativas de segurança. O OpenAI Safety Fellowship (6 abr.) é um programa de pesquisa externa aberto até 3 de maio de 2026, remunerado com recursos de computação, para trabalhos sobre avaliação, robustez e supervisão agentic — calendário: 14 de setembro de 2026 a 5 de fevereiro de 2027. O Child Safety Blueprint (8 abr.) propõe um quadro de combate à exploração infantil por IA, co-desenvolvido com o NCMEC, Thorn e a Attorney General Alliance, articulado em torno de três eixos: modernizar as leis sobre conteúdos CSAM gerados por IA, melhorar a denúncia, e incorporar a segurança desde a concepção (safety-by-design).

🔗 Safety Fellowship · Child Safety Blueprint


GitHub Copilot

Scan de segurança OWASP Top 10 desde o terminal 9 de abril de 2026 — O GitHub Copilot CLI integra um workflow de segurança automatizado diretamente a partir do terminal. Em alguns comandos, os desenvolvedores podem lançar uma análise completa no seu repositório, mapear os resultados para as categorias OWASP Top 10 e abrir automaticamente issues GitHub para cada vulnerabilidade detetada — sem sair do ambiente CLI. Um complemento direto ao Project Glasswing para as equipas que já utilizam as ferramentas GitHub.

Agente “Rubber Duck” — revisão automática

8 de abril de 2026 — A equipa GitHub Research lança um agente “Rubber Duck” para o Copilot CLI. Inspirado na técnica clássica de depuração (explicar o próprio código em voz alta para encontrar problemas), o agente analisa automaticamente o código submetido e produz uma revisão estruturada diretamente no terminal. Experimental, mas oficialmente republicado por @github.

🔗 Tweet Copilot CLI OWASP · Tweet Agente Rubber Duck


Perplexity

Integração Plaid — finanças pessoais no Perplexity Computer

9 de abril de 2026 — A Perplexity lança uma integração com a Plaid, permitindo aos utilizadores ligar as suas contas bancárias, cartões de crédito e empréstimos diretamente no Perplexity Computer. O acesso é em apenas leitura — os dados não passam pelos servidores da Perplexity. A rede Plaid cobre mais de 12 000 instituições (Chase, Fidelity, Vanguard, Robinhood, etc.). Casos de uso: cálculo do património líquido, acompanhamento do orçamento, planeador de amortização de dívidas, projeção da reforma. Disponível em computador nos Estados Unidos e no Canadá.

TierFuncionalidades
StandardLigar a carteira, acesso básico ao Portfolio
Pro / MaxAnálises avançadas, painéis interativos

Billion Dollar Build — competição de startups

8 de abril de 2026 — A Perplexity lança o “Billion Dollar Build”, uma competição de 8 semanas em que equipas usam o Perplexity Computer para construir uma empresa com uma trajetória para 1 mil milhão de dólares de valorização. Prémios para os finalistas: até 1 milhão de dólares de investimento do Perplexity Fund + até 1 milhão de dólares em créditos Computer.

🔗 Blog da Integração Plaid · Tweet Billion Dollar Build


Agentes e ferramentas

Manus integra-se no Slack — três modos

6 de abril de 2026 — A Manus (agora afiliada à Meta) lança um conjunto completo de integrações Slack estruturado em torno de três modos: um agente em DM com memória persistente para tarefas pessoais, uma menção @manus nos canais da equipa para tarefas coletivas (sem memória persistente — cada thread é uma nova tarefa) e um conector MCP para automatizar relatórios e resumos em seu nome a partir de manus.im. Disponível no plano pago do Slack.

🔗 Blog Manus para Slack

Genspark AI Workspace 4.0 — Claw Desktop, plugins Office

8 de abril de 2026 — A Genspark lança a versão 4.0 do seu espaço de trabalho de IA com quatro componentes: Claw for Desktop (Computer Use e Browser Use para controlar o computador), plugins Microsoft Office para PowerPoint, Excel e Word, Speakly (tradução em tempo real e tomada de notas em reunião) e Advanced Workflows num novo motor OpenCode.

🔗 Blog da Genspark


Média generativa e hardware

Stability AI Brand Studio — plataforma criativa para marcas

8 de abril de 2026 — A Stability AI lança Brand Studio, uma plataforma completa de produção criativa pensada para equipas de marketing de empresas. O núcleo do sistema assenta no Brand Central Hub: modelos Brand ID treinados com os elementos visuais de uma marca (estilo fotográfico, paleta, padrões, posicionamento do logótipo). O Producer Mode converte uma descrição num plano de produção estruturado e executa-o automaticamente passo a passo. O Curated Model Routing seleciona de forma inteligente o modelo mais adequado entre as ofertas da Stability AI e de terceiros (incluindo Seedream e Nano Banana). Do lado empresarial: SSO, controlos de acesso por função, workflows de aprovação. Parceiro de lançamento: a agência criativa Huge. Disponibilidade: plano Core (teste gratuito) + plano Enterprise.

🔗 Brand Studio por Stability AI

NVIDIA — Semana Nacional da Robótica

9 de abril de 2026 — Por ocasião da Semana Nacional da Robótica, a NVIDIA publica um artigo-recurso sobre as suas tecnologias Physical AI: NVIDIA Cosmos (modelos de fundação do mundo), Isaac Sim (simulação), gama Jetson (edge AI), Nemotron e NemoClaw (open source). Sem anúncio de novo hardware — uma síntese pedagógica do ecossistema robótico da NVIDIA para os developers.

🔗 Semana de Robótica da NVIDIA


Claude Code — atualizações v2.1.94 / v2.1.96 / v2.1.97

Três novas versões publicadas durante a semana.

VersãoDataPontos-chave
v2.1.945-6 abr.Suporte Bedrock powered by Mantle, effort predefinido high para API-key/Bedrock/Enterprise, exibição compacta de links Slack MCP
v2.1.967 abr.Correção de regressão Bedrock: erro 403 "Authorization header is missing" com AWS_BEARER_TOKEN_BEDROCK
v2.1.978-9 abr.Alternância da vista focus Ctrl+O em modo NO_FLICKER, parâmetro refreshInterval na linha de estado, indicador ● N running em /agents, realce de sintaxe Cedar

A v2.1.94 introduz também uma alteração de comportamento notável: os plugins skills declarados via "skills": ["./"] usam agora o campo name do frontmatter em vez do nome do diretório. A v2.1.97 corrige vários problemas de permissões Bash (prefixos de variáveis de ambiente, redireções de rede) e um bug em que regras de permissões cujo nome correspondia a uma propriedade prototype JavaScript (toString, etc.) eram silenciosamente ignoradas em settings.json.

🔗 CHANGELOG do Claude Code


O que isto significa

A semana de 5 a 9 de abril de 2026 marca uma aceleração em duas direções que se cruzam. Por um lado, a Anthropic sai de uma lógica de produto de consumo para entrar numa lógica de infraestrutura crítica: Project Glasswing e a parceria Google/Broadcom sinalizam que a Anthropic se posiciona como fornecedora de capacidades de IA ao nível do ecossistema tecnológico global, e não apenas como concorrente na corrida aos benchmarks. O compromisso de 100 milhões de dólares em créditos e 30 mil milhões de dólares em receitas anualizadas consolida esta leitura.

Por outro lado, a Meta regressa com Muse Spark ao romper com a sua política open-weights. É uma mudança estratégica significativa: a Meta escolhe concorrer no segmento frontier fechado em vez de manter o seu posicionamento open source. A criação da Meta Superintelligence Labs e o primeiro modelo não Llama sinalizam uma profunda reorientação da estratégia de IA do grupo.

Para os developers, a semana é densa mas coerente: o Gemini CLI ganha persistência e estrutura, o GitHub Copilot amplia o seu perímetro de segurança, a Perplexity avança para os dados pessoais e o Claude Code continua o seu ciclo de atualizações rápidas.


Fontes

Este documento foi traduzido da versão fr para a língua pt usando o modelo gpt-5.4-mini. Para mais informações sobre o processo de tradução, consulte https://gitlab.com/jls42/ai-powered-markdown-translator