Anthropic revela a autoaperfeiçoamento recursivo da IA, NVIDIA Nemotron 3 Ultra open-source, Suno capta 400M USD

O 4 de junho de 2026 começa com uma publicação histórica do Anthropic Institute: a IA já está a acelerar o seu próprio desenvolvimento, com mais de 80% do código da Anthropic escrito por Claude e um ganho de produtividade de ×8. Ao mesmo tempo, a NVIDIA lança Nemotron 3 Ultra, um modelo MoE de 550 mil milhões de parâmetros totalmente open-source para agentes. A OpenAI disponibiliza Dreaming v3, uma nova arquitetura de memória para o ChatGPT 5× mais barata. O GitHub Copilot ultrapassa a marca de um milhão de tokens de contexto. E a Suno anuncia uma ronda de financiamento Série D de $400 milhões, elevando a sua avaliação para $5,4 mil milhões.

Anthropic Institute — “When AI builds itself” : o autoaperfeiçoamento recursivo documentado

4 de junho — O Anthropic Institute publica “When AI builds itself”, a primeira documentação oficial, com números internos, sobre a progressão para um possível autoaperfeiçoamento recursivo da IA. As coautoras Marina Favaro e Jack Clark apresentam dados internos de maio de 2026 que mostram que Claude escreve agora a maior parte do código da Anthropic.

Indicador	Valor (maio de 2026)
Parte do código da Anthropic escrito por Claude	>80% das linhas mescladas em produção
Ganho de produtividade código/engenheiro	×8 no Q2 2026 vs 2024
Taxa de sucesso em tarefas abertas	76% (+50 pontos em 6 meses)
Speedup de otimização de código (Mythos Preview)	~52× vs ~3× para Opus 4 (maio de 2025)
Decisões de investigação melhores do que o humano	64% (Mythos Preview vs 51% para Opus 4.5 em nov. de 2025)
Inquérito interno — ganho de produtividade estimado	×4 com Mythos Preview (130 funcionários, março de 2026)

A progressão da duração da tarefa autónoma é particularmente marcante: Claude Opus 3 geria tarefas de cerca de 4 minutos em março de 2024, Claude Sonnet 3.7 atingia 1h30 em março de 2025, Claude Opus 4.6 opera durante 12 horas em março de 2026, e Mythos Preview ultrapassa 16 horas (limite de medição do benchmark METR) em maio de 2026. A duração duplica aproximadamente a cada 4 meses.

Um resultado concreto: em abril de 2026, agentes Claude resolveram um problema aberto de segurança de IA de ponta a ponta — hipóteses, testes, iterações — e recuperaram 97% do ganho de desempenho, contra 23% para dois investigadores humanos ao longo de uma semana, com um custo de cerca de $18 000 em computação ao longo de 800 horas acumuladas.

O artigo explora três cenários: um patamar (considerado o menos provável), uma automatização substancial com direção humana estratégica, e o autoaperfeiçoamento recursivo completo, em que os modelos constroem os seus sucessores sem intervenção humana. O artigo termina com um apelo explícito para uma pausa coordenada e verificável no desenvolvimento de IA frontier, condicionada à participação dos outros grandes labs.

“Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought, and the implications deserve greater attention.”

🇵🇹 Os nossos dados internos mostram que Claude acelera o desenvolvimento da IA — um possível caminho para o autoaperfeiçoamento recursivo, ou para a IA construir autonomamente um sucessor mais capaz. Isto está a acontecer mais depressa do que o previsto, e as implicações merecem uma atenção redobrada. — @AnthropicAI

🔗 Artigo do Anthropic Institute

NVIDIA Nemotron 3 Ultra — 550B MoE open-source para agentes de longa duração

4 de junho — A NVIDIA lança Nemotron 3 Ultra, um modelo frontier open-source de 550 mil milhões de parâmetros concebido especificamente para agentes de IA de longa duração (long-running agents). Este lançamento é a concretização efetiva dos pesos open-source — após o anúncio inicial durante o Microsoft Build em 2 de junho, os pesos já estão disponíveis no HuggingFace e via Ollama Cloud.

Característica	Valor
Arquitetura	Híbrida Mamba-Transformer MoE
Parâmetros totais	550 mil milhões
Parâmetros ativos	55 mil milhões (NVFP4)
Velocidade de inferência	5× mais rápida do que modelos frontier open-source comparáveis
Redução de custo agentico	-30%
Pesos HuggingFace	`nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4`
Acesso cloud	Ollama Cloud
Harnesses de agentes suportados	OpenClaw, Hermes Agent (NousResearch), LangChain

A arquitetura híbrida Mamba-Transformer MoE permite realizar mais ciclos de raciocínio com o mesmo orçamento de tempo — é isso que explica o ganho de velocidade. O Nemotron 3 Ultra é pós-treinado para tarefas complexas: coding avançado, pesquisa aprofundada, planeamento, utilização de ferramentas e recuperação após falhas.

A NVIDIA também publica os dados sintéticos e as receitas de pós-treino, o que permite a equipas externas reproduzir ou afinar o processo.

“Today we’re shipping Nemotron 3 Ultra. A 550B MoE frontier-intelligence open model built for long-running agents. It delivers 5x faster inference and lowers the cost of complex agentic tasks by up to 30% versus other open frontier models.”

🇵🇹 Hoje entregamos o Nemotron 3 Ultra. Um modelo MoE open-source de nível frontier com 550 mil milhões de parâmetros, concebido para agentes de longa duração. Oferece uma inferência 5× mais rápida e reduz em 30% o custo de tarefas agenticas complexas em comparação com outros modelos frontier open-source. — @NVIDIAAI

🔗 HuggingFace — Nemotron 3 Ultra

Dreaming v3 — uma nova arquitetura de memória para o ChatGPT

4 de junho — A OpenAI lança Dreaming v3, uma arquitetura de memória autónoma totalmente redesenhada para o ChatGPT. O sistema resolve as três limitações do mecanismo anterior: a frescura da informação, a sua correção ao longo do tempo, e a escalabilidade para utilizadores Free.

Objetivo	Descrição
Continuidade contextual	Memorizar a informação uma vez, reutilizá-la em futuras conversas
Respeito pelas preferências	Aplicar as restrições pessoais (alimentação, fuso horário, etc.)
Atualização temporal	Rever automaticamente as memórias — depois de uma viagem, a IA sabe que já regressou

O histórico do sistema: as saved memories chegaram em abril de 2024 (declaração manual), depois “Dreaming v0” em abril de 2025 (síntese automática em segundo plano). A versão 3 é autonomamente arquitetural, ~5× mais barata de servir — foi esta redução de custo que tornou possível a extensão aos utilizadores Free.

Disponibilidade: hoje para os subscritores Plus e Pro nos Estados Unidos; extensão prevista para os outros países e para os utilizadores Free e Go nas próximas semanas.

Uma página “Memory Summary” permite consultar um resumo legível do que o ChatGPT sabe sobre o utilizador, adicionar ou corrigir informações, e definir regras sobre os tópicos a abordar.

🔗 openai.com — Dreaming

Suno Série D — $400 milhões para uma avaliação de $5,4 mil milhões

3 de junho — A Suno anuncia uma ronda de financiamento Série D de $400 milhões, elevando a avaliação da plataforma de música generativa para $5,4 mil milhões. A ronda é liderada pela Bond Capital, com a participação de novos investidores (IVP, USV — Union Square Ventures, Forerunner Ventures) e o apoio renovado da Matrix VC, Lightspeed e Menlo Ventures.

A trajetória de avaliação é notável: $125 milhões captados em maio de 2024, depois $250 milhões em novembro de 2025 para uma avaliação de $2,45 mil milhões, e agora $5,4 mil milhões — mais do dobro em sete meses.

A Suno afirma-se como uma das plataformas criativas de IA melhor financiadas do mundo, com uma missão que se mantém constante: permitir que mais pessoas experimentem a alegria de criar música, sem constrangimentos técnicos.

“We’re thrilled to announce Suno’s next chapter: a $400M Series D at a $5.4B valuation!”

🇵🇹 Temos o prazer de anunciar o próximo capítulo da Suno: uma Série D de $400 milhões para uma avaliação de $5,4 mil milhões! — @suno

🔗 Blog da Suno — The Next Chapter

GitHub Copilot — janela de contexto de 1M tokens e raciocínio configurável

4 de junho — O GitHub Copilot integra duas novas capacidades importantes disponíveis a partir de hoje no VS Code, no Copilot CLI e na aplicação GitHub Copilot.

Capacidade	Disponibilidade	Impacto em créditos de IA
Janela de contexto 1M tokens	VS Code, Copilot CLI, app Copilot	Mais elevado
Níveis de raciocínio configuráveis	VS Code, Copilot CLI, app Copilot	Mais elevado

A janela de contexto de um milhão de tokens permite trabalhar em bases de código maiores, documentos mais longos e projetos multi-ficheiro complexos sem perder o fio à meada. Até agora, os limites de contexto obrigavam os programadores a fragmentar o trabalho ou a simplificar os pedidos em projetos complexos.

Os níveis de raciocínio configuráveis permitem calibrar o equilíbrio entre velocidade e profundidade e ativar o “pensamento estendido” (extended thinking) para os desafios arquiteturais e de depuração mais complexos. O GitHub recomenda reservar as definições máximas para problemas complexos multi-ficheiro — a utilização de contexto estendido ou de raciocínio superior consome mais créditos de IA por interação.

A extensão para outras superfícies do Copilot está prevista nas próximas semanas.

🔗 GitHub Changelog — Larger context windows

GitHub Copilot — atualizações de 4 de junho

Copilot no Visual Studio — Atualização de maio de 2026

4 de junho — A atualização de maio de 2026 para o Copilot no Visual Studio 2026 reforça o planeamento e a revisão colaborativa.

Agent Plan: explora o repositório em modo apenas leitura, coloca perguntas de clarificação e gera um plano detalhado guardado em .copilot/plans/plan-{titre}.md. Um botão “Implement plan” muda para o modo agente.
Painel Skills: lista todas as competências de agentes detetadas a partir do espaço de trabalho e do perfil do utilizador, com pesquisa por nome ou palavra-chave.
Diff resumido multi-ficheiro: após alterações do Copilot em vários ficheiros, uma vista “change summary” para aceitar ou anular alterações a nível global, por ficheiro ou por bloco.
Indicador de utilização da janela de contexto: ícone no topo da caixa de introdução com opção “Summarize conversation” para libertar espaço.
Adicionar commits em contexto: clique direito num commit no Git History para o anexar como contexto no Copilot Chat.

🔗 GitHub Changelog — Visual Studio May update

Copilot Chat em github.com — contexto de PR enriquecido (disponibilidade geral)

4 de junho — O Copilot Chat passa de pré-visualização pública para disponibilidade geral para todos os titulares de uma licença Copilot, com capacidades enriquecidas ao trabalhar em diffs e pull requests em github.com.

Código e chat lado a lado: consulta da conversa mesmo ao lado do código, comentários e alterações inline sem alternar entre a PR e a janela de chat.
Contexto carregado automaticamente: quando uma pergunta diz respeito a um diff ou a uma PR, o contexto relevante é injetado automaticamente — já não é preciso copiar e colar excertos.
Acesso: botão “Ask about this diff” no topo de cada diff, ou através do menu dropdown ao realçar uma linha de código.

🔗 GitHub Changelog — Copilot Chat PR context

Claude Code v2.1.162

3 de junho — A versão v2.1.162 do Claude Code traz várias melhorias de UX e correções importantes para agentes.

Funcionalidade	Descrição
`claude agents --json` + `waitingFor`	O JSON inclui agora o motivo de bloqueio de uma sessão em espera (ex.: prompt de permissões)
`/effort` persistência confirmada	Confirmação explícita quando o nível escolhido passa a ser o padrão para novas sessões
Autocomplete de slash command	Um clique preenche o comando no prompt sem o executar — Enter para confirmar
Remote Control footer pill	O Remote Control aparece como um pill persistente no fundo com ligação para a sessão
Renomeação Windsurf → Devin Desktop	Atualizado em `/ide`, `/terminal-setup`, `/scroll-speed`

Entre as correções: bloqueio silencioso no arranque se o diretório de configuração estiver em modo de leitura apenas (o Claude Code agora inicia com uma configuração em memória), regras WebFetch não aplicadas em domínios pré-aprovados, permissões Windows com backslashes, e várias correções para agentes (Ctrl+V de imagens, sessões perdidas ao fazer backgrounding, largura do terminal em sessões longas).

🔗 Releases Claude Code v2.1.162

ElevenLabs — Flows Agent e parceria Hasbro

Flows Agent no ElevenCreative

4 de junho — A ElevenLabs lança Flows Agent na sua interface ElevenCreative. O utilizador descreve o que quer criar e o agente constrói automaticamente o pipeline completo — ligando mais de 50 modelos de imagem e vídeo às ferramentas de voz, música e efeitos sonoros disponíveis na plataforma, num único canvas unificado.

Um modo “assist” permite que o agente peça validação antes de cada operação paga para manter o controlo dos custos. As equipas de marketing podem assim encadear modalidades e testar variantes criativas em diferentes produtos, idiomas e formatos sem configurar manualmente cada etapa.

🔗 ElevenLabs Flows

ElevenLabs × Hasbro — vozes de personagens licenciadas no Iconic Marketplace

3 de junho — A ElevenLabs associa-se à Hasbro para disponibilizar vozes oficiais de personagens (My Little Pony, Transformers, G.I. Joe) através do Iconic Marketplace. As vozes são construídas em parceria com a Hasbro e com os talentos vocais originais, com direitos de utilização claramente definidos para programadores, empresas e criadores de aplicações. A oferta visa combinar criatividade de IA e proteção dos direitos de propriedade intelectual das marcas.

🔗 Tweet ElevenLabs × Hasbro

GPT-Rosalind — novas capacidades para as ciências da vida

3 de junho — A OpenAI anuncia uma atualização importante do GPT-Rosalind, o seu modelo especializado para investigação em ciências da vida à escala enterprise. O modelo combina as capacidades agenticas do GPT-5.5 com uma inteligência reforçada em química medicinal e genómica.

Benchmark	Domínio	Pontuação GPT-Rosalind	Pontuação GPT-5.5	Redução de tokens
LifeSciBench	Ciências da vida (6 domínios)	Melhor	—	—
MedChemBench	Química medicinal	27,5%	25,1%	-7,2%
GeneBench	Genómica	21,6%	20,4%	-31%
LabWorkBench	Protocolos wet lab	63,2%	55,8%	-5,3%

Dois novos plugins estão agora acessíveis a todos os utilizadores Codex: Life Sciences Research plugin (recuperação de provas com fontes) e Life Sciences NGS Analysis plugin (workflows bioinformáticos scRNA-seq, bulk RNA-seq). Novo Nordisk é o primeiro parceiro anunciado. O acesso é alargado globalmente às organizações qualificadas (investigação científica legítima, governação sólida).

🔗 openai.com — GPT-Rosalind

Perplexity lança o Main Street AI Accelerator com a SBA dos EUA

4 de junho — A Perplexity lança o Main Street AI Accelerator em parceria com a U.S. Small Business Administration (SBA). O programa disponibiliza $25 milhões em créditos do Perplexity Computer: $250 em créditos para até 100 000 empresas elegíveis, em referência ao 250º aniversário dos Estados Unidos.

São elegíveis as empresas beneficiárias dos empréstimos 7(a), 504 e microempréstimos da SBA. As candidaturas ainda não estão abertas; há uma lista de espera disponível na página dedicada. A iniciativa faz parte da estratégia da Perplexity de expandir o Computer para o tecido econômico local americano, após ter anunciado na semana anterior as mais de 400 integrações enterprise do Computer (Intuit QuickBooks, Vercel, Shopify, Canva).

🔗 Main Street AI Accelerator

Cohere vence o 1º prêmio do desafio da OTAN sobre IA agentiva

4 de junho — A Cohere vence o primeiro lugar do concurso NATO Agentic AI for Cognitive Warfare Innovation Challenge. O pódio completo:

Cohere (1º lugar)
OpenMinds (2º lugar)
Ipsos & Thoughtworks (3º lugar, ex aequo)

A competição destaca o papel crescente da IA agentiva para ajudar as nações democráticas a entender, antecipar e responder às ameaças informacionais. Para a Cohere, esse reconhecimento da OTAN confirma seu posicionamento em IA soberana para os setores de defesa e governo — um eixo central desde sua fusão transatlântica com a Aleph Alpha em abril de 2026.

🔗 Cohere — Desafio da OTAN

Pika — Group Chat com agente de IA no iOS

4 de junho — A Pika lança o primeiro Group Chat integrado com um agente de IA em seu aplicativo. Os usuários convidam seus contatos para um chat de grupo onde o Pika Agent participa da conversa criativa — ajuda para configurar um telefone, criar memes em grupo, colaborar em formatos curtos de vídeo. Disponível agora no iOS via https://pika.me.

🔗 Tweet da Pika

Breves

Artigo da Anthropic — analytics em autoatendimento com Claude — A equipe da Anthropic publica suas boas práticas para construir agentes de análise de dados em autoatendimento com Claude: competências (skills), fundamentos de dados e avaliações. 🔗 Blog do Claude
Google Antigravity v2.0.11 — Patch de estabilidade para o IDE impulsionado por Gemini: dois correções (travamentos na inicialização e botão “Open IDE”), nenhum novo recurso. 🔗 Changelog do Antigravity
GitHub Enterprise Teams GA — Enterprise Teams entra em disponibilidade geral no GitHub Enterprise Cloud: grupos definidos uma única vez no nível da empresa, atribuíveis a todas as organizações, com SCIM, GitHub Apps e auditoria completa. Até 2 500 equipes e 5 000 membros por equipe. 🔗 Changelog do GitHub
Genspark — parceiro de lançamento do Agent365 no Microsoft Build — O cofundador Ray Zhong subiu ao palco no Microsoft Build como parceiro estratégico global e parceiro de lançamento do Agent365, integrando IA agentiva à infraestrutura enterprise Microsoft existente. 🔗 Tweet da Genspark
Cohere apoia a estratégia nacional de IA do Canadá — O CEO Aidan Gomez reafirma o enraizamento canadense da Cohere, saudando a nova estratégia nacional de IA do Canadá como um passo importante rumo à soberania tecnológica e à construção da IA de próxima geração no país. 🔗 Tweet da Cohere

O que isso significa

A autoaperfeiçoamento da IA passa do cenário teórico para dados internos medidos. A publicação do Anthropic Institute não é especulação — é um relatório de campo com números precisos: >80% do código, ×8 de produtividade, 76% de taxa de sucesso em tarefas abertas. A duração das tarefas autônomas que dobra a cada 4 meses é o sinal mais concreto da dinâmica em curso. O que era discutido em círculos de segurança de IA como um risco futuro agora está documentado como uma realidade presente. O apelo por uma pausa coordenada — com a Anthropic como primeira signatária — ilustra a tensão entre competição comercial e prudência regulatória.

O open-source de nível frontier muda de dimensão. Nemotron 3 Ultra com 550 bilhões de parâmetros — totalmente open-source, pesos baixáveis, dados sintéticos e receitas publicadas — redefine o que “open-source” significa para modelos frontier. A velocidade de inferência 5× superior e a redução de custo de 30% para tarefas agentivas não são marginais: elas tornam viável a execução de agentes complexos fora das grandes clouds proprietárias. Para as equipes que constroem agentes autônomos, essa é uma nova infraestrutura que se estabelece.

A ferramenta para desenvolvedores se consolida em torno do agente de longa duração. GitHub Copilot com 1M tokens de contexto, Claude Code v2.1.162 com waitingFor no JSON agents, Flows Agent da ElevenLabs que constrói pipelines multimodais — esses três anúncios compartilham o mesmo paradigma: o agente deve gerenciar contextos longos, comunicar seu estado a outros sistemas e orquestrar várias ferramentas sem intervenção humana. O “raciocínio configurável” do Copilot e o /effort persistente do Claude Code respondem à mesma pergunta: como o usuário pode calibrar a profundidade de reflexão de acordo com a complexidade da tarefa?

A economia da IA criativa atinge um patamar simbólico. A valorização da Suno em $5,4 bilhões em sete meses — com uma duplicação de valor — sinaliza que os investidores apostam em uma plataforma de criação musical generativa em escala de consumo de massa. Combinado às captações recentes em vídeo (Runway, Pika), o setor de criação com IA agora dispõe de uma capitalização comparável à dos grandes editores de software criativo tradicionais. A entrada da Hasbro no Iconic Marketplace da ElevenLabs ilustra como os detentores de direitos de propriedade intelectual se adaptam: em vez de bloquear a IA, eles a monetizam por licença.