ai-powered-markdown-translatorArtigo traduzido do fr para o pt com gpt-5.4-mini.
1º de junho de 2026 ficará como um dos dias mais densos da história recente da IA: a Anthropic dá um passo rumo à bolsa com um pedido S-1 confidencial à SEC, enquanto uma onda de “Physical AI” se espalha simultaneamente — NVIDIA Cosmos 3, Cosmos Coalition Runway+NVIDIA, Luma OPAL Lab, MiniMax M3, Qwen-VLA e Qwen3.7-Plus. Ao mesmo tempo, a OpenAI lança Rosalind Biodefense para a preparação contra pandemias e publica uma estrutura de governança alinhada com a TFAIA da Califórnia e a EU AI Act.
Anthropic apresenta confidencialmente um formulário S-1 à SEC
1º de junho — A Anthropic apresentou confidencialmente um projeto de registro no formulário S-1 à Comissão de Valores Mobiliários e Câmbio dos EUA (SEC), com vista a uma oferta pública inicial (IPO) de suas ações ordinárias. Esse depósito confidencial é uma etapa preliminar obrigatória que permite à SEC analisar o documento antes de qualquer oferta pública.
| Elemento | Valor |
|---|---|
| Tipo de depósito | Formulário S-1 confidencial |
| Regulador | SEC (Estados Unidos) |
| Tipo de ação | Ações ordinárias |
| Preço / número de ações | Ainda não definidos |
| Status legal | Depósito preliminar — não é uma oferta de venda |
| Data | 1º de junho de 2026 |
O anúncio informa que a Anthropic mantém a opção de abrir capital assim que a análise da SEC for concluída, mas que a operação final dependerá das condições de mercado e de outros fatores. Esse pedido S-1 ocorre em continuidade direta ao fechamento da Série H (US 965 bilhões) e a uma receita anualizada que teria ultrapassado US$ 47 bilhões em meados de maio de 2026.
A Anthropic continua sendo uma sociedade de benefício público (PBC — Public Benefit Corporation), status que pretende manter após uma eventual listagem — uma distinção jurídica rara que impõe obrigações de interesse público além da busca por lucro.
NVIDIA Cosmos 3 — primeiro omni-modelo open-source para Physical AI
1º de junho — A NVIDIA lança Cosmos 3, o primeiro omni-modelo totalmente aberto para IA física. Ele unifica linguagem, imagem, vídeo, áudio e geração de ações em um único modelo — uma estreia mundial.
| Variante | Parâmetros | Disponibilidade |
|---|---|---|
| Cosmos 3 Super | 32B | Open-source desde o lançamento |
| Cosmos 3 Nano | 8B | Open-source desde o lançamento |
O modelo integra nativamente raciocínio visual (native vision reasoning), geração de mundos (world generation) e geração de ações (action generation). Segundo a Artificial Analysis, o Cosmos 3 se classifica imediatamente em #1 entre os modelos open-weight em geração texto-para-imagem e imagem-para-vídeo já no dia do lançamento. Os pesos estão disponíveis no Hugging Face e no NVIDIA NGC.
“Introducing Cosmos 3: Our latest frontier model for Physical AI. Cosmos 3 is the world’s first fully open omnimodel with native vision reasoning, world and action generation.”
🇵🇹 A NVIDIA apresenta o Cosmos 3: seu mais recente modelo frontier para a IA física. O Cosmos 3 é o primeiro omni-modelo totalmente aberto do mundo, com raciocínio visual nativo, geração de mundos e geração de ações. — @NVIDIAAI no X
Cosmos Coalition — Runway + NVIDIA, iniciativa global para world models
1º de junho — A Runway se junta à NVIDIA como membro fundador da Cosmos Coalition, uma iniciativa global que reúne laboratórios de IA de ponta para construir e disponibilizar em open-source world models frontier para a IA física.
O objetivo é criar um ecossistema aberto comum que permita a qualquer grupo de pesquisa ou indústria usar, modificar e combinar esses modelos para sistemas de trabalho produtivo. A coalizão também integra parcerias com fabricantes de chips e de hardware.
“Introducing the Cosmos Coalition. A new global initiative with NVIDIA and leading AI labs to build and open-source frontier world models for physical AI.”
🇵🇹 Apresentando a Cosmos Coalition. Uma nova iniciativa global com a NVIDIA e os principais laboratórios de IA para construir e disponibilizar em open-source world models frontier para a IA física. — @runwayml no X
Esse lançamento coordenado com o Cosmos 3 marca uma virada estratégica: a NVIDIA posiciona a IA física open-source como uma questão de soberania tecnológica global, diante da concentração de recursos em poucos atores fechados.
MiniMax M3 — primeiro open-weight a combinar coding frontier, multimodalidade e contexto de 1M
1º de junho — A MiniMax lança M3, o primeiro modelo open-weight a combinar três capacidades frontier simultaneamente. Com 1,7 milhão de visualizações em poucas horas, é um dos lançamentos open-source mais acompanhados do ano.
| Capacidade | Detalhe |
|---|---|
| Coding & Agentic frontier | 59,0% SWE-Bench Pro, 66,0% Terminal Bench 2.1 |
| Contexto 1M tokens | MiniMax Sparse Attention |
| Multimodalidade nativa | Desde a etapa zero do treinamento |
Benchmarks completos:
| Benchmark | Pontuação |
|---|---|
| SWE-Bench Pro | 59,0% |
| Terminal Bench 2.1 | 66,0% |
| SWE-fficiency | 34,8% |
| KernelBench Hard | 28,8% |
| MCP Atlas | 74,2% |
| BU Bench (browser use) | +26% vs anterior |
O M3 é projetado nativamente para agentes de computador (computer-use agents) e fluxos de trabalho agentivos de longa duração. Os pesos e o relatório técnico serão publicados em cerca de 10 dias a partir do lançamento. Um IDE dedicado, MiniMax Code, é lançado simultaneamente, acessível em code.minimax.io. Os parceiros de lançamento do primeiro dia incluem Qubrid AI (infraestrutura cloud GPU) e Simular (agentes autônomos).
Luma OPAL Lab — laboratório aberto de Physical AI para a robótica generalista
1º de junho — A Luma anuncia a criação do OPAL Lab (Open Science Physical AI Lab), um laboratório de pesquisa aberta dedicado à generalização em robótica.
O fundador Amit (@gravicle) identifica o problema central da IA física atual: ao contrário dos grandes modelos de linguagem, capazes de generalizar para tarefas inéditas, os robôs só conseguem reproduzir tarefas específicas em ambientes específicos. A robótica sofre de falta de dados, criando uma crise de generalização.
“We are launching Open Physical AI Lab at Luma to solve generalization in robotics. We believe general physical AI is the most consequential problem to solve to improve life on Earth.”
🇵🇹 Estamos lançando o Open Physical AI Lab na Luma para resolver o problema de generalização em robótica. Acreditamos que a IA física generalista é o problema mais crucial a ser resolvido para melhorar a vida na Terra. — @gravicle no X
A Luma se baseia em 4 anos de pesquisa fundamental em IA multimodal (3D, imagem, vídeo, geração unificada) e em uma infraestrutura de processamento de dados multimodais em escala da internet. Os princípios do OPAL Lab: ciência aberta, métodos e substratos disponíveis para todos, colaboração com a academia, parcerias industriais e avaliações de segurança. A mensagem é explicitamente política: concentrar a infraestrutura de inteligência física mundial nas mãos de um pequeno número de empresas representa uma ameaça profunda para a humanidade.
Qwen3.7-Plus — agente multimodal da Alibaba com visão, coding e contexto longo
1º de junho — O Alibaba Tongyi Lab publica Qwen3.7-Plus, seu modelo agente multimodal mais avançado. Construído sobre o backbone de texto do Qwen3.7, ele funde visão e linguagem em uma fundação agente única e versátil.
Benchmarks-chave:
| Benchmark | Qwen3.7-Plus | GPT-5.4 | Claude Opus 4.6 Max | Gemini 3.1 Pro |
|---|---|---|---|---|
| Terminal Bench 2.0 | 70,3 | — | 65,4 | — |
| SWE-bench Verified | 77,7 | — | 80,8 | — |
| GPQA Diamond | 90,3 | — | 91,3 | — |
| ScreenSpot Pro | 79,0 | 67,4 | 49,5 | 68,1 |
| AndroidWorld | 81,0 | — | 62,0 | 70,7 |
| BabyVision | 70,4 | 53,1 | 12,6 | 55,9 |
Quatro capacidades principais: agente híbrido GUI+CLI (percebe as telas, navega nos aplicativos), assistente de codificação e produtividade multimodal (do protótipo frontend à engenharia complexa), agente visual (percepção, raciocínio, localização e perguntas e respostas enriquecidas por busca web), e generalização multiambiente via Claude Code, OpenClaw, Qwen Code ou qualquer outro ambiente de agentes.
Disponibilidade: Alibaba Cloud Model Studio, API compatível com OpenAI e protocolo Anthropic (usável diretamente com Claude Code via ANTHROPIC_BASE_URL).
Rosalind Biodefense — OpenAI abre o GPT-Rosalind à biologia defensiva
29 de maio — A OpenAI anuncia duas iniciativas importantes em torno da biologia defensiva, com base no GPT-Rosalind, seu modelo de raciocínio dedicado às ciências da vida.
| Organização | Área | Tipo |
|---|---|---|
| Fourth Eon | Triagem de biossegurança, síntese de DNA | Desenvolvedor Rosalind Biodefense |
| SecureDNA | Segurança biológica | Desenvolvedor Rosalind Biodefense |
| Lawrence Livermore National Laboratory | Contramedidas médicas | Parceiro governamental |
| Johns Hopkins APL | Engenharia de proteínas, terapêuticas | Parceiro governamental |
| CEPI | Vacinas pandêmicas, resposta ao Ebola | Parceiro governamental |
Rosalind Biodefense é um programa de desenvolvimento aberto a instituições acadêmicas, organizações sem fins lucrativos, empresas com missão defensiva e equipes governamentais. A OpenAI financia o acesso ao GPT-Rosalind e acompanha projetos sobre modelagem epidemiológica, detecção precoce, triagem, preparação para pandemias e contramedidas médicas.
“Advances in biology can strengthen our ability to prevent, detect, and respond to biological threats. Our goal is to help build a more robust ecosystem — giving trusted defenders frontier AI to develop and operate new defenses for public health and biodefense.”
🇵🇹 Os avanços em biologia podem fortalecer nossa capacidade de prevenir, detectar e responder a ameaças biológicas. Nosso objetivo é ajudar a construir um ecossistema mais robusto — dando aos defensores de confiança uma IA frontier para desenvolver e operar novas defesas para a saúde pública e a biodefesa. — @OpenAI no X
O acesso ampliado ao GPT-Rosalind para parceiros governamentais americanos e aliados é anunciado simultaneamente, com beneficiários como a CEPI no âmbito de sua missão “100 Days” de aceleração de vacinas — incluindo a resposta ao surto de Ebola em curso.
🔗 Rosalind Biodefense — OpenAI
Claude Code v2.1.153 a v2.1.159 — cinco atualizações pós-28 de maio
29 de maio – 1º de junho — A Anthropic publica cinco versões do Claude Code nos dias seguintes ao lançamento do Opus 4.8.
| Versão | Pontos-chave |
|---|---|
| 2.1.153 | Opção skipLfs para marketplace, claude doctor aprimorado, correções MCP/agentes macOS/Windows |
| 2.1.156 | Correção crítica — thinking blocks do Opus 4.8 provocavam erros de API |
| 2.1.157 | Plugins carregados automaticamente desde .claude/skills/, comando plugin init, EnterWorktree no meio da sessão |
| 2.1.158 | Auto Mode no Bedrock, Vertex e Foundry para Opus 4.7 e Opus 4.8 (CLAUDE_CODE_ENABLE_AUTO_MODE=1) |
| 2.1.159 | Infraestrutura interna, nenhuma mudança visível |
A versão 2.1.157 é a mais notável: os plugins colocados em .claude/skills/ agora são carregados automaticamente sem passar pelo marketplace, e EnterWorktree pode alternar entre worktrees geridos pelo Claude durante a sessão. A versão 2.1.158 traz o Auto Mode nas principais plataformas de nuvem, reforçando a implementação enterprise do Claude Code.
Gemini 3.5 Flash e Gemini Omni em disponibilidade geral
29 de maio — O Google marca a disponibilidade geral (general availability) do Gemini 3.5 Flash por meio de 9 demonstrações em vídeo cobrindo o Gemini Omni e o Gemini 3.5 Flash em ação.
Implantação do Gemini 3.5 Flash: modelo padrão no aplicativo Gemini e no AI Mode da Search (global), disponível via Google Antigravity, a API Gemini no Google AI Studio, Android Studio, Gemini Enterprise Agent Platform e Gemini Enterprise.
Gemini Spark: o agente de IA pessoal 24h alimentado pelo Gemini 3.5, agora disponível para todos os assinantes Google AI Ultra nos Estados Unidos, integrado ao Gmail, Docs, Slides e Workspace.
Gemini Omni Flash: implantado para assinantes Google AI Plus, Pro e Ultra no aplicativo Gemini e no Google Flow; disponível sem custo para usuários do YouTube Shorts e do aplicativo YouTube Create; implantação da API para desenvolvedores prevista para as semanas seguintes.
🔗 Demonstrações Gemini Omni e 3.5 Flash
Qwen-VLA — agente robótico visão-linguagem-ação para 11 tipos de robôs
29 de maio — O Tongyi Lab publica Qwen-VLA, um modelo unificado Vision-Language-Action (VLA) para a inteligência incorporada geral (general embodied intelligence).
Arquitetura: Qwen3.5-4B (backbone linguagem-visão) + decodificador DiT 1,15B para produzir ações diretamente a partir da percepção visual e da linguagem natural. O modelo unifica manipulação de objetos, navegação espacial e previsão de trajetória em uma única estrutura.
Graças aos prompts com consciência da incorporação (embodiment-aware prompts), o mesmo modelo funciona em 11 tipos de incorporações robóticas — braço único, braços duplos e plataformas humanoides — sem cabeças de política (policy heads) nem arquiteturas específicas por tarefa. O tweet gerou 3,1 milhões de visualizações em dois dias, sinal do grande interesse da comunidade robótica.
Copilot — a API de métricas adiciona coortes de adoção de IA
29 de maio — O GitHub enriquece a API de métricas de uso do Copilot com um sistema de coortes de adoção de IA. Cada usuário ativo é classificado em uma das quatro fases a seguir, calculadas em uma janela móvel de 28 dias:
| Fase | Nome | Critério |
|---|---|---|
| 0 | No cohort | Engajamento insuficiente |
| 1 | Code first | Conclusão de código e/ou modo agente no IDE |
| 2 | Agent first | Uma superfície agente do GitHub (cloud agent, code review, CLI) |
| 3 | Multi-agent | Duas ou mais superfícies agente, ou o app GitHub Copilot |
As métricas expostas por fase: usuários ativos, interações, geração e aceitação de código, linhas adicionadas/removidas, pull requests criadas/mescladas/revisadas, tempo mediano de merge. Acessível a administradores enterprise e proprietários de organização. Esse sistema permite medir a maturidade real da adoção do Copilot e acompanhar a evolução dos desenvolvedores rumo a usos agentivos avançados.
🔗 Changelog do GitHub — API de métricas de uso do Copilot
ElevenLabs assina um MOU com o governo da Grécia
28 de maio — A ElevenLabs assina um memorando de entendimento com o governo grego, na presença do primeiro-ministro (@PrimeministerGR) e do ministro da Transformação Digital (@papastergiougr), para três frentes: melhorar o acesso aos serviços públicos por meio de IA de voz, promover o turismo e preservar o patrimônio linguístico grego. Essa parceria governamental ilustra a estratégia da ElevenLabs para se estabelecer no setor público europeu, apostando em usos institucionais de alta visibilidade.
Frontier Governance Framework — OpenAI alinha suas práticas com a TFAIA e o EU AI Act
28 de maio — A OpenAI publica seu Frontier Governance Framework, um documento de governança pública que traduz o Preparedness Framework interno em obrigações regulatórias concretas. O alvo principal: a Transparency in Frontier AI Act (TFAIA) da Califórnia e o Código de prática para IA de uso geral do EU AI Act.
O framework cobre a avaliação e a mitigação de riscos nos domínios ciberofensivos, CBRN (químicos, biológicos, radiológicos, nucleares), manipulação nociva e perda de controle. Ele também inclui obrigações de reporte de modelos, gestão de incidentes, recurso a especialistas externos e um mecanismo de atualização. A OpenAI esclarece que o Preparedness Framework continua sendo sua base interna — algumas práticas vão além dos requisitos legais atuais.
🔗 Frontier Governance Framework
Guia de avaliações terceiras confiáveis — método e cinco vieses a controlar
29 de maio — A OpenAI publica um guia metodológico para avaliações terceiras rigorosas de modelos de IA de fronteira. O documento parte de um diagnóstico: avaliações originalmente criadas para chatbots já não são adequadas a sistemas agentivos capazes de usar ferramentas e atuar em trajetórias longas.
O guia distingue três tipos de reivindicações que as avaliações devem sustentar: a elicitação de capacidades (o que o modelo pode fazer nas melhores condições), a robustez das proteções (resistência a ataques) e a comparação entre sistemas. Um conceito central é o “harness” (ambiente de execução ao redor do modelo), cujas escolhas podem alterar materialmente os resultados — a OpenAI cita o impacto da compactação de contexto no desempenho do GPT-5.5 em avaliações cibernéticas multietapas.
Cinco vieses de validade são identificados: reward hacking (exploração de atalhos), recusa mascarando as capacidades reais, contaminação (memorização dos benchmarks), problemas quebrados (tarefas impossíveis ou mal pontuadas) e sandbagging (subdesempenho deliberado em avaliações detectadas). A OpenAI se compromete a fornecer instruções de elicitação máxima aos avaliadores terceirizados e a compartilhar os traços de raciocínio.
🔗 Guia de avaliações terceiras — OpenAI
Grok Imagine Extend — extensão de vídeo contínuo
29 de maio — O Grok Imagine lança Extend, uma funcionalidade que permite criar vídeos contínuos com transições suaves a partir de um vídeo ou de imagens existentes. A funcionalidade está disponível diretamente na interface do Grok Imagine. O tweet da conta @imagine foi repostado por @grok e atingiu 701 mil visualizações. Este anúncio consolida a suíte criativa do Grok ao lado do Grok Build e da API grok-build-0.1.
Codex Computer Use no Windows e controle móvel
29 de maio — A OpenAI anuncia que a funcionalidade de “computer use” do Codex agora está disponível no Windows. O agente pode ver a tela, clicar e inserir texto nos aplicativos do Windows, abrindo caminho para testes nativos, fluxos em simulador e correções de bugs acessíveis apenas pela interface gráfica. O aplicativo móvel ChatGPT integra simultaneamente o suporte ao Windows para o Codex: início, acompanhamento e controle das tarefas pelo telefone enquanto o trabalho continua no PC. A OpenAI qualifica essa funcionalidade como uma «experiência inicial»; ela não está disponível no Espaço Econômico Europeu, no Reino Unido nem na Suíça.
🔗 Codex Computer Use no Windows
Breves
-
Salesforce + Claude Code — Boris Cherny (@bcherny) compartilha um depoimento da Salesforce sobre o uso agentivo do Claude Code: uma migração inicialmente estimada em 231 dias entregue em 13, 21 endpoints com 100% de cobertura de testes e uma queda de 5% nos incidentes apesar do aumento do volume de PRs. 🔗 fonte
-
Google I/O 2026 — making-of de IA — O Google detalha como suas equipes usaram Gemini Omni, Nano Banana, Lyria 3 e Antigravity para produzir as experiências criativas do Google I/O 2026: curta de animação, identidade visual, pré-show musical interativo, jogos generativos. 🔗 fonte
-
Gemini CLI v0.44.0 — Modo Auto unificado (fusão dos modos especializados), suporte nativo ao Sublime Text e ao Emacs Client, novas ferramentas de teste TUI programáticas. 🔗 fonte
-
GitHub Copilot — modelos em avaliação no modo auto — Os usuários individuais (Free, Pro, Pro+) agora têm acesso aos modelos pré-GA por meio da seleção automática
auto. Opção de desativação disponível nas configurações. 🔗 fonte -
ElevenLabs Summit Varsóvia — Preview do modelo de voz mais expressivo já desenvolvido pela ElevenLabs, revelado pelo cofundador Mati. Trata-se de uma preview בלבד, sem acesso público anunciado. 🔗 fonte
-
Cohere Command A+ — benchmarks de tradução — O Command A+ supera Mistral Medium 3.5, DeepSeek, gpt-oss e Claude Opus 4.6 no WMT24++, assim como o Google Translate. Ganhos documentados: +2,4 pts em francês, +1,9 pts em espanhol, +0,9 pts em alemão. 🔗 fonte
O que isso significa
A dinâmica financeira da Anthropic e a consolidação do setor. O depósito S-1 confidencial da Anthropic é a notícia mais estruturante da semana. Ele ocorre em um contexto de crescimento extraordinário — 65 bilhões de USD levantados na Série H, avaliação próxima ao trilhão — e sinaliza que as grandes empresas de IA de fronteira começam a considerar seriamente os mercados públicos. A manutenção do status de PBC (Public Benefit Corporation) é um compromisso forte: a Anthropic busca provar que uma oferta pública é compatível com uma missão de segurança de longo prazo. Esse precedente terá implicações para a OpenAI e para outros atores que possam seguir esse caminho.
A onda Physical AI — rumo a uma IA que age no mundo real. O 1º de junho marca uma convergência notável em torno da IA física: NVIDIA Cosmos 3 (primeiro omni-modelo open-weight para robôs e agentes), Cosmos Coalition (ecossistema aberto Runway+NVIDIA), Luma OPAL Lab (pesquisa aberta sobre generalização robótica), MiniMax M3 (contexto 1M + multimodalidade nativa), Qwen-VLA (11 tipos de robôs sob uma arquitetura unificada) e Qwen3.7-Plus (agente GUI+CLI em ação nas interfaces). Esse agrupamento não é coincidência — ele reflete um consenso crescente de que a próxima fronteira da IA é a ação no espaço físico, e que o open-source desempenha um papel central nisso. A competição se intensifica entre modelos fechados e abertos, especialmente nos benchmarks de robótica e de computer use.
A governança e a segurança em IA entram no direito positivo. A publicação do Frontier Governance Framework da OpenAI, alinhado com a TFAIA californiana e o EU AI Act, e a do guia de avaliações terceiras marcam uma etapa: as grandes empresas de IA não definem mais suas regras apenas internamente. Elas as alinham com legislações concretas e publicam suas metodologias de avaliação. A iniciativa Rosalind Biodefense ilustra o outro lado dessa governança — colocar a IA de fronteira a serviço da defesa social (preparação para pandemias, biossegurança), com controles adaptados.
A instrumentação do desenvolvedor acelera e se fragmenta. O Claude Code recebe cinco versões em quatro dias, incluindo o Auto Mode no Bedrock/Vertex/Foundry e o carregamento automático de plugins locais. O Gemini CLI v0.44.0 unifica seu modo Auto e amplia as integrações com IDE. O GitHub Copilot refina sua taxonomia de adoção (4 fases, janela de 28 dias) para ajudar as organizações a medir a maturidade real de sua adoção de IA. Os desenvolvedores agora dispõem de uma instrumentação agentiva densa e em rápida evolução — a questão já não é o acesso aos modelos, mas a capacidade das equipes de integrar essas ferramentas em seus fluxos de trabalho de forma coerente e mensurável.
Fontes
- Anthropic — Depósito S-1 confidencial na SEC
- NVIDIA Cosmos 3 no X
- Cosmos Coalition — Runway no X
- MiniMax M3 no X
- Luma OPAL Lab no X
- Luma OPAL Lab — @gravicle no X
- Qwen3.7-Plus — Blog Qwen
- Qwen-VLA no X
- Rosalind Biodefense — OpenAI
- Frontier Governance Framework — OpenAI
- Avaliações terceiras confiáveis — OpenAI
- Codex Computer Use Windows — OpenAI no X
- Grok Imagine Extend no X
- Claude Code Releases
- Gemini Omni e 3.5 Flash — Google Blog
- API de métricas de uso do Copilot — GitHub Changelog
- ElevenLabs MOU Grécia no X
- ElevenLabs Summit Varsóvia no X
- Cohere Command A+ tradução no X
- Gemini CLI changelog
- Google I/O 2026 — making-of de IA
- Salesforce + Claude Code — @bcherny no X
- GitHub Copilot — modelos em avaliação no auto