Pesquisar

GLM-5.2 open-source MIT, Qwen-Robot Suite e NVIDIA Blackwell dominam o MLPerf: 16 de junho de 2026 em IA

GLM-5.2 open-source MIT, Qwen-Robot Suite e NVIDIA Blackwell dominam o MLPerf: 16 de junho de 2026 em IA

ai-powered-markdown-translator

Artigo traduzido do fr para o pt com gpt-5.4-mini.

Ver projeto no GitHub ↗

16 de junho de 2026 — A Z.ai publica os pesos open-source MIT do GLM-5.2 (janela de 1M tokens, dois níveis de raciocínio), a Alibaba Qwen apresenta a Qwen-Robot Suite composta por três modelos fundamentais para robótica, a NVIDIA Blackwell domina a totalidade dos benchmarks do MLPerf Training 6.0 — incluindo o DeepSeek-V3 671B treinado em 2,02 minutos em 8 192 GPU. O GitHub anuncia a disponibilidade geral (general availability) paga do Code Quality em 20 de julho, a $10 por desenvolvedor ativo por mês, o June Pixel Drop traz Gemini Omni em vídeo e geração musical nos dispositivos Pixel, e a pesquisa econômica da Anthropic quantifica pela primeira vez o impacto da expertise de domínio no Claude Code.


Z.ai GLM-5.2 — pesos open-source MIT disponíveis

16 de junho — A Z.ai (anteriormente Zhipu AI) publica oficialmente os pesos open-source do GLM-5.2 sob licença MIT, concretizando o anúncio de 13 de junho. Os pesos já estão disponíveis para download na plataforma da empresa.

“Introducing GLM-5.2: Frontier Intelligence, Open Weights

  • Significant improvements in coding and agentic tasks
  • Strong long-horizon capabilities with a 1M context window
  • Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong balance”

🇵🇹 Apresentando GLM-5.2: Inteligência de fronteira, pesos abertos. Melhorias significativas em tarefas de codificação e agentivas. Capacidades robustas em sequências longas com uma janela de contexto de 1 milhão de tokens. Dois níveis de esforço de raciocínio: o GLM-5.2 (max) leva os limites ao máximo, enquanto o GLM-5.2 (high) oferece um sólido equilíbrio.@Zai_org no X

Pontos-chave do GLM-5.2:

  • Melhorias significativas em tarefas de codificação (coding) e agentivas
  • Janela de contexto de 1 milhão de tokens — útil para agentes de codificação em grande escala e para o processamento de documentos longos
  • Dois níveis complementares de esforço de raciocínio
  • Supera o GLM-5.1 em codificação, uso de ferramentas e raciocínio
  • Disponível via chat.z.ai
VarianteRaciocínioContextoLicença
GLM-5.2 (max)Desempenho máximo1M tokensMIT open-source
GLM-5.2 (high)Forte equilíbrio entre desempenho/velocidade1M tokensMIT open-source

A licença MIT é o marcador mais importante: ela autoriza o uso comercial sem restrições, tornando o GLM-5.2 diretamente utilizável por empresas que não podem ou não desejam depender de modelos proprietários americanos. O tweet atingiu 515 000 visualizações em poucas horas — um sinal forte do interesse da comunidade por modelos open-source de fronteira com grandes janelas de contexto.

🔗 Blog da Z.ai — GLM-5.2


Qwen-Robot Suite — três modelos fundamentais para a robótica incorporada

16 de junho — A Alibaba Qwen anuncia a Qwen-Robot Suite, uma pilha completa para inteligência incorporada (embodied intelligence) composta por três modelos fundamentais distintos e complementares: navegação, manipulação e modelo de mundo.

Qwen-RobotNav — especialista em navegação móvel:

  • Unifica 5 tarefas em um único modelo: seguimento de instruções, navegação até um ponto-alvo (point-goal), navegação até um objeto-alvo (object-goal), rastreamento de objetos e condução autônoma
  • Protocolo de observação controlável
  • Interface de ferramenta para sistemas agentivos

Qwen-RobotManip — especialista em manipulação:

  • Espaço estado-ação unificado para robôs heterogêneos
  • Poses delta em referencial de câmera para um aprendizado consistente entre diferentes corpos robóticos (cross-embodiment)
  • Pré-treinado em um corpus open-source de mais de 38 100 horas

Qwen-RobotWorld — modelo de mundo físico:

  • Um único modelo cobrindo mais de 20 tipos de corpos robóticos
  • Interface de ação em linguagem natural
  • Prediz futuros fisicamente ancorados para manipulação, condução e navegação

Cada modelo pode ser usado independentemente e também pode ser combinado como uma ferramenta do mundo físico. Juntos, eles formam a caixa de ferramentas de baixo nível para sistemas agentivos com vocação generalista.

ModeloEspecialidadeDado-chave
Qwen-RobotNavNavegação multi-tarefas (5 tarefas unificadas)Interface de ferramenta para sistemas agentivos
Qwen-RobotManipManipulação robótica cross-embodimentCorpus open-source 38 100+ horas
Qwen-RobotWorldWorld model físico20+ tipos de corpos robóticos

🔗 Qwen-Robot Suite — anúncio


NVIDIA Blackwell domina o MLPerf Training 6.0 — clean sweep

16 de junho — A NVIDIA venceu a totalidade dos benchmarks do MLPerf Training 6.0, a referência industrial de treinamento de IA estabelecida pelo consórcio MLCommons. É a única plataforma a ter submetido resultados em todos os testes, incluindo os dois novos benchmarks introduzidos nesta edição: DeepSeek-V3 (671 bilhões de parâmetros, arquitetura MoE) e GPT-OSS-20B.

Os desempenhos do sistema GB300 NVL72 (72 GPU Blackwell Ultra interconectadas) são notáveis:

ModeloPlataformaGPUTempo
DeepSeek-V3 671B (MoE)GB300 NVL728 1922,02 min
GPT-OSS 20B (MoE)GB300 NVL725127,43 min
Llama 3.1 405BGB200 NVL728 1927,07 min
Llama 3.1 8BGB200 NVL721 0244,46 min
Llama 2 70B LoRAGB300 NVL725120,40 min
FLUX.1 (geração de imagens)GB300 NVL7251217,1 min
DLRM-dcnv2GB300 NVL72640,67 min

A inclusão de FLUX.1 (modelo de geração de imagens da Black Forest Labs) nos benchmarks oficiais é notável: ela confirma que a infraestrutura Blackwell é o referencial para treinar os modelos de geração de imagens mais avançados.

No plano de software, a NVIDIA implementou várias inovações na stack NeMo 26.06: grafos CUDA em iteração completa para os MoE, fusões de kernels via CuTe DSL, precisão MXFP8 para o bloco de atenção e otimizações do roteador MoE (aceleração de kernel 5×). Essas melhorias de software permitiram um ganho de 1,3× no throughput do DeepSeek-V3 em três meses sem alteração do hardware, passando de 1 298 para 1 648 TFLOPS/GPU — um lembrete de que o desempenho de hardware é apenas uma parte da equação.

🔗 NVIDIA — MLPerf Training 6.0


June Pixel Drop 2026 — Gemini Omni vídeo, geração musical, Daily Brief

16 de junho — O June Pixel Drop 2026 introduz várias funcionalidades importantes que integram o Gemini diretamente nos dispositivos Pixel, com o rollout gradual começando nas próximas semanas.

Gemini Omni — criação e edição de vídeo com IA: basta conversar naturalmente com o Gemini para misturar texto, imagens e vídeos. É possível começar do zero, remixar conteúdos da galeria, usar modelos predefinidos ou até criar um avatar de IA personalizado com a imagem e a voz do usuário.

Geração musical no Gemini: o usuário descreve uma ideia ou importa uma foto, que é transformada em uma faixa de áudio original com letra. Estilo, voz e andamento podem ser personalizados pelo menu Ferramentas → “Criar música” do app Gemini.

Daily Brief — agente matinal de IA: disponível para todos os assinantes Google AI Plus, Pro e Ultra (18+, por enquanto apenas nos Estados Unidos). Esse agente organiza o dia do usuário antes mesmo de ele acordar. O Voice Translate, que traduz chamadas em tempo real, expande-se para o Pixel 10a (7 idiomas, incluindo francês).

FuncionalidadeDisponibilidadeObservações
Gemini Omni vídeoPixel (rollout gradual)Criação/remix por conversa
Geração musicalPixel (app Gemini)Áudio + letra, personalizável
Daily BriefGoogle AI Plus/Pro/Ultra, 18+, Estados UnidosAgente matinal de IA
Voice TranslatePixel 10a7 idiomas + hindi em prévia
Edit with Ask PhotosReino Unido, Alemanha, França, Espanha, ItáliaEdição de fotos por conversa

🔗 June Pixel Drop 2026 — blog oficial do Google


GitHub Code Quality — disponibilidade geral em 20 de julho, $10 por desenvolvedor ativo

16 de junho — O GitHub anuncia que o GitHub Code Quality passará da pré-visualização pública para a disponibilidade geral (general availability) em 20 de julho de 2026, como produto pago. Mais de 10 000 empresas participaram da prévia.

Preços em 20 de julho:

ComponentePreço
Licença por desenvolvedor ativo (committer)$10 / desenvolvedor ativo / mês
Funcionalidades de IA (Copilot code review, detecção de IA, Copilot Autofix)Cobrança por uso
Análise determinística CodeQLMinutos do GitHub Actions

Novas funcionalidades disponíveis a partir do GA:

  • Implantação em escala organizacional (um único toggle de admin)
  • Painéis de qualidade no nível da organização
  • Aplicação da cobertura de código por meio de conjuntos de regras (rulesets)
  • Pontuação de qualidade por repositório e por organização
  • API para ativação e gerenciamento dos resultados

Disponibilidade: apenas GitHub Enterprise Cloud e GitHub Team. Não disponível no GitHub Enterprise Server. Clientes que desejarem sair antes da cobrança podem desativar o Code Quality em seus repositórios antes de 20 de julho.

🔗 GitHub Code Quality — anúncio GA


Pesquisa econômica da Anthropic — a expertise de domínio supera o domínio do código

16 de junho — A Anthropic publica um estudo econômico sobre o uso do Claude Code, baseado na análise confidencial de cerca de 400 000 sessões entre outubro de 2025 e abril de 2026. Primeiros resultados quantificados sobre como a expertise determina o sucesso com um agente de codificação por IA.

Resultados-chave do estudo (autores: Zoe Hitzig, Maxim Massenkoff, Eva Lyubich, Ryan Heller, Peter McCrory):

IndicadorValor
Sessões analisadas~400 000
Usuários distintos~235 000
Período cobertoOut 2025 – Abr 2026
Decisões de planejamento (usuário)~70 %
Decisões de execução (Claude)~80 %
Aumento médio do valor econômico das tarefas+25 %
Taxa de sucesso verificada (especialista de domínio)28–33 %
Taxa de sucesso verificada (iniciante)15 %
Parcela de sessões de depuração out → abr33 % → 19 %

Conclusão central: em uma sessão típica, o usuário toma ~70% das decisões de planejamento (o que fazer), enquanto o Claude toma ~80% das decisões de execução (como fazer). Os especialistas de domínio — não necessariamente desenvolvedores — conduzem o Claude para cadeias de ações duas vezes mais longas e com cinco vezes mais conteúdo por instrução. A taxa de sucesso de profissões não técnicas (advogados, gestores, cientistas) fica a menos de 7 pontos percentuais da dos engenheiros de software. É a compreensão do problema de negócio, e não o domínio do código, que determina o sucesso.

🔗 Pesquisa econômica da Anthropic — Claude Code


Anthropic e OpenAI — agentes em produção e implantação na Europa

Claude Managed Agents — guia de colocação em produção

16 de junho — A equipe Applied AI da Anthropic publica um guia prático sobre a colocação em produção de agentes com Claude Managed Agents. O post explica a evolução das superfícies de interação: do chatbot clássico para agentes autônomos planejados e persistentes, com acesso a ambientes de execução (stateful runtime environments). Duas funcionalidades disponíveis desde 9 de junho: execução de agentes com planejamento definido e armazenamento de variáveis de ambiente em cofres (vaults).

🔗 Building with Claude Managed Agents

Claude Code v2.1.178 — permissões granulares e skills aninhadas

15 de junho — O Claude Code v2.1.178 introduz a sintaxe Tool(param:value) para as regras de permissão — por exemplo Agent(model:opus) para bloquear os subagentes Opus. As skills em diretórios .claude/skills/ aninhados são carregadas automaticamente ao trabalhar nessas pastas. O modo auto agora avalia os lançamentos de subagentes pelo classificador antes do início, fechando uma brecha em que um subagente podia solicitar uma ação bloqueada sem revisão prévia.

🔗 Claude Code v2.1.178

Codex app no EEE, no Reino Unido e na Suíça — Computer Use, Memories, Chronicle

16 de junho — A OpenAI libera quatro funcionalidades avançadas do Codex no Espaço Econômico Europeu (EEE), no Reino Unido e na Suíça: Computer Use (macOS + Windows), a extensão Chrome Codex, Memories e Chronicle.

O Computer Use permite que o Codex interaja com aplicativos de desktop — ver, clicar, inserir texto. A extensão Chrome permite realizar tarefas que exigem contexto de navegador conectado, trabalhando em várias abas em segundo plano. O Memories memoriza preferências e convenções recorrentes de repositórios, mas está desativado por padrão nas três regiões por conformidade regulatória. O Chronicle, uma prévia opt-in reservada a assinantes Pro no macOS, ajuda o Codex a construir memórias a partir do contexto recente da tela. Essas funcionalidades já estavam disponíveis para usuários Enterprise fora do EEE/UK/CH.

🔗 OpenAI — rollout do Codex EEE/UK/Suíça

Simulação de Implementação da OpenAI — prever o comportamento antes do lançamento

16 de junho — A OpenAI publica seu método Deployment Simulation (Simulação de implementação): reproduzir conversas reais anonimizadas provenientes de implementações anteriores com um modelo candidato, para detectar comportamentos indesejados antes da colocação em produção. Testado nas implementações GPT-5-series Thinking (~1,3 milhão de conversas), o erro mediano de previsão é de 1,5×, significativamente melhor do que as avaliações sintéticas. O método permitiu detectar o “calculator hacking” (uma forma de reward hacking) antes do lançamento do GPT-5.1.

🔗 Deployment Simulation — OpenAI

Codex CLI 0.140.0 — /usage, /import a partir de Claude Code, autenticação Bedrock

15 de junho — A versão 0.140.0 do Codex CLI traz várias funcionalidades substanciais. /usage exibe as atividades diárias, semanais e acumuladas de tokens da conta. /import permite importar seletivamente a configuração, as definições do projeto e conversas recentes a partir do Claude Code — uma interoperabilidade direta entre duas ferramentas concorrentes. codex delete remove definitivamente uma sessão com confirmação de segurança e limpeza dos subagentes associados. A autenticação Amazon Bedrock gerenciada armazena as chaves API de forma criptografada localmente e também abrange os identificadores OAuth MCP. Em paralelo, correções de confiabilidade MCP (novas tentativas em inicializações transitórias) e recuperação automática de bases SQLite corrompidas.

🔗 Codex CLI 0.140.0 — lançamento no GitHub


Meta AI — AI Mode no Facebook com Muse Spark

16 de junho — A Meta está a implantar novas ferramentas de inteligência artificial no Facebook. AI Mode é um novo modo de pesquisa alimentado por Meta AI (impulsionado por Muse Spark) que ancora as suas respostas no que os utilizadores dizem publicamente nas aplicações Meta — Grupos, Reels — oferecendo perspetivas contextualizadas em vez de resultados genéricos. Acessível a partir do feed de notícias ou da pesquisa.

Novas ferramentas criativas: sugestões de partilha a partir da galeria com modelos de colagem (cutout templates), efeitos de transição de vídeo, predefinições de foto (photo presets) que permitem modificar virtualmente roupas e penteado, e a opção “Wear It” para vestir virtualmente uma camisola desportiva nas Stories. Todas estas funcionalidades são opt-in e podem ser desativadas.

🔗 Meta — novas ferramentas de IA no Facebook


NVIDIA SpatialClaw — agente de raciocínio espacial sem treino

16 de junho — A NVIDIA Research publica SpatialClaw, um agente de raciocínio espacial visual training-free (sem treino adicional). Em vez de chamar um conjunto fixo de ferramentas predefinidas, o agente escreve diretamente Python num núcleo persistente, compondo dinamicamente módulos de perceção e revendo a sua estratégia ao longo das etapas. As saídas tornam-se variáveis Python reutilizáveis com NumPy e SciPy.

Resultados: +11,2 pontos em 20 benchmarks de raciocínio espacial visual em comparação com um agente anterior recente, de forma consistente em 6 arquiteturas de modelos diferentes, sem ajuste específico para um benchmark.

🔗 SpatialClaw — @NVIDIAAI no X


Cohere — afluxo de pedidos após a restrição dos EUA à Anthropic

15 de junho — A Cohere, empresa canadiana de IA generativa, relata receber um elevado número de pedidos entrantes (inbounds) de empresas que procuram alternativas na sequência da diretriz dos EUA que restringe o acesso à Anthropic (coberta a 13 de junho). A empresa respondeu com humor citando o tweet da Polymarket: “The world needs more Canada 🇨🇦”. O tweet alcançou 56 000 visualizações, 797 likes. Este posicionamento confirma que a diretriz americana cria uma oportunidade comercial direta para fornecedores soberanos não americanos.

🔗 Cohere — tweet


GitHub Models retirado para novos clientes

16 de junho — A GitHub anuncia a retirada gradual do GitHub Models. A partir de 16 de junho, novos clientes (organizações e empresas sem uso pré-existente) já não têm acesso ao serviço, nem nos planos gratuitos nem nos planos pagos. Os clientes existentes com uso ativo não são impactados por enquanto e podem continuar a usar o terreno de jogo (playground), a API e os modelos disponíveis. A GitHub esclarece que comunicará mais tarde os prazos detalhados do encerramento completo. Para novos projetos que necessitem de acesso a modelos de IA, a GitHub orienta para o Azure AI Foundry, que oferece um catálogo alargado de modelos.

🔗 Descontinuação do GitHub Models


Breves

  • Claude Code v2.1.179 — 9 correções de estabilidade (16 de junho) : cortes de ligação em curso de fluxo (mid-stream) preservados, deslocamento com a roda do rato corrigido no WSL2 no Windows Terminal e no VS Code (regressão desde v2.1.172), correção da sandbox Linux em grandes árvores de diretórios. 🔗 v2.1.179

  • Gemini Trusted Tester Program — inscrições abertas : a Google abre um número limitado de vagas para utilizadores avançados que queiram testar funcionalidades inéditas do Gemini antes do lançamento público. 🔗 Inscrição

  • Gemini — microfone multilingue 70+ idiomas (Android e iOS) : o ícone do microfone suporta agora mais de 70 idiomas com mistura livre sem alterar definições. Anúncio via @joshwoodward (Director of Product, Gemini App).

  • GitHub Code Quality — ativação da organização num clique (16 de junho) : os administradores da organização podem ativar ou desativar o Code Quality em todos os seus repositórios com um único toggle nas definições de segurança. 🔗 Changelog

  • Copilot usage metrics — enriquecimento por telemetria do servidor (15 de junho) : os relatórios de utilização do Copilot Enterprise integram agora os utilizadores ativos detetados do lado do servidor (além da telemetria do cliente), melhorando a cobertura dos DAU nos relatórios diários e de 28 dias. 🔗 Changelog

  • Manus — fila de mensagens durante a execução (16 de junho) : o Manus permite agora colocar em fila mensagens para enviar ao agente enquanto uma tarefa está em curso. As mensagens são processadas por ordem assim que a tarefa atual termina. 🔗 Anúncio

  • ChatGPT iOS 1.2026.160 (15 de junho) : explorador de ficheiros workspace, seletor de pasta, controlos de diff, aprovação MCP por chat ou global, e renderização LaTeX nas mensagens e planos do Codex.


O que isto significa

A abertura dos pesos MIT do GLM-5.2 e os três modelos robóticos Qwen-Robot Suite ilustram a aceleração da oferta open-source chinesa nos nichos onde os intervenientes americanos continuam em grande parte proprietários. O GLM-5.2 com a sua janela de 1M tokens sob licença MIT posiciona-se diretamente como concorrente dos modelos comerciais para empresas que procuram uma alternativa soberana — precisamente o nicho que a diretriz dos EUA que restringe a Anthropic tornou estrategicamente visível, como confirma o afluxo de pedidos sinalizado pela Cohere. A robótica é o próximo terreno desta competição: o Qwen-Robot Suite propõe uma pilha completa navegação-manipulação-world model, enquanto o SpatialClaw da NVIDIA Research demonstra que um raciocínio espacial avançado pode ser alcançado sem fine-tuning — duas abordagens complementares que desenham a arquitetura dos sistemas robóticos agentivos da próxima geração.

No front do hardware, os resultados do MLPerf Training 6.0 confirmam a dominância da arquitetura Blackwell numa escala industrial: treinar o DeepSeek-V3 (671 mil milhões de parâmetros) em 2 minutos em 8 192 GPU não é uma proeza académica, é uma capacidade de produção real implementada em datacenters cloud. O ganho de software de 1,3× no throughput do DeepSeek-V3 em três meses sem qualquer alteração de hardware recorda que a corrida ao desempenho em IA é tanto uma competição de pilhas de software (NeMo, CuTe DSL, MXFP8) quanto de chips — uma dinâmica que amplifica as posições já dominantes.

A investigação económica da Anthropic sobre o Claude Code traz uma perspetiva contraintuitiva importante: a experiência no domínio de negócio (direito, gestão, ciências) determina o sucesso com um agente de programação quase tanto quanto o domínio do código em si. As taxas de sucesso verificadas mostram uma diferença de apenas 7 pontos entre engenheiros e não-desenvolvedores especialistas na sua área. É uma informação estruturante para as equipas de produto: o público-alvo das ferramentas de programação por IA já não é apenas o dos desenvolvedores, e o design das interfaces deve ter isso em conta.

Do lado da instrumentação para desenvolvedores, o dia 16 de junho concentra vários sinais convergentes: o GA pago do GitHub Code Quality ($10/desenvolvedor ativo), a disponibilidade do Codex com Computer Use no EEE/Reino Unido/Suíça, as permissões granulares do Claude Code v2.1.178 e o método Deployment Simulation da OpenAI. A qualidade do código e a segurança das implementações passam de temas de investigação a produtos faturados — uma normalização que reflete a maturidade crescente do mercado de ferramentas de IA para equipas de desenvolvimento.


Fontes