ai-powered-markdown-translatorArtigo traduzido do fr para o pt com gpt-5.4-mini.
Esta semana, o Google DeepMind avança um passo importante na pesquisa matemática com o AlphaProof Nexus, um agente capaz de resolver problemas em aberto há várias décadas. Do lado da Anthropic, o modo auto do Claude Code passa a estar disponível no plano Pro e integra o Sonnet 4.6. O GitHub open source o plugin Copilot para Eclipse, e a Alibaba ativa o cache implícito no Qwen3.7-Max.
AlphaProof Nexus — Um agente de IA resolve problemas matemáticos em aberto há décadas
25 de maio de 2026 — O Google DeepMind anunciou o AlphaProof Nexus, um framework agentic (agentic framework) de pesquisa de provas formais alimentado por Gemini, acompanhado de um artigo submetido ao arXiv em 21 de maio (arXiv:2605.22763).
O agente baseia-se em um ciclo que alterna geração via Gemini e verificação formal via a linguagem de provas Lean. Essa combinação garante o rigor matemático das provas produzidas: o LLM propõe, o Lean valida ou rejeita, e o agente itera.
Resultados publicados:
| Domínio | Resultados | Contexto |
|---|---|---|
| Problemas em aberto de Erdős | 9 resolvidos em 353 avaliados | Sendo 2 em aberto há 56 anos |
| Conjecturas OEIS | 44 resolvidas em 492 | Online Encyclopedia of Integer Sequences |
| Geometria algébrica | 1 problema em aberto resolvido | Em aberto há 15 anos |
| Otimização min-max | 1 questão em aberto resolvida | Em aberto há 7 anos |
O custo por problema resolvido é de algumas centenas de dólares — uma ordem de grandeza que ilustra a eficiência econômica da abordagem agentic para a pesquisa matemática formal.
O AlphaProof Nexus já está sendo implantado em colaboração com matemáticos em várias áreas: combinatória, teoria dos grafos, geometria algébrica e óptica quântica. Esse trabalho insere-se na continuidade do AlphaProof (2024), que visava problemas de nível olimpíada. O AlphaProof Nexus mira problemas de pesquisa em aberto, marcando um passo em direção ao uso da IA como ferramenta autônoma de descoberta matemática.
“AI agents are advancing research-level math.”
🇵🇹 Os agentes de IA estão a impulsionar a matemática ao nível da investigação. — Pushmeet Kohli, VP Research, Google DeepMind no X
Claude Code v2.1.149 — Detalhe /usage por categoria e mais de 25 correções
23 de maio de 2026 — A versão 2.1.149 do Claude Code foi lançada, concretizando a funcionalidade /usage breakdown por categoria anunciada por Boris Cherny na semana anterior.
| Funcionalidade | Detalhe |
|---|---|
/usage breakdown | Detalhe de consumo por categoria: skills, subagentes, plugins, servidor MCP |
/diff navigation | Navegação por teclado: setas, j/k, PgUp/PgDn, Home/End |
| GFM task lists | Caixas de seleção Markdown ([ ] / [x]) exibidas corretamente |
| Enterprise | Novo parâmetro gerido allowAllClaudeAIMcps para managed-mcp.json |
A release corrige também cerca de vinte bugs: contorno de permissões PowerShell em cd, esgotamento da tabela vnode no macOS com find, congelamento do diálogo managed-settings, alterações fantasmas em /config, crash de /insights em campos opcionais em falta, e o spinner de reflexão permanecendo âmbar entre chamadas de ferramentas.
A versão 2.1.150, lançada no mesmo dia, traz apenas melhorias internas de infraestrutura, sem mudanças visíveis.
Claude Code Auto Mode — Disponível no Pro, Sonnet 4.6 integrado
23 de maio de 2026 — A Anthropic anuncia duas extensões do modo auto do Claude Code:
“Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7. Shift+tab, and let Claude run.”
🇵🇹 Duas atualizações do modo auto: agora disponível no plano Pro; o Sonnet 4.6 é suportado, ao lado do Opus 4.7. Faça Shift+tab e deixe o Claude trabalhar. — @ClaudeDevs no X
O modo auto, ativado via Shift+Tab, permite ao Claude executar ações de forma autónoma sem validação manual em cada etapa. Até agora reservado a planos superiores, passa a estar acessível aos assinantes Pro. A adição do Sonnet 4.6 oferece uma opção mais económica do que o Opus 4.7 para sessões longas, reduzindo o consumo de créditos em modo autónomo.
Para aceder a estas mudanças: claude update ou atualização da aplicação desktop Claude. O anúncio gerou 1,18 milhão de visualizações no X.
GitHub Copilot for Eclipse — Open source sob licença MIT
21 de maio de 2026 — O GitHub tornou open source o plugin GitHub Copilot para Eclipse, disponível no GitHub sob licença MIT no endereço github.com/microsoft/copilot-for-eclipse.
Todo o conjunto de funcionalidades está exposto para contribuições da comunidade:
| Funcionalidade | Estado |
|---|---|
| Code completion (compleções inline) | Open source |
| Next Edit Suggestions (NES) | Open source |
| Chat (fluxo de conversa, chamadas de ferramentas) | Open source |
| Agent mode (workflows agentic multistep) | Open source |
| Skills e prompt files | Open source |
| BYOK (Bring Your Own Key) | Open source |
| Agentes personalizados, subagentes, plano agent, MCP | Open source |
A motivação é a transparência e a inovação comunitária no espírito do ecossistema aberto do Eclipse. Já foram recebidas contribuições da comunidade desde a abertura.
Qwen3.7-Max — Cache implícito ativado em produção
25 de maio de 2026 — A Alibaba ativa o cache implícito (implicit caching) no Qwen3.7-Max, o seu modelo principal orientado a agentes.
O cache é ativado automaticamente para todas as requisições API — não é necessária nenhuma alteração de código. Os desenvolvedores beneficiam imediatamente de requisições mais rápidas e mais baratas em contextos repetitivos. Para taxas de cache mais altas e determinísticas, a Alibaba recomenda o cache explícito, documentado na Alibaba Cloud.
Breves
-
MiniMax Hailuo AI no AIFF de Hong Kong (HKUST) — A 2.ª edição do AI Film Festival organizado pela HKUST recebeu 1 300 candidaturas de 80 países. O Hailuo AI esteve representado ao lado da Tencent e da Z.ai num painel sobre a democratização do cinema com IA. 🔗 minimax.io
-
NVIDIA DGX Spark — 16 agentes de IA locais em simultâneo — Demonstração comunitária retuitada por @NVIDIAAI: 2x DGX Spark (GB10) + MiniMax M2.7 NVFP4 fazem correr 16 agentes de IA em streaming simultâneo, sem APIs cloud. 🔗 @NVIDIAAI no X
O que isso significa
Um ponto de viragem para a pesquisa matemática formal. O AlphaProof Nexus marca uma rutura: a IA já não se limita a problemas de concurso ou benchmarks académicos; ela enfrenta problemas em aberto que os matemáticos não conseguiram resolver durante décadas. A combinação Gemini + Lean cria um ciclo de verificação formal que garante que as provas são corretas, e não apenas plausíveis. O custo de algumas centenas de dólares por problema resolvido sugere que esta abordagem está a tornar-se acessível a laboratórios de investigação, e não apenas aos gigantes do setor.
A maturidade da instrumentação agentic do lado da Anthropic. A chegada do modo auto ao plano Pro e a integração do Sonnet 4.6 sinalizam que a Anthropic considera o uso autónomo agentic suficientemente estável para o público em geral. A versão 2.1.149, com o seu breakdown /usage por categoria, responde a uma necessidade concreta dos desenvolvedores que constroem sistemas multiagente complexos: compreender com precisão o que consome a sua quota para otimizar as suas arquiteturas.
Abertura vs soberania de software. O open source do Copilot para Eclipse sob MIT e a ativação do cache implícito no Qwen3.7-Max ilustram duas estratégias diferentes para conquistar os desenvolvedores. O GitHub aposta na transparência e no ecossistema Eclipse para ampliar a adoção do Copilot em ambientes Java empresariais. A Alibaba aposta na redução automática de custos sem fricção para tornar o Qwen3.7-Max mais competitivo face às alternativas cloud.
A industrialização dos media generativos avança. A participação da MiniMax no AIFF de Hong Kong — 1 300 candidaturas de 80 países — e a demonstração da NVIDIA de 16 agentes locais em simultâneo no DGX Spark desenham um ecossistema em que a criação de vídeo por IA penetra os workflows profissionais do cinema, tanto em festivais como em infraestrutura local.