OpenAI refuta uma conjectura de Erdős com 80 anos, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

Em 20 de maio de 2026, a IA irrompe nas matemáticas fundamentais: um modelo da OpenAI refuta uma conjectura de Paul Erdős proposta em 1946, com uma prova de 125 páginas validada por matemáticos, incluindo o medalhista Fields Tim Gowers. No campo dos modelos, a Cohere lança o Command A+ em open-source sob Apache 2.0 (arquitetura MoE 218B/25B ativos), a NVIDIA lança o Nemotron-Labs-Diffusion com geração paralela de tokens, e a Stability AI revela o Stable Audio 3.0 (4 modelos open weights). Na área de ferramentas, o GitHub Copilot evolui em quatro frentes simultaneamente, e o Claude Code lança duas versões em 24 horas.

OpenAI refuta uma conjectura de Erdős com 80 anos

20 de maio — A OpenAI publicou um resultado inédito: um modelo interno de raciocínio geral resolveu o problema das distâncias unitárias no plano (planar unit distance problem), uma questão em aberto desde que Paul Erdős a formulou em 1946. Esse problema questiona o número máximo de pares de pontos a distância exatamente 1 entre n pontos no plano. Desde os anos 1940, a comunidade matemática acreditava que as construções em grades quadradas de Erdős eram essencialmente ótimas.

O modelo produziu uma prova mostrando a existência de uma família infinita de configurações que supera o limite conjecturado, com um expoente δ = 0,014 estabelecido por Will Sawin (Princeton). O avanço baseia-se em uma ferramenta matemática inesperada: torres de corpos de classes infinitos e a teoria de Golod-Shafarevich, oriundas da teoria algébrica dos números, aplicadas a um problema elementar de geometria euclidiana. Essa conexão entre dois campos a priori distantes é, segundo os matemáticos envolvidos, o cerne da originalidade do resultado.

Aspecto	Detalhe
Problema	Distâncias unitárias no plano (Erdős, 1946)
Limite anterior	Crescimento em n^(1+C/loglog(n)) (Spencer-Szemerédi-Trotter, 1984)
Novo resultado	n^(1+δ), δ = 0,014
Ferramenta matemática	Teoria algébrica dos números (Golod-Shafarevich)
Modelo	Modelo interno de raciocínio geral (não nomeado)
Comprimento da cadeia de pensamento	125 páginas
Validação	Grupo de matemáticos externos + artigo complementar

O que torna o resultado especialmente notável: ele não foi produzido por um sistema treinado especificamente para matemática ou direcionado a esse problema. Trata-se de um modelo de uso geral, avaliado em uma coleção de problemas de Erdős no contexto de uma exploração mais ampla das capacidades de pesquisa autônoma.

Tim Gowers (medalha Fields) qualifica o resultado como “milestone in AI mathematics”. Arul Shankar (Princeton) vai além:

“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”

🇵🇹 Na minha opinião, este artigo demonstra que os modelos de IA atuais vão além do simples papel de assistentes para matemáticos — eles são capazes de ter ideias originais e engenhosas e de levá-las até o fim. — [Arul Shankar, teórico dos números, Princeton]

A OpenAI vê nesse resultado um sinal para a pesquisa fundamental: se um modelo pode sustentar um raciocínio complexo ao longo de 125 páginas e conectar áreas matemáticas distantes, essas capacidades são transferíveis para biologia, física, materiais e medicina.

🔗 Artigo da OpenAI

Cohere Command A+ — MoE flagship open-source

20 de maio — A Cohere lança Command A+, seu modelo mais poderoso até hoje, em open-source sob licença Apache 2.0. A arquitetura mixture-of-experts (sparse MoE) mobiliza 218B parâmetros totais, mas apenas 25B ativos a cada inferência, o que permite executá-lo em duas GPUs NVIDIA H100 ou em uma única GPU Blackwell (B200) com quantização W4A4.

O Command A+ unifica em um único modelo as capacidades antes distribuídas entre Command A Reasoning, Command A Vision e Command A Translate. Ele suporta 48 idiomas (contra 23 nas versões anteriores), com um tokenizador aprimorado para idiomas não europeus (+20% para o árabe, +16% para o coreano, +18% para o japonês).

Benchmark	Command A+	Command A Reasoning
τ²-Bench Telecom	85%	37%
Terminal-Bench Hard	25%	3%
MMMU	75,1%	N/A
MathVista	80,6%	73,5%
North Agentic QA	+20% melhoria	referência
North Data Analysis	+32% melhoria	referência

O modelo é até 2× mais rápido e 30% menos latente que o Command A Reasoning, com decodificação especulativa (speculative decoding) oferecendo um ganho adicional de 1,5–1,6×. Disponível no Hugging Face e via vLLM. A pontuação de 37 no Artificial Analysis Intelligence Index o coloca como o melhor entre os modelos open-source.

“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”

🇵🇹 Aqui está o Cohere Command A+ — criámos o nosso LLM mais poderoso até agora, otimizado para funcionar com o mínimo de hardware possível, e estamos a lançá-lo em open-source para todos. — @cohere no X

🔗 Blog da Cohere

Gemini for Science — A IA como parceira da descoberta científica

20 de maio — Anunciado durante o Google I/O 2026 e publicado no X em 20 de maio, Gemini for Science é um conjunto de ferramentas experimentais para a pesquisa científica. Diante da explosão de dados, o objetivo é permitir que pesquisadores conectem informações que nenhum indivíduo consegue processar sozinho.

Três ferramentas experimentais são apresentadas:

Ferramenta	Base	Função
Geração de Hipóteses	Co-Scientist	Descoberta e refinamento de novas hipóteses
Descoberta Computacional	AlphaEvolve + ERA	Testes de milhares de variações de código em paralelo
Science Skills	30+ modelos bio	Bundle integrado às plataformas agenticas (Antigravity)

Descoberta Computacional é a ferramenta mais técnica: ela gera e avalia milhares de variações de código em paralelo, permitindo testar novas abordagens de modelagem em epidemiologia, química ou biologia computacional em uma fração do tempo habitual.

Science Skills integra dados de mais de 30 modelos importantes em ciências da vida e bases de dados, conectando-se às plataformas agenticas para automatizar fluxos de trabalho manuais complexos em poucos minutos.

O projeto foi desenvolvido com 100+ instituições parceiras, de estudantes de doutorado a laureados com o Nobel.

🔗 Anúncio @GoogleAI

NVIDIA Nemotron-Labs-Diffusion — Arquitetura de difusão de tokens

20 de maio — A NVIDIA anuncia Nemotron-Labs-Diffusion, um modelo de linguagem que gera tokens de forma paralela por difusão, ao contrário dos LLMs autoregressivos clássicos, que produzem um token de cada vez. Essa arquitetura — inspirada nos modelos de difusão para geração de imagens — visa acelerar a inferência mantendo a qualidade das saídas.

A abordagem é fundamentalmente diferente do paradigma transformer padrão: em vez de prever sequencialmente cada token condicionado aos anteriores, o modelo itera em paralelo sobre uma sequência inteira de tokens com ruído, até a convergência. As vantagens teóricas incluem menor latência em saídas longas e melhor paralelização em GPU.

Aspecto	Clássico (autoregressivo)	Nemotron-Labs-Diffusion
Geração	Token por token, sequencial	Paralela em toda a sequência
Latência em saídas longas	Cresce linearmente	Potencialmente reduzida
Paradigma	GPT-style	Diffusion-style

O relatório técnico completo acompanha o lançamento. Trata-se de uma contribuição de pesquisa da NVIDIA Labs, posicionada como alternativa arquitetural ao modelo dominante transformer autoregressivo — um campo de pesquisa ativo desde o surgimento dos modelos de difusão de texto como MDLM e Plaid.

🔗 Anúncio @NVIDIAAI

Stability AI — Stable Audio 3.0 (família open weights)

20 de maio — A Stability AI publica Stable Audio 3.0, uma família de 4 modelos de áudio open weights sob licença comercial. A linha cobre todo o espectro de implantação, de dispositivos embarcados à API empresarial.

Modelo	Duração máx.	Implantação	Open weights
Small SFX	curta	on-device	Sim
Small	2 min	on-device	Sim
Medium	6:20	cloud/local	Sim
Large	6:20+	API/empresa	Não

Os modelos Small SFX, Small e Medium estão disponíveis no Hugging Face. Todos os dados de treinamento são totalmente licenciados, com parcerias anunciadas com Universal Music Group e Warner Music Group. Os recursos avançados incluem suporte a LoRA training para fine-tuning personalizado, e um modo de audio inpainting (edição single-segment, multi-segment, continuação causal).

“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”

🇵🇹 Queremos promover no áudio o mesmo tipo de inovação impulsionada pela comunidade que desencadeámos na geração de imagens com o lançamento do Stable Diffusion. — Stability AI

GitHub Copilot evolui em quatro frentes

Seleção automática adaptativa de modelo no VS Code

20 de maio — A opção “Auto” do Copilot VS Code agora seleciona o modelo ideal conforme a natureza da tarefa: raciocínio complexo, geração simples de código, depuração ou orquestração de ferramentas. A seleção baseia-se em métricas em tempo real de disponibilidade e confiabilidade. Vantagem prática: redução de 10% no multiplicador de solicitações premium ao usar Auto, sem necessidade de configuração.

🔗 Changelog GitHub

Busca semântica de issues em linguagem natural

20 de maio — O Copilot Chat na web integra um índice semântico de issues: um desenvolvedor pode buscar “os bugs de renderização mobile relatados no mês passado” sem conhecer o título exato e obter resultados agrupados por contexto. Disponível em disponibilidade geral para todos os planos Copilot.

🔗 Changelog GitHub

Remoção dos modelos Gemini do Copilot Chat web

20 de maio — Todos os modelos Gemini são removidos do Copilot Chat em github.com, assim como GPT-5.2 Codex e GPT-5.4 nano. Apenas OpenAI e Claude permanecem disponíveis na web. O GitHub justifica a decisão pela consistência da qualidade das respostas. Gemini continua disponível nos IDEs e na API.

🔗 Changelog GitHub

Fix with Copilot — aplicação em lote dos comentários de code review

19 de maio — O botão “Implement suggestion” é renomeado para “Fix with Copilot” com uma nova caixa de diálogo (escolha do modelo, branch de destino, instruções personalizadas). Um novo botão “Fix batch with Copilot” permite agrupar vários comentários de code review e enviá-los simultaneamente ao Copilot cloud agent, reduzindo o atrito em PRs com muitos comentários.

🔗 Changelog GitHub

Claude Code v2.1.144 e v2.1.145

19 de maio — O Claude Code publica duas versões em 24 horas com um conjunto substancial de novos recursos e correções.

A versão 2.1.144 melhora o gerenciamento de sessões em segundo plano: o comando /resume agora exibe as sessões --bg, e as notificações de fim de subagente incluem a duração (ex.: “Agent completed · 3h 2m 5s”). O comando /model aplica-se apenas à sessão atual (pressione d para definir o padrão permanente). A renomeação “extra usage” → “usage credits” esclarece a terminologia, e a correção de um bloqueio de inicialização de até 75 segundos quando api.anthropic.com está inacessível (VPN, firewall) melhora a experiência corporativa.

A versão 2.1.145 destaca-se pela introdução de claude agents --json, um comando concebido para integração em scripts shell (tmux-resurrect, barras de status, seletores de sessão). O tracing OpenTelemetry é enriquecido com agent_id e parent_agent_id nos spans, permitindo uma hierarquia correta dos subagentes. A tela /plugin agora exibe o conteúdo completo (comandos, agentes, skills, hooks, servidores MCP/LSP) antes da instalação. Os hooks Stop/SubagentStop recebem dois novos campos: background_tasks e session_crons.

🔗 CHANGELOG Claude Code

Anthropic abre a reflexão sobre a formação do caráter da IA

19 de maio — A Anthropic publicou um artigo detalhando uma iniciativa de diálogos regulares com filósofos, clérigos e eticistas de mais de 15 tradições religiosas e culturais. O objetivo é enriquecer a reflexão sobre o que significa formar o caráter de um sistema de IA — apoiando-se em séculos de pensamento acumulado sobre virtude e a vida boa, sem alinhar o Claude a uma tradição específica.

Um resultado experimental merece destaque: uma ferramenta que o Claude pode invocar durante uma tarefa para reler seus próprios compromissos éticos. Usada espontaneamente antes de ações de alto impacto, ela mostrou “uma redução acentuada de comportamentos desalinhados” nas avaliações internas. As próximas etapas incluirão conversas com juristas, psicólogos e instituições civis.

🔗 Artigo da Anthropic

Cohere — MOUs com Indra Group e Multiverse Computing

20 de maio — A Cohere assina dois memorandos de entendimento (MOU) durante a visita de Estado do Rei Felipe VI da Espanha ao Canadá. O primeiro une a Cohere à IndraMind (braço de IA do grupo Indra, de defesa e digitalização espanholas) para construir um ecossistema de IA soberana incluindo adaptações linguísticas para as cinco línguas oficiais da Espanha. Uma vertente de defesa prevê capacidades de análise e planejamento para exercícios multinacionais. O segundo envolve a Multiverse Computing (otimização por IA de inspiração quântica, Espanha/Canadá) para explorar oportunidades comerciais na Europa e no Canadá.

“Enterprises no longer want to rent AI — they want to own it.”

🇵🇹 As empresas já não querem alugar a IA — querem possuí-la. — Aidan Gomez, cofundador e CEO da Cohere

Perplexity — Compressão de contexto sensível à consulta em produção

20 de maio — A Perplexity lança em produção um sistema de compressão de contexto (query-aware context compression) que reduz os tokens de contexto em até 70% enquanto melhora a precisão das respostas. O princípio: um modelo leve extrai cirurgicamente os trechos relevantes para a consulta antes de os transmitir ao LLM principal, eliminando anúncios, metadados e conteúdo fora do tema.

Métrica	Valor
Redução de tokens de contexto	até 70%
Ganho de conteúdo vital por trecho	+63%
Redução da latência de inferência	35–40%
Redução do cálculo GPU agregado	40–45%
Latência de produção (p99)	< 20 ms

O backbone pplx-diffusion (17 camadas, destilado de 28 camadas) prevê em paralelo quais segmentos manter sem geração de texto — uma abordagem extrativa que garante a fidelidade das citações. No SimpleQA, o preset “medium” com compressão atinge 95% de precisão com apenas 200 tokens em média por documento.

🔗 Anúncio da Perplexity

ElevenLabs — Speech Engine, um agente de voz em um prompt

20 de maio — A ElevenLabs lança o Speech Engine, um pipeline de voz unificado (síntese vocal + transcrição + orquestração) que permite aos desenvolvedores transformar um agente conversacional de texto em um agente de voz completo com um único prompt. Disponível no ElevenAPI, a precificação é de 8 centavos por minuto com desconto por volume. Migração possível para o ElevenAgents para canais de implantação adicionais com monitoramento e analytics.

🔗 Anúncio da ElevenLabs

Luma Agents integra Seedance 2.0

19 de maio — A Luma Agents integra o Seedance 2.0, o modelo de geração de vídeo da ByteDance, à sua plataforma de agentes criativos. Mesmo workflow que os outros modelos já integrados. Essa integração amplia a escolha de modelos acessíveis via Luma Agents, posicionando a plataforma como hub de orquestração multimoodelo para vídeo IA.

🔗 Anúncio da Luma

Kling AI em Cannes — House of David, primeiro filme de Hollywood com IA em escala industrial

20 de maio — No Festival de Cannes 2026, a Kling AI confirma o uso industrial de sua tecnologia em House of David (Prime Video): 44 milhões de viewers globais, top 10 das novas séries nos Estados Unidos, número 1 no Prime Video US. Esta é a primeira produção hollywoodiana a reconhecer publicamente a integração da geração de vídeo por IA em seu pipeline de produção em larga escala, com planos coerentes atendendo a rígidos padrões industriais.

🔗 Anúncio da Kling AI

Breves

Running Guide Agent — Google DeepMind — Agente de IA pessoal dedicado ao treinamento para corrida, apresentado como “um passo em direção a uma corrida sem limites”. 🔗 Blog da DeepMind
Midjourney V8.1 — flag --no reintroduzido — O flag anti-prompting está de volta no V8.1 para excluir elementos das imagens geradas (ex.: --no people). 🔗 Anúncio @midjourney
Anthropic /usage reformulada no Claude Code — Boris Cherny confirma uma reformulação da UI de /usage para visualizar melhor o consumo de tokens em resposta a um usuário. 🔗 fonte
MiniMax Speech 2.8 Turbo — 600+ vozes no Together AI — Mais de 600 novas vozes Speech 2.8 Turbo agora disponíveis na plataforma Together AI. 🔗 Anúncio @MiniMax_AI

O que isso significa

Pesquisa fundamental e IA autônoma. A resolução da conjectura de Erdős por um modelo OpenAI de uso geral não é anedótica. O que impressiona os matemáticos envolvidos é a natureza do resultado: uma conexão inesperada entre dois ramos da matemática (teoria algébrica dos números e geometria discreta), mantida ao longo de 125 páginas de raciocínio coerente. Combinada ao Gemini for Science (desenvolvido com mais de 100 instituições), a tendência é clara: a IA começa a se integrar não mais apenas como ferramenta de processamento de dados científicos, mas como parceira de descoberta capaz de gerar hipóteses originais.

Arquiteturas alternativas ao paradigma autoregressivo. Dois anúncios do dia questionam o modelo dominante no estilo GPT. NVIDIA Nemotron-Labs-Diffusion gera tokens em paralelo por difusão, em vez de sequencialmente. O Stable Audio 3.0 da Stability AI demonstra que a difusão produz resultados musicais de alta qualidade com modelos open weights em 4 níveis de implantação. A convergência dessas abordagens sugere que a difusão não está mais restrita à geração de imagens — ela se torna uma arquitetura concorrente séria para texto e áudio.

Soberania e IA corporativa. Command A+ (MoE 218B open-source, Apache 2.0, 2× H100) e os MOUs da Cohere com Indra Group e Multiverse Computing ilustram uma tendência de fundo: as grandes organizações — governos, defesa, setor regulado — querem implantar seus modelos em sua própria infraestrutura. A combinação de uma arquitetura MoE eficiente (25B ativos em 218B totais) e uma licença Apache 2.0 faz do Command A+ o modelo open-source melhor posicionado para implantações soberanas no fim de maio de 2026.

Pressão crescente sobre as ferramentas de desenvolvimento. Claude Code 2.1.144 e 2.1.145, as quatro atualizações simultâneas do GitHub Copilot e a compressão de contexto da Perplexity (-70% tokens, -40% GPU) são sinais coerentes: a competição está se deslocando da qualidade bruta dos modelos para a ergonomia das ferramentas, a scriptabilidade (claude agents —json), o custo de inferência (Auto model selection -10%, pplx-diffusion) e a robustez em produção (correção do bloqueio VPN no Claude Code).

OpenAI refuta uma conjectura de Erdős com 80 anos, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

OpenAI refuta uma conjectura de Erdős com 80 anos

Cohere Command A+ — MoE flagship open-source

Gemini for Science — A IA como parceira da descoberta científica

NVIDIA Nemotron-Labs-Diffusion — Arquitetura de difusão de tokens

Stability AI — Stable Audio 3.0 (família open weights)

GitHub Copilot evolui em quatro frentes

Seleção automática adaptativa de modelo no VS Code

Busca semântica de issues em linguagem natural

Remoção dos modelos Gemini do Copilot Chat web

Fix with Copilot — aplicação em lote dos comentários de code review

Claude Code v2.1.144 e v2.1.145

Anthropic abre a reflexão sobre a formação do caráter da IA

Cohere — MOUs com Indra Group e Multiverse Computing

Perplexity — Compressão de contexto sensível à consulta em produção

ElevenLabs — Speech Engine, um agente de voz em um prompt

Luma Agents integra Seedance 2.0

Kling AI em Cannes — House of David, primeiro filme de Hollywood com IA em escala industrial

Breves

O que isso significa

Fontes

Índice