Pesquisar

ChatGPT Images 2.0 com thinking, Gemini Deep Research Max, NVIDIA x Adobe x WPP

ChatGPT Images 2.0 com thinking, Gemini Deep Research Max, NVIDIA x Adobe x WPP

Em 21 de abril de 2026, três grandes anúncios dominam as notícias de IA: a OpenAI lança o ChatGPT Images 2.0 com seu primeiro modelo de imagem capaz de raciocinar, o Google DeepMind apresenta dois agentes de pesquisa autônomos alimentados pelo Gemini 3.1 Pro, e a NVIDIA consolida uma parceria tripartite com Adobe e WPP em torno de agentes criativos para marketing empresarial. Claude Code, Codex e Git 2.54 completam um dia rico em atualizações de ferramentas.


ChatGPT Images 2.0 e gpt-image-2

21 de abril — A OpenAI lança ChatGPT Images 2.0, disponível imediatamente para todos os usuários do ChatGPT e do Codex. O modelo subjacente, gpt-image-2, está simultaneamente disponível via API.

Esta nova versão marca uma mudança em relação à geração anterior: o seguimento de instruções detalhadas (instruction following) está significativamente melhorado, o posicionamento e a relação precisa entre objetos são mais confiáveis, a renderização de texto denso foi revista, e vários formatos (retrato, paisagem, quadrado) são suportados nativamente.

O modo reflexão (thinking) é a principal novidade. ChatGPT Images 2.0 é o primeiro modelo de imagem da OpenAI com capacidades de raciocínio. No modo thinking, disponível para assinantes Plus, Pro e Business (Enterprise em breve), o modelo pode:

  • Pesquisar a web em tempo real para informações atualizadas
  • Gerar várias imagens distintas a partir de um único prompt
  • Autoverificar e corrigir as suas próprias saídas

As equipes de pesquisa da OpenAI detalharam os casos de uso em um thread: renderização multilíngue e texto preciso, slides e infográficos profissionais, múltiplos formatos e resoluções, seguimento de instruções complexas.

FuncionalidadeDisponibilidade
ChatGPT Images 2.0 (standard)Todos os usuários do ChatGPT e Codex
Modo thinkingChatGPT Plus, Pro, Business (Enterprise em breve)
API gpt-image-2Disponível já a partir de agora

A linha orientadora da OpenAI para este lançamento: o modelo “passa da geração de imagens para o design estratégico, de uma ferramenta para um sistema visual.”

🔗 Apresentando o ChatGPT Images 2.0 🔗 Tweet @OpenAI


Google Deep Research e Deep Research Max

21 de abril — O Google DeepMind lança dois agentes de pesquisa autônomos alimentados por Gemini 3.1 Pro: Deep Research e Deep Research Max.

Esses agentes navegam tanto na web aberta quanto em dados personalizados — documentos internos, informações financeiras especializadas — para produzir relatórios profissionais totalmente citados.

Deep Research é otimizado para velocidade e baixa latência, ideal para interfaces que exigem respostas rápidas. Deep Research Max aproveita um tempo de cálculo estendido (extended test-time compute) para raciocinar de forma iterativa, refinar as pesquisas e produzir um relatório de alta qualidade — concebido para processamentos assíncronos em segundo plano.

FuncionalidadeDetalhe
Suporte MCPConexão segura a fontes proprietárias ou de terceiros
Geração nativa de visuaisPrimeiro agente a gerar gráficos e infográficos (HTML ou Nano Banana 2)
Planejamento colaborativoO utilizador pode refinar o plano de pesquisa antes da execução
MultimodalidadePDFs, CSVs, imagens, áudio, vídeo aceitos na entrada
DisponibilidadeAPI Gemini, terceiros pagos, pré-visualização pública

A geração nativa de visuais é notável: o Deep Research Max pode produzir gráficos e infográficos diretamente nos seus relatórios, em HTML ou via Nano Banana 2, sem ferramenta externa. As startups e empresas Google Cloud beneficiarão de uma disponibilidade a ser anunciada em breve.

🔗 Anúncio @GoogleDeepMind 🔗 Artigo blog.google


NVIDIA × Adobe × WPP — Agentes criativos para o marketing empresarial

20 de abril — A NVIDIA amplia suas colaborações estratégicas com Adobe e WPP para implantar agentes de IA autônomos nas operações de marketing empresarial. O anúncio vem acompanhado de uma demonstração ao vivo no Adobe Summit em 21 de abril, com Jensen Huang (CEO da NVIDIA) e Shantanu Narayen (CEO da Adobe).

A nova solução Adobe CX Enterprise Coworker é orquestrada por agentes de IA baseados em:

  • NVIDIA OpenShell: ambiente de execução seguro, observável e auditável para workflows agenticos
  • NVIDIA Agent Toolkit e modelos Nemotron open-source
  • Adobe Firefly Foundry acelerado pela infraestrutura NVIDIA AI

Na prática, um varejista global pode agora gerar milhões de combinações produto/audiência/canal em poucos minutos, em vez de meses. Os gêmeos digitais 3D (Omniverse + OpenUSD) servem como identidades de produtos persistentes para automatizar a produção de conteúdo de alta fidelidade em grande escala.

🔗 Artigo blogs.nvidia.com 🔗 Tweet @NVIDIAAI


Claude Code v2.1.116

19–21 de abril — Claude Code v2.1.116 traz uma série de melhorias direcionadas ao desempenho, à fiabilidade e à experiência no terminal.

A atualização mais tangível: o comando /resume está até 67 % mais rápido em grandes sessões (40 Mo+), com melhor gestão de entradas “dead-fork”. A inicialização MCP também está mais rápida com vários servidores stdio configurados.

Experiência do usuário:

  • O indicador de reflexão agora mostra o progresso em linha (“still thinking”, “thinking more”, “almost done thinking”), substituindo a linha de dica separada
  • /config pode pesquisar por valor de opção (ex: procurar “vim” encontra o parâmetro Editor mode)
  • /doctor pode ser aberto enquanto o Claude responde, sem esperar o fim da vez

Segurança: o sandbox auto-allow já não contorna a verificação de caminhos perigosos para rm/rmdir visando /, $HOME ou outros diretórios de sistema críticos.

8 correções de terminal incluem: protocolo de teclado Kitty (Ctrl+-, Cmd+Esquerda/Direita), renderização de scripts Devanagari, bloqueio de Ctrl+Z via processo wrapper, duplicação de scrollback no modo inline e várias correções no VS Code/Warp/Ghostty.

CategoriaMudança principal
Desempenho/resume 67 % mais rápido em sessões 40 Mo+
UXThinking spinner progressivo, /config por valor
SegurançaSandbox respeita a proteção dos caminhos críticos
Terminais8 correções (Kitty, VS Code, Warp, Ghostty, WezTerm)
PluginsAuto-install das dependências em falta

🔗 CHANGELOG Claude Code


Live Artifacts no Claude Cowork

20 de abril — A Anthropic lança os “Live Artifacts” no Claude Cowork: painéis e trackers dinâmicos diretamente conectados às aplicações e ficheiros do utilizador.

Ao contrário dos artefatos clássicos (estáticos), os Live Artifacts são atualizados automaticamente ao abrir com os dados atuais. Eles são salvos em uma nova aba dedicada com histórico de versões, acessível a partir de qualquer sessão.

“In Cowork, Claude can now build live artifacts: dashboards and trackers connected to your apps and files. Open one any time and it refreshes with current data.”

🇵🇹 “No Cowork, o Claude agora pode criar artefatos dinâmicos: painéis e trackers conectados às suas aplicações e ficheiros. Abra um a qualquer momento e ele é atualizado com os dados atuais.”@claudeai no X

A funcionalidade está disponível em todos os planos pagos por meio de uma atualização do aplicativo Claude.

🔗 Anúncio @claudeai


Codex na empresa: Codex Labs e 7 parceiros integradores

21 de abril — A OpenAI dá mais um passo na implantação empresarial do Codex: 4 milhões de desenvolvedores o utilizam toda semana (contra 3 milhões no início de abril, ou seja, +33 % em duas semanas), e lança simultaneamente Codex Labs e um programa de parcerias com 7 integradores globais.

Codex Labs leva especialistas da OpenAI diretamente às organizações para workshops práticos e sessões de trabalho, com o objetivo de ajudar as equipes a passar de um uso experimental para uma implantação reproduzível.

Os 7 parceiros integradores (GSI): Accenture, Capgemini, CGI, Cognizant, Infosys, PwC e Tata Consultancy Services.

EmpresaUso do Codex
Virgin AtlanticCobertura de testes, redução da dívida técnica
RampAceleração das revisões de código (code review)
NotionDesenvolvimento rápido de novas funcionalidades
CiscoCompreensão de grandes repositórios interligados
RakutenResposta a incidentes (incident response)

O Codex agora se estende para além do desenvolvimento de software: navegação no navegador, geração de imagens, memória, orquestração de tarefas transversais.

🔗 Expandindo o Codex para empresas em todo o mundo


Nano Banana Pro no Google AI Studio

20 de abril — Os assinantes Google AI Pro e Ultra passam agora a beneficiar de acesso alargado ao Google AI Studio sem chave API exigida: acesso ao Nano Banana Pro e aos modelos Gemini Pro com limites de uso aumentados.

Basta entrar com a conta de assinante para passar do protótipo para a produção. Esta evolução posiciona a assinatura Google AI como uma ponte prática para desenvolvedores que desejam experimentar sem a complexidade da cobrança por requisição.

🔗 Anúncio @GoogleAI 🔗 Artigo blog.google


Kimi FlashKDA open-source

21 de abril — A Moonshot AI publica em open-source FlashKDA, sua implementação CUTLASS de alto desempenho dos kernels Kimi Delta Attention (KDA).

MétricaValor
Speedup pré-fill vs baseline1,72× a 2,22× em H20
IntegraçãoBackend drop-in para flash-linear-attention
Pré-requisitosSM90+, CUDA 12.9+, PyTorch 2.4+

O FlashKDA funciona como um backend intercambiável (drop-in) para flash-linear-attention. A integração está disponível via a PR fla-org/flash-linear-attention#852.

🔗 Repositório GitHub FlashKDA 🔗 Tweet @Kimi_Moonshot


Git 2.54

20 de abril — Git 2.54 está disponível com três evoluções estruturais.

git history (experimental) — Nova subcomando para reescrever o histórico sem passar por git rebase -i :

  • git history reword <commit> : modificar a mensagem de um commit e reescrever as branches no local
  • git history split <commit> : dividir um commit em dois interativamente

Config-based hooks — Os hooks podem agora ser definidos nos ficheiros de configuração do Git, e não apenas em .git/hooks. Isso permite o compartilhamento entre vários repositórios via ~/.gitconfig, vários hooks para o mesmo evento e a desativação individual via hook.<name>.enabled = false.

Geometric repacking por padrãogit maintenance usa agora a estratégia geométrica por padrão, melhorando o desempenho sem configuração adicional.

🔗 Destaques do Git 2.54 🔗 Tweet @github


Genspark Build em pré-visualização pública

21 de abril — A Genspark lança Genspark Build em pré-visualização pública (public preview): uma ferramenta de criação de aplicações e sites web impulsionada por Claude Opus 4.7, cobrindo todo o processo da ideia à maquete de design, protótipo e código funcional.

Os usuários Plus e Pro beneficiam de 3 dias de acesso sem crédito de 21 a 24 de abril (9h PT). A Genspark esclarece que está a lançar “rough edges and all” — a ferramenta está em construção ativa.

No mesmo dia, a Genspark também integra Lyria 3 Music no seu AI Music Agent e Gemini 3.1 Flash TTS no seu AI Audio Agent.

🔗 Tweet Genspark Build 🔗 Tweet Lyria 3 + TTS


Cohere — Pesquisa sobre decodificação especulativa para modelos MoE

21 de abril — A Cohere publica um artigo de pesquisa técnica sobre a otimização de modelos de mistura de especialistas (Mixture-of-Experts, MoE) com decodificação especulativa (speculative decoding).

A equipe valida nos seus modelos MoE em produção — incluindo Command A (111 bilhões de parâmetros) — uma curva de ganho não monotônica conforme o tamanho do lote: os ganhos aumentam primeiro antes de diminuir. Dois mecanismos-chave são identificados: a correlação temporal no roteamento de especialistas reduz de 20 a 31 % o número de especialistas únicos a carregar na memória, e um amortecimento dos custos fixos explica os ganhos elevados em BS=1.

🔗 Artigo Cohere


Genspark Claw: Kimi K2.6 já no dia do lançamento

21 de abril — A Genspark integra Kimi K2.6 na sua ferramenta Claw já no dia do lançamento (Day 0), por meio de uma parceria com a Fireworks AI que acompanhou as fases de pré-lançamento e teste.

🔗 Tweet @genspark_ai


Anthropic STEM Fellows Program

21 de abril — A Anthropic lança o programa STEM Fellows, direcionado a especialistas em ciências e engenharia para trabalhar ao lado das equipes de pesquisa em projetos de alguns meses, baseados em São Francisco.

🔗 Anúncio @AnthropicAI


O que isso significa

21 de abril marca uma convergência entre raciocínio e geração multimodal. gpt-image-2 ilustra uma tendência clara: os modelos generativos integram o raciocínio como camada de orquestração, não apenas como melhoria de qualidade. O resultado é um modelo capaz de pesquisar, gerar, verificar e corrigir em uma mesma sessão.

Deep Research Max leva a mesma lógica para o lado da pesquisa: com suporte MCP, o agente pode acessar dados proprietários estruturados, o que abre caminho para workflows analíticos autônomos sem exportar dados sensíveis para serviços de terceiros.

A parceria NVIDIA × Adobe × WPP sinaliza que a adoção enterprise de IA criativa está saindo da fase piloto. OpenShell como runtime auditável responde a uma verdadeira restrição das grandes organizações: agentes autônomos precisam poder ser observados e rastreados, não apenas ter bom desempenho.

No aspecto de ferramentas, os config-based hooks do Git 2.54 são uma evolução arquitetônica discreta, mas importante: os hooks compartilhados entre repositórios via ~/.gitconfig vão mudar as práticas de equipe para a padronização de workflows de CI locais.


Fontes

Este documento foi traduzido da versão fr para o idioma pt usando o modelo gpt-5.4-mini. Para mais informações sobre o processo de tradução, consulte https://github.com/jls42/ai-powered-markdown-translator