Pesquisar

Qwen3.7-Max, incidente de segurança do GitHub, NVIDIA Verified Agent Skills, Runway Aleph 2.0

Qwen3.7-Max, incidente de segurança do GitHub, NVIDIA Verified Agent Skills, Runway Aleph 2.0

ai-powered-markdown-translator

Artigo traduzido do fr para o pt com gpt-5.4-mini.

Ver projeto no GitHub ↗

Uma semana intensa para o ecossistema de IA: a Alibaba lança seu modelo principal Qwen3.7-Max, projetado para a era agêntica, o GitHub revela um incidente de segurança envolvendo uma extensão maliciosa do VS Code, a NVIDIA publica um framework aberto de governança para skills de agentes, e a Runway renova seu modelo de edição de vídeo com Aleph 2.0 e Edit Studio. Do lado das ferramentas para desenvolvedores, o Claude Code 2.1.146 renomeia /simplify para /code-review e o Codex 26.519 introduz os Appshots no macOS.


Qwen3.7-Max — O flagship da Alibaba para a era agêntica

21 de maio — A Alibaba lança Qwen3.7-Max, seu novo modelo proprietário principal, projetado especificamente para agentes autônomos. O modelo sucede às previews Qwen3.7-Max-Preview e Qwen3.7-Plus-Preview avaliadas na Arena em 18 de maio.

O posicionamento é explicitamente “Agent Era”: o Qwen3.7-Max mira tarefas que vão além da compreensão pontual e entram no campo da autonomia de longa duração e da orquestração complexa.

MétricaValor
Pontuação AAII56,6
Evolução vs. anterior+4,8 pts
Horas de autonomia contínuas (teste de núcleo)35 h
Chamadas de ferramentas (teste de núcleo)1 000+
Visualizações do tweet principal~325 000

Cinco capacidades anunciadas:

  1. Agente de codificação de ponta a ponta — protótipos de frontend, refatorações de múltiplos arquivos, depuração no mundo real
  2. Produtividade de escritório — tarefas via integrações MCP e gerenciamento multiagente
  3. Autonomia de longa duração — 35 horas consecutivas em uma tarefa de otimização de kernel, 1 000+ chamadas de ferramentas sem alucinação crítica
  4. Agnóstico em relação a scaffolds — compatível com Claude Code, OpenClaw, Qwen Code ou qualquer stack personalizada
  5. Raciocínio científico reforçado — pontuação AAII: 56,6 (+4,8 pts)

Segundo o Tongyi Lab (Alibaba), o Qwen3.7-Max é “nosso mais recente modelo proprietário, projetado especificamente para a era dos agentes”, com um agente de codificação de ponta, um assistente de produtividade de escritório e autonomia de longa duração — confiável sempre, agnóstico em relação a scaffolds.

O modelo está acessível via Qwen Studio (chat.qwen.ai) e a API da Alibaba Cloud.

🔗 Blog oficial do Qwen3.7-Max


GitHub — Incidente de segurança: extensão maliciosa do VS Code

20 de maio — O GitHub revela um grande incidente de segurança: um funcionário instalou uma extensão maliciosa do VS Code a partir do marketplace da Microsoft, permitindo acesso não autorizado a repositórios internos do GitHub.

O anúncio inicial no X gerou 13,4 milhões de visualizações, 8 000 reposts e 25 000 likes — sinal de um impacto comunitário considerável. O GitHub publicou um thread em 5 partes detalhando a cronologia e as medidas adotadas.

“1/ Yesterday we detected and contained a compromise of an employee device involving a poisoned VS Code extension. We removed the malicious extension version, isolated the endpoint, and began incident response immediately.”

🇵🇹 Ontem, detectamos e contivemos a violação de um dispositivo de um funcionário envolvendo uma extensão do VS Code adulterada. Removemos a versão maliciosa da extensão, isolamos o endpoint e iniciamos imediatamente a resposta ao incidente.@github no X

O que aconteceu:

  • Vetor: extensão maliciosa do VS Code do marketplace da Microsoft
  • Dispositivo de um funcionário do GitHub comprometido
  • Acesso não autorizado aos repositórios internos do GitHub

O que não foi afetado (segundo o GitHub):

  • Nenhum impacto confirmado nos dados de clientes (empresas, organizações, repositórios públicos ou privados)

Ações imediatas:

  • Remoção da extensão maliciosa
  • Isolamento do endpoint comprometido
  • Análise dos registros (logs) e rotação de segredos
  • Monitoramento reforçado da infraestrutura

O GitHub se comprometeu a publicar um relatório completo ao fim da investigação. Este incidente reacende o debate sobre a segurança do marketplace de extensões do VS Code, que conta com dezenas de milhares de extensões cuja verificação ainda é limitada.

🔗 Anúncio do GitHub no X


NVIDIA Verified Agent Skills — Um padrão aberto para a governança de agentes de IA

21 de maio — A NVIDIA lança os NVIDIA-Verified Agent Skills, um framework de governança aberto para proteger as capacidades (skills) dos agentes de IA. A iniciativa responde a um problema crescente: as skills ampliam as capacidades dos agentes, mas também introduzem vulnerabilidades potenciais.

Uma skill “verificada” segundo a NVIDIA se apoia em quatro pilares:

ComponenteDescrição
CatalogaçãoSincronização diária a partir das equipes de produto da NVIDIA
SkillSpectorScanner de riscos baseado em OWASP LLM e MITRE ATLAS
Assinatura criptográficaAssinatura destacada skill.oms.sig verificável via OpenSSF Model Signing
Skill Card (SKILLCARD.yaml)Metadados machine-readable: proveniência, dependências, limitações, status

O framework detecta, em especial: dependências vulneráveis, injeção de prompts, trigger abuse, excessive agency e tool poisoning.

A especificação técnica é aberta via agentskills.io (formato SKILL.md), compatível nativamente com Claude Code, OpenAI Codex e Cursor. O repositório público das skills da NVIDIA está disponível em github.com/nvidia/skills.

“Verified means cataloged, scanned, signed, and documented with a skill card.”

🇵🇹 Verificado significa catalogado, escaneado, assinado e documentado com uma ficha de competência. — Developer Blog da NVIDIA, 21 de maio de 2026

O fato de a especificação ser aberta e compatível com as três principais ferramentas de codificação de IA (Claude Code, Codex, Cursor) sugere uma ambição de padrão industrial, e não apenas de ferramenta interna da NVIDIA.

🔗 Blog de desenvolvedor da NVIDIA


Runway Aleph 2.0 e Edit Studio — Edição de vídeo de até 30 segundos em 1080p

21 de maio — A Runway lança Aleph 2.0, uma atualização importante do seu modelo de edição de vídeo, acompanhada do Edit Studio, uma nova interface dedicada às equipes de marketing e aos cineastas.

A novidade central do Aleph 2.0 é o controle image-level: o usuário fornece um frame editado como referência visual, e o modelo aplica a modificação de forma consistente em todo o vídeo. Ao contrário das abordagens anteriores, em que o resultado final era desconhecido antes da geração, esse método oferece controle previsível sobre a saída.

FuncionalidadeDetalhe
Duração máx.30 segundos
Resolução1080p
ControleFrame de referência de imagem (image-level)
Edição multi-shotsSim — aplicação automática em vários planos
AcessoTodos os planos pagos da Runway

Capacidades de edição do Aleph 2.0:

  • Edições localizadas precisas: apenas a área modificada muda, o restante é preservado
  • Edição multi-shots: modificações aplicadas em vídeos com vários cortes
  • Cliques de até 30s em 1080p — duração suficiente para anúncios e conteúdo curto

Casos de uso do Edit Studio: troca de produto, mudança de fundo, variação sazonal de campanha, correção de iluminação, remoção de elementos intrusivos, reestilização completa.

“With Aleph 2.0, your edited frame defines what the change should look like, and the model carries it through to the right parts of your video.”

🇵🇹 Com o Aleph 2.0, sua imagem modificada define a aparência desejada, e o modelo a aplica às partes correspondentes do seu vídeo. — Runway, blog oficial 21 de maio de 2026

🔗 Anúncio oficial da Runway


Claude Code 2.1.146 — /code-review e correções background agents

21 de maio — A Anthropic publica a versão 2.1.146 do Claude Code com uma novidade principal e várias correções importantes de estabilidade.

O comando /simplify é renomeado para /code-review, acompanhado de um nível de esforço opcional (/code-review high). Essa mudança reposiciona explicitamente a funcionalidade como uma ferramenta de revisão de código nos workflows agênticos.

DomínioCorreção
Windows PowerShellRegressão v2.1.124 corrigida para pwsh via winget/Microsoft Store
MCP paginationresources/list e prompts/list não perdem mais os itens além da página 1
Background sessionsStrobing do Windows Terminal, worktrees NTFS, bloqueios /background e claude agents
Auto modeAskUserQuestion preservado quando a skill ou o usuário dependem disso
BedrockAuth cross-account corrigida com awsCredentialExport
VSCode VoiceFeedback de microfone silencioso, sugestões sox para WSLg

🔗 CHANGELOG do Claude Code


Claude Code /usage — Decomposição do consumo de tokens por componente

21 de maio — Boris Cherny (lead do Claude Code na Anthropic) anuncia no X uma extensão significativa do comando /usage: a próxima versão permitirá ver exatamente quais Skills, Agents, MCPs e Plugins consomem tokens em uma sessão.

Essa funcionalidade vai além do redesenho da interface da véspera. Ela traz granularidade por componente — permitindo identificar as extensões mais vorazes em contexto. Já está disponível em CLI e chegará ao aplicativo Desktop em breve. O anúncio gerou 137 527 visualizações no X, com muitos pedidos para desativar seletivamente conectores não usados.

“In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next”

🇵🇹 Na próxima versão do Claude Code: execute /usage para ver a distribuição do consumo de tokens por Skills, Agents, MCPs e Plugins — disponível em CLI hoje, no Desktop em breve.@bcherny no X


Google I/O 2026 — O resumo oficial “100 anúncios”

20 de maio — O Google publica seu artigo oficial de resumo “100 things announced at I/O 2026”, documento de referência para todos os lançamentos do evento. Entre os anúncios confirmados: Antigravity 2.0 CLI (sucessor do Gemini CLI), Universal Cart (compras em múltiplas lojas), Google Pics (gestão inteligente de fotos), Ask YouTube (consulta de vídeos do YouTube), Android XR glasses e a expansão do SynthID. Este documento consolida a amplitude do Google I/O 2026 e serve como fonte primária para desenvolvedores que desejam recuperar todos os detalhes oficiais.

🔗 Blog do Google — 100 anúncios do I/O 2026


Gemini Connected Apps — OpenTable, Canva e Instacart

21 de maio — O Google Gemini amplia seus Connected Apps para três novos parceiros: OpenTable (reserva de restaurante), Canva (criação de visuais) e Instacart (compras de supermercado). O Gemini deixa de apenas buscar informações — ele passa a tomar ações concretas no ecossistema digital do usuário em nome dele. Esse anúncio pós-I/O traduz de forma concreta a visão agêntica do Gemini Spark: o agente atua em serviços de terceiros populares sem sair do aplicativo.

🔗 Anúncio do Gemini Connected Apps


GitHub Copilot — Quatro atualizações para desenvolvedores

Relatórios métricos migrados para copilot-reports.github.com

20 de maio — As URLs de download dos relatórios Copilot Usage Metrics migram do antigo domínio Azure Front Door (azurefd.net) para o domínio estável copilot-reports.github.com. Ação necessária para organizações com firewall ou proxy: adicionar o novo domínio à allowlist enterprise o mais rápido possível. O domínio antigo permanece ativo durante o período de transição, mas será descontinuado posteriormente. Para instâncias GitHub Enterprise Cloud, o novo domínio segue o formato copilot-reports.SUBDOMAIN.ghe.com. Um fallback para *.blob.core.windows.net está previsto em caso de indisponibilidade da Azure.

🔗 Changelog do GitHub Copilot

Cloud agent — Claude Haiku 4.5 e GPT-5.4-mini a 0,33x

18 de maio — O Copilot cloud agent integra dois novos modelos econômicos: Claude Haiku 4.5 e GPT-5.4-mini, ambos cobrados a 0,33x do multiplicador padrão (contra 1x para os modelos padrão). Essa expansão permite escolher a ferramenta certa conforme a natureza da tarefa — modelo leve e rápido para correções simples de lint ou testes unitários, modelo mais poderoso para refatorações complexas. A escolha do modelo é feita no momento de delegar uma tarefa ao cloud agent, permitindo otimizar a relação custo/qualidade conforme a complexidade real do trabalho.

🔗 Changelog do cloud agent

Chat web — Painel lateral contextual em disponibilidade geral

18 de maio — O Copilot Chat no github.com agora se abre em painel lateral diretamente ao lado do recurso consultado (PR, issue, repositório), sem precisar navegar para uma página dedicada. O contexto se acumula automaticamente ao navegar entre vários PRs e issues na mesma sessão — as referências entre recursos continuam acessíveis sem perder o fio da conversa. A experiência imersiva em tela cheia continua disponível via “More → In immersive chat”. Também é possível transformar a conversa em uma sessão de agente para criar PRs ou iniciar uma pesquisa aprofundada. Disponível em GA para todos os planos Copilot.

🔗 Changelog do Copilot Chat web

Genspark integra Gemini 3.5 Flash gratuitamente

20 de maio — A Genspark integra Gemini 3.5 Flash já no dia seguinte ao seu anúncio no Google I/O, disponível gratuitamente no AI Chat Agent e no Genspark Claw. A plataforma (70+ modelos simultaneamente disponíveis) ilustra sua estratégia de integração reativa: adotar os modelos mais recentes sem forçar o usuário a escolher manualmente. O Gemini 3.5 Flash representa o modelo Flash mais avançado do Google até hoje, otimizado para velocidade de resposta em tarefas complexas.

🔗 Anúncio da Genspark


Kling AI em Cannes — RAPHAEL RAPHAEL, filme 100% IA

21 de maio — A Kling AI apresenta RAPHAEL RAPHAEL no Festival de Cannes 2026, um projeto de longa-metragem 100% gerado por IA em grande escala. Esse anúncio é distinto do post de 20 de maio sobre House of David (primeira série de Hollywood a integrar a Kling em escala industrial, 44 milhões de viewers, #1 no Prime Video US). A Kling AI consolida assim uma presença multprojeto em Cannes 2026, afirmando sua posição como um grande ator da IA de vídeo para o cinema.

🔗 Anúncio da Kling AI


BFL FLUX Erase — Remoção de objetos e apagamento de texto

21 de maio — A Black Forest Labs lança FLUX Erase, funcionalidade de apagamento inteligente para imagens FLUX. Três capacidades principais: remoção de objetos (retirada limpa com reconstrução coerente do fundo), apagamento de texto (remoção preservando o design subjacente) e remoção automática de sombras relacionadas aos objetos apagados. A funcionalidade foi projetada para retoque de precisão (precision inpainting): apenas a área alvo é modificada, sem degradar o restante da imagem. Disponível via a ferramenta web flux-tools.bfl.ai/erase e a API BFL (docs.bfl.ai/flux_erase), com acesso imediato sem lista de espera.

🔗 Anúncio da BFL


ElevenReader — 200 000+ títulos premium com voz à escolha

21 de maio — A ElevenLabs integra 200 000+ títulos premium no ElevenReader: best-sellers em audiobooks e eBooks licenciados, incluindo milhares disponíveis com a voz do narrador à escolha entre as vozes da ElevenLabs. Essa expansão posiciona o ElevenReader como uma plataforma de leitura em áudio personalizável, na qual o usuário não fica mais limitado ao narrador original de um livro: ele pode escolher a voz de sua preferência para qualquer título compatível. O aplicativo está acessível em elevenreader.io com acesso gratuito para começar.

🔗 Anúncio da ElevenLabs


xAI Grok × OpenCode — Grok Build no CLI de código

21 de maio — Assinantes do Grok ou do X Premium agora podem usar o modelo Grok Build no OpenCode, um editor de código em linha de comando (CLI coding editor) especializado em inteligência de base de código. Essa integração segue a anunciada no OpenClaw dois dias antes — a xAI está expandindo gradualmente sua assinatura para mais ferramentas de terceiros. O acesso está incluído na assinatura Grok/X Premium existente, sem custo adicional. O OpenCode se diferencia do OpenClaw pelo foco específico no código: análise de base de código, navegação e refatoração assistida.

🔗 Anúncio da xAI


Codex 26.519 — Appshots, Goal mode GA, uso de computador bloqueado, compartilhamento de plugins

21 de maio — A OpenAI lança o Codex 26.519 com vários novos recursos para macOS e empresas. Os Appshots permitem enviar a janela do aplicativo em primeiro plano em um thread do Codex por meio de um toque duplo nas duas teclas Command — a janela visível e o texto acessível pela API de acessibilidade do macOS são capturados. O Goal mode sai do status experimental e passa a disponibilidade geral (app, extensão IDE, CLI). Remote computer use: o Codex agora pode usar os aplicativos de desktop após o Mac ser bloqueado. O compartilhamento de plugins está disponível para o ChatGPT Business.

RecursoStatusPlataformas
AppshotsNovo (GA)Somente macOS
Goal modeGA (era experimental)App, extensão IDE, CLI
Remote computer use (Mac bloqueado)NovomacOS + Codex Mobile
Compartilhamento de pluginsNovo (Business)ChatGPT Business

🔗 Changelog do Codex


Breves

  • Gemini Daily Brief — disponibilidade geral — O resumo diário agora está acessível a todos os assinantes Google AI Plus, Pro e Ultra (18+), inicialmente nos Estados Unidos. 🔗 fonte
  • Grok × Imagine — assets de jogos de vídeo (8,1M visualizações) — Demonstração viral da prototipagem de assets de jogos diretamente com Grok e @imagine, com forte engajamento da comunidade gamer. 🔗 fonte
  • Cohere Command A+ — pesos W4A4 disponíveis no HuggingFace — Os pesos quantizados W4A4 do Command A+ podem ser baixados, permitindo a implantação em 2× H100 com +47% de velocidade vs BF16. 🔗 fonte

O que isso significa

A era agentic se afirma em várias frentes ao mesmo tempo. O lançamento do Qwen3.7-Max com 35 horas de autonomia contínua e 1.000+ chamadas de ferramentas, combinado com os NVIDIA Verified Agent Skills que padronizam a governança das capacidades dos agentes, indica que o setor está passando de uma fase de experimentação para uma fase de estruturação. O fato de a NVIDIA basear seu padrão na especificação aberta agentskills.io — compatível com Claude Code, Codex e Cursor — sugere uma convergência para interfaces comuns para agentes de IA, independentemente do modelo subjacente.

A segurança da cadeia de ferramentas de IA torna-se um ponto crítico. O incidente do GitHub, em que uma extensão maliciosa do VS Code no marketplace oficial da Microsoft comprometeu um dispositivo interno, ilustra uma nova superfície de ataque que o setor ainda não abordou plenamente. O timing é revelador: a NVIDIA lança seus Verified Agent Skills no mesmo dia em que o GitHub anuncia seu incidente. Os skills e extensões não verificados representam um vetor de ataque crescente à medida que os agentes de IA assumem o controle de sistemas críticos.

A ferramenta para desenvolvedores se consolida em torno da transparência de consumo. O anúncio do Claude Code /usage com decomposição por componente, combinado com os Appshots do Codex e o Goal mode GA, revela uma tendência: as ferramentas IA de nova geração para desenvolvedores agora precisam explicar o que consomem e como. A granularidade por Skills/Agents/MCPs/Plugins responde a uma demanda concreta das equipes que implantam agentes em produção e querem entender os custos reais.

A IA generativa de vídeo entra na indústria cinematográfica. O Runway Aleph 2.0 com seu controle previsível em nível de imagem, o Kling AI em Cannes com um longa-metragem 100% IA (RAPHAEL RAPHAEL) e a confirmação de que House of David (44M viewers, #1 Prime Video US) usa Kling em escala industrial marcam uma virada. Os estúdios não estão mais testando a tecnologia — estão integrando-a em seus pipelines de produção padrão.


Fontes