DeepSeek-V4 Preview, Claude chemik (NMR), wyróżnienia CVPR 2026

Tydzień naznaczony dwoma ważnymi ogłoszeniami: DeepSeek publikuje swój nowy flagowy model V4 Preview z oknem kontekstu wynoszącym milion tokenów w bardzo niskich cenach, a Anthropic pokazuje, że Opus 4.7 dorównuje referencyjnemu oprogramowaniu NMR w chemii syntezy. Po stronie narzędzi dla deweloperów Claude Code kolejno wydaje nowe wersje, a GitHub Copilot otwiera swoje API REST do zadań agentowych.

DeepSeek-V4 Preview — modele V4 Flash i V4 Pro, kontekst 1M tokenów

6 czerwca — DeepSeek publikuje wersję przedpremierową (preview) DeepSeek-V4, swojego nowego flagowego modelu, w dwóch wariantach: deepseek-v4-flash i deepseek-v4-pro. Oba oferują okno kontekstu 1 miliona tokenów oraz maksymalny output 384 000 tokenów — możliwości plasujące je w górnej części rynku frontier.

Oficjalny baner ogłoszeniowy podkreśla pozycjonowanie modelu w obszarze rozumowania i możliwości agentowych (Agent capabilities) :

🎉 DeepSeek-V4 Preview is here with stronger Agent capabilities and top-tier reasoning. Now available on Web, App, and API.

🇵🇱 DeepSeek-V4 Preview jest dostępny z wzmocnionymi możliwościami agentowymi i rozumowaniem z najwyższej półki. Dostępny już teraz w Web, aplikacji i API. — deepseek.com (oficjalny baner ogłoszeniowy)

Każdy model obsługuje tryb rozumowania (thinking, włączony domyślnie) oraz tryb standardowy (non-thinking). Dostęp jest natychmiastowy w sieci, aplikacji mobilnej i API. Dawne identyfikatory deepseek-chat i deepseek-reasoner zostaną wycofane 24 lipca 2026; odpowiadają one teraz odpowiednio trybom non-thinking i thinking w deepseek-v4-flash.

Istotna uwaga dla deweloperów: API DeepSeek udostępnia endpoint zgodny z formatem Anthropic (https://api.deepseek.com/anthropic) oprócz formatu OpenAI — co pozwala używać V4 w narzędziach takich jak Claude Code poprzez zmienną ANTHROPIC_BASE_URL bez modyfikacji kodu.

🔗 deepseek.com

Oficjalne ceny (api-docs.deepseek.com)

Model	Kontekst	Max output	Input cache miss /1M	Input cache hit /1M	Output /1M	Równoległość
deepseek-v4-flash	1M	384K	$0,14	$0,0028	$0,28	2 500
deepseek-v4-pro	1M	384K	$0,435	$0,003625	$0,87	500

Ceny te pozostają bardzo poniżej porównywalnych zachodnich modeli frontier: flash za $0,28 / 1M tokenów wyjściowych, pro za $0,87 — czyli rząd wielkości taniej niż oferty GPT-5.x czy Claude 4.x o zbliżonych możliwościach.

🔗 Oficjalne ceny

Claude chemik — Opus 4.7 dorównuje ChemDraw i MestReNova w NMR

5 czerwca — Anthropic publikuje szczegółowy artykuł naukowy o swoim programie AI dla chemii. Badanie, prowadzone przez Davida Kambera, chemika w Anthropic, porównuje wydajność Claude w spektroskopii NMR (Nuclear Magnetic Resonance) — referencyjnym narzędziu analitycznym w chemii syntezy — z wyspecjalizowanymi programami ChemDraw i MestReNova.

Protokół oceny: 20 związków wyekstrahowanych z preprintów ChemRxiv opublikowanych po datach treningu modeli, podzielonych na 4 rodziny struktur (chloropirydazyny, maleimidy, spiroketony, sylilowane sulfonamidy), po 5 związków na rodzinę.

Bezpośrednia predykcja (symulowane widmo na podstawie struktury):

Narzędzie	Błąd ¹H (MAE)	Błąd ¹³C (MAE)
Opus 4.7	±0,079 ppm (najlepszy)	±1,37 ppm (ex aequo z MestReNova)
MestReNova	—	±1,48 ppm
Opus 4.6	Pośredni	Pośredni
Sonnet 4.6	Niższy	Niższy

Opus 4.7 jest najdokładniejszy dla wodoru (¹H) i remisuje z MestReNova dla węgla (¹³C). W kwestii kształtu pików (splitting patterns), modele Claude przewidują odstępy z tolerancją 0,5 Hz dla około 80 % przypadków, wobec 26 do 35 % dla ChemDraw i MestReNova.

Elucidacja odwrotna (struktura na podstawie widma): Opus 4.7 poprawnie odzyskuje 8/8 prostych struktur przy każdej próbie, na podstawie samego widma i wzoru molekularnego. Spośród 7 złożonych struktur, przy wskazaniu materiału wyjściowego, osiąga 3/3 prób dla 4 z nich oraz 2/3 dla pozostałych.

Ograniczenia wskazane przez autorów: tylko 20 związków, 4 rodziny strukturalne, brak NMR 2D, brak stereochemii, 3 testowane rozpuszczalniki. Anthropic zapowiada rozszerzenie programu o odczyt struktur z patentów, retrosyntezę (retrosynthesis) oraz mechanizmy reakcji.

🔗 Artykuł naukowy Anthropic

Claude Code & Cowork — intensywny tydzień aktualizacji

Cowork — podwojone limity użycia do 5 lipca

6 czerwca — Anthropic tymczasowo podwaja limity użycia Claude Cowork dla wszystkich płatnych subskrybentów, obowiązujące do 5 lipca 2026. Środek dotyczy limitów przepustowości w 5 godzin (5-hour rate limits).

Szczegół	Wartość
Współczynnik zwiększenia	×2
Czas trwania	6 czerwca → 5 lipca 2026
Obejmowane plany	Wszystkie plany płatne
Dostęp	Aplikacja desktopowa Claude + claude.com/cowork

We doubled Claude Cowork usage limits for the next month. This applies to your 5-hr rate limits.

🇵🇱 Podwoiliśmy limity użycia Claude Cowork na przyszły miesiąc. Dotyczy to waszych limitów przepustowości w 5 godzin. — @bcherny na X

🔗 Ogłoszenie @claudeai

Claude Code v2.1.163 — zarządzane wersje, /plugin list, rozbudowane hooks

4 czerwca — Wersja 2.1.163 Claude Code wprowadza kilka funkcji dla administratorów i twórców wtyczek:

Funkcja	Szczegół
`requiredMinimumVersion` / `requiredMaximumVersion`	Wymusza dozwolony zakres wersji; odmawia uruchomienia poza zakresem
`/plugin list`	Wyświetla listę zainstalowanych wtyczek z filtrami `--enabled` i `--disabled`
Hooks `Stop` / `SubagentStop`	Zwracają `hookSpecificOutput.additionalContext` bez wywoływania błędu
Skills — ucieczka `\$`	Uwzględnij dosłowny `$` przed cyfrą w treści poleceń
MCP stdio	Otrzymuje ten sam `CLAUDE_CODE_SESSION_ID` co hooks i Bash podczas `--resume`

🔗 Wydanie v2.1.163

Claude Code v2.1.166 — fallbackModel, bezpieczeństwo między sesjami, kontrola rozumowania

5-6 czerwca — Najbogatsza funkcjonalnie wersja z całego zestawu:

Funkcja	Szczegół
`fallbackModel`	Próbuje maksymalnie 3 modeli zapasowych w kolejności; opcja CLI `--fallback-model` w trybie interaktywnym
Wzorce glob w `deny`	`"*"` blokuje wszystkie narzędzia; nieznane nazwy generują ostrzeżenie
Bezpieczeństwo `SendMessage`	Wiadomości przekazywane z innych sesji nie przenoszą już uprawnień użytkownika
`MAX_THINKING_TOKENS=0`	Wyłącza rozumowanie w modelach, które rozumują domyślnie przez API Claude
`claude update`	Ogłasza wersję docelową przed pobraniem

🔗 Wydanie v2.1.166

GitHub Copilot — firmowe wtyczki i agentowe API REST

Wtyczki zarządzane przez firmę w VS Code w publicznym preview

5 czerwca — Wersja 1.122 VS Code rozszerza na klientów VS Code funkcję firmowo zarządzanych wtyczek, wcześniej dostępną wyłącznie w Copilot CLI. Administratorzy mogą teraz konfigurować i dystrybuować wtyczki do całej organizacji za pomocą pliku settings.json umieszczonego w .github-private/.github/copilot/settings.json.

Aspekt	Szczegół
Plany	Copilot Business, Copilot Enterprise
Obsługiwani klienci	VS Code v1.122+, Copilot CLI
Typy wtyczek	Niestandardowi agenci, skills, hooks, konfiguracje MCP
Instalacja	Automatyczna przy uwierzytelnieniu

🔗 Changelog GitHub

Agent Tasks REST API — publiczne preview dla Pro, Pro+ i Max

4 czerwca — REST API Agent Tasks pozwala programowo uruchamiać i śledzić zadania agenta chmurowego Copilot. Obejmowane przypadki użycia: masowa refaktoryzacja w wielu repozytoriach, tworzenie nowych repozytoriów z wewnętrznego portalu deweloperskiego, automatyczne przygotowanie nowych wersji.

Aspekt	Szczegół
Plany	Copilot Pro, Pro+, Max
Status	Publiczne preview
Uwierzytelnianie	Klasyczne PAT, precyzyjne PAT, tokeny OAuth

🔗 Changelog GitHub

OpenAI Codex i rozumowanie matematyczne

Codex CLI 0.137.0 — Multi-agent v2 i limity enterprise

4 czerwca — Codex CLI przechodzi do wersji 0.137.0 z kilkoma usprawnieniami dla workflowów wieloagentowych i wdrożeń enterprise:

Nowość	Szczegół
Multi-agent v2	Każdy wątek zachowuje wybór silnika wykonawczego (runtime); czystsze metadane
Limity kredytów enterprise	Wizualizacja miesięcznych progów + stosowanie pakietów konfiguracji chmurowej
Zdalne sterowanie	Parowanie (pairing) i zarządzanie dostępem przez app-server v2
Narzędzia web i image	Dostępne w większej liczbie przepływów w trybie code

🔗 Codex Changelog

Koniektura Erdősa — model rozumowania znajduje kontrprzykład po 80 latach

4 czerwca — OpenAI ogłasza, że jeden z jego modeli rozumowania znalazł kontrprzykład (counterexample) do 80-letniej koniektury matematycznej Erdősa. Ogłoszenie przybiera formę odcinka 20 podcastu OpenAI, w którym trzech badaczy — Alex Wei, Hongxun Wu i @wjmzbmr1 — opowiada o odkryciu i wyjaśnia, jak matematycy i modele mogą współpracować, by tworzyć nową wiedzę. Podcast wygenerował ponad 227 000 wyświetleń na X.

What happened when one of our models found a counterexample to an 80-year-old Erdős conjecture? Researchers @alexwei_, @HongxunWu, and @wjmzbmr1 shared the story on the OpenAI Podcast with @AndrewMayne and explained how mathematicians and models can work together to make new discoveries.

🇵🇱 Co się stało, gdy jeden z naszych modeli znalazł kontrprzykład do 80-letniej koniektury Erdősa? Badacze @alexwei_, @HongxunWu i @wjmzbmr1 opowiedzieli tę historię w podcaście OpenAI z @AndrewMayne, wyjaśniając, jak matematycy i modele mogą współpracować, aby dokonywać nowych odkryć. — @OpenAI na X

Badania i CVPR 2026 — Meta SAM 3D i NVIDIA PixelDiT wyróżnione

Konferencja CVPR 2026 (Computer Vision and Pattern Recognition) nagradza dwa prace badawcze pochodzące z branży AI.

Meta AI SAM 3D — Honorowe Wyróżnienie Najlepszej Pracy

5 czerwca — Zespół SAM 3D w Meta AI otrzymuje Honorowe Wyróżnienie Najlepszej Pracy (Best Paper Honorable Mention) na CVPR 2026. SAM 3D to trójwymiarowe rozszerzenie modelu Segment Anything (SAM), umożliwiające segmentację obiektów w scenach 3D — kluczową zdolność dla robotyki, rzeczywistości rozszerzonej i autonomicznej jazdy.

🔗 Tweet @AIatMeta · 🔗 ArXiv paper

NVIDIA PixelDiT — Finalista Najlepszej Pracy

6 czerwca — NVIDIA Research ogłasza, że PixelDiT (Pixel Diffusion Transformers) został finalistą najlepszego papieru na CVPR 2026. Architektura stanowi innowację w pipeline: podczas gdy wszystkie obecne modele dyfuzji (Stable Diffusion, FLUX itd.) kompresują obraz przez autoenkoder przed dyfuzją — wprowadzając skumulowaną utratę jakości — PixelDiT działa bezpośrednio w przestrzeni pikseli w jednym kroku, eliminując to wstępne przetwarzanie. To podejście single-stage usuwa pośrednią degradację i upraszcza pipeline.

🔗 Tweet @NVIDIAAI

NotebookLM — Source Attribution i Grok na Cloudflare AI Gateway

NotebookLM uruchamia Source Attribution

4 czerwca — Google uruchamia Source Attribution w NotebookLM, długo wyczekiwaną funkcję. Użytkownicy mogą teraz zobaczyć dokładną formułę — kombinację zapytań (prompts) i źródeł — używaną do generowania każdego artefaktu. Przycisk „Iterate” pozwala bezpośrednio dostosować formułę i personalizować tworzone artefakty, czyniąc proces generowania przejrzystym i odtwarzalnym.

Element	Szczegół
Funkcja	Source Attribution
Kluczowy przycisk	„Iterate” do personalizacji
Dostępność	NotebookLM (web)

🔗 Ogłoszenie @NotebookLM

Grok dostępny na Cloudflare AI Gateway

4 czerwca — xAI ogłasza, że jego modele Grok (LLM, audio, image i video) są dostępne za pośrednictwem Cloudflare AI Gateway. Rozliczanie jest scentralizowane przez Cloudflare, bez dodatkowej konfiguracji uwierzytelniania ani osobnych kluczy API xAI do zarządzania — to uproszczenie integracji dla deweloperów już działających w ekosystemie Cloudflare.

🔗 Ogłoszenie @xai

Krótkie wiadomości

Claude Code v2.1.165 — Poprawki błędów, usprawnienia niezawodności bez nowych funkcji. 🔗 Wydanie
Claude Code v2.1.167 — Poprawki błędów. 🔗 Wydanie
Claude Code v2.1.168 — Najnowsza wersja (7 czerwca), poprawki błędów i niezawodność. 🔗 Wydanie
GPT-5.2 i GPT-5.2-Codex wycofywane w Copilot — Od 5 czerwca te modele zastępowane są przez GPT-5.5 i GPT-5.3-Codex. GPT-5.2 pozostaje dostępny wyłącznie w code review. 🔗 Changelog
Fix with Copilot dla GitHub Actions rozszerzone — Subskrybenci Pro, Pro+ i Max mogą jednym kliknięciem naprawić nieudany job GitHub Actions (analiza + poprawka PR). 🔗 Changelog
API zarządzania budżetami GitHub w GA — Pełny cykl życia budżetów przez API (tworzenie, aktualizacja, usuwanie), filtrowany usage summary według org, repozytorium, produktu lub SKU. 🔗 Changelog
API raportów użycia rozliczeń GitHub w GA — Programowe generowanie raportów CSV dla administratorów GitHub Enterprise. 🔗 Changelog
Suno — przewodnik Voices „Your Voice, Reimagined” — 6 praktycznych wskazówek, jak korzystać z funkcji Voices (śpiewanie własnym głosem, dostępne dla płatnych subskrybentów). 🔗 Artykuł Suno
Codex — aktualizacje poprawiające komfort pracy (5 czerwca) — Wyszukiwanie w ustawieniach według kategorii, zachowanie stanu między restartami (szkice, zoom, wskaźniki nieprzeczytanych), ogólny polish interfejsu. 🔗 Tweet @OpenAIDevs
Codex — spersonalizowana karta profilu — Karta udostępniania profilu dostosowuje się do wybranego motywu i zawiera wybranego wirtualnego pupila (pet). 🔗 Tweet @OpenAIDevs
Perplexity integruje Nemotron 3 Ultra (NVIDIA) — Model open source NVIDIA do długotrwałych agentów dostępny dla subskrybentów Pro i Max. 🔗 Tweet @perplexity_ai
Cohere na webinarium Far-Field ASR Leaderboard (HuggingFace) — Cohere Transcribe zaprezentowany podczas webinaru FFASR Leaderboard 11 czerwca 2026. 🔗 Tweet @cohere

Co to oznacza

Wyścig o modele open-weight low-cost nabiera tempa. DeepSeek-V4 Preview wyznacza nowy dolny próg cenowy dla okien kontekstu 1M tokenów: $0,28 / 1M tokenów wyjściowych dla wersji flash, $0,87 dla wersji pro. Stawki te wywierają bezpośrednią presję na zachodnich graczy, którzy za porównywalne możliwości pobierają kwoty rzędy wielkości wyższe. Zgodność API DeepSeek z Anthropic to mocny sygnał: DeepSeek stawia na interoperacyjność, aby obniżyć koszt migracji.

Narzędzia agentowe dla deweloperów osiągają dojrzałość operacyjną. W ciągu tygodnia Claude Code wypuszcza cztery wersje (v2.1.163, .165, .166, .168), GitHub Copilot otwiera swoje REST API dla zadań agentowych i rozszerza wtyczki enterprise na VS Code, a OpenAI publikuje Codex CLI 0.137.0 z multi-agent v2. To już nie jest eksperymentowanie: wszyscy trzej gracze dostarczają funkcje zarządcze (administrowane kontrolowanie wersji, limity kredytów, bezpieczeństwo między sesjami), które wskazują na wdrożenie na skalę enterprise.

AI stosowana w nauce przynosi pierwsze mierzalne wyniki. Badanie NMR Anthropic wnosi coś rzadkiego: rygorystyczne porównanie na niewidzianych danych między ogólnym modelem językowym a oprogramowaniem przeznaczonym dla chemików. Opus 4.7 osiąga najlepszy błąd bezwzględny dla wodoru i 80% trafności w kwestii kształtu pików — wobec 26–35% dla narzędzi specjalistycznych. To jeszcze nie zastępuje ChemDraw, ale pokazuje, że modele frontier mogą konkurować z narzędziami wertykalnymi bez specjalnego fine-tuningu.

Wizja komputerowa zyskuje podwójne uznanie akademickie. CVPR 2026 jednocześnie wyróżnia SAM 3D (Meta) i PixelDiT (NVIDIA). Te dwa wyróżnienia odzwierciedlają uzupełniające się kierunki techniczne: SAM 3D przesuwa segmentację w stronę wolumenu, a PixelDiT ponownie stawia pytania o fundamenty pipeline’ów dyfuzyjnych, usuwając wstępne przetwarzanie przez autoenkoder. Branża AI nie skupia się już wyłącznie na modelach językowych — trójwymiarowa percepcja wizualna i generowanie obrazów wysokiej jakości rozwijają się równolegle.