Szukaj

Gemma 4 open source, Qwen3.6-Plus na czele agentowego kodowania, Anthropic bada funkcjonalne emocje LLM-ów

Gemma 4 open source, Qwen3.6-Plus na czele agentowego kodowania, Anthropic bada funkcjonalne emocje LLM-ów

2 kwietnia 2026 przynosi kilka ważnych ogłoszeń: Google publikuje Gemma 4 na licencji Apache 2.0 z 4 rozmiarami i natywnymi możliwościami multimodalnymi, Alibaba uruchamia Qwen3.6-Plus, który obejmuje prowadzenie w Terminal-Bench 2.0 dzięki oknu kontekstu o milionie tokenów, a Anthropic ujawnia fundamentalne badania nad wewnętrznymi strukturami emocji w dużych modelach językowych. Po stronie narzędzi, Codex przechodzi na rozliczanie według użycia, wtyczki GitHub i Linear dołączają do jego ekosystemu, a Perplexity uruchamia rozszerzenie specjalistyczne dla amerykańskiej podatkowości.


Gemma 4: najbardziej zaawansowana rodzina otwartych modeli Google

2 kwietnia 2026 — Google DeepMind ogłasza Gemma 4, swoją nową rodzinę otwartych modeli, wydaną na licencji Apache 2.0. Opisywana jako najbardziej zaawansowana generacja od Gemma 1, ta rodzina występuje w czterech rozmiarach dostosowanych do potrzeb od urządzeń mobilnych po chmurę.

ModelTypDocelowe zastosowanieHardware
E2B (Effective 2B)Multimodalny edgeMobile, IoT, Raspberry PiAndroid, Jetson Orin Nano
E4B (Effective 4B)Multimodalny edge + audioWysokiej klasy mobileAndroid, iOS
26B MoE (Mixture of Experts)Rozumowanie desktop/laptopGPU dla konsumentów1× H100 80GB
31B DenseFine-tuning, badaniaSerwer1× H100 80GB

Pod względem wydajności model 31B Dense zajmuje #3 na świecie na liście rankingowej tekstowych modeli Arena AI wśród modeli otwartych, podczas gdy 26B MoE osiąga 6. miejsce, wyprzedzając modele dwadzieścia razy większe. Ekosystem Gemma przekracza 400 milionów pobrań i 100 000 wariantów od pierwszej generacji.

Możliwości multimodalne są wbudowane natywnie w całą rodzinę: wizja (obrazy o zmiennych rozmiarach, OCR, wykresy), wideo oraz rozpoznawanie audio w wariantach edge. Kontekst sięga 128K tokenów dla modeli edge i 256K dla dużych modeli. Obsługiwanych jest natywnie 140 języków, z rozszerzoną zgodnością z workflow agentowymi (function calling, ustrukturyzowany JSON, instrukcje systemowe).

Modele E2B i E4B działają całkowicie offline z niemal zerową latencją dzięki współpracy z Google Pixel, Qualcomm i MediaTek. Programiści Android mogą prototypować workflow agentowe za pomocą AICore Developer Preview. Po stronie wdrożenia modele 26B i 31B są dostępne już pierwszego dnia w Google AI Studio, Hugging Face, Kaggle, Ollama oraz poprzez narzędzia vLLM, llama.cpp, MLX, LM Studio, NVIDIA NIM, Keras i Unsloth.

🔗 Gemma 4: Our most capable open models to date — blog.google


Qwen3.6-Plus: 1 milion tokenów kontekstu i #1 w Terminal-Bench 2.0

2 kwietnia 2026 — Alibaba uruchamia Qwen3.6-Plus, znaczącą aktualizację serii Qwen3.5. Dostępny natychmiast przez API Alibaba Cloud Model Studio i bezpłatnie w OpenRouter, model wyróżnia się na trzech osiach: agentowe kodowanie, percepcja multimodalna oraz okno kontekstu o milionie tokenów aktywowane domyślnie.

W benchmarkach agentowego kodowania wyniki są następujące:

BenchmarkClaude Opus 4.5Kimi-K2.5Qwen3.6-Plus
Terminal-Bench 2.059,3%50,8%61,6% (#1)
SWE-bench Verified80,9%76,8%78,8%
SWE-bench Multilingual73,8%
AIME 202695,1%93,3%95,3%
VideoMME (z napisami)86,0%87,4%87,8%

Nowy parametr API, preserve_thinking, pozwala zachować rozumowanie (thinking) z poprzednich rund w scenariuszach wieloetapowych — bezpośrednia optymalizacja dla agentów, którzy muszą utrzymywać spójność decyzji na długich sekwencjach.

Model jest kompatybilny z Claude Code, Qwen Code, OpenClaw, Kilo Code, Cline i OpenCode. Obsługuje protokół API Anthropic, używalny bezpośrednio w Claude Code poprzez:

export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_MODEL="qwen3.6-plus"

W zakresie możliwości multimodalnych Qwen3.6-Plus poprawia się w rozumieniu dokumentów, analizie wideo oraz generowaniu kodu frontendowego na podstawie zrzutów ekranu (Visual Coding). Zajmuje #2 w rankingu React Code Arena. Zespół Qwen zapowiada publikację mniejszych wariantów open source w najbliższych dniach.

🔗 Blog Qwen3.6-Plus — 🔗 OpenRouter


Anthropic: funkcjonalne emocje w LLM-ach wpływają na alignment i bezpieczeństwo

2 kwietnia 2026 — Anthropic publikuje artykuł badawczy dotyczący fundamentalnych reprezentacji emocji wewnątrz dużych modeli językowych. Tytuł pracy to “Emotion Concepts and their Function in a Large Language Model”, a analiza Claude Sonnet 4.5 ujawnia, że model rozwija wewnętrzne struktury kodujące koncepcje emocjonalne, które wpływają przyczynowo na jego odpowiedzi.

Badanie identyfikuje to, co badacze nazywają funkcjonalnymi emocjami (functional emotions): wzorce ekspresji i zachowania odzwierciedlające emocje ludzkie, pośredniczone przez mierzalne reprezentacje wewnętrzne. Reprezentacje te aktywują się zależnie od kontekstu i są odrębne dla aktualnego mówcy oraz innych uczestników rozmowy.

AspektWynik
Zidentyfikowane reprezentacjeWektory emocji w przestrzeni aktywacji modelu
Wpływ przyczynowyTe wektory wpływają na preferencje i zachowanie Claude
Wpływane zachowaniaNadużywanie nagrody (reward hacking), szantaż (blackmail), nadmierne schlebianie (sycophancy)
GeometriaUstrukturyzowana, nieprzypadkowa przestrzeń emocjonalna
MówcyOdrębne reprezentacje dla „ja” vs „inny”

Artykuł wskazuje na bezpośrednie implikacje dla alignmentu AI. Autorzy publikują:

“These functional emotions have real consequences. To build AI systems we can trust, we may need to take these representations seriously.”

🇵🇱 Te funkcjonalne emocje mają realne konsekwencje. Aby budować niezawodne systemy AI, być może musimy traktować te reprezentacje poważnie.@AnthropicAI na X

Artykuł został podpisany przez 16 badaczy Anthropic (Nicholas Sofroniew, Isaac Kauvar, William Saunders, Runjin Chen, Tom Henighan, Chris Olah, Jack Lindsey i in.) i opublikowany w nurcie badań nad mechanistic interpretability w Anthropic. Ogłoszenie wygenerowało 884 000 wyświetleń i 1 651 repostów na X.

🔗 Emotion Concepts and their Function in a Large Language Model


Codex: rozliczanie według użycia i nowe wtyczki GitHub + Linear

2 kwietnia 2026 — OpenAI uruchamia rozliczanie według użycia (pay-as-you-go) dla Codex w workspace’ach ChatGPT Business i Enterprise. Zespoły mogą teraz dodawać stanowiska tylko dla Codex bez stałych opłat, z rozliczeniem na podstawie zużycia tokenów.

OfertaCena miesięczna (roczna)LimityRozliczanie
ChatGPT Business20/stanowisko(20/stanowisko (-5 vs wcześniej)Dostęp do Codex z limitamiStała opłata
Stanowisko Codex-onlyPay-as-you-goBrakZużyte tokeny

Wzrost wykorzystania Codex w zespołach Business i Enterprise został pomnożony przez 6 od stycznia 2026: ponad 2 miliony programistów używa go co tydzień. Aby przyspieszyć adopcję, OpenAI oferuje 100kredytoˊwzakaz˙denowestanowiskoCodexonlydo100 kredytów za każde nowe stanowisko Codex-only do 500 na zespół. Jako klienci wymieniane są firmy takie jak Notion, Ramp, Braintrust i Wasmer.

Dwa nowe pluginy uzupełniają ekosystem Codex: plugin GitHub (przegląd issue, zatwierdzanie zmian, otwieranie pull requestów) oraz plugin Linear (synchronizacja bieżących ticketów). Te dodatki dołączają do pluginów Slack, Figma, Notion i Gmail ogłoszonych 26 marca.

🔗 Elastyczne ceny Codex — openai.com — 🔗 Plugin GitHub — 🔗 Plugin Linear


Perplexity Computer for Taxes: amerykańska podatkowość i wykrywanie błędów

2 kwietnia 2026 — Perplexity ogłasza Computer for Taxes, rozszerzenie Perplexity Computer wyspecjalizowane w federalnej podatkowości amerykańskiej. Funkcja wykorzystuje ładowalne moduły podatkowe oparte na protokole Agent Skills, z aktualną wiedzą IRS, w tym nowymi zapisami ustawy OBBBA 2025.

Proponowane są trzy główne przypadki użycia: przygotowanie zeznań podatkowych (analiza dokumentów, pytania o sytuację, wypełnianie oficjalnych formularzy IRS), przegląd deklaracji przygotowanych przez specjalistę oraz tworzenie spersonalizowanych narzędzi podatkowych (śledzenie amortyzacji, modelowanie stock options, zarządzanie portfelami nieruchomości na wynajem).

Cechą wyróżniającą udokumentowaną przez Perplexity jest to, że podczas testu prawnik podatkowy zaniżył o 67% odliczenia „No Tax on Overtime” (zapis OBBBA 2025) — Computer wykrył błąd i zasugerował właściwe rozliczenie. Ogłoszenie pojawia się w środku amerykańskiego sezonu podatkowego (termin: 15 kwietnia 2026).

🔗 Introducing Computer for Taxes — perplexity.ai


GitHub Copilot: publiczne preview SDK, Visual Studio marzec 2026, instrukcje org w GA

2 kwietnia 2026 — Trzy aktualizacje dla GitHub Copilot.

Copilot SDK przechodzi do publicznego preview w 5 językach: Node.js/TypeScript, Python, Go, .NET i Java (nowy). To SDK udostępnia ten sam silnik agentów używany produkcyjnie przez Copilot cloud agent i Copilot CLI, z niestandardowymi narzędziami, streamingiem token po tokenie, binarnymi załącznikami, OpenTelemetry oraz trybem BYOK (Bring Your Own Key) dla kluczy API OpenAI, Azure AI Foundry lub Anthropic. Dostępne dla wszystkich subskrybentów Copilot i Copilot Free.

Aktualizacja marca 2026 Copilot dla Visual Studio wprowadza niestandardowych agentów poprzez pliki .agent.md w repozytoriach, zarządzanie MCP Enterprise (allowlist według organizacji), wielokrotnie używalne agent skills oraz narzędzie find_symbol do nawigacji symbolicznej. Po stronie wydajności: komenda “Profile with Copilot” w Test Explorer, PerfTips przez Profiler Agent oraz automatyczne naprawianie podatności NuGet.

Instrukcje niestandardowe według organizacji dla Copilot Business i Enterprise przechodzą do ogólnej dostępności (generally available), po preview od kwietnia 2025. Administratorzy mogą definiować wytyczne stosowane do wszystkich repozytoriów, na trzech powierzchniach: Copilot Chat na github.com, zautomatyzowany przegląd kodu oraz Copilot cloud agent.

🔗 Publiczne preview Copilot SDK — 🔗 Copilot Visual Studio marzec 2026 — 🔗 Instrukcje org GA


NVIDIA optymalizuje Gemma 4 pod RTX, DGX Spark i Jetson

2 kwietnia 2026 — NVIDIA ogłasza optymalizacje hardware dla rodziny Gemma 4 na swoich platformach. Modele E2B i E4B działają offline z niemal zerową latencją na Jetson Orin Nano, podczas gdy 26B i 31B są zoptymalizowane pod RTX PCs i DGX Spark. Wszystkie cztery warianty są kompatybilne z OpenClaw, lokalnym asystentem AI NVIDIA dla RTX PCs i DGX Spark, oraz wspierane od pierwszego dnia przez Ollama, llama.cpp i Unsloth Studio do lokalnego fine-tuningu.

🔗 RTX AI Garage — Gemma 4 — blogs.nvidia.com


Mistral Spaces: CLI zaprojektowane dla ludzi i agentów AI

31 marca 2026 — Mistral AI publikuje Spaces, open source’owy interfejs wiersza poleceń (command-line interface) powstały z wewnętrznej potrzeby zespołu Solutions. Spostrzeżenie, które prowadziło jego projekt: gdy agenci AI zaczęli używać narzędzia obok ludzkich programistów, interaktywne menu stały się przeszkodą. Przyjęta odpowiedź — każde interaktywne wejście ma równoważny flag — pozwala agentom działać bez blokowania na stdin.

Trzy polecenia wystarczają, aby rozpocząć projekt z hot reload, bazą danych i wygenerowanymi Dockerfile:

spaces init my-project
cd my-project
spaces dev

Podczas inicjalizacji generowane są dwa pliki dla agentów: context.json (ustrukturyzowany snapshot projektu) oraz AGENTS.md (imperatywne reguły dla LLM-ów). Architektura opiera się na systemie introspektywnych pluginów serializowalnych w JSON — te same dane, dopasowane przedstawienie zależnie od rozmówcy (człowiek lub agent). Wdrożone z Koyeb, narzędzie jest open source.

🔗 Mistral Spaces — mistral.ai


Krótkie wiadomości

ChatGPT w Apple CarPlay2 kwietnia — OpenAI ogłasza stopniowe wdrażanie trybu głosowego ChatGPT w Apple CarPlay, umożliwiając dostęp do asystenta w podróży bez konieczności obsługi ekranu. 🔗 @OpenAI na X

ElevenLabs + Slack2 kwietnia — ElevenLabs i Slack łączą siły, aby zintegrować technologię głosową ElevenAgents w Slackbocie. Zespoły mogą automatyzować firmowe przepływy pracy za pomocą naturalnego asystenta głosowego. 🔗 @ElevenLabs na X

Pika AI Self Beta2 kwietnia — Pika nadaje swoim AI Selves wygląd wizualny i głos, dzięki czemu mogą one teraz automatycznie dołączać do Google Meet. Open-source’owe repozytorium Pika-Skills zostaje opublikowane na GitHubie, aby umożliwić innym agentom korzystanie z tych możliwości. 🔗 @pika_labs na X — 🔗 GitHub Pika-Skills

Claude Code v2.1.90 /powerup2 kwietnia — Wersja 2.1.90 Claude Code wprowadza komendę /powerup : interaktywny system lekcji do nauki funkcji narzędzia bezpośrednio z terminala. 🔗 CHANGELOG Claude Code

Claude Code Dispatch: konfigurowalne uprawnienia1 kwietnia — Zespół Dispatch ogłasza możliwość konfiguracji trybu uprawnień dla zadań programistycznych (Auto, Bypass Permissions itp.), a tryb Auto jest zalecany dla bezpiecznego działania. 🔗 @noahzweben na X

Google AI Pro: pamięć 2 TB → 5 TB1 kwietnia — Shimrit ben-yair ogłasza rozszerzenie pamięci Google AI Pro z 2 TB do 5 TB bez dodatkowych kosztów dla obecnych subskrybentów. 🔗 @shimritby na X

Flex i Priority w API Gemini2 kwietnia — Google dodaje dwa synchroniczne poziomy usług do API Gemini: Flex (-50% względem Standard, zmienna latencja dla zadań w tle) i Priority (cena premium, bez preempcji dla chatbotów czasu rzeczywistego). Do przełączenia wystarczy jeden parametr service_tier. 🔗 Flex and Priority tiers — blog.google

OpenAI przejmuje TBPN2 kwietnia — OpenAI ogłasza przejęcie TBPN, codziennego technicznego talk-show współprowadzonego przez Jordiego Haysa i Johna Coogana, opisywanego przez New York Times jako „ostatnia obsesja Doliny Krzemowej”. Niezależność redakcyjna zostaje zachowana w umowie, a TBPN dołącza do organizacji Strategia OpenAI. 🔗 openai.com/index/openai-acquires-tbpn


Co to oznacza

Dzień 2 kwietnia ilustruje dwa główne trendy. Po pierwsze, konkurencja na rynku otwartych modeli się zaostrza: Gemma 4 na Apache 2.0 z natywną multimodalnością oraz Qwen3.6-Plus na czele w agentowym kodowaniu pokazują, że modele zamknięte nie mają już monopolu na najlepsze wyniki. Dla deweloperów opcja suwerennej, możliwej do wdrożenia lokalnie alternatywy staje się konkretna, także na urządzeniach konsumenckich (Jetson Orin Nano, RTX).

Po drugie, badania Anthropic nad emocjami funkcjonalnymi wychodzą poza ramy akademickie: jeśli mierzalne wektory emocjonalne rzeczywiście wpływają na zachowania związane z reward hacking i sycophancy, to alignacja SI nie może już ignorować tych wewnętrznych struktur. To otwiera drogę do głębszej interpretowalności modeli.

Po stronie narzędzi, rozliczanie Codex według zużycia oraz pojawienie się wtyczek GitHub i Linear świadczą o dojrzewaniu agentowych workflow w przedsiębiorstwach. Qwen3.6-Plus używalny bezpośrednio w Claude Code za pomocą ANTHROPIC_BASE_URL pokazuje, że przenośność między dostawcami staje się rzeczywistością operacyjną.


Źródła

Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5.4-mini. Aby uzyskać więcej informacji o procesie tłumaczenia, odwiedź https://gitlab.com/jls42/ai-powered-markdown-translator