Qwen3-Coder-Next: open source goni czołówkę szybciej, niż myślisz

Alibaba wypuściła Qwen3-Coder-Next, kolejny krok w otwartych modelach do kodowania. Najciekawsze nie jest to, że jest darmowy do pobrania, tylko jak dużo wyciąga z małej liczby aktywnych parametrów. Dla każdego, kto chce hostować model u siebie albo mocno ciąć rachunki za API, to pozycja obowiązkowa do sprawdzenia.

Mały model, który udaje duży

Qwen3-Coder-Next korzysta z architektury Mixture-of-Experts. W praktyce oznacza to, że przy każdym zapytaniu model uruchamia tylko 3 miliardy parametrów, choć w sumie ma ich 80 miliardów. Efekt jest taki, że działa lekko i szybko, a jakością bije modele wielokrotnie większe od siebie w trybie pracy.

Na benchmarku SWE-bench Verified wariant Coder-Next uzyskał 70,6% przy zaledwie 3 mld aktywnych parametrów, rywalizując z modelami 10 do 20 razy większymi. Cała rodzina Qwen3-Coder była trenowana na ponad 7,5 biliona tokenów, z czego ponad 70% to kod, i obsługuje ponad 100 języków programowania. To nie jest model „do zabawy“, tylko realne narzędzie do agentowego kodowania.

Cena, która robi różnicę

Tu open source pokazuje pazur. Według danych Artificial Analysis (pobrane 2 lipca 2026) Qwen3-Coder-Next kosztuje przez API 0,35 USD za milion tokenów wejściowych i 1,20 USD za wyjściowych. Po kursie ok. 3,65 zł/USD to jakieś 1,28 zł i 4,38 zł za milion tokenów. Do tego generuje wyjątkowo szybko, w okolicach 124 tokenów na sekundę, co przy pracy z agentem realnie skraca czas oczekiwania.

Uczciwie: na złożonym, wieloaspektowym Intelligence Index Artificial Analysis model nie ląduje w ścisłej czołówce (nota ok. 21,2). To wyższy pułap ogólnego rozumowania, gdzie topowe modele wciąż mają przewagę. Ale w wąskim zadaniu, jakim jest kodowanie i praca w repo, stosunek jakości do ceny jest trudny do pobicia. Warto trzymać w głowie tę różnicę: „najlepszy do wszystkiego“ i „najlepszy do kodu za te pieniądze“ to dwie różne kategorie.

Dla kogo to sensowny wybór

Qwen3-Coder-Next świeci w trzech sytuacjach. Chcesz uruchomić model lokalnie, na własnym sprzęcie, bez wysyłania kodu do cudzej chmury (istotne przy wrażliwych projektach). Generujesz duże ilości tokenów w tle i każdy grosz na milionie się liczy. Albo budujesz własne narzędzie agentowe i potrzebujesz taniego, szybkiego silnika, który ogarnia typowe operacje na plikach i wywołania narzędzi.

Granice są przewidywalne. Do najtrudniejszych, długich zadań, gdzie liczy się głębokie rozumowanie i utrzymanie wątku przez wiele kroków, wciąż sensowniej sięgnąć po droższych liderów. Dobrym kompromisem bywa układ hybrydowy: tani model do większości roboty, a droższy tylko do fragmentów, które naprawdę tego wymagają.

Co znaczy „hostować model u siebie“

Dla osoby nietechnicznej „otwarty model“ brzmi abstrakcyjnie, więc doprecyzujmy. Wagi Qwen są publicznie dostępne, co oznacza, że możesz pobrać model i uruchomić go na własnym komputerze albo serwerze, bez wysyłania czegokolwiek do cudzej chmury. Służą do tego narzędzia pokroju LM Studio czy Ollama, które upraszczają cały proces do kilku kliknięć.

Zaleta jest podwójna. Pierwsza to prywatność, bo kod nie opuszcza Twojej maszyny, co ma znaczenie przy wrażliwych projektach klientów. Druga to koszt, bo po pobraniu nie płacisz za tokeny, tylko za prąd i sprzęt. Haczyk polega na tym, że większe warianty wymagają mocnej karty graficznej, więc lokalny hosting opłaca się głównie przy dużym, regularnym użyciu, a nie do pojedynczego prototypu.

Cała rodzina Qwen3-Coder

Coder-Next to lekki wariant zoptymalizowany pod prędkość i niski koszt. W rodzinie jest też cięższy flagowiec, model rzędu 480 miliardów parametrów z 35 miliardami aktywnymi, celujący w najtrudniejsze zadania. Całą serię trenowano na ponad 7,5 biliona tokenów, w większości kodu, i obsługuje ona ponad 100 języków programowania. Dzięki temu masz wybór: lekki i tani model do codziennej roboty albo mocniejszy do zadań, gdzie liczy się każdy procent jakości.

Jak się w tym połapać

Jeśli zależy Ci na najniższym rachunku, warto porównać Qwen z innymi tanimi opcjami, na przykład DeepSeek V3.2 czy GLM-5.2, zamiast patrzeć tylko na jedną liczbę. Każdy z nich celuje w trochę inny punkt na osi cena/jakość/prędkość.

Pełne benchmarki i pozycję Qwen3-Coder-Next w rankingu znajdziesz w karcie modelu. A jeśli chcesz oszacować, ile zapłacisz przy własnym wolumenie, wrzuć ceny do kalkulatora kosztów API. Wniosek na dziś jest prosty: dystans między otwartymi a zamkniętymi modelami w kodowaniu topnieje, a przy takich cenach open source staje się domyślnym wyborem do coraz większej części codziennej pracy.