GLM-5.2 od Z AI: otwarty model, który naciska liderów w kodowaniu

Chińskie Z AI (dawniej Zhipu) wypuściło GLM-5.2, otwarty model wprost wycelowany w agentowe kodowanie. Ciekawe jest nie samo istnienie kolejnej wersji, tylko to, gdzie ląduje w rankingach i za ile. W niezależnych testach potrafi dorównać droższym liderom przy cenie liczonej w groszach za milion tokenów.

Co pokazują liczby

Zacznijmy od twardych danych. Według Artificial Analysis (pobrane 2 lipca 2026) GLM-5.2 osiąga Coding Index na poziomie 68,8 i Intelligence Index 51,1, generuje ok. 183 tokeny na sekundę (jeden z szybszych modeli tej klasy) i kosztuje 1,40 USD za milion tokenów wejściowych oraz 4,40 USD za wyjściowych. Po kursie ok. 3,65 zł/USD to jakieś 5,11 zł i 16,06 zł za milion tokenów. Premiera przypadła na 16 czerwca 2026.

Dla kontekstu warto zestawić to z poprzednikiem. GLM-5 z lutego 2026 miał Intelligence Index rzędu 39,5. Skok do 51,1 w cztery miesiące to realny postęp, a nie kosmetyka wersji. Dużo bliżej mu teraz do ścisłej czołówki niż do środka stawki.

Gdzie realnie wygrywa

Najciekawsze dzieje się na benchmarkach długich, wielokrokowych zadań programistycznych, czyli tam, gdzie agent musi utrzymać wątek przez wiele kroków. Portal VentureBeat opisał, że GLM-5.2 bije GPT-5.5 na kilku takich testach za jedną szóstą ceny. Konkretnie: na SWE-bench Pro uzyskał 62,1 wobec 58,6 u GPT-5.5, a na teście długich zadań FrontierSWE dobił do 74,4%, wyprzedzając GPT-5.5 (72,6%) i ocierając się o Claude Opus 4.8 z wynikiem 75,1%.

Do tego dochodzi mocny wynik w obsłudze narzędzi. Na ewaluacji MCP-Atlas, sprawdzającej pracę modelu z protokołem MCP i zewnętrznymi narzędziami, GLM-5.2 uzyskał 77,0, wyżej niż GPT-5.5 z 75,3. Dla vibe codingu to istotne, bo realna praca agenta to w dużej mierze wołanie narzędzi, a nie samo generowanie tekstu.

Otwarte wagi i długi kontekst

Dwie rzeczy dopełniają obraz. Po pierwsze, Z AI udostępniło wagi modelu na licencji MIT, więc możesz go hostować u siebie, dostroić pod własny projekt albo po prostu uniezależnić się od cen jednego dostawcy. Po drugie, model obsługuje okno kontekstu rzędu miliona tokenów, co przy dużym repozytorium oznacza, że agent widzi projekt jako całość, a nie tylko kilka otwartych plików.

Architektonicznie GLM-5.2 to Mixture-of-Experts, raportowany w okolicach 753 mld parametrów łącznie, z których na jeden token aktywuje się ok. 40 mld. To znów ten sam wzorzec, który widać w tegorocznych otwartych modelach: duży sumaryczny rozmiar, ale oszczędne uruchamianie, żeby utrzymać sensowną prędkość i koszt.

Dla kogo to dobry wybór

GLM-5.2 najmocniej świeci w kilku sytuacjach. Robisz dużo pracy agentowej na dużym projekcie i zależy Ci, żeby model widział całe repozytorium naraz, dzięki milionowemu oknu kontekstu. Zależy Ci na szybkiej odpowiedzi, bo 183 tokeny na sekundę to jeden z lepszych wyników w tej klasie. Albo chcesz uniezależnić się od jednego dostawcy i rozważasz hosting własnych wag, co umożliwia otwarta licencja.

Mniej oczywisty, ale realny plus dotyczy pracy z narzędziami. Skoro model wysoko punktuje w obsłudze protokołu MCP, dobrze sprawdzi się jako silnik agenta podpiętego do zewnętrznych usług: bazy danych, dokumentacji czy firmowego API. Dla wielu projektów to właśnie ta zdolność, a nie sam „iloraz inteligencji“, decyduje o użyteczności.

Czego pilnować

Nie wszystko jest bez gwiazdki. Przy korzystaniu z modelu przez oficjalne API Z AI warto świadomie ocenić, jakie dane wpuszczasz, bo to usługa działająca w Chinach. Dla otwartego kodu czy nauki to bez znaczenia, ale przy wrażliwym repozytorium klienta lepiej rozważyć hosting własnych wag zamiast wysyłania wszystkiego do cudzej chmury. Druga uwaga jest ogólna: benchmarki to punkt startu, nie wyrok. Zanim oprzesz na modelu poważny projekt, przepuść przez niego jedno realne zadanie, które sam umiesz ocenić.

Wniosek

GLM-5.2 wpisuje się w wyraźny trend: otwarte modele domykają dystans do zamkniętych liderów w kodowaniu, a robią to za ułamek ceny. Jeśli szukasz szybkiego, taniego silnika do pracy agentowej i nie odstrasza Cię konfiguracja, to jeden z mocniejszych kandydatów tego lata. Pełne benchmarki i pozycję w rankingu znajdziesz w karcie modelu, a rachunek przy własnym wolumenie przeliczysz w kalkulatorze kosztów API. Warto go zestawić z drugą głośną premierą tego miesiąca, czyli Kimi K2.7 Code.