Kimi K2.7 Code od Moonshot: otwarty model pod agentowe kodowanie

Moonshot AI wypuściło Kimi K2.7 Code, otwarty model wyostrzony pod jedno konkretne zadanie: długie, agentowe kodowanie. Nie chodzi o rozmowę czy pisanie tekstów, tylko o pracę, w której agent planuje, edytuje pliki, odpala polecenia w terminalu, woła narzędzia i debuguje przez wiele kroków. Do tego dochodzą otwarte wagi i cena liczona w groszach za milion tokenów.

Liczby na start

Twarde dane najpierw. Według Artificial Analysis (pobrane 2 lipca 2026) Kimi K2.7 Code osiąga Coding Index 60,8 i Intelligence Index 41,9, generuje ok. 43 tokeny na sekundę i kosztuje 0,95 USD za milion tokenów wejściowych oraz 4,00 USD za wyjściowych. Po kursie ok. 3,65 zł/USD to jakieś 3,47 zł i 14,60 zł za milion tokenów. Premiera przypadła na 12 czerwca 2026.

Ciekawy jest kierunek zmiany względem poprzednika. Kimi K2.6 z kwietnia miało Coding Index na poziomie 56 i Intelligence 42,8. Nowa wersja podbiła kodowanie (56 do 60,8), a nieznacznie zeszła w ogólnym rozumowaniu (42,8 do 41,9). To świadoma decyzja: model jest wyspecjalizowany pod kod, a nie „lepszy do wszystkiego“. Warto o tym pamiętać, wybierając go do zadań spoza programowania.

Co dostajesz pod maską

Kimi K2.7 Code to Mixture-of-Experts z bilionem parametrów łącznie, z których na token aktywuje się 32 miliardy, przy oknie kontekstu rzędu 256 tys. tokenów. Architektura jest natywnie multimodalna, więc obsługuje tekst, obraz i wideo na wejściu. Moonshot udostępniło pełne wagi modelu, więc możesz go pobrać i hostować u siebie.

Producent raportuje konkretne skoki na własnych benchmarkach kodowania: +21,8% na Kimi Code Bench v2, +11,0% na Program Bench i +31,5% na MLS Bench Lite względem poprzedniej wersji. Ciekawszy dla codziennej pracy jest wynik obsługi narzędzi. Na teście MCP Mark Verified, sprawdzającym pracę z protokołem MCP, model uzyskał 81,1 wobec 76,4 u Claude Opus 4.8. Do tego Moonshot chwali się redukcją zużycia „tokenów myślenia“ o około 30% względem K2.6, co przekłada się wprost na niższy rachunek za tę samą pracę.

Cena kontra reszta stawki

Tu leży główny argument Kimi. Przy stawkach 0,95 USD wejście i 4,00 USD wyjście model jest mniej więcej pięć razy tańszy na wejściu i cztery do sześciu razy tańszy na wyjściu niż Claude Opus 4.8 czy GPT-5.5. Dla kogoś, kto trzyma agenta włączonego godzinami i generuje ogromne ilości tokenów, ta różnica składa się w realne pieniądze na koniec miesiąca.

Multimodalność w praktyce

Natywna obsługa obrazu i wideo brzmi jak dodatek, ale w kodowaniu bywa konkretnie użyteczna. Możesz pokazać modelowi zrzut ekranu z projektem interfejsu i poprosić o odtworzenie go w kodzie. Możesz wkleić screenshot błędu zamiast przepisywać komunikat ręcznie. Przy pracy nad frontendem to skraca drogę od „jak to ma wyglądać“ do działającego komponentu, bo nie musisz wszystkiego opisywać słowami.

To odróżnia Kimi K2.7 Code od modeli czysto tekstowych. Nie każdy potrzebuje tej funkcji na co dzień, ale gdy pracujesz z makietami albo odtwarzasz istniejący układ, potrafi realnie oszczędzić czas.

Redukcja „tokenów myślenia“ ma znaczenie dla rachunku

Warto zatrzymać się przy jednej liczbie: około 30% mniej tokenów zużywanych na wewnętrzne rozumowanie względem poprzedniej wersji. W modelach, które „myślą“ przed odpowiedzią, spora część kosztu idzie właśnie na te niewidoczne tokeny. Skoro Kimi wykonuje podobną pracę taniej pod tym względem, realny rachunek za zadanie spada mocniej, niż sugerowałaby sama stawka za milion tokenów. Dla kogoś, kto liczy każdy grosz przy dużym wolumenie, to argument nie do pogardzenia.

Gdzie tkwi haczyk

Uczciwie, dwie rzeczy studzą entuzjazm. Po pierwsze, prędkość. Około 43 tokeny na sekundę to zauważalnie wolniej niż u szybszych rywali, na przykład GLM-5.2 generującego cztery razy szybciej. Przy interaktywnej pracy z agentem to odczuwalne, choć przy zadaniach puszczanych w tle mniej istotne. Po drugie, na ogólnym Intelligence Index model nie należy do czołówki, więc do zadań wymagających szerokiego rozumowania spoza kodu lepiej sprawdzą się inne modele.

Dla kogo to trafiony wybór

Kimi K2.7 Code ma sens, jeśli robisz dużo agentowego kodowania, zależy Ci na niskim koszcie tokenów i nie przeszkadza umiarkowana prędkość. Świetnie pasuje też tam, gdzie chcesz hostować model lokalnie i nie wysyłać kodu do cudzej chmury. Do szybkiej, interaktywnej pracy albo zadań mocno spoza programowania rozważ alternatywy.

Pełne benchmarki i pozycję w rankingu znajdziesz w karcie modelu, a koszt przy własnym wolumenie przeliczysz w kalkulatorze kosztów API. Naturalnym punktem odniesienia jest druga otwarta premiera tego miesiąca, czyli GLM-5.2, który stawia na prędkość i większy kontekst kosztem nieco wyższej ceny.