Claude Code w boju: agent w terminalu, który dowozi duże refaktory
Testujemy Claude Code na polskich projektach. Co potrafi agent Anthropic w konsoli, ile realnie kosztuje w PLN i dla kogo się nadaje.

Większość narzędzi AI do kodowania mieszka w edytorze. Claude Code poszedł w drugą stronę: to agent, który żyje w terminalu, czyli w tym czarnym oknie z tekstem, którego wiele osób się boi. Testowaliśmy go przez trzy tygodnie na realnych, polskich projektach i mamy dobrą wiadomość: raz oswojony terminal odwdzięcza się mocą, jakiej edytory dopiero się uczą. Poniżej pełen rozbiór, z cenami w złotówkach i uczciwą listą wad.
Werdykt w jednym zdaniu
Claude Code to najlepszy wybór do dużych, wieloplikowych zadań i refaktorów, a napędzają go modele Claude z topowej półki, w tym Claude Opus 4.8 z trzecim wynikiem w indeksie kodowania Artificial Analysis.
Czym jest Claude Code
Wyobraź sobie, że zamiast klikać w menu, po prostu piszesz do asystenta zwykłym językiem: „przejrzyj ten projekt i dodaj eksport do PDF”. Agent czyta pliki, planuje, pisze kod, uruchamia testy i pokazuje Ci, co zmienił. Całość dzieje się w terminalu, uruchamianym komendą claude. To jest właśnie agent AI w czystej postaci: nie podpowiada linijek, tylko wykonuje zadania od początku do końca. Jeśli słowo „terminal” brzmi obco, zajrzyj do naszego hasła o tym, czym jest CLI.
Anthropic udostępnia Claude Code nie tylko w konsoli, ale też jako wtyczkę do edytorów VS Code i JetBrains oraz w aplikacji desktopowej. Sercem pozostaje jednak terminal, i to tam narzędzie pokazuje pełnię możliwości. W naszym teście działaliśmy na wersji widocznej niżej.
Jak testowaliśmy
Wzięliśmy trzy realne zadania z polskich projektów. Pierwsze: refaktor aplikacji w TypeScript, w której trzeba było zmienić sposób obsługi błędów w kilkunastu plikach naraz. Drugie: dopisanie testów do istniejącego, nieudokumentowanego modułu. Trzecie: naprawa upierdliwego buga, który pojawiał się tylko na produkcji. Każde zadanie odpalaliśmy jednym poleceniem po polsku i obserwowaliśmy, ile trzeba poprawiać ręcznie.
Kluczowa obserwacja z pierwszych minut: Claude Code najpierw czyta projekt i planuje, zanim cokolwiek napisze. Przy dużym refaktorze to bezcenne, bo agent rozumie, jak pliki się ze sobą łączą, i nie zostawia sierot w połowie zmiany.
W liczbach wyglądało to tak. Refaktor obsługi błędów w kilkunastu plikach agent domknął w jednym przebiegu, z jedną drobną poprawką z naszej strony. Dopisywanie testów do nieudokumentowanego modułu poszło wolniej, bo agent musiał najpierw zrozumieć, co kod właściwie robi, ale efekt był sensowny i od razu przechodził. Najbardziej zaskoczyła nas naprawa buga produkcyjnego: Claude Code sam postawił hipotezę, dopisał tymczasowe logi, poprosił nas o odtworzenie błędu i na tej podstawie wskazał winną funkcję. Człowiek szukałby tego znacznie dłużej.
Co działa świetnie
Duże, wieloplikowe zadania to żywioł Claude Code. Refaktor obsługi błędów, który w edytorze wymagałby otwierania pliku po pliku, agent domknął w jednym przebiegu, sam znajdując wszystkie miejsca do zmiany. To dokładnie ten scenariusz, w którym praca na całym repozytorium wygrywa z podpowiadaniem pojedynczych linijek.
Model robi różnicę. Napędzający narzędzie Claude Opus 4.8 z wynikiem 74,3 w indeksie kodowania Artificial Analysis (dane z 2 lipca 2026) zajmuje trzeci wynik w naszej porównywarce, tuż za liderem Claude Fable 5 (76,5) i GPT-5.5 (74,9). Co istotne, Claude Code korzysta z modeli Claude, w tym z najnowszego Fable 5 po jego powrocie, więc realnie sięgasz po sam czubek stawki. W praktyce czuć to jako mniejszą liczbę poprawek po tym, jak agent ogłosi sukces.
Praca po polsku jest bez zarzutu. Polecenia rozumie w lot, a podsumowania zmian pisze po polsku, zwięźle i konkretnie. Po każdym zadaniu dostajesz krótki opis tego, co zrobił i dlaczego, co bardzo ułatwia kontrolę pracy osobie mniej technicznej.
Testy i uruchamianie kodu to duży plus. Claude Code potrafi sam odpalić testy, zobaczyć, że coś nie przechodzi, i poprawić własny kod, zanim odda Ci zadanie. W teście naprawy buga produkcyjnego ta pętla samodzielnie zawęziła problem do jednej funkcji, co zajęłoby człowiekowi sporo czasu.
Co warto skonfigurować na start
Claude Code nabiera mocy, gdy poświęcisz chwilę na ustawienia. Najważniejszy jest plik z instrukcjami projektu, trzymany w repozytorium, w którym opisujesz, jak działa Twoja aplikacja, jakich komend używać do testów i czego unikać. To jak notatka dla nowej osoby w zespole: raz napisana, oszczędza dziesiątki powtórzeń. Agent czyta ją automatycznie i trzyma się zasad.
Przydają się też dwie rzeczy dla bardziej zaawansowanych. Pierwsza to tryb planowania, w którym agent najpierw pokazuje plan działania do zatwierdzenia, zanim cokolwiek zmieni. Druga to podłączanie zewnętrznych narzędzi przez standard MCP, dzięki czemu Claude Code sięga do Twojej bazy danych, systemu zgłoszeń czy dokumentacji. Na start nie musisz tego ruszać, ale warto wiedzieć, że sufit możliwości jest wysoko.
Co potrafi wkurzyć
Terminal bywa nieczytelny. To najważniejsza bariera dla osób całkiem nietechnicznych, bo surowy tekst bez przycisków i okienek potrafi wyglądać nieprzystępnie. Trzeba zainstalować narzędzie, otworzyć konsolę i oswoić kilka podstawowych komend. Kto nigdy nie widział terminala, poczuje na starcie opór, choć instalacja jest prosta, a my prowadzimy przez nią krok po kroku w poradniku o Claude Code.
Limity sesji potrafią przeszkodzić. Plany rozliczają zużycie w pięciogodzinnych oknach oraz z tygodniowymi limitami, dzielonymi z czatem na claude.ai. Zużycie rośnie szczególnie szybko, gdy podłączysz wiele integracji MCP naraz: każde dodatkowe narzędzie i kontekst, które agent musi przetworzyć, zjada limit szybciej niż sama rozmowa. Przy intensywnym dniu z rozbudowanym setupem można trafić na komunikat o wyczerpaniu limitu w środku pracy, co bywa frustrujące. To cena za brak rozliczania każdego tokena osobno, ale warto o niej wiedzieć.
Agent bywa zbyt pewny siebie. Jak każde tego typu narzędzie, potrafi zrobić więcej, niż prosiłeś, albo z przekonaniem napisać kod, który wygląda dobrze, a nie działa. Trzeba czytać podsumowania i weryfikować efekt, zwłaszcza gdy zmiana dotyka pieniędzy albo danych użytkowników.
Dane wędrują do USA. Claude Code w standardowych planach Pro i Max przetwarza zapytania na serwerach Anthropic w Stanach Zjednoczonych, bez opcji przetwarzania danych w UE. Dla prywatnych projektów zwykle nie ma to znaczenia, ale firmy w Polsce i Europie, które muszą trzymać kod czy dane klientów w UE (np. ze względu na RODO), powinny to sprawdzić przed wdrożeniem. W takich przypadkach warto rozważyć dostęp przez Amazon Bedrock albo Google Vertex AI z regionem UE, gdzie modele Claude bywają dostępne z lokalnym przetwarzaniem danych.
Ile to kosztuje w złotówkach
Claude Code jest wliczony w płatne plany Claude. Kwoty w USD, w nawiasie orientacyjnie w PLN po kursie z lipca 2026:
- Free: 0 USD, do spróbowania w ograniczonym zakresie.
- Pro: 20 USD miesięcznie (około 90 zł), Claude Code w terminalu i edytorach, zużycie liczone w oknach sesyjnych.
- Max 5x: 100 USD miesięcznie (około 400 zł), pięć razy więcej zużycia na sesję niż Pro.
- Max 20x: 200 USD miesięcznie (około 800 zł), dwadzieścia razy więcej.
- Team i Enterprise: od 25 USD za użytkownika wzwyż, dla zespołów.
Alternatywnie można płacić przez API, czyli za realne zużycie tokenów, co ma sens przy nieregularnej pracy. Warto wiedzieć, że planowaną na 15 czerwca 2026 zmianę w rozliczaniu Agent SDK Anthropic ostatecznie wstrzymał, więc obecne plany działają po staremu. Dla orientacji: Claude Opus 4.8 kosztuje przez API około 5 USD za milion tokenów wejściowych i 25 USD za milion wyjściowych (dane Artificial Analysis z 2 lipca 2026), więc intensywny dzień z agentem potrafi kosztować kilka dolarów. Dla kogoś, kto koduje codziennie, subskrypcja zwykle wychodzi taniej i jest łatwiejsza do zaplanowania. Zanim ruszysz z API, oszacuj koszt w naszym kalkulatorze kosztów API.
Claude Code kontra Codex
Naturalnym rywalem jest Codex od OpenAI, drugi mocny agent działający w terminalu i w chmurze. Oba domykają duże zadania, ale różni je filozofia: Claude Code stawia na jedną, mocną sesję w konsoli i świetny model, Codex mocniej gra kartą pracy w tle i delegowania zadań jak juniorowi. Pełne, bezpośrednie starcie rozpisaliśmy w osobnym porównaniu Claude Code kontra Codex. W skrócie: do dużych refaktorów i pracy na jednym repo sięgamy po Claude Code, do zrównoleglonych, dobrze zdefiniowanych zadań chętniej po Codex.
Dla kogo
Dla osób, które kodują regularnie i nie boją się terminala, to dziś najmocniejsze narzędzie na rynku. Świetnie sprawdza się przy starszych, zaniedbanych projektach, dużych refaktorach i zadaniach, w których liczy się rozumienie całości, a nie pojedynczego pliku. Początkujący też skorzystają, pod warunkiem że przejdą przez próg instalacji i oswojenia konsoli. Osoby całkiem nietechniczne, które chcą tylko zbudować aplikację bez dotykania kodu, będą szczęśliwsze w app-builderze pokroju Lovable.
Werdykt
Claude Code dostaje od nas 9,1 na 10, najwyższą ocenę wśród testowanych agentów. Dowozi tam, gdzie inne narzędzia się poddają: przy dużych, wieloplikowych zadaniach, refaktorach i pracy wymagającej rozumienia całego projektu. Ma pod maską jedne z najmocniejszych dziś modeli do kodowania, a praca po polsku jest wzorowa. Odejmujemy punkty za próg wejścia terminala i za limity sesji, które potrafią zatrzymać w najgorszym momencie. Jeśli kod to Twoja codzienność, warto oswoić tę konsolę.
Opanuj AI‑coding w 5 minut. W każdy poniedziałek.
Konkretne premiery, analizy cen i jeden trik, który przyspieszy Twoją pracę. Po polsku, bez żargonu, prosto na maila.