
Nowy model kodowania od Anthropic
Claude Sonnet 4.5 został zaprezentowany jako „najlepszy model kodowania na świecie”. Według oficjalnych danych osiąga on 77,2% w benchmarku SWE-bench Verified i potrafi utrzymać autonomiczną pracę przez ponad 30 godzin. Model został zintegrowany z VS Code, Amazon Bedrock oraz GitHub Copilot, co rozszerza jego potencjalne zastosowania w środowiskach deweloperskich i biznesowych.
Najważniejsze deklaracje producenta
Anthropic podkreśla, że nowa wersja oferuje lepszą kontrolę bezpieczeństwa, mniejszą podatność na prompt injection oraz narzędzia wspierające pracę programisty, takie jak checkpoints czy nowe API. Co istotne, cennik pozostał bez zmian, co ma zachęcić do wdrożeń na szeroką skalę.
Reakcje mediów technologicznych
Według Reuters model opracował od podstaw aplikację webową, a w testach udało się utrzymać ciągłe działanie przez 30 godzin. The Verge podało, że w tym czasie wygenerował około 11 000 linii kodu. Podkreślono także, że poprzednie wersje modelu nie były w stanie osiągać tak długiej autonomii.
Pierwsze testy praktyczne
W niezależnych próbach model generował poprawny i spójny kod, a jego interfejs oceniono jako intuicyjny. Wyniki te potwierdzają spójność z danymi z mediów oraz z oficjalnych zapowiedzi. Wskazuje to na realny potencjał do wykorzystania w edukacji i profesjonalnym środowisku programistycznym.
Największe zalety modelu
Do najważniejszych atutów należą: długi horyzont działania, lepsza jakość kodu, zaawansowane narzędzia developerskie, większa kontrola bezpieczeństwa oraz silne wsparcie ekosystemu. Szczególnie istotne są funkcje przydatne w refaktoryzacji dużych systemów i integracja z popularnymi narzędziami.
Ograniczenia i ryzyka
Wciąż istnieją wyzwania związane z różnicą między warunkami testowymi a produkcyjnymi, koniecznością nadzoru ludzkiego oraz zagrożeniem atakami manipulacyjnymi. Model musi również konkurować z rozwiązaniami OpenAI i Google, a długie procesy mogą generować koszty infrastrukturalne.