
Nowe narzędzia i możliwości Responses API
Responses API od OpenAI wzbogacono o szereg funkcji, które mają na celu zwiększenie elastyczności integracji i mocy obliczeniowej modeli językowych. Wprowadzono obsługę zdalnych serwerów MCP, nową funkcję image generation z możliwością strumieniowania i wieloetapowej edycji, a także Code Interpreter umożliwiający wykonywanie kodu Python i analizę obrazów. To krok w stronę głębszej integracji modeli AI z rzeczywistymi procesami informatycznymi.
Usprawnienia pod kątem przejrzystości i prywatności
Wśród wprowadzonych innowacji znalazły się również tryb pracy w tle (background mode), podsumowania rozumowania (reasoning summaries) oraz szyfrowane elementy rozumowania. Te funkcje mają na celu zwiększenie przejrzystości i bezpieczeństwa danych, co jest szczególnie istotne dla firm i instytucji przetwarzających dane wrażliwe. Dzięki nim możliwe staje się bardziej zaufane wdrażanie AI w środowiskach profesjonalnych.
Reinforcement Fine-Tuning dla o4-mini
Model o4-mini uzyskał wsparcie dla Reinforcement Fine-Tuning (RFT), który opiera się na rozumowaniu łańcuchowym (chain-of-thought) oraz specyficznej ocenie zadań. Pozwala to na optymalizację wydajności modeli w wymagających branżach. Przykładem sukcesu może być firma Accordance, która po zastosowaniu RFT zanotowała 40% wzrost skuteczności w obszarach podatkowych i księgowych.
Lokalne kodowanie z Codex CLI
OpenAI udostępniło Codex CLI, lokalnego agenta kodowania, który po zalogowaniu przez ChatGPT łączy się z organizacją API. Umożliwia to płynne zarządzanie projektami kodu z poziomu terminala. Dodatkowo użytkownicy planów Plus i Pro mogą otrzymać promocyjne kredyty API, a nowy model codex-mini oferuje szybkie odpowiedzi i edycję kodu przy minimalnym opóźnieniu.
Nowy agent inżynierii oprogramowania
Codex, dostępny w ChatGPT, to narzędzie dla programistów, które pozwala na automatyczne wykonywanie zadań inżynierskich. Samodzielnie przeszukuje bazę kodu, proponuje zmiany i tworzy pull requesty. Może działać w wielu wątkach jednocześnie, co pozwala na efektywną współpracę w zespołach developerskich.
Structured Outputs i precyzja schematów
Wprowadzono też aktualizacje w zakresie Structured Outputs, w tym możliwość równoległego wywoływania funkcji w trybie ścisłym, co gwarantuje zgodność z ustalonym schematem. Dodano też nowe słowa kluczowe dla kontroli długości i formatu danych przy pomocy wyrażeń regularnych.
Elastyczność cenowa dzięki Flex Processing
Nowa opcja Flex Processing umożliwia korzystanie z modeli o3 i o4-mini w trybie ekonomicznym. Dzięki parametrowi service_tier=”flex” można znacznie obniżyć koszty API kosztem nieco większego opóźnienia. To rozwiązanie skierowane jest do zadań wsadowych, ewaluacyjnych oraz wzbogacania danych.
Zastosowania w czasie rzeczywistym
Modele z rodziny o3 wykorzystywane są już w praktyce – jeden z nich gra na żywo w Pokémona na Twitchu, analizując wizualnie mapę, zapisując postęp i wyjaśniając swoje decyzje. To pokazuje, że AI może działać interaktywnie i transparentnie w czasie rzeczywistym.
Wielkie wyzwania i zachęty
OpenAI ogłosiło OpenAI to Z Challenge, które zachęca do wykorzystania modeli do eksploracji nieznanych stanowisk archeologicznych w Amazonii. Nagrodą główną jest 250 000 USD w gotówce lub kredytach API oraz finansowanie dalszych badań z udziałem archeologów.
Nowe przewodniki i szkolenia
Dla społeczności programistów udostępniono przewodniki edukacyjne, obejmujące m.in. buforowanie promptów, generowanie obrazów z edycją i strumieniowaniem oraz tworzenie agentów głosowych z wykorzystaniem Responses API i RFT. Te materiały pozwalają na szybsze i bardziej świadome wdrażanie AI.