
Nowe API OpenAI otwiera świat generowania obrazów
Technologia generowania obrazów wykorzystywana w ChatGPT została udostępniona przez OpenAI w postaci API. Dzięki temu deweloperzy mogą zintegrować ją bezpośrednio w swoich aplikacjach i usługach, rozszerzając funkcjonalność o możliwość tworzenia zaawansowanych grafik przy użyciu sztucznej inteligencji.
Charakterystyka modelu gpt-image-1
Model gpt-image-1 to zaawansowany multimodalny system AI, który umożliwia generowanie obrazów w różnych stylach estetycznych oraz zgodnie z niestandardowymi wytycznymi. System potrafi również dokładnie odwzorować tekst, korzystając z szerokiej wiedzy o świecie. Generowanie może być realizowane w różnych trybach jakościowych, co wpływa na czas przetwarzania i poziom szczegółowości.
Bezpieczeństwo i moderacja treści
Wszystkie funkcje API podlegają tym samym zabezpieczeniom co wersja dostępna w ChatGPT. Dostępne są dwa poziomy czułości moderacji: „auto” jako domyślny oraz „low” dla mniej restrykcyjnego filtrowania. Dodatkowo wszystkie generowane obrazy zawierają metadane C2PA, pozwalające na ich identyfikację jako dzieł AI na kompatybilnych platformach.
Model oparty na strukturze tokenów
OpenAI zastosowało model rozliczeniowy oparty na liczbie tokenów. Koszt to 10 dolarów za milion tokenów wejściowych oraz 40 dolarów za milion tokenów wyjściowych. Przekłada się to na cenę od 2 do 19 centów za jeden obraz, w zależności od wybranej jakości renderowania.
Nowe integracje z aplikacjami kreatywnymi
Wiele znanych marek rozpoczęło integrację modelu gpt-image-1 w swoich ekosystemach. Adobe wdraża technologię w aplikacjach Firefly i Express, natomiast Figma wykorzystuje ją w projektowaniu graficznym. Canva testuje wykorzystanie modelu w Magic Studio, a GoDaddy oraz Airtable implementują go w narzędziach do tworzenia logo i zarządzania zasobami wizualnymi.