Opcja Flex została uruchomiona w wersji beta dla modeli o3 oraz o4-mini, a jej głównym przeznaczeniem są zadania o niższym priorytecie, takie jak ewaluacje modeli, wzbogacanie danych czy operacje asynchroniczne – czyli te, które nie muszą być realizowane natychmiast.

Co ważne, ceny w modelu Flex są aż o 50% niższe niż w standardowym przetwarzaniu. Dla modelu o3 to 5 USD za milion tokenów wejściowych i 20 USD za milion tokenów wyjściowych (zamiast odpowiednio 10 i 40 USD). W przypadku o4-mini ceny spadają do 0,55 USD i 2,20 USD, w porównaniu do 1,10 USD i 4,40 USD w tradycyjnym rozliczeniu.

Wprowadzenie tej opcji zbiega się w czasie z rosnącą presją konkurencyjną – na przykład Google właśnie zaprezentował Gemini 2.5 Flash, który oferuje wysoką wydajność przy niższym koszcie tokena, stając się realną alternatywą dla innych czołowych modeli AI.

Dodatkowo, OpenAI zapowiedziało, że użytkownicy z niższych poziomów zużycia (tier 1–3) będą musieli przejść proces weryfikacji tożsamości, by móc korzystać z modelu o3 i niektórych funkcji API. Firma tłumaczy tę zmianę potrzebą ograniczenia nadużyć i zapewnienia bezpieczniejszego środowiska dla deweloperów.