Pora się pakować. Najnowszy generator obrazu od Open AI to koszmar fotografów komercyjnych

Autor: Maciej Luśtyk

28 Marzec 2025

Artykuł na: 6-9 minut

Open AI zaprezentowało nowy model generowania obrazów, który niebawem trafi do Chata GPT. Nowy generator dużo precyzyjniej odtwarza drobne detale i napisy, utrzymuje spójność pomiędzy seriami obrazów a także pozwala na swobodne edytowanie grafik, stając się poważnym wyzwaniem dla rynku fotografii komercyjnej.

Gdy przed trzema laty na rynku debiutowały pierwsze powszechnie dostępne generatory grafiki, niektórzy eksperci z branży AI sugerowali, że do 2029 roku ponad 90% treści w internecie będzie generowana przy użyciu narzędzi sztucznej inteligencji. Wtedy nie chciało się w to wierzyć, ale ten scenariusz staje się coraz bardziej prawdopodobny.

Fujifilm GFX100RF - Raty 20x0%

22 999 zł

PANASONIC LUMIX S1R II + Fotoforma Care - raty 20 x 0%

15 499 zł

SONY FE 400-800 MM F/6.3-8 G OSS - raty 20 x 0%

13 299 zł

Canon PowerShot V1 Premium Vlogger Kit - Raty 20x0%

4 549 zł

Canon EOS R50 V body - Raty 20x0%

3 329 zł

Już od początku swojego istnienia generatory, wzbudzając zrozumiałe zainteresowanie branży marketingowej, stwarzały duże zagrożenie rynkowi fotograficznemu, a my co i rusz słyszeliśmy o dużych firmach czy usługach wykreślających z procesu produkcji konieczność zatrudniania fotografa. Wystarczy wspomnieć chociażby wygenerowane kampanie odzieżowe marki Mango czy apkę Botika, która tworzy profesjonalne zdjęcia ubrań na potrzeby e-commerce.

Do tej pory rewelacje z branży AI nie dotykały przeciętnego fotografa. Właśnie się to zmienia

W przypadku dużych marek były to jednak procesy kosztowne, wymagające trenowania własnych modeli i zatrudniania specjalistów, poszczególne usługi ograniczały się zaś zwykle do ściśle określonych celów. Jednym słowem wszystko to nie dotykało jeszcze widocznie największej rzeszy osób żyjących z wykonywania zdjęć - fotografów średniego szczebla, wykonujących sesje produktowe i lifestylowe na potrzeby klientów prywatnych czy niewielkich przedsiębiorstw. Wszystko przez to, że dotychczasowe generatory nadal średnio radziły sobie z odwzorowywaniem drobnych detali czy utrzymywaniem spójnego stylu pomiędzy poszczególnymi ujęciami. A jeśli takie efekty udawało się uzyskać, wymagało to korzystania z usług specjalistów czy też poświęcania dużej ilości czasu na rozwijanie własnych umiejętności z zakresu obsługi narzędzi AI.

Wszystko to zmienia najnowszy generator Open AI, który właśnie wdrażany jest do Chata GPT w wersji 4o. Nowy model to przede wszystkim większa precyzja, lepsza kontrola nad tekstem i swobodna edycja proponowanych rezultatów. A wszystko to na wyciągnięcie ręki, w ramach prostego interfejsu, z którym poradzi sobie dosłownie każdy.

W dużym skrócie, o ile zapowiadane możliwości okażą się tak imponujące, jak to, co niektórzy mający już dostęp do nowej funkcji użytkownicy pokazują w internecie, nasi klienci bez większego problemu będą na przykład w stanie wygenerować profesjonalnie wyglądający zestaw zdjeć, przedstawiający ich produkt, na bazie kilku fotek wykonanych swoim telefonem. Co więcej, takie zdjęcia będą mogli swobodnie edytować także po fakcie, łatwo dostosowując ich wygląd i format do wszelkich aktualnych potrzeb.

Czy w obliczu takich możliwości ktoś będzie jeszcze chciał zatrudniać do takich celów fotografów? Śmiem wątpić. I choć na pewno znajdą się firmy, które będą szczycić się prawdziwą fotografią, będzie to raczej wyjątek potwierdzający regułę. W końcu historycznie zawsze wygrywała wygoda.

Niektórych zastosowań fotografii nie da się zastąpić AI. Czy jednak na pewno?

Oczywiście pozostaje jeszcze kwestia najważniejsza, czyli przedstawianie ludzi i aspekt dokumentalny. We wcześniejszych artykułach dotyczących AI wskazywałem, że paradoksalnie, wraz z rozwojem sztucznej inteligencji fotografia może na nowo odżyć w swoim pierwotnym zastosowaniu - zatrzymywaniu chwil z naszej życia. Istnieje bowiem niezliczona liczba przypadków, w których potrzebujemy zdjęć nas samych. Dziś nie jestem już tego taki pewny.

Obserwując dotychczas udostępnione przykłady tego, jak skutecznie nowy model radzi sobie z odwzorowywaniem wyglądu osób ze zdjęć bazowych, nietrudno wyobrazić mi sobie sytuacje, gdzie firma czy klient zamiast zatrudniać fotografa generuje sesję portretową na bazie fotek cykniętych smartfonem. Nie byłbym też zupełnie zaskoczony gdyby w ten sposób zaczęły być realizowane zlecenia stanowiące jeden z głównych filarów dzisiejszej fotografii zawodowej - sesje ślubne i weselne. Powiem więcej, jestem przekonany, że już niedługo zobaczymy firmy i usługi specjalizujące się dokładnie w tym obszarze.

Oczywiście, w przypadku tak specyficznych realizacji nadal konieczne będzie wysłanie na miejsce kogoś, kto udokumentuje całe zdarzenie i dostarczy AI wystarczającej ilości materiału źródłowego, ale jeśli nie będzie to wymagało żadnych umiejętności czy nakładów sprzętowych i tak będzie to procesem dużo tańszym i szybszym. A wtedy rachunek staje się bardzo prosty.

Wyświetl ten post na Instagramie

Post udostępniony przez ChatGPT (@chatgpt)

Czy więc przyszłość „fotografii” komercyjnej sprowadzi się do prostego zbierania surowych danych, które następnie będą przetwarzane przez układy AI w celu stworzenia finalnego obrazu? Tego nie wiem, ale jeśli tylko okaże się to szybsze, tańsze i wygodniejsze od zrobienia dobrego zdjęcia, istnieje spora szansa, że tego typu rozwiązania będą stanowiły sporą cześć rynku. Znamienne jest chociażby to, że w oficjalnych prezentacjach Open AI zawsze stara się ocieplać „wizerunek” sztucznej inteligencji, bazując na dość abstrakcyjnych i nieszkodliwych przykładach użycia, podczas gdy finalnie narzędzia te używane są do optymalizacji typowo przyziemnych procesów. To, że w powyższych prezentacjach niewiele jest typowej fotografii, to bynajmniej nie przypadek.

Do zobaczenia po drugiej stronie lustra

Być może ten tekst ma nieco zbyt sensacyjny charakter. Być może finalnie możliwości nowego generatora nie okażą się wcale tak imponujące (sprawdzimy je, jak tylko zostaną szerzej udostępnione). W końcu samo Open AI wskazuje, że najnowszy model nadal ma problemy z pewnymi procesami. Pewne jest natomiast to, że żyjemy w okresie fundamentalnej zmiany w sposobie tworzenia oraz konsumowania treści i czy tego chcemy czy nie, będziemy musieli się do niej odpowiednio zaadaptować. A może w ogóle fotografia taka, jaką znamy, była tylko okresem przejściowym w historii ewolucji przekazu wizualnego? W końcu segment AI tak naprawdę dopiero raczkuje, a widząc jak szybko ewoluuje nawet najbardziej abstrakcyjne scenariusze zaczynają wydawać się prawdopodobne.

Więcej informacji o możliwościach nowego generatora w ramach Chat GPT4o znajdziecie na stronie openai.com.

(fot. okładkowa: Open AI, prompt: Szczere zdjęcie w stylu paparazzich przedstawiające Karola Marksa pospiesznie idącego przez parking Mall of America, spoglądającego przez ramię z zaskoczonym wyrazem twarzy, gdy próbuje uniknąć bycia fotografowanym. W rękach trzyma wiele błyszczących toreb na zakupy wypełnionych luksusowymi towarami. Jego płaszcz powiewa za nim na wietrze, a jedna z toreb kołysze się, jakby był w trakcie biegu. Rozmyte tło z samochodami i świecącym wejściem do centrum handlowego dla podkreślenia ruchu. Lampa błyskowa aparatu częściowo prześwietla obraz, nadając mu chaotyczny, tabloidowy charakter.)