Imagen - sztuczna inteligencja, która zabije fotografię stockową

Autor: Maciej Luśtyk

26 Maj 2022

Artykuł na: 6-9 minut

Google stworzyło układ AI, który jest w stanie kreować fotorealistyczne obrazy na podstawie opisu. Czy nadchodzi koniec fotografii stockowej i produktowej?

Układy AI operujące obrazami z roku na rok stają się coraz doskonalsze i bardziej zaskakujące. To, co jeszcze kilka lat temu wydawało się fikcją rodem z filmów science fiction dziś trafia już do programów graficznych. Wygląda jednak na to, że jesteśmy w przeddzień rewolucji, która może wstrząsnąć rynkiem fotografii użytkowej. Opracowywane są bowiem systemy, potrafiące tworzyć gotowe obrazy wyłącznie na podstawie opisów.

Zdjęcia ze słów - to można zrobić już dziś

Raptem w kwietniu informowaliśmy was o dokonaniu naukowców z firmy Open AI. Stworzony przez nich układ DALL-E 2 jest w stanie przygotowywać spójne, stosunkowo realistyczne obrazy na podstawie danych wpisywanych w formie zwykłych zdań i przygotowywać rezultaty w dowolnie określonym przez użytkownika stylu.

Fujifilm GFX100RF - Raty 20x0%

22 999 zł

PANASONIC LUMIX S1R II + Fotoforma Care - raty 20 x 0%

15 499 zł

SONY FE 400-800 MM F/6.3-8 G OSS - raty 20 x 0%

13 299 zł

Canon PowerShot V1 Premium Vlogger Kit - Raty 20x0%

4 549 zł

Canon EOS R50 V body - Raty 20x0%

3 329 zł

Przeczytaj także:

Dotarliśmy do końca fotografii. Nowy system AI tworzy zdjęcia i grafiki na podstawie opisówJeśli zastanawiacie się, jak rynek fotografii i grafiki będzie wyglądał za kilka lat, nowe dokonania programistów z Open AI mogą być tego ciekawą zapowiedzią. [Czytaj więcej]

Nowe dokonanie programistów z Google idzie jednak o krok dalej. Stworzony przez Amerykanów układ Imagen oprócz możliwości tworzenia grafik na podstawie prostych opisów, za cel obiera sobie także tworzenie obrazów, jak najbardziej przypominających zwykłe zdjęcia. A gotowe rezultaty oferuje w dużej, a przynajmniej zupełnie użytecznej rozdzielczości. Poniżej kilka przykładów wraz z opisami, które posłużyły do ich stworzenia.

"Logo Google Brain nad panoramą Toronto"

"Zdjęcie szopa w hełmie kosmonauty"

Powyższe przykłady to tylko kilka z przykładowych obrazów, które twórcy udostępniają na swojej stronie. Wchodząc na nią znajdziemy także prosty kreator, pozwalający zobaczyć jak zmieniają się rezultaty przy zmianach poszczególnych składowych opisu kreowanego „zdjęcia”.

Sprawdź najlepsze promocje >

Aparat cyfrowy Sony A7 IV body...

10275 PLN

Sprawdź

Obiektyw Sigma C 18-50 mm f/2.8 DC DN...

2276 PLN

Sprawdź

Aparat cyfrowy Nikon Aparat cyfrowy...

9999 PLN

Sprawdź

Obiektyw Sigma A 24-70 mm f/2.8 DG DN...

5620 PLN

Sprawdź

Aparat cyfrowy Sony A7S III body...

17489 PLN

Sprawdź

Aparat cyfrowy Panasonic Lumix S5IIX...

8335 PLN

Sprawdź

Systemy tego typu są jeszcze niedoskonałe. Ale już niedługo

Oglądając gotowe grafiki w powiększeniu, jesteśmy oczywiście w stanie zauważyć pewne niedoskonałości i nienaturalne elementy, ale tak czy inaczej jest to jak do tej pory najdoskonalszy system tego typu, jaki widzieliśmy na oczy. Biorąc pod uwagę szybki rozwój technologii, pozostaje pytanie jak szybko znajdzie ona realne zastosowanie.

"Zdjęcie kota w okularach i koszulce, jeżdżącego na deskorolce w ogrodzie"

"Zdjęcie pluszowego misia pływającego motylkiem"

Już teraz śmiało można stwierdzić, że większość ze wspomnianych niedoskonałości prawdopodobnie nie zostałaby wychwycona przez oglądających podczas scrollowania Instagrama. W ciągu kilku lat układy tego typy dojrzeją zapewne na tyle, że będą w stanie oszukać widza także podczas oglądania zdjęć w większym rozmiarze. Jakie będą tego konsekwencje?

Jednym z najbardziej prawdopodobnych skutków wdrożenia tego typu technologii na szeroką skalę będzie załamanie się rynku banków zdjęć i fotografii stockowej. Bo o ile większość fotografii komercyjnej wymaga (jeszcze) fizycznego pojawienia się fotografa w danym miejscu czy sfotografowania produktów, to w przypadku zdjęć użytkowych i ilustracyjnych zwyczajnie łatwiej będzie użytkownikowi wygenerować dany obraz na podstawie opisu, niż tracić czas na poszukiwanie go w serwisach stockowych. Na dodatek uzyska on w tej sposób obraz unikalny, który nie był używany wcześniej.

Czas przygotować się na diametralną zmianę w postrzeganiu fotografii

Naturalnie pojawiają się też pytania o etykę. Dziś, w erze deepfake’ów i fake newsów tego typu rozwiązania budzą uzasadnione obawy o wykorzystanie ich do niecnych celów. I właśnie dlatego twórcy jak na razie nie udostępniają swojej technologii szerszemu gronu, chcąc ją dopracować i ograniczyć możliwości tworzenia za jej pomocą krzywdzących obrazów. Jak sami piszą, ze względu na szkolenie sieci neuronowych na otwartych bazach zdjęć muszą na przykład uporać się z problemem uprzedzeń społecznych i kulturowych, które system przejawia nawet gdy w zadanych mu żądaniach nie pojawiają się ludzie.

"Modrosójka błękitna stojąca na koszu wypełnionym makaronikami w kolorze tęczy"

"Mózg ujeżdżający rakietę"

"Zdjęcie chromowanej kaczki ze złotym dziobek, która kłóci się ze wściekłym żółwiem"

"Zdjęcie podtopionej galerii sztuki, wystawiającej dzieła Moneta robotom"

Na gotowy, powszechnie dostępny system tego typu poczekamy zapewne jeszcze kilka lat, a jego ostateczna forma może być w pewien sposób ograniczona pod względem możliwości. Tak czy inaczej powinniśmy zacząć zdawać sobie sprawę, że w bardzo niedalekiej przyszłości technologia tego typu diametralnie zmieni nasz sposób postrzegania i używania fotografii, a wraz z kolejnymi usprawnieniami przewartościuje także zapewne segment fotografii reklamowej.

W końcu rozbudowanie danego systemu o możliwość dodania obrazu czy produktu, wokół którego AI budować ma narrację wizualną wydaje się jak najbardziej w zasięgu obecnych już możliwości programistów. Ba, prawdopodobnie problemem nie będzie nawet sprawienie, by rezultaty odpowiadały stylowi danego fotografa.

Czy jesteście na to gotowi?

Więcej informacji na temat układu Imagen znajdziecie na stronie imagen.research.google.