Wydarzenia
Sprawdź promocje Black Friday w Cyfrowe.pl
Google stworzyło układ AI, który jest w stanie kreować fotorealistyczne obrazy na podstawie opisu. Czy nadchodzi koniec fotografii stockowej i produktowej?
Układy AI operujące obrazami z roku na rok stają się coraz doskonalsze i bardziej zaskakujące. To, co jeszcze kilka lat temu wydawało się fikcją rodem z filmów science fiction dziś trafia już do programów graficznych. Wygląda jednak na to, że jesteśmy w przeddzień rewolucji, która może wstrząsnąć rynkiem fotografii użytkowej. Opracowywane są bowiem systemy, potrafiące tworzyć gotowe obrazy wyłącznie na podstawie opisów.
Raptem w kwietniu informowaliśmy was o dokonaniu naukowców z firmy Open AI. Stworzony przez nich układ DALL-E 2 jest w stanie przygotowywać spójne, stosunkowo realistyczne obrazy na podstawie danych wpisywanych w formie zwykłych zdań i przygotowywać rezultaty w dowolnie określonym przez użytkownika stylu.
Nowe dokonanie programistów z Google idzie jednak o krok dalej. Stworzony przez Amerykanów układ Imagen oprócz możliwości tworzenia grafik na podstawie prostych opisów, za cel obiera sobie także tworzenie obrazów, jak najbardziej przypominających zwykłe zdjęcia. A gotowe rezultaty oferuje w dużej, a przynajmniej zupełnie użytecznej rozdzielczości. Poniżej kilka przykładów wraz z opisami, które posłużyły do ich stworzenia.
"Logo Google Brain nad panoramą Toronto"
"Zdjęcie szopa w hełmie kosmonauty"
Powyższe przykłady to tylko kilka z przykładowych obrazów, które twórcy udostępniają na swojej stronie. Wchodząc na nią znajdziemy także prosty kreator, pozwalający zobaczyć jak zmieniają się rezultaty przy zmianach poszczególnych składowych opisu kreowanego „zdjęcia”.
Oglądając gotowe grafiki w powiększeniu, jesteśmy oczywiście w stanie zauważyć pewne niedoskonałości i nienaturalne elementy, ale tak czy inaczej jest to jak do tej pory najdoskonalszy system tego typu, jaki widzieliśmy na oczy. Biorąc pod uwagę szybki rozwój technologii, pozostaje pytanie jak szybko znajdzie ona realne zastosowanie.
"Zdjęcie kota w okularach i koszulce, jeżdżącego na deskorolce w ogrodzie"
"Zdjęcie pluszowego misia pływającego motylkiem"
Już teraz śmiało można stwierdzić, że większość ze wspomnianych niedoskonałości prawdopodobnie nie zostałaby wychwycona przez oglądających podczas scrollowania Instagrama. W ciągu kilku lat układy tego typy dojrzeją zapewne na tyle, że będą w stanie oszukać widza także podczas oglądania zdjęć w większym rozmiarze. Jakie będą tego konsekwencje?
Jednym z najbardziej prawdopodobnych skutków wdrożenia tego typu technologii na szeroką skalę będzie załamanie się rynku banków zdjęć i fotografii stockowej. Bo o ile większość fotografii komercyjnej wymaga (jeszcze) fizycznego pojawienia się fotografa w danym miejscu czy sfotografowania produktów, to w przypadku zdjęć użytkowych i ilustracyjnych zwyczajnie łatwiej będzie użytkownikowi wygenerować dany obraz na podstawie opisu, niż tracić czas na poszukiwanie go w serwisach stockowych. Na dodatek uzyska on w tej sposób obraz unikalny, który nie był używany wcześniej.
Naturalnie pojawiają się też pytania o etykę. Dziś, w erze deepfake’ów i fake newsów tego typu rozwiązania budzą uzasadnione obawy o wykorzystanie ich do niecnych celów. I właśnie dlatego twórcy jak na razie nie udostępniają swojej technologii szerszemu gronu, chcąc ją dopracować i ograniczyć możliwości tworzenia za jej pomocą krzywdzących obrazów. Jak sami piszą, ze względu na szkolenie sieci neuronowych na otwartych bazach zdjęć muszą na przykład uporać się z problemem uprzedzeń społecznych i kulturowych, które system przejawia nawet gdy w zadanych mu żądaniach nie pojawiają się ludzie.
"Modrosójka błękitna stojąca na koszu wypełnionym makaronikami w kolorze tęczy"
"Mózg ujeżdżający rakietę"
"Zdjęcie chromowanej kaczki ze złotym dziobek, która kłóci się ze wściekłym żółwiem"
"Zdjęcie podtopionej galerii sztuki, wystawiającej dzieła Moneta robotom"
Na gotowy, powszechnie dostępny system tego typu poczekamy zapewne jeszcze kilka lat, a jego ostateczna forma może być w pewien sposób ograniczona pod względem możliwości. Tak czy inaczej powinniśmy zacząć zdawać sobie sprawę, że w bardzo niedalekiej przyszłości technologia tego typu diametralnie zmieni nasz sposób postrzegania i używania fotografii, a wraz z kolejnymi usprawnieniami przewartościuje także zapewne segment fotografii reklamowej.
W końcu rozbudowanie danego systemu o możliwość dodania obrazu czy produktu, wokół którego AI budować ma narrację wizualną wydaje się jak najbardziej w zasięgu obecnych już możliwości programistów. Ba, prawdopodobnie problemem nie będzie nawet sprawienie, by rezultaty odpowiadały stylowi danego fotografa.
Czy jesteście na to gotowi?
Więcej informacji na temat układu Imagen znajdziecie na stronie imagen.research.google.