DraGAN - kolejne narzędzie AI pokazuje jak będzie wyglądać przyszłość obróbki zdjęć

Autor: Maciej Luśtyk

22 Maj 2023
Artykuł na: 4-5 minut

Technologie AI na dobre wkraczają na rynek pracy komercyjnej. Naukowcy z Instytutu Maxa Placka, MIT i Google prezentują system, który już niedługo może rozbudować możliwości programów do edycji.

Rok 2023 już teraz możemy śmiało nazwać rokiem sztucznej inteligencji. Najnowsze wersje generatorów grafiki typu MidJourney i Dall-E 2, wyrastające się jak grzyby po deszczu nowe usługi AI, globalne firmy zapowiadające wdrożenie układów SI do codziennych praktyk, edytor AI rozwijany przez Adobe czy pierwsze komercyjne zastosowania stworzonych w całości cyfrowo obrazów pokazują, jasno pokazują, że rynek wizualny zmienia się dosłownie na naszych oczach.

Do grupy technologii, które już niebawem mają szansę odmienić sposób, w jaki pracujemy z grafiką i zdjęciami dołącza DraGAN - nowy system GAN (Generative Adversarial Network), opracowany przez naukowców zrzeszonych w Max Planck Institute for Informatics, MIT Computer Science and Artificial Intelligence Laboratory oraz Google AR/VR.

Wesoły Biden, poważny Biden. DraGAN pokazuje możliwości edycji obrazów, jakich jeszcze nie widzieliśmy

W odróżnieniu od innych generatywnych systemów AI, DraGAN, zamiast na kreowaniu obrazu od podstaw, skupia się głównie na możliwościach jego edycji. A te są naprawdę imponujące. System bazujący na punktowej edycji pozwala na „inteligentną” transformację obrazu, umożliwiając m.in.: swobodne obracanie dwuwymiarowych obiektów, zmianę póz ludzi i zwierząt, korekcję mimiki czy łatwą regulację wyglądu ubioru lub fryzury. Dla przykładu system jest w stanie zamienić zwykłą fotografię „paszportową” wykonaną en-face w obraz uśmiechniętej osoby, która puszcza do nas oko czy też sprawić, by spokojnie stojący na zdjęciu lew zaczął ryczeć.

Główne demo systemu DraGAN (przyspieszone)

DraGAN określany jest mianem photoshopowej funkcji Liquify (Skraplanie) na sterydach i prawdopodobnie nie minie dużo czasu, zanim opracowane w ramach projektu rozwiązania zobaczymy w czołowych programach do edycji. System już teraz oferuje interfejs umożliwiający swobodne wykorzystywanie go przez laików, toteż tylko kwestią czasu jest aż zostanie od udostępniony developerom w formie licencji. W końcu nietrudno wyobrazić sobie jakie korzyści może przynieść on w pracy komercyjnej.

Zbliżamy się do momentu, w którym profesjonalna fotografia przestanie być potrzebna. Przynajmniej w ujęciu komercyjnym

Pisząc o korzyściach warto też zwrócić uwagę na dalsze ograniczenie funkcji fotografii w tworzeniu przekazu wizualnego. O ile dotychczasowe generatory są już w stanie stworzyć fotorealistyczne, potrafiące w pełni oszukać odbiorcę obrazy, to nadal dość widocznie ograniczają nas w zakresie precyzyjnej nad nim kontroli. Bazujemy na tym, jak dany system przetworzy nasze prompty, poza pracą w obrębie jednego seeda nie ma też mowy o powtarzalności. Dzięki połączeniu możliwości DraGANa z systemami generowania grafik użytkownik mógłby w dużej mierze ominąć te przeszkody, dostosowując wygenerowany obraz dokładnie do swoich oczekiwać. Tym samym znacznie zmalałaby konieczność sięgania po tradycyjną fotografię jako medium bazowego czy też w celu stworzenia ilustracji do konkretnego scenariusza.

Oczywiście, jak pisaliśmy już wielokrotnie, nawet znaczny rozwój systemów tego typu nie oznacza końca fotografii jako takiej, należy się jednak przygotować na to, że w świecie realizacji komercyjnych z roku na rok może mieć ona coraz mniejsze znaczenie.

Więcej informacji i przykładów działania systemu DraGAN znajdziecie na stronie vcai.mpi-inf.mpg.de.

Skopiuj link

Autor: Maciej Luśtyk

Redaktor prowadzący serwisu Fotopolis.pl. Zafascynowany nowymi technologiami, choć woli fotografować analogiem.

Komentarze
Więcej w kategorii: Software
Final Cut Pro 11 - magnetyczne maski, inteligentny tracking, automatyczne transkrypcje i usprawniony workflow. Apple na dobre bierze się za flagowy edytor wideo
Final Cut Pro 11 - magnetyczne maski, inteligentny tracking, automatyczne transkrypcje i...
Po 13 latach Apple prezentuje w końcu kolejną wersje programu do edycji wideo Final Cut Pro. Nowa odsłona nie wprowadza rewolucji, ale wreszcie otrzymuje funkcje, dzięki którym może...
4
Nowości AI w Adobe Photoshop, Lightroom i Premiere - rewolucja w pracy kreatywnej nabiera rozpędu
Nowości AI w Adobe Photoshop, Lightroom i Premiere - rewolucja w pracy kreatywnej nabiera rozpędu
Podczas konferencji Adobe Max producent oprogramowania przedstawił i zapowiedział szereg nowych funkcji opartych o AI, które jeszcze bardziej ułatwią pracę w programach graficznych....
29
Adobe Content Authenticity - producent przygotowuje aplikację webową do przypisywania i podglądu certyfikatów autentyczności
Adobe Content Authenticity - producent przygotowuje aplikację webową do przypisywania i podglądu...
W ramach rozwoju inicjatywy CAI / C2PA Adobe wprowadza platformę, która ułatwić ma przypisywanie i podgląd specjalnych metadanych poświadczających oryginalność cyfrowych plików.
6
Powiązane artykuły