Sztuczna inteligencja (AI) zaczęła już nie tylko pukać do naszych drzwi, ale sprawiła, że zaczęliśmy zastanawiać się, czy nie wpuścić jej do środka. Nie jest ona niczym nowym, biorąc pod uwagę jej powszechnie zastosowanie w narzędziach, z których korzystamy na co dzień – takich jak asystent głosowy czy spersonalizowane rekomendacje treści. Natomiast w ostatnim czasie zrobiło się o niej głośno, choćby za sprawą czatu GPT, który osiągnął 1 milion użytkowników w niespełna 5 dni.
W opinii publicznej natomiast coraz częściej pojawiają się głosy mówiące o tym, że sztuczna inteligencja jest zagrożeniem dla wielu branż, a raczej dla osób w nich pracujących. Z pewność można stwierdzić, że sztuczna inteligencja rozwija się aktualnie szybciej, niż Bugatti Chiron do setki, a to jedynie ułamek jej możliwości. Czy zatem AI pozostanie tylko jako narzędzie pomagające nam w codziennych obowiązkach, czy całkowicie nas zastąpi? Postanowiliśmy zatem sprawdzić jak AI radzi sobie w świecie grafiki komputerowej. Pod lupę wzięliśmy jeden z najpopularniejszych na daną chwilę program, jakim jest DALL-E 2.
W tym wpisie dowiesz się:
- Czym jest DALLE-E 2
- Jak działa DALLE-E 2
- Jak DALLE-E 2 poradzi sobie z naszymi grafikami
- Czy DALLE-E 2 stworzy obraz na podstawie opisu
- Czy sztuczna inteligencja zastąpi grafika
Czym jest DALLE-E 2?
DALL-E 2 to nowoczesne narzędzie AI opracowane przez OpenAI, które pozwala na generowanie obrazów na podstawie opisów tekstowych, bądź wgranego przez nas zdjęcia. To druga generacja systemu DALL-E, który wykorzystuje głębokie uczenie się i sieć neuronową do tworzenia realistycznych obrazów 3D. DALL-E 2 jest w stanie generować szeroką gamę obrazów, od prostych kształtów po bardziej skomplikowane modele i postacie. To narzędzie może być wykorzystywane w różnych branżach, takich jak chociażby grafika komputerowa, reklama czy szeroko rozumiany marketing.
Narzędzie to ma również polski akcent, którego nie moglibyśmy pominąć w tym wpisie. Jednym z założycieli OpenAI jest Wojciech Zaremba. Polski inżynier i naukowiec specjalizującym się w dziedzinie sztucznej inteligencji. Jest on uznawany za jednego z najważniejszych naukowców w tej dziedzinie. Zaremba jest byłym członkiem zespołu Google Brain i obecnie jest członkiem zespołu OpenAI, gdzie pracuje nad rozwojem i ulepszaniem modeli językowych i uczenia maszynowego.
Jak działa DALLE-E 2?
W procesie uczenia DALL-E 2 analizuje niezliczone ilości obrazów i opisów tekstowych, aby nauczyć się związku między tekstem a obrazem. Po nauce model jest w stanie generować nowe obrazy na podstawie tekstowego opisu, który jest mu dostarczany. Dzięki temu po wgraniu zdjęcia bądź napisaniu tekstu otrzymujemy 4 propozycje, które zostały wygenerowane przez sztuczną inteligencję. DALL-E 2 używa deep learning, aby zrozumieć kontekst tekstu i wygenerować odpowiednie obrazy. Model ten może tworzyć różne rodzaje obrazów, takie jak obiekty, postaci, sceny i wiele innych, co czyni go bardzo elastycznym narzędziem.
Dużą zaletą, którą warto wyróżnić jest łatwość obsługi. Narzędzia nie wymaga specjalistycznej wiedzy z zakresu programowania czy sztucznej inteligencji. Kolejną z zalet narzędzia jest zdecydowanie jego darmowa rejestracja. Otrzymujemy 50 bezpłatnych kredytów na start, natomiast jeśli chcemy korzystać z narzędzia częściej, musimy zapłacić 15 USD za zakup dodatkowych 115 kredytów. Co miesiąc odnawia nam się 15 darmowych kredytów, za które nie musimy dodatkowo płacić.
Jak DALLE-E 2 poradzi sobie z naszymi grafikami?
Sporo teorii czas przejść do praktyki. Funkcja generowania grafik na podstawie wgrania pliku to pierwszy przystanek w naszej zabawie. DALLE-E 2 oferuje taką możliwość, a więc sprawdźmy to! Posłużyliśmy się tutaj naszymi stworzonymi wcześniej grafikami, które postanowiliśmy lekko upgrejdować. Dlaczego grafiki, a nie zdjęcia np. osób? Nie ma do końca jasnych informacji jak później takie zdjęcia są wykorzystywane. Jeden z programów, który wcześniej testowaliśmy wyświetlił nam komunikat, że takie działania mogą być niebezpieczne.
Czy DELL-E 2 jest bezpieczniejsze? No cóż, czytając regulamin można odnieść wrażenie, że „korzystasz na własną odpowiedzialność”. Ale tutaj zachęcamy do zapoznania się samemu z regulaminem przed przystąpieniem do zabawy. Dostępny jest pod linkiem “Terms & Policies”. My natomiast pokażemy Wam wyniki naszej przygody z tym narzędziem.
Na pierwszym obrazku widać nasz projekt Ciri z Wiedźmina, na podstawie którego DALL-E 2, wygenerował swoje 4 propozycje. Ok.. nie jest idealnie i nasza wiedźminka wygląda na nich bardziej jakby była właśnie po starciu z Dzikim Gonem niż przechadzała się po królewskim pałacu, ale do sedna. Na pewno pierwsze co rzuca nam się w oczy to liczne deformacje twarzy czy ciała. Przyglądając się dokładniej zaproponowanym grafikom można zauważyć, że w pierwszej propozycji brakuje np. źrenicy w oku, w drugiej kawałka twarzy. Przy trzeciej propozycji rzuca się w oczy różny kolor oczu, bądź dziwna deformacja na dekolcie. Czwarta propozycja (naszym zdaniem najgorsza) posiada różne brwi, oczy i wyrastający liść ze środka brzucha. Dodatkowo, przy żadnej propozycji sztuczna inteligencja nie wygenerowała nam poprawnego narzędzia wiedźminki, którym jest miecz, za to na dwóch z nich nasza Ciri lata z dzidą.
Biorąc pod uwagę spójność wygenerowanych propozycji względem oryginału – jest lepiej, niż jeśli skupimy się na detalach. Tutaj mamy sporo zastrzeżeń względem tego co otrzymaliśmy. Ale czas na kolejną próbę!
Kolejna grafika i kolejne 4 propozycje od sztucznej inteligencji. Tym razem umieściliśmy naszą grafiki Meduzy. Tak samo jak w przypadku Ciri, nie otrzymaliśmy efektu, który by nas zadowolił. Liczne deformacje, a na propozycji 2 nie możemy oprzeć się wrażeniu, że nasza Meduza strzeliła do nas focha. Dużym minusem względem zaproponowanych propozycji jest fakt, że na każdej z nich węże z głowy naszej Meduzy postanowiły się rozleniwić i poodpoczywać na dekolcie bohaterki. Sama dokładność względem oddania węży pozostawia wiele do życzenia Spójność względem oryginalnej grafiki, również jak w przypadku Ciri została zachowana, ale pod względem innych aspektów mamy sporo uwag.
Czas na decydujące starcie jeśli chodzi o generowanie grafik na podstawie wgranych zdjęć. Kolejna grafika to postać nie byle kogo, ale zdjęcie członka naszej projektowej załogi. Biorąc pod uwagę wygenerowane propozycje musimy przyznać, ze AI musi lubić kwiatki na równi z naszym kotem. Bukiet na naszym kocie zrobił takie wrażenie, że delikatnie powyginało nam kicie na samą myśl o wyzwaniu, jakie przed nią stoi. Szczególnie bawi nas czwarta propozycja, w której nasz kot zdobył drugi język.
Czy DALL-E 2 2 stworzy obraz na podstawie opisu?
DALL-E 2 daje nam również możliwość generowania grafik na podstawie tekstu. Dlatego postanowiliśmy sprawdzić ten sposób i wygenerować tym samym kilka propozycji. Nie jest pewnie zaskoczeniem, dlaczego nasze zapytanie zostało napisane w języku angielskim – program słabo radzi sobie z polskim tekstem.
Nasza propozycja padła na pandę, która wraz z noworocznymi postanowieniami postanawia wziąć się za siebie i zacząć trenować. Tak samo jak z postanowieniami noworocznymi i w tym przypadku coś nie do końca wyszło, tak jak powinno. Poprosiliśmy o wygenerowanie pandy ćwiczącej jogę na siłowni. Czy otrzymaliśmy to co chcieliśmy? Tak. Czy jesteśmy zadowolenie? No już mniej. Czwarta propozycja nawiązuje najbardziej do naszego zapytania. Możemy rozpoznać, że jest to siłownia (albo sala gimnastyczna w szkole). Panda wygląda przyzwoicie z zachowaniem proporcji i dobrymi detalami twarzy. Propozycję pierwszą, drugą i trzecią pozostawimy do waszej opinii, czy wygląda ona zachęcająco dla odbiorcy, czy raczej jak antyreklama zajęć z jogi?
Poprzednie propozycje tekstów były abstrakcjami, które miały posłużyć nam na sprawdzenie możliwości programu. Ostatnia próba natomiast odnosi się do sytuacji z życia każdego marketera. Piszemy wpis na nasze social media, bądź blog i potrzebujemy dodać przyciągającą oko grafikę. Jak poradzi sobie z takim zadaniem DALL-E 2?
Zamiast korzystać ze zdjęć stockowych, postanawiamy, aby to sztuczna inteligencja wygenerowała nam naszą grafikę. Tutaj również mamy mieszane uczucia co do efektu finalnego. Na grafikach można zauważyć deformacje twarzy oraz ciała naszych wygenerowanych modeli. Uważamy jednak, że ta próba wypadła najlepiej i otrzymane grafiki prezentują początkowy zamysł zdjęcia. Nie zmienia to faktu, że najlepiej nie znaczy w tym przypadku dobrze, względem użycia tych zdjęć w projekcie marketingowym. Lepsze i ciekawsze zdjęcia możemy znaleźć w ogólnodostępnych bankach zdjęć.
Czy sztuczna inteligencja zastąpi grafika?
Program DALL-E 2 może tworzyć własne grafiki na podstawie danych, takich jak zdjęcia, obrazy i modele, które zostały wcześniej zaprezentowane mu jako przykłady. W miarę uczenia się program może rozpoznawać i replikować style, kolory i inne cechy charakterystyczne tych obrazów. Jednak warto pamiętać, że programy takie jak DALL-E 2 nie są w stanie tworzyć oryginalnych i unikalnych projektów z pełnym zrozumieniem kreatywnych intencji i procesów twórczych, które stoją za pracą grafika. DALL-E 2 to bez wątpienia potężne narzędzie, które pozwala na generowanie grafik. Jest ono na razie w fazie Beta, dlatego zawiera na tym etapie jeszcze wiele błędów i niedociągnięć.
Podsumowując, choć sztuczna inteligencja i uczenie maszynowe mogą pomagać w automatyzacji niektórych aspektów pracy grafika, to jednak na razie nie są w stanie zastąpić kreatywności i umiejętności grafików. Graficy nadal odgrywają kluczową rolę w tworzeniu oryginalnej i wysokiej jakości treści wizualnej, a sztuczna inteligencja i uczenie maszynowe będą bardziej wspierać ich pracę, niż ją zastępować.