Michał Szułdrzyński: Na zdjęciu Trump czy niby-Trump? Czego nie da nam AI

Co jest nie tak z obrazami, które tworzy sztuczna inteligencja?

Publikacja: 05.05.2023 17:00

Michał Szułdrzyński: Na zdjęciu Trump czy niby-Trump? Czego nie da nam AI

Foto: Adobe Stock

Jest coś głęboko niepokojącego w obrazach i filmach generowanych przez programy sztucznej inteligencji. Trochę dlatego, że we wcześniejszych wersjach ludzie mieli po trzy ręce albo trzy nogi, trzy albo sześć palców. I dopiero potem w ramach ćwiczeń i szkolenia algorytmów po prostu wpisano do bardziej zaawansowanych modeli, że jeśli ktoś prosi o obraz człowieka, to ten powinien mieć dwie ręce, dwie nogi i po pięć palców w każdej ręce. Najwyraźniej więc sam algorytm na to nie wpadł. Dla niego co innego było cechą konstytutywną dla istoty ludzkiej. Dopiero należało mu ową liczbę rąk czy palców przy kolejnej aktualizacji wprost wpisać, by nie popełniał dalej błędu.

Filmy czy zdjęcia od AI nadal są jednak niepokojące. Reklama pizzy, film zamówiony przez republikanów, by uderzyć w Joe Bidena, gdy ogłosił, że będzie się starał o reelekcję, czy trailer filmu „The Great Catspy” – jest w nich coś zastanawiającego. Z jednej strony dosłowność, a z drugiej przeciwnie, dziwna umowność.

Czytaj więcej

Michał Szułdrzyński: Wulgarny język to wulgarne myślenie i wrażliwość

Wiem, że opisywanie w felietonach własnych snów jest przedsięwzięciem bardzo ryzykownym, ale wspomnę tu, jak kilka dni temu obudziłem się przerażony po tym, gdy przyśnił mi się udział w rodzinnej uroczystości. Gospodarze siedzieli w oświetlonej części pokoju, ja z żoną i dziećmi w cieniu. Wiedziałem, że to moje dzieci, bo zgadzała się liczba blond głów, postaci. Ale gdy zacząłem się im przyglądać, żadne z nich nie było sobą. Była to mieszanina różnych cech pasujących do moich dzieci, ale żadne z nich nie wyglądało tak jak w rzeczywistości. Po przebudzeniu czułem się dokładnie tak samo jak po obejrzeniu filmów generowanych przez sztuczną inteligencję.

Filmy czy zdjęcia od AI nadal są jednak niepokojące. Reklama pizzy, film zamówiony przez republikanów, by uderzyć w Joe Bidena, gdy ogłosił, że będzie się starał o reelekcję, czy trailer filmu „The Great Catspy” – jest w nich coś zastanawiającego. 

Bo chyba to jest właśnie istota niepokojącego wrażenia, jakie u mnie wywołują. Jeśli poprosimy o stworzenie obrazu osoby, której tysiące czy nawet miliony zdjęć można znaleźć w sieci, nakarmiony nimi algorytm dość łatwo potrafi odtworzyć rysy. Ale gdy odnosi się do postaci, których zdjęć jest mało lub nie ma ich w ogóle, wtedy to, co zaczyna tworzyć, jest, no właśnie, dziwne.

Dochodzimy tu zresztą do pewnego filozoficznego problemu rodem z filozofii Platona. Ten grecki filozof uważał, że świat, który widzimy, przypomina teatr cieni. Rzeczy są tylko cieniami idei, dla uproszczenia można by je nazwać rzeczami samymi w sobie. Te dobre są cieniem idei dobra, woda to cień idei wody jako takiej itd.

Wydaje się, że sztuczna inteligencja, która przegląda zasoby archiwalne zdjęć i obrazów, tworzy sobie właśnie takie idee. Idea człowieka, idea dziecka, idea Donalda Trumpa, czyli zestawu cech, które sprawią, że jeśli poprosimy, by AI wygenerowała obraz człowieka, dziecka czy Trumpa, dostaniemy obraz w jakiejś mierze przypominający to, o co prosiliśmy. W jakiś sposób przypominający… ale nie tożsamy.

Czytaj więcej

Michał Szułdrzyński: AI – między panem a niewolnikiem

Może bowiem sztuczna inteligencja nie ma świadomości, ale najwyraźniej tworzy sobie pewne algorytmiczne ciągi, którymi opisuje oglądaną przez siebie „rzeczywistość”. I później, generując obrazy, trzyma się tych algorytmicznych ciągów, których nauczyła się, przeglądając wcześniej miliony zdjęć. Obrazy, które tworzy, są zgodne z tym, co uznała za ideę człowieka, dziecka czy Trumpa. A nie z rzeczywistym, konkretnym Trumpem. Bo nie odnosi się do rzeczywistości, lecz do milionów przejrzanych obrazów.

Czy to tylko kwestia niedoskonałości systemu, czy też rodzaj prześwitu, w którym widzimy, że sztuczna inteligencja myśli lub procesuje dane zupełnie inaczej niż człowiek i jego ludzki umysł? To ta odmienność na razie niepokoi.

Jest coś głęboko niepokojącego w obrazach i filmach generowanych przez programy sztucznej inteligencji. Trochę dlatego, że we wcześniejszych wersjach ludzie mieli po trzy ręce albo trzy nogi, trzy albo sześć palców. I dopiero potem w ramach ćwiczeń i szkolenia algorytmów po prostu wpisano do bardziej zaawansowanych modeli, że jeśli ktoś prosi o obraz człowieka, to ten powinien mieć dwie ręce, dwie nogi i po pięć palców w każdej ręce. Najwyraźniej więc sam algorytm na to nie wpadł. Dla niego co innego było cechą konstytutywną dla istoty ludzkiej. Dopiero należało mu ową liczbę rąk czy palców przy kolejnej aktualizacji wprost wpisać, by nie popełniał dalej błędu.

Pozostało 83% artykułu
Plus Minus
Trwa powódź. A gdzie jest prezydent Andrzej Duda?
Plus Minus
Liga mistrzów zarabiania
Plus Minus
Jack Lohman: W muzeum modlono się przed ołtarzem
Plus Minus
Irena Lasota: Nokaut koni
Materiał Promocyjny
Wpływ amerykańskich firm na rozwój polskiej gospodarki
Plus Minus
Mariusz Cieślik: Wszyscy jesteśmy wyjątkowi