Na początku marca wiele osób musiało przecierać oczy ze zdumienia, widząc nagranie, na którym ukraiński prezydent Wołodymyr Zełenski wzywa swoich żołnierzy do złożenia broni. Słowa wypowiadane na nagraniu stały w tak dużej sprzeczności z tym, co dotychczas prezentował przywódca Ukrainy, że od razu wydało się to podejrzane. Po pierwszym szoku można było zauważyć niedoróbki świadczące o tym, że nagranie jest zmanipulowane.
Prowokacja nie odniosła skutku, była mało wiarygodna i niedoskonała. Jest to jednak zwiastun tego, co czeka nas w niedalekiej przyszłości – kiedy to, co widzimy, wcale nie będzie musiało być tym, czym się wydaje. Sztuczna inteligencja pozwalająca tworzyć deepfaki (czyli głębokie fałszerstwo) otwiera nowe możliwości w wojnie informacyjnej i jest wyzwaniem dla naszego systemu prawnego.
Czytaj więcej
Choć sztuczna inteligencja jest już w użyciu w brytyjskim wymiarze sprawiedliwości, jesteśmy daleko od przyzwolenia na jej używanie w skomplikowanych sprawach karnych czy rodzinnych – mówi Christina Blacklaws, brytyjska adwokatka, mediatorka i konsultantka biznesowa w rozmowie z Pawłem Rochowiczem.
Nowy rodzaj broni
W czasie wojny odpowiednie słowa stają się bronią. Mogą zagrzewać do walki własnych żołnierzy lub skutecznie osłabić morale przeciwnika. Nie jest jednak obojętne z czyich ust padają. Jedno słowo charyzmatycznego politycznego przywódcy może wojnę wywołać albo ją zakończyć. Nowa technologia sprawia jednak, że nie możemy już być pewni, do kogo w rzeczywistości wypowiadane słowa należą i to nawet wtedy, kiedy widzimy i słyszymy osobę, która je wypowiada.
Z technicznego punktu widzenia stworzenie wiarygodnego deepfake’a to rozwiązanie dwóch problemów. Pierwszym, jest odpowiednie wygenerowanie dźwięku, odzwierciedlającego barwę, tempo i wysokość głosu. Innymi słowy wszystkie charakterystyczne cechy wyróżniające głos i sposób mówienia „dawcy”. Drugim wyzwaniem jest stworzenie obrazu, który z tym dźwiękiem współgra. W obu tych przypadkach doskonale sprawdzają się rozwiązania oparte na głębokich sieciach neuronowych. Obecnie istnieją algorytmy na tyle efektywne, by w czasie rzeczywistym przetwarzać głos przesyłany w rozmowie telefonicznej.