Sa sve bržim i bržim razvojem tehnologija, tako se sve više i brže i brže razvijaju alati koji su u stanju manipulirati javnim mišljenjem i općenito percepcijama pojedinaca. Razvitkom algoritma strojnog učenja, prikupljanjem sve većeg broja podataka rastu i mogućnosti samog AI-ja.
Unutar ovog seminara ću se baviti metodama kojima algoritami nastoje detektirati DeepFake videozapise.
Deepfakes (a portmanteau of “deep learning” and “fake”) are synthetic media in which a person in an existing image or video is replaced with someone else's likeness. [1]
U isto vrijeme zgražajuća i informativna informacija je ta da je sam naziv ove tehnolgoije “DeepFake” nastala na Redditu na temelju korisničkog imena (istoimenog naziva) koji je objavljivao pornografski sadržaj s DeefFake tehnologijom.
Najprije ću definirati neke od izazova koji su prepoznati pirlikom detekcije DeepFake videa kako bi mogli u skladu s definiranim problemima vidjeti koje su potencijalne mane na temelju kojih se mogu otkriti manipulacije. [2]
Glavna nit vodilja kod svih detekcijskih algoritama je uočiti nekakve mane i šumove u podacima za koje pretpostavljamo da se tamo u stvarnim podacima ne bi trebale nalaziti. Isto vrijedi i za detekciju DeepFake videozapisa, nastoji se uočiti neke nepravilnosti na licima, bilo da se radi o čudnom osvjetljenju, čudnim grimasama i sl.
U literaturi [2] postoje tri glavne podjele metoda na temelju kojih se vrše detekcije:
Prije nego što nastavite s tekstom, možete se okušati u testu, pa vidite prepoznajete li Vi kao osoba dobro DeepFake uradke.
Prvo se nalazi kviz u kojem postoje računalno generirana lica i ona prava: https://www.buzzfeednews.com/article/janelytvynenko/real-or-fake-face-quiz
Ovdje se nalazi nekoliko videa na kojima možete pokušati detektirati legitimnost: https://www.abc.net.au/news/2018-09-27/fake-news-part-one/10308638?nw=0&r=HtmlFragment
Ako netko odluči se upustiti u kreiranje modela koji bi detektirao lažne videozapise postoji lista smjernica [4]:
Sada ponovno možete pokušati odigrati kviz prije ovih pitanja i vidjeti jeste li bolje uočili dijelove na koje je potrebno obratiti pažnju.
Neki od najpoznatijih algoritama za detekciju su [3]:
U točkama ispod su navedeni neki algoritmi s dodatnim pojašnjenjem, a neki ne. Razlog toga je da se algoritmi koji nisu dodatno pojašnjeni često izvedeni u arhitekturama dubokih mreža koje je jako teško objasniti (black box).
U odjeljku Izazovi je bilo riječ o tome kako s boljim skupom podataka veća je vjerojatnost generiranja dobrih rezultata. Stoga postoji jedan ogroman problem koji će u budućnosti biti zasigurno sve zastupljeniji prilikom detekcije, a to je kreiranje sve boljih i boljih skupova podataka. Na taj problem i ozbiljne posljedice je ukazao jedan rad koji je na temelju iznimno kvalitetnog dataseta Cabel DF (slike u datasetu su iznimno kvalitetno napravljene s visokom rezolucijom) nastojao testirati performanse algoritama za detekciju.
Razultati [3] su navedeni u slijedećem grafu:
Na slici iznad je vidljivo kako za skup podataka s najboljom kvalitetom slika Caleb-DF su najgori rezultati za sve algoritme.
Brojevi koji se pojavljuju na x-osi su AUC engl. Area under the curve brojevi pri čemu brojka od 1 znači savršen rezultat
Točnost algoritama nad različitim datasetovima je prikazana na slici ispod [2]. Ona pokazuje kako dominiraju DSP-FWA, Xception pa FWA. Potrebno je podsjetiti se kako upravo FWA koristi defekte na licima poput rastezanja, nepravilog popunjavanja i sl.
DeepFake videozapisi donose veliki rizik, pogotovo ako dođu u krive ruke. S porastom skupova podataka koji postaju sve kvalitetniji i kvalitetniji sve je lakše zavarati ljudsko oko, a tako i “računalno oko” te je postupak detekcije sve kompleksniji problem.
Postoji puno modela koji nastoje detektirati anomalije u zapisima no njihova točnost uvelike ovisi o tome što je algoritam prije vidio, problem je ako algoritam nešto prije nije vidio.
Psotoje problemi (pogotovo na društvenim mrežama) kada algoritmi za detekciju lažno označe sadržaj kao lažan iako on nije manipuliran DeepFake postupcima.
Svakako je potrebno s razvojem DeepFake modela razvijati i što bolje algoritme i postupke za njihvu detekciju.
[2] DEEPFAKE DETECTION: CURRENT CHALLENGES AND NEXT STEPS - Siwei Lyu
[3] Celeb-DF: A Large-scale Challenging Dataset for DeepFake Forensics - Yuezun Li, Xin Yang, Pu Sun, Honggang Qi and Siwei Lyu
[4] Detect DeepFakes: How to counteract misinformation created by AI
[5] kviz
[6] kviz 2