Starije izmjene na obje strane
Starija izmjena
Novija izmjena
|
Starija izmjena
|
racfor_wiki:fingerprinting [2021/01/15 21:35] dkeca [Uvod] |
racfor_wiki:fingerprinting [2023/06/19 18:17] (trenutno) |
Ključne riječi: fingerprinting; otisak; //acoustic//; video; //browser//; //Shazam//; jedinstvenost; identifikacija | Ključne riječi: fingerprinting; otisak; //acoustic//; video; //browser//; //Shazam//; jedinstvenost; identifikacija |
===== Uvod ===== | ===== Uvod ===== |
Otisak prsta (eng. //fingerpint//) je trag koji zbog svoje strukture, sile trenja i pritiska na površinu ostavljaju ljudski prsti. Za jednog čovjeka otisak predstavlja jedinstvenu oznaku prilikom identifikacije. Upravo zbog svoje jedinstvenosti, otisci imaju veliku važnost i primjene u forenzici. Kako čovjeku jedinstvenu oznaku daje otisak prsta, tako u računarstvu susrećemo niz algoritama koji veliku količinu podataka preslikavaju u manji tekstualni zapis specifičan za svaku datoteku. Ti algoritmi izvorno se nazivaju //fingerprinting algorithms// (algoritmi otiska prsta) i razlikuju se ovisno o tipu podataka. Tako će se na audio zapisima primijeniti //acoustic fingerprint// postupci, za video podatke koristit će se //digial video fingerprint//, a za ostale datoteke digitalnog sadržaja upotrijebit će se neka općenita //digital fingerpirnt// tehnika. Najčešći razlog kreiranja i korištenja otiska datoteke uklanjanje je nepotrebnih kopija i ponovljivosti u podacima. Kako je za identifikaciju datoteke potreban samo njezin otisak, usporedbe i prijenos velikih količina podataka može se implementirati puno jednostavnije i brže. Osim toga, za računalnu je forenziku izrazito važna usporedba otisaka kojom se može potvrditi izmjena i ukazati na trenutke pojedinih modifikacija datoteka.\\ | Otisak prsta (eng. //fingerpint//) je trag koji zbog svoje strukture, sile trenja i pritiska na površinu ostavljaju ljudski prsti. Za jednog čovjeka otisak predstavlja jedinstvenu oznaku prilikom identifikacije. Upravo zbog svoje jedinstvenosti, otisci imaju veliku važnost i primjene u forenzici. Kako čovjeku jedinstvenu oznaku daje otisak prsta, tako u računarstvu susrećemo niz algoritama koji veliku količinu podataka preslikavaju u manji tekstualni zapis specifičan za svaku datoteku. Ti algoritmi izvorno se nazivaju //fingerprinting algorithms// (algoritmi otiska prsta) i razlikuju se ovisno o tipu podataka. Tako će se na audio zapisima primijeniti //acoustic fingerprint// postupci, za video podatke koristit će se //digial video fingerprint//, a za ostale datoteke digitalnog sadržaja upotrijebit će se neka općenita //digital fingerpirnt// tehnika. Najčešći razlog kreiranja i korištenja otiska datoteke uklanjanje je nepotrebnih kopija i ponovljivosti u podacima. Kako je za identifikaciju datoteke potreban samo njezin otisak, usporedbe i prijenos velikih količina podataka može se implementirati puno jednostavnije i brže. Osim toga, za računalnu je forenziku izrazito važna usporedba otisaka kojom se može potvrditi izmjena i ukazati na trenutke pojedinih modifikacija datoteka.<sup>[1]</sup>\\ |
Glavna značajka digitalnog otiska je njegova jedinstvenost, tj. sa velikom sigurnošću treba osigurati da nema preklapanja otisaka bilo koje dvije različite datoteke. Poželjno je da vjerojatnost poklapanja otisaka dva različita izvora bude manja od 10<sup>-20</sup>. Kako povećavamo broj bita potrebnih za prikaz otisaka, tako se vjerojatnost preklapanja smanjuje. Za usporedbu, vjerojatnost da čovjeka pogodi grom (približno 10<sup>-6</sup>) ili da strada u napadu morskog psa (približno 10<sup>-9</sup>) puno su manje od kolizije dva otiska. Te vjerojatnosti su na razini uništenja nekog sustava od pada meteora (približno 10<sup>-28</sup>).\\ | Glavna značajka digitalnog otiska je njegova jedinstvenost, tj. sa velikom sigurnošću treba osigurati da nema preklapanja otisaka bilo koje dvije različite datoteke. Poželjno je da vjerojatnost poklapanja otisaka dva različita izvora bude manja od 10<sup>-20</sup>. Kako povećavamo broj bita potrebnih za prikaz otisaka, tako se vjerojatnost preklapanja smanjuje. Za usporedbu, vjerojatnost da čovjeka pogodi grom (približno 10<sup>-6</sup>) ili da strada u napadu morskog psa (približno 10<sup>-9</sup>) puno su manje od kolizije dva otiska. Te vjerojatnosti su na razini uništenja nekog sustava od pada meteora (približno 10<sup>-28</sup>).\\ |
U većim arhivama ili skupovima podataka često dolazi do povezivanja ili spajanja datoteka, stoga je poželjno da se digitalni otisak može lagano izvesti iz kombinacije otisaka pojedinačnih datoteka. To je drugo važno svojstvo digitalnih otisaka.<sup>[ [[syntax#literatura|3]] ]</sup> | U većim arhivama ili skupovima podataka često dolazi do povezivanja ili spajanja datoteka, stoga je poželjno da se digitalni otisak može lagano izvesti iz kombinacije otisaka pojedinačnih datoteka. To je drugo važno svojstvo digitalnih otisaka.<sup>[4]</sup> |
| |
===== Algoritmi preslikavanja ===== | ===== Algoritmi preslikavanja ===== |
[[wp>Michael O. Rabin]] kreirao je ideju za implementiranje digitalnih otisaka korištenjem polinoma koji se preslikavaju preko konačnog broja elemenata. Otisak je rezultat dijeljenja dva polinoma. Vjerojatnost da dva niza, //a// i //b//, rezultiraju istim otiskom duljine //w// bita ne prelazi max(|a|, |b|)/2<sup>w-1</sup>. Gdje su |a| i |b| duljine nizova. Problem je što ova metoda nije sigurna protiv napada: uz poznati ključ, lagano se može mijenjati sadržaj datoteke a da se pritom ne mijenja njezin otisak. | [[wp>Michael O. Rabin]] kreirao je ideju za implementiranje digitalnih otisaka korištenjem polinoma koji se preslikavaju preko konačnog broja elemenata. Otisak je rezultat dijeljenja dva polinoma. Vjerojatnost da dva niza, //a// i //b//, rezultiraju istim otiskom duljine //w// bita ne prelazi max(|a|, |b|)/2<sup>w-1</sup>. Gdje su |a| i |b| duljine nizova. Problem je što ova metoda nije sigurna protiv napada: uz poznati ključ, lagano se može mijenjati sadržaj datoteke a da se pritom ne mijenja njezin otisak.<sup>[2]</sup> |
Brojne aplikacije koriste ovaj algoritam i ideju za usporedbu nizova pod nazivom [[wp>Rabin–Karp algorithm]]. Za implementaciju se koristi pomični //hash// prozor. Prednost prema drugim funkcijama mapiranja je mogućnost izračuna otiska jednog bloka korištenjem izračunatog otiska drugog bloka ako se ta dva bloka preklapaju.\\ | Brojne aplikacije koriste ovaj algoritam i ideju za usporedbu nizova pod nazivom [[wp>Rabin–Karp algorithm]]. Za implementaciju se koristi pomični //hash// prozor. Prednost prema drugim funkcijama mapiranja je mogućnost izračuna otiska jednog bloka korištenjem izračunatog otiska drugog bloka ako se ta dva bloka preklapaju.\\ |
Osim Rabinovog algoritma koriste se i kriptografske funkcije mapiranja za stvaranje otisaka. Veliki podaci pretvaraju se u manje zapise. Postupak određivanja otiska bez ključa zahtijevao bi //brute force// pretraživanje. Svojstva koja moraju vrijediti prilikom svakog preslikavanja ovim postupkom su: ista datoteka uvijek rezultira istim preslikavanjem, preslikana vrijednost brzo se može odredi, postupak je ireverzibilan i preslikavanje je jedinstveno. Osim toga, preslikana vrijednost dodijeljena izmijenjenoj datoteci nepovezana je s veličinom promjene datoteke. Sporije su od Rabinovog algoritma. | Osim Rabinovog algoritma koriste se i kriptografske funkcije mapiranja za stvaranje otisaka. Veliki podaci pretvaraju se u manje zapise. Postupak određivanja otiska bez ključa zahtijevao bi //brute force// pretraživanje. Svojstva koja moraju vrijediti prilikom svakog preslikavanja ovim postupkom su: ista datoteka uvijek rezultira istim preslikavanjem, preslikana vrijednost brzo se može odredi, postupak je ireverzibilan i preslikavanje je jedinstveno. Osim toga, preslikana vrijednost dodijeljena izmijenjenoj datoteci nepovezana je s veličinom promjene datoteke. Sporije su od Rabinovog algoritma.<sup>[3]</sup> |
| |
===== Acoustic fingerprinting ===== | ===== Acoustic fingerprinting ===== |
//Acoustic fingerprint// digitalni je otisak generiran iz audio signala. Otisak je kreiran deterministički i može se koristiti u identifikaciji sličnih značajki u audio bazi podataka. Praktična uporaba akustičnog otiska prisutna je u prepoznavanju pjesama, melodija, reklama, zvučnih efekata, itd. Mogu se pratiti podaci sa radija, CD-a, mrežnog prometa i glazbenih albuma.\\ | //Acoustic fingerprint// digitalni je otisak generiran iz audio signala. Otisak je kreiran deterministički i može se koristiti u identifikaciji sličnih značajki u audio bazi podataka. Praktična uporaba akustičnog otiska prisutna je u prepoznavanju pjesama, melodija, reklama, zvučnih efekata, itd. Mogu se pratiti podaci sa radija, CD-a, mrežnog prometa i glazbenih albuma.\\ |
Ukoliko dva audio signala jako slično zvuče, njihov otisci bi trebali biti isti. Drugim riječima, dva zvuka su slična ukoliko su signali koji ih opisuju slični. Zvuk do mikrofona ili uha putuje kroz neki medij, npr. vodu ili zrak, a da bi se mogao obrađivati i analizirati, potrebno ga je u računalu pretvoriti u diskretni signal postupkom uzorkovanja. Postoji niz značajki koje se koriste u kreiranju otiska promatranjem tako dobivenog signala. U nastavku su nabrojane neke najpopularnije.\\ | Ukoliko dva audio signala jako slično zvuče, njihov otisci bi trebali biti isti. Drugim riječima, dva zvuka su slična ukoliko su signali koji ih opisuju slični. Zvuk do mikrofona ili uha putuje kroz neki medij, npr. vodu ili zrak, a da bi se mogao obrađivati i analizirati, potrebno ga je u računalu pretvoriti u diskretni signal postupkom uzorkovanja. Postoji niz značajki koje se koriste u kreiranju otiska promatranjem tako dobivenog signala. U nastavku su nabrojane neke najpopularnije.<sup>[8]</sup>\\ |
* //Zero crossing rate// praćenje je kako signal, prikazan kao funkcija u vremenu, mijenja predznak (pozitivno-negativno/negativno-pozitivno). Oznake se postavljaju na mjestima promijene. | * //Zero crossing rate// praćenje je kako signal, prikazan kao funkcija u vremenu, mijenja predznak (pozitivno-negativno/negativno-pozitivno). Oznake se postavljaju na mjestima promijene. |
* Estimacija tempa brzina je ili korak pojedine skladbe mjerena u jedinici otkucaja u minuti (eng. //bits per minute (bpm)//) | * Estimacija tempa brzina je ili korak pojedine skladbe mjerena u jedinici otkucaja u minuti (eng. //bits per minute (bpm)//) |
Postupci i algoritmi mogu se kombinirati i povezivati, ali u jednom trenutku signal će se sigurno pretvoriti u spektralnu domenu gdje će se iz odnosa pojedinih frekvencijskih komponenti generirati otisak. Dosta popularna metoda za kreiranje jedinstvenog potpisa audio signala je korištenje spektrograma, tj. prikaz frekvencijskog spektra signala i njegove promijene u vremenu. Rezultat je graf u kojem je prikazan vremensko/frekvencijski odnos amplituda (intenziteta signala). Slika u nastavku prikazuje 2D i 3D spektrogram audio isječka iz snimke gitare korištene na laboratorijskim vježbama predmeta [[https://www.fer.unizg.hr/predmet/nmdos_a|Napredne metode digitalne obrade signala]] na [[https://www.fer.unizg.hr|FER-u]]. | Postupci i algoritmi mogu se kombinirati i povezivati, ali u jednom trenutku signal će se sigurno pretvoriti u spektralnu domenu gdje će se iz odnosa pojedinih frekvencijskih komponenti generirati otisak. Dosta popularna metoda za kreiranje jedinstvenog potpisa audio signala je korištenje spektrograma, tj. prikaz frekvencijskog spektra signala i njegove promijene u vremenu. Rezultat je graf u kojem je prikazan vremensko/frekvencijski odnos amplituda (intenziteta signala). Slika u nastavku prikazuje 2D i 3D spektrogram audio isječka iz snimke gitare korištene na laboratorijskim vježbama predmeta [[https://www.fer.unizg.hr/predmet/nmdos_a|Napredne metode digitalne obrade signala]] na [[https://www.fer.unizg.hr|FER-u]]. |
| |
| {{ :racfor_wiki:gitara.wav |Snimka gitare}} |
{{ :racfor_wiki:racfor_wiki:spectrogram.jpg?700 |Spektrogram snimke gitare}} | {{ :racfor_wiki:racfor_wiki:spectrogram.jpg?700 |Spektrogram snimke gitare}} |
| |
Za proučavanje karakteristika audio signala nije potreban cijeli spektar. Niske harmonike obilježuje pozadinska buka i šum, npr. let aviona u prolazu, a visoki harmonici značajni su za zvukovni doživljaj, ne toliko bitan za prepoznavanje i izvlačenje značajki iz spektra. Prema tome, signali se propuštaju kroz pojasni propust odbacujući visoke i niske frekvencije. Pojas koji ostaje otprilike je u intervalu: [300, 2000] Hz. Prilikom mapiranja vrhova može se koristiti Locality Sensitive Hashing algoritam čija je glavna ideja da se bliske točke koje se ne razlikuju previše mapiraju u istu lokaciju. | Za proučavanje karakteristika audio signala nije potreban cijeli spektar. Niske harmonike obilježuje pozadinska buka i šum, npr. let aviona u prolazu, a visoki harmonici značajni su za zvukovni doživljaj, ne toliko bitan za prepoznavanje i izvlačenje značajki iz spektra. Prema tome, signali se propuštaju kroz pojasni propust odbacujući visoke i niske frekvencije. Pojas koji ostaje otprilike je u intervalu: [300, 2000] Hz. Prilikom mapiranja vrhova može se koristiti [[wp>Locality-sensitive hashing]] algoritam čija je glavna ideja da se bliske točke koje se ne razlikuju previše mapiraju u istu lokaciju. |
Cilj je da i nakon što audio signali prođu kroz određene postupke i korake kompresije, podaci budu i dalje prepoznatljivi i da se može prepoznati originalni zapis. | Cilj je da i nakon što audio signali prođu kroz određene postupke i korake kompresije, podaci budu i dalje prepoznatljivi i da se može prepoznati originalni zapis. |
Brojne aplikacije na mobilnim uređajima implementiraju postupak pretraživanja po zvuku, tj. na dani audio signal daju povratnu informaciju o sadržaju i identificiraju signal. Postupak se dijeli u nekoliko koraka: mikrofonom na uređaju snima se audio signal, kreira se reprezentativan uzorak iz pjesme ili melodije te se provjerava njegovo postojanje u bazi pjesama/biblioteci. Ukoliko je signal prepoznat, korisniku se prikazuju informacije. Uspješne aplikacije su [[wp>Shazam]], [[wp>SoundHound]] i [[wp>ACRCloud]]. Neke aplikacije omogućuju prihvaćenje korisnički generiranih zvukova i audio signala (npr. osoba pjeva neku pjesmu) i na temelju njih vraćaju popis najsličnijih originalnih pjesama. | Brojne aplikacije na mobilnim uređajima implementiraju postupak pretraživanja po zvuku, tj. na dani audio signal daju povratnu informaciju o sadržaju i identificiraju signal. Postupak se dijeli u nekoliko koraka: mikrofonom na uređaju snima se audio signal, kreira se reprezentativan uzorak iz pjesme ili melodije te se provjerava njegovo postojanje u bazi pjesama/biblioteci. Ukoliko je signal prepoznat, korisniku se prikazuju informacije. Uspješne aplikacije su [[wp>Shazam]], [[wp>SoundHound]] i [[wp>ACRCloud]]. Neke aplikacije omogućuju prihvaćenje korisnički generiranih zvukova i audio signala (npr. osoba pjeva neku pjesmu) i na temelju njih vraćaju popis najsličnijih originalnih pjesama.<sup>[8]</sup> |
| |
==== Shazam ==== | ==== Shazam ==== |
Snimanjem 20 sekundi bilo kojeg dijela pjesme, aplikacija //Shazam// stvara otisak, provjerava bazu i na temelju algoritma prepoznavanja vraća točne podatke o pjesmi koja se snimila. Kontinuirani val zvuka snima se mikrofonom u analogni oblik. Za daljnju obradu provodi se diskretizacija i računa spektar signala. Za transformaciju iz vremenske u frekvencijsku domenu koristi se diskretna Fourierova transformacija ([[wp>Discrete Fourier transform|Discrete Fourier transform (DFT)]]), implementiranjem brzog i učinkovitog algoritma [[wp>Fast Fourier transform|Fast Fourier transform (FFT)]]. Promatranjem spektra, lagano je filtrirati nepotrebne frekvencije i zaključivati koje su komponente prisutne a koje nisu. Osim toga, potrebno je odlučiti koje su komponente bitne za stvaranje otiska i kojim kriterijem će se one birati. Iznos amplitude pojedine frekvencijske komponente odabire se kao metoda odabira. Kako u samo jednoj pjesmi mogu postojati i visoke i niske frekvencije izražajne amplitude, frekvencijski raspon se dijeli na manje intervale prema važnosti glazbenih komponenti. Svaki se interval analizira zasebno i neovisno od drugih intervala. Slijedi detekcija, izvlačenje i zapisivanje podataka o frekvencijama najvećih amplituda. Ti zapisi su oznaka za taj dio pjesme i predstavljat će jedan dio u cijelom otisku audio signala. | Snimanjem 20 sekundi bilo kojeg dijela pjesme, aplikacija //Shazam// stvara otisak, provjerava bazu i na temelju algoritma prepoznavanja vraća točne podatke o pjesmi koja se snimila. Kontinuirani val zvuka snima se mikrofonom u analogni oblik. Za daljnju obradu provodi se diskretizacija i računa spektar signala. Za transformaciju iz vremenske u frekvencijsku domenu koristi se diskretna Fourierova transformacija ([[wp>Discrete Fourier transform|Discrete Fourier transform (DFT)]]), implementiranjem brzog i učinkovitog algoritma [[wp>Fast Fourier transform|Fast Fourier transform (FFT)]]. Promatranjem spektra, lagano je filtrirati nepotrebne frekvencije i zaključivati koje su komponente prisutne a koje nisu. Osim toga, potrebno je odlučiti koje su komponente bitne za stvaranje otiska i kojim kriterijem će se one birati. Iznos amplitude pojedine frekvencijske komponente odabire se kao metoda odabira. Kako u samo jednoj pjesmi mogu postojati i visoke i niske frekvencije izražajne amplitude, frekvencijski raspon se dijeli na manje intervale prema važnosti glazbenih komponenti. Svaki se interval analizira zasebno i neovisno od drugih intervala. Slijedi detekcija, izvlačenje i zapisivanje podataka o frekvencijama najvećih amplituda. Ti zapisi su oznaka za taj dio pjesme i predstavljat će jedan dio u cijelom otisku audio signala. |
Danas postoji veliki broj pjesama i glazbenih djela, a neka od njih nastala su samo manjim izmjenama ili posudbama iz već postojećih pjesama ili njihovih dijelova. Posljedično, čest je slučaj da će prilikom mapiranja iz frekvencijskog spektra doći do poklapanja identifikacije s više pjesama. Samo promatranje frekvencijskog spektra nije dovoljno za sužavanje izbora. Prema tome, uz spektar, promatra se i relativni vremenski odnos uzoraka i rezultata mapiranja. Snimljeni signal nikada neće biti savršen i neće se u potpunosti (bez greške) poklapati s otiscima u bazi. Iz toga razloga, sve pjesme s kojima je došlo do podudaranja, sortiraju se prema vjerojatnosti, a aplikacija vrati onu pjesmu koja je prva na sortiranoj listi prijedloga.\\ | Danas postoji veliki broj pjesama i glazbenih djela, a neka od njih nastala su samo manjim izmjenama ili posudbama iz već postojećih pjesama ili njihovih dijelova. Posljedično, čest je slučaj da će prilikom mapiranja iz frekvencijskog spektra doći do poklapanja identifikacije s više pjesama. Samo promatranje frekvencijskog spektra nije dovoljno za sužavanje izbora. Prema tome, uz spektar, promatra se i relativni vremenski odnos uzoraka i rezultata mapiranja. Snimljeni signal nikada neće biti savršen i neće se u potpunosti (bez greške) poklapati s otiscima u bazi. Iz toga razloga, sve pjesme s kojima je došlo do podudaranja, sortiraju se prema vjerojatnosti, a aplikacija vrati onu pjesmu koja je prva na sortiranoj listi prijedloga.<sup>[7]</sup>\\ |
Osim pjesama, //Shazam// može prepoznati i audio isječke iz video zapisa, kao što su televizijske serije i reklame. Manjim promjenama u načinu prikaza rezultata, ovim postupkom mogu se tražiti sličnosti u pjesmama ili čak plagijati.\\ | Osim pjesama, //Shazam// može prepoznati i audio isječke iz video zapisa, kao što su televizijske serije i reklame. Manjim promjenama u načinu prikaza rezultata, ovim postupkom mogu se tražiti sličnosti u pjesmama ili čak plagijati.\\ |
Slike u nastavku prikazuju neke od rezultata //Shazam// pretraživanja, a poveznice pokraj njih preusmjeruju na audio/video zapise. Mobilna aplikacija je prepoznala sljedeće: isječak iz kantate [[wp>Carmina Burana (Orff)|Carmina Burana]] skladatelja [[wp>Carl Orff|Carla Orffa]], pozadinsku skladbu iz reklame za grah [[wp>Heinz Baked Beans]], uvodnu pjesmu iz televizijske serije [[wp>Friends]] i pjesmu hrvatskog pop sastava [[wp>Magazin]]. Nakon puštanja audio zapisa, svi rezultati prepoznati su unutar dvije sekunde osim primjera s reklamom gdje je trebalo par sekundi dulje za dobivanje povratne informacije.\\ | Slike u nastavku prikazuju neke od rezultata //Shazam// pretraživanja, a poveznice pokraj njih preusmjeruju na audio/video zapise. Mobilna aplikacija je prepoznala sljedeće: isječak iz kantate [[wp>Carmina Burana (Orff)|Carmina Burana]] skladatelja [[wp>Carl Orff|Carla Orffa]], pozadinsku skladbu iz reklame za grah [[wp>Heinz Baked Beans]], uvodnu pjesmu iz televizijske serije [[wp>Friends]] i pjesmu hrvatskog pop sastava [[wp>Magazin]]. Nakon puštanja audio zapisa, svi rezultati prepoznati su unutar dvije sekunde osim primjera s reklamom gdje je trebalo par sekundi dulje za dobivanje povratne informacije.\\ |
| [[https://www.youtube.com/watch?v=9WoM2bHfr48&feature=youtu.be|Sons of war]] |{{:racfor_wiki:sons_of_war.png?150|Sons of war}}| [[https://www.youtube.com/watch?v=Xs-HbHCcK58|I'll Be There for You (Theme from "Friends')]] |{{:racfor_wiki:friends.png?150|I'll Be There for You (Friends)}}| | | [[https://www.youtube.com/watch?v=9WoM2bHfr48&feature=youtu.be|Sons of war]] |{{:racfor_wiki:sons_of_war.png?150|Sons of war}}| [[https://www.youtube.com/watch?v=Xs-HbHCcK58|I'll Be There for You (Theme from "Friends')]] |{{:racfor_wiki:friends.png?150|I'll Be There for You (Friends)}}| |
===== Digital video fingerprinting ===== | ===== Digital video fingerprinting ===== |
//Video fingerprinting// postupak je u kojem program iz ulaznog videa ili filma izvlači, prepoznaje i na kraju kombinira i grupira pojedine komponente u otisak. Kao što je slučaj i kod ljudskog otiska prsta te audio otiska, dodijeljena oznaka je jedinstvena jer se temelji na specifičnim optičkim značajkama videa i može poslužiti prilikom usporedbe digitalnih video sadržaja. Različite verzije istog video materijala imat će različite otiske pomoću kojih ih možemo klasificirati. Za razliku od postavljanja digitalnog vodenog žiga ( eng. //digital watermarking//), koji nakon postavljanja može identificirati kopije videa nastale tek nakon umetanja, referentni video otisak može se kreirati od bilo koje kopije ili verzije. Postupak kreiranja i korištenja sličan je onome akustičnog otiska.\\ | //Video fingerprinting// postupak je u kojem program iz ulaznog videa ili filma izvlači, prepoznaje i na kraju kombinira i grupira pojedine komponente u otisak. Kao što je slučaj i kod ljudskog otiska prsta te audio otiska, dodijeljena oznaka je jedinstvena jer se temelji na specifičnim optičkim značajkama videa i može poslužiti prilikom usporedbe digitalnih video sadržaja. Različite verzije istog video materijala imat će različite otiske pomoću kojih ih možemo klasificirati. Za razliku od postavljanja digitalnog vodenog žiga ( eng. //digital watermarking//), koji nakon postavljanja može identificirati kopije videa nastale tek nakon umetanja, referentni video otisak može se kreirati od bilo koje kopije ili verzije. Postupak kreiranja i korištenja sličan je onome akustičnog otiska.<sup>[9]</sup>\\ |
Primjena digitalnog video otiska prisutna je kod [[wp>Digital rights management|DRM-a]], i to naročito na području distribucije nedopuštenih sadržaja na internetu. Ukoliko objavljivači ili poslužitelji sadržaja (filmski studio ili korisnički stvorene stranice) primijete da neki od objavljenih videa sadrži registriran otisak, mogu provesti neku od radnji: ukloniti video sa stranice, ispraviti neke od značajki, zatražiti odštetu. Osim toga, može se pratiti učestalost prikazivanja pojedinog videa i koliko je često pristupano istom. Postupak se često kombinira s audio otiskom, naročito kada se kombinira i spaja više jedinstvenih video ili audio materijala. Samo jedan postupak određivanja otiska ne bi možda primijetio postojanje kombinacije sadržaja ili bi dao krivu informaciju. Kada bi audio i video otisak bili iz različitih izvora, prikazani sadržaj smatrao bi se sumnjivim. Prilikom prevođenja filma na druge jezike, audio otisak bi bio kompliciran jer bi se morao stvarati za svaki prijevod i verziju, s druge strane, sinkronizacija nema utjecaj na sam video sadržaj tako da se slobodno može zadržati samo jedan video otisak koji vrijedi za sve prijevode. Osim u filmske, video otisak koristi se i u forenzičke svrhe u kriminalistici prilikom distribucije videozapisa snimljenih od strane terorista, krađi, javnih eksperimenata, silovanja, zlostavljanja, itd. Postupci prepoznavanja, vađenja i kombiniranja značajki iz videa razlikuju se, neka od rješenja poznatih firmi:\\ | Primjena digitalnog video otiska prisutna je kod [[wp>Digital rights management|DRM-a]], i to naročito na području distribucije nedopuštenih sadržaja na internetu. Ukoliko objavljivači ili poslužitelji sadržaja (filmski studio ili korisnički stvorene stranice) primijete da neki od objavljenih videa sadrži registriran otisak, mogu provesti neku od radnji: ukloniti video sa stranice, ispraviti neke od značajki, zatražiti odštetu. Osim toga, može se pratiti učestalost prikazivanja pojedinog videa i koliko je često pristupano istom. Postupak se često kombinira s audio otiskom, naročito kada se kombinira i spaja više jedinstvenih video ili audio materijala. Samo jedan postupak određivanja otiska ne bi možda primijetio postojanje kombinacije sadržaja ili bi dao krivu informaciju. Kada bi audio i video otisak bili iz različitih izvora, prikazani sadržaj smatrao bi se sumnjivim. Prilikom prevođenja filma na druge jezike, audio otisak bi bio kompliciran jer bi se morao stvarati za svaki prijevod i verziju, s druge strane, sinkronizacija nema utjecaj na sam video sadržaj tako da se slobodno može zadržati samo jedan video otisak koji vrijedi za sve prijevode. Osim u filmske, video otisak koristi se i u forenzičke svrhe u kriminalistici prilikom distribucije videozapisa snimljenih od strane terorista, krađi, javnih eksperimenata, silovanja, zlostavljanja, itd. Postupci prepoznavanja, vađenja i kombiniranja značajki iz videa razlikuju se, neka od rješenja poznatih firmi:\\ |
* //ivitec (intelligent video technologies)//\\ Razvoj sustava pod nazivom //Adaptive Video Fingerprinting// na platformi //MediaSeeker Core Platform// s kojim se naglašava da sadržaj videa prilikom stvaranja i izvlačenja značajki uvelike utječe na otisak, i da bi se stvaranje otiska trebalo prilagoditi tome. Tako se razlikuje količina detalja ovisno o svrsi: za internet videozapise gdje do izražaja ne dolaze toliko detalji nije potreban detaljni pregled i traženje otiska, dok s druge strane postoji analiza na razini slika, gdje svaka slika videa ima ulogu u otisku zbog potrebe za detaljima.\\ | * //ivitec (intelligent video technologies)//\\ Razvoj sustava pod nazivom //Adaptive Video Fingerprinting// na platformi //MediaSeeker Core Platform// s kojim se naglašava da sadržaj videa prilikom stvaranja i izvlačenja značajki uvelike utječe na otisak, i da bi se stvaranje otiska trebalo prilagoditi tome. Tako se razlikuje količina detalja ovisno o svrsi: za internet videozapise gdje do izražaja ne dolaze toliko detalji nije potreban detaljni pregled i traženje otiska, dok s druge strane postoji analiza na razini slika, gdje svaka slika videa ima ulogu u otisku zbog potrebe za detaljima.<sup>[10]</sup>\\ |
* //Compex//\\ Razvoj tehnologije koja otiske čini otpornima na distorziju, neovisno o formatu ulaznog videa. Osigurana velika preciznost pretraživanja baze otisaka uz veliku brzinu. Osim toga, sustav je robustan na svakakve smetnje ili distorzije koje bi se mogle pojaviti u videu i imati utjecaj na generiranje i pretraživanje otisaka. U tu skupinu spada otpornost na razne šumove, promijene svjetline i boje, kontrasta, osvjetljenja, itd.\\ | * //Comexp//\\ Razvoj tehnologije koja otiske čini otpornima na distorziju, neovisno o formatu ulaznog videa. Osigurana velika preciznost pretraživanja baze otisaka uz veliku brzinu. Osim toga, sustav je robustan na svakakve smetnje ili distorzije koje bi se mogle pojaviti u videu i imati utjecaj na generiranje i pretraživanje otisaka. U tu skupinu spada otpornost na razne šumove, promijene svjetline i boje, kontrasta, osvjetljenja, itd.<sup>[12]</sup>\\ |
* //Visioforge//\\ U svojem rješenju kombinira postupke analize scene, praćenja objekata i estimacije pokreta kako bi se identificirala kopija videa neovisno o rezoluciji, tipu enkodiranja ili formatu datoteke. Tehnologiju se može primijeniti na videozapise s //Youtube-a// u cilju zaštite prava, arhive videa smanjile bi količinu podataka i izbacile duplikate, piratski sadržaj, praćenje i prepoznavanje sadržaja reklama, itd. | * //Visioforge//\\ U svojem rješenju kombinira postupke analize scene, praćenja objekata i estimacije pokreta kako bi se identificirala kopija videa neovisno o rezoluciji, tipu enkodiranja ili formatu datoteke. Tehnologiju se može primijeniti na videozapise s //Youtube-a// u cilju zaštite prava, arhive videa smanjile bi količinu podataka i izbacile duplikate, piratski sadržaj, praćenje i prepoznavanje sadržaja reklama, itd.<sup>[13]</sup> |
| |
===== Browser fingerprinting ===== | ===== Browser fingerprinting ===== |
* //Device fingerprinting//: infomarcije o medijskim uređajima na računalu | * //Device fingerprinting//: infomarcije o medijskim uređajima na računalu |
* //Audio fingerprinting//: zvučne značajke računala | * //Audio fingerprinting//: zvučne značajke računala |
Kombiniranjem svih tih podataka, korisnicima se mogu točnije i preciznije nuditi pojedini sadržaji za koje se smatra da će mu privući pažnju i personalizirati //online// doživljaj. Osim toga, podaci mogu koristiti u sprečavanju [[wp>Denial-of-service attack|Denial-of-service attack (DDoS)]] napada ili pokušaja krađe identiteta. Na ovaj način, u istragama, potajno se prati ljude bez njihovog znanja o tome.\\ | Kombiniranjem svih tih podataka, korisnicima se mogu točnije i preciznije nuditi pojedini sadržaji za koje se smatra da će mu privući pažnju i personalizirati //online// doživljaj. Osim toga, podaci mogu koristiti u sprečavanju [[wp>Denial-of-service attack|Denial-of-service attack (DDoS)]] napada ili pokušaja krađe identiteta. Na ovaj način, u istragama, potajno se prati ljude bez njihovog znanja o tome.<sup>[15]</sup>\\ |
Zbog ispravnog rada web stranica, nije moguće poništiti skripte koje se vrte u pozadini i stalno prikupljaju podatke, ali se te iste skripte mogu zbuniti i pokušati prevariti tehnikama generalizacije i nasumičnosti. //AvastAntiTrack// alat je koji generira navedena svojstva i na taj način skriva prave privatne informacije. Osim toga, mogu se koristiti preglednici koji imaju ugrađene //anti-fingerprinting// postupke: [[wp>Tor (anonymity network)|Tor Browser]] koristi generalizaciju, [[wp>Brave (web browser)|Brave Browser]] nasumičnost, a [[wp>Firefox]] neke specifične skripte. Kao jedno od najsigurnijih rješenja koje kombinira generaliziranje i nasumičnost ističe se [[wp>Avast Secure Browser]]. Nabrojani načini zaštite:\\ | Zbog ispravnog rada web stranica, nije moguće poništiti skripte koje se vrte u pozadini i stalno prikupljaju podatke, ali se te iste skripte mogu zbuniti i pokušati prevariti tehnikama generalizacije i nasumičnosti. //AvastAntiTrack// alat je koji generira navedena svojstva i na taj način skriva prave privatne informacije.<sup>[14]</sup> Osim toga, mogu se koristiti preglednici koji imaju ugrađene //anti-fingerprinting// postupke: [[wp>Tor (anonymity network)|Tor Browser]] koristi generalizaciju, [[wp>Brave (web browser)|Brave Browser]] nasumičnost, a [[wp>Firefox]] neke specifične skripte. Kao jedno od najsigurnijih rješenja koje kombinira generaliziranje i nasumičnost ističe se [[wp>Avast Secure Browser]]. Nabrojani načini zaštite:\\ |
* tajni (eng. //incognito//) način rada | * tajni (eng. //incognito//) način rada |
* instalacija sigurnosnih //plug-in-ova// | * instalacija sigurnosnih //plug-in-ova// |
* //anti-malware// alati | * //anti-malware// alati |
* posebni web preglednici\\ | * posebni web preglednici\\ |
Od 2017 godine, web preglednik koji ostavlja najviše otisaka je [[wp>Microsoft Edge]]. Ostali preglednici su Firefox, [[wp>Google Chrome]], [[wp>Internet Explorer]] i [[wp>Safari (web browser)|Safari]]. Na mobilnim uređajima ističu se Google Chrome, [[wp>Opera Mini]], Firefox, Edge i Safari.\\ | Od 2017 godine, web preglednik koji ostavlja najviše otisaka je [[wp>Microsoft Edge]]. Ostali preglednici su Firefox, [[wp>Google Chrome]], [[wp>Internet Explorer]] i [[wp>Safari (web browser)|Safari]]. Na mobilnim uređajima ističu se Google Chrome, [[wp>Opera Mini]], Firefox, Edge i Safari.<sup>[16]</sup>\\ |
[[https://amiunique.org|AmIUnique]] stranice je koja prikupi i vrati podatke o otisku računala i korištenog web preglednika. Slike u tablici u nastavku pokazuju rezultate otiska različitih web preglednika i dva različita računala. Ističe se podatak o web pregledniku, vremenskoj zoni, operacijskom sustavu i korištenom jeziku.\\ | [[https://amiunique.org|AmIUnique]] stranice je koja prikupi i vrati podatke o otisku računala i korištenog web preglednika. Slike u tablici u nastavku pokazuju rezultate otiska različitih web preglednika i dva različita računala. Ističe se podatak o web pregledniku, vremenskoj zoni, operacijskom sustavu i korištenom jeziku.\\ |
^ Web preglednik ^ Prijenosno računalo ^ Jedinstvenost ^ | ^ Web preglednik ^ Prijenosno računalo ^ Jedinstvenost ^ |
^ //battery// | - | charging: true, chargingTime: 0, dischargingTime: true | | ^ //battery// | - | charging: true, chargingTime: 0, dischargingTime: true | |
===== Zaključak ===== | ===== Zaključak ===== |
| Stvaranjem otiska digitalne datoteke dobivamo njezinu jedinstvenu oznaku. Ta oznaka može nam poslužiti za brže usporedbe i prijenos podataka kao i za uklanjanje kopija i ponovljivosti. Postupak kreiranja i praćenja otiska primjenu pronalazi u očuvanju autorskih prava video i audio sadržaja te u otkrivanju plagijata. U računalnoj forenzici otisak ukazuje na izmjene i modifikacije datoteke, a otiskom web preglednika mogu se pratiti "sumnjive" aktivnosti na računalima. |
===== Literatura ===== | ===== Literatura ===== |
| |