Pregled alata i tehnika forenzičke analize audiozapisa
Forenzika audiozapisa predstavlja interdisciplinarno područje digitalne forenzike koje se bavi analizom, provjerom autentičnosti i detekcijom manipulacija u zvučnim zapisima. S obzirom na sve češću upotrebu audiozapisa kao dokaznog materijala u pravnim postupcima, ali i na rast dostupnosti alata za obradu zvuka, potreba za pouzdanom i metodološki utemeljenom analizom postaje sve izraženija. [7] Ovaj seminar daje pregled osnovnih pojmova digitalnog audiozapisa, najčešćih tipova manipulacija te važnih tehnika i alata koji se koriste u forenzičkoj analizi zvuka, s ciljem razumijevanja mogućnosti i ograničenja utvrđivanja autentičnosti audiozapisa. Prije samog pregleda tehnika i alata, važno je objasniti osnovne pojmove vezane uz ovo područje.
Kako bi razumjeli koncepte obrade, manipulacije i forenzičke analize neke audio datoteke, potrebno je dati pregled osnovnih pojmova vezanih uz sam pojam digitalnog audiozapisa.
Digitalni audiozapis nastaje pretvorbom analognog zvučnog signala u diskretni digitalni oblik pomoću procesa uzorkovanja i kvantizacije. Osnovni parametri digitalnog zapisa su frekvencija uzorkovanja, dubina bita i broj kanala, jer izravno utječu na kvalitetu i vjernost zapisa. U forenzičkom kontekstu, ovi su parametri važni jer omogućuju analizu izvora zapisa, usporedbu s drugim zapisima te identifikaciju mogućih naknadnih obrada. [8]
Slika 1: prikaz kvantizacije analognog signala
Audiozapisi se pohranjuju u različitim formatima (npr. WAV, MP3, AAC, FLAC), pri čemu se razlikuju po načinu kompresije i očuvanja podataka. Ne-komprimirani i bezgubitni (engl. lossless) formati, kao što su WAV i FLAC, zadržavaju cjelovite podatke signala, dok gubitni (engl. lossy) formati, poput MP3 i AAC, uklanjaju dijelove spektra koji se smatraju manje važnima u kontekstu ljudske percepcije. [2]
Metapodaci audiozapisa, kao i kod drugih vrsta datoteka, predstavljaju strukturirane informacije koje opisuju sadržaj i nastanak datoteke, ali nisu dio samog audio signala. Oni mogu uključivati podatke o datumu i vremenu snimanja, korištenom uređaju ili softveru, postavkama snimanja, autoru te povijesti izmjena. Analiza metapodataka često je prvi korak u forenzičkom ispitivanju jer može pružiti tragove o porijeklu zapisa, kronologiji događaja i mogućim nedosljednostima. Važno je naglasiti da se metapodaci mogu mijenjati ili uklanjati, namjerno ili nenamjerno, primjerice prilikom prijenosa datoteke ili obrade zvuka. Stoga se u forenzičkoj analizi metapodaci uvijek promatraju u korelaciji s analizom samog audio signala. Usporedba tehničkih karakteristika zapisa i pripadajućih metapodataka omogućuje otkrivanje anomalija koje mogu upućivati na neautentičnost ili manipulaciju audiozapisa. [4]
Manipulacije audiozapisa mogu nastati iz različitih izvora, ovisno o namjeni i kontekstu u kojem se zapis koristi. U nastavku je dan pregled osnovnih načina manipulacije audiozapisa.
Jedan od osnovnih tipova manipulacija je rezanje i spajanje (engl. cut and paste) dijelova audiozapisa, čime se uklanjaju ili preuređuju segmenti govora ili zvuka. Ovakve intervencije često ostavljaju diskontinuitete u vremenskoj strukturi signala, promjene u ambijentalnom šumu ili nesklad u spektralnim karakteristikama. Srodna tehnika ovoj je montaža iz više izvora, gdje se dijelovi različitih snimki kombiniraju u jednu cjelinu, što može rezultirati neusklađenim akustičkim okruženjem. [1] Ovakav tip montaže često se javlja u tzv. “sampling” tehnici stvaranja glazbe, koja često sa sobom povlači pravna i etička pitanja.
Drugi čest tip manipulacije uključuje obradu signala efektima, poput filtriranja, normalizacije, ekvilizacije, kompresije dinamike ili uklanjanja šuma. Filtriranje i ekvilizacija mogu mijenjati frekvencijski sadržaj zapisa, pojačavajući ili smanjujući određene spektre, što može sakriti šumove, pogreške ili artefakte nastale prijašnjim intervencijama. Normalizacija i kompresija dinamike mijenjaju glasnoću i raspon zvuka, čime se gube prirodne varijacije u snimci koje bi u forenzičkoj analizi mogle otkriti manipulacije ili nesklade u akustičnom okruženju. Uklanjanje šuma ili primjena algoritama za čišćenje zapisa može ukloniti važne tragove, poput pozadinskog ambijentalnog zvuka ili signala slabije amplitude, koji su ključni za identifikaciju mjesta, uređaja ili uvjeta snimanja. U ekstremnim slučajevima, višestruka obrada može potpuno promijeniti spektralni potpis originalnog zapisa, otežavajući forenzičko utvrđivanje autentičnosti, ali istovremeno ostavljajući specifične artefakte koji sami po sebi mogu biti dokaz o manipulaciji. [8]
Posebnu kategoriju čine rekodiranja i višestruke konverzije formata, osobito između gubitnih kodeka. Svako ponovno kodiranje može uvesti dodatne artefakte i gubitak podataka, što otežava utvrđivanje izvornog stanja zapisa. [6] U forenzičkoj praksi, analiza ovih artefakata može pomoći u identifikaciji broja i vrste intervencija kojima je audiozapis bio izložen te u procjeni njegove autentičnosti.
Pojedini audiozapis može sadržavati različite aspekte koji bi mogli biti zanimljivi i korsini za analizu, kao što su spektralni sadržaj, valni oblik, govor, i sl. Iz ovog razloga, postoje brojni načini i metode forenzičke analize samog audiozapisa, a u nastavku je dan pregled onih najvažnijih.
Spektralna analiza omogućuje pregled frekvencijskog sadržaja audiozapisa i identifikaciju karakterističnih uzoraka ili anomalija. Korištenjem spektrograma ili Fourierove transformacije, mogu se detektirati neprirodne promjene u spektralnom sastavu signala, poput naglih prekida, ponavljajućih artefakata ili neuobičajenih frekvencijskih vrhova koji mogu pokazivati na montažu, filtriranje ili dodatnu obradu zvuka. [2][6] Ova tehnika je posebno korisna za provjeru autentičnosti govornog materijala i otkrivanje manipulacija u složenim snimkama kao što su pjesme.
Slika 2: Primjer spektralne analize audiozapisa spektrogramom
Dodatno, kako ovakav spektrogram daje vizualni prikaz koji se može lako manipulirati, u audiozapise moguće je sakriti efektivno nečujne skrivene poruke koje su vidljive spektralnom analizom.
Analiza valnog oblika fokusira se na vremenski prikaz amplitude audio signala. Promatranjem trajanja, intenziteta i prijelaza između segmenata, moguće je uočiti diskontinuitete, skokove ili nesklad u dinamici signala koji često nastaju kod rezanja, spajanja ili rekodiranja snimki. Valni oblik također omogućuje praćenje temporalnih karakteristika govora, ambijentalnog šuma i impulznih zvukova, što može pomoći u određivanju točnosti ili autentičnosti zapisa. [1]
Slika 3: primjer “neprirodnog” prijelaza između 2 valna oblika
Na primjeru iz gornje slike možemo zaključiti kako se radi o manipulaciji signala jer postoji oštri prijelaz unutar valnog oblika koji implicira da je možda u audiozapisu korištena tzv. “splicing” metoda gdje se spajaju 2 različita audiozapisa. Također, može se raditi i o prethodno spomenutoj metodi rezanja i spajanja.
Svaki audiozapis sadrži određeni pozadinski šum koji je često specifičan za uređaj ili prostor u kojem je snimka nastala. Forenzička analiza šuma uključuje identifikaciju i usporedbu tih signala kako bi se provjerila dosljednost snimke ili otkrile manipulacije. Promjene u karakteru šuma, neusklađenosti u ambijentalnim tonovima ili nestanak uobičajenih pozadinskih zvukova mogu biti indikator rezanja, spajanja ili obrade audiozapisa. [1]
Naravno, kao i kod drugih vrsta datoteka u digitalnoj domeni, ne moramo promatrati sam zapis (zvuk), već i metapodatke datoteke i tehničke parametre zapisa. Analiza navedenog uključuje provjeru formata, frekvencije uzorkovanja, dubine bita, broja kanala i povijesti uređivanja. Nesklad između tehničkih karakteristika i očekivanih vrijednosti može upućivati na rekodiranje, konverziju između formata ili neautentične izmjene. U praksi se ne smije oslanjati isključivo na metapodatke jer ih je moguće mijenjati ili ukloniti tijekom prijenosa ili obrade datoteka. Međutim, kombinacija metapodataka i analize samog signala često daje najpouzdanije dokaze o autentičnosti ili manipulaciji. Detaljna provjera tehničkih parametara u kombinaciji sa spektralnom analizom, promatranjem valnog oblika i ambijentalnog šuma omogućuje otkrivanje nesukladnosti koje metapodaci sami po sebi možda ne pokazuju. Također, usporedba više verzija iste datoteke ili usporedba sa referentnim uzorcima dodatno povećava pouzdanost kranjeg nalaza.
U slučajevima identifikacije osoba ili verifikacije govora, koristi se analiza glasovnih karakteristika, poput frekvencijskog raspona, tembra, intonacije i ritma govora. Usporedbom s referentnim uzorcima moguće je potvrditi ili osporiti identitet govornika, ali i detektirati sintetički ili modificirani govor. [9] Ova metoda se često kombinira sa spektralnom i valnom analizom kako bi se dobila cjelovita forenzička procjena audiozapisa. Novije tehnike vezane uz verifikaciju govora i identifikaciju glasa se često zasnivaju na umjetnoj inteligenciji i dubokom učenju, pa time izlaze iz opsega ovog seminara.
Digitalna forenzika audiozapisa koristi specijalizirane softverske i hardverske alate koji omogućuju detaljnu analizu signala, detekciju manipulacija i provjeru autentičnosti snimki. Alati se razlikuju po funkcionalnosti, neki se fokusiraju na tehničku analizu valnog oblika i spektra, dok drugi omogućuju analizu metapodataka, identifikaciju govornika ili automatsku detekciju anomalija. U forenzičkoj praksi često se koristi kombinacija više alata kako bi se dobio što potpuniji uvid u audiozapis. U nastavku je dan pregled ovakvih alata.
Softverski alati poput Adobe Audition, Audacity, iZotope RX [5] ili specijaliziranih forenzičkih paketa kao što su Audio Forensic Tool i Forensic Audio Workstation omogućuju vizualizaciju valnog oblika, spektrograma i frekvencijskih analiza. Oni pružaju mogućnosti filtriranja, dešuma, izolacije govora, usporedbe zapisa te praćenja tehničkih parametara, što olakšava identifikaciju manipulacija i provjeru autentičnosti.
Slika 4: Primjer softverskog alata - iZotope RX
Za forenzičko istraživanje metapodataka koriste se programi poput MediaInfo ili ExifTool [4], koji omogućuju čitanje i analizu tehničkih podataka datoteka, uključujući format, frekvenciju uzorkovanja, dubinu bita, uređaj snimanja i povijest izmjena. Neslaganja ili neusklađenosti u metapodacima često impliciraju rekodiranje, manipulaciju ili neautentične intervencije.
Slika 5: primjer alata za analizu metapodataka - ExifTool
Postoje i alati koji koriste algoritamske metode za automatsko otkrivanje manipulacija, poput audio fingerprinting sustava i alata za detekciju spojenih ili umetnutih segmenata. Ovi sustavi analiziraju spektralne, temporalne i statističke karakteristike zapisa te mogu identificirati anomalije koje ljudskom okom ili ušima nisu lako uočljive.
U nastavku je dana sažeta tablica svih prethodno spomenutih alata.
| Alat | Vrsta alata | Glavne funkcije |
|---|---|---|
| Adobe Audition | Softverski alat | Vizualizacija valnog oblika, spektralna analiza, obrada zvuka |
| Audacity | Softverski alat | Valni oblik, osnovna obrada, izolacija zvuka, filtriranje |
| iZotope RX | Softverski alat | Napredna restauracija, uklanjanje šuma, analiza spektra |
| Audio Forensic Tool | Specijalizirani forenzički alat | Detekcija manipulacija, spektrogram, automatska analiza |
| Forensic Audio Workstation | Specijalizirani forenzički alat | Valni oblik, spektralna analiza, usporedba zapisa |
| MediaInfo | Alat za metapodatke | Čitanje formata, frekvencije uzorkovanja, dubine bita, povijesti izmjena |
| ExifTool | Alat za metapodatke | Detaljna analiza tehničkih parametara i metapodataka |
U nekim slučajevima mogu se koristiti i specijalizirani uređaji za precizno snimanje, analizu i usporedbu audiozapisa, koji omogućuju visokokvalitetnu digitalizaciju, očuvanje originalnog signala i kontrolu nad uvjetima analize. Hardverski alati smanjuju rizik od dodatnih artefakata ili gubitaka podataka tijekom obrade i bitni su za vjerodostojnost rezultata. Osim toga, takvi uređaji često imaju mogućnosti sinkronizacije više kanala, praćenja parametara uzorkovanja u realnom vremenu te integrirane alate za usporedbu spektra i valnog oblika, što omogućuje preciznu identifikaciju eventualnih manipulacija ili nesklada u snimci. Na primjer, u sudskim istragama često se koristi prethodno spomenuti Forensic Audio Workstation u kombinaciji s višekanalnim digitalnim snimačem, gdje se originalna snimka razgovora s više mikrofona digitalizira bez gubitaka i potom analizira.
Kao i kod drugih forenzičkih analiza, analiza audiozapisa se suočava s nizom tehničkih i metodoloških ograničenja. Kvaliteta snimke, priroda obrade i sam pristup analizi često postavljaju granice preciznosti i pouzdanosti nalaza. Razumijevanje tih izazova je bitno za pravilnu interpretaciju rezultata i izbjegavanje pogrešnih zaključaka.
Kvaliteta audiozapisa predstavlja jedno od najvećih ograničenja u forenzičkoj praksi. Niske frekvencije uzorkovanja, mali broj bitova ili korištenje gubitnih formata kompresije mogu ukloniti ili izmijeniti ključne informacije sadržane u signalu. Snimke sa šumom, smetnjama, odjecima ili smanjenom dinamikom dodatno otežavaju detekciju anomalija i manipulacija. Višestruko kodiranje i konverzije između gubitnih formata često uvode artefakte koji nalikuju na intervencije, što može dovesti do pogrešne interpretacije ili sumnje u autentičnost zapisa.
Audiozapisi često prolaze kroz različite obrade, uključujući čišćenje šuma, normalizaciju glasnoće ili profesionalnu montažu. Razlikovanje legitimnih tehničkih zahvata od manipulacija koje mijenjaju sadržaj zahtijeva kombinaciju više forenzičkih metoda i iskustvo analitičara. Dodatni izazov predstavljaju nenamjerne izmjene, primjerice automatska kompresija prilikom prijenosa preko mrežnih aplikacija ili konverzija formata, koje mogu narušiti integritet signala bez da postoji namjera manipulacije. Ove intervencije često stvaraju subtilne artefakte ili promjene u spektru, što dodatno komplicira forenzičku evaluaciju.
Forenzička analiza zvuka suočava se s nizom kompleksnih izazova koji proizlaze iz same prirode digitalnog zapisa i evolucije tehnologije. Iako postoje napredni softverski i hardverski alati, njihova preciznost nije apsolutna.[6] Moderni forenzičari često se oslanjaju na vizualizaciju spektrograma i analizu ENF-a (električne mrežne frekvencije), no faktori poput niske kvalitete snimke, pozadinske buke ili kompresije podataka mogu značajno degradirati pouzdanost ovih metoda. Automatski algoritmi za detekciju manipulacija mogu propustiti složene intervencije, poput sofisticiranih montaža ili sintetičkog govora. S druge strane, subjektivna analiza stručnjaka podložna je ljudskoj pogrešci i različitim interpretacijama. Čak i uz najsuvremeniju opremu, percepcija analitičara može biti pod utjecajem kognitivne pristranosti ili zamora, što je posebno kritično kod transkripcije nejasnih snimaka ili identifikacije govornika na temelju auditivne usporedbe. Nedostatak standardiziranih protokola i varijabilnost metodologija između laboratorija dodatno otežavaju usporedbu rezultata i potvrdu autentičnosti. Bez jedinstvenog globalnog okvira koji bi propisao točne korake validacije, različiti stručnjaci mogu doći do suprotstavljenih zaključaka koristeći različite softverske pakete ili pragove tolerancije, čime se naglašava potreba za kontinuiranom edukacijom i razvojem otpornijih forenzičkih okvira. [3]
Uvođenje audiozapisa kao dokaznog materijala u pravne postupke otvara niz kompleksnih pravnih i etičkih izazova. Čak i tehnički besprijekoran zapis mora proći strogu sudsku provjeru da bi bio prihvaćen kao dokaz, dok etički standardi forenzike određuju granice između zaštite pravde i narušavanja privatnosti pojedinaca. Ključni koncept je lanac nadzora (chain of custody), koji zahtijeva dokumentiranje svakog koraka puta datoteke, od izuzimanja s uređaja, preko obrade i analize, do prezentacije pred sudom. Svaka nejasnoća u lancu nadzora ili nepropisno rukovanje datotekom može dovesti do odbacivanja dokaza. Dodatni pravni izazov predstavlja privatnost i legalnost snimanja. [3] U mnogim područjima audiozapis snimljen bez znanja ili privole sudionika smatra se nezakonitim, osim u specifičnim slučajevima poput teških kaznenih djela ili prijetnji nacionalnoj sigurnosti. Forenzičar se stoga lako može naći u etičkoj dilemi, npr. ima opciju analizirati materijal koji može biti ključan za pravdu, ali je pribavljen kršenjem prava na privatnost. Pojava audio deepfake tehnologije dodatno komplicira situaciju jer je sada potrebno procijeniti ne samo manipulacije unutar snimke, već i samu autentičnost glasa, a pogrešna interpretacija može imati ozbiljne posljedice po ugled i prava pojedinaca.[3]
U primjeni forenzike audiozapisa, teorijski koncepti spektralne analize i identifikacije artefakata postaju vrlo bitni alati u rješavanju pravnih sporova oko autorskih prava i autentičnosti. Dok se u kriminalistici fokus stavlja na glasovnu verifikaciju, u glazbenoj industriji forenzika se koristi za otkrivanje “skrivenog” samplinga. Neki primjeri ovakvih slučajeva slijede u nastavku.
U području sudbene audio forenzike, jedan od najpoznatijih primjera primjene glasovne verifikacije i biometrije bio je proces identifikacije Osame bin Ladena putem audio kazeta dostavljanih medijima. Konkretan postupak koji se u takvim slučajevima koristi naziva se ekstrakcija formanta i analiza vokalnog trakta. Formanti su rezonantne frekvencije ljudskog govornog trakta koje ovise o fizičkoj anatomiji govornika (duljina vrata, oblik čeljusti i usne šupljine) i gotovo ih je nemoguće dugoročno svjesno modificirati ili uspješno imitirati. Forenzičari koriste spektralnu analizu kako bi izolirali prva tri formanta (F1, F2 i F3) unutar stabilnih samoglasnika. Ti se podaci zatim uspoređuju s referentnim uzorcima glasa iz baza podataka. Čak i kada je snimka loše kvalitete ili je govornik pokušao promijeniti boju glasa, statistički modeli poput Gaussovih mješovitih modela (GMM) [9] ili novijih x-vector sustava temeljenih na dubokom učenju, mogu s visokim postotkom vjerojatnosti potvrditi identitet. Ovaj postupak omogućuje razlikovanje autentičnog govora od imitatora ili danas sve prisutnijih AI generiranih deepfake zapisa, koji često pokazuju neprirodne diskontinuitete u faznim prijelazima spektralnih komponenti.
Slika 6: Prikaz prva dva vokalna formanta
U suvremenoj forenzici audiozapisa, dokazivanje neovlaštenog korištenja uzoraka (samplinga) često se oslanja na metodu invertiranja faze, koja omogućuje detekciju originalnog signala čak i kada je on zamaskiran efektima ili drugim instrumentima. Konkretan primjer ovakvog postupka vidljiv je u stručnim analizama sporova poput onog za pjesmu „Vogue“, gdje se sumnja na korištenje vrlo kratkih segmenata tuđeg djela. Forenzički proces uključuje precizno poravnavanje sumnjivog uzorka s pretpostavljenim originalom do razine mikrosekunde, nakon čega se na jednom od signala invertira faza (okretanje valnog oblika za 180°, vidi sliku 7). Ako su zapisi digitalno identični, dolazi do potpunog poništavanja signala (engl. phase cancellation), dok na spektrogramu ostaju vidljivi samo naknadno dodani artefakti poput jeke (reverb) ili distorzije. Ovaj postupak, u kombinaciji s analizom aliasing artefakata specifičnih za stare digitalne samplere, pruža neoboriv tehnički dokaz da audiozapis nije ponovno odsviran, već je izravno kopiran iz izvornog digitalnog izvora. [8]
Slika 7: vrste fazne korelacije
Zanimljiv primjer suvremene “amaterske” forenzike, koja koristi profesionalne alate poput spektrograma, jest potraga za podrijetlom anonimnih pjesama (tzv. Lostwave). Jedan ovakav primjer je poznata internetska potraga “The Most Mysterious Song on the Internet”. Istraživači su koristili spektralnu analizu kako bi u audiozapisu pronašli ENF (Electric Network Frequency), tj. tragove frekvencije električne mreže (50 Hz u Europi, 60 Hz u SAD-u) koji su slučajno snimljeni u pozadini.
U sporu oko pjesme “Dark Horse”, forenzički vještaci za zvuk analizirali su instrumentalne dionice (ostinato) kako bi utvrdili radi li se o krađi melodije iz pjesme “Joyful Noise”. Iako se radilo o analizi nota, forenzički pristup uključivao je preklapanje valnih oblika i spektrograma kako bi se utvrdilo je li došlo do kopiranja same teksture zvuka i boje instrumenta, što bi upućivalo na izravan sampling, a ne samo na slučajnu sličnost melodije.
Forenzička analiza audiozapisa temelji se na kombinaciji analize samog zvučnog signala, metapodataka i tehničkih parametara zapisa, pri čemu se pouzdani zaključci donose isključivo korelacijom više metoda. Pregled osnovnih tipova manipulacija, poput rezanja i spajanja, primjene audioefekata te višestrukog rekodiranja, pokazuje da većina intervencija ostavlja mjerljive tragove u vremenskoj i frekvencijskoj domeni, iako ti tragovi nisu uvijek rezultat namjerne manipulacije. Spektralna analiza, analiza valnog oblika i ambijentalnog šuma čine temelj forenzičkog ispitivanja autentičnosti, dok analiza metapodataka služi kao dopunski izvor informacija o porijeklu i povijesti zapisa. Unatoč napretku alata i automatiziranih sustava, kvaliteta snimke, gubitna kompresija i prethodne obrade često predstavljaju značajna ograničenja i zahtijevaju opreznu interpretaciju rezultata.Forenzika audiozapisa stoga ostaje interdisciplinarno i metodološki zahtjevno područje u kojem tehnička preciznost mora biti popraćena pravnom ispravnošću i etičkom odgovornošću. U kontekstu sve češćih digitalnih manipulacija i pojave sintetičkog govora, sustavan i kritički pristup analizi zvuka izuzetno je bitan za očuvanje vjerodostojnosti audiozapisa kao dokaznog i istraživačkog materijala.
[1] Bevinamarad, P. R., & Shirldonkar, M. S. (2020). Audio Forgery Detection Techniques: Present and Past Review [IEEE conference paper]. IEEE. https://ieeexplore.ieee.org/abstract/document/9143014
[2] Brixen, E. B. (2010). Techniques for the authentication of digital audio recordings. Audio Engineering Society Convention Papers. https://www.researchgate.net/profile/Eddy-Brixen/publication/270159202_Techniques_for_the_authentication_of_digital_audio_recordings/links/572da37e08aeb1c73d12709b/Techniques-for-the-authentication-of-digital-audio-recordings.pdf
[3] EclipseForensics, A Comprehensive Guide to How Forensic Audio Testimony Influences Verdicts https://eclipseforensics.com/a-comprehensive-guide-to-how-forensic-audio-testimony-influences-verdicts/
[4] Exiftool team. Exiftool Application Documentation. https://exiftool.org/exiftool_pod.html
[5] iZotope team. RX 11 manual. https://docs.izotope.com/rx11/en/index-en.html#introduction
[6] Maher, R. C. (2009). Audio forensic examination. IEEE Signal Processing Magazine https://ieeexplore.ieee.org/abstract/document/4806208
[7] National Forensic Science Technology Center. A Simplified Guide To Forensic Audio and Video Analysis. https://www.forensicsciencesimplified.org/av/AudioVideo.pdf
[8] Petošić, A. (2025) Materijali iz kolegija Audioprogramiranje, FER. https://www.fer.unizg.hr/predmet/aud_h
[9] Reynolds, D. A. (1995). Speaker identification and verification using Gaussian mixture speaker models. https://www.sciencedirect.com/science/article/abs/pii/016763939500009D