Slijede razlike između dviju inačica stranice.
Novija izmjena | Starija izmjena | ||
racfor_wiki:seminari:statisticke_znacajke_za_pripisivanje_autorstva_teksta [2023/01/12 19:25] li51404 stvoreno iz predloska |
racfor_wiki:seminari:statisticke_znacajke_za_pripisivanje_autorstva_teksta [2024/12/05 12:24] (trenutno) |
||
---|---|---|---|
Redak 1: | Redak 1: | ||
===== Statističke značajke za pripisivanje autorstva teksta ===== | ===== Statističke značajke za pripisivanje autorstva teksta ===== | ||
- | ===== Sažetak ===== | + | ==== Sažetak ==== |
+ | U ovom eseju obrađena je tema korištenja statističkih značajki za pripisivanje autorstva teksta u računalnoj forenzici. Istaknuto je nekoliko metoda za atribuciju autorstva, uključujući stilometriju, | ||
+ | ==== Uvod ==== | ||
+ | Računalna forenzika područje je koje uključuje istraživanje i analizu digitalnih dokaza kako bi se otkrile informacije, | ||
- | Ključne riječi: | + | ==== Metode pripisivanja autorstva ==== |
+ | Postoji nekoliko metoda za pripisivanje autorstva tekstualnom dokumentu, uključujući lingvističke, | ||
+ | === Stilometrija === | ||
+ | Stilometrija obuhvaća analizu značajki kao što su izbor riječi, struktura rečenice i interpunkcija. Stilometrija se može koristiti za analizu rukom pisanih i tipkanih dokumenata, a može se koristiti za identifikaciju autora dokumenta čak i kada je tekst anoniman ili kada je dokumentu pridonijelo više autora. Velikim dijelom koristi statističke metode poput omjera funkcionalnih riječi koji će biti naknadno detaljnije opisan. | ||
- | ===== Uvod ===== | + | === Leksička analiza |
+ | Može uključivati analizu učestalosti određenih riječi ili skupina riječi, kao i korištenje specifičnih gramatičkih struktura. Leksička analiza može se koristiti za identifikaciju autora dokumenta usporedbom teksta s poznatim primjercima pisanja potencijalnog autora. | ||
- | ===== Poglavlje 2 ===== | + | === Statističke značajke |
+ | Statističke značajke moćan su alat za pripisivanje autorstva tekstualnom dokumentu. Ove značajke mogu uključivati širok raspon metrika kao što je prosječna duljina riječi, duljina rečenice i upotreba određenih riječi ili grupa riječi. Statističke značajke mogu se koristiti za prepoznavanje jedinstvenih stilova pisanja i mogu se koristiti za usporedbu različitih dokumenata kako bi se utvrdilo njihovo autorstvo. | ||
+ | Jedna često korištena statistička značajka je omjer funkcionalnih riječi. To su riječi koje se često pojavljuju u tekstu, ali ne nose mnogo informacija o sadržaju, kao što su " | ||
+ | Druga statistička značajka koja se može koristiti za pripisivanje autorstva je analiza frazeologije, | ||
+ | Kako bi se prevladala ta ograničenja, | ||
+ | === Prednosti i nedostaci metoda pripisivanja autorstva === | ||
+ | Korištenje stilometrije i leksičke analize za atribuciju autorstva ima nekoliko prednosti, uključujući mogućnost identifikacije autora dokumenta čak i kada je tekst anoniman ili kada je dokumentu pridonijelo više autora. Ove se metode također mogu koristiti za analizu rukom pisanih i tipkanih dokumenata. | ||
+ | Upotreba statističkih značajki za atribuciju autorstva također ima nekoliko prednosti, uključujući mogućnost identifikacije jedinstvenih stilova pisanja i mogućnost usporedbe različitih dokumenata kako bi se utvrdilo njihovo autorstvo. Međutim, postoji i nekoliko zajedničkih nedostataka svim navedenim metodama, a glavna od njih je potreba za velikim uzorkom poznatih uzoraka pisanja za usporedbu te mogućnost lažno pozitivnih rezultata u procesu atribucije. | ||
+ | ==== Nedavni trendovi ==== | ||
+ | Posljednjih godina došlo je do nekoliko napretka u području pripisivanja autorstva, uključujući korištenje tehnika strojnog učenja za poboljšanje točnosti pripisivanja autorstva. Ove tehnike mogu uključivati korištenje neuronskih mreža i drugih algoritama strojnog učenja za analizu stila pisanja i prepoznavanje jedinstvenih uzoraka u tekstu. Uz to, sve je veći fokus na razvoju metoda za atribuciju autorstva u višejezičnim tekstovima, kao i metodama za analizu teksta na internetu i na društvenim mrežama, što predstavlja drugačije izazove od tradicionalnog teksta. Još jedan važan razvoj u ovom području je korištenje digitalnih forenzičkih alata i tehnika za izvlačenje informacija iz tekstualnih dokumenata. To može uključivati korištenje tekstualne steganografije za skrivanje informacija unutar dokumenta, kao i korištenje forenzičke analize slike za otkrivanje skrivenih informacija unutar slika ili drugog multimedijskog sadržaja. | ||
+ | ==== Zaključak ==== | ||
+ | Zaključno, korištenje statističkih značajki za atribuciju autorstva teksta u računalnoj forenzici moćan je alat za identifikaciju autora tekstualnog dokumenta. Ove metode mogu uključivati upotrebu stilometrije, | ||
+ | ===== Literatura ===== | ||
+ | [1] [[https:// | ||
+ | [2] [[https:// | ||
- | ===== Poglavlje | + | [3] [[https://urn.nsk.hr/urn: |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | ===== Poglavlje ... ===== | + | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | ===== Zaključak ===== | + | |
- | + | ||
- | + | ||
- | ===== Literatura ===== | + | |
- | + | ||
- | [1] [[https://dl.acm.org/doi/ | + | |
- | [2] [[http://clem.dii.unisi.it/~vipp/ | + | [4] [[https://doi.org/10.1007/978-3-030-33695-0_39|Khomytska, I., Teslyuk, V., " |
- | [3] [[https:// | + | [5] [[https:// |