Dieses Dokuwiki verwendet ein von Anymorphic Webdesign erstelltes Thema.

Razlike

Slijede razlike između dviju inačica stranice.

Poveznica na ovu usporedbu

Starije izmjene na obje strane Starija izmjena
Novija izmjena
Starija izmjena
racfor_wiki:seminari:tehnike_profiliranja_ethereum_korisnika [2023/01/13 00:36]
lb52002 [Rezultati]
racfor_wiki:seminari:tehnike_profiliranja_ethereum_korisnika [2024/12/05 12:24] (trenutno)
Redak 48: Redak 48:
 {{:racfor_wiki:seminari:rezlb.png?400|}} {{:racfor_wiki:seminari:rezlb.png?400|}}
  
-Bez pretprocesiranja+==== Bez pretprocesiranja ====
 Iz priloženih se rezultata može uočiti kako je Accuracy poprilično visoka za sve klasifikatore, ali s obzirom da se radi o neuravnoteženom skupu podataka, očekivano je da se kao izlaz dobije oznaka za većinsku klasu. Što se tiče metrike Precision, postoji određena pristranost jer se samo očito pozitivne instance točno klasificiraju. U tablici se može primijetiti kako Precision prelazi 52% za većinu navedenih klasifikatora dok je Recall ispod 42%. Osim toga, može se uočiti i da je manje od 50 profesionalnih korisnika točno klasificirano (TP < 42%). Iz toga zaključujemo kako modeli bez pretprocesiranja podataka teže označavati podatke s većinskom klasom, tj. klasificiraju ih kao obične korisnike.  Iz priloženih se rezultata može uočiti kako je Accuracy poprilično visoka za sve klasifikatore, ali s obzirom da se radi o neuravnoteženom skupu podataka, očekivano je da se kao izlaz dobije oznaka za većinsku klasu. Što se tiče metrike Precision, postoji određena pristranost jer se samo očito pozitivne instance točno klasificiraju. U tablici se može primijetiti kako Precision prelazi 52% za većinu navedenih klasifikatora dok je Recall ispod 42%. Osim toga, može se uočiti i da je manje od 50 profesionalnih korisnika točno klasificirano (TP < 42%). Iz toga zaključujemo kako modeli bez pretprocesiranja podataka teže označavati podatke s većinskom klasom, tj. klasificiraju ih kao obične korisnike. 
  
-Poduzorkovanje+==== Poduzorkovanje ====
 Gledajući drugu skupinu rezultata može se primijetiti kako se performanse klasifikatora povećavaju za Recall i AUC-ROC metriku te to rezultira povećanjem broja točno klasificiranih profesionalnih korisnika. Osim toga, što su veće vrijednosti AUC-ROC metrike, to su veće šanse da obje klase budu točno identificirane. Što se tiče pojedinačne izvedbe klasifikatora, može se uočiti kako je najbolji Random Forest uz AUC-ROC i TP metriku, s vrijednošću preko 94%. Gledajući drugu skupinu rezultata može se primijetiti kako se performanse klasifikatora povećavaju za Recall i AUC-ROC metriku te to rezultira povećanjem broja točno klasificiranih profesionalnih korisnika. Osim toga, što su veće vrijednosti AUC-ROC metrike, to su veće šanse da obje klase budu točno identificirane. Što se tiče pojedinačne izvedbe klasifikatora, može se uočiti kako je najbolji Random Forest uz AUC-ROC i TP metriku, s vrijednošću preko 94%.
  
-Preuzorkovanje+==== Preuzorkovanje ====
 Kod preuzorkovanje, također je poboljšan Recall, a samim time i točna klasifikacija profesionalnih korisnika. Random Forest i ovdje ima najbolje individualne performanse nad ostalim klasifikatorima.  Kod preuzorkovanje, također je poboljšan Recall, a samim time i točna klasifikacija profesionalnih korisnika. Random Forest i ovdje ima najbolje individualne performanse nad ostalim klasifikatorima. 
  
-Odluka+==== Odluka ====
 Zaključujemo kako je poduzorkovanje najbolja tehnika pretprocesiranja jer postiže najbolje rezultate kada je u pitanju AUC-ROC metrika.  Zaključujemo kako je poduzorkovanje najbolja tehnika pretprocesiranja jer postiže najbolje rezultate kada je u pitanju AUC-ROC metrika. 
  
 ===== Zaključak ===== ===== Zaključak =====
  
 +U ovom radu predstavljena je primjena modela strojnog učenja za identifikaciju korisničkih profila Ethereum platforme, klasificirajući ih kao profesionalne ili obične korisnike odnosno račune. Značajke potrebne za pravilno treniranje predloženih modela izdvojene su iz javno dostupnih podataka o transakcijama ove blockchain platforme. Pokazalo se kako modeli mogu postići visoku točnost i pritom raditi kompromis između Precision i Recall metrika pri klasifikaciji. Osim toga, istaknuto je kako su tehnike balansiranja skupa podataka za učenje nužan korak pretprocesiranja podataka s obzirom na to da je udio profesionalnih korisnika na mreži znatno manji od udjela običnih korisnika, što čini skup podataka neuravnoteženim.
 ===== Literatura ===== ===== Literatura =====
  
-[1] [[https://dl.acm.org/doi/pdf/10.1145/1161366.1161375| Wang W., Farid H.: Exposing Digital Forgeries in Video by Detecting Double MPEG Compression]] 
  
-[2] [[http://clem.dii.unisi.it/~vipp/website_resources/publications/conferences/2014_ICASSP_GironiFBPB_A_Video_Forensic_Technique_For_Detecting_Frame_Deletion_And_Insertion.pdf | AGironiMFontani, TBianchi, A. Piva, M. Barni: A VIDEO FORENSIC TECHNIQUE FOR DETECTING FRAME DELETION AND INSERTION ]]+[1] [[https://arxiv.org/pdf/2005.14051.pdfBeres F., Seres I.A., Benczur A.A., Quintyne-Collins M.: Blockchain is Watching You: Profiling and Deanonymizing Ethereum Users]] 
 + 
 +[2] [[https://gavwood.com/paper.pdf| Wood G.: Ethereum: A secure decentralised generalised transaction 
 +ledger]]
  
-[3] [[https://www.forensicfocus.com/articles/forensics-bitcoin/]]+[3] [[https://ieeexplore.ieee.org/document/9680589| Valadares J.A., Oliveira V.C., de Azevedo Sousa J.E., Bernardino H.S., Villela S.M., Vieira A.B., Goncalves G.: Identifying User Behavior Profiles in Ethereum Using Machine Learning Techniques]]
  
  
racfor_wiki/seminari/tehnike_profiliranja_ethereum_korisnika.1673570201.txt.gz · Zadnja izmjena: 2024/12/05 12:23 (vanjsko uređivanje)
Dieses Dokuwiki verwendet ein von Anymorphic Webdesign erstelltes Thema.
CC Attribution-Share Alike 4.0 International
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0