Slijede razlike između dviju inačica stranice.
Novija izmjena | Starija izmjena | ||
racfor_wiki:seminari:tehnike_profiliranja_ethereum_korisnika [2023/01/12 21:32] lb52002 stvoreno |
racfor_wiki:seminari:tehnike_profiliranja_ethereum_korisnika [2024/12/05 12:24] (trenutno) |
||
---|---|---|---|
Redak 6: | Redak 6: | ||
Ethereum je trenutno jedna od najvećih javnih blockchain platformi koja je postala digitalno poslovno okruženje za mnoge korisnike. Ova platforma dizajnirana je tako da dozvoljava decentralizirane transakcije između anonimnih korisnika. Stoga, razvoj metoda pomoću kojih bi se mogli identificirati i definirati korisnički profili, uz očuvanje njihove anonimnosti, | Ethereum je trenutno jedna od najvećih javnih blockchain platformi koja je postala digitalno poslovno okruženje za mnoge korisnike. Ova platforma dizajnirana je tako da dozvoljava decentralizirane transakcije između anonimnih korisnika. Stoga, razvoj metoda pomoću kojih bi se mogli identificirati i definirati korisnički profili, uz očuvanje njihove anonimnosti, | ||
- | Ključne riječi: Ethereum; strojno učenje; blockchain; korisnički profili | + | Ključne riječi: Ethereum; blockchain; strojno učenje; korisnički profili |
Redak 35: | Redak 35: | ||
+ | ===== Primjena strojnog učenja na profiliranje Ethereum korisnika ===== | ||
+ | Modeli strojnog učenja široko su upotrebljavani za razne analize na Ethereum platformi, od korisničkih profila do sigurnosti i performansi pametnih ugovora. U ovom radu, strojno učenje koristit će se u svrhu klasificiranja i profiliranja korisnika. Korisnički računi potrebni za provođenje istraživanja odabrani su iz javno dostupnih podataka o Ethereum transakcijama. Prvi korak bio je, dakle, prikupiti Ethereum transakcije od kojih je izrađena baza podataka. Tako se iz podataka u bazi moglo doći do detaljnih značajki transakcija i korisničkih računa povezanih s njima. Od otprilike 20 milijuna prikupljenih transakcija nasumično i uniformno je odabrano oko 2 milijuna. Potom su izdvojeni računi primatelja i pošiljatelja koji su sudjelovali u pojedinoj transakciji te je napravljena lista, odnosno skup svih jedinstvenih korisničkih računa. U svrhu analize, zanemareno je kako jedan korisnik može imati više korisničkih računa te se model trenirao s pretpostavkom da svaki korisnik ima samo jedan račun. Na kraju je izdvojeno ukupno 17020 računa korištenih u analizi. Za svaki od računa, izdvojeni su podatci kao što su broj transakcija u kojima je dotični račun bio primatelj, broj transakcija u kojima je bio pošiljatelj, | ||
+ | ===== Opis korištenih modela strojnog učenja ===== | ||
- | ===== Zaključak ===== | + | Kako bi se Ethereum korisnici klasificirali na profesionalne i obične, korišten je skup različitih modela strojnog učenja: K-najbližih susjeda (eng. K-Nearest Neighbors), stabla odluke (eng. Decision Tree), logistička regresija, Random Forest algoritam, SVM (eng. Support Vector Machine) i Classifier Committees. S obzirom da skup korisničkih računa sadrži samo 0.68% profesionalnih korisničkih računa, prvo su korištene metode balansiranja, |
+ | ===== Rezultati ===== | ||
+ | Rezultati dobiveni s predloženim modelima i metodologijama evaluacije prikazani su na sljedećoj slici. Rezultati su podijeljeni u 3 skupine, bez pretprocesiranja ulaznih podataka te uz navedene 2 tehnike balansiranja skupa podataka za učenje. Valja napomenuti kako su profesionalni korisnici označeni kao pozitivna klasa, a obični korisnici kao negativna. | ||
+ | {{: | ||
+ | |||
+ | ==== Bez pretprocesiranja ==== | ||
+ | Iz priloženih se rezultata može uočiti kako je Accuracy poprilično visoka za sve klasifikatore, | ||
+ | |||
+ | ==== Poduzorkovanje ==== | ||
+ | Gledajući drugu skupinu rezultata može se primijetiti kako se performanse klasifikatora povećavaju za Recall i AUC-ROC metriku te to rezultira povećanjem broja točno klasificiranih profesionalnih korisnika. Osim toga, što su veće vrijednosti AUC-ROC metrike, to su veće šanse da obje klase budu točno identificirane. Što se tiče pojedinačne izvedbe klasifikatora, | ||
+ | |||
+ | ==== Preuzorkovanje ==== | ||
+ | Kod preuzorkovanje, | ||
+ | |||
+ | ==== Odluka ==== | ||
+ | Zaključujemo kako je poduzorkovanje najbolja tehnika pretprocesiranja jer postiže najbolje rezultate kada je u pitanju AUC-ROC metrika. | ||
+ | |||
+ | ===== Zaključak ===== | ||
+ | |||
+ | U ovom radu predstavljena je primjena modela strojnog učenja za identifikaciju korisničkih profila Ethereum platforme, klasificirajući ih kao profesionalne ili obične korisnike odnosno račune. Značajke potrebne za pravilno treniranje predloženih modela izdvojene su iz javno dostupnih podataka o transakcijama ove blockchain platforme. Pokazalo se kako modeli mogu postići visoku točnost i pritom raditi kompromis između Precision i Recall metrika pri klasifikaciji. Osim toga, istaknuto je kako su tehnike balansiranja skupa podataka za učenje nužan korak pretprocesiranja podataka s obzirom na to da je udio profesionalnih korisnika na mreži znatno manji od udjela običnih korisnika, što čini skup podataka neuravnoteženim. | ||
===== Literatura ===== | ===== Literatura ===== | ||
- | [1] [[https:// | ||
- | [2] [[http://clem.dii.unisi.it/~vipp/website_resources/ | + | [1] [[https://arxiv.org/pdf/2005.14051.pdf] | Beres F., Seres I.A., Benczur A.A., Quintyne-Collins |
+ | |||
+ | [2] [[https:// | ||
+ | ledger]] | ||
- | [3] [[https://www.forensicfocus.com/articles/ | + | [3] [[https://ieeexplore.ieee.org/document/9680589| Valadares J.A., Oliveira V.C., de Azevedo Sousa J.E., Bernardino H.S., Villela S.M., Vieira A.B., Goncalves G.: Identifying User Behavior Profiles in Ethereum Using Machine Learning Techniques]] |