Sadržaj

Tehnike za watermarking teksta

Sažetak

Moderna tehnologija omogućuje dijeljenje dokumenata brzo, jeftino i dostupno svima. To je zbog smanjenja cijene opreme potrebne za kopiranje, distribuciju i pregledavanje sadržaja. Korištenje digitalnih dokumenata za sobom je povuklo ilegalno kopiranje istih. Zbog toga istražuju se tehnike kako to spriječiti i zaštititi prava autora. Steganografija je tehnika koja omogućava autorima da sakriju poruku u tekstu bez da je ta poruka primjetna čitatelju. Pa tako autor u tekst može sakriti svoje ime, identifikator ili druge korisne informacije, odnosno staviti svoj vodeni žig. U ovom seminaru obradit će se neke od tehnika za skrivanje vodenog žiga u tekstualnoj datoteci.

Keywords: steganografija; watermark; vodeni; žig; watermarking; tehnike

Uvod

Vodeni žig je samo oznaka na dokumentu. Ta oznaka može poslužiti kao vrsta zaštite od mogućeg krivotvorenja. Koristi se u tiskanju novčanica, tiskanju knjiga, u digitalnim oblicima knjiga, video zapisa, slika i audio zapisa, odnosno u svemu što ima potrebu zaštite od kopiranja. Zbog modernih tehnologija koje omogućavaju kopiranje sadržaja sve je više potrebe za nekakvom zaštitom autorskih prava. Dok su digitalni oblici slika, videa i zvuka pogodni za ovakav pristup zaštite, tekst je najteže označiti, a da se pri tome ne naruši izgled ili smisao poruke.

Ove tehnike imaju primjene gdje god se koriste elektronički dokumenti zaštićeni autorskim pravima. Jedan primjer je virtualna knjižnica gdje korisnici skidaju kopije knjiga ili skripti, ali nije im dopušteno daljnje dijeljenje. U takvim aplikacijama dokumneti moraju imati vodene žigove od autora jer ako se kasnije ispostavi da je neki dokument dijeljen, na sudu se može dokazati pomoću vodenog žiga da je to dokument iz te knjižnice, ili ako nema žiga to znači da je izgubljen na način da je dokument prepisan.

U ovom seminaru bit će prikazane i opisane tehnike za sakrivanje vodenog žiga u tekstu.

Tehnike

U tehnikama postoje dvije vrste sakrivanja vodenog žiga. Prva vrsta su lomljivi vodeni žigovi. Lomljivi su jer se oni izgube nakon što se dokument prepiše. Njih nije moguće primijetiti golim okom, a autori ih mogu lagano otkriti i provjeriti je li dokument originalan ili ilegalna kopija. U drugu vrstu spadaju otporni žigovi, a tako se zovu jer se ne brišu kod prepisivanja. I ova vrsta je nevidljiva čitatelju. Takav žig je teško detektirati i za to je potreban originalan dokument koji ne sadrži žig. Ove dvije vrste žigova se mogu i kombinirati radi poboljšanja svojstva i bolje sigurnosti.

Pomicanje redaka (eng. Line Shift)

Ova tehnika mijenja dokument tako da vertikalno pomiče retke teksta. Postoje dva načina kako se mogu tretirati pomaci redaka, a to si u prvom slučaju da pomak retka prema gore označava 0, a pomak prema dole označava 1. U drugom slučaju pomace se mogu označavati kao 0 za ne pomaknuti redak, 1 za redak pomaknut prema dolje i -1 za redak pomaknut prema gore. Za usporedbu se mogu uzeti dva retka, jedan iznad i jedan ispod pomaknutog retka i usporediti udaljenosti do njih pa tako doći do informacije kako je redak pomaknut. Takav način omogućava 2^(n-1)/2 kodnih riječi na stranici za prvi način kodiranja gdje je n broj redaka na stranici ili 3^(n-1)/2 za drugi. Broj se može povećati tako da se svaki redak pomakne, ali za to je potrebno imati originalni dokument s kojim će se uspoređivati. Prednost ove tehnike je da se skrivena riječ izgubi ako se tekst kopira ili ako se nad dokumentom koristi OCR i tako se nakon takvih obrada vidi da text nije originalan.

Pomicanje riječi (eng. Word Shift)

Slična metoda prethodno opisanoj, ali u ovom slučaju horizontalno se pomiču riječi, pa bi pomak u lijevo mogao označavati 0, a pomak u desno 1. Za otkrivanje skrivenog teksta potreban je originalni dokument za usporedbu. Prednosti navedene za prethodnu tehniku se odnose i na ovu, ali nedostatak je taj da postoji i velika mogućnost da pomaci napravljeni slučajno radi oblikovanja teksta.

Kodiranje pomoću značajki (eng. Feature Coding)

Upotrebom ove metode kod se u tekst umeće kao promjena na nekim značajkama slova. Slova koja imaju pogodne značajke za promjenu bez podizanja sumnje kod čitatelja su b, d, h, k i ostala slova koja imaju dugačku liniju u sebi i koju se može produžiti ili skratiti te i, j, ć, č, š, ž, kojima se točke ili kvačice mogu pomaknuti u jednu stranu. Prednosti ove tehnike su jednaki prednostima navedenim kod tehnike pomicanja redaka.

Kodiranje pomoču razmaka (eng. White Steg)

Ovom metodom se u tekst dodaje kod u obliku razmaka između riječi. Jedan razmak označava 0 a dva razmaka označavaju 1. Ako se ta tehnika koristi između svake riječi onda ju je lako uočiti, pa je zato bolje rješenje da se ta tehnika koristi samo na kraju svake rečenice odnosno iza točke.

Jezične transformacije

Tehnike koje koriste jezične transformacije nastoje skrivenu poruku ugraditi u tekst dokumenta. Najjednostavnija i najkorištenija jezična transformacija je zamjena sinonimima. Tom metodom se odrede neke riječi koje se mogu zamijeniti sinonimima koji ne mijenjaju smisao rečenice. Tako bi u tekstu originalna riječ označavala 0, a tamo gdje bi se zamijenila sinonimom to bi označavalo 1. Ovakvim tehnikama se vodeni žig neće ukloniti prepisivanjem ili kopiranja pomoću računalnog vida, a niti nije vidljiv čovjeku.

Zaključak

Za upotrebu vodenog žiga u svrhu zašite nekog sadržaja potrebno je da taj sadržaj ima prazan i neupotrebljen prostor gdje bi se vodeni žig smjestio, a da samim time ne mijenja bitno taj sadržaj i nije uočljiv. Tekst sadrži vrlo malo ili nema neprimjetnih podataka, pa čak i vrlo sitne promjene su očigledne ljudskom oku. Zato je jako teško zaštititi tekstualne dokumente. Steganografija iako prikriva postojanje poruke nije potpuno sigurna od napada.

Literatura

[1] Tihana Poljak, Zaštita teksta digitalnim vodenim žigom, Sveučilište u Zagrebu, Fakultet elektrotehnike i računarstva , 2007.

[2] Monika Agarwal. TEXT STEGANOGRAPHIC APPROACHES: A COMPARISON. 2013.

[3] Richard Popa, An Analysis of Steganographic Techniques, 1998.

[4] https://link.springer.com/article/10.1007/s11042-019-08025-x

[5] https://www.slideshare.net/anjutommklm/watermark-13375625

[6] https://www.locklizard.com/ipr-protection/

[7] Ji Hwan Park, Sook Ee Jeong, Chang Soo Kim, Robust and Fragile Watermarking Techniques for Documents Using Bi-directional Diagonal Profiles