46efd2dbd6d1e7aa40feff71e88ff496.ppt
- Количество слайдов: 39
VISUALISASI SISTEM REKOMENDASI PENAMBAHAN LINK PADA WEBSITE BERDASARKAN DATA LOG WEBSITE KURNIAWAN AJI SAPUTRA G 64052249 Pembimbin g: ANNISA, S. Kom. , M. Kom
LATAR BELAKANG q Website merupakan salah satu sarana yang menyediakan informasi pada jaringan internet q Struktur yang baik menurut pengembang belum tentu sesuai dengan keinginan pengguna q Struktur website yang baik adalah yang mampu mempermudah penggunanya untuk mencari sesuatu yang diinginkannya
TUJUAN Membuat sistem rekomendasi website yang diterapkan ke dalam sebuah website artificial dengan menggunakan data log asli website
RUANG LINGKUP Data yang diteliti adalah path halaman website hasil kunjungan pengguna website yang diperoleh dari data log website yang menggunakan apache-server.
MANFAAT Sistem ini diharapkan mampu membantu pengembang website untuk membuat struktur website yang baik sehingga dapat meningkatkan kepuasan pengguna website.
TINJAUAN PUSTAKA
WEB MINING Penelitian sebelumnya oleh Nurdian Setyawan (2008) dengan judul “Rekomendasi Penambahan Link Pada Web Berdasarkan Pola Akses Pengguna” telah berhasil mengimplementasikan Algoritme Find Expectation Location dan Algoritme Optimasi (First. Only, Optimize. Benefit)
DATA LOG q Data yang mencatat setiap request halaman website oleh pengguna saat membuka suatu website tertentu (Ivancy & Vajk 2006). q Contoh Format Data Log : 192. 168. 19. 123 - - [16/Feb/2005: 14: 27: 22 +0700] "GET / HTTP/1. 1" 200 18768 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0 192. 168. 19. 123 - - [16/Feb/2005: 14: 27: 22 +0700] "GET /scripts/format. css HTTP/1. 1" 200 2217 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0 192. 168. 19. 123 - - [16/Feb/2005: 14: 27: 22 +0700] "GET /images/home-on. gif HTTP/1. 1“ 404 295 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0 192. 168. 19. 123 - - [16/Feb/2005: 14: 27: 22 +0700] "GET /images/latar. jpg HTTP/1. 1" 200 1919 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0 192. 168. 19. 123 - - [16/Feb/2005: 14: 27: 22 +0700] "GET /images/home-off. gif HTTP/1. 1“ 404 296 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0 192. 168. 19. 123 - - [16/Feb/2005: 14: 27: 22 +0700] "GET /images/kiri-atas. gif HTTP/1. 1" 200 14697 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0 192. 168. 19. 123 - - [16/Feb/2005: 14: 27: 22 +0700] "GET /images/tengah-kiri. gif HTTP/1. 1“ 200 2809 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0 192. 168. 19. 123 - - [16/Feb/2005: 14: 27: 22 +0700] "GET /images/tengah-tengah. gif HTTP/1. 1" 200 27180 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0
DATA LOG (Lanjutan) 192. 168. 19. 123 -- [16/Feb/2005: 14: 27: 22 +0700] “GET /libs/detail. html HTTP/1. 1” 200 2809 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0 IP address pengguna informasi waktu pengguna melakukan request menunjukkan metode request halaman yang diminta oleh pengguna Protokol yang digunakan status request yang berarti setuju dan besarnya data (byte) cookie dalam browser URL yang diminta pengguna browser yang digunakan pengguna
PREPROCESSING Tahapan Preprocessing (Cooley et al. 1999): data cleaning session identification user identifcation transaction identification path completion
HALAMAN TARGET Penentuan Halaman target (Srikant & Yang 2001) : v Jelas Perbedaan halaman konten dan halaman isi Halaman Isi Halaman target v Tidak Jelas Perbedaan halaman konten dan halaman isi Waktu Kunjungan Paling Lama Halaman target v Pada Struktur Website Bertingkat Leaf Halaman target
MODEL PENCARIAN PENGGUNA 1 A 2 B 2 A 3 A 1 2 3 B 5 7 2 C 8 9 10 6 Website dan Model Pencarian (Srikant & Yang 2001)
METODE PENELITIAN
METODE PENELITIAN Penambahan Tabel Database Input Data Pengambilan Data Log Penentuan Halaman Target Preprocessing User identification Session identification Lokasi Harapan Processing Algoritme Optimasi Visualisasi & Simulasi Data cleaning Path completion Transaction identifocation
LINGKUP PENGEMBANGAN SISTEM q Perangkat Keras § Processor : Intel Pentium Dual CPU T 2390 1. 86 GHz § Memory : 1 GB § Harddisk : 120 GB § Keyboard & mouse q Perangkat Lunak : § Microsoft ®Windows Vista Ultimate § XAMPP § Notepad++ § Opera version 9. 64
BATASAN –BATASAN SISTEM q Data log yang digunakan sebagai input masih data log dari apache-server q Format data log harus sesuai dengan contoh yaitu : 172. 17. 1. 146 - - [20/Mar/2006: 00: 25: 12 +0700] "GET /ipb-bhmn HTTP/1. 1" 301 324 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 q Data Log harus berupa file teks q Struktur website minimal mempunyai level minimal 4 q Sistem tidak dapat digunakan oleh 2 orang atau lebih dalam waktu yang sama
HASIL DAN PEMBAHASAN
PENAMBAHAN TABEL DATABASE q Tabel yang masih digunakan : § tb_exp_locations § tb_hsl_firstonly § tb_hsl_optbenefit § tb_temp q Tabel tambahan : § data_log § url § inputdata § strukturview
PENGAMBILAN DATA LOG q Data log yang digunakan adalah dari www. eramuslim. com => januari 2009 q Data asli = 112. 219 baris q Partisi = 10. 000 baris per file q Ukuran per file rata-rata 1 MB q Diambil 5 file untuk penelitian q Asumsi Halaman Target (Srikant & Yang 2001) “ Halaman yang mempunyai level 4 dalam struktur website dan diambil hanya 15 halaman target yang paling banyak dikunjungi oleh pengunjung website”
PENGAMBILAN DATA LOG (lanjutan) q Halaman Target yang dihasilkan : No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Halaman Target /berita/palestina/israel-gencatan-senjata-sepihak-gagal-tumbangkan-hamas. htm /berita/palestina/hari-ke-21 -22 -pertemuan-doha-dunia-arab-bekukan-hubungan-denganisrael. htm /berita/dunia/ratusan-ribu-veterang-perang-irak-afghanistan-jadi-gelandangan. htm /berita/analisa/perang-legitimasi. htm /berita/analisa/kegagalan-israel-terhadap-palestina. htm /berita/dunia/pejuang-hamas-fatah-bersatu-abbas-tolak-negosiasi-dengan-israel. htm /berita/dunia/iran-bantu-gaza-bentuk-pasukan-islam-dan-hentikan-ekspor-minyak-keas. htm /suara-langit/undangan-surga/merindukan-mati-syahid. htm /berita/rss/int /berita/dunia/petani-israel-rugi-besar-akibat-geraikan-boikot. htm /berita/dunia/yusuf-qardawi-teruslah-turun-ke-jalan. htm /berita/palestina/bangsa-arab-bersatu-untuk-gaza. htm /berita/dunia/aktris-hollywood-boikot-pengusaha-yahudi-zionis-as. htm /syariah/bercermin-salaf/kemenangan-islam-di-syam-iraq-dan-yaman. htm /berita/tahukah-anda/siapa-sebenarnya-suharto-7. htm
DATA CLEANING Menghapus baris-baris dalam data log dimana url mengandung format gambar seperti jpg, jpeg, gif, JPG, JPEG dan GIF (Cooley et al. 1999) 192. 168. 19. 123 - - [16/Feb/2005: 14: 27: 22 +0700] "GET /libs/detail. html HTTP/1. 1“ 404 296 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0 192. 168. 19. 123 - - [16/Feb/2005: 14: 27: 22 +0700] "GET /images/home-off. gif HTTP/1. 1“ 404 296 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0 192. 168. 19. 123 - - [16/Feb/2005: 14: 27: 22 +0700] "GET /libs/detail. html HTTP/1. 1“ 404 296 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 http: //www. unipi. it MSIE+6. 0
USER IDENTIFICATION 192. 168. 19. 123 192. 168. 28. 13 192. 168. 59. 3 √ X
USER IDENTIFICATION (lanjutan) q Alamat IP sudah mengalami pengkodean / enkripsi q q q File File 1 2 3 4 5 => => => 5. 583 5. 399 5. 645 5. 665 5. 363 pengunjung pengunjung Alamat IP 1123631938 1591339728 3399020594 2107729223 2033469383 3399016549 3399668931 3732719634 1916426500 2108061929 2107701710 1094176879 3395101756 168558991
SESSION IDENTIFICATION Penentuan Session (Catledge dan Pitkow 1995) : q Terdapat informasi waktu dan lama kunjungan Time Out > 30 Menit Session Baru q Terdapat cookie di dalam browser yang disimpan Cookie browser Session
SESSION IDENTIFICATION (lanjutan) q Satu pengunjung dapat memiliki lebih dari satu session q Namun satu session hanya dimiliki oleh satu pengunjung Alamat IP 990812105 979265853 974889972 974793278 703366272 703219349 703179115 703178520 703178485 703177562 703170954 701150367 644300602 Session 22 es 2 q 9 nc 0 llfb 7 nr 4 ep 05 km 6 gkvas 6 tiqi 8 r 0 l 1 0 tssoih 8 scmc 6 s 6 mmmpe 011 fri 43 ua 48 u 32 faqf 4 21 gkm 2 v 62 htb 6 elut 8 fk 2 e 42 cst 7 rt 4 f 62 qojkbo 2 q 7 t 1 btmq 6 cmo 60 l 7 du 3 1 cak 1 p 26 qtnblir 11 g 3 j 0 u 28 dncll 5 s 3 gf 8 f 491 d 265 td 0 sd 2 t 812 hreh 4 o 5 02 s 8 uep 9 h 63 gh 19 gca 9 s 0 mtskrc 0 vpmattm 1 aotv 283 hh 86 iih 3 gf 40 q 2 igj 1 c 1 o 19 jh 09 t 0 t 832 ltgp
PATH COMPLETION q Mengurutkan halaman kunjungan setiap pengguna dan setiap session q Contoh : 172. 17. 0. 172 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 172. 17. 0. 123 Mhljljuadjnfalsd 0970800 ad 35 fadf => 1, 2, 7, 17, 7, 18, 7, 2, 6, 14 => 1, 4, 10, 25, 10
PATH COMPLETION (lanjutan) q Contoh hasil dari Path Completion : Alamat IP 1009956329 Session 2 jnbr 1 cna 7 uma 0 dat 0 aj 1009985486 0 m 41 nrh 2 kir 9 r 8 ob 7 uu 5 1010047370 1010162336 1 b 3 c 5 gvae 55 fk 7 f 9 kgvk 0 j 5 ktdttvvvipua 1 aqtt 1010165768 2 blsgodfcev 4 qkss 254 k 1023754567 2 hl 116 me 7 gieqsjju 3 pt Urutan Tingkah Laku Pengunjung /search/? keyword=alat+musik, /search/? keyword=alat+musik&search. B utton. x=11&search. Button. y=10, /berita/palestina/hari-ke-21 -22 pertemuan-doha-dunia-arab-bekukan-hubungan-denganisrael. htm, /berita/dunia/krisis-gaza-israel-as-tandatangani-kesepakatan -sepihak. htm /berita/palestina/israel-gencatan-senjata-sepihak-gagal-tumbangkanhamas. htm /berita/dunia/aktris-hollywood-boikot-pengusaha-yahudi-zionis-as. htm /suara-kita/pemuda-mahasiswa/sinkronisasi-moral-mencegahkorupsi. htm, /berita/palestina/israel-gencatan-senjata-sepihak-gagaltumbangkan-hamas. htm, /suara-kita/pemuda-mahasiswa/sinkronisasimoral-mencegah-korupsi. htm /berita/dunia/ratusan-ribu-veterang-perang-irak-afghanistan-jadigelandangan. htm, /ustadz-menjawab/membenci-yahudi. htm, /suarakita/suara-pembaca/komentar-siapa-sebenarnya-soeharto. htm, /suarakita/suara-pembaca/resolusi-1860 -bukti-nyata-pengecutnyapenguasa. htm /berita/palestina/israel-gencatan-senjata-sepihak-gagal-tumbangkanhamas. htm
TRANSACTION IDENTIFICATION q Setelah pengguna menemukan halaman target dan masih melanjutkan pencarian, maka menjadi sebuah transaksi baru q Contoh : 172. 17. 0. 172 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 => 1, 2, 7, 17, 7, 18, 7, 2, 6, 14 172. 17. 0. 172 Mm. Ta. Ug 00 pd. A 00001 fvkws. M 4000 => 1, 2, 7, 17, => 7, 18, => 7, 2, 6, 14
TRANSACTION IDENTIFICATION (lanjutan) q Contoh hasil dari Transaction Identification : Alamat IP 32719939 3732704554 3411020548 3400937929 3399000550 3398968658 3398682338 Urutan Tingkah Laku Pengunjung /berita/dakwah-mancanegara/yahudi-as-pindah-ke-israel-dan-masukislam. htm, /berita/analisa/israel-menggali-kuburnya-sendiri. htm, /berita/analisa/peranglegitimasi. htm /berita/dunia/aktris-hollywood-boikot-pengusaha-yahudi-zionis-as. htm /berita/palestina/israel-gencatan-senjata-sepihak-gagal-tumbangkan-hamas. htm /berita/dunia/petani-israel-rugi-besar-akibat-geraikan-boikot. htm /berita/palestina/hari-ke-21 -22 -pertemuan-doha-dunia-arab-bekukan-hubungan-denganisrael. htm /berita/palestina/hamas-hancurkan-tujuh-tank-zionis. htm, /berita/dunia/iran-bantu-gaza-bentuk -pasukan-islam-dan-hentikan-ekspor-minyak-ke-as. htm /berita/analisa/perang-legitimasi. htm /berita/dunia/bantai-warga-irak-lima-tentara-bayaran-as-siap-diadili. htm, /berita/dunia/ratusan -ribu-veterang-perang-irak-afghanistan-jadi-gelandangan. htm /berita/dunia/aktris-hollywood-boikot-pengusaha-yahudi-zionis-as. htm //berita/dunia/rss, /berita/dunia/yusuf-qardawi-teruslah-turun-ke-jalan. htm //berita/dunia/rss, /berita/dunia/pejuang-hamas-fatah-bersatu-abbas-tolak-negosiasi-denganisrael. htm
PROCESSING q Pencarian Lokasi Harapan (E 1, E 2, E 3, E 4) menggunakan Algoritme Find Expectation Location q Penentuan Rekomendasi Halaman menggunakan 2 algoritme : § Algoritme First. Only § Algoritme Optimize. Benefit
PROCESSING q Algoritme Find Expectation Location tidak menghasilkan lokasi harapan q Jika tidak ada lokasi harapan maka Algoritme First. Only dan Optimize. Benefit juga tidak akan menghasilkan halaman rekomendasi q Penyebab : 1. Karakteristik data (data dummy dan data log) 2. Path Completion yang terlalu pendek 3. Sudah ada hyperlink di halaman utama ke halaman target
VISUALISASI
VISUALISASI (lanjutan) q Pengujian visualisasi menggunakan hasil akhir penelitian Nurdian Setyawan (2008) yang menggunakan data dummy q Algoritme First. Only dan Optimize. Benefit dengan nilai threshold 37 dan minsup 7%
VISUALISASI (lanjutan) q Tabel hasil algoritme First. Only No Target Rek Page Support Hits % 1 2 3 4 5 20 25 26 27 27 4 3 10 5 3 39 37 44 38 37 7. 8% 9. 1% 10. 4% 10. 6% 9. 4%
VISUALISASI (lanjutan) q Tabel hasil algoritme Optimize. Benefit No 1 2 3 4 5 6 7 8 9 10 Target 17 17 19 19 19 20 24 24 25 25 Rek Page 5 3 5 4 9 4 11 2 3 11 Support 39 37 42 40 41 44 46 42 48 42 Hits % 7. 5% 7. 1% 7. 9% 7. 5% 7. 7% 7. 8% 8. 6% 7. 8% 9. 1% 7. 9% No 11 12 13 14 15 16 17 18 19 20 Target 26 26 27 27 28 28 28 29 Rek Page 10 2 5 3 10 2 4 2 13 13 Support 59 43 56 50 49 43 41 38 41 44 Hits % 10. 4% 7. 6% 10. 6% 9. 4% 9. 2% 8. 1% 7. 6% 7. 7%
VISUALISASI (lanjutan)
KESIMPULAN q Penelitian ini telah berhasil melakukan tahapan preprocessing dengan menggunakan data log asli website yang disimpan dalam bentuk database mysql q Penelitian dengan data log yang digunakan tidak menghasilkan halaman rekomendasi q Penelitian mampu memvisualisasikan struktur website yang dinamis
SARAN q Sistem ini perlu dicoba dengan menggunakan data dari beberapa website lain (dinamis maupun statis) yang sudah dapat dibedakan halaman targetnya
TERIMA KASIH
46efd2dbd6d1e7aa40feff71e88ff496.ppt