Anda di halaman 1dari 3

Web Mining / pertambangan struktur web adalah aplikasi dari data mining teknik untuk

menemukan pola dari Web . Menurut analisis target, pertambangan web dapat dibagi menjadi
tiga jenis, yaitu pertambangan penggunaan Web, pertambangan konten Web dan pertambangan
struktur Web.

Penggunaan Web Mining

pertambangan penggunaan Web adalah proses penggalian informasi yang berguna dari server log
sejarah yaitu pengguna. pertambangan Penggunaan Web adalah proses mencari tahu apa yang
pengguna cari di internet . Beberapa pengguna mungkin hanya melihat data tekstual, sedangkan
beberapa yang lain mungkin tertarik dalam data multimedia.


Web Mining Content
pertambangan konten web adalah proses untuk menemukan informasi yang berguna dari teks,
gambar, data audio atau video di web. pertambangan konten Web kadang-kadang disebut web
text mining , karena isi teks adalah daerah yang paling banyak diteliti. Teknologi yang biasa
digunakan di pertambangan konten web NLP ( Natural pengolahan bahasa ) dan IR ( Information
retrieval ). Walaupun data mining adalah istilah yang relatif baru, teknologi tidak. Perusahaan
telah menggunakan komputer kuat untuk menyaring volume data scanner supermarket dan
menganalisis laporan penelitian pasar selama bertahun-tahun. Namun, inovasi secara terus
menerus daya komputer pengolahan, penyimpanan disk, dan software statistik secara dramatis
meningkatkan akurasi analisis saat mengemudi menurunkan biaya.

Web Mining Structure

pertambangan struktur Web adalah proses menggunakan teori graph untuk menganalisis struktur
node dan koneksi dari sebuah situs web. Menurut jenis data web struktural, pertambangan
struktur web dapat dibagi menjadi dua jenis:

1. Mengekstrak pola dari hyperlink di web: suatu hyperlink adalah komponen struktural yang
menghubungkan halaman web ke lokasi yang berbeda.

2. Pertambangan struktur dokumen: analisis seperti struktur pohon struktur halaman untuk
menggambarkan HTML atau XML penggunaan tag.

Pro dan Kontra Web Mining

Kelebihan

pertambangan Web dasarnya memiliki banyak keuntungan yang membuat teknologi ini menarik
untuk perusahaan termasuk lembaga pemerintah. Teknologi ini telah memungkinkan e-
commerce untuk melakukan pemasaran yang dipersonalisasi, yang akhirnya hasil dalam volume
perdagangan yang lebih tinggi. Instansi pemerintah menggunakan teknologi ini untuk
mengklasifikasikan ancaman dan perang melawan terorisme. Kemampuan memprediksi aplikasi
pertambangan dapat memberi manfaat bagi masyarakat dengan mengidentifikasi aktivitas
kriminal. Perusahaan-perusahaan dapat membangun hubungan pelanggan yang lebih baik dengan
memberikan mereka apa yang mereka butuhkan. Perusahaan dapat memahami kebutuhan
pelanggan yang lebih baik dan mereka dapat bereaksi terhadap kebutuhan pelanggan lebih cepat.

Perusahaan-perusahaan dapat menemukan, menarik dan mempertahankan pelanggan, mereka
dapat menghemat biaya produksi dengan memanfaatkan wawasan diperoleh persyaratan
pelanggan. Mereka dapat meningkatkan profitabilitas dengan harga target berdasarkan profil
dibuat. Mereka bahkan dapat menemukan pelanggan yang mungkin default pesaing perusahaan
akan berusaha untuk mempertahankan pelanggan dengan memberikan penawaran promosi
kepada pelanggan yang spesifik, sehingga mengurangi resiko kehilangan pelanggan atau
pelanggan.

Kelemahan Web Mining

pertambangan Web, sendiri, tidak menciptakan masalah, namun teknologi ini bila digunakan
pada data bersifat pribadi dapat menyebabkan keprihatinan. Isu etika yang paling dikritik
melibatkan pertambangan web invasi privasi. Privasi dianggap hilang ketika informasi tentang
seorang individu diperoleh, digunakan, atau disebarluaskan, terutama jika hal ini terjadi tanpa
pengetahuan atau persetujuan. Data yang diperoleh akan dianalisis, dan dikelompokkan untuk
membentuk profil, data akan dibuat anonim sebelum clustering sehingga tidak ada profil pribadi.
Jadi aplikasi ini de-individualize pengguna dengan menilai mereka dengan klik mouse mereka.
De-individualisasi, dapat didefinisikan sebagai kecenderungan menilai dan memperlakukan
orang berdasarkan karakteristik kelompok bukan pada individu karakteristik sendiri dan manfaat.

Keprihatinan lain yang penting adalah bahwa perusahaan pengumpulan data untuk tujuan
tertentu mungkin menggunakan data untuk tujuan yang sama sekali berbeda, dan ini pada
dasarnya melanggar kepentingan pengguna. Tren yang berkembang penjualan data pribadi
sebagai komoditas mendorong pemilik website untuk perdagangan data pribadi yang diperoleh
dari situs mereka. Tren ini telah meningkatkan jumlah data yang ditangkap dan diperdagangkan
meningkatkan bersesuaian dari privasi seseorang sedang diserang. Perusahaan yang membeli
data wajib membuat anonim dan perusahaan-perusahaan ini dianggap penulis setiap peluncuran
khusus pola pertambangan. Mereka secara hukum bertanggung jawab atas isi dari rilis, setiap
ketidakakuratan dalam rilis akan menghasilkan tuntutan hukum yang serius, tetapi tidak ada
hukum yang mencegah mereka dari perdagangan data.

Beberapa algoritma pertambangan mungkin menggunakan atribut yang kontroversial seperti
seks, ras, agama, atau orientasi seksual untuk mengkategorikan individu. Praktek ini mungkin
melawan undang-undang anti-diskriminasi. Aplikasi membuat sulit untuk mengidentifikasi
penggunaan atribut kontroversial tersebut, dan tidak ada aturan yang kuat terhadap penggunaan
algoritma tersebut dengan atribut seperti itu. Proses ini dapat mengakibatkan penolakan layanan
atau hak istimewa kepada seseorang berdasarkan ras, agama atau orientasi seksual, sekarang
situasi ini dapat dihindari dengan standar etika yang tinggi yang dikelola oleh perusahaan data
mining.

Data yang dikumpulkan sedang dibuat anonim sehingga, data yang diperoleh dan pola yang
diperoleh tidak dapat ditelusuri kembali ke individu. Mungkin terlihat seolah-olah ini tidak
menimbulkan ancaman terhadap privasi seseorang, sebenarnya banyak informasi tambahan dapat
disimpulkan oleh aplikasi dengan menggabungkan dua data yang tidak bermoral terpisah dari
pengguna.