Emillia Zilfa (021119242) UTS Data Mining

Nama : Emillia Zilfa Rani Utami
NPM : 021119242 (5G Manajemen)
JAWABAN UTS DATA MINING
1. Analisa pasar dan Manajemen

Analisa pasar dan manajemen pada bidang data mining yaitu di dalam bidang pemasaran
biasanya data mining digunakan untuk pemasaran beberapa target, manajemen hubungan
pelanggan (CRM ), analisis pasar, cross seling, dan segmentasi pasar.
Corporate Analysis & Risk Manajemen
Corporate analysis dan Risk manajemen didalam penerapan Data mining dalam bidang
perusahaan biasanya digunakan untuk prediksi, retensi pelanggan, underwriting yang
lebih baik, kontrol kualitas, analisis kompetitif.
Olahraga
Olahraga termasuk kedalam implementasi data mining karena IBM Advanced Scout
menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots
blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive
advantage) untuk tim-tim NBA.
Keuangan
Pada bidang keuangan atau Financial Crimes Enforcement Network di Amerika Serikat
baru-baru ini menggunakan data mining untuk menambang trilyunan dari berbagai
subyek seperti properti, rekening bank dan transaksi keuangan lainnya untuk mendeteksi
transaksi-transaksi keuangan yang mencurigakan (seperti money laundry).
Asuransi.
Australian Health Insurance Commision menggunakan data mining untuk
mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan
oleh peserta asuransi .
2. Fungsi dasar teknik data mining :
Descriptive : Descriptive merupakan suatu fungsi yang bertujuan untuk memahami lebih jauh
mengenai data yang diamati sehingga dapat diketahui perilaku dari sebuah data.
Predictive : Fungsi ini adalah sebuah fungsi yang menjelaskan suatu proses dalam
menemukan pola tertentu dari sebuah data. Pola-pola yang digunakan diketahui dari
beragam variabel yang terdapat pada data.
Classification
Fungsi ini bertujuan untuk menyimpulkan beberapa definisi karakteristik dari sebuah
grup. Misalnya, pelanggan perusahaan yang sudah berpindah karena tersaingin oleh
perusahaan lain.
Clustering
Clustering adalah identifikasi kelompok dari produk-produk atau barang-barang yang
memiliki karakteristik khusus.
3. Pemrosesan
Sekarang, dalam tahap pemrosesan, data yang tidak valid dan tidak perlu akan dibuang.
Oleh karena itu, pembersihan data akan dilakukan dimana informasi benar-benar tidak
diperlukan. Data duplikat, data yang tidak konsisten dan salah akan diperiksa dan
dihapus.
Transformasi
Tahap selanjutnya adalah transformasi. Proses konversi atau encoding adalah proses
mengubah data menjadi format tertentu agar dapat digunakan dan dilacak nantinya.
Penambangan data
Pada tahapan yang satu ini, metode, teknik, dan juga algoritme tertentu yang beragam dan
kompleks akan digunakan untuk mencari pola. Pola serta data yang Anda cari adalah pola
dan data yang akan menarik.
Interpretasi dan penilaian
Setelah menemukan pola dan data yang cukup menarik, dengan menampilkan data
tersebut dalam bentuk data yang akan mudah dipahami oleh semua pengguna yang
memiliki kepentingan.
4. Clustering atau klasterisasi adalah metode pengelompokan data. Menurut Tan, 2006
clustering adalah sebuah proses untuk mengelompokan data ke dalam beberapa cluster
atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang
maksimum dan data antar cluster memiliki kemiripan yang minimum. Clustering
merupakan proses partisi satu set objek data ke dalam himpunan bagian yang disebut
dengan cluster. Objek yang di dalam cluster memiliki kemiripan karakteristik antar satu
sama lainnya dan berbeda dengan cluster yang lain.
Konsep clustering akan menghasilkan tingkat kesamaan yang tinggi dalam satu kelas dan
tingkat kesamaan yang rendah antar kelas. Kesamaan yang dimaksud merupakan
pengukuran secaranumeric terhadap dua buah objek. Nilai kesamaan antar kedua objek
akan semakin tinggi jika kedua objek yang dibandingkan memiliki kemiripan yang tinggi.
Begitu juga dengan sebaliknya. Kualitas hasil clustering sangat bergantung pada metode
yang dipakai.
Contohnya :
Hierarchical clustering
Pada hierarchical clusteringdata dikelompokkan melalui suatu bagan yang berupa hirarki,
dimana terdapat penggabungan dua grup yang terdekat disetiap iterasinya ataupun
pembagian dari seluruh set data kedalam cluster.
Partitional Clustering
Partitional clusteringyaitu data dikelompokkan ke dalam sejumlah cluster tanpa adanya
struktur hirarki antara satu dengan yang lainnya. Pada metode partitional clusteringsetiap
cluster memiliki titik pusat cluster (centroid) dan secara umum metode ini memiliki
fungsi tujuan yaitu meminimumkan jarak (dissimilarity) dari seluruh data ke pusat cluster
masing-masing. Contoh metode partitional clustering: K-Means, Fuzzy K-means dan
Mixture Modelling.
5. Klasikasi adalah : Digunakan untuk memprediksi nilai dari variable diskrit (seperti
memprediksi on line user yang akan membeli pada sebuah website)
Contoh : Contoh
Decision tree adalah salah satu metode klasifikasi yang paling populer, karena mudah
untuk diinterpretasi oleh manusia. Decision tree adalah model prediksi menggunakan
struktur pohon atau struktur berhirarki. Konsep dari pohon keputusan adalah mengubah
data menjadi decision tree dan aturan-aturan keputusan.
Naïve bayes Classifier merupakan salah satu pengklasifikasi statistik, dimana
pengklasifikasi ini dapat memprediksi probabilitas keanggotaan kelas suatu data yang
akan masuk ke dalam kelas tertentu, sesuai dengan perhitungan probabilitas.
Neural network adalah suatu metode pembelajaran yang diinspirasi dari jaringan sistem
pembelajaran biologis yang terjadi dari jaringan sel syaraf (neuron) yang terhubung satu
dengan yang lainnya
Model klasifikasi : Proses pembuatan model
–Data latihan
•Proses testing model
–Data testing
•Proses klasifikasi
–Data yang tidak diketahui kelasnya
6. Decision tree dimulai dengan satu node atau simpul. Kemudian, node tersebut bercabang
untuk menyatakan pilihan-pilihan yang ada. Selanjutnya, setiap cabang tersebut akan
memiliki cabang-cabang baru. Oleh karenanya, metode ini disebut 'tree' karena
bentuknya menyerupai pohon yang memiliki banyak cabang
Naïve Bayes menghitung peluang dari satu kelas dari masing-masing kelompok atribut
yang ada dan menentukan kelas mana yang paling optimal, artinya pengelompokan dapat
dilakukan berdasarkan kategori yang pengguna masukkan pada perangkat
lunak.Perbedaan dan Persamaan
Metode yang digunakan dalam penulisan ini adalah Decision Tree dan Naive-Bayes yang
sama-sama merupakan bagian dari metode Data Mining Klasifikasi (Supervised
Learning).Metode Decision Tree dan Metode Naive mengubah data training yang
dinyatakan dalam bentuk tabel dengan atribut dan record menjadi menjadi pohon
keputusan (decision tree) dan aturan-aturan keputusan (rule).
Metode Naïve Bayes data dinyatakan dalam tabel dengan atribut dan record terutama
untuk data-data-data yang tidak konsisten maupun bias untuk mendapatkan hipotesis dari
suatu keputusan.
Dari data training yang diolah terdapat perbedaan keputusan yang dihasilkan antar kedua
metode tersebut, Hasil keputusan dari metode Naïve Bayes lebih akurat dari pada hasil
keputusan metode Decision Tree.

Emillia Zilfa (021119242) UTS Data Mining

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Emillia Zilfa (021119242) UTS Data Mining

Diunggah oleh

Hak Cipta:

Format Tersedia

Nama : Emillia Zilfa Rani Utami

NPM : 021119242 (5G Manajemen)

JAWABAN UTS DATA MINING

1. Analisa pasar dan Manajemen

Anda mungkin juga menyukai