Analisa pasar dan manajemen pada bidang data mining yaitu di dalam bidang pemasaran biasanya data mining digunakan untuk pemasaran beberapa target, manajemen hubungan pelanggan (CRM ), analisis pasar, cross seling, dan segmentasi pasar. Corporate Analysis & Risk Manajemen Corporate analysis dan Risk manajemen didalam penerapan Data mining dalam bidang perusahaan biasanya digunakan untuk prediksi, retensi pelanggan, underwriting yang lebih baik, kontrol kualitas, analisis kompetitif. Olahraga Olahraga termasuk kedalam implementasi data mining karena IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim-tim NBA. Keuangan Pada bidang keuangan atau Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk menambang trilyunan dari berbagai subyek seperti properti, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry). Asuransi. Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi . 2. Fungsi dasar teknik data mining : Descriptive : Descriptive merupakan suatu fungsi yang bertujuan untuk memahami lebih jauh mengenai data yang diamati sehingga dapat diketahui perilaku dari sebuah data. Predictive : Fungsi ini adalah sebuah fungsi yang menjelaskan suatu proses dalam menemukan pola tertentu dari sebuah data. Pola-pola yang digunakan diketahui dari beragam variabel yang terdapat pada data. Classification Fungsi ini bertujuan untuk menyimpulkan beberapa definisi karakteristik dari sebuah grup. Misalnya, pelanggan perusahaan yang sudah berpindah karena tersaingin oleh perusahaan lain. Clustering Clustering adalah identifikasi kelompok dari produk-produk atau barang-barang yang memiliki karakteristik khusus. 3. Pemrosesan Sekarang, dalam tahap pemrosesan, data yang tidak valid dan tidak perlu akan dibuang. Oleh karena itu, pembersihan data akan dilakukan dimana informasi benar-benar tidak diperlukan. Data duplikat, data yang tidak konsisten dan salah akan diperiksa dan dihapus. Transformasi Tahap selanjutnya adalah transformasi. Proses konversi atau encoding adalah proses mengubah data menjadi format tertentu agar dapat digunakan dan dilacak nantinya. Penambangan data Pada tahapan yang satu ini, metode, teknik, dan juga algoritme tertentu yang beragam dan kompleks akan digunakan untuk mencari pola. Pola serta data yang Anda cari adalah pola dan data yang akan menarik. Interpretasi dan penilaian Setelah menemukan pola dan data yang cukup menarik, dengan menampilkan data tersebut dalam bentuk data yang akan mudah dipahami oleh semua pengguna yang memiliki kepentingan. 4. Clustering atau klasterisasi adalah metode pengelompokan data. Menurut Tan, 2006 clustering adalah sebuah proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum. Clustering merupakan proses partisi satu set objek data ke dalam himpunan bagian yang disebut dengan cluster. Objek yang di dalam cluster memiliki kemiripan karakteristik antar satu sama lainnya dan berbeda dengan cluster yang lain. Konsep clustering akan menghasilkan tingkat kesamaan yang tinggi dalam satu kelas dan tingkat kesamaan yang rendah antar kelas. Kesamaan yang dimaksud merupakan pengukuran secaranumeric terhadap dua buah objek. Nilai kesamaan antar kedua objek akan semakin tinggi jika kedua objek yang dibandingkan memiliki kemiripan yang tinggi. Begitu juga dengan sebaliknya. Kualitas hasil clustering sangat bergantung pada metode yang dipakai. Contohnya : Hierarchical clustering Pada hierarchical clusteringdata dikelompokkan melalui suatu bagan yang berupa hirarki, dimana terdapat penggabungan dua grup yang terdekat disetiap iterasinya ataupun pembagian dari seluruh set data kedalam cluster. Partitional Clustering Partitional clusteringyaitu data dikelompokkan ke dalam sejumlah cluster tanpa adanya struktur hirarki antara satu dengan yang lainnya. Pada metode partitional clusteringsetiap cluster memiliki titik pusat cluster (centroid) dan secara umum metode ini memiliki fungsi tujuan yaitu meminimumkan jarak (dissimilarity) dari seluruh data ke pusat cluster masing-masing. Contoh metode partitional clustering: K-Means, Fuzzy K-means dan Mixture Modelling. 5. Klasikasi adalah : Digunakan untuk memprediksi nilai dari variable diskrit (seperti memprediksi on line user yang akan membeli pada sebuah website) Contoh : Contoh Decision tree adalah salah satu metode klasifikasi yang paling populer, karena mudah untuk diinterpretasi oleh manusia. Decision tree adalah model prediksi menggunakan struktur pohon atau struktur berhirarki. Konsep dari pohon keputusan adalah mengubah data menjadi decision tree dan aturan-aturan keputusan. Naïve bayes Classifier merupakan salah satu pengklasifikasi statistik, dimana pengklasifikasi ini dapat memprediksi probabilitas keanggotaan kelas suatu data yang akan masuk ke dalam kelas tertentu, sesuai dengan perhitungan probabilitas. Neural network adalah suatu metode pembelajaran yang diinspirasi dari jaringan sistem pembelajaran biologis yang terjadi dari jaringan sel syaraf (neuron) yang terhubung satu dengan yang lainnya Model klasifikasi : Proses pembuatan model –Data latihan •Proses testing model –Data testing •Proses klasifikasi –Data yang tidak diketahui kelasnya 6. Decision tree dimulai dengan satu node atau simpul. Kemudian, node tersebut bercabang untuk menyatakan pilihan-pilihan yang ada. Selanjutnya, setiap cabang tersebut akan memiliki cabang-cabang baru. Oleh karenanya, metode ini disebut 'tree' karena bentuknya menyerupai pohon yang memiliki banyak cabang Naïve Bayes menghitung peluang dari satu kelas dari masing-masing kelompok atribut yang ada dan menentukan kelas mana yang paling optimal, artinya pengelompokan dapat dilakukan berdasarkan kategori yang pengguna masukkan pada perangkat lunak.Perbedaan dan Persamaan Metode yang digunakan dalam penulisan ini adalah Decision Tree dan Naive-Bayes yang sama-sama merupakan bagian dari metode Data Mining Klasifikasi (Supervised Learning).Metode Decision Tree dan Metode Naive mengubah data training yang dinyatakan dalam bentuk tabel dengan atribut dan record menjadi menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan (rule). Metode Naïve Bayes data dinyatakan dalam tabel dengan atribut dan record terutama untuk data-data-data yang tidak konsisten maupun bias untuk mendapatkan hipotesis dari suatu keputusan. Dari data training yang diolah terdapat perbedaan keputusan yang dihasilkan antar kedua metode tersebut, Hasil keputusan dari metode Naïve Bayes lebih akurat dari pada hasil keputusan metode Decision Tree.