Jelaskan secara singkat apa yang diketahui mengenai Data Mining?
Definisi Data Mining
Data mining merupakan sebuah proses pengumpulan informasi penting dari sebuah data yang besar. Pengumpulan informasi penting tersebut dilakukan melalui beberapa proses yang meliputi metode statistika, matematikan maupun teknologi artificial intelligence. Secara lebih khusus, definisi data mining yaitu sebuah alat serta aplikasi yang memakai analisis statistik pada data dan menyaring serta menyimpan semuda data tersebut. Data mining sendiri dapat menggambarkan suatu pengumpulan beberapa teknik yang bertujuan agar menemukan pola-pola yang belum diketahui pada data yang terkumpul. Melalui data inilah para pengguna dapat menemukan pengetahuan berupa database yang semula tidak mungkin bisa diketahui. Selain itu, pengumpulan data tersebut juga menjadi bagian dari Knowledge Discovery in Database (KDD) yang terdiri atas beberapa tahapan, diantaranya pemilihan data, pra pengolahan, tahap transformasi, penerapan serta evaluasi hasil. Secara umum KDD sering dikenal dengan istilah pangkalan data.
Fungsi Data Mining
Data mining mempunyai berbagai fungsi, termasuk fungsi utamanya yaitu descriptive serta predictive. Untuk lebih jelasnya mengenai fungsi tersebut berikut ini akan diberikan beberapa penjelasannya. Descriptive Descriptive merupakan suatu fungsi yang bertujuan memahami lebih jauh mengenai data yang diamati sehingga dapat diketahui perilaku dari sebuah data. Predictive Fungsi ini adalah sebuah fungsi yang menjelaskan suatu proses dalam menemukan pola tertentu dari sebuah data. Pola-pola yang digunakan diketahui dari beragam variabel yang terdapat pada data. Classification Fungsi ini bertujuan untuk menyimpulkan beberapa definisi karakteristik dari sebuah grup. Misalnya, pelanggan perusahaan yang sudah berpindah karena tersaingin oleh perusahaan lain. Clustering Clustering adalah identifikasi kelompok dari produk-produk atau barang- barang yang memiliki karakteristik khusus. Association Association merupakan identifikasi hubungan dari kejadian-kejadian yang sudah terjadi di suatu waktu. Sequencing Sequencing sebetulnya hampir sama dengan association tetapi untuk sequencing berfungsi untuk identifikasi hubungan-hubunga berbeda di sebuah periode waktu tertentu. Contohnya, para pelanggan yang berkunjung di supermarket secara berulang. Forecasting Fungsi ini bertujuan untuk memperkirakan nilai di suatu masa di masa mendatang sesuai dengan pola-pola dengan kumpula data dalam jumlah besar. Contohnya, peralaman permintaan pasar. Manfaat data mining Dengan melakukan data mining, perusahaan dapat mendapatkan banyak manfaat. Beberapa manfaat dari data mining adalah : Memudahkan pengambilan keputusan. Perusahaan dapat terus menganalisa dan mengotomatisasi keputusan rutin tanpa adanya penundaan karena penilaian manusia. Membuat prediksi akurat untuk perencanaan. Data mining membantu tahapan perencanaan dan memberikan informasi tepat untuk membuat prediksi berdasarkan tren masa lalu dan kondisi saat ini. Pengurangan biaya. Data mining memungkinkan perusahaan menggunakan alokasi dana lebih efisien karena otomatisasi pengambilan keputusan dapat mengurangi biaya. Mendapat wawasan tentang pelanggan. Perusahaan dapat mengetahui karakteristik antara pelanggan sehingga dapat merancang strategi yang dapat meningkatkan pengalaman pelanggan dengan tepat. Tujuan data mining Data mining dilakukan untuk memenuhi beberapa tujuan tertentu. Berikut ini adalah tujuan-tujuan dari data mining: Sebagai sarana menjelaskan (Explanatory) Data mining dapat digunakan sebagai sarana untuk menjelaskan suatu kondisi penelitian. Sebagai sarana konfirmasi (Confirmatory) Data mining dapat digunakan sebagai sarana untuk memastikan sebuah pernyataan atau mempertegas suatu hipotesis. Sebagai sarana eksplorasi (Exploratory) Data mining dapat digunakan sebagai sarana untuk mencari pola baru yang sebelumnya tidak terdeteksi.
Metode data mining
Secara prosesnya, data mining memiliki perencanaan dan metodologi yang menyeleraskan gagasan implementasi dari awal hingga akhir. Metode ini dapat dirangkum dalam dua metode utama data mining yang adalah sebagai berikut : 1. Pengambilan data Proses pengambilan data ini dilakukan secara bertahap melalui data mentah yang lantas diseleksi dan diolah menjadi sebuah informasi atau benang merah dari sebuah data. Adapun tahapan prosesnya meliputi beberapa hal seperti : Data cleansing, dalam tahapan awal menuju data mining ini data- data mentah dibersihkan dari error atau ketidaklengkapan dan inkonsistensi data. Data integration, tahapan ini dilakukan dengan proses pengintegrasian data yang telah dibersihkan dan dikombinasikan jika terjadi kesamaan data. Selection, tahapan ini dilakukan sebelum data mining untuk memilih dan menyeleksi data yang sudah dibersihkan untuk dicari relevansinya terhadap proses analisis atau basis data umum. Data transformation, tahapan ini dilakukan dengan menempatkan data-data yang relevan ke dalam prosedur data mining dengan proses agresi data. Data mining, tahapan utama dalam proses pengambilan data adalah data mining yaitu di mana identifikasi dilakukan dengan pengukuran atau persyaratan umum yang telah disepakati untuk mengambil pola-pola tertentu. Knowledge presentation, tahapan akhir ini dilakukan secara visual untuk memudahkan pengguna dalam memahami hasil dari data mining. 2. Teknik dalam proses data mining Proses data mining mencakup pemanfaatan alat analisis data yang disempurnakan untuk menemukan pola dan hubungan antar data. Pola dan relasi ini umumnya tidak diketahui sebelumnya karena berada di dalam kumpulan data yang amat besar. Alat-alat ini nantinya dapat menggabungkan model statistik, teknik machine learning, dan algoritma matematika. Hal-hal inilah yang lantas membuat data mining menjadi proses penggabungan antara analisis dan prediksi. Untuk memahami proses analisis dan prediksi tadi, data mining dapat dilakukan dengan beberapa teknik secara bertahap yang terdiri dari beberapa teknik berikut ini : Classification, teknik ini digunakan untuk memperoleh informasi penting dan relevan tentang data dan metadata. Teknik data mining ini membantu pengguna untuk mengklasifikasikan data ke dalam beberapa kelas berbeda. Clustering, teknik data mining ini merupakan proses pembagian informasi ke dalam kelompok-kelompok objek yang terhubung. Teknik clustering dilakukan untuk mengidentifikasi data yang serupa dan mengenali perbedaan atau persamaan antara data. Dari sudut pandang praktikal, clustering memainkan peran dalam menemukan pola tersembunyi dan eksplorasi data. Regression, teknik analisis regresi merupakan teknik data mining yang digunakan untuk mengidentifikasi dan menganalisis relasi antar variabel karena pengaruh faktor lain. Teknik ini digunakan untuk menentukan probabilitas variabel tertentu baik dalam perencanaan maupun pemodelan atau proyeksi. Association rules, teknik data mining ini dijalankan untuk membantu dan menemukan hubungan antara dua atau lebih item. Association rules juga dapat menemukan pola tersembunyi dalam kumpulan data. Tiga teknik pengukuran utama dalam teknik data mining ini meliputi Lift, Support, dan Confidence. Outer detection, teknik data mining jenis ini berkaitan dengan pengamatan item data dalam kumpulan data yang tidak sesuai dengan pola atau perilaku tertentu. Teknik ini dapat digunakan di berbagai domain seperti intrusi, deteksi, dan deteksi penipuan (fraud). Sequential patterns, teknik data mining ini merupakan teknik dengan pola sekuensial untuk mengevaluasi data dan menemukan pola sekuensial dari setiap subsekuen yang menarik dalam satu set urutan data. Pengambilan data subsekuen ini dilakukan dengan dasar beberapa kriteria seperti panjang, frekuensi kemunculan, dan sebagainya. Prediction, prediksi merupakan teknik kombinasi dari beberapa teknik data mining lainnya. Prediksi umumnya dipakai untuk menganalisis peristiwa atau kejadian di masa lalu dalam urutan tertentu untuk memperkirakan peristiwa di masa depan.
Penerapan Data Mining
Penggunaan data mining sendiri terbilang cukup luas. Biasanya teknik data mining digunakan untuk membangun model machine learning yang dapat mendukung aplikasi kecerdasan buatan modern seperti algoritma mesin pencari atau sistem pemberian rekomendasi. Selain itu, data mining kerap digunakan dalam berbagai industri dan disiplin ilmu seperti: Komunikasi Data mining digunakan oleh perusahaan multimedia dan telekomunikasi untuk memahami banyaknya data pelanggan, memprediksi perilaku mereka dan menawarkan kampanye yang sesuai target atau relevan. Asuransi Penerapan lain data mining adalah pada industri asuransi. Perusahaan asuransi umumnya menggunakan teknik data mining untuk mendeteksi penipuan, mengidentifikasi faktor risiko pada pengajuan klaim, analisa pelanggan, hingga untuk menemukan cara menawarkan produk kompetitif ke basis pelanggan yang ada. Manufaktur Data mining dimanfaatkan seperti untuk menyesuaikan rencana supply dan perkiraan permintaan, quality assurance, memprediksi aset produksi dan mengantisipasi pemeliharaan. Retail Digunakan untuk membantu perusahaan mengoptimalkan kampanye pemasaran, meningkatkan hubungan pelanggan dan memperkirakan penjualan. Pendidikan Data mining membantu tenaga mendidik dalam mengakses data siswa, memprediksi tingkat pencapaian dan memberi pandangan tentang siswa atau kelompok siswa mana saja yang membutuhkan perhatian ekstra. Perbankan Data mining membantu perusahaan jasa keuangan untuk mendapatkan pandangan yang lebih baik tentang risiko pasar, mendeteksi penipuan, mengelola pemenuhan peraturan dan untuk mendapatkan return optimal dari investasi pemasaran. Kesimpulan dan Penutup Berdasarkan uraian di atas, Data mining adalah proses pengumpulan dan pengolahan data yang bertujuan untuk mengekstrak informasi penting pada data. Proses pengumpulan dan ekstraksi informasi tersebut dapat dilakukan menggunakan perangkat lunak dengan bantuan perhitungan statistika, matematika, ataupun teknologi Artificial Intelligence (AI). Data mining sering disebut juga Knowledge Discovery in Database (KDD).