Anda di halaman 1dari 5

1.

2 Pengantar Data MIning

Motivasi: 

Kebutuhan akan Pengetahuan yang ada pada Data 

• Problem ledakan data 

– Tool koleksi data otomatis dan perkembangan teknologi database menyebabkan


banyak sekali data yang bisa dikumpulkan di dalam database, data warehouse, dan alat
peyimpanan informasi lainnya, untuk dianalisa 

• Kita punya banyak data tapi tidak tahu pengetahuan yang tersimpan di dalamnya.

• Solusi: Penggudangan data dan penambangan data (Data warehousing and data


mining) 

– Data warehousing dan on-line analytical processing (OLAP) 

– Penyaringan pengetahuan yang menarik (kaidah, keberaturan, pola, kendala) dari data
dalam database yang besar.
1.3 Pengertian Data mining

Kalau kita membahas tentang Data Mining, tentulah kita


harus mengetahui terlebih dahulu definisi dari Data
Mining. Secara umum Data Mining terbagi atas 2(dua)
kata yaitu:
·  Data yaitu Kumpulan Fakta yang terekam atau sebuah entitas yang tidak memiliki arti
dan selama ini terabaikan.

·  Mining yaitu proses Penambangan


            Sehingga Data Mining itu dapat diartikan sebagai proses penambangan data
yang menghasilkan sebuah ouput (keluaran) berupa pengetahuan. Selain itu juga
Definisi Data Mining dapat dikutip dari beberapa sumber yaitu:

Menurut Pramudiono:
Data Mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks
dengan tujuan untuk menemukan pola atau kecenderungan yang penting yang biasanya
tidak disadari keberadaanya. (Pramudiono,2006)

Menurut Larose:
Data Mining merupakan analisis dari peninjauan kumpulan data untuk menemukan
hubungan yang tidak diduga dan meringkasdata dengan cara berbeda dengan cara
yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik
data. (Larose, 2005)

Data Mining  merupakan bidang dari beberapa bidang keilmuan yang menyatukan teknik
dari pembelajaran mesin, pengenalan pola, statistic,database, dan visualisasi untuk
penanganan permasalahan pengambilan informasi dari database yang besar. (Larose,
2005)

Mengapa kita perlu memahami Data Mining?  Karena manusia menghasilkan banyak


sekali Data yang sangat besar baik dalam bidang Bisnis, Kedokteran, Cuaca,

Olahraga, Politik dan sebagainya. Contohnya dalam Dunia Olahraga kita mengetahui
Dari FIFA berapa banyak Lionel Messi Mencetak Gol selama semusim, berapa banyak
Lionel Messi memberikan Asisst. Pada Bidang Bisnis khususnya Saham, kita
memperolehnya dari Bursa Efek Jakarta, kapan Harga Saham Naik maupun Turun. Pada
Bidang Cuaca kita mengetahui data tentang Curah Hujan, Suhu, Kelembaban dan lain
sebagainya.

Kita mengetahui bahwa setiap proses data melalui tiga fase yaitu input, proses dan
output. Dalam data mining, proses input adalah Himpunan Data, Prosesnya adalah
Algoritma atau metode dalam Data Mining  itu sendiri, dan Keluarannya adalah berupa
Pengetahuan dalam bentuk Pola, Decision Tree, Cluster  dan lain-lain. 
 

1.4 Faktor penyebab dilakukan data mining


          Analisa data mining berjalan pada data yang cenderung terus membesar dan
teknik terbaik yang digunakan kemudian beorientasi kepada data beukuran sangat besar
untuk mendapatkan kesimpulan dan keputusan paling layak. Data mining memiliki
beberapa sebutan atau nama lain yaitu : Knowledge discovery (mining) in databases
(KDD), ekstraksi pengetahuan (knowledge extraction), Analisa data/pola, kecerdasan
bisnis (business intelligence), dll.

         Meskipun sebagian besar teknik data mining seperti yang akan dijelaskan pada
bagian- lain laporan tugas akhir ini sudah ada sejak lama, namun hanya pada beberapa
tahun terakhir ini data mining benar-benar berperan yaitu sejak dilakukan
komersialisasi data mining.

Beberapa faktor yang mendukung perlunya dilakukan data mining adalah :

1. Data telah mencapai jumlah dan ukuran yang sangat besar

        Hasil dan proses data mining merupakan suatu informasi yang akan mendasari


tindakan tertentu sehingga tingkat kebenaran informasi tersebut menjadi sangat
signifikan, dan makin besar serta makin banyak data yang digunakan maka akan semakin
valid hasilnya. Perkembangan data dalam hal jumlah dan ukuran telah mencapai
kecepatan yang sangat cepat, sehingga ukuran basis data yang dimiliki oleh sebuah
perusahaan bisa mencapai kisaran gigabyte atau bahkan terabyte.

2.        Telah dilakukan proses data warehousing

             Untuk mencapai hasil yang memuaskan, maka sumber data yang digunakan
dalam proses data mining seringkali merupakan data gabungan dari banyak
departemen, daerah operasi bahkan dari sumber-sumber lain seperti data
kependudukan. Oleh karena itu maka disarankan perlunya proses data warehousing
untuk menjaga konsistensi, memberikan prespektif yang lebih baik terhadap data dan
menjaga integritas data.

3.        Kemampuan Komputasi yang semakin terjangkau

         Pada dasarnya proses data mining melakukan banyak akses terhadap data yang


sangat besar. Selain itu juga melakukan proses komputasi yang membutuhkan sumber
daya sangat besar. Penurunan harga yang cukup cepat terhadap perangkat keras
computer serta semakin tingginya kinerja yang berhasil dicapai oleh perangkat computer
maupun teknologi pengolahan data seperti teknologi pararel proses saat ini, menjadikan
proses saat ini, menjadikan proses data mining suduh cukup layak untuk dilakukan
secara komersial.

4.        Persaingan bisnis yang semakin ketat

         Tekanan persaingan bisnis yang semakin ketat mendorong perusahaan-


perusahaan untuk selalu berinovasi agar mampu meningkatkan daya saingnya dipasar
global. Beberapa tren yang berkembang saat ini adalah

a.       Setiap bisnis adalah bisnis pelayanan


b.       Adanya fenomena kustomisasi produk oleh masyarakat

c.       Informasi adalah produk

Presensi absen: warehouse

Anda mungkin juga menyukai