Anda di halaman 1dari 14

BIG DATA & DATA

MINING
Fakta Menarik
• Volume data bisnis di seluruh dunia, di semua perusahaan, berlipat ganda
setiap 1,2 tahun.

• 2500 kuadriliun data harian dihasilkan dan lebih dari 90 persen data
diproduksi dalam dua tahun terakhir.

• Dalam beberapa tahun terakhir biaya penyimpanan dan daya pemrosesan


turun secara signifikan.

• Facebook memproses 10 TB data setiap hari / Twitter 7 TB

• Google memiliki lebih dari 3 juta server yang memproses lebih dari 2 triliun
pencarian per tahun.
APA ITU ?
APA ITU BIG DATA ?
• Istilah Big data digunakan untuk menggambarkan volume besar dari data
terstruktur dan tidak terstruktur yang sangat besar sehingga sulit untuk
diproses menggunakan database tradisional dan teknik perangkat lunak

• Kumpulan data besar dalam terabyte dan petabytes.

• Kompleks dengan tipe dan format data yang berbeda.

• ‘Big Data’ mirip dengan data data kecil ’, tetapi lebih besar

• Data yang lebih besar memerlukan pendekatan yang berbeda: Teknik, alat,
dan arsitektur

• Dengan tujuan untuk memecahkan masalah baru atau masalah lama


dengan cara yang lebih baik
BERAPA BANYAK DATA YANG
ADA?
• 2,5 quintillion byte data dibuat SETIAP HARI

• IBM : 90 persen dari data di dunia saat ini diproduksi dari dua tahun
terakhir.

• Contoh : Data Ilmiah, Data Sensor, Data Internet.

• Rata-rata, orang menghabiskan sekitar 50 juta tweet per hari, Walmart


memproses 1 juta transaksi pelanggan per jam.
4V Big Data
MENGAPA BIG DATA PENTING?
• Pentingnya Big Data tidak berarti berapa banyak data yang kita miliki
tetapi apa yang akan kita dapatkan dari data itu. Kita dapat menganalisis
data untuk mengurangi biaya dan waktu, pengambilan keputusan yang
cerdas, dll.
APA ITU DATA MINING?
• Data Mining juga dikenal sebagai Knowledge Discovery of Data yaitu
penggalian pengetahuan dari sejumlah besar data yaitu Big Data. Terutama
digunakan dalam statistik, machine learning dan kecerdasan buatan . Ini
adalah langkah dari "Penemuan pengetahuan dalam database".

• Bisnis dan pemerintah berbagi informasi yang telah mereka kumpulkan


dengan tujuan referensi silang untuk mengetahui lebih banyak informasi
tentang orang-orang yang dilacak dalam database mereka.
KOMPONEN DALAM DATA
MINING
Komponen utama data mining terdiri dari 5 level, yaitu: -

• Ekstrak, ubah, dan muat data ke dalam Gudang (warehouse)

• Simpan dan kelola

• Menyediakan akses data (Komunikasi)

• Analisis (Proses)

• Antarmuka Pengguna (Menyajikan data ke pengguna)


UNTUK APA DATA MINING
DIBUTUHKAN ?
• Menganalisis hubungan dan pola dalam data transaksi yang tersimpan
untuk mendapatkan informasi yang akan membantu keputusan bisnis yang
lebih baik.

• Data mining membantu dalam Credit ratings , target pemasaran, deteksi


penipuan seperti jenis transaksi mana yang akan menjadi penipuan dengan
memeriksa transaksi pengguna sebelumnya, memeriksa hubungan
pelanggan seperti pelanggan setia dan yang akan pindah ke perusahaan
lain.
KEGUNAAN DATA MINING
Secara umum kegunaan data mining dapat dibagi menjadi dua :
• Deskriptif : berarti data mining digunakan untuk mencari pola-pola yang dapat dipahami
manusia yang menjelaskan karakteristik data.
• Prediktif : berarti data mining digunakan untuk membentuk sebuah model pengetahuan
yang akan digunakan untuk melakukan sebuah prediksi.
Berdasarkan fungsionalitasnya, tugas-tugas data mining dapat dikelompokan kedalam enam
kelompok berikut ini :
• Klasifikasi (classification)
• Klasterisasi (clustering)
• Regresi (regression)
• Deteksi anomali (anomaly detection)
• Pembelajaran aturan asosiasi (association rule learning)
• Perangkuman (summarization).
PERBEDAAN UTAMA ANTARA
BIG DATA DAN DATA MINING
• Big Data dan Data Mining adalah dua konsep yang berbeda, Big data
adalah mengacu pada sejumlah besar data sedangkan Data mining mengacu
pada drive yang dalam ke dalam data untuk mengekstraksi pengetahuan /
Pola / Informasi dari sejumlah kecil atau besar data .

• Konsep utama dalam Data mining adalah menggali lebih dalam untuk
menganalisis pola dan hubungan data yang dapat digunakan lebih lanjut
dalam kecerdasan buatan, analisis prediktif , dll. Namun konsep utama
dalam big data adalah sumber, variasi, volume data, dan cara menyimpan
dan memproses jumlah data ini.

• Menganalisis big data untuk memberikan solusi bisnis atau membuat


definisi bisnis memainkan peran penting untuk menentukan pertumbuhan.
HUBUNGAN ANTARA BIG DATA
DAN DATA MINING
• Dapat dikatakan bahwa data mining tidak harus bergantung pada big data
karena dapat dilakukan pada jumlah data yang kecil atau besar tetapi big
data pasti tergantung pada data mining karena jika kita tidak dapat
menemukan nilai / pentingnya sejumlah besar data maka data itu tidak ada
gunanya.

• Data mining menggunakan berbagai jenis alat dan perangkat lunak pada
Big data untuk menghasilkan pengetahuan baru. Seperti "mencari jarum di
tumpukan jerami"

• Singkatnya, big data adalah aset dan data mining adalah manajer yang
digunakan untuk memberikan hasil yang bermanfaat.

Anda mungkin juga menyukai