Anda di halaman 1dari 12

PEMROSESAN DATA

DATA MINING

DosenPengampu :

ENDANG ANGGIRATIH, S.T, M.Sc

Disusun Oleh :

AGUS ICHSANUDIN (17.5.00040)


CANDRAYANU W (17.5.00080)
MUH. AFRIZAL (17.5.00083)

JURUSAN TEKNIK INFORMATIKA


SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER
SINAR NUSANTARA
SURAKARTA
2020
KATA PENGANTAR

Alhamdulillahi Robbil ‘Alami, Segala puji bagi Allah SWT Tuhan Semesta
Alam. Atas segala karunia nikmatNya sehingga kami dapat menyusun makalah ini
dengan sebaik-baiknya. Makalah yang berjudul “Penerapan Data Mining dalam
Kehidupan Sehari - hari” disusun dalam rangka memenuhi salah satu tugas mata
pelajaran Data Mining yang diampu oleh Ibu Endang Anggiratih.

Makalah ini berisi tentang materi – materi tentang penerapan data mining
dalam kehidupan sehari – hari . Materi ini merupakan materi yang harus diketahui
dalam Mata Kuliah Data Mining. Dalam penyusunannya melibatkan berbagai pihak,
baik dari dalam kampus maupun luar kampus. Oleh sebab itu kami mengucapkan
banyak terima kasih atas segala kontribusinya dalam membantu penyusunan makalah
ini.

Meski telah disusun secara maksimal, namun penulis sebagai manusia biasa
menyadari bahwa makalah ini masih jauh dari sempurna. Karenanya penulis
mengharapkan kritik dan saran yang membangun dari pembaca sekalian.

Besar harapan kami makalah ini dapat menjadi sarana membantu mahasiswa
dalam pemahaman materi Data Mining dalam mata kuliah Data Mining.

Demikian apa yang bisa kami sampaikan, semoga pembaca dapat mengambil
manfaat dari karya ini.

Surakarta, 28 Maret 2020

Penulis

2
DAFTAR ISI
BAB I ...................................................................................................................................................... 1
PENDAHULUAN ................................................................................................................................. 1
1.1 Latar Belakang ................................................................................................................................ 1
1.2 Rumusan Masalah : ........................................................................................................................ 1
Batasan Masalah : ................................................................................................................................. 1
Tujuan : ................................................................................................................................................. 1
BAB II .................................................................................................................................................... 2
ISI ........................................................................................................................................................... 2
2.1. Pengertian Pemrosesan ................................................................................................................. 2
BAB III................................................................................................................................................... 4
HASIL DAN PEMBAHASAN ............................................................................................................. 4
BAB IV ................................................................................................................................................... 9
PENUTUP.............................................................................................................................................. 9

3
BAB I
PENDAHULUAN

1.1 Latar Belakang


Sistem pengolahan data merupakan kumpulan dari sub–sub yang saling
berhubungan satu sama lain secara harmonis dengan tujuan untuk mengolah data yang
berkaitan dengan masalah menjadi sistem informasi yang diperlukan .Dalam sistem
informasi ini terdiri atas orang, peralatan, prosedur yang ditunjukkan untuk
mengumpulkan, menganalisa dan membagi–bagi apa–apa yang dibutuhkan secara
tepat waktu dan informasi akurat yang akan digunakan. Didalam pemrosesan data,
perlu ada tahapan- tahapan dari pembersihan data, integrasi data, reduksi data,
penambahan data, normalisasi data, dan diskritisasi data.

1.2 Rumusan Masalah :


1. Memahami tahapan-tahapan pemrosesan data
2. Menerapkan tahapan-tahapan Pra-Pemrosesan data di suatu jurnal

Batasan Masalah :
1. ada beberapa proses yang tidak bisa di terapkan karena terkendala pada data yang
disajikan

Tujuan :
1. Untuk mempermudah memahami data, sehingga mempermudah pemilihan teknik
dan metode data mining yang tepat
2. Untuk meningkatkan kualitas data, sehingga hasil data mining menjadi lebih
Baik
3. Untuk meningkatkan efisiensi dan kemudahan proses penambangan data

1
BAB II
ISI

2.1. Pengertian Pemrosesan


Pemrosesan data atau data processing adalah jenis pemrosesan yang dapat
mengubah data menjadi informasi atau pengetahuan. Pemrosesan data ini sering
menggunakan komputer sehingga bisa berjalan secara otomatis. Setelah diolah, data
ini biasanya mempunyai nilai yang informatif jika dinyatakan dan dikemas secara
terorganisir dan rapi, maka istilah pemrosesan data sering dikatakan sebagai sistem
informasi. Kedua istilah ini mempunyai arti yang hampir sama, pemrosesan
data mengolah dan memanipulasi data mentah menjadi informasi (hasil pengolahan),
sedangkan sistem informasi memakai data sebagai bahan masukan dan menghasilkan
informasi sebagai produk keluaran.

Fungsi dan Tujuan Data Mming


 Fungsi Data mining
Data Mining mengidentifikasi fakta- fakta atau kesimpulan-kesimpulan yang
di sarankan berdasarkan penyaringan melalui data untuk menjelajahi pola-pola atau
anomali-anomali data. Data Mining mempunyai 5 fungsi:
a. Classification
Classification, yaitu menyimpulkan definisi-definisi karakteristik sebuah
grup. Contoh: pelanggan-pelanggan perusahaan yang telah berpindah
kesaingan perusahaan yang lain.
b. Clustering
Clustering, yaitu mengindentifikasikan kelompok-kelompok dari barang-
barang atau produk-produk yang mempunyai karakteristik
khusus(clustering berbeda dengan classification, dimana pada clustering
tidak terdapat definisi-definisi karakteristik awak yang di berikan pada
waktu classification.)
c. Association
Association, yaitu mengidentifikasikan hubungan antara kejadian-kejadian
yang terjadi pada suatu waktu, seperti isi-isi dari keranjang belanja.
d. Sequencing

2
Hampir sama dengan association, sequencing mengidentifikasikan
hubungan-hubungan yang berbeda pada suatu periode waktu tertentu,
seperti pelanggan-pelanggan yang mengunjungi supermarket secara
berulang-ulang.
e. Forecasting
Forecasting memperkirakan nilai pada masa yang akan datang berdasarkan
pola-pola dengan sekumpulan data yang besar, seperti peramalan
permintaan pasar.
 Tujuan Data Mining
Tujuan data mining antara lain:
a. Explanatory
Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa
penjualan truk pick up meningkat di colorado.
b. Confirmatory
Untuk mempertegas hipotesis, seperti halnya 2 kali pendapatan keluarga
lebih suka di pakai untuk membeli peralatan keluarga, di bandingkan
dengan satu kali pendapatan keluarga.
c. Exploratory
Menganalisis data untuk hubungan yang baru yang tidak di harapkan,
seperti halnya pola apa yang cocok untuk kasus penggelapan kartu kredit.

3
BAB III
HASIL DAN PEMBAHASAN

3.1. Menyiapkan Data


Data diambil dari penjualan store OPPO berupa tabel tabular.

TRANSA F1F R7S F1 JOY NEO 5 N3 N1


KSI PLUS PLUS MINI
1 1 1 1 0 0 0 0
2 1 1 0 1 0 0 0
3 0 1 1 0 1 0 0
4 1 0 1 0 0 1 0
5 1 1 1 0 0 0 0
6 1 1 0 0 0 0 1
7 1 1 0 1 0 0 0
8 1 0 0 0 1 0 1
9 0 0 1 0 0 1 1
10 1 0 1 0 1 0 0
11 1 1 1 1 0 0 0
12 0 0 1 0 1 0 0
Jumlah 9 7 8 3 4 2 3

3.2. Pembersihan Data


Pembersihan data dilakukan dengan cara menghilangkan nilai 0 dan
menjumlahkan nilai
Diperoleh data penjumlahan
TRANSA F1F R7S F1 JOY NEO 5 N3 N1
KSI PLUS PLUS MINI
JUMLAH 9 7 8 3 4 2 3

3.2.1. Binning
Setelah memperolah jumlah data selanjutnya adalah Binning Data tujuan Binning
adalah menkonversi data numerik menjadi data katagorik
 Partisi Equal-Width
Sebelum melakukan partisi data lebih dulu disusun dari data terkecil ke
data terbesar
TRANSA N3 N1 JOY NEO R72 F1 F1F
KSI MINI PLUS 5 PLUS
JUMLAH 2 3 3 4 7 8 9

Membagi jarak K interval dengan jarak yang sama.


2334789
Rumus : W = (Max - Min) / N
W=(9–2)/2
W = 7 / 2 = 3,5

4
a. 3,5 + 2 = 5,5 Bin 1 = 2, 3, 3,
b. 3,5 + 5,5 = 9 Bin 2 = 4, 7
c. 3,5 + 9 = 12,5 Bin 3 = 8, 9

Keterangan :
W = width
Max = nilai paling tinggi
Min = nilai paling rendah
N = Jumlah

 Partisi Equal-Dept (Frekuensi)


Partisi Equals-Deps ini digunakan untuk mengurangi variasi data, dengan
cara mengurutkan nilai-nila pada suatu atribut, lalu membaginya kedalam
sebuah wadah (bin) secara merata
a. Binning by means :
Bin 1 : (2 + 3 + 3 ) / 3 = 2,5 Bin 1 : (2,5), (2,5), (2,5), (2,5)
Bin 2 : (4 + 7) / 2 = 5,5 Bin 2 : (5,5), (5,5), (5,5), (5,5)
Bin 3 : (8 + 9) / 2 = 8,5 Bin 3 : (8,5), (8,5), (8,5), (8,5)
b. Binning Median :
Bin 1 : 3 Bin 1 : 3, 3, 3, 3
Bin 2 : (4+7)/2 = 5,5 Bin 2 : (5,5), (5,5), (5,5), (5,5)
Bin 3 : (8+9)/2 = 8,5 Bin 3 : (8,5), (8,5), (8,5), (8,5)
c. Binning by Boundaries :
Bin 1: (2+3)/2 = 2,5 2 < 2,5 , 3 > 2,5 , 3 > 2,5 Bin 1 : 2, 2, 3
Bin 2 : (4+7)/2 = 5,5 4 < 5,5 , 7 > 5,5 Bin 2 : 4,7
Bin 3 : (8+9)/2 = 8,5 8 < 8,5 , 9 > 8,5 Bin 3 : 8,9

3.3. Integrasi Data


Integrasi adalah melakukan penggabungan sejumlah basis data, didalam
mengintegrasi basis data perlu adanya meta data, yaitu data tentang data yaitu
segala hal yang menjelaskan tentang data, dengan misal nama atribut, arti
sinematik dari atribut, tipe data, rentang nilai. Tetapi didalam jurnal diatas basis
data hanya satu tabel yaitu tentang tabel tabulasi tentang penjualan handphone
merk OPPO selama 12 hari dan didalam tabel hanya terdapat merk hp dan nilai,
jadi proses integrasi data tidak dilakukan.
3.4. Reduksi Data
Reduksi data dilakukan setelah Intregrasi Data, yang mana saat menghadapi
masalah dengan himpunan data sangat besar secara jumlah, dimensi, maupun
keberbilangan dan dituntut untuk membangun sebuah sistem yang real time. Jadi
bagaimana data yang sangat besar yang membutuhkan waktu lama untuk
memproses dan dituntut untuk membangun sistem real time, dengan mereduksi
data itu menjadikan data lebih kecil tetapi tetap menjaga integritas yang terdapat
pada data asli, sehingga lebih effisien dan hasilnya akan sama / hampir sama

5
dengan hasil analisis yang dilakukan data asli. Proses reduksi data tidak dilakukan
karena pada proses integrasi data tidak dilakukan. Karena proses reduksi data
bergantung pada proses integrasi data.
Terdapat 3 teknik reduksi yaitu :
a. Reduksi Dimensi
Menyederhanakan sebaran data yang tadinya acak dan tumpang tindih agar
dapat dikelompokkan secara teratur sehingga mudah dianalisis.
- PCA (principal component analysis) yaitu metode matematis yang
mentransformasikan data kedalam ranah baru untuk memperjelas
visualisasi dan mempermudah analisis data.
TRANSA N3 N1 JOY NEO R72 F1 F1F
KSI MINI PLUS 5 PLUS
JUMLAH 2 3 3 4 7 8 9
SIMBOL

2
N3 N1 Mini JOYPLUS NEO 5 R72 F1PLUS F1F

b. Reduksi keterbilangan
Teknik mengganti data asli dengan representasi baru yang lebih sederhana,
yang bisa berupa parametik (data baru hanya berupa parameter-parameter).
- Histrogram
Adalah reduksi data dengan cara perwadahan (binning) seperti
pembersihan data
9

2
N3 N1 Mini JOYPLUS NEO 5 R72 F1PLUS F1F

6
didalam jurnal yang dibahas berikut gambarnya.

- Sampling
Adalah teknik memilih acak sejumlah data kecil yang repesentatif.

TRANSA N3 N1 JOY NEO R72 F1 F1F


KSI MINI PLUS 5 PLUS
JUMLAH 2 3 3 4 7 8 9
Menjadi

JUMLAH HARI JUMLAH TRANSAKSI JUMLAH MERK TERJUAL


12 36 7

3.5. Penambahan Data


Strategi penambahan dimensi baru dengan menggunakan fungsi logaritma / eksponensial
secara cepat dengan cara menambah dimensi baru tetapi ini dilakukan untuk
mempermudah proses data mining, misal dalam reduksi data dari 9 dimensi ke 2 dimensi,
tetapi dalam penambahan data itu menambah dimensi baru menjadi 3 dimensi.

3.6. Normalisasi Data


Nilai – nilai atribut data yang berbeda - beda rentangnya seringkali perlu
normalisasi agar proses data mining tidak bias.
Stretegi normalisasi ada 3 yaitu :
a. Normalisasi min-maks
Menggunakan nilai min dan maks untuk konversi data secara linier.

7
Rumus

b. Normalisasi penskalaan decimal


Dengan membagi nilai atribut
Rumus

c. Normalisasi z-score
Menormalisasi suatu nilai Xi pada atribut A menjadi nilai baru dengan rumus

3.7. Diskritisasi Data


Diskritisasi data yaitu mentransformasikan nilai atribut bertipe numerik menjadi nominal.
Ordinal. Atau binner, di jurnal ini didalam mentransformasikan nilai-nilai kontinu
menjadi nilai diskrit adalah :

serta dijurnal ini didalam mengolah menggunakan algoritma apppriori.

8
BAB IV
PENUTUP

Kesimpulan

Prapemrosesan adalah suatu urutan atau prosedur dengan tujuan untuk


mengolah data yang berkaitan dengan masalah menjadi sistem informasi yang
diperlukan, dan prapemrosesan diperlukan dalam mengolah data untuk membuat
suatu system agar bisa membantu agar lebih baik dan lebih terstruktur.

Daftar Pustaka

http://blog-elok.blogspot.com/2015/01/makalah-data-mining.html
Dr. Suyanto, S.T, M.Sc.(2010).Data Mining Untuk klasifikasi dan Klasterisasi
Data.PT.Informatika,Bandung.

Anda mungkin juga menyukai