Anda di halaman 1dari 28

Bab

3
Model dan Prediksi Data

A. Mengingat Kembali Data


B. Model Data
C. Prediksi Data
D. Mengolah Data dengan
Weka

INFORMATIKA untuk SMA/MA Kelas XI


A. Mengingat Kembali Data
1. Numerik
Numerik merupakan tipe data yang biasanya didapatkan dari hasil
pengukuran kuantitatif. Pada tipe data numerik ini terdapat 2 tipe, yaitu
diskrit dan kontinu. Diskrit merupakan tipe data berbentuk bilangan
bulat dan tipe data kontinu merupakan tipe data yang rentangnya tidak
terbatas.
2. Kategorik
Kategorik merupakan tipe data yang berbentuk pilihan dan tidak
memiliki makna secara matematis.

3. Ordinal
Ordinal merupakan tipe data yang bisa dikatakan gabungan dari tipe
data numerik dan kategorik.
B. Model Data
Dengan membuat model data, kita dapat membuat perantara untuk
mentransformasi data agar dapat diproses oleh sistem/komputer.
1. Model Data Berdasarkan Objek
Model data jenis ini menggunakan pendekatan objek untuk
merepresentasikan sesuatu.
a. Model Entity-Relationship (ER)
Model ER merupakan model data yang paling populer dan paling banyak
digunakan saat ini. Model ER memetakan objek dunia nyata sebagai suatu
entitas.
Berikut merupakan karakteristik dan istilah yang digunakan dalam
pembuatan model ER.
1. Memetakan suatu objek sebagai entitas.
2. Set entitas merupakan kumpulan dari entitas-entitas yang sama.
3. Atribut merupakan karakteristik dari suatu entitas.
4. Relasi merupakan hubungan antara satu entitas dengan entitas lainnya.
5. Memetakan entitas, atribut, dan relasinya dengan menggunakan
simbol.
• One to one
One to one merupakan kardinalitas di mana satu entitas hanya dapat
berelasi dengan satu entitas lainnya dan berlaku kebalikannya.

• One to many
One to many merupakan jenis kardinalitas dimana satu entitas A
dapat berelasi dengan banyak entitas B lainnya.
• Many to one
Many to one merupakan jenis kardinalitas di mana satu entitas A
dapat berelasi hanya dengan satu entitas B.

• Many to many
Many to many merupakan jenis kardinalitas dimana banyak
entitas dapat berelasi dengan banyak entitas lainnya dan berlaku
kebalikannya.
Contoh.
Berikut ini merupakan contoh ER sederhana yang menggambarkan
hubungan dari 3 entitas, yakni siswa, ekstrakurikuler, dan guru.
Perhatikan model ER berikut ini.
b. Model Semantik
Model semantik adalah model yang mirip dengan model ER
di mana kita menggunakan relasi untuk menghubungkan
antarobjek. Namun, dalam model semantik ini relasi antar
objeknya tidak digambarkan dalam sebuah simbol, tetapi
diungkapkan dalam kata-kata.

Contoh.
Berikut ini merupakan contoh model semantik sederhana yang
menggambarkan hubungan antara bank, tabungan, dan customer.
Perhatikan model semantik berikut ini.
c. Model Data Berorientasi Objek
Model data berorientasi objek merupakan model data yang
menganggap objek dunia nyata sebagai objek. Pada model
data semantik dan ER kita dapat memetakan relasi
antarentitas/objeknya secara langsung.

Berikut merupakan karakteristik dan istilah yang digunakan dalam


pembuatan model data berorientasi objek.
1. Memetakan objek sebagai class.
2. Atribut merupakan karakteristik dari class.
3. Fungsi/prosedur merupakan sifat atau fungsi yang dapat
dilakukan oleh suatu class.

Contohnya adalah pada class mobil merupakan representasi dari


berbagai jenis mobil dunia nyata. Setiap mobil memiliki beberapa
atribut/karakteristik seperti jumlah kursi, jumlah pintu, jenis transmisi,
dan mesin. Selain itu, kita juga dapat mendefinisikan fungsi/prosedur
umum pada setiap mobil seperti maju, mundur, dan mengerem.
2. Model Data Berdasarkan Record
Model data berbasis record ini merupakan model data yang
merepresentasikan record data. Jika pada model data berdasarkan
objek kita membuat representasi data sebagai entitas, maka pada
model data berdasarkan record setiap data dinyatakan sebagai
suatu record.
a. Model Hierarki
Model hierarki merupakan model yang menggambarkan data dalam
bentuk pohon (tree). Setiap record digambarkan sebagai simpul/
node dengan hubungan parent-child.
• Parent-child
One to many: suatu parent bisa memiliki satu atau lebih
child
• Child-parent
One to one: suatu child hanya boleh memiliki satu parent
Contoh.
Perhatikan gambar berikut.

Pada contoh berikut kita dapat melihat bagaimana model hierarki


untuk menyimpan data dosen, mata kuliah, dan mahasiswa. Dosen
berperan sebagai parent di mana dosen mengampu beberapa mata
kuliah sebagai simpul. Setiap mata kuliah memiliki beberapa
mahasiswa yang merupakan child.
b. Model Jaringan
Model jaringan merupakan perbaikan dari model hierarki. Secara
umum representasi model jaringan sama dengan model hierarki,
tetapi pada model jaringan kita dapat memetakan hubungan many
to many antara parent dan child.

• Parent-child
One to many: suatu parent bisa memiliki satu atau lebih child.
• Child-parent
One to many: suatu child bisa memiliki satu atau lebih parent.
Contoh.
Perhatikan contoh model jaringan berikut.

Contoh berikut merupakan hasil modifikasi dari contoh


sebelumnya pada model hierarki. Pada model jaringan ini,
child diperbolehkan memiliki lebih dari 1 parent sehingga
tidak terjadi redudansi.
c. Model Relasional

Model ini akan membentuk tabel yang terdiri atas record dan
column. Satu tabel dalam model relasional mirip seperti set entitas
pada model ER. Sementara record adalah satu entitas dan column
adalah atribut pada model ER.

Kelebihan dari model relasional adalah sebagai berikut.


• Mudah dipahami.
• Mudah jika ingin melakukan perubahan pada data.
• Mudah melakukan pencarian.
• Mudah ditransformasi dari model ER.
Contoh.
Perhatikan contoh model jaringan berikut.

Contoh berikut adalah contoh model relasional dengan 3 tabel


utama yakni siswa, guru, dan ekstrakurikuler. Guru memiliki relasi
one to one dengan ekstrakurikuler, dan kita menempatkan NIK yang
merupakan primary key guru pada table ekstrakurikuler. Sementara
hubungan ekstrakurikuler dan siswa adalah many to many dan kita
membuat tabel baru yang menampung kedua primary key dari
kedua tabel tersebut.
C. Prediksi Data
Prediksi data adalah kegiatan yang dilakukan untuk meramalkan
atau memprediksi segala hal yang terkait dengan data-data
besar seperti produksi, penawaran, permintaan, dan
penggunaan teknologi dalam sebuah industri atau usaha.

Prinsip kerja
machine
learning dalam
prediksi
data.
1. Supervised Learning
Supervised learning merupakan metode pembelajaran dengan
menggunakan label dalam mempelajari dan menghasilkan
pengetahuan.
a. Estimasi
Estimasi merupakan salah satu jenis supervised learning dimana
pembelajaran pada data dilakukan menggunakan fitur dan
labelnya.

Data tersebut merupakan contoh data harga rumah berdasarkan


spesifikasinya.
Kita akan menyebut harga (dalam juta) sebagai label, sementara
spesifikasi-spesifikasi lain seperti luas tanah, luas bangunan, jumlah
lantai, kamar mandi dan kamar tidur sebagai fitur. Pada contoh
tersebut misal kita punya 1000 data rumah beserta fitur dan
labelnya (harga) untuk dipelajari oleh algoritma pembelajaran.
Setelah data tersebut dipelajari, kita berharap algoritma yang
sudah dilatih dapat melakukan estimasi harga untuk data baru yang
tidak ada pada data tersebut.
b. Prediksi
Sama halnya dengan estimasi, prediksi juga memerlukan label bersama
dengan fiturnya untuk dipelajari dan menggunakan tipe numerik.
Namun, pada prediksi data yang digunakan adalah data yang berbasis
waktu (time series).

Tabel tersebut adalah contoh data saham dengan bentuk time series.
Dengan menggunakan pendekatan prediksi kita dapat
memprediksi nilai yang akan terjadi pada waktu berikutnya
berdasarkan data-data waktu yang sudah ada tersebut.

Adapun beberapa algoritma dan metode yang dapat


digunakan untuk prediksi time series di antaranya sebagai
berikut.
• ARIMA
• Artificial neural network
• Moving average
c. Klasifikasi
Klasifikasi merupakan salah satu jenis dari supervised learning
Di mana kita membutuhkan label dalam proses pembelajaran.
Beberapa algoritma pembelajaran yang dapat digunakan untuk
kasus klasifikasi di antaranya sebagai berikut.
• Logistic regression
• Artificial neural network
• Support vector machine (SVM)
• Decision tree
• Naïve bayes

d. Asosiasi Perhatikan contoh data pembelian


Pada umumya pendekatan barang berikut.
asosiasi digunakan pada
kasus pembelian barang.
Dengan menggunakan
asosiasi kita akan mengecek
ketergantungan suatu
barang terhadap barang
lainnya.
Setiap transaksi terdiri atas beberapa barang pembelian.
Misalnya, dengan menggunakan data tersebut kita ingin
mengetahui ketergantungan antarbarang satu sama lain,
sehingga dapat kita gunakan untuk mengatur strategi bisnis.

Adapun beberapa algoritma yang dapat digunakan untuk kasus


asosiasi di antaranya adalah sebagai berikut.
• FP growth
• Apriori
2. Unsupervised Learning
Unsupervised learning merupakan metode pembelajaran yang
tidak menggunakan label dalam mempelajari dan menghasilkan
pengetahuan.

a. Clustering
Clustering merupakan jenis unsupervised learning di mana kita tidak
memerlukan label untuk pembelajaran.
Contoh tersebut merupakan data gaji dan usia dari sampel 95 orang.
Adapun gaji dan usia adalah fitur dan Anda tidak memiliki label pada
contoh tersebut. Anda akan melakukan clustering untuk melakukan
pengelompokkan data berdasarkan gaji dan usia tersebut tanpa
melihat label yang ada. Sebagai contoh, Anda ingin melakukan
pengelompokkan data menjadi 3 jenis. Maka hasil yang didapatkan
adalah sebagai berikut.
Terima Kasih

“Jadilah pribadi yang selalu siap menjalani


setiap rintangan yang dating padamu.“

B.J Habibie
Created
By:
Yulistya
Pratiwi

Anda mungkin juga menyukai