Anda di halaman 1dari 6

Penalaran dan prediksi berdasarkan data

Data tidak bisa digunakan sampai menjadi suatu informasi. Informasi ini memiliki beragam
bentuk seperti rangkuman data yang memberikan gambaran keseluruhan data atau trend atau
kecenderungan data serta adanya suatu outlier atau pola tertentu dalam data. dalam
perkembangan ilmu pengetahuan, melihat pola dalam sebuah data sangatlah penting. Munculnya
teori dan rumus di berbagai bidang seperti matematika Fisika biologi dan kimia adalah
berdasarkan pola dari data sekian banyak percobaan yang dilakukan.

Seiring dengan perkembangan teknologi, sebagai salah satu pengguna Pengolahan data untuk
melakukan prediksi titik bagaimana data yang digunakan sebagai prediksi? Ilustrasi sederhana
seperti berikut ini.

Anda diberikan data mengenai pertumbuhan penduduk di suatu negara dari tahun ke tahun.

2010 2015 2018 2020


98 juta 115 juta 150 juta ?

Bisakah anda membuat prediksi jumlah penduduk di tahun 2020? Anda dapat membuat
perkiraan sederhana menggunakan data yang sudah ada sebelumnya.

prediksi yang paling mudah adalah dengan anda memperpanjang garis lurus data dari tahun 2015
dan 2018 tik tik Anda dapat menentukan persamaan garis dengan rumus yang sudah anda
pelajari di SMP.

Dengan mengambil data pada tahun 2015 dan 2018 diperoleh 2 data ( 2015 115 ) dan
( 2018,150) diperoleh persamaan garisnya adalah

Y=11.67 X-23400.1

Di mana y adalah jumlah penduduk dan x adalah tahun titik Dengan demikian prediksi jumlah
penduduk di tahun 2020 adalah

Y = 11. 6 7 x 2020 -23 400. 1 = 173. 3 5 juta

cara lain yang dapat anda lakukan adalah dengan membuat fungsi kuadrat dari ketiga. Q tahun
2010-2015 dan 2018 dengan rumus

1|Page
Y = a X2 + bX + c

dengan subtitusi dan penyelesaian sistem persamaan kuadrat dapat diperoleh rumus y = 1. 0 3 x
kuadrat min 4 15 5.77 x +4 1 7 8 4 1 9

Dengan demikian prediksi jumlah penduduk di tahun 2020 adalah y = 1. 0 3 dalam kurung 2020
pangkat 2 dikurang 4 1 lima 5.77 dalam kurung 2020 tutup kurung + 4 1 7 8 4 1 9 = 183 titik
enam tujuh juta

cara seperti di atas adalah dengan menggunakan interpolasi yaitu membuat rumus fungsi suku
banyak yang melalui titik. Pada data awal. selain menggunakan interpolasiyaitu membuat rumus
fungsi suku banyak yang melalui titik-titik pada data titik selain menggunakan interpolasi, Anda
juga bisa menggunakan regresi yang pernah dibahas di penggunaan nya menggunakan Excel titik
persamaan baik dengan interpolasi maupun regresi disebut sebagai salah satu bentuk model data,
tepatnya model prediksi atau predictive model.

prediksi pada suatu data tidak selalu seperti contoh di atas, tergantung data yang ada dan
tujuannya. Suatu sistem rekomendasi juga contoh bentuk model prediksi yang lain sebagai
contoh seorang pemilik showroom mobil ingin memperkirakan apakah mobil bekas dengan ciri-
ciri karakteristik tertentu dapat terjual dengan cepat atau tidak ia bisa menggunakan data
terdahulu untuk mengetahui ciri-ciri mobil yang cepat terjual ataupun tidak titik dengan
algoritma tertentu ia bisa mendapatkan suatu aturan tertentuuntuk menentukan apakah sebuah
mobil terjual atau tidak dengan cepat . topik yang membahas permodelan prediktif seperti adalah
data mining. dengan data mining inilah suatu artifisial inteligentdapat dibentuk sehingga dapat
mendukung adanya revolusi industri seperti yang sudah dijelaskan sebelumnya. Data mining
sendiri adalah teknik mengeluarkan informasi yang tidak diketahui sebelumnya dan penting
dalam suatu data. Data dalam data mining adalah beberapa macam. adapun yang terkait dengan
dengan model predictive ini adalah klasifikasi dan regresi.

1. Teknik klasifikasi

2|Page
Dalam teknik klasifikasi diberikan data awal yang terbagi menjadi beberapa kelas atau kategori
tertentu. Teknik klafikasi menemukan model daridata awal sehingga jika ada data baru yang
masuk, Anda dapat memprediksi kelas atau kategorinya. Sebagai contoh dalam sebuah pabrik
tekstil yang memproduksi batik teknik klafikasi dapat digunakan untuk memprediksi apakah
suatu produk baik atau cacat atau penjaminan mutu atau quality assurance.caranya dengan
mengumpulkan data awal berupa gambar atau foto produk yang baik dan yang cacat. Dengan
algoritma tertentu poma anda akan memperoleh sebuah model klasifikasi titik ketika ada produk,
sistem akan memfoto produk tersebut kemudian dimasukkan model. Selanjutnya, pada sistem
akan muncul keputusan apakah produk tersebut lolos QA atau tidak.

untuk membangun suatu model klafikasi diperlukan data awal di mana masing-masing data
mempunyai kelas atau kategori. Sebagai data akan disisihkan sebagai training set untuk
mendapatkan model. Adapun sisanya digunakan sebagai testing set untuk menguji apakah model
yang dihasilkan baik atau tidak titik baik atau tidaknya sebuah model tergantung pada presentasi
keberhasilan model menebak kelas data testing dengan benar titik presentase keberhasilan
disebut dengan akurasi

Karena model digunakan dengan belajar dari training set maka dikenal dengan istilah learning
algoritma atau machine learning yang sering anda sebut dengan artificial intelligence. Ada
banyak teknik dalam membangun classifier, k nearest neighbor, artificial neural network atau
ANN dan support vector machine. Diantara algoritma tersebut yang paling mudah dipahami dan
diinterpretasikan adalah di dicision tree atau pohon keputusan titik teknik ini termasuk yang
paling banyak digunakan terutama untuk sistem rekomendasi berikut ini contoh model prediksi
kelas atau klasifikasi menggunakan pohon keputusan

3|Page
TES DI JALAN
YA

TIDAK MEMBELI TINGGI


JARAK
TEMPUH

BELI

UMUR
TUA MUDA

Pohon keputusan seperti contoh diatas merupakan model prediksi di mana seorang pelanggan
membeli mobil atau tidak model tersebut diperoleh dari data pengalaman sebelumnya. Jika
modal tidak dites jalan maka keputusan tidak dibeli jika boleh dites jalan maka dilihat jarak
tempuh dalam km mileage jika KM rendah maka dibeli jika KM tinggi maka dilihat usia mobil
jika masih baru maka dibeli jika tidak maka tidak dibeli

2. Regresi

analisis regresi merupakan salah satu teknik dalam statistika untuk menentukan hubungan sebab
akibat antara suatu variabel dengan variabel variabel lain. Variabel penyebab disebut dengan
berbagai macam istilah antara lain variabel penjelas, variabel eksplanatori variabel independen
atau secara bebas dan variabel x karena seringkali digambarkan dalam grafik sebagai absis atau
sumbu x variabel terkena akibat dikenal sebagai variabel yang dipengaruhi variabel dependen
variabel terikat atau variabel y. Kedua variabel ini dapat merupakan variabel acak atau random
tetapi variabel yang dipengaruhi harus selalu variabel acak.

4|Page
analisis regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya. Analisis
regresi dipakai secara luas untuk melakukan prediksi dan ramalan, dengan penggunaan yang
saling melengkapi dengan bidang pembelajaran mesin. Analisis ini juga digunakan untuk
memahami variabel bebas mana saja yang berhubungan dengan variabel terikat, dan untuk
mengetahui bentuk-bentuk hubungan tersebut .

Bagaimana model regresi bbisa diperoleh? Pada prinsipnya hal ini sesuai dengan metode
machine learning lainnya. Berangkat dari sekumpulan data dengan metode regresi akan
ditemukan rumus variabel tergantung (y ) dalam bentuk berbagai fungsi dari variabel-variabel
bebas, x 1 x 2... X berikut ini ilustrasi sederhana bagaimana persamaan regresi diperoleh

untuk mendapat prediksi data baru dibuat persamaan yang mewakili keseluruhan titik-titik
tersebut titik untuk data 2 dimensi seperti di atas, dapat dibentuk model dalam bentuk persamaan
linier y = b 0 + b 1x dengan meminimalkan error atau residu antara nilai data pada model dan
nilai data aslinya.

sikap model yang dibentuk akan menghasilkan error atau residu antara model dengan data asli
seperti gambar dibawah ini titik dengan teknik regresi, error ini akan dibuat seminimal mungkin
sehingga menghasilkan model pendekatan atau persamaan yang paling baik.

perlu Anda ketahui bahwa tidak semua model atau persamaan hasil regresi dapat diterima. Hal
ini karena untuk beberapa perilaku data tidak dapat selalu didekati dengan model regresi yang
sudah ada titik dengan kata lain tidak selalu model predictive baik, terkadang model yang
dihasilkan jauh dari harapan titik data statistik, setiap model regresi yang dihasilkan harus diuji
dulu secara statistik apakah model tersebut baik atau dapat diterima atau tidak berikut

dapat disimpulkan bahwa model prediksi dari suatu data tidak selalu memberikan hasil yang baik
titik oleh karena itu Anda perlu memeriksa beberapa baik model dapat memprediksi data titik
untuk metode klasifikasi, ujian model anda lakukan dengan menerapkan pada testing data hal ini

5|Page
untuk mengetahui akurasi model dalam memprediksi kelas dari suatu data pada data testing titik
adapun pada regresi dilakukan uji statistik tertentu untuk memeriksa apakah model yang
dihasilkan dapat diterima atau tidak titip software yang dapat digunakan untuk membuat model
sekaligus memeriksa beberapa baik model adalah software statistika seperti minitab atau SP PSS

6|Page

Anda mungkin juga menyukai