Anda di halaman 1dari 21

KEMENTERIAN KEUANGAN REPUBLIK INDONESIA

BADAN PENDIDIKAN DAN PELATIHAN KEUANGAN

POLITEKNIK KEUANGAN NEGARA STAN

TANGERANG SELATAN

TUGAS PENELITIAN

Prediksi Keterjadian Inflasi Daerah Tahun 2017-2018 berdasarkan Harga Bahan Makanan
Bergejolak (Volatile Food Price) : Analisis Menggunakan Data Mining

Disusun oleh:
Lutgard Ritanto J. (17)
Satya Permadi (30)

Dosen: Khamami Herusantoso

KELAS 8-01

Untuk Memenuhi Tugas Mata Kuliah Sistem Informasi Manajemen

Program Diploma IV Akuntansi Alih Program – Non Akuntansi

Semester VIII T.A. 2018/2019

DAFTAR ISI
JUDUL ....................................................................................................................................................... i

DAFTAR ISI............................................................................................................................................... ii

DAFTAR GAMBAR................................................................................................................................... iii

DAFTAR GRAFIK...................................................................................................................................... iv

DAFTAR TABEL ........................................................................................................................................ v

DAFTAR GAMBAR................................................................................................................................... vi

BAB I PENDAHULUAN............................................................................................................................. 1

A. Latar Belakang .............................................................................................................................. 1

B. Rumusan Masalah ........................................................................................................................ 2

C. Tujuan dan Manfaat Penelitian .................................................................................................... 2

BAB II LANDASAN TEORI ........................................................................................................................ 3

A. Inflasi ............................................................................................................................................ 3

B. Pengukuran Inflasi ........................................................................................................................ 4

C. Komponen Pembentuk Inflasi ...................................................................................................... 5

D. Harga Makanan Bergejolak (Volatile Food Price) ......................................................................... 7

E. Data Mining .................................................................................................................................. 8

BAB III HASIL DAN PEMBAHASAN........................................................................................................ 11

A. Business Understanding ............................................................................................................. 12

B. Data Understanding ................................................................................................................... 12

C. Data Preparation ............................................................................................................................

D. Modeling.........................................................................................................................................

E. Evaluation .......................................................................................................................................

F. Deployment ....................................................................................................................................

BAB IV PENUTUP ......................................................................................................................................

A. Kesimpulan .....................................................................................................................................

B. Keterbatasan ................................................................................................................................ 5

C. Saran ............................................................................................................................................. 5

ii
REFERENSI .................................................................................................................................................

iii
BAB I

Pendahuluan

A. Latar Belakang

Komoditas bahan pangan mempunyai peranan yang sangat penting dalam aspek ekonomi,
sosial, dan politik (Prabowo, 2014). Harga komoditas bahan pangan sendiri sangat dipengaruhi oleh
kestabilan distribusi permintaan dan penawaran. Harga komoditas sering mengalami fluktuasi
dikarenakan oleh beberapa faktor yaitu, produksi bahan pokok mengalami gagal panen akibat cuaca,
gangguan hama serta faktor perkembangan harga bahan pokok akan mengganggu jalannya distribusi.
Di Indonesia harga komoditas bahan pangan yang sering mengalami fluktuasi harga antara
lain beras, jagung, kedelai tepung terigu, gula pasir, minyak goreng, bawang merah, cabe,telur, daging
dan susu (Sumaryanto, 2009). Perubahan harga komoditas bahan pangan dapat menjadi penyumbang
terbesar laju inflasi dikarenakan dengan jumlah penduduk yang cukup besar, permintaan bahan
makanan akan menjadi cukup tinggi. Namun terkadang penawaran belum cukup mampu untuk
memenuhi permintaan tersebut, sehingga akhirnya mendorong laju inflasi (Santoso,2011).
Inflasi merupakan fenomena moneter yang selalu menjadi perhatian utama Bank sentral atau
otoritas moneter. Pasalnya, inflasi yang tidak terkendali akan menggerus daya beli masyarakat
terhadap barang dan jasa sehingga kesejahteraan masyarakat menurun. Oleh karena itu, pengendalian
inflasi merupakan tugas penting yang diemban bank sentral atau otoritas moneter dalam mendukung
tercapainya peningkatan kesejahteraan rakyat.
Secara umum, setiap negara menginginkan terciptanya laju inflasi yang rendah dan stabil.
Pada tingkat yang rendah dan stabil, inflasi memberikan efek positif bagi perekonomian. Konsumen
akan lebih mudah melakukan perencanaan konsumsi dan tergerak menabung karena daya beli tidak
akan tergerus oleh inflasi. Inflasi yang rendah umumnya dibarengi suku bunga yang rendah, sehingga
mendorong dunia usaha berinvestasi untuk peningkatan produksi yang akhirnya mendorong
pertumbuhan ekonomi. Sebaliknya, inflasi yang tinggi menimbulkan ketidakpastian sehingga
mengurangi insentif untuk investasi dan konsumsi serta menggerus daya saing ekspor domestik.
Inflasi yang tinggi juga menjadi masalah sosial karena dampaknya langsung dirasakan oleh
masyarakat berpendapatan rendah. Masyarakat kelas bawah merupakan golongan yang paling rentan
terhadap inflasi karena pergerakan upah mereka relatif lamban. Dengan melihat dampak negatif
inflasi yang tinggi tersebut, maka target untuk menciptakan inflasi yang rendah dan stabil hampir pasti
menjadi tujuan dari setiap pemerintah yang berkuasa.

1
B. Rumusan Masalah

Perkiraan tingkat inflasi yang akurat sangat dibutuhkan bagi pemerintah untuk merumuskan
kebijakan. Jika inflasi dapat diprediksi, pemerintah dapat membuat kebijakan untuk melindungi
masyarakat dari dampak kenaikan harga. Dari sekian banyak faktor pembentuk inflasi, penulis
merumuskan masalah yaitu apakah harga makanan bergejolak dapat dijadikan dasar untuk
memprediksi tingkat inflasi bulanan tiap daerah.

C. Tujuan dan Manfaat Penelitian

Penelitian ini bertujuan untuk mengetahui apakah pergerakan harga makanan bergejolak dapat
digunakan untuk memprediksi tingkat inflasi bulanan di daerah. Hasil penerlitian ini nantinya dapat
dijadikan prototipe model prediksi yang melibatkan lebih banyak faktor, seperti komponen inflasi inti
dan komponen harga yang diatur pemerintah(administered price).

2
BAB II

LANDASAN TEORI

A. Inflasi

Fluktuasi harga barang dan jasa adalah hal yang umum kita alami dalam kehidupan sehari-
hari. Sebagai contoh, tarif hotel dan tarif angkutan udara meningkat pada saat akhir minggu atau
musim liburan. Kenaikan ini terjadi karena meningkatnya permintaan (demand) akan jasa transportasi
dan penginapan. Pada saat lainnya, kita mengalami harga beras naik karena kegagalan panen atau
sebaliknya turun karena panen yang melimpah. Fluktuasi harga, khususnya kenaikan harga pada suatu
komoditas, yang terjadi karena perubahan demand dan supply sesaat tersebut tidak selalu
menimbulkan dampak inflasi.

Dalam konsep makroekonomi, inflasi didefinisikan sebagai kenaikan harga barang dan jasa
secara umum dan terus menerus. Sebagaimana ditulis Suseno dan Astiyah (2009), dalam konteks
tersebut terdapat dua pengertian penting yang merupakan kunci dalam memahami inflasi yaitu
kenaikan harga secara umum dan terus-menerus. Hanya kenaikan harga yang terjadi secara umum
yang dapat disebut inflasi. Kenaikan harga pada komoditas tertentu yang terjadi karena faktor
musiman, misalnya menjelang hari-hari besar atau karena gangguan supply sesaat dan tidak
mempunyai pengaruh lanjutan, tidak disebut inflasi.

Menurut Bank Indonesia, Secara sederhana inflasi diartikan sebagai kenaikan harga secara
umum dan terus menerus dalam jangka waktu tertentu. Kenaikan harga dari satu atau dua barang saja
tidak dapat disebut inflasi kecuali bila kenaikan itu meluas (atau mengakibatkan kenaikan harga) pada
barang lainnya. Kebalikan dari inflasi disebut deflasi.

Konsep nilai dari uang (time value of money) menunjukan seberapa besar nilai uang pada saat
ini memiliki nilai yang sama di masa yang akan datang, dengan asumsi uang tersebut tidak
diinvestasikan dalam surat-surat berharga atau disimpan dalam tabungan dan sejenisnya yang
menghasilkan bunga. Semakin besar inflasi, maka semakin besar pula penurunan nilai uang. Dengan
kata lain, jumlah barang dan jasa yang bisa dibeli dengan sejumlah rupiah pada saat ini akan semakin
sedikit jika terjadi inflasi di tahun depan.

B. Pengukuran Inflasi

3
Inflasi umumnya diukur dalam ruang lingkup yang luas yaitu total kenaikan hargaharga atau
peningkatan biaya hidup di suatu negara. Namun demikian, inflasi juga dapat diukur dalam ruang
lingkup yang lebih kecil yaitu untuk suatu kelompok komoditas, misalnya komoditas makanan dan
jasa. Karenanya, kita sering mendengar istilah seperti inflasi kelompok bahan makanan dan inflasi
kelompok perumahan. Semakin berkembang suatu perekonomian dan semakin banyak barang dan
jasa yang dikonsumsi masyarakat, maka penghitungan inflasi juga menjadi semakin kompleks.

Untuk mengukur perubahan inflasi dari waktu ke waktu, pada umumnya digunakan suatu
angka indeks. Angka indeks disusun dengan memperhitungkan sejumlah barang dan jasa yang akan
digunakan untuk menghitung besarnya angka inflasi. Kelompok barang dan jasa yang dipilih tersebut
diberi bobot sesuai tingkat signifikansi serta intensitas penggunaannya oleh masyarakat. Semakin
besar tingkat penggunaan suatu barang dan jasa, semakin besar pula bobotnya dalam penghitungan
indeks. Dengan demikian, perubahan harga barang dan jasa yang memiliki bobot besar akan memiliki
dampak yang lebih besar pula terhadap inflasi. Perubahan angka indeks dari satu waktu ke waktu
yang lain, yang dinyatakan dalam angka persentase, adalah besarnya angka inflasi dalam periode
tersebut.
Angka indeks yang umum dipakai untuk menghitung besarnya inflasi adalah:
1) Producer Price Index (PPI)/Indeks Harga Produsen (IHP)
Producer Price Index atau Indeks Harga Produsen (IHP) mengukur perubahan harga yang
diterima produsen domestik untuk barang yang mereka hasilkan. IHP mengukur tingkat harga
yang terjadi pada tingkat produsen.
2) Wholesale Price Index/Indeks Harga Perdagangan Besar (IHPB)
Indeks Harga Perdagangan Besar mengukur perubahan harga untuk transaksi yang terjadi
antara penjual/pedagang besar pertama dan pembeli/pedagang besar berikutnya dalam jumlah
besar pada pasar pertama. Di beberapa negara termasuk Indonesia, IHPB merupakan indikator
yang menggambarkan pergerakan harga dari komoditas-komoditas yang diperdagangkan di
suatu daerah.
3) Consumer Price Index (CPI)/Indeks Harga Konsumen (IHK)
Consumer Price Index adalah indeks yang yang paling banyak digunakan dalam
penghitungan inflasi. Indeks ini disusun dari harga barang dan jasa yang dikonsumsi oleh
masyarakat. Jumlah barang dan jasa yang digunakan dalam penghitungan angka indeks
tersebut berbeda antarnegara dan antarwaktu, bergantung pada pola konsumsi masyarakat
akan barang dan jasa tersebut. Sebagai contoh, di Indonesia pada awalnya hanya digunakan
sembilan bahan pokok (meliputi pangan, sandang, dan perumahan) yang dikonsumsi
masyarakat. Dalam perkembangannya, jumlah barang dan jasa tersebut berkembang menjadi
semakin banyak dan tidak hanya meliputi pangan, sandang, dan papan, tetapi juga mencakup,
antara lain, jasa kesehatan dan pendidikan.

4
C. Komponen Pembentuk Inflasi

Umumnya, inflasi dibagi berdasarkan karakteristik atau sifat perubahan harga dari kelompok
barang dan jasa. Beberapa karakteristik atau sifat tersebut diantaranya apakah barang dan jasa tersebut
cenderung sensitif terhadap kondisi tertentu, apakah perubahan inflasinya cenderung lebih disebabkan
peraturan regulator, dan sebagainya. Jika kita mendengar kalimat “inflasi tahunan mencapai xx%,”
biasanya inflasi dimaksud mengacu pada laju inflasi umum atau headline inflation (inflasi IHK), atau
secara sederhana bisa dikatakan sebagai inflasi keseluruhan yang merupakan tingkat kenaikan harga
secara umum dalam periode tertentu. Gambar 1.1 menunjukkan komponen pembentuk inflasi.

Sumber : bi.go.id

Di Indonesia, komponen inflasi IHK tersebut dikelompokan menjadi:


1. Inflasi Inti, yaitu komponen inflasi yang cenderung menetap atau persisten (persistent
component) di dalam pergerakan inflasi dan dipengaruhi oleh faktor fundamental, seperti:

 Interaksi permintaan-penawaran
 Lingkungan eksternal: nilai tukar, harga komoditi internasional, inflasi mitra dagang
 Ekspektasi Inflasi dari pedagang dan konsumen

5
2. Inflasi non Inti, yaitu komponen inflasi yang cenderung tinggi volatilitasnya karena
dipengaruhi oleh selain faktor fundamental. Komponen inflasi non inti terdiri dari :

 Inflasi Komponen Bergejolak (Volatile Food) : Inflasi yang dominan dipengaruhi oleh
shocks (kejutan) dalam kelompok bahan makanan seperti panen, gangguan alam, atau
faktor perkembangan harga komoditas pangan domestik maupun perkembangan harga
komoditas pangan internasional.

Inflasi Komponen Harga yang diatur Pemerintah (Administered Prices) : Inflasi yang dominan
dipengaruhi oleh shocks (kejutan) berupa kebijakan harga Pemerintah, seperti harga BBM bersubsidi,
tarif listrik, tarif angkutan, dll.

D. Harga Makanan Bergejolak (Volatile Food Price)

Harga yang terbentuk untuk suatu komoditas merupakan hasil interaksi antara
penjual dan pembeli. Harga yang terjadi sangat dipengaruhi oleh kuantitas barang yang
ditransaksikan. Dari sisi pembeli (demand, D) semakin banyak barang yang ingin dibeli akan
meningkatkan harga, sementara dari sisi penjual (supply, S) semakin banyak barang yang
akan dijual akan menurunkan harga. Banyak faktor yang dapat mempengaruhi perilaku
permintaan maupun penawaran dalam interaksi pembentukan harga. Namun untuk komoditas
pangan/pertanian, pembentukan harga tersebut disinyalir lebih dipengaruhi oleh sisi
penawaran (supply shock) karena sisi permintaan cenderung stabil mengikuti perkembangan
trennya.

Faktor-faktor yang mempengaruhi sisi penawaran komoditas pangan/pertanian


cenderung sulit untuk dikontrol. Studi empiris yang dilakukan oleh Deaton dan Laroque
(1992), Chambers dan Bailey (1996) dan Tomek (2000) menyimpulkan dua faktor yang
sangat berpengaruh terhadap pembentukan harga komoditas pangan/pertanian, yakni faktor
produksi/panen (harvest disturbance) dan perilaku penyimpanan (storage/inventory
behavior). Walaupun keberhasilan panen sangat dipengaruhi oleh kondisi musim/cuaca yang
sifatnya uncontrolable, pengaruh pola tanam terhadap perkembangan harga komoditas
pertanian di Amerika Serikat terlihat sangat dominan. Terdapat pola cyclical yang sistematis
antara pola tanam dan variance harga komoditas. Variance harga membesar pada saat musim
tanam dan mengecil pada saat musim panen. Sementara keberadaan teknologi menyimpanan
atas produk pertanian, khususnya untuk produk yang mudah busuk/basi (durable products),
akan mengurangi tekanan fluktutasi harga dari komoditas tersebut.

6
Pada negara berkembang, perubahan harga cenderung berpengaruh lebih kuat pada inflasi
dibandingkan komponen inti inflasi (Walsh, 2011). Penyebabnya adalah mayoritas masyarakat di
negara berpenghasilan rendah menghabiskan penghasilannya untuk makan. Pergerakan harga sedikit
saja akan berpengaruh secara langsung pada tingkat inflasi. Berbeda dengan negara maju, pengaruh
pergerakan harga makanan tidak begitu terasa karena proporsi penghasilan yang dihabiskan untuk
makan relatif kecil. Bank sentral negara maju harus lebih waspada terhadap perubahan harga ini dan
menjaga agar daya beli masyarakan tetap stabil dengan berbagai stimulus.

E. Data Mining

1. Definisi dan Atribut Data Mining.


Data mining dapat diartikan sebagai proses penambangan data yang menghasilkan sebuah output
(keluaran) berupa pengetahuan. Han, J. et al (2012) mendefinisikan “data mining is the process of
discovering interesting patterns and knowledge from large amounts of data” atau secara sederhana
diartikan sebagai proses penemuan pola yang menarik dan pengetahuan dari banyak data. Data diolah
menjadi informasi, lalu informasi akan menjadi pengetahuan yang bermanfaat dalam pengambilan
keputusan. Untuk itulah, data mining dilakukan dalam rangka memberikan informasi yang lebih
bermanfaat.Data mining dapat digunakan untuk membangun model prediktif yang dapat dijadikan
bahan pertimbangan bank sentral dan pemerintah untuk merumuskan kebijakan fiskal maupun
moneter untuk menjaga tingkat inflasi dan daya beli masyarakat.
Penggunaan atribut dikenal dalam teknik data mining. Menurut Han et al., (2012), atribut
merupakan field data yang menggambarkan karakteristik suatu data objek. Dalam berbagai literatur,
atribut sering disebut juga dimensi, fitur, atau variabel. Jenis atribut berdasarkan kemungkinan nilai
terbagi menjadi enam jenis, antara lain:
a. Atribut Nominal.
Nilai dari atribut nominal merupakan simbol atau nama dari sesuatu. Setiap nilai menggambarkan
jenis kategori, kode, atau status sehingga atribut ini disebut sebagai kategorial. Contoh atribut
nominal seperti status_marital, warna_rambut, dan pekerjaan.
b. Atribut Binary.
Atribut binary merupakan atribut nominal yang hanya memiliki 2 kategori, yakni 0 atau 1, di
mana 0 berarti atribut tersebut tidak ada (absent) dan 1 berarti atribut tersebut ada (present).
Atribut binary terbagi menjadi atribut simetris dan asimetris.
c. Atribut Ordinal.
Atribut ordinal merupakan atribut yang nilainya kemungkinan bisa diurutkan, tetapi jarak atas
masing-masing nilai tidak bisa diukur dengan pasti.
d. Atribut Numeric.

7
Atribut numeric merupakan atribut kuantitatif yang dapat diukur nilainya dengan pasti karena
berupa bilangan atau nilai riil. Atribut ini bisa berupa skala interval atau skala rasio.
e. Atribut Diskrit dan Kontinu.
Selain keempat atribut di atas, atribut dapat dibagi menjadi atribut diskrit dan atribut
kontinu. Atribut diskrit memiliki set nilai yang terbatas, dan dapat direpresentasikan
menggunakan bilangan bulat ataupun tidak. Apabila atribut bukan dinyatakan sebagai
atribut diskrit, maka atribut tersebut dianggap kontinu. Atribut kontinu dan atribut
numerik sering dipersamakan dalam berbagai literatur. Atribut kontinu memiliki set nilai
yang tidak terbatas, umumnya direpresentasikan menggunakan bilangan riil.
f. Atribut turunan (derived attribute).
Dalam sebuah basis data, atribut yang ada biasanya memiliki tujuan hanya sekedar untuk
menyimpan rekaman (record keeping) sehingga atribut tersebut bisa jadi tidak cocok untuk
digunakan dalam data mining. Maka perlu dibuat sebuah atribut baru dari atribut yang sudah ada.
Atribut ini disebut sebagai atribut turunan (Lin 2002).

2. Tahapan dan Teknik Data Mining.


Secara garis besar proses penggalian data terdiri dari tiga tahapan yaitu tahap pertama
eksplorasi awal, tahap kedua pembangunan model atau pola dengan validasi/verifikasi, dan tahap
terakhir deployment.
a. Eksplorasi Awal.
Tahap pertama ini dimulai dengan persiapan data yang terdiri dari pembersihan data, transformasi
data, pemilihan record, dan melakukan beberapa kegiatan pemilihan fitur awal untuk menentukan
range dari jumlah variabel agar dapat diolah.
b. Pembangunan Model/Pola.
Tahapan ini dilakukan dengan mempertimbangkan berbagai variasi model dan memilih satu
model terbaik berdasarkan predictive performance. Beberapa teknik yang dapat digunakan dalam
tahapan ini adalah Bagging (Voting, Averaging), Boosting, Stacking (Stacked Generalizations),
dan Meta-Learning.
c. Deployment.
Tahap terakhir dari proses data mining terdiri dari penggunaan model terbaik yang telah dipilih
pada tahapan sebelumnya dan menerapkannya dalam data baru untuk menghasilkan prediksi atau
estimasi yang diharapkan.

Selanjutnya, menurut Pramudiono (2003) ada tiga teknik yang populer di dalam data mining, yaitu:
a. Association.
Teknik ini digunakan untuk menemukan aturan asosiatif antara kombinasi suatu item untuk
menunjukkan hubungan antara objek data.

8
b. Classification.
Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data, dengan tujuan untuk memperkirakan kelas dari suatu objek
yang labelnya tidak diketahui. Model itu sendiri dapat berupa aturan jika-maka (if-then), pohon
keputusan (decision tree), dan jaringan saraf tiruan (neural network).
c. Clustering.
Clustering melakukan pengelompokan data tanpa berdasarkan kelas data tertentu. Clustering
dapat dipakai untuk memberikan label pada kelas data yang belum diketahui.

BAB III

Hasil Penelitian dan Pembahasan

Dalam penelitian ini, pendekatan pengolahan data yang digunakan adalah pendekatan
Cross-Industry Standard Process for Data mining (CRISP-DM). Pendekatan ini membantu
dalam menciptakan model data mining yang sistematis sehingga dalam proses pengolahannya
akan lebih mudah dan efisien. Pendekatan CRISP-DM ini terdiri dari enam fase yang terdiri

9
dari business understanding, data understanding, data preparation, modeling, evaluation,
dan deployment. Tahapan pengolahan data dengan pendekatan model CRISP-DM adalah
sebagaimana ditampilkan pada Gambar IV.1.
Gambar IV.1 Tahapan Pengolahan Data Dengan Pendekatan CRISP-DM
Sumber: Chapman et al. (2000)

A. Business Understanding

Dalam melakukan sebuah penelitian, sangat penting bagi peneliti untuk memahami proses bisnis dari
objek penelitian sebagai dasar dari tindakan lanjutan yang harus dilakukan. Sejalan dengan hal
tersebut, pada tahap pertama dari teknik data mining dengan pendekatan CRISP-DM ini, penulis
melakukan serangkaian kegiatan untuk memahami proses bisnis dari objek penelitian. Objek
penelitian ini adalah pergerakan inflasi bulanan tiap kota dan kabupaten pada tahun 2017 dan 2018.

Penggunaan data mining dalam penelitian ini adalah untuk mengetahui pengaruh pola fluktuasi harga
bahan kebutuhan pokok pada tingkat inflasi atau deflasi bulanan tahun 2017 dan 2018. Dengan
mengetahui fluktuasi bahan kebutuhan pokok mana yang paling berpengaruh terhadap tingkat inflasi,
Bank Sentral dapat merumuskan kebijakan moneter untuk mengendalikan inflasi sesuai yang
diharapkan.

Desain Penelitian berdasarkan variabel yang mempengaruhi tingkat inflasi atau deflasi dengan data
mining ini ditunjukkan pada

Penulis mengusulkan hipotesis bahwa fluktuasi harga bahan pokok yang paling berpengaruh adalah
harga beras karena tingkat konsumsi masyarakat yang sangat tinggi

B. Data Understanding

Proses pengolahan data dengan pendekatan CRISP-DM ditahap kedua adalah


pemahaman data (data understanding). Proses ini dimulai dengan melakukan pengumpulan
data awal. Kemudian, penulis mempelajari data tersebut untuk memahami data apa saja yang
dapat diolah. Data yang digunakan adalah data sekunder yang berasal dari dari laman daring
Biro Pusat Statistik yang beralamat di www.bps.go.id. Sumber data inflasi berasal dari
publikasi di laman tersebut yang berisi kompilasi grafik pergerakan Indeks Harga Konsumen
pada 82 Daerah di Indonesia tiap-tiap bulan pada tahun 2017-2018. Data harga bahan

10
makanan juga didapat dari laman tersebut, yang berupa tabel kompilasi harga bahan makanan
mingguan tiap-tiap ibukota propinsi di Indonesia. Seluruh data tersebut berupa softcopy
dalam format .pdf yang kemudian diolah menggunakan aplikasi RapidMiner versi 9.3.
Seluruh data .pdf terintegrasi kemudian penulis pilih dan pilah yang
merepresentasikan 8 variabel penelitian dilakukan proses pemahaman atribut terkait dan
dilakukan pengolahan lebih lanjut untuk dapat ditentukan kriteria yang dapat mewakili
variabel penelitian. Setelah keseluruhan data tersebut dipahami, dilanjutkan ke tahapan data
mining selanjutnya.

C. Data Preparation

Dalam tahap ini, diperlukan penyesuaian data sekunder sebelum digunakan dalam
proses modeling. Persiapan data terdiri selecting data, cleaning data, constructing data,
integrating data, dan formating data.
1. Selecting Data.
Atribut yang dipilih adalah atribut yang dimungkinkan memiliki korelasi dengan
atribut label sehingga akan memudahkan proses klasifikasi. Seluruh data yang diperoleh
penulis dari data “Perkembangan Mingguan Harga Eceran Beberapa Bahan Pokok di Ibukota
Provinsi Seluruh Indonesia Tahun 2017-2018” dapat digunakan dalam proses modeling ini.
Atribut yang digunakan penulis dalam penelitian ini adalah sebagaimana atribut yang
ditunjukkan dalam table IV.1.
2. Cleaning Data.
Pada tahap ini, penulis tidak melakukan pembersihan data (cleaning data) karena data yang ada sudah
siap untuk diolah. Penulis hanya memilih data-data pada file .pdf untuk disusun pada file ms. Excell
.xlsx.

3. Constructing Data.
Proses konstruksi data (constructing data) dilakukan untuk menyusun, mengatur, dan mengolah data
agar dapat digunakan pada tahap selanjutnya. Setelah dilakukan pembersihan data, atribut-atribut
perlu dibentuk agar dapat digunakan. Dari data mentah yang ada penulis melakukan konstruksi data
agar data memiliki kriteria penyajian yang sama. Hal ini bertujuan agar data siap digunakan untuk
diteliti. Hasil konstruksi data dalam penelitian ini.

11
4. Integrating Data.
Pengintegrasian data yaitu proses untuk menyatukan atau menggabungkan data-data yang awalnya
mungkin terpisah-pisah dalam beberapa file atau beberapa sheet menjadi tergabung dalam satu sheet.
Tujuannya adalah agar dapat dilanjutkan ke tahap selanjutnya, yaitu modeling. Pada penelitian ini
penulis melakukan integrasi antara file fluktuasi harga bahan pokok dengan file fluktuasi inflasi.
Adapun hadil integrase data tersebut adalah sebagaimana ditunjukkan dalam gambar

12
5. Formating Data.
Berdasarkan data awal yang diperoleh, penulis melakukan tahap data preparation menggunakan
Microsoft Excel dan hasilnya disimpan dengan format .xlsx. Tahap berikutnya adalah modeling
dengan menggunakan aplikasi RapidMiner. RapidMiner menyediakan menu import data untuk
membaca data dari berbagai format eksternal, salah satunya format .xlsx. Jadi, Penulis tidak perlu
mengganti format data yang telah diolah sebelumnya. Penulis hanya menyesuaikan penggolongan
kriteria atribut menjadi polynominal sebagaimana ditunjukkan pada

D. Modeling

Teknik Modeling yang digunakan adalah klasifikasi dengan metode decision tree. Decision tree ini
sendiri merupakan implementasi dari sebuah sistem yang dikembangkan dalam mencari dan membuat
keputusan untuk suatu masalah dengan memperhitungkan berbagai macam faktor yang berkaitan di
dalam lingkup masalah tersebut. Dengan decision tree, kita dapat dengan mudah mengidentifikasi dan
melihat hubungan antara faktor-faktor yang mempengaruhi suatu masalah, terutama faktor-faktor
yang sangat signifikan pengaruhnya, sehingga dengan memperhitungkan faktor-faktor tersebut dapat
dihasilkan penyelesaian terbaik untuk suatu masalah. Dengan decision tree pula dapat diketahui pola
dan kebiasaan suatu kelompok sehingga dapat dijadikan sebagai dasar prediksi dan estimasi.
Pendesainan decision tree dalam data mining menjadi sangat penting dalam kaitannya dengan
kegunaan decision tree sebagai dasar analisis pengambilan keputusan. Model yang optimal adalah
model dengan tingkat akurasi yang tinggi dan memiliki bentuk decision tree yang sederhana sehingga
dapat lebih mudah dipahami hasilnya. Jumlah atribut yang digunakan akan memberikan pengaruh
pada decision tree, terutama pada jumlah ranting dan kerimbunan daun. Apabila decision tree
memiliki ranting dan daun yang terlalu rimbun, maka perlu dilakukan pruning (pemangkasan).
Konsekuensi dari pemangkasan ini adalah semakin berkurangnya tingkat akurasi dan kelayakan
model. Selalu ada tradeoff antara akurasi dan kesederhanaan dalam sebuah decision tree. Oleh karena
itu, pemilihan model harus selalu diperhatikan dengan memperhitungkan tingkat akurasi dan bentuk
decision tree yang diharapkan.
Dalam RapidMiner terdapat empat parameter yang dapat disesuaikan untuk mendapatkan model
decision tree tertentu, yaitu:
1. Criterion.
Parameter ini digunakan untuk memilih kriteria untuk menetapkan atribut akar dari decision
tree. Kriteria yang dapat dipilih antara lain adalah gain ratio, information gain, gini index,
accuracy, dan least square.
2. Maximal Depth.

13
Parameter ini digunakan untuk membatasi ukuran node decision tree. Proses percabangan
decision tree tidak berlanjut ketika kedalaman pohon adalah sama dengan kedalaman
maksimal.
3. Apply Pruning.
Parameter ini digunakan untuk melakukan pemangkasan cabang yang dilakukan setelah pohon
terbentuk dengan cara mengubah parameter confidence. Parameter ini menentukan tingkat
kepercayaan yang digunakan untuk perhitungan kesalahan pesimistis dari pemangkasan.
Parameter confidence digunakan untuk menentukan tingkat kepercayaan yang digunakan untuk
tingkat kesalahan pesimis saat dilakukan pemangkasan.
4. Apply Prepruning.
Parameter ini digunakan untuk menghentikan pembentukan cabang dengan memangkas pohon
lebih awal. Alat pre-purning dalam Rapidminer terdiri atas minimal gain, minimal leaf size,
minimal size for split, dan number of pre-pruning alternatives.

Dalam penelitian ini penulis membuat 1 mode dengan uji coba rekayasa parameter-parameter pada
decision tree, baik secara manual (menggunakan cross validation).

14
SUB-PROSES

1. Model I.
Model 1 adalah model di mana dalam pemodelannya tidak memanfaatkan fitur prepruning
dalam pembentukan decision tree-nya.

Parameters Value
Criterion Accuracy
Maximal depth 20
Apply Pruning checked
Confidence 0,5
Apply Prepruning checked

Setelah Minimal Gain 0.01 dilakukan running,


Model 1 menghasilkan akurasi sebesar dan model decision tree sebagaimana pada Gambar
Model ini menghasilkan decision tree yang sangat sederhana, dengan attribut “Beras” sebagai

15
root node. Dari Gambar IV.14, dapat dilihat bahwa prediksi yang cukup % berada pada nilai
yang sebenarnya “Inlasi” namun diprediksikan “Deflasi”.

2. Model II.
Model ini memanfaatkan fitur pruning dalam pembentukan decision tree-nya. Pengaturan
dilakukan sebagaimana pada tabel IV.10.
Parameters Value
Criterion Accuracy
Maximal depth 20
Apply Pruning Checked
Confidence 0,5
Apply Prepruning Unchecked

Setelah dilakukan running, Model 2 menghasilkan akurasi sebesar 81,90% dan model decision tree
sebagaimana pada Gambar IV.21. Model ini menghasilkan akurasi yang lebih besar dibandingkan
dengan perlakuan yang sama pada Model 1. Dari Gambar IV.20, dapat dilihat bahwa persebaran
prediksi yang memberikan nilai sesuai nilai sebenarnya memiliki persebaran yang lebih merata.
Decision tree yang dihasilkan juga telah mendeskripsikan seluruh variabel.

E. Evaluation

Pada tahap ini, perlu dilakukan evaluasi yang bertujuan untuk meyakinkan bahwa hasilnya benar-
benar bisa digunakan dan bisa dimanfaatkan. Tahap evaluasi terdiri dari tiga tahap yaitu sebagai
berikut:
1. Evaluating Results.
Pada tahap ini, evaluasi hasil (evaluating results) dilakukan pada hasil model yang terpilih yaitu
Model II
2. Reviewing the Process.
Pada tahap ini, peneliti melakukan review atas apa saja yang telah dilakukan selama penelitian yang
dilakukan. Penelitian ini menggunakan metode Cross-Industry Standard Process for Data Mining
(CRISP-DM) di mana jenis data mining yang dilakukan adalah klasifikasi untuk mencari pola dari
perubahan harga eceran bahan kebutuhan pokok. Algoritma yang dipakai pada penelitian ini adalah
c4.5 dengan bantuan aplikasi RapidMiner versi 9.3.001. Dalam melakukan uji coba, penulis membuat
model yang menggunakan pemangkasan pre-pruning, pruning. Alasan penentuan nilai parameter-
parameter yang penulis gunakan adalah memperhatikan indikator kesederhanaan dan akurasi yang
paling baik yang mungkin dihasilkan.

16
3. Determining the Next Step.
Informasi yang didapatkan dari hasil penelitian ini diharapkan dapat menjadi masukan atau saran,
terutama kepada

F. Deployment

Penelitian data mining memang menggunakan data dan informasi dari masa lalu. Namun, selain dapat
digunakan untuk membantu menemukan pola atau karakteristik suatu data, penelitian ini juga dapat
digunakan untuk membuat prediksi di masa yang akan datang. Keberhasilan penerapan data mining
harus diawali dengan pemahaman proses bisnis, pemahaman data, persiapan data, dan yang terakhir
adalah pembuatan model melalui aplikasi. Penerapan data mining ini juga dapat dikembangkan lebih
jauh lagi dengan memperhatikan pengembangan atribut-atribut lain yang dapat memberikan pengaruh
yang signifikan terhadap

17
Bab V

Penutup

A. Kesimpulan
B. Keterbatasan
C. Saran

18

Anda mungkin juga menyukai