Anda di halaman 1dari 56

IMPLEMENTASI DATA WAREHOUSE AND BUSINESS

INTELLIGENCE (STUDI KASUS: DATA


KEPENDUDUKAN KABUPATEN
KUBU RAYA 2018-2020)

TUGAS TERSTRUKTUR
Diajukan untuk memenuhi salah satu syarat kelulusan mata Kuliah Data

Warehouse and Business Intelligence Program Strata Satu (S1)

KELOMPOK 4
11211892 ZULFANI MIRSUMA
11211891 HENDI MINARTO
11211893 ENDANG PERWANSYAH
11211360 MUHAMMAD FAHAD
11211854 NOOR HELLYDA HERMAWATI

Program Studi Sistem Informasi


Fakultas Teknologi Informasi
Universitas Nusa Mandiri
Jakarta
2021
KATA PENGANTAR

Alhamdulillah, Dengan mengucapkan puji dan syukur kehadirat Allah SWT

yang telah melimpahkan rahmat dan karunia-Nya, sehingga pada akhirnya penulis

dapat menyelesaikan Tugas Terstruktur ini dengan baik. Dimana Tugas Terstruktur

ini penulis sajikan dalam bentuk buku yang sederhana. Adapun judul Tugas

Terstruktur, yang penulis ambil sebagai berikut, “Implementasi Data Warehouse

and Business Intelligence (Studi Kasus: Data Kependudukan Kabupaten Kubu

Raya 2018-2020)”.

Tujuan penulisan Tugas Terstruktur ini dibuat sebagai salah satu syarat

kelulusan mata kuliah Data Warehouse and Business Intelligence program Srata

Satu (S1) Universitas Nusa Mandiri. Sebagai bahan penulisan diambil berdasarkan

hasil penelitian dan beberapa sumber literatur yang mendukung penulisan ini.

Penulis menyadari bahwa tanpa bimbingan dan dorongan dari semua pihak, maka

penulisan Tugas Terstruktur ini tidak akan lancar. Oleh karena itu pada kesempatan

ini, izinkanlah penulis menyampaikan ucapan terima kasih kepada:

1. Rektor Universitas Nusa Mandiri.

2. Dekan Fakultas Teknologi Informasi Universitas Nusa Mandiri.

3. Ketua Program Studi Sistem Informasi Universitas Nusa Mandiri.

4. Bapak Nanang Ruhyana, M.Kom selaku Dosen Pengajar dan Pembimbing mata

Kuliah Data Warehouse and Business Intelligence.

5. Dinas Kependudukan dan Catatan Sipil Kabupaten Kubu Raya yang telah

menerbitkan data kependudukan Kabupaten Kubu Raya yang dapat diakses

secara publik.

ii
6. Orang tua tercinta yang telah memberikan dukungan moral maupun spiritual

tanpa mengenal lelah.

7. Rekan-rekan Universitas Nusa Mandiri angkatan 2021 khususnya kelas

11.7D.06.

Serta semua pihak yang terlalu banyak untuk disebutkan satu persatu

sehingga terwujudnya penulisan ini. Penulis menyadari bahwa Tugas Terstruktur

ini masih jauh sekali dari sempurna, untuk itu penulis mohon kritik dan saran yang

bersifat membangun demi kesempurnaan penulisan dimasa yang akan datang.

Akhir kata semoga Tugas Terstruktur ini dapat berguna bagi penulis

khusunya dan bagi para pembaca yang berminat pada umumnya.

Pontianak, 07 November 2021

Penulis,

Tim Penulis

iii
DAFTAR ISI
Halaman
Lembar Judul Tugas Terstruktur ................................................................ i
Kata Pengantar........................................................................................... ii
Daftar Isi.................................................................................................... iv
Daftar Gambar ........................................................................................... v
Daftar Tabel............................................................................................... vi

BAB I PENDAHULUAN
1.1. Latar Belakang................................................................ 1
1.2. Tujuan Data Warehouse dan Business Intelligence .......... 4
1.3. Fungsi Data Warehouse Business Intelligence ................ 6

BAB II ANALISA KASUS & PENYELESAIAN KASUS


2.1. Analisa Kasus ................................................................. 9
2.1.1. Analisa Data Set.................................................. 9
2.1.2. Analisa Proses Bisnis .......................................... 9
2.2. Penyelesaian Kasus ......................................................... 13
2.2.1. Penerapan Dengan Data Warehouse .................... 13
2.2.2. Penerapan Dengan Business Intelligence ............. 21
2.2.3. Penerapan Dengan Data Mining .......................... 35

BAB III PENUTUP


3.1. Kesimpulan..................................................................... 46
3.2. Saran ............................................................................ 48

DAFTAR PUSTAKA ............................................................................... 50


DAFTAR RIWAYAT HIDUP ................................................................. 51

iv
DAFTAR GAMBAR
Halaman
Gambar II.1. Ilustrasi Analisa Proses Bisnis .......................................... 12
Gambar II.2. Star Schema Data Kependudukan Kabupaten Kubu Raya . 15
Gambar II.3. Visualisasi Sebaran Penduduk Kabupaten Kubu Raya....... 22
Gambar II.4. Visualisasi Total Penduduk Setiap Kecamatan .................. 23
Gambar II.5. Visualisasi Jumlah Penduduk Setiap Tahun....................... 24
Gambar II.6. Visualisasi Jumlah Penduduk Berdasarkan Jenis Kelamin . 25
Gambar II.7. Visualisasi Jumlah Penduduk Berdasarkan Jenis Kelamin
Setiap Kecamatan ............................................................. 26
Gambar II.8. Visualisasi Jumlah Penduduk Berdasarkan Agama ............ 27
Gambar II.9. Visualisasi Jumlah Penduduk Berdasarkan Agama
Setiap Kecamatan ............................................................. 28
Gambar II.10. Visualisasi Jumlah Penduduk Berdasarkan Status Kawin .. 29
Gambar II.11. Visualisasi Jumlah Penduduk Berdasarkan Struktur Umur 30
Gambar II.12. Visualisasi Jumlah Penduduk Berdasarkan Tingkat
Pendidikan ........................................................................ 31
Gambar II.13. Visualisasi Rasio Jumlah Penduduk E-KTP Terhadap
Total Penduduk ................................................................. 32
Gambar II.14. Visualisasi Rasio Total Penduduk Terhadap Kartu Keluarga 33
Gambar II.15. Visualisasi 7 Desa Terpadat Berdasarkan Jumlah Penduduk 34
Gambar II.16. Membuat Koneksi Ke Database Menggunakan RapidMiner 35
Gambar II.17. Membangun Query Untuk Membuat Data Table............... 36
Gambar II.18. Data Table Kependudukan Kubu Raya ............................. 37
Gambar II.19. Cleansing Data Table Kependudukan Kubu Raya............. 38
Gambar II.20. Komparasi Model-Model Prediction ................................. 39
Gambar II.21. ROC Comparison Model-Model Prediction ...................... 39
Gambar II.22. Lift Charts Naïve Bayes .................................................... 40
Gambar II.23. Performansi Generalized Linier Model (GLM) ................. 40
Gambar II.24. Simulator Logistic Regression........................................... 41
Gambar II.25. Optimal Parameters Fast Large Margin ........................... 41
Gambar II.26. Weights Deep Learning ..................................................... 42
Gambar II.27. Model Decision Tree (Jumlah Penduduk Status Kawin) .... 43
Gambar II.28. Model Random Forest ...................................................... 43
Gambar II.29. Optimal Parameters Gradient Boosted Trees .................... 44
Gambar II.30. Centroid Chart K-Means .................................................. 45
Gambar II.31. Centroid Chart X-Means ................................................... 45

v
DAFTAR TABEL
Halaman
Tabel III.1. Spesifikasi File Dimension Kecamatan ............................. 16
Tabel III.2. Spesifikasi File Dimension Desa ....................................... 17
Tabel III.3. Spesifikasi File Dimension Tahun ..................................... 17
Tabel III.4. Spesifikasi File Dimension Jenis Kelamin......................... 18
Tabel III.5. Spesifikasi File Dimension Agama ................................... 18
Tabel III.6. Spesifikasi File Dimension Status Kawin .......................... 19
Tabel III.7. Spesifikasi File Dimension Struktur Umur ........................ 20
Tabel III.8. Spesifikasi File Dimension Tingkat Pendidikan ................ 20
Tabel III.9. Spesifikasi File Fact Penduduk ......................................... 21

vi
BAB I

PENDAHULUAN

1.1. Latar Belakang

Data merupakan aset penting dalam sebuah organisasi yang digunakan

untuk memutuskan kebijakan, melakukan strategi, atau mengambil keputusan. Data

sebelum digunakan akan diolah dulu menjadi suatu informasi yang dibutuhkan oleh

organisasi. Proses pengolahan data dapat dilakukan diberbagai tempat, misalkan di

database operasional, aplikasi operasional, maupun menggunakan teknologi data

warehouse. Data warehouse adalah suatu konsep dan kombinasi teknologi yang

memfasilitasi organisasi untuk mengelola dan memelihara data historis yang

diperoleh dari sistem atau aplikasi operasional. Data warehouse bukan suatu

produk tetapi suatu lingkungan dimana user dapat menemukan informasi strategik.

Data warehouse adalah kumpulan data-data logik yang terpisah dengan database

operasional dan merupakan suatu ringkasan [1].

Data warehouse adalah suatu konsep dan kombinasi teknologi yang

memfasilitasi organisasi untuk mengelola dan memelihara data historis yang

diperoleh dari sistem atau aplikasi operasional. Data warehouse juga bisa diartikan

sebagai database relasional yang didesain lebih kepada query dan analisa dari pada

proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa

juga data dari sumber lainnya. Data warehouse memisahkan beban kerja analisis

dari beban kerja transaksi dan memungkinkan organisasi menggabung/konsolidasi

data dari berbagai macam sumber [2].

1
2

Jadi, data warehouse merupakan metode dalam perancangan database,

yang menunjang DSS (Decission Support System) dan EIS (Executive Information

System). Secara fisik data warehouse adalah database, tapi perancangan data

warehouse dan database sangat berbeda. Dalam perancangan database tradisional

menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah

cara yang terbaik. Data warehouse adalah tempat penyimpanan berdasakan subyek

bukan berdasakan aplikasi.

Data warehouse erat kaitannya dengan business intelligence. Sumber-

sumber data yang sudah terkumpul di dalam data warehouse ini akan dijadikan

sebagai landasan dalam pemodelan atau visualisasi. Pemodelan atau visualisasi dari

data warehouse ini biasanya dinamakan business intelligence. Business intelligence

menjelaskan tentang suatu konsep dan metode bagiamana untuk meningkatkan

kualitas pengambilan keputusan bisnis berdasarkan sistem yang berbasiskan data.

BI seringkali dipersamakan sebagaimana briefing books, report and query tools,

dan sistem informasi eksekutif. Secara umum Business intelligence merupakan

sebuah proses untuk melakukan ekstraksi data-data operasional perusahaan dan

mengumpulkannya dalam sebuah data warehouse. Selama proses ekstraksi juga

dapat dilakukan transformasi dengan menerapkan berbagai formula, agregasi,

maupun validasi sehingga didapat data yang sesuai dengan kepentingan analisis

bisnis [3].

Selanjutnya data di data warehouse diproses menggunakan berbagai

analisis statistik dalam proses data mining, sehingga didapat berbagai

kecenderungan atau pattern dari data. Hasil penyederhanaan dan peringkasan ini

disajikan kepada end user yang biasanya merupakan pengambil keputusan bisnis.
3

Dengan demikian manajemen dapat mengambil keputusan berdasarkan fakta-fakta

aktual, dan tidak hanya mengandalkan intuisi dan pengalaman kuantitatif saja [4].

BI merupakan sistem pendukung pengambilan keputusan yang berbasiskan

data-data. Business intelligence (intelejen bisnis) adalah suatu cara untuk

mengumpulkan, menyimpan, mengorganisasikan, membentuk ulang, meringkas

data serta menyediakan informasi, baik berupa data aktifitas bisnis internal

perusahaan, maupun data aktifitas bisnis eksternal perusahaan termasuk aktifitas

bisnis para pesaing yang mudah diakses serta dianalisis untuk berbagai kegiatan

manajemen. Business intelligence (BI) adalah rangkaian aplikasi dan teknologi

untuk mengumpulkan, menyimpan, menganalisis, dan menyuguhkan akses data

untuk membantu petinggi perusahaan dalam pengambilan keputusan. Business

intelligence adalah alat analisis yang digunakan untuk mengkonsolidasikan data,

menganalisis, menyimpan dan mengakses banyak data untuk membantu dalam

pembuatan keputusan, seperti perangkat lunak untuk query database dan pelaporan

serta alat untuk analisis data multi dimensi [5].

Data kependudukan merupakan sumber data yang dapat digunakan untuk

mempelajari dinamika kependudukan manusia. Analisis kependudukan dapat

merujuk masyarakat secara keseluruhan atau kelompok tertentu yang didasarkan

kriteria seperti jenis kelamin, struktur umur, agama, tingkat pendidikan, status

perkawinan, jumlah kartu keluarga, jumlah e-ktp dan lain sebagainya. Data

kependudukan merupakan segala tampilan data penduduk dalam bentuk resmi

maupun tidak resmi yang diterbitkan oleh badan-badan pencatatan kependudukan

(pemerintah maupun non pemerintah), dalam berbagai bentuk baik angka, grafik,

gambar dan lain lain [6].


4

Proses analisis data kependudukan ini dapat dilakukan dengan baik apabila

data-data kependudukan ini sudah tertampung di data warehouse kemudian diolah

menggunakan tools seperti Tableau untuk mengetahui perkembangan jumlah

penduduk berdasarkan jenis kelamin, struktur umur, agama, tingkat pendidikan,

status perkawinan, jumlah kartu keluarga, jumlah e-ktp dan perkembangan setiap

tahunnya serta berdasarkan wilayah kecamatan dalam suatu kabupaten [7].

Berdasarkan latar belakang yang telah diuraikan pada halaman di atas, maka

kami sebagai penulis tertarik untuk membahas tentang implementasi data

warehouse dan business intelligence (studi kasus: data kependudukan Kabupaten

Kubu Raya).

1.2. Tujuan Data Warehouse dan Business Intelligence

Tujuan dari penerapan data warehouse adalah mendukung dalam proses

pembuatan keputusan yang strategis agar dapat dijadikan sebagai dasar

pengambilan keputusan. Para pengguna berinteraksi dengan data warehouse

menggunakan end-user access tools. Tujuan dari perancangan data warehouse

adalah untuk menyatukan data yang beragam yang berasal dari berbagai sumber ke

dalam sebuah tempat penyimpanan dimana pengguna dapat dengan mudah

melakukan pencarian data, menghasilkan tampilan dashboard sebagai laporan serta

melakukan analisis [2].

Penerapan business intelligence bertujuan untuk memudahkan interpretasi

data yang besar, mengidentifikasi peluang baru dan menerapkan strategi yang

efektif berdasarkan wawasan yang dapat memberi keuntungan pasar yang

kompetitif bagi bisnis dan stabilitas jangka panjang. Penerapan data warehouse dan
5

business intelligence memiliki tujuan tertentu. Adapun tujuan dari penerapan data

warehouse dan business intelligence, khususnya untuk organisasi non-profit (data

kependudukan dari disdukcapil Kabupaten Kubu Raya) [5], yaitu:

1. Meningkatkan nilai data dan informasi organisasi

Melalui pembangunan BI, maka seluruh data dan informasi dapat diintegrasikan

sedemikian rupa sehingga menghasilkan dasar pengambilan keputusan yang

lengkap. Informasi-informasi yang dulunya tidak dicakupkan sebagai salah satu

faktor pengambilan keputusan (terisolasi) dapat dengan mudah dilakukan

(connect and combine) dengan menggunakan BI. Data dan informasi yang

dihasilkan pun juga menjadi lebih mudah diakses dan lebih mudah untuk

dimengerti (friendly-users).

2. Memudahkan pemantauan kinerja organisasi

Dalam mengukur kinerja suatu organisasi seringkali dipergunakan ukuran yang

disebut Key Performance Indicator (KPI). KPI tidak semestinya diukur dengan

satuan uang, namun dapat juga berdasarkan kecepatan pelaksanaan suatu

layanan. BI dapat dengan mudah menunjukkan capaian KPI suatu organisasi

dengan mudah, cepat dan tepat. Dengan demikian akan memudahkan pihak-

pihak yang terlibat dalam pengambilan keputusan untuk menentukan langkah-

langkah antisipasi yang diperlukan.

3. Meningkatkan nilai investasi TI yang sudah ada

BI tidak perlu/harus mengubah atau menggantikan sistem informasi yang sudah

digunakan sebelumnya. Sebaliknya, BI hanya menambahkan layanan pada

sistem-sistem tersebut sehingga data dan informasi yang sudah ada dapat
6

menghasilkan informasi yang komprehensif dan memiliki kegunaan yang lebih

baik

4. Menciptakan pegawai yang memiliki akses informasi yang baik (well-informed

workers)

Dalam melaksanakan pekerjaannya sehari-hari, seluruh level dari suatu

organisasi (mulai dari pegawai/bawahan sampai dengan pimpinan) selalu

berkaitan dan/atau membutuhkan akses data dan informasi. BI mempermudah

seluruh level pegawai dalam mengakses data dan informasi yang diperlukan

sehingga membantu membuat suatu keputusan. Jika kondisi seperti ini tercapai,

maka misi dan strategi organisasi yang sudah ditetapkan dapat dengan lebih

mudah terlaksana serta terpantau tingkat pencapaiannya.

5. Meningkatkan efisiensi biaya

BI dapat meningkatkan efisiensi karena mempermudah seseorang dalam

melakukan pekerjaan, hemat waktu dan mudah pemanfaatannya. Waktu yang

dibutuhkan untuk mencari data dan mendapatkan informasi yang dibutuhkan

menjadi semakin singkat dan cara untuk mendapatkannya pun tidak

memerlukan pengetahuan (training) yang rumit. Dengan demikian training-

training yang bisanya sering dilakukan dengan biaya yang cukup besar, dapat

dihemat sedimikian rupa.

1.3. Fungsi Data Warehouse dan Business Intelligence

Data warehouse diciptakan untuk membantu sebuah perusahaan atau

institusi memiliki sistem penyimpanan data pendukung yang lebih terstruktur dan

terorganisir. Berikut beberapa fungsi lengkap dari data warehouse [1], yaitu:
7

1. Data warehouse mampu memudahkan para user untuk mendapatkan akses

cepat akan data esensial dari sebuah sumber yang menampung berbagai

informasi spesifik dalam satu tempat.

2. Data warehouse menyediakan informasi yang konsisten untuk berbagai divisi

dan bentuk aktivitas. Sistem ini juga menyimpan laporan dan query.

3. Data warehouse dapat membantu proses integrasi data.

4. Restrukturisasi dan integrasi dapat mempermudah proses pembuatan laporan

dan analisa.

5. Data warehouse membuat pengguna dapat mengakses data penting dari

berbagai sumber melalui satu tempat. Hal ini pastinya dapat menghemat waktu

dalam pengambilan data yang dibutuhkan dari berbagai sumber.

6. Data warehouse menyimpan data dalam jumlah besar, begitu juga data-data

lama dari berbagai tahun. Informasi ini dapat dijadikan bahan analisis tambahan

untuk menganalisa suatu fenomena dan memprediksi trend yang akan muncul

mengikuti pola yang ada.

Penerapan business intelligence mempunyai beberapa fungsi bagi

penggunanya. Adapun fungsi-fungsi dari penerapan business intelligence [5], yaitu:

1. Business intelligence berfungsi sebagai sistem pendukung pengambilan

keputusan dimana sistem dan aplikasi ini mengubah data-data dalam suatu

perusahaan atau organisasi (data operasional, data transaksional, atau data

lainnya) ke dalam bentuk pengetahuan.

2. Business intelligence bertujuan untuk menyajikan berbagai informasi yang

disesuaikan dengan kebutuhan setiap penggunanya. Informasi tersebut dapat

berasal dari data publik atau data private. Data-data tersebut kemudian diolah
8

dan disajikan dalam bentuk informasi yang mudah dipahami oleh penggunanya

dengan satu tujuan yaitu membantu pencapaian tujuan pengguna BI.

3. Business Intelligence (BI) memiliki karakteristik sebagai pendukung

ketersediaan data yang relevan yang akan disajikan pada pengguna. Biasanya,

BI mengintegrasikan informasi dari keseluruhan sumber informasi perusahaan

sehingga pembuat keputusan dapat membuat analisis dengan berbekal

pengetahuan yang lengkap dan real time.


BAB II

ANALISA KASUS & PENYELESAIAN KASUS

2.1. Analisa Kasus

Tim penulis melakukan studi kasus atas data kependudukan Kabupaten

Kubu Raya. Data kependudukan ini merupakan data publik yang disiapkan oleh

Dinas Kependudukan dan Catatan Sipil Kabupaten Kubu Raya. Analisa kasus ini

terbagi menjadi dua (2) bagian, yaitu analisa data set dan analisa proses bisnis.

2.1.1. Analisa Data Set

Data set yang digunakan adalah data agregat kependudukan Kabupaten

Kubu Raya dari tahun 2018 sampai dengan tahun 2020 dengan tipe data berformat

portable document format (pdf). Datasets yang berupa format .Pdf kemudian

dikonversi menjadi Ms. Excel agar lebih mudah diolah. Kemudian data-data yang

telah menjadi Ms. Excel dilakukan clustering dan cleansing secara manual

menggunakan Ms. Excel yang terbagi menjadi beberapa sheet, dimana terdapat

sheet-sheet seperti sheet desa, kecamatan, agama, jeniskelamin, statuskawin,

strukturumur, tahun, tingkat pendidikan dan penduduk.

2.1.2. Analisa Proses Bisnis

Terdapat beberapa bagian dalam proses bisnis dari data warehouse dan

business intelligence. Adapun proses bisnis atau tahapan-tahapan dari keseluruhan

proses dalam data warehouse dan business intelligence [5], dapat diterjemahkan

menjadi langkah-langkah dibawah ini:

1. Identifikasi masalah bisnis yang perlu diselesaikan dengan gudang data dan

menentukan data yang diperlukan untuk menyelesaikan masalah tersebut.

9
10

Penulis melakukan identifikasi masalah bisnis mengenai data kependudukan

Kabupaten Kubu Raya 2018-2020, adapun identifikasi masalah bisnis yang

perlu diselesaikan, yaitu:

a. Sebaran penduduk Kabupaten Kubu Raya menggunakan maps.

b. Mengetahui jumlah penduduk berdasarkan:

c. Total penduduk Kabupaten.

d. Total penduduk per Kecamatan.

e. Tingkat pertumbuhan penduduk.

f. Total penduduk berdasarkan jenis kelamin untuk Kabupaten.

g. Total penduduk berdasarkan jenis kelamin per Kecamatan.

h. Total penduduk berdasarkan agama untuk Kabupaten.

i. Total penduduk berdasarkan agama per kecamatan.

j. Total penduduk berdasarkan status kawin untuk Kabupaten.

k. Total penduduk berdasarkan struktur umur per Kabupaten.

l. Total penduduk di usia produktif (15-64 tahun).

m. Total penduduk berdasarkan tingkat pendidikan untuk Kabupaten.

n. Ratio jumlah penduduk dengan jumlah penduduk yang telah memiliki E-

KTP untuk Kabupaten.

o. Ratio jumlah penduduk berbanding dengan jumlah kartu keluarga (untuk

mengetahui rata-rata jumlah penduduk dalam 1 KK).

p. Mencari 7 Desa terpadat yang ada di Kabupaten Kubu Raya.

2. Identifikasi lokasi dari data-data yang diperlukan dan mengambilnya dari

sumber penyimpanannya. Penulis mengambil data kependudukan Kabupaten

Kubu Raya dari tahun 2018 sampai dengan tahun 2020. Sumber data ini berupa
11

data publik yang dapat diakses oleh semua orang. Untuk menentukan titik lokasi

(longitude dan latitude) setiap kecamatan, penulis menggunakan sumber dari

google maps.

3. Merubah data yang diperoleh dari beragam sumber tersebut ke dalam sebuah

data yang konsisten. Data-data atau datasets yang didapat berupa format .Pdf

kemudian dikonversi menjadi Ms. Excel agar lebih mudah diolah.

4. Mengambil data yang telah dirubah tersebut dan menyimpan ke dalam lokasi

yang tersentralisasi. Data-data yang telah menjadi Ms. Excel dilakukan

clustering secara manual menggunakan Ms. Excel yang terbagi menjadi

beberapa sheet, dimana terdapat sheet-sheet seperti dim_desa, dim_kecamatan,

dim_agama, dim_jeniskelamin, dim_statuskawin, dim_strukturumur,

dim_tahun, dim_tingkat pendidikan dan fact_penduduk. Proses clustering dan

cleansing ini dilakukan secara manual di excel, kemudian sheet-sheet yang

bernama dim ini akan menjadi dimension dan sheet yang bernamakan fact akan

menjadi measurement.

5. Membuat sebuah gudang data dengan data yang ada dalam lokasi yang

tersentralisasi tersebut. . Setelah selesai melakukan clustering dan cleansing ini

secara manual, kemudian hal yang dilakukan adalah meng-import data set

berupa Ms. Excel tersebut ke SQLyog Enterprise (aplikasi basis data dengan

tipe MariaDB). Setelah berhasil melakukan import, hal yang dilakukan adalah

mengkonfigurasi struktur data dari setiap table tersebut untuk menentukan tipe

data, panjang data, primary key dan foreign key untuk setiap tabel serta asosiasi

atau merelasikan setiap table-table yang berhubungan.


12

6. Memasang sebuah produk atau aplikasi yang dapat memberikan akses ke data

yang ada dalam data warehouse dan memvisualisasikan menggunakan tools

atau aplikasi pembantu. Data-data yang telah tersimpan di data warehouse ini

akan divisualisasikan menggunakan Tableau Desktop 2019. Pada Tableau ini,

yang dibuat adalah visualisasi berupa maps atau peta yang berisikan data

kabupaten, kecamatan dan jumlah penduduk, kemudian membuat diagram-

diagram yang berisikan jumlah penduduk berdasarkan jenis kelamin, agama,

umur, pendidikan, status kawin, ratio-ratio dan prediksi. Hasil dari visualisasi

dari data kependudukan Kabupaten Kubu Raya yang menggunakan Tableau

Desktop 2019 dapat dijadikan landasan dalam pengambilan keputusan, sajian

informasi yang lengkap, sehingga para pengguna data, baik orang awam

maupun pihak yang berkepentingan dapat memanfaatkan informasi-informasi

yang disajikan baik sebagai pengetahuan umum atau sebagai langkah strategis

untuk menangani masalah kependudukan di Kabupaten Kubu Raya.

Sumber: (Hasil Penelitian, 2021)

Gambar II.1.
Ilustrasi Analisa Proses Bisnis
13

2.2. Penyelesaian Kasus

Analisa proses bisnis yang telah diuraikan pada sub-bab sebelumnya akan

dijadikan dasar dalam penyelesaian kasus. Untuk menyelesaikan kasus mengenai

data kependudukan Kabupaten Kubu Raya 2018 sampai dengan 2020 terbagi

menjadi tiga (3) tahapan, yaitu penyelesaian kasus dengan data warehouse,

visualisasi dengan business intelligence dan data mining.

2.2.1. Penerapan Dengan Data Warehouse

Untuk membuat sebuah data warehouse, digunakan multidimensional

modeling (MDM) yang merupakan salah satu pendekatan data warehouse yang

dibangun berdasarkan metode OLAP (On-Line Analytical Processing) yang

memiliki konsep dimensi, hirarki, level dan anggota. Agregat dari penerapan

konsep tersebut dapat ditampilkan dengan star schema design. Dibandingkan

dengan konsep database relasional, konsep multidimensional database dapat

melakukan analisa dari berbagai sudut dimensi [4].

Model data multidimensional dirancang untuk memfasilitasi analisis dan

bukan transaksi. Model ini umum digunakan dalam data warehouse karena bersifat

memiliki konsep intuitif dari banyak dimensi atau perspektif pengukuran bisnis atau

fakta-fakta. Contohnya melihat data kependudukan dari perspektif pengguna,

waktu dan kategori [7].

OLAP (On-Line Analytical Processing) merupakan suatu sistem atau

teknologi yang dirancang untuk mendukung proses analisis kompleks dalam rangka

mengungkapkan kecenderungan pasar atau faktor-faktor penting dalam bisnis.

OLAP ditandai dengan kemampuannya menaikkan atau menurunkan dimensi data

sehingga pengguna dapat menggolongkan data sampai pada tingkat yang detail dan
14

memperoleh pandangan yang lebih luas mengenai objek yang sedang dianalisis.

OLAP juga sering disebut dengan analisis multi dimensi [3].

Pemodelan sebuah data warehouse dapat menggunakan beberapa macam

schema. Penulis menggunakan star schema dalam pemodelan data warehouse. Star

schema merupakan desain skema tabel dimana terdapat sebuah tabel fact dengan n-

dimensi berada di tengah-tengah yang berfungsi sebagai penghubung tabel-tabel

dimensi yang ada. Adapun kelebihan dan kekurangan dari star schema ini, yaitu

untuk performansi sistem, star schema lebih dapat diandalkan dibandingkan dengan

skema lainnya, hal ini dikarenakan penggunaan tingkat join antar tabel dimensi dan

tabel fact yang sedikit sehingga memudahkan sistem untuk melakukan suatu

operasi agregasi. Sedangkan, permasalahan yang timbul adalah munculnya

redudansi di dalam tabel dimensi [2].

Adapun hasil pemodelan data warehouse menggunakan star schema untuk

data kependudukan Kabupaten Kubu Raya, digambarkan sebagai berikut.


15

Sumber: (Hasil Penelitian, 2021)

Gambar II.2.
Star Schema Data Kependudukan Kabupaten Kubu Raya

Setiap tabel yang terdapat pada star schema tersebut akan diuraikan lebih

rinci ke dalam spesifikasi file. Adapun spesifikasi file tersebut, dijabarkan sebagai

berikut:

1. Spesifikasi file dimension kecamatan

Nama File : dimension kecamatan

Akronim : dim_kecamatan

Fungsi : untuk menyimpan data kecamatan

Tipe File : File Master (Dimension)

Organisasi File : Indexed Sequential


16

Akses File : Random

Media : Harddisk

Panjang record : 670

Kunci Field : kdkec

Software : MySQL

Tabel III.1.
Spesifikasi File Dimension Kecamatan
No Nama Field Tipe Data Panjang Keterangan
1 kdkec char 10 Primary Key
2 kab varchar 50
3 provinsi varchar 50
4 negara varchar 50
5 lat varchar 255
6 long varchar 255
Sumber: Hasil Penelitian (2021)

2. Spesifikasi file dimension desa

Nama File : dimension desa

Akronim : dim_desa

Fungsi : untuk menyimpan data desa

Tipe File : File Master (Dimension)

Organisasi File : Indexed Sequential

Akses File : Random

Media : Harddisk

Panjang record : 70

Kunci Field : kddesa

Software : MySQL
17

Tabel III.2.
Spesifikasi File Dimension Desa
No Nama Field Tipe Data Panjang Keterangan
1 kddesa char 10 Primary Key
2 desa varchar 50
3 kdkec char 10 Foreign Key
Sumber: Hasil Penelitian (2021)

3. Spesifikasi file dimension tahun

Nama File : dimension tahun

Akronim : dim_tahun

Fungsi : untuk menyimpan data tahun

Tipe File : File Master (Dimension)

Organisasi File : Indexed Sequential

Akses File : Random

Media : Harddisk

Panjang record : 14

Kunci Field : kdtahun

Software : MySQL

Tabel III.3.
Spesifikasi File Dimension Tahun
No Nama Field Tipe Data Panjang Keterangan
1 kdtahun char 10 Primary Key
2 tahun year 4
Sumber: Hasil Penelitian (2021)

4. Spesifikasi file dimension jenis kelamin

Nama File : dimension jenis kelamin

Akronim : dim_jeniskelamin

Fungsi : untuk menyimpan data jenis kelamin

Tipe File : File Master (Dimension)

Organisasi File : Indexed Sequential


18

Akses File : Random

Media : Harddisk

Panjang record : 30

Kunci Field : kdtahun

Software : MySQL

Tabel III.4.
Spesifikasi File Dimension Jenis Kelamin
No Nama Field Tipe Data Panjang Keterangan
1 kdjeniskelamin char 10 Primary Key
2 jeniskelamin varchar 20
Sumber: Hasil Penelitian (2021)

5. Spesifikasi file dimension agama

Nama File : dimension agama

Akronim : dim_agama

Fungsi : untuk menyimpan data agama

Tipe File : File Master (Dimension)

Organisasi File : Indexed Sequential

Akses File : Random

Media : Harddisk

Panjang record : 30

Kunci Field : kdagama

Software : MySQL

Tabel III.5.
Spesifikasi File Dimension Agama
No Nama Field Tipe Data Panjang Keterangan
1 kdagama char 10 Primary Key
2 agama varchar 20
Sumber: Hasil Penelitian (2021)
19

6. Spesifikasi file dimension status kawin

Nama File : dimension status kawin

Akronim : dim_statuskawin

Fungsi : untuk menyimpan data status kawin

Tipe File : File Master (Dimension)

Organisasi File : Indexed Sequential

Akses File : Random

Media : Harddisk

Panjang record : 30

Kunci Field : kdstatuskawin

Software : MySQL

Tabel III.6.
Spesifikasi File Dimension Status Kawin
No Nama Field Tipe Data Panjang Keterangan
1 kdstatuskawin char 10 Primary Key
2 statuskawin varchar 20
Sumber: Hasil Penelitian (2021)

7. Spesifikasi file dimension struktur umur

Nama File : dimension struktur umur

Akronim : dim_strukturumur

Fungsi : untuk menyimpan data struktur umur

Tipe File : File Master (Dimension)

Organisasi File : Indexed Sequential

Akses File : Random

Media : Harddisk

Panjang record : 30

Kunci Field : kdstrukturumur


20

Software : MySQL

Tabel III.7.
Spesifikasi File Dimension Struktur Umur
No Nama Field Tipe Data Panjang Keterangan
1 kdstrukturumur char 10 Primary Key
2 strukturumur varchar 20
Sumber: Hasil Penelitian (2021)

8. Spesifikasi file dimension tingkat pendidikan

Nama File : dimension tingkat pendidikan

Akronim : dim_tingkatpendidikan

Fungsi : untuk menyimpan data tingkat pendidikan

Tipe File : File Master (Dimension)

Organisasi File : Indexed Sequential

Akses File : Random

Media : Harddisk

Panjang record : 30

Kunci Field : kdtingkatpendidikan

Software : MySQL

Tabel III.8.
Spesifikasi File Dimension Tingkat Pendidikan
No Nama Field Tipe Data Panjang Keterangan
1 kdtingkatpendidikan char 10 Primary Key
2 tingkatpendidikan varchar 20
Sumber: Hasil Penelitian (2021)

9. Spesifikasi file fact penduduk

Nama File : fact penduduk

Akronim : fact_penduduk

Fungsi : untuk menyimpan data kependudukan

Tipe File : File Transaction (Fact)


21

Organisasi File : Indexed Sequential

Akses File : Random

Media : Harddisk

Panjang record : 157

Kunci Field : kd

Software : MySQL

Tabel III.9.
Spesifikasi File Fact Penduduk
No Nama Field Tipe Data Panjang Keterangan
1 kd int 10 Primary Key
2 kddesa char 10 Foreign Key
3 kdtahun char 10 Foreign Key
4 kdstrukturumur char 10 Foreign Key
5 jumlahpendudukstrukturumur double 11
6 kdtingkatpendidikan char 10 Foreign Key
7 jumlahpendudukpendidikan double 11
8 kdagama char 10 Foreign Key
9 jumlahpendudukagama double 11
10 kdstatuskawin char 10 Foreign Key
11 jumlahpendudukstatuskawin double 11
12 kdjeniskelamin char 10 Foreign Key
13 jumlahpendudukjk double 11
14 jumlahpendudukktp double 11
15 jumlahkepalakeluarga double 11
Sumber: Hasil Penelitian (2021)

2.2.2. Penerapan Dengan Business Intelligence

Business Intelligence merupakan sistem pendukung pengambilan keputusan

yang berbasiskan data-data. Business intelligence (BI) adalah rangkaian aplikasi

dan teknologi untuk mengumpulkan, menyimpan, menganalisis, dan menyuguhkan

akses data untuk membantu petinggi perusahaan dalam pengambilan keputusan.

Aplikasi pembantu yang dijadikan sebagai alat untuk visualisasi adalah Tableau

Desktop 2019. Hasil visualisasi dari data warehouse tentang data kependudukan
22

Kabupaten Kubu Raya menggunakan Tableau Desktop 2019, diuraikan sebagai

berikut:

1. Visualisasi sebaran penduduk Kabupaten Kubu Raya menggunakan maps

Sebaran penduduk Kabupaten Kubu Raya menggunakan maps menggunakan

konsep dual axis, yaitu maps 2 layer, yang dimana layer pertama adalah untuk

menentukan lokasi Kabupaten Kubu Raya dan layer kedua adalah untuk

menentukan titik lokasi setiap Kecamatan.

Sumber: (Hasil Penelitian, 2021)

Gambar II.3.
Visualisasi Sebaran Penduduk Kabupaten Kubu Raya

Berdasarkan gambar di atas, dapat diketahui jumlah penduduk Kabupaten Kubu

Raya secara keseluruhan dan jumlah penduduk berdasarkan Kecamatan. Titik-

titik tersebut menandakan lokasi dari Kecamatan yang ada di Kabupaten Kubu

Raya. Jumlah penduduk Kabupaten Kubu Raya secara keseluruhan pada tahun

2020 adalah 610.103.


23

2. Visualisasi total penduduk setiap Kecamatan

Sebaran penduduk untuk setiap Kecamatan yang ada Kabupaten Kubu Raya

menggunakan diagram batang, yang berfungsi untuk menyajikan tingkat

kepadatan penduduk setiap Kecamatan.

Sumber: (Hasil Penelitian, 2021)

Gambar II.4.
Visualisasi Total Penduduk Setiap Kecamatan

Berdasarkan gambar di atas, dapat diketahui jumlah penduduk Kabupaten Kubu

Raya berdasarkan dengan Kecamatan. umlah penduduk untuk setiap kecamatan

pada tahun 2020, yaitu: Kecamatan Sungai Raya berjumlah 234.424, Sungai

Kakap berjumlah 128.877, Sungai Ambawang berjumlah 80573, Kubu

berjumlah 38.082, Batu Ampar berjumlah 35.636, Kuala Mandor berjumlah

28.911, Rasau Jaya berjumlah 28.631, Teluk Pakedai 21.226 dan Terentang

berjumlah 13.743. Berdasarkan informasi-informasi ini, maka Kecamatan

terpadat adalah Kecamatan Sungai Raya.


24

3. Visualisasi jumlah penduduk setiap tahun

Jumlah penduduk setiap tahun pada Kabupaten Kubu Raya menggunakan

diagram batang, yang berfungsi untuk menyajikan tingkat pertumbuhan

penduduk setiap tahunnya.

Sumber: (Hasil Penelitian, 2021)

Gambar II.5.
Visualisasi Jumlah Penduduk Setiap Tahun

Berdasarkan gambar di atas, dapat diketahui jumlah penduduk Kabupaten Kubu

Raya pada tahun 2018 adalah 603.407, tahun 2019 adalah 606.729 dan tahun

2020 adalah 610.103. Berdasarkan informasi ini, maka diketahui persentase

pertumbuhan setiap tahunnya adalah 0,005%.


25

4. Visualisasi jumlah penduduk berdasarkan jenis kelamin

Jumlah penduduk Kabupaten Kubu Raya juga dikategorikan berdasarkan jenis

kelamin menggunakan diagram lingkaran (pie chart), yang berfungsi untuk

menyajikan jumlah penduduk berdasarkan jenis kelamin.

Sumber: (Hasil Penelitian, 2021)

Gambar II.6.
Visualisasi Jumlah Penduduk Berdasarkan Jenis Kelamin

Berdasarkan gambar di atas, dapat diketahui jumlah penduduk Kabupaten Kubu

Raya berdasarkan jenis kelamin pada tahun 2020 adalah 312.027 laki-laki

(51,143%)dan 298.076 perempuan (48,857%). Berdasarkan informasi ini, maka

selisih antar jumlah laki-laki dan perempuan adalah 14131 (2,286%).


26

5. Visualisasi jumlah penduduk berdasarkan jenis kelamin setiap Kecamatan

Jumlah penduduk berdasarkan jenis kelamin pada Kabupaten Kubu Raya akan

dirincikan lebih lanjut sampai ke tingkat Kecamatan menggunakan diagram

batang, yang berfungsi untuk menyajikan jumlah penduduk berdasarkan jenis

kelamin untuk setiap Kecamatan.

Sumber: (Hasil Penelitian, 2021)

Gambar II.7.
Visualisasi Jumlah Penduduk Berdasarkan Jenis Kelamin Setiap Kecamatan

Berdasarkan gambar di atas, dapat diketahui jumlah penduduk Kabupaten Kubu

Raya berdasarkan jenis kelamin untuk setiap Kecamatan.


27

6. Visualisasi jumlah penduduk berdasarkan agama

Jumlah penduduk Kabupaten Kubu Raya juga dikategorikan berdasarkan

agama menggunakan diagram lingkaran (pie chart), yang berfungsi untuk

menyajikan jumlah penduduk berdasarkan agama.

Sumber: (Hasil Penelitian, 2021)

Gambar II.8.
Visualisasi Jumlah Penduduk Berdasarkan Agama

Berdasarkan gambar di atas, dapat diketahui jumlah penduduk Kabupaten Kubu

Raya berdasarkan agama pada tahun 2020 adalah 505.656 beragama islam,

44.122 beragama Budha, 34.687 beragama Khatolik, 23.996 beragama Kristen,

1.076 beragama Konghucu, 531 beragama Hindu dan 35 masih menganut

kepercayaan.
28

7. Visualisasi jumlah penduduk berdasarkan agama setiap Kecamatan

Jumlah penduduk berdasarkan agama pada Kabupaten Kubu Raya akan

dirincikan lebih lanjut sampai ke tingkat Kecamatan menggunakan diagram

batang, yang berfungsi untuk menyajikan jumlah penduduk berdasarkan agama

untuk setiap Kecamatan.

Sumber: (Hasil Penelitian, 2021)

Gambar II.9.
Visualisasi Jumlah Penduduk Berdasarkan Agama Setiap Kecamatan

Berdasarkan gambar di atas, dapat diketahui jumlah penduduk Kabupaten Kubu

Raya berdasarkan agama untuk setiap Kecamatan.


29

8. Visualisasi jumlah penduduk berdasarkan status kawin

Jumlah penduduk Kabupaten Kubu Raya juga dikategorikan berdasarkan status

kawin menggunakan diagram lingkaran (pie chart), yang berfungsi untuk

menyajikan jumlah penduduk berdasarkan status kawin.

Sumber: (Hasil Penelitian, 2021)

Gambar II.10.
Visualisasi Jumlah Penduduk Berdasarkan Status Kawin

Berdasarkan gambar di atas, dapat diketahui jumlah penduduk Kabupaten Kubu

Raya berdasarkan status kawin pada tahun 2020 adalah 325.580 yang belum

kawin, 260.465 yang sudah kawin, 17.258 yang berstatus cerai mati dan 6.500

yang berstatus cerai hidup..


30

9. Visualisasi jumlah penduduk berdasarkan struktur umur

Jumlah penduduk Kabupaten Kubu Raya juga dikategorikan berdasarkan

struktur umur menggunakan diagram batang, yang berfungsi untuk menyajikan

jumlah penduduk berdasarkan struktur umur dan umur produktif.

Sumber: (Hasil Penelitian, 2021)

Gambar II.11.
Visualisasi Jumlah Penduduk Berdasarkan Struktur Umur

Berdasarkan struktur umur, diketahui bahwa umur produktif (15-64) pada

Kabupaten Kubu Raya pada tahun 2020 berjumlah 430.672.


31

10. Visualisasi jumlah penduduk berdasarkan tingkat pendidikan

Jumlah penduduk Kabupaten Kubu Raya juga dikategorikan berdasarkan

tingkat pendidikan menggunakan diagram batang, yang berfungsi untuk

menyajikan jumlah penduduk berdasarkan tingkat pendidikannya.

Sumber: (Hasil Penelitian, 2021)

Gambar II.12.
Visualisasi Jumlah Penduduk Berdasarkan Tingkat Pendidikan

Berdasarkan gambar di atas, dapat diketahui bahwa jumlah penduduk

Kabupaten Kubu Raya berdasarkan tingkat pendidikan pada tahun 2020 adalah

189.010 yang belum sekolah, 81.933 yang tidak tamat SD, 158.243 tamat SD,

75.726 tamat SMP, 83.359 tamat SMA, 2.492 tamat D2, 5.474 tamat D3, 13.004

tamat S1, 802 tamat S2 dan 57 tamat S3.


32

11. Visualisasi rasio jumlah penduduk yang memiliki E-KTP terhadap total

penduduk

Jumlah penduduk yang memiliki E-KTP Kabupaten Kubu Raya dapat

identifikasi dan dibandingkan dengan total penduduk yang ada menggunakan

diagram batang, yang berfungsi untuk mengetahui jumlah penduduk yang telah

memiliki E-KTP dan rasio atau persentasenya.

Sumber: (Hasil Penelitian, 2021)

Gambar II.13.
Visualisasi Rasio Jumlah Penduduk E-KTP Terhadap Total Penduduk

Berdasarkan gambar di atas, dapat diketahui bahwa jumlah penduduk Kubu

Raya pada tahun 2020 yang mempunyai E-KTP 396.474 berbanding dengan

jumlah penduduk yaitu 610.103. Berdasarkan informasi ini, didapat bahwa rasio

kepemilikan E-KTP berjumlah 64,98%.


33

12. Visualisasi rasio total penduduk terhadap jumlah kartu keluarga (KK)

Rasio dari total penduduk yang ada di Kabupaten Kubu Raya akan

dibandingkan dengan jumlah kartu keluarga (KK) yang terdaftar menggunakan

diagram batang, yang berfungsi untuk mengetahui rata-rata jumlah penduduk

untuk setiap kartu keluarga (KK).

Sumber: (Hasil Penelitian, 2021)

Gambar II.14.
Visualisasi Rasio Total Penduduk Terhadap Kartu Keluarga

Berdasarkan gambar di atas, dapat diketahui bahwa jumlah kartu keluarga (KK)

Kabupaten Kubu Raya pada tahun 2020 adalah 166.130 berbanding dengan

jumlah penduduk yaitu dengan 610.103. Berdasarkan informasi ini, didapat

bahwa rasio jumlah penduduk berbanding dengan jumlah KK adalah 367,24%

atau 1 KK terdapat 3,67 penduduk.


34

13. Visualisasi 7 Desa terpadat berdasarkan jumlah penduduk

Sebaran jumlah penduduk pada Kabupaten Kubu Raya akan diklasifikasi lebih

lanjut untuk mengetahui Desa-Desa terdapat. Visualisasi ini menyajikan 7 Desa

terpadat berdasarkan jumlah penduduknya.

Sumber: (Hasil Penelitian, 2021)

Gambar II.15.
Visualisasi 7 Desa Terpadat Berdasarkan Jumlah Penduduk

Berdasarkan data di atas, dapat diketahui bahwa 7 Desa terdapat pada

Kabupaten Kubu Raya tahun 2020, yaitu Desa Parit Baru dengan jumlah

33.330, Desa Kuala Dua dengan jumlah 31.710, Desa Arang Limbung dengan

jumlah 27.811, Desa Pal Sembilan dengan jumlah 26.052, Desa Sungai Raya

Dalam dengan jumlah 23.690, Desa Sungai Rengas dengan jumlah 23.556 dan

Desa Limbung dengan jumlah 17.327.


35

2.2.3. Penerapan Dengan Data Mining

Data mining merupakan suatu proses untuk menemukan interesting

knowledge dari sejumlah data yang disimpan dalam basis data atau media

penyimpanan data lainnya. Dengan melakukan data mining terhadap sekumpulan

data, akan didapatkan suatu interesting pattern yang dapat disimpan sebagai

knowledge baru. Pattern yang didapat akan digunakan untuk melakukan evaluasi

terhadap data-data tersebut untuk selanjutnya akan didapatkan informasi [5]. Dalam

implementasi menggunakan SQLyog Enterprise (10.4.11-MariaDB) sebagai basis

data dan RapidMiner sebagai alat untuk data mining, diuraikan sebagai berikut:

1. Membuat koneksi dan memanggil sumber data dari basis data

Hal yang harus dilakukan sewaktu melakukan data mining menggunakan

RapidMiner adalah membuat koneksi ke basis data.

Sumber: (Hasil Penelitian, 2021)

Gambar II.16.
Membuat Koneksi Ke Database Menggunakan RapidMiner
36

Setelah membuat koneksi, hal yang harus dilakukan adalah meng-import

database dengan menggunakan query SQL.

Sumber: (Hasil Penelitian, 2021)

Gambar II.17.
Membangun Query Untuk Membuat Data Table

Adapun sintaks query yang digunakan, adalah sebagai berikut:

SELECT fact_penduduk.kd, dim_tahun.tahun,


dim_desa.desa,
dim_kecamatan.namakec,
dim_strukturumur.strukturumur,
fact_penduduk.jumlahpendudukstrukturumur,
dim_tingkatpendidikan.tingkatpendidikan,
fact_penduduk.jumlahpendudukpendidikan,
dim_agama.agama,
fact_penduduk.jumlahpendudukagama,
dim_statuskawin.statuskawin,
fact_penduduk.jumlahpendudukstatuskawin,
dim_jeniskelamin.jeniskelamin,
fact_penduduk.jumlahpendudukjk,
fact_penduduk.jumlahpendudukktp,
fact_penduduk.jumlahkepalakeluarga
FROM fact_penduduk
LEFT JOIN dim_tahun ON fact_penduduk.kdtahun = dim_tahun.kdtahun
LEFT JOIN dim_desa ON fact_penduduk.kddesa = dim_desa.kddesa
LEFT JOIN dim_kecamatan ON dim_desa.kdkec = dim_kecamatan.kdkec
37

LEFT JOIN dim_strukturumur ON fact_penduduk.kdstrukturumur =


dim_strukturumur.kdstrukturumur
LEFT JOIN dim_tingkatpendidikan ON fact_penduduk.kdtingkatpendidikan =
dim_tingkatpendidikan.kdtingkatpendidikan
LEFT JOIN dim_agama ON fact_penduduk.kdagama = dim_agama.kdagama
LEFT JOIN dim_statuskawin ON fact_penduduk.kdstatuskawin =
dim_statuskawin.kdstatuskawin
LEFT JOIN dim_jeniskelamin ON fact_penduduk.kdjeniskelamin =
dim_jeniskelamin.kdjeniskelamin
ORDER BY fact_penduduk.kd;

Hasil query tersebut menyajikan data table yang diinginkan.

Sumber: (Hasil Penelitian, 2021)

Gambar II.18.
Data Table Kependudukan Kubu Raya

2. Setting tipe data pada data table

Data table yang telah terbentuk harus diatur terlebih dahulu tipe datanya, agar

sesuai dengan kebutuhan data-data tersebut.


38

3. Melakukan cleansing

Setelah data table terbentuk, tahapan selanjutnya adalah membersihkan data-

data yang tidak digunakan menggunakan konsep cleansing pada RapidMiner.

Sumber: (Hasil Penelitian, 2021)

Gambar II.19.
Cleansing Data Table Kependudukan Kubu Raya

4. Melakukan prediction

Penerapan prediction ini menggunakan model Naïve Bayes, Generalized Linear

Model, Logistic Regression, Fast Large Margin, Deep Learning, Decision Tree,

Random Forest, Gradient Boosted Trees. Berikut ini, adalah hasil komparasi

seluruh model yang digunakan.


39

Sumber: (Hasil Penelitian, 2021)

Gambar II.20.
Komparasi Model-Model Prediction

Sumber: (Hasil Penelitian, 2021)

Gambar II.21.
ROC Comparison Model-Model Prediction

a. Naïve Bayes

Naïve Bayes merupakan sebuah metode penggolongan berdasarkan

probabilitas sederhana dan dirancang untuk dipergunakan dengan asumsi

bahwa antar satu kelas dengan kelas yang lain tidak saling tergantung

(independen). Pada klasifikasi Naïve Bayes, proses pembelajaran lebih

ditekankan pada mengestimasi probabilitas. Keuntungan dari pendekatan

ini yaitu pengklasifikasian akan mendapatkan nilai error yang lebih kecil

ketika data set berjumlah besar.


40

Sumber: (Hasil Penelitian, 2021)

Gambar II.22.
Lift Charts Naïve Bayes

b. Generalized Linear Model

Generalized linier model (GLM) merupakan perluasan dari model regresi

linier dengan asumsi prediktor memiliki efek linier akan tetapi tidak

mengasumsikan distribusi tertentu dari variabel respon dan digunakan

ketika variabel respon merupakan anggota dari keluarga eksponensial.

Sumber: (Hasil Penelitian, 2021)

Gambar II.23.
Performansi Generalized Linier Model (GLM)

c. Logistic Regression

Regresi logistik adalah sebuah pendekatan untuk membuat model prediksi

seperti halnya regresi linear atau yang biasa disebut dengan istilah Ordinary
41

Least Squares (OLS) regression. Perbedaannya adalah pada regresi logistik,

peneliti memprediksi variabel terikat.

Sumber: (Hasil Penelitian, 2021)

Gambar II.24.
Simulator Logistic Regression

d. Fast Large Margin

Fast Large Margin merupakan salah satu model probabilitas tentang skema

pembelajaran vektor dukungan linier yang hasilnya mirip dengan

implementasi regresi logistik, namun bedanya pengklasifikasi linier ini

mampu bekerja pada kumpulan data dengan jutaan contoh dan atribut.

Sumber: (Hasil Penelitian, 2021)

Gambar II.25.
Optimal Parameters Fast Large Margin
42

e. Deep Learning

Deep Learning adalah bagian dari kecerdasan buatan dan machine learning,

yang merupakan pengembangan dari neural network multiple layer untuk

memberikan ketepatan tugas seperti deteksi objek, pengenalan suara,

terjemahan bahasa dan lain – lain. Deep Learning berbeda dari teknik

machine learning yang tradisional, karena deep learning secara otomatis

melakukan representasi dari data seperti gambar, video atau text tanpa

memperkenalkan aturan kode atau pengetahuan domain manusia.

Sumber: (Hasil Penelitian, 2021)

Gambar II.26.
Weights Deep Learning

f. Decision Tree

Decision tree adalah alat pendukung dengan struktur seperti pohon yang

memodelkan kemungkinan hasil, biaya sumber daya, utilitas, dan

kemungkinan konsekuensi.
43

Sumber: (Hasil Penelitian, 2021)

Gambar II.27.
Model Decision Tree (Jumlah Penduduk Status Kawin)

g. Random Forest

Random forest adalah kombinasi dari masing-masing tree yang baik

kemudian dikombinasikan ke dalam satu model. Random Forest

bergantung pada sebuah nilai vector random dengan distribusi yang sama

pada semua pohon yang masing masing decision tree memiliki kedalaman

yang maksimal.

Sumber: (Hasil Penelitian, 2021)

Gambar II.28.
Model Random Forest
44

h. Gradient Boosted Trees

Gradient boosted trees adalah algoritma machine learning yang

menggunakan ensamble dari decision tree untuk memprediksi nilai.

Sumber: (Hasil Penelitian, 2021)

Gambar II.29.
Optimal Parameters Gradient Boosted Trees

5. Melakukan clustering

Penerapan clustering ini menggunakan model k-Means dan x-Means.

a. K-Means

K-means clustering merupakan salah satu metode cluster analysis non

hirarki yang berusaha untuk mempartisi objek yang ada kedalam satu atau

lebih cluster atau kelompok objek berdasarkan karakteristiknya, sehingga

objek yang mempunyai karakteristik yang sama dikelompokan dalam satu

cluster yang sama dan objek yang mempunyai karakteristik yang berbeda

dikelompokan kedalam cluster yang lain.


45

Sumber: (Hasil Penelitian, 2021)

Gambar II.30.
Centroid Chart K-Means

b. X-Means

X-means adalah kelompok-kelompok (cluster) data, dan jumlah cluster

terbaik berdasarkan perhitungan uji model yang dilakukan ketika proses

eksekusi berlangsung.

Sumber: (Hasil Penelitian, 2021)

Gambar II.31.
Centroid Chart X-Means
BAB III

PENUTUP

3.1. Kesimpulan

Penulisan laporan Tugas Terstruktur yang berjudul Implementasi Data

Warehouse and Business Intelligence (Studi Kasus: Data Kependudukan

Kabupaten Kubu Raya 2018-2020) yang dimodelkan maps (Kabupaten dan

Kecamatan), total penduduk per Kecamatan, tingkat pertumbuhan per tahun, jenis

kelamin (Kabupaten dan Kecamatan), agama (Kabupaten dan Kecamatan), status

kawin, struktur umur, tingkat pendidikan, kepemilikan E-KTP dan jumlah kartu

keluarga menyajikan informasi-informasi yang dapat digunakan sebagai dalam

pengambilan keputusan terutama dalam peningkatan nilai bisnis di Kabupaten

Kubu Raya itu sendiri. Adapun kesimpulan-kesimpulan yang dapat diambil dari

laporan Tugas Terstruktur ini, dijabarkan sebagai berikut:

Berdasarkan keseluruhan hasil penelitian yang telah dilakukan dengan

menggunakan aplikasi Tableau Desktop 2019, dapat diperoleh kesimpulan sebagai

berikut:

1. Jumlah penduduk Kabupaten Kubu Raya secara keseluruhan pada tahun 2020

adalah 610.103.

2. Jumlah penduduk untuk setiap kecamatan pada tahun 2020, yaitu: Kecamatan

Sungai Raya berjumlah 234.424, Sungai Kakap berjumlah 128.877, Sungai

Ambawang berjumlah 80573, Kubu berjumlah 38.082, Batu Ampar berjumlah

35.636, Kuala Mandor berjumlah 28.911, Rasau Jaya berjumlah 28.631, Teluk

46
47

Pakedai 21.226 dan Terentang berjumlah 13.743. Berdasarkan informasi-

informasi ini, maka Kecamatan terpadat adalah Kecamatan Sungai Raya.

3. Jumlah penduduk Kabupaten Kubu Raya pada tahun 2018 adalah 603.407,

tahun 2019 adalah 606.729 dan tahun 2020 adalah 610.103. Berdasarkan

informasi ini, maka diketahui persentase pertumbuhan setiap tahunnya adalah

0,005%.

4. Jumlah penduduk Kabupaten Kubu Raya berdasarkan jenis kelamin pada tahun

2020 adalah 312.027 laki-laki (51,143%)dan 298.076 perempuan (48,857%).

Berdasarkan informasi ini, maka selisih antar jumlah laki-laki dan perempuan

adalah 14131 (2,286%).

5. Jumlah penduduk Kabupaten Kubu Raya berdasarkan agama pada tahun 2020

adalah 505.656 beragama islam, 44.122 beragama Budha, 34.687 beragama

Khatolik, 23.996 beragama Kristen, 1.076 beragama Konghucu, 531 beragama

Hindu dan 35 masih menganut kepercayaan.

6. Jumlah penduduk Kabupaten Kubu Raya berdasarkan status kawin pada tahun

2020 adalah 325.580 yang belum kawin, 260.465 yang sudah kawin, 17.258

yang berstatus cerai mati dan 6.500 yang berstatus cerai hidup.

7. Berdasarkan struktur umur, diketahui bahwa umur produktif (15-64) pada

Kabupaten Kubu Raya pada tahun 2020 berjumlah 430.672.

8. Jumlah penduduk Kabupaten Kubu Raya berdasarkan tingkat pendidikan pada

tahun 2020 adalah 189.010 yang belum sekolah, 81.933 yang tidak tamat SD,

158.243 tamat SD, 75.726 tamat SMP, 83.359 tamat SMA, 2.492 tamat D2,

5.474 tamat D3, 13.004 tamat S1, 802 tamat S2 dan 57 tamat S3.
48

9. Jumlah penduduk Kubu Raya pada tahun 2020 yang mempunyai E-KTP

396.474 berbanding dengan jumlah penduduk yaitu 610.103. Berdasarkan

informasi ini, didapat bahwa rasio kepemilikan E-KTP berjumlah 64,98%.

10. Jumlah kartu keluarga (KK) Kabupaten Kubu Raya pada tahun 2020 adalah

166.130 berbanding dengan jumlah penduduk yaitu dengan 610.103.

Berdasarkan informasi ini, didapat bahwa rasio jumlah penduduk berbanding

dengan jumlah KK adalah 367,24% atau 1 KK terdapat 3,67 penduduk.

11. 7 Desa terdapat pada Kabupaten Kubu Raya tahun 2020, yaitu Desa Parit Baru

dengan jumlah 33.330, Desa Kuala Dua dengan jumlah 31.710, Desa Arang

Limbung dengan jumlah 27.811, Desa Pal Sembilan dengan jumlah 26.052,

Desa Sungai Raya Dalam dengan jumlah 23.690, Desa Sungai Rengas dengan

jumlah 23.556 dan Desa Limbung dengan jumlah 17.327.

3.2. Saran

Dari hasil Implementasi Data Warehouse and Business Intelligence (Studi

Kasus: Data Kependudukan Kabupaten Kubu Raya 2018-2020) ini masih terdapat

beberapa bagian yang perlu dikembangkan lebih lanjut. Adapun saran-saran untuk

pengembangan ke depannya, yaitu:

1. Terkait dengan jumlah penduduk berdasarkan tingkat pendidikan, dapat

dikolaborasikan dengan data kependidikan untuk mengetahui dan mengukur

angka prestasi kasar (APK), angka prestasi sekolah (APS) dan angka prestasi

murni (APM).

2. Ditambahkan referensi atau pengkategorian berdasarkan jenis pekerjaan agar

dapat mengetahui jumlah penduduk berdasarkan jenis pekerjaannya


49

3. Penambahan batas atau border untuk setiap Kecamatan dengan cara mengambil

rentang titik longitude dan rentang titik latitude.


DAFTAR PUSTAKA

[1] M. Sagala, “Implementasi Data Warehouse Pada Perpustakaan Universitas


Katolik Santo Thomas,” JTIUST (Jurnal Tek. Inform. Unika St. Thomas),
vol. 3, no. 1, pp. 33–39, 2018.

[2] Windarto, “Pemanfaatan Data Warehouse Sebagai Sarana Penunjang


Penyusunan Borang Akreditasi Standar 3 Pada Fakultas Teknologi Informasi
Universitas Budi Luhur,” J. Telemat. MKOM, vol. 3, no. 2, pp. 1–11, 2011.

[3] Rianto and C. Hadis, “Perancangan Data Warehouse Pada Rumah Sakit
(Studi Kasus : BLUD RSU Kota Banjar),” J. Siliwangi Seri Sains dan
Teknol., vol. 3, no. 2, pp. 214–221, 2017.

[4] K. Nisa, D. Sugiarto, and T. Siswanto, “Perancangan Data Warehouse Harga


Pangan Di Wilayah Perumda Pasar Jaya,” Explor. Sist. Inf. dan Telemat.,
vol. 12, no. 1, pp. 47–55, 2021,

[5] Imelda, “Busines Intelligence,” Maj. Ilm. UNIKOM, vol. 11, no. 1, pp. 111–
122, 2017.

[6] F. F. D. Imaniawan and F. F. Wati, “Sistem Informasi Administrasi


Kependudukan Berbasis Web Desa Sawahan,” IJSE - Indones. J. Softw.
Eng., vol. 3, no. 2, pp. 77–81, 2017.

[7] R. Akbar, A. Soniawan, R. Dinur, J. Adrian, R. Azim, and A. Zikri,


“Implementasi Business Intelligence untuk Menganalisis Data Persalinan
Anak di Klinik Ani Padang dengan Menggunakan Aplikasi Tableau Public,”
JOIN (Jurnal Online Inform., vol. 2, no. 1, pp. 20–24, 2017.

50

Anda mungkin juga menyukai