Anda di halaman 1dari 17

Penerapan Business Understanding Dan Perbedaan Google Colab Dengan Jupyter

Notebook

Dosen Pembimbing : Evta Indra, S.Kom., M.Kom.

KELOMPOK 2
Farhan Yumna (193303040264)
Ben Jua Ivand Manihuruk (193303040275)
Lolo Frans M. Brutu (193303040283)
Reinhard Halomoan Napitupulu (193303040316)

PRODI S1 - SISTEM INFORMASI


FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS PRIMA INDONESIA
2023
KATA PENGANTAR
Puji syukur kehadirat Tuhan Yang Maha Esa yang telah memberikan kita
kesehatan, dan kesempatan sehingga kami dapat menyelesaikan Makalah Audit Sistem
Informasi yang berjudul “Penerapan Business Understanding Dan Perbedaan
Google Colab Dengan Jupyter Notebook”.
Kami menyadari, bahwa makalah data science fundamental yang kami buat ini
masih jauh dari kata sempurna baik segi penyusunan, bahasa, maupun penulisannya.
Oleh karena itu, kami sangat mengharapkan kritik dan saran yang membangun dari
semua pembaca guna menjadi acuan agar penulis bisa menjadi lebih baik lagi di masa
mendatang.
Semoga makalah penerapan business understanding dan perbedaan google colab
dengan jupyter notebook ini bisa menambah wawasan para pembaca dan bisa
bermanfaat untuk perkembangan dan peningkatan ilmu pengetahuan.

Medan, 18 Maret 2023

Penulis

ii
DAFTAR ISI
COVER
KATA PENGANTAR......................................................................................................ii
DAFTAR ISI....................................................................................................................iii
DAFTAR GAMBAR.......................................................................................................iii
1.1 Fase dalam CRIPS DM...............................................................................................1
3.2 Phase of Data Modeling..............................................................................................3
4.3 From Modeling to Evaluation.....................................................................................4
5.4 Fase Program menentukan Sertifikasi.........................................................................5
DAFTAR TABEL...........................................................................................................iii
2.1 Jenis Data Kuantitatif Dan Data Kualitatif.................................................................2
6.3 Data hasil uji sertifikasi di laboratorium ITCC pada tahun 2017 – 2018...................6
7.4 Data Selection.............................................................................................................7
8.5 Kriteria 1.....................................................................................................................8
8.6 Kriteria 2.....................................................................................................................8
9.6 Kriteria 3.....................................................................................................................9
9.7 Kriteria 4.....................................................................................................................0
9.8 Kriteria 5.....................................................................................................................9
10.9 Variable Kelulusan....................................................................................................10
BAB I.................................................................................................................................1
PENDAHULUAN.............................................................................................................1
1.1 Business Understanding..............................................................................................1
1.2 Data Understanding.....................................................................................................2
1.3 Data Prepation.............................................................................................................3
1.4 Modeling.....................................................................................................................4
1.5 Evaluation....................................................................................................................4
1.6 Deployment.................................................................................................................4
1.7 Contoh Penerapan Business Understanding................................................................5
1.8 Perbedaan Google Colab Dengan Jupyter Notebook................................................11
BAB II................................................................................................................................8
KESIMPULAN.................................................................................................................8
DAFTAR PUSTAKA.......................................................................................................9

iii
iii
BAB I
PENDAHULUAN

1.1 Business Understanding


Tahap pertama dari CRISP DM (The CRoss Industry Standard Process for Data
Mining) adalah Business Understanding yang merupakan tahap dimana Business
problem didefinisikan dengan sederhana dan tepat. Meskipun terkesan sederhana pada
hakikatnya tahapan ini memerlukan penguasaan pada dua bagian yang berbeda yaitu
pemahaman terhadap business process termasuk regulasi yang mengaturnya dan
pemahaman terhadap cara pengolahannya. Tahapan yang pertama ini bisa dibilang
sangat vital karena praktisi data butuh pijakan dasar untuk melakukan analisis data.
Salah satunya adalah business knowledge ataupun pengetahuan dari segi objek bisnis.
Dalam tahap ini, praktisi data akan mulai belajar bagaimana membangun atau
mendapatkan data, bagaimana untuk mencocokkan tujuan permodelan untuk tujuan
bisnis sehingga model terbaik dapat dibangun.
Adapun kegiatan dalam business understanding ini mulai dari menentukan
tujuan, menentukan fenomena dan persyaratan dengan jelas secara keseluruhan,
menerjemahkan tujuan tersebut serta menentukan pembatasan dalam perumusan
masalah yang diaplikasikan dalam data mining dan selanjutnya mempersiapkan strategi
awal untuk mencapai tujuan tersebut.

Gambar 1.1 Fase dalam CRISP DM

1
2

1.2 Data Understanding


Data Understanding merupakan proses dimana kita mempertemukan antara data
apa yang kita miliki dan data apa yang kita seharusnya perlukan. Bisa jadi suatu project
data analisis berawal dari penemuan data-data yang telah ada yang kemudian
mengarahkan analist untuk menggali knowledge yang ada pada kumpulan data tersebut.
Jenis data akan sangat menentukan jenis algoritma dan tujuan dari data mining yang
ingin dicapai. Pada tahapan ini data analist perlu menguasai pemahaman terhadap jenis
data kuantitatif dan data kualitatif sebagai berikut:

Jenis Data Deskripsi Hal yang perlu diperhatikan Catatan bagi data analist
· Posisi data setara untuk setiap subtype.
· Hanya untuk memberikan label pada • Penggunaan jenis data ini untuk Data
variable mining dengan tujuan prediction dan
· lebih tepat menggunakan kode biner forecasting mengacu pada aturan
Contoh misalkan terdapat 4 tipe bahwa Jumlah variabel biner harus
data yang berasal dari peruntukan lahan maka digunakan kurang 1 dari jumlah kategori yang akan
Nominal proses kategorisasi atau kode seperti ini: dikuantitatifkan (Gujarati dan Porter
klasifikasi Komersial 1 0 0 2010; 358).
Residensial 0 1 0 • Sangat baik untuk data mining dengan
Perkantoran 0 0 1 tujuan asosiasi dan klasifikasi yang
Campuran 0 0 0 menggunakan jenis data categorical
· Tidak bisa dilakukan operasi (tidak dinyatakan dalam angka)
matematika
· Posisi data untuk setiap subtype tidak
setara namun tidak diketahui berapa
jarak antar subtype
data yang berasal dari Apabila menggunakan Algoritma Konstanta
· Memiliki urutan dan tidak memiliki
proses kategorisasi atau Nearest Neigborhood, perlu disadari bahwa
nilai Nol, contoh posisi tanah
klasifikasi namun jarak antara sub type tidak diketahui artinya
terhadap elevasi jalan dinyatakan
Ordinal diantara data tersebut hubungan antar dua objek dengan dengan
sebagai berikut:
terdapat hubungan perbedaan kode 3 dan 2 adalah sama dengan
Lebih tinggi 3
(misalnya hubungan hubungan antara dua objek dengan kode 2
Sejajar 2
bertingkat) dan 1.
Lebih rendah 1
· Tidak bisa dilakukan operasi
matematika
Perlu kehati-hatian dalam menggunakan
Data interval adalah Konstanta Nearest Neigborhood karena
· Tidak memiliki nilai Nol absolut
data yang diperoleh tanda plus dan minus untuk angka yang
sebagai contoh data pertumbuhan
dengan cara sama tidak berbeda contoh:
Interval ekonomi dimana terdapat nilai negatif
pengukuran namun negara dengan tingkat pertumbuhan positif
· Bisa dilakukan operasi matematika
tidak ada titik nol yang 2 dan negara dengan tingkat pertumbuhan
terbatas
absolut minus 2 akan terkumpul dalam kelompok
yang sama.
data yang diperoleh
dengan cara
pengukuran, dimana · Merupakan peringkat teratas dari Tepat untuk digunakan pada data mining
Rasio jarak dua titik pada semua jenis data dengan algoritma yang berdasar pada semua
skala sudah diketahui, · Bisa dilakukan operasi matematika jenis operasi matematika.
dan mempunyai titik
nol yang absolut

Tabel 2.1 Jenis Data Kuantitatif Dan Data Kualitatif

1.3 Data Prepation


Proses data preparasi merupakan proses data treatment menuju model berkualitas
3

yang berguna. Tahapan ini adalah yang paling menguras resources dari tim analisis.
Model yang baik dan akurat berawal dari data preparasi yang baik. Beberapa hal yang
umum dilakukan pada tahapan ini adalah:
1. Melakukan pengecekan kembali pada kebenaran data;
Pengecekan pada data perlu di desain bertingkat sehingga akuntabilitas terjaga.
Pengecekan juga diperlukan terhadap konsistensi inputing data. System yang baik
dalam pengumpulan data antara lain menggunakan default akan dapat menjaga
konsistensi data.
2. Mengelola data outlier
Data Outlier perlu dikelola dengan baik. Data Outlier dapat berupa Univariate
Outlier, dan Multivariate Outlier serta dapat berada pada variable dependent
maupun variable independent. Data Mining untuk tujuan generalisir akan
terpengaruh dengan dengan Data Outlier sehingga perlu dinetralisir. Sebelum
melakukan treatment atas data Outlier alangkah baiknya terlebih dahulu dilakukan
pengecekan terhadap pengambilan dan pengisian data.
3. Memberlakukan data missing dan data inkonsistensi
Perlakuan terhadap data missing harus match dengan tujuan dari data mining itu
sendiri. Misalkan data missing yang di isi dengan average mungkin masih dapat
diterima untuk tujuan prediction dan forecasting, namun untuk klastering bisa jadi
akan mengarahkan pada kelompok yang kurang tepat. Sebaliknya menggunakan
data yang sering muncul untuk mengisi missing data untuk multi variable data
mining akan berpengaruh pada hasil untuk tujuan prediction dan forecast.

1.4 Modeling
Model adalah deskripsi atau knowledge berkualitas yang dibangun oleh system
atau process dari kalkulasi dan prediksi yang berterima. Kata sifat berterima disini
mengacu pada sedikitnya beberapa hal yaitu technically correct dan economically
correct (pada penelitian ekonomi).

Gambar 3.2 Phases of Data Modeling


4

1.5 Evaluation

Pada tahap ini akan dilakukan evaluasi terhadap kualitas dan efektivitas satu

atau lebih model yang dikirim dalam fase pemodelan sebelum menempatakan untuk

digunakan di lapangan. Tentukan apakah model tersebut benar benar mencapai tujuan

yang ditetapkan pada fase pertama, yakni tahap Business Understanding. Menetapkan

beberapa aspek penting dari masalah bisnis atau penelitian belum diperhitungkan secara

memadai. Dan terakhir mengambil keputusan berdasrkan data mining.

Gambar 4.3 From Modeling to Evaluation

1.6 Deployment
Tahap terakhir dalam model CRISP-DM adalah Deployment. Tahap Deployment
adalah saat dimana para analyst dan engineer mempacking dan menyampaikan proses
data analisis yang telah dilakukan Perencanaan untuk Deployment dimulai selama
Business Understanding dan harus menggabungkan tidak hanya bagaimana untuk
menghasilkan nilai model, tetapi juga bagaimana mengkonversi skor keputusan, dan
bagaimana untuk menggabungkan keputusan dalam sistem operasional.
Pada akhirnya, rencana sistem Deployment mengakui bahwa tidak ada model
yang statis. Model tersebut dibangun dari data yang diwakili data pada waktu tertentu,
sehingga perubahan waktu dapat menyebabkan berubahnya karakteristik data. Modelpun
harus dipantau dan mungkin diganti dengan model yang sudah diperbaiki.
5

1.7 Contoh Penerapan Business Understanding


Analisa kebutuhan merupakan tahapan awal dari melakukan
penelitian. Dengan menggunakan metode Crisp DM diperlukan
beberapa tahapan yaitu sebagai berikut :
a. Business Understanding Phase (Fase Pemahaman Bisnis)
Pada tahap ini dilakukan penentuan tujuan dan kebutuhan secara detail dalam
lingkup bisnis atau unit penelitian secara keseluruhan. Hal ini memiliki tujuan
untuk menciptakan sistem penentuan yang dapat memprediksi tingkat kelulusan
peserta sertifikasi berdasarkan kriteria uji sertifikasi dengan
mengimplementasikan pendekatan Algoritma Naive Bayes. untuk mencapai
tujuan tersebut dilakukan analisis terlebih dahulu.
1. Analisa Masalah
Analisa permasalahan ini dilakukan untuk mengetahui masalah-masalah
yang terjadi dengan menggunakan metode Fishbone. Fishbone atau
tulang ikan menjelaskan sebuah sebab-akibat dari sebuah masalah.
Berikut merupakan fishbone yang telah dibuat oleh peneliti, yaitu sebagai
berikut:

Diagram fishbone ini menjelaskan tentang sebab – akibat dalam suatu


masalah. Adapun penjelasan dari masing-masing penyebabnya adalah:
a) Manusia: Penyebab sulitnya
m

Gambar 5.4 Fase program menetukan sertifikasi

enentukan program sertifikasi yang tepat untuk dipilih, yaitu karena


kurangnya pengetahuan para peserta mengenai kriteria uji sertifikasi yang
dimiliki dan tidak adanya ilmu tentang prediksi. Sehingga peserta sering
kali tidak tepat dalam menentukan program yang tepat.
6

b) Metode: Dari pihak laboratorium masih kurang dalam memberikan


edukasi mengenai program sertifikasi yang tepat untuk dipilih. Hal ini
disebabkan karena belum adanya metode untuk mendukung proses
prediksi.
c) Sistem: Belum ada sistem untuk memprediksi tingkat kelulusan uji
sertifikasi sehingga kurangnya informasi terkait uji sertifikasi
d) Material: Hasil data uji sertifikasi sebelumnya tidak diolah sehingga
data yang tersimpan dibiarkan begitu
e) dan peserta tidak mengetahui kriteria yang dimiliki.
Berdasarkan analisa diatas, kita dapat memberikan solusi yang
akan membantu dalam pengolahan data yang lebih efektif dan efisien,
agar data tersebut dapat diolah dan menghasilkan sistem yang bisa
membantu proses prediksi dalam menentukan tingkat kelulusan peserta
sertifikasi. Yaitu menggunakan algoritma naive bayes.
b. Data Understanding Phase (Fase Pemahaman Data)
Pada tahap ini akan dilakukan pengumpulan data. Pada laporan kali ini, data
yang digunakan sebagai contoh adalah data hasil uji sertifikasi di
laboratorium ITCC pada tahun 2017 – 2018 dengan jumlah sebanyak 1024
data. Data yang diperoleh adalah sebagai berikut:

No Program K1 K2 K3 K4 K5 Keterangan Nilai


1 MOS-01 100% 100% 100% 100% 100% Lulus 1000
2 MOS-01 93% 94% 98% 92% 85% Lulus 924
3 MOS-01 96% 93% 97% 96% 68% Lulus 900
4 MOS-01 93% 97% 99% 95% 61% Lulus 890
5 MOS-01 93% 90% 94% 83% 91% Lulus 902
… …… …… …… …… …… …… …… ……
… ……. ……. ……. ……. ……. ……. ……. …….
… ……. ……. ……. ……. ……. ……. ……. …….
… …….. …….. …….. …….. …….. …….. …….. ……..
1022 MOS-01 58% 58% 57% 61% 84% Tidak 637
1023 MOS-01 57% 63% 55% 61% 71% Tidak 614
1023 MOS-01 56% 58% 61% 64% 61% Tidak 600

Tabel 6.3 data hasil uji sertifikasi di laboratorium ITCC pada tahun 2017 – 2018
c. Data Preparation Phase (Fase Pengolahan Data)
7

Pada tahap pengolahan data dilakukan proses data selection dan data
transformation. Data yang sudah digabungkan akan diolah di fase
pengolahan data ini.
1. Data Selection (Seleksi Data)
Pada tahap pengolahan data dilakukan proses data selection dan
data transformation. Data yang sudah digabungkan akan diolah di
fase pengolahan data ini.

No K1 K2 K3 K4 K5 Keterangan Nilai
1 100% 100% 100% 100% 100% Lulus 1000
2 93% 94% 98% 92% 85% Lulus 924
3 96% 93% 97% 96% 68% Lulus 900
4 93% 97% 99% 95% 61% Lulus 890
5 93% 90% 94% 83% 91% Lulus 902
… …… …… …… …… …… …… ……
… ……. ……. ……. ……. ……. ……. …….
… ……. ……. ……. ……. ……. ……. …….
… …….. …….. …….. …….. …….. …….. ……..
1022 58% 58% 57% 61% 84% Tidak 637
1023 57% 63% 55% 61% 71% Tidak 614
1023 56% 58% 61% 64% 61% Tidak 600

Tabel 7.4 Data Selection

2. Data Transformation (Pengubahan Data)


Data yang telah di seleksi selanjutnya akan diproses lagi pada
tahap pengubahan data. Tahap pengubahan data merupakan
penggabungan data dengan melakukan pengklasifikasian menjadi
beberapa kategori. Berikut tabel pengkalsifikasian data:

a.) Kriteria 1 (K1)


Variabel ini berisi range nilai yang telah diklasifikasikan menjadi
5 Kategori, yaitu A, B, C, D dan E. Berikut kriteria 1 yang telah
di klasifikasi sebagai berikut:
8

K1 Kategori
90%-100% A
80%-89% B
65-79% C
55-64% D
<55% E

Tabel 8.5 Kriteria 1

b.) Kriteria 2 (K2)


Variabel ini berisi range nilai yang telah diklasifikasikan menjadi
5 Kategori, yaitu A, B, C, D dan E. Berikut kriteria 2 yang telah
di klasifikasi sebagai berikut:

K2 Kategori
90%-100% A
80%-89% B
65-79% C
55-64% D
<55% E

Tabel 8.6 Kriteria 2

c.) Kriteria 3 (K3)


Variabel ini berisi range nilai yang telah diklasifikasikan menjadi
5 Kategori, yaitu A, B, C, D dan E. Berikut kriteria 3 yang telah
di klasifikasi sebagai berikut:

K3 Kategori
90%-100% A
80%-89% B
65-79% C
55-64% D
<55% E
9

Tabel 9.6 Kriteria 3

d.) Kriteria 4
Variabel ini berisi range nilai yang telah diklasifikasikan menjadi
5 Kategori, yaitu A, B, C, D dan E. Berikut kriteria 4 yang telah
di klasifikasi sebagai berikut:
K4 Kategori
90%-100% A
80%-89% B
65-79% C
55-64% D
<55% E

Tabel 9.7 Kriteria 4

e.) Kriteria 5
Variabel ini berisi range nilai yang telah diklasifikasikan menjadi
5 Kategori, yaitu A, B, C, D dan E. Berikut kriteria 5 yang telah
di klasifikasi sebagai berikut:
K5 Kategori
90%-100% A
80%-89% B
65-79% C
55-64% D
<55% E

Tabel 9.8 Kriteria 5

f.) Tingkat KeluluVariabel tingkat keberhasilan merupakan class


atau data yang berfungsi untuk
menentukan hasil keputusan. Dalam pengelompokan data sudah
ditentukan secara tetap agar tidak terjadi kesalahan dalam proses
perhitungan program. Data keputusan tingkat keberhasilan
memiliki dua nilai yaitu “LULUS” dan “TIDAK”.
Berikut ini merupakan data yang telah di klasifikasi berdasarkan
10

kategori masing masing atribut:

No K1 K2 K3 K4 K5 Keterangan
1 A A A A A Lulus
2 A A A A B Lulus
3 A A A A C Lulus
4 A A A A D Lulus
5 A A A B A Lulus
… …… …… …… …… …… ……
… ……. ……. ……. ……. ……. …….
… ……. ……. ……. ……. ……. …….
… …….. …….. …….. …….. …….. ……..
1022 D D D D D Tidak
1023 D D D D D Tidak
1023 D D D D D Tidak

Tabel 10.9 Variabel Kelulusan

1.8 Perbedaan Google Colab Dengan Jupyter Notebook

1) Google Colab

Google Colab atau Google Colaboratory, adalah sebuah executable


document yang dapat digunakan untuk menyimpan, menulis, serta membagikan
program yang telah ditulis melalui Google Drive.
11

Software ini pada dasarnya serupa dengan Jupyter Notebook gratis


berbentuk cloud yang dijalankan menggunakan browser, seperti Mozilla Firefox dan
Google Chrome. Ia memungkinkan penggunanya untuk menjalankan kode Python
tanpa perlu melakukan proses instalasi dan setup lainnya. Justru, semua
keperluan setting dan adjustment akan diserahkan ke cloud.

2) Jupyter Notebook

Jupyter adalah singkatan dari tiga bahasa


pemrograman Julia (Ju), Python (Py), dan R. Tiga bahasa pemrograman ini adalah
sesuatu yang penting bagi seorang data scientist.

Jupyter berfungsi untuk membantu dalam membuat narasi komputasi yang


menjelaskan makna dari data di dalamnya dan memberikan insight mengenai data
tersebut.

Selain itu, Jupyter juga mempermudah kerja sama antara insinyur dan data
scientist karena kemudahannya dalam menulis dan berbagi teks dan kode.

Karena alasan inilah, Jupyter mempermudah data scientist untuk


berkolaborasi dengan data scientist, data researchers atau data engineers lainnya.

3) Perbedaan Google Colab dengan Jupyter Notebook

Pada dasarnya kedua software ini serupa yang dimana dijalankan


menggunakan browser berbasis cloud. Perbedaam kedua software ini hanya terdapat
pada bahasa pemrogramannya pada Google Colab mendukung Bahasa pemrograman
python sedangkan Jupyter mendukung tiga bahasa
pemrograman Julia (Ju), Python (Py), dan R.
BAB II
KESIMPULAN

Dengan dibuatnya makalah dengan judul “Penerapan Business Understanding


Dan Perbedaan Google Colab Dengan Jupyter Notebook”. Diharapkan para pembaca
dapat mengetahui pengertian,fungsi, dan perbedaan dari topik yang sudah dibahas dalam
makalah ini, dan diharapkan juga dapat menjadi referensi bagi pembaca untuk
kedepannya serta memberikan dampak positif dan keuntungan yang besar bagi pembaca.

12
DAFTAR PUSTAKA
[1]. Dapat diaksesnpada website: https://www.djkn.kemenkeu.go.id/artikel/baca/
[2]. Dapat diakses pada website : https://dqlab.id/teknik-analisis-data-crisp-dm-dalam-
data-mining
[3]. Dapat diakses pada website : https://flinsetyadi.com/metodologi-crisp-dm-beserta-
contoh-kasusnya/
[4]. Dapat diakses pada website : https://glints.com/id/lowongan/google-colab-adalah/
[5]. Dapat diakses pada website : https://glints.com/id/lowongan/jupyter-adalah/
[6]. Dapat diakses pada website : https://www.studocu.com/id/document/universitas-
lambung-mangkurat/ilmu-komputer/contoh-kasus-naive-bayes-menggunakan-
metode-crisp-dm-analisis-kebutuhan/37420177

13

Anda mungkin juga menyukai