Challenge 3

Diunggah oleh

candra vakris

0% menganggap dokumen ini bermanfaat (0 suara)

6 tayangan33 halaman

Hak Cipta

Format Tersedia

PPTX, PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Hak Cipta:

Format Tersedia

Unduh sebagai PPTX, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

6 tayangan33 halaman

Challenge 3

Diunggah oleh

candra vakris

Hak Cipta:

Format Tersedia

Unduh sebagai PPTX, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 33

Cari di dalam dokumen

Challenge 3

Data Science
Group Y Data Science 5
- Timotius Putra Goldvist Sinaga (1955627840-593)
- Vakris Candra Sasmita (1955627840-723)
Challenge 1

Latar Belakang

Di Era Digital ini masyarakat membutuhkan informasi Berikut adalah informasi sekilas mengenai
mengenai perkembangan kasus covid-19 di Indonesia. perkembangan Covid-19 di Indonesia
Oleh karena itu kita hadir untuk menjawab
permasalahan tersebut.
Jumlah kasus covid terbanyak pada provinsi DKI Puncak kasus baru tertinggi tercatat pada bulan Juli
Jakarta mengingat daerah tersebut merupakan provinsi 2021 dan Februari 2022
dengan kepadatan penduduk tinggi sehingga
memperceppat penyebaran covid19
Pada November 2021 terjadi pelandaian kasus
covid19 dikarenakan kebijakan vaksinasi dan
pembatasan sosial yang menekan penyebaran virus
covid 19 dan menurunkan persentase kasus baru
covid19.
Berdasarkan peta ini, dapat disimpulkan sebaran covid19 terbesar terdapat di Pulau Jawa khususnya
Provinsi DKI Jakarta.
Jumlah kasus sembuh didominasi pada daerah di
Pulau Jawa dikarenakan daerah tersebut memiliki
jumlah penduduk yang banyak dibanding pulau lain,
dan penyebarannya tergolong cepat. Di Pulau Jawa
pun memiliki fasilitas kesehatan yang lebih baik
dibanding daerah lainnya.
Challenge 2
Reading the Data

🞆 Menyiapkan libarary yang digunakan : pandas,

numpy, matplotlib, seaborn, statsmodel
🞆 Melakukan pemanggilan data customer churn
Data Cleaning

Checking Data Types

🞆 Melakukan pemeriksaan untuk memastikan tipe
data setiap variable telah sesuai
Data Cleaning

Checking Missing Values

Data Cleaning

Missing Value
🞆 Data tidak mengandung nilai kosong dan dapat ke
tahap data cleaning selanjutnya
Data Cleaning

Deteccting Outliers
Data Cleaning

🞆 Dari hasil output data banyak mengandung outliier

🞆 Karena jumlah banyaknya pencilan tidak terlalu
banyak maka dapat melakukan penghapusan
dengan outlier tersebut
Data Cleaning

Handling Outliers
Data Cleaning

🞆 Setelah dilakukan pembersihan pencilan jumlah

baris yang sebelumnya 4250 menjadi 3482
EDA

🞆 Melakukan pemisahan tipe data

numerical dan tipe data categorical
EDA

🞆 sns.distplot(df_train['account_length'])
🞆 sns.boxplot(df_train['total_day_calls'])
🞆 Sebaran data 'total_day_calls terlihat dari boxplot dan distplot
Distribusi Total Day Minutes
● sns.kdeplot(df_train['total_day_minutes'])
EDA
Perbandingan pelanggan melakukan churn
pelanggan melakukan churn berdasar internasional
plan
pelanggan melakukan churn berdasarkan voice mail
plan
Banyak pelanggan churn berdasarkan kode area
🞆 Jumlah pelanggan melakukan
pemanggilan CS disbanding tingkat
costomer churn
🞆 Jumlah pelanggan melakukan pemanggilan CS
disbanding tingkat costomer churn
🞆 Semakin banyak tingkat costumer churn pada
banyak pemanggilan internasional 2-5
Total day charge berdasarkan pelanggan melakukan
churn
Standarisation Data

🞆 Agar data lebih terpusat dan memudahkan algorima clasifikasi jika sebaran data seragam
Machine Learning

Spliting
🞆 Mendefinisikan variable terikat Y: Churn
🞆 Dan variable x sebagai variable bebas
Machine Learning

Logistic Regression
🞆 Memiliki tingkat akurasi model
87.96%
Machine Learning

Decision Tree
🞆 Memiliki tingkat akurasi model 85.02%
Conclusion

🞆 Dari dua model algoritma ML di atas regresi logistic memiliki tingkat akurasi lebih tinggi disbanding
algoritma Decision Tree
Prediksi Logistik Regression

Anda mungkin juga menyukai

Resume Bab 3 - Buku 2 - Fungsi Biaya Nilai Dan Mutu Informasi - Hindri Wahidah Munawaroh - F1B017009
Dokumen7 halaman
Resume Bab 3 - Buku 2 - Fungsi Biaya Nilai Dan Mutu Informasi - Hindri Wahidah Munawaroh - F1B017009
Hindri Wahidah Munawaroh
100% (1)
Makalah Data Mining
Dokumen39 halaman
Makalah Data Mining
cindy yanti
100% (1)
Kel 11 - Uts - Big Data
Dokumen14 halaman
Kel 11 - Uts - Big Data
titianistiqoma
Belum ada peringkat
1861 4884 1 PB
Dokumen9 halaman
1861 4884 1 PB
Hafizh Annaufal
Belum ada peringkat
v01
Dokumen26 halaman
v01
Tsaqif Alfatan Nugraha
Belum ada peringkat
7-02 - Kelompok 3 - Tugas ASI Data Mining
Dokumen28 halaman
7-02 - Kelompok 3 - Tugas ASI Data Mining
Ihsan Daffa
Belum ada peringkat
Laporan Penelitian Tingkat Resiko Covid-19 Di Jawa Barat Menggunakan K-Nearest Neighbour
Dokumen5 halaman
Laporan Penelitian Tingkat Resiko Covid-19 Di Jawa Barat Menggunakan K-Nearest Neighbour
Royan Hisyam Rafliansyah
Belum ada peringkat
1 SM
Dokumen14 halaman
1 SM
rihanaqotrunnada
Belum ada peringkat
CLARANS - SEGMENTASI LOYALITAS PELANGGAN MODEL RFM Clarans
Dokumen7 halaman
CLARANS - SEGMENTASI LOYALITAS PELANGGAN MODEL RFM Clarans
solehhudin aulia
Belum ada peringkat
29 55 1 SM
Dokumen13 halaman
29 55 1 SM
Almer Risma
Belum ada peringkat
Tugas Kelompok Datamining - Naive Bayes (Kelompok 2)
Dokumen1 halaman
Tugas Kelompok Datamining - Naive Bayes (Kelompok 2)
Anas Ibnu Madjah
Belum ada peringkat
Portofolio PDF
Dokumen14 halaman
Portofolio PDF
Firman Brilian
Belum ada peringkat
Ujian Tengah Semester It II
Dokumen6 halaman
Ujian Tengah Semester It II
Dewa Putu Oka Diatmika
Belum ada peringkat
Penerapan Algoritma Decision Tree C4.5 Untuk Deteksi Fraud Pada Kartu Kredit Dengan Oversampling Synthetic Minority Technique (SMOTE)
Dokumen6 halaman
Penerapan Algoritma Decision Tree C4.5 Untuk Deteksi Fraud Pada Kartu Kredit Dengan Oversampling Synthetic Minority Technique (SMOTE)
Hendaryie Tjoeng
Belum ada peringkat
Pertemuani: Latar Belakang Datamining
Dokumen44 halaman
Pertemuani: Latar Belakang Datamining
Putra
Belum ada peringkat
Tugas Data Mining
Dokumen6 halaman
Tugas Data Mining
Andi Fira
Belum ada peringkat
Laporan Tugas Besar Machine Learning
Dokumen13 halaman
Laporan Tugas Besar Machine Learning
Rachdian Habi Yahya
Belum ada peringkat
Pengolahan Data
Dokumen34 halaman
Pengolahan Data
Rini Kusuma Dewi
Belum ada peringkat
BAB 3: Data Preprocessing: Mengapa Perlu Proses Awal Terhadap Data?
Dokumen42 halaman
BAB 3: Data Preprocessing: Mengapa Perlu Proses Awal Terhadap Data?
Fierhan Hasir
Belum ada peringkat
2362 8472 2 PB
Dokumen7 halaman
2362 8472 2 PB
Bernad Sitompul
Belum ada peringkat
10 19 1 SM
Dokumen8 halaman
10 19 1 SM
sulis
Belum ada peringkat
Data
Dokumen14 halaman
Data
Novi Dwi Aryanti
Belum ada peringkat
Tugas Aps
Dokumen14 halaman
Tugas Aps
Devi Fatmawati
Belum ada peringkat
UTS Data Mining
Dokumen13 halaman
UTS Data Mining
Dimas Kurnia Arsy
Belum ada peringkat
Akdm Bigpro
Dokumen65 halaman
Akdm Bigpro
DELA SRIWAHYUNI
Belum ada peringkat
LBD Minggu 1
Dokumen16 halaman
LBD Minggu 1
HAN HAN
Belum ada peringkat
21.04.573 Jurnal Eproc
Dokumen12 halaman
21.04.573 Jurnal Eproc
Yuliyanti Yunus
Belum ada peringkat
Proposal Sistem Informasi Manajemen Penjualan Pakaian Jadi
Dokumen12 halaman
Proposal Sistem Informasi Manajemen Penjualan Pakaian Jadi
Kidang mas
Belum ada peringkat
Kelompok 4 - BDA C - Analisis Projek UTS
Dokumen47 halaman
Kelompok 4 - BDA C - Analisis Projek UTS
fredy Darmawan
Belum ada peringkat
Laporan Penelitian
Dokumen11 halaman
Laporan Penelitian
Dono Prahara
Belum ada peringkat
Tugas DSS
Dokumen5 halaman
Tugas DSS
Nur Arif Setiawan
Belum ada peringkat
Kelompok 24 - Makalah Data Mining - Preprocessing Data
Dokumen13 halaman
Kelompok 24 - Makalah Data Mining - Preprocessing Data
Adinda Nur Halisyah
Belum ada peringkat
Jurnal
Dokumen27 halaman
Jurnal
Dafa Fauzan
Belum ada peringkat
Muhammad Azizul Hakim - Clustering-Dm
Dokumen22 halaman
Muhammad Azizul Hakim - Clustering-Dm
Azizul Hakim
Belum ada peringkat
Adapun Contoh Dari Beberapa Karakteristik Adalah Sebagai Berikut
Dokumen6 halaman
Adapun Contoh Dari Beberapa Karakteristik Adalah Sebagai Berikut
Herdy Timanta Ginting 1907113439
Belum ada peringkat
Klasifikasi Pengguna Kendaraan Roda 4 Dengan Algoritma K-Nearest Neighbor
Dokumen7 halaman
Klasifikasi Pengguna Kendaraan Roda 4 Dengan Algoritma K-Nearest Neighbor
se n da l je pi t bu su k
Belum ada peringkat
Mastering 7 QC Tools For Improvement
Dokumen84 halaman
Mastering 7 QC Tools For Improvement
setengah mahasiswa
Belum ada peringkat
M. Tegar Juliansyah - Tugas 3 - Karya Ilmiah
Dokumen11 halaman
M. Tegar Juliansyah - Tugas 3 - Karya Ilmiah
M. Tegar Juliansyah
Belum ada peringkat
KNN (K-Nearest Neighbour)
Dokumen18 halaman
KNN (K-Nearest Neighbour)
Ayunda Putri Anjani
Belum ada peringkat
Mastering 7 QC Tools For Improvement
Dokumen84 halaman
Mastering 7 QC Tools For Improvement
ahmad habibi
Belum ada peringkat
FR - Ananda Fauia Sabban
Dokumen11 halaman
FR - Ananda Fauia Sabban
Ananda Fauzia Sabban
Belum ada peringkat
Pengembangan Sistem Informasi Pengelolaan Data Gangguan Telepon Rumah (Studi Kasus Di Pt. Telkom Garut)
Dokumen151 halaman
Pengembangan Sistem Informasi Pengelolaan Data Gangguan Telepon Rumah (Studi Kasus Di Pt. Telkom Garut)
digilibsttg
Belum ada peringkat
Mastering 7 QC Tools For Improvement
Dokumen84 halaman
Mastering 7 QC Tools For Improvement
verd1988
Belum ada peringkat
1b. Pengantar Biostatistik
Dokumen62 halaman
1b. Pengantar Biostatistik
Juwita Nanda
Belum ada peringkat
Pengelompokan KabupatenKota Di Pulau Kalimantan Dengan Fuzzy C-Means Berdasarkan Indikator Kemiskinan
Dokumen8 halaman
Pengelompokan KabupatenKota Di Pulau Kalimantan Dengan Fuzzy C-Means Berdasarkan Indikator Kemiskinan
Ifenza Hernanda
Belum ada peringkat
Modul Data Mining
Dokumen52 halaman
Modul Data Mining
Muhammad Indra
Belum ada peringkat
1612501468-M.Febriyan Dwiki Prayoga-Penambangan Data-AC
Dokumen14 halaman
1612501468-M.Febriyan Dwiki Prayoga-Penambangan Data-AC
febriyan
Belum ada peringkat
Review Soal UKOM
Dokumen11 halaman
Review Soal UKOM
wahyu
Belum ada peringkat
Ade Fikri Ramadhan - 0110219006 - UAS - BIG DATA
Dokumen9 halaman
Ade Fikri Ramadhan - 0110219006 - UAS - BIG DATA
Gin
Belum ada peringkat
Analisa Data Evaluasi Program
Dokumen30 halaman
Analisa Data Evaluasi Program
Wagino Thok
100% (2)
Klastering Kmeans
Dokumen7 halaman
Klastering Kmeans
marshafira
Belum ada peringkat
Laporan Clustering 42520011
Dokumen8 halaman
Laporan Clustering 42520011
sasa123
Belum ada peringkat
Topik 24 Processing Data Dan Visualisasi
Dokumen41 halaman
Topik 24 Processing Data Dan Visualisasi
Slamet Fauzan
Belum ada peringkat
15.04.392 Jurnal Eproc PDF
Dokumen9 halaman
15.04.392 Jurnal Eproc PDF
Cut Narasya Harahap
Belum ada peringkat
Tugas 9 - Kecerdasan Buatan Dan Data Sains
Dokumen3 halaman
Tugas 9 - Kecerdasan Buatan Dan Data Sains
Anwar
Belum ada peringkat
efyyosrita,+MODEL+CLUSTERING+MENGGUNAKAN+ALGORITMA+K-MEANS+PADA+DATA+KELUHAN+PELANGGAN+PT +PLN+ (STUDI+KASUS++PT +PLN+ (PERSERO)
Dokumen9 halaman
efyyosrita,+MODEL+CLUSTERING+MENGGUNAKAN+ALGORITMA+K-MEANS+PADA+DATA+KELUHAN+PELANGGAN+PT +PLN+ (STUDI+KASUS++PT +PLN+ (PERSERO)
'aNggih Prasetya
Belum ada peringkat
Klasifikasi Data Mining Untuk Prediksi Potensi Nasabah
Dokumen10 halaman
Klasifikasi Data Mining Untuk Prediksi Potensi Nasabah
slsjkt 003
Belum ada peringkat
Tugas 3 Metode Penelitian Sosial
Dokumen3 halaman
Tugas 3 Metode Penelitian Sosial
Jefri Oes
Belum ada peringkat
Machine Learning
Dari Everand
Machine Learning
Ibnu Daqiqil Id
Penilaian: 2.5 dari 5 bintang
2.5/5 (7)
Ekomomi, Bisnis, Regulasi & Kebijakan Telekomunikasi
Dari Everand
Ekomomi, Bisnis, Regulasi & Kebijakan Telekomunikasi
Sigit Haryadi
Penilaian: 4 dari 5 bintang
4/5 (77)