Prediksi Karyawan dengan Decision Tree

Dokumen tersebut berisi jawaban soal ujian tengah semester analisis big data dari mahasiswa Arsyad Muzaffar Basyarudin dengan NIM 211127005 jurusan Bisnis Digital. Mahasiswa tersebut melakukan prediksi apakah karyawan akan tetap atau keluar dengan menggunakan model decision tree pada dataset karyawan dan memperoleh tingkat akurasi sebesar 80,47%.

Diunggah oleh

Fika Hidayati

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

0% menganggap dokumen ini bermanfaat (0 suara)

47 tayangan5 halaman

Prediksi Karyawan dengan Decision Tree

Diunggah oleh

Fika Hidayati

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

Nama : Arsyad Muzaffar Basyarudin

NIM : 211127005
Jurusan : Bisnis Digital

UJIAN TENGAH SEMESTER

ANALISIS BIG DATA

SOAL

1. Cari dan tentukan datasheet yang akan digunakan (datasheet bebas dan harus berisi
ratusan data)
2. Tentukan model data mining yang akan dipilih (model prediksi atau klasifikasi)
3. Pahami datasheet tersebut berisi data apa, atribute yang ada dan apa tujuan dari
datasheet tersebut
4. Lakukan proses data preparing (data kosong, data kembar, apakah ada data yang
terlampau jauh/ pencilan), apa perlu dilakukan proses normalisasi dan lainnya
5. Buat model yang dipilih
6. Lakukan proses evaluasi untuk melihat berapa nilai akurasi nya.

JAWABAN

1. Dataset yang saya pilih adalah dataset employe.

2. Data mining yang saya pilih adalah Prediksi.
3. Dataset ini memiliki atribut : Dataset ini memiliki atribut : Dataset ini memiliki
atribut : Joining year, payment tier, eexperience education,city, gender, &
everbenched. Leave or not adalah atribut yang saya gunakan sebagai tujuan atau label
karena pada atribut ini memprediksikan apakah karyawan tersebut akan tetap atau
keluar.
4. Berikut merupakan hasil dari data preparing
Data diatas menunjukkan tidak ada yang missing,namun ada data yang kembar,
maka pada data preparing diatas saya menggunakan remove duplicate.

5. Berikut merupakan model yang saya pakai.

Operator-operator yang digunakan yaitu :

- Operator Set Role. Operator ini saya gunakan untuk memfokuskan atau melabelkan satu
atribut yang memiliki peran khusus yaitu leave or not, setelah itu akan digunakan untuk
mencari tahu tingkat prediksinya.
- Operator remove duplicate saya gunakan untuk menghilangkan data yang sama, agar saat
proses prediksi data tidak terlalu berat.
- Operator Normalize. Operator ini saya gunakan supaya nilai yang tertera pada attribute
tidak terlampau jauh.
- Operator Select Attributes. Operator ini saya gunakan untuk menyeleksi attribute apa saja
yang akan digunakan. Namun karena pada datasets yang saya pilih semua atributenya
dibutuhkan maka saya select semuanya atau All. berfungsi untuk memilih atribut yang
digunakan disini saya memilih subset dan saya memilih attribut yang memiliki nilai karena
nantinya saya akan menggunakan regresi.
- Operator Split data berfungi untuk membagi dataset menjadi partisi data lalu menguji sesuai
dengan rasio yang diberikan misal 0.8 dan 0.2 semakin besar perbandingan rasio maka resiko
juga semakin tinggi.
- Operator Apply Model berfungsi untuk untuk memperoleh hasil prediksi pada data yang
belum memiliki label.
- Operator Decision Tree berfungsi mengubah data menjadi aturan-aturan keputusan dan
untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih simple,
sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan.
- Operator performance berfungsi untuk mencari untuk mengevaluasi kinerja model yang
memberikan daftar nilai kriteria kinerja secara otomatis sesuai dengan tugas yang diberikan.
Saya menggunakan operator performance ini untuk mengetahui tingkat akurasinya.

Lalu ini merupakan hasil dari apply model dimana kita akan melihat nilai prediksi.

Kemudian ini adalah hasil dari performancenya.

6. Berdasarkan pada analisis data mining pada model Decision Tree pada prediksi
employee/karyawan dapat disimpulkan bahwa tingkat keakuratannya sebesar 80,47%,
bisa dibilang data yang gunakan sudah cukup akurat.

Anda mungkin juga menyukai

Maetri Rapid Miner
Belum ada peringkat
Maetri Rapid Miner
4 halaman
Analisis Regresi Data Kebahagiaan 2015-2020
Belum ada peringkat
Analisis Regresi Data Kebahagiaan 2015-2020
17 halaman
Penerapan Supervised dan Unsupervised di Orange
100% (1)
Penerapan Supervised dan Unsupervised di Orange
4 halaman
Perbaikan Nilai DataMining
Belum ada peringkat
Perbaikan Nilai DataMining
6 halaman
Pertemuan 4
Belum ada peringkat
Pertemuan 4
50 halaman
P Roses Data Mining
Belum ada peringkat
P Roses Data Mining
40 halaman
Eps2 - Data Understanding
Belum ada peringkat
Eps2 - Data Understanding
8 halaman
Prediksi Kelulusan Mahasiswa Naïve Bayes
Belum ada peringkat
Prediksi Kelulusan Mahasiswa Naïve Bayes
12 halaman
Eksperimen Data Mining: Persiapan & Estimasi
Belum ada peringkat
Eksperimen Data Mining: Persiapan & Estimasi
8 halaman
SVM untuk Penilaian Kenaikan Gaji Karyawan
Belum ada peringkat
SVM untuk Penilaian Kenaikan Gaji Karyawan
4 halaman
Prediksi Pengunduran Diri Karyawan dengan Random Forest
Belum ada peringkat
Prediksi Pengunduran Diri Karyawan dengan Random Forest
12 halaman
Teknik EDA dan Preprocessing ML/AI
Belum ada peringkat
Teknik EDA dan Preprocessing ML/AI
3 halaman
Tugas 1-Pebriwindari Data Mining
50% (2)
Tugas 1-Pebriwindari Data Mining
5 halaman
Belajar ADP Orange
Belum ada peringkat
Belajar ADP Orange
12 halaman
Efek Psikologis COVID: Analisis Data Klasifikasi
Belum ada peringkat
Efek Psikologis COVID: Analisis Data Klasifikasi
5 halaman
Akurasi Metode Data Mining Terbaru
Belum ada peringkat
Akurasi Metode Data Mining Terbaru
9 halaman
Penggunaan Rapid Miner
Belum ada peringkat
Penggunaan Rapid Miner
11 halaman
DMDW#9
Belum ada peringkat
DMDW#9
15 halaman
Prediksi Loyalitas Karyawan dengan ANN
Belum ada peringkat
Prediksi Loyalitas Karyawan dengan ANN
6 halaman
Soal Uts Data Mining
100% (2)
Soal Uts Data Mining
4 halaman
Data Mining C4.5 untuk Karyawan Berprestasi
Belum ada peringkat
Data Mining C4.5 untuk Karyawan Berprestasi
6 halaman
4.33.22.0.12 - Laksamana Dzikri Al Jauzi - 2 Split Dataset
Belum ada peringkat
4.33.22.0.12 - Laksamana Dzikri Al Jauzi - 2 Split Dataset
12 halaman
Memahami Siklus ML dan Evaluasi Model
Belum ada peringkat
Memahami Siklus ML dan Evaluasi Model
32 halaman
Alful Laila S
Belum ada peringkat
Alful Laila S
6 halaman
Laporan Klasifikasi Data Science 2023
Belum ada peringkat
Laporan Klasifikasi Data Science 2023
12 halaman
Muhammad Hanif SYa'Bani - 09011282227049 - UTS ML
Belum ada peringkat
Muhammad Hanif SYa'Bani - 09011282227049 - UTS ML
18 halaman
Prediksi Kompetensi Karyawan C4.5
Belum ada peringkat
Prediksi Kompetensi Karyawan C4.5
6 halaman
Pengaruh Kursus Ujian Terhadap Performa Siswa
Belum ada peringkat
Pengaruh Kursus Ujian Terhadap Performa Siswa
47 halaman
Prediksi Turnover Pekerja dengan Decision Tree
Belum ada peringkat
Prediksi Turnover Pekerja dengan Decision Tree
7 halaman
Analisis Pemasaran Data Klien Bank
Belum ada peringkat
Analisis Pemasaran Data Klien Bank
17 halaman
Data Mining
Belum ada peringkat
Data Mining
8 halaman
Data Mining
Belum ada peringkat
Data Mining
8 halaman
Ujian Data Mining: KNN & Naïve Bayes
Belum ada peringkat
Ujian Data Mining: KNN & Naïve Bayes
2 halaman
Klasifikasi Loyalitas Pegawai Perusahaan
Belum ada peringkat
Klasifikasi Loyalitas Pegawai Perusahaan
4 halaman
Analisis Dropout Mahasiswa dengan RapidMiner
Belum ada peringkat
Analisis Dropout Mahasiswa dengan RapidMiner
6 halaman
Pengetahuan yan-WPS Office
Belum ada peringkat
Pengetahuan yan-WPS Office
2 halaman
Laporan Simulasi Data Mining Pengolahan Dataset Pada Paper
Belum ada peringkat
Laporan Simulasi Data Mining Pengolahan Dataset Pada Paper
6 halaman
Analisis Data untuk Prediksi Transaksi E-Commerce
Belum ada peringkat
Analisis Data untuk Prediksi Transaksi E-Commerce
28 halaman
Prediksi Kinerja Karyawan dengan K-Means dan Decision Tree
Belum ada peringkat
Prediksi Kinerja Karyawan dengan K-Means dan Decision Tree
10 halaman
Materi 2 - Peran Utama Dan Metode Data Mining
Belum ada peringkat
Materi 2 - Peran Utama Dan Metode Data Mining
45 halaman
Data Mining: Preprocessing Dataset
Belum ada peringkat
Data Mining: Preprocessing Dataset
11 halaman
Rapid Miner
Belum ada peringkat
Rapid Miner
7 halaman
Pemrosesan Data untuk Data Mining
Belum ada peringkat
Pemrosesan Data untuk Data Mining
31 halaman
07 - Proses Data Mining Berbasis Metodologi CRISP-DM
Belum ada peringkat
07 - Proses Data Mining Berbasis Metodologi CRISP-DM
25 halaman
Konsep Data Mining
Belum ada peringkat
Konsep Data Mining
47 halaman
Model Klasifikasi Data Science
Belum ada peringkat
Model Klasifikasi Data Science
51 halaman
Klasifikasi Data Mining dengan C4.5
Belum ada peringkat
Klasifikasi Data Mining dengan C4.5
28 halaman
Proses dan Evaluasi Model ML
Belum ada peringkat
Proses dan Evaluasi Model ML
3 halaman
SOAL UTS ML INF - AhmadTH+Farida
Belum ada peringkat
SOAL UTS ML INF - AhmadTH+Farida
8 halaman
Kelompok 24 - Makalah Data Mining - Preprocessing Data
0% (1)
Kelompok 24 - Makalah Data Mining - Preprocessing Data
13 halaman
Data Mining Mahasiswa TI Universitas Siliwangi
Belum ada peringkat
Data Mining Mahasiswa TI Universitas Siliwangi
42 halaman
Panduan Lengkap Proses Data Mining
Belum ada peringkat
Panduan Lengkap Proses Data Mining
44 halaman
UTS Data Mining
Belum ada peringkat
UTS Data Mining
10 halaman
Prediksi Kelulusan Mahasiswa SVM 2021
Belum ada peringkat
Prediksi Kelulusan Mahasiswa SVM 2021
30 halaman
Latihan Machine Learning dengan Data nyata
Belum ada peringkat
Latihan Machine Learning dengan Data nyata
31 halaman
Tugas 3 Data Mining
Belum ada peringkat
Tugas 3 Data Mining
11 halaman
Proses Preprocessing Data Mining
Belum ada peringkat
Proses Preprocessing Data Mining
7 halaman