Naskah MSIM4310 The 1

MSIM4310
NASKAH UAS-THE
UJIAN AKHIR SEMESTER-TAKE HOME EXAM (THE)
UNIVERSITAS TERBUKA
SEMESTER: 2023/2024 Ganjil (2023.2)
Analisis dan Visualisasi Data

MSIM4310
No. Soal Skor

1. Perhatikan distribusi data usia 100 calon peserta pemilu di Desa Segar Asri berikut: 30
17 22 63 68 26 22 17 70 63 76
49 27 71 18 35 17 21 62 60 63
48 21 29 44 34 26 61 17 63 22
54 70 38 51 71 69 72 21 19 70
58 23 56 65 74 19 25 31 60 66
45 33 81 28 43 64 25 59 67 31
23 27 67 18 18 67 23 71 27 24
51 32 32 28 42 18 18 21 63 34
46 82 24 29 29 67 31 71 25 31
29 26 66 28 68 28 23 27 63 75
Buatlah tabel daftar distribusi frekuensi dengan panjang kelas yang sama dengan terlebih dahulu
menghitung:
1. Range/rentang distribusi data (R)
2. Banyaknya kelas (B)
3. Kelas interval atau panjang kelas; dan
4. Batas kelas
5. Tabel distribusi frekuensi yang terdiri dari: Kelas Interval, Batas Bawah, Batas Atas, dan
Frekuensi)
2. Perhatikan data BMI (Body Mass Index) dari 50 mahasiswa di bawah: 40
Umur TB BB BMI
21 1,67 56,2 20,15131
31 1,72 59 19,94321
41 1,75 61,5 20,08163
NA 1,68 57,5 20,37273
32 1,73 60,8 20,31474
42 1,76 62,2 20,08006
23 1,69 58,7 20,55250
33 1,74 61,2 20,21403
43 1,77 63,4 20,23684
24 1,7 60 20,76125
34 1,75 NA 20,17959
44 1,78 64,8 20,45196
25 1,71 61,2 20,92952
35 1,76 62,4 20,14463
1 dari 3
MSIM4310
45 1,79 65,7 20,50498

16 NA 65,5 24,05877
26 1,7 75,6 26,15917
36 1,75 85,8 28,01633
46 1,8 95,9 29,59877
17 1,67 NA 24,38237
27 1,72 78,2 26,43321
37 1,77 88,3 28,18475
47 1,82 98,4 29,70656
18 1,69 70,5 24,68401
28 1,74 80,8 26,68781
38 1,79 90,9 28,36990
48 NA 101 29,83223
19 1,7 73 25,25952
29 1,76 83,3 26,89179
39 1,81 93,5 28,54003
49 1,86 104,6 30,23471
20 1,72 NA 25,55435
30 1,78 85,7 27,04835
40 1,83 96,1 28,69599
NA 1,88 107,2 30,33047
21 1,74 78,1 25,79601
31 1,8 88,2 27,22222
41 1,85 98,7 NA
22 1,76 80,7 26,05243
32 1,82 90,6 27,35177
42 NA 101,3 28,96851
23 1,78 83,3 26,29087
33 1,84 93,1 27,49882
43 1,89 104 29,11453
24 1,8 NA 26,48148
34 1,86 95,7 27,66216
44 1,91 106,9 29,30292
25 1,82 88,4 26,68769
35 1,88 98,5 27,86895
45 1,93 109,9 29,50415
Ket: TB = Tinggi Badan, BB = Berat Badan
BMI adalah indikator pengukuran yang digunakan untuk menentukan kategori berat badan ideal
atau tidak. Kita dapat mengetahui kategori berat badan, yaitu kurus, ideal, berlebihan, atau bahkan
obesitas berdasarkan dari perhitungan BMI.
Pada data di atas terdapat 4 variabel yaitu: umur, tinggi badan, berat badan, dan BMI. Jika kita
perhatikan data di atas, terdapat beberapa data yang hilang (NA). Yaitu 10 data pengamatan pada
baris ke-4, 11, 16, 20, 27, 32, 35, 38, 41, dan 45.
Dari keterangan tersebut cobalah:

1. Buat dataset sesuai dengan data yang disajikan pada tabel di atas dalam bentuk csv!
2 dari 3
MSIM4310
2. Dengan menggunakan software R, gunakan metode Mean Substitution dalam penanganan

data hilang untuk mengisi kolom kosong pada kesepuluh data hilang di atas! Tuliskan ke-10
data hilang tersebut secara berurutan berdasarkan index-nya!
3. Sertakan source code R dalam jawaban!
3. Perhatikan dashboard visualisasi data dari dataset penguin di bawah ini! 30
Dataset “penguin” merupakan kumpulan data species penguin dengan jumlah observasi data
sebanyak 344 dan diklasifikasikan ke dalam 3 kelas (species), yaitu: Adelie, Chinstrap, dan Gentoo.
Berdasarkan gambar di atas, buatlah visualisasi data dengan menggunakan dataset “penguin” dan
menerapkan metode pengelompokan data menggunakan K-Means Clustering dengan ketentuan
sebagai berikut:
1. Variabel X dan Y merupakan variabel data dengan tipe “numeric”.
2. Jumlah minimal cluster (kelompok) dalam pengelompokan berdasarkan K-Means adalah 3 dan
maksimal adalah 6. Untuk plotting warna dan symbol setiap kelompok data bebas yang
terpenting hasil pengelompokan sesuai dengan hasil yang ditampilkan pada gambar di atas.
3. Sertakan source code R.
4. Menampilkan tampilan visualisasi.
Dataset penguin dapat diunduh pada laman berikut:

https://docs.google.com/spreadsheets/d/1jN4UhAeJDLtCY9w_WkafisQTqXnnlGxZrOUW086coc8
/edit?usp=sharing
Skor Total 100
3 dari 3

Naskah MSIM4310 The 1

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Naskah MSIM4310 The 1

Diunggah oleh

Hak Cipta:

Format Tersedia

MSIM4310

Analisis dan Visualisasi Data

No. Soal Skor

2. Perhatikan data BMI (Body Mass Index) dari 50 mahasiswa di bawah: 40

45 1,79 65,7 20,50498

Dari keterangan tersebut cobalah:

2. Dengan menggunakan software R, gunakan metode Mean Substitution dalam penanganan

3. Perhatikan dashboard visualisasi data dari dataset penguin di bawah ini! 30

Dataset penguin dapat diunduh pada laman berikut:

Skor Total 100

Anda mungkin juga menyukai