NASKAH UAS-THE
UJIAN AKHIR SEMESTER-TAKE HOME EXAM (THE)
UNIVERSITAS TERBUKA
SEMESTER: 2023/2024 Ganjil (2023.2)
17 22 63 68 26 22 17 70 63 76
49 27 71 18 35 17 21 62 60 63
48 21 29 44 34 26 61 17 63 22
54 70 38 51 71 69 72 21 19 70
58 23 56 65 74 19 25 31 60 66
45 33 81 28 43 64 25 59 67 31
23 27 67 18 18 67 23 71 27 24
51 32 32 28 42 18 18 21 63 34
46 82 24 29 29 67 31 71 25 31
29 26 66 28 68 28 23 27 63 75
Buatlah tabel daftar distribusi frekuensi dengan panjang kelas yang sama dengan terlebih dahulu
menghitung:
1. Range/rentang distribusi data (R)
2. Banyaknya kelas (B)
3. Kelas interval atau panjang kelas; dan
4. Batas kelas
5. Tabel distribusi frekuensi yang terdiri dari: Kelas Interval, Batas Bawah, Batas Atas, dan
Frekuensi)
Umur TB BB BMI
21 1,67 56,2 20,15131
31 1,72 59 19,94321
41 1,75 61,5 20,08163
NA 1,68 57,5 20,37273
32 1,73 60,8 20,31474
42 1,76 62,2 20,08006
23 1,69 58,7 20,55250
33 1,74 61,2 20,21403
43 1,77 63,4 20,23684
24 1,7 60 20,76125
34 1,75 NA 20,17959
44 1,78 64,8 20,45196
25 1,71 61,2 20,92952
35 1,76 62,4 20,14463
1 dari 3
MSIM4310
BMI adalah indikator pengukuran yang digunakan untuk menentukan kategori berat badan ideal
atau tidak. Kita dapat mengetahui kategori berat badan, yaitu kurus, ideal, berlebihan, atau bahkan
obesitas berdasarkan dari perhitungan BMI.
Pada data di atas terdapat 4 variabel yaitu: umur, tinggi badan, berat badan, dan BMI. Jika kita
perhatikan data di atas, terdapat beberapa data yang hilang (NA). Yaitu 10 data pengamatan pada
baris ke-4, 11, 16, 20, 27, 32, 35, 38, 41, dan 45.
Dataset “penguin” merupakan kumpulan data species penguin dengan jumlah observasi data
sebanyak 344 dan diklasifikasikan ke dalam 3 kelas (species), yaitu: Adelie, Chinstrap, dan Gentoo.
Berdasarkan gambar di atas, buatlah visualisasi data dengan menggunakan dataset “penguin” dan
menerapkan metode pengelompokan data menggunakan K-Means Clustering dengan ketentuan
sebagai berikut:
1. Variabel X dan Y merupakan variabel data dengan tipe “numeric”.
2. Jumlah minimal cluster (kelompok) dalam pengelompokan berdasarkan K-Means adalah 3 dan
maksimal adalah 6. Untuk plotting warna dan symbol setiap kelompok data bebas yang
terpenting hasil pengelompokan sesuai dengan hasil yang ditampilkan pada gambar di atas.
3. Sertakan source code R.
4. Menampilkan tampilan visualisasi.
3 dari 3