NPM : 2215061032
Kelas : PSTI D
Dosen Pengampu : Raden Arum Setia Priadi, S.Si.,M.T.
Tugas Ketujuh
Probabilitas dan Statistik
1. Tabel dibawah menampilkan tinggi badan X dan Y dari sampel terdiri dari 12 pasangan ayah
(X) dan anak laki-laki tertua (Y) (dalam cm). Cobalah a) buat diagram pencar, dan b) cari
persamaan regresi dari data tersebut.
X 165 163 167 164 168 162 170 166 168 167 169 171
Y 168 166 168 165 169 166 168 165 171 167 168 170
2. Berdasarkan tabel di atas, tentukan nilai koefisien korelasi dan koefisien determinasi,
berikan penjelasan terhadap hasil nilai koefisien tersebut.?
3. Jelaskan perbedaan penggunaan korelasi produk momen, korelasi rank order dan chi-
kuadrat.
4. Tabel dibawah ini menyajikan distribusi frekuensi nilai akhir 100 orang mahasiswa peserta
kuliah matematika ekonomi dan statistik. Berdasarkan data itu a) tentukan jumlah
mahasiswa yang mendapat nilai 70-79 untuk matematika ekonomi dan 80-89 untuk statistik,
b) tentukan korelasi kedua mata kuliah, serta c) tentukan koefisen korelasi kedua nilai mata
kuliah itu.
Jawaban:
1. Berikut adalah diagram pencar (scatter plot) menggunakan Python dan memanfaatkan
library matplotlib, dari tinggi ayah (X) dan tinggi anak laki-laki tertua (Y) berdasarkan tabel
soal nomor 1.
Untuk mencari persamaan regresi dari data tersebut, dapat menggunakan Python dan
memanfaatkan library numpy dan scipy. Berikut adalah kode yang dapat digunakan:
Gambar 3 Kode Python Persamaan Regresi
2. Untuk menentukan nilai koefisien korelasi dan koefisien determinasi dari data tersebut,
dapat menggunakan Python dan memanfaatkan library numpy dan scipy. Berikut adalah
kode yang dapat digunakan:
Nilai koefisien korelasi (r) yang mendekati 1 menunjukkan hubungan yang positif dan kuat
antara tinggi ayah (X) dan tinggi anak laki-laki tertua (Y). Dalam hal ini, nilai 0.703
menunjukkan adanya hubungan yang cukup kuat antara kedua variabel. Ini berarti bahwa tinggi
ayah cenderung mempengaruhi tinggi anak laki-laki tertua.
Koefisien determinasi (R-squared) adalah ukuran yang menunjukkan seberapa baik variabilitas
dari tinggi anak laki-laki tertua (Y) dapat dijelaskan oleh variabilitas tinggi ayah (X) dalam
model regresi linier sederhana. Dalam kasus ini, nilai 0.494 menunjukkan bahwa sekitar 49.4%
variasi dalam tinggi anak laki-laki tertua dapat dijelaskan oleh variasi dalam tinggi ayah. Sisa
variabilitas yang tidak dijelaskan mungkin disebabkan oleh faktor-faktor lain yang tidak
termasuk dalam model ini, seperti faktor genetik lainnya atau faktor lingkungan.
3. Perbedaan Penggunaan Korelasi Produk Momen, Korelasi Rank Order, dan Chi-Kuadrat:
• Korelasi Produk Momen (Pearson Correlation):
1. Korelasi produk momen (atau dikenal juga sebagai korelasi Pearson) digunakan
untuk mengukur hubungan linier antara dua variabel kontinu.
2. Metode ini mengasumsikan bahwa hubungan antara variabel adalah linear dan
mengukur sejauh mana data mengikuti garis lurus.
3. Nilai korelasi Pearson berkisar antara -1 hingga 1. Nilai 1 menunjukkan hubungan
linier positif sempurna, -1 menunjukkan hubungan linier negatif sempurna, dan 0
menunjukkan tidak ada hubungan linier antara kedua variabel.
4. Korelasi Pearson lebih cocok digunakan ketika kedua variabel berdistribusi secara
normal dan memiliki hubungan linier.
• Chi-Kuadrat (Chi-Square):
1. Chi-kuadrat digunakan untuk menguji hubungan antara dua variabel kategorikal
(non-parametrik) dalam bentuk tabel kontingensi.
2. Metode ini menguji apakah distribusi frekuensi pengamatan dalam tabel kontingensi
berbeda secara signifikan dari distribusi yang diharapkan jika tidak ada hubungan
antara variabel.
3. Nilai chi-kuadrat menunjukkan sejauh mana observasi yang diamati berbeda dari
harapan dan apakah perbedaan tersebut signifikan.
4. Chi-kuadrat lebih cocok digunakan ketika kedua variabel adalah variabel
kategorikal, seperti variabel biner (ya/tidak) atau variabel nominal.
5. Hasil uji chi-kuadrat menghasilkan nilai statistik chi-kuadrat dan p-value untuk
menentukan apakah terdapat hubungan yang signifikan antara kedua variabel dalam
tabel kontingensi.