Dikha Rizki S - 20422424 - 2IC03
Dikha Rizki S - 20422424 - 2IC03
NPM : 20422424
Kelas : 2IC03
Melalui diagram histogram ini, Anda dapat melihat distribusi jam kerja per minggu
dalam dataset, termasuk apakah ada puncak atau tren tertentu dalam data. Ini membantu
dalam pemahaman pola dalam data yang dapat berguna dalam analisis statistik dan
pengambilan keputusan.
2. Diagram Income
Diagram yang dijelaskan dalam kode di atas adalah diagram "countplot" yang
digunakan untuk memvisualisasikan jumlah pengamatan dalam setiap kategori
dalam data kategori. Diagram ini sangat berguna untuk memahami sebaran data
kategori dan seberapa sering setiap kategori muncul dalam dataset. Berikut
penjelasan komponen-komponen utama dalam diagram countplot tersebut:
1. Variabel pada Sumbu X: Pada sumbu horizontal (X) terdapat kategori yang
akan dihitung dan divisualisasikan. Dalam contoh ini, kategori tersebut
adalah "income" (pendapatan), yang mungkin memiliki dua nilai seperti
">50K" dan "<=50K."
2. Tinggi Batang: Tinggi setiap batang dalam diagram countplot menunjukkan
jumlah pengamatan (frekuensi) yang masuk ke dalam kategori tersebut.
3. Anotasi Data: Dalam kode, terdapat bagian ax.text yang digunakan untuk
menambahkan anotasi (teks) di atas setiap batang. Anotasi ini berisi
persentase dari jumlah pengamatan dalam kategori tersebut terhadap jumlah
total pengamatan dalam dataset. Ini membantu dalam memberikan
informasi lebih lanjut tentang sebaran data.
4. Ukuran dan Estetika: Dengan plt.figure(figsize=(7,7)), kita mengatur
ukuran diagram. Penggunaan warna dan estetika dapat disesuaikan sesuai
kebutuhan.
Dengan diagram ini, Anda dapat melihat perbedaan dalam jam kerja antara
kategori pendapatan ">50K" dan "<=50K." Jika median atau garis tengah kotak
berbeda antara kedua kategori, ini menunjukkan perbedaan dalam rata-rata jam
kerja. Jika terdapat outlier, itu mungkin menunjukkan situasi di mana ada individu
yang bekerja jam yang sangat lama atau sangat pendek di luar kebanyakan kasus.
Boxplot adalah alat yang berguna untuk membandingkan distribusi data antara
kategori yang berbeda.
4. Uji Hipotesis
Dari kode yang diberikan, tampaknya tidak ada informasi yang cukup untuk
mengidentifikasi atau merumuskan uji hipotesis spesifik. Untuk merumuskan uji
hipotesis, Anda perlu memiliki data yang ingin diuji dan pertanyaan penelitian yang
jelas. Proses merumuskan uji hipotesis melibatkan langkah-langkah berikut:
Contoh
a. Hipotesis Nol (H0): "Rata-rata berat badan penduduk kota A sama dengan
rata-rata berat badan penduduk kota B."
b. Hipotesis Alternatif (Ha): "Rata-rata berat badan penduduk kota A berbeda
dengan rata-rata berat badan penduduk kota B."
c. Dengan informasi tambahan mengenai variabel dan data yang ingin Anda
uji hipotesisnya, Anda dapat merumuskan hipotesis nol dan alternatif
dengan lebih tepat.
5. Kesimpulan
Selanjutnya, kesimpulan dari analisis data ini akan bergantung pada nilai p
(pval) yang diperoleh dari uji hipotesis. Jika pval kurang dari 0.05, ini
menunjukkan perbedaan yang signifikan antara dua kelompok usia berdasarkan
kategori pendapatan. Jika pval lebih besar dari 0.05, maka tidak ada perbedaan
signifikan.