Research Tools
03 Statistik Deskriptif
Penelitian merupakan kegiatan utama dari penyelidikan ilmiah yang
bertujuan mengembangkan pengatahuan dan pemahaman
mengenai topik-topik penting
99.7%
95.4%
68.2%
Data pencilan
Data pencilan (outliers) adalah nilai yang tidak biasa dalam data
Penyebab adanya data pencilan
• Kesalahan saat data entry
• Observasi yang terjadi di bawah kondisi abnormal
• Observasi yang secara akurat menunjukkan adanya variabilitas dalam studi
Masalah dengan adanya data pencilan
• Data pencilan mungkin tidak mewakili populasi atai pertanyaan penelitian yang
sedang dipelajari
• Nilai ekstrimnya akan menyebabkan penyimpangan dari ahsil analisis
• Mungkin disebabkan oleh kesalahan dalam memasukkan data
Identifikasi data pencilan
• Box plot
• Histogram
Identifikasi data pencilan - Boxplot
• Metode untuk secara grafik menggambarkan kelompok data numerik melalui nilai
kuartilnya.
• Mungkin memiliki garis yang diperpanjang dari kotaknya (box) yang
mengingikasikan variabilitas diluar kuartil atas dan bawah
Identifikasi data pencilan – Boxplot
• Kuartil: nilai yang membagi data menjadi 4 bagian
• Data dibagi berdasarkan jumlah kelompok datanya, bukan berdasar nilai data
Contoh data: 2, 5, 6, 7, 10, 22, 13, 14, 16, 65, 45, 12
∑ 𝑋𝑖
• Mean memberikan informasi yang berhubungan
𝑖=1
𝑋=
𝑁
Contoh dampak data pencilan, misal: dalam suatu ujian terdapat beberapa
mahasiswa yang mendapatkan nilai 0. Dampaknya adalah nilai 0 yang terjadi akan
“menarik” mean menjauh dari titik tengah ke arah data pencilan tersebut (ke arah
nilai kecil). Sebaliknya, beberapa nilai 100 akan menarik mean ke arah nilai besar
Mean
Beberapa hal yang harus dipertimbangkan jika peneliti menggunakan mean dalam
penelitiannya
Jumlah data: N = 68
Pusat data: Mean (21.2647) > Median (20.0000) data menceng kanan
Distribusi data dan tendensi sentral
Kondisi distribusi Tampilan grafis Kondisi tendensi sentral
Simetris, unimodal Mean = Median = Mode
Varians (s2) mengukur seberapa jauh jarak setiap observasi dalam kelompok data
dari mean.
Rumus varians:
S: tanda penjumlahan
2
𝑠 =
∑ ( 𝑥 𝑖 − 𝑥 )2
kuadrat jarak antara pengamatan ke i dengan mean
( 𝑛 −1 ) n: total observasi dalam sampel
n – 1: penyesuaian untuk mengakomodasi bias sampel
Interpretasi varians
Varians diinterpretasi berdasar besarannya
• Jika varians = 0, tidak ada variabilitas
terjadi pada sampel, semua observasi
pada data adalah sama dengan mean
• Varians yang kecil memberikan indikasi
bahwa observasi yang ada secara relatif
berkumpul dekat dengan mean
• Varians yang besar memberikan indikasi
bahwa observasi lebih tersebar dan lebih
jauh dari mean
Interpretasi varians
Untuk menjelaskan variasi dalam suatu kelompok data, peneliti menggunakan
mean dan deviasi
• 68.2% (46.376) data yang diobservasi tersebar pada rentang 14.8427 s/d 27.6867
• 95.4% (64.872) data yang diobservasi tersebar pada rentang 8.4207 s/d 34.1087
• 99.7% (67.796) data yang diobservasi tersebar pada rentang 1.9987 s/d 40.5307
Latihan
DER ROA CR FAR SIZE SALES
Mean 0.88 0.06 2,378.00 0.27 29,021.00 0.19
Median 0.66 0.05 1,715.00 0.25 29,276.00 0.07
Maximum 4,447.00 0.46 14,829.00 0.67 32,253.00 8,921.00
Minimum 0.08 (0.66) 0.17 - 23,045.00 (0.87)
Standar Deviasi 0.80 0.15 2,344.00 0.15 1,713.00 1,004.00
Observasi 120 120 120 120 120 120