• Awalnya data ini ada dalam bentuk mentah, artinya, kumpulan data ini tidak
mengandung makna yang berarti, hanya merupakan sekumpulan angka hasil
pengamatan.
• Agar data ini berguna sebagai ukuran kinerja kelompok, data tersebut harus
diatur, diringkas, dan dianalisis, sehingga maknanya dapat dikomunikasikan.
• Hal tersebut adalah fungsi dari cabang matematika yang disebut statistika.
• Statistika deskriptif digunakan untuk mengkarakterisasi bentuk, tendensi
sentral, dan variabilitas dalam sekumpulan data, dengan maksud untuk
menggambarkan suatu populasi
Jumlah skor (sample) Distribusi
Distribusi Frekwensi
• Metode yang paling umum untuk membuat grafik distribusi frekuensi adalah
plot batang dan daun (Stem-and-leaf plot), histogram, dan polygon frekuensi.
Stem-and-leaf plot
• Plot batang-dan-daun adalah distribusi frekuensi berkelompok halus yang
paling berguna untuk menyajikan pola distribusi variabel kontinu.
• Di dalam statistik, stem-and-leaf plot merupakan alat untuk menyajikan data
kuantitatif dalam format grafis, untuk membantu dalam memvisualisasikan
bentuk distribusi data yang sering digunakan dalam analisis eksplorasi.
• Stemplot diperkenalkan oleh Arthur Bowley di awal tahun 1900-an.
• Namun penggunaannya secara umum baru dimulai pada tahun 1980 setelah
John Tukey’s mempublikasikan Exploratory Data Analysis pada tahun 1977
• Stem-and-leaf plot memberikan informasi lebih banyak tentang nilai yang
sebenarnya dibanding histogram.
• Seperti dalam histogram, panjang setiap batang sesuai dengan jumlah
kejadian yang jatuh ke dalam interval tertentu. Namun, pada Histogram kita
hanya bisa melihat nilai frekuensi dari data saja, tetapi kita tidak tahu berapa
nilai angka sebenarnya.
• Sedangkan pada Stem-and-leaf Plot selain kita bisa mengetahui nilai
frekuensinya, kita pun bisa tau berapa nilai data sebenarnya. Hal ini dilakukan
dengan membagi nilai-nilai yang diamati menjadi dua komponen, stem dan
leaf
• Stem-and-leaf plot menyajikan data
dengan cara memisahkan setiap nilai
menjadi dua bagian: bagian batang (stem)
yaitu digit angka paling kiri dan diikuti
dengan angka berikutnya, yaitu daun (leaf),
digit angka paling kanan
• Skor memiliki digit paling kiri dari 6 sampai
13. Nilai-nilai ini menjadi batang. Digit
terakhir di setiap skor menjadi daun. Untuk
membaca plot batang dan daun, kita
melihat ke seberang setiap baris,
menempelkan setiap digit daun ke batang
• Oleh karena itu, baris pertama mewakili skor
60 dan 68; baris kedua, 72, 77 dan 77; baris
ketiga, 80, 82, 84, 85 dan 86; dan seterusnya.
• Tampilan ini memberikan ringkasan data
yang ringkas, dengan tetap menjaga
integritas data asli.
• Jika kita membandingkan plot ini dengan
distribusi frekuensi yang dikelompokkan,
jelas seberapa banyak informasi yang
diberikan oleh plot batang-dan-daun dalam
ruang kecil, dan bagaimana ia menyediakan
elemen tampilan tabel dan grafik.
Tujuan utama Stem-and-leaf plot adalah untuk hal berikut ini:
•Apakah pola pengamatan simetris.
•Penyebaran atau variasi dari data pengamatan.
•Apakah terdapat outlier (nilai-nilai yang berada jauh dari yang
lainnya).
•Titik pemusatan data.
•Ada Lokasi yang merupakan gap (kesenjangan dalam data)
Histogram
• Histogram adalah grafik batang, terdiri dari serangkaian kolom, masing-masing
mewakili satu skor atau interval kelas.
• Kurva B mewakili kasus khusus dari distribusi simetris yang disebut distribusi
normal.
• Mean adalah jumlah dari sekumpulan skor dibagi dengan banyaknya skor, n .
• Ini adalah nilai yang kebanyakan orang sebut sebagai "rata-rata".
• Simbol yang digunakan untuk menyatakan mean suatu populasi adalah huruf
Yunani mu, μ dan mean sampel dilambangkan dengan X-Bar
Membandingkan Pengukuran Central Tendency
• Bentuk dan tendensi sentral dari suatu distribusi berguna tetapi belum
lengkap untuk mendiskripsikan sebuah sample.
• Untuk mengilustrasikan hal ini, pertimbangkan dilema berikut:
Anda bertanggung jawab untuk merencanakan hiburan musik untuk
pesta yang terdiri dari tujuh orang, tetapi Anda tidak tahu jenis musik
apa yang harus dipilih—jadi Anda memutuskan untuk menggunakan usia
rata-rata mereka sebagai panduan.
Usia tamu adalah 3, 3, 13, 14, 59, 70, dan 78 tahun.
Jika Anda mendasarkan keputusan Anda pada
mode 3 tahun, Anda akan membawa karakter dari
Sesame Street.
Menggunakan median 14 tahun, Anda mungkin
menyewa band heavy metal.
Dan menurut usia rata-rata 34,3 tahun, Anda
mungkin memutuskan untuk bermain soft rock,
meskipun tidak ada orang dalam kelompok yang
benar-benar berada dalam rentang usia tersebut.
Dan penggemar Frank Sinatra benar-benar
terabaikan! Yang kita abaikan adalah penyebaran
usia di dalam kelompok
• Pertimbangkan sekarang contoh yang lebih konkret menggunakan skor dari
coin rotation test (CRT) untuk dua kelompok pasien.
• Jika kita menggambarkan dua distribusi ini hanya dengan menggunakan
ukuran tendensi sentral, mereka akan tampak identik.
• Deskripsi sampel tidak lengkap tanpa kita dapat mengkarakterisasi
perbedaan yang ada di antara skor serta tendensi sentral dari data.
• Oleh karena itu penting juga untuk memahami lima ukuran statistik
variabilitas yang umum digunakan:
range,
percentiles,
variance,
standard deviation,
coefficient of variation.
Range
Ukuran variabilitas yang paling sederhana adalah range, yaitu selisih antara nilai
tertinggi dan terendah dalam suatu distribusi.
Untuk nilai tes yang dilaporkan pada table diatas:
Group A range = 20 – 14 = 6
Group B range = 28 – 9 = 19
• Oleh karena itu, meskipun mudah dihitung, biasanya range digunakan hanya
sebagai ukuran deskriptif kasar dan biasanya dilaporkan bersama dengan
indeks variabilitas lainnya.