Anda di halaman 1dari 13

STATISTIK DESKRIPTIF

Alasan utama menghitung statistik adalah untuk mendeskripsikan dan meringkas


sekumpulan data. Sekumpulan angka biasanya tidak terlalu informatif sehingga kita perlu
menemukan cara untuk mengabstraksi informasi kunci yang memungkinkan kita
menyajikan data dalam bentuk yang jelas dan dapat dipahami. Dalam bab ini kita akan
melihat contoh kumpulan data dan mempertimbangkan cara terbaik untuk mendeskripsikan
dan meringkasnya.
Seratus siswa mengikuti ujian. Setelah ujian, kertas diberi nilai dan diberi skor
seratus. Anda diberikan hasilnya dan diminta untuk mempresentasikannya ke komite yang
memantau kinerja ujian. Anda dihadapkan pada tanda-tanda berikut:

Untungnya, Anda diberi tahu jenis pertanyaan yang mungkin diajukan komite:
• Bisakah Anda menjelaskan hasil pemeriksaan?
• Dapatkah Anda memberi kami ringkasan singkat tentang mereka?
• Berapa nilai rata-ratanya?
• Bagaimana penyebaran skor?
• Apakah nilai tertinggi dan terendah?
• Berikut hasil tahun lalu, bagaimana perbandingan tahun ini?

Anda duduk melihat tabel di atas. Jawaban atas pertanyaan tidak jelas dari data
'mentah', yaitu data asli sebelum ada statistik yang dihitung. Kita perlu melakukan sesuatu
untuk membuatnya lebih jelas. Hal pertama yang dapat kita lakukan adalah membuat daftar
data secara berurutan, dari yang terendah hingga tertinggi:

Dengan pengurutan ini, hal-hal tertentu menjadi lebih jelas: sekarang kita dapat
melihat skor terendah dan tertinggi dengan lebih mudah, dengan skor jatuh antara 0 dan
90.
Hal lain yang dapat kami lakukan untuk meningkatkan presentasi kami adalah
dengan menambahkan jumlah orang yang mencapai nilai yang sama. Kami menghitung
frekuensi setiap tanda. Misalnya, 5 orang mendapat skor 52 dan hanya 1 yang mendapat
nilai 69. Saat kita melakukan ini, kita dapat melihat bahwa tanda paling 'populer' adalah 56
dengan frekuensi 7. Kita tidak boleh lupa bahwa ada sejumlah kemungkinan nilai yang tidak
ada yang mencapai: tidak ada yang mendapat nilai 8 atau 35 misalnya, jadi masing-masing
nilai ini memiliki frekuensi 0.
Kami dapat menyajikan informasi ini dalam bentuk grafik jika kami mengubahnya
menjadi histogram, di mana frekuensi tanda direpresentasikan sebagai batang vertikal.
Dalam histogram, yang ditunjukkan pada Gambar 2.1, kami mencantumkan semua
kemungkinan nilai yang dapat diperoleh siswa, 0 hingga 100, dan menggambar batang di
atas setiap nilai, dengan panjang batang sesuai dengan frekuensi nilai dalam set tersebut.
hasil. Untuk nilai 55 kami menggambar batang dengan panjang 6 (karena 6 siswa
memperoleh nilai 55) dan untuk 64 kami menggambar batang dengan panjang 2. Ini
memberikan presentasi visual yang jelas dari hasil.
Histogram ini disebut distribusi frekuensi, karena kita dapat melihat bagaimana
tanda didistribusikan ke seluruh rentang tanda yang mungkin. Distribusi frekuensi sangat
penting dalam analisis statistik karena memberikan representasi dasar dari informasi kami.
Distribusi frekuensi adalah bagan informatif yang jelas, memberi kami cara untuk
menunjukkan pola tanda yang kami peroleh: distribusinya di seluruh rentang nilai yang
memungkinkan. Kami mungkin ingin mempresentasikan distribusi frekuensi kepada komite
karena memberikan kami representasi grafis dari tanda tersebut. Namun yang tidak
dilakukannya adalah memberi kami ringkasan dari temuan-temuannya.

UKURAN 'TENDENSI SENTRAL'


Apakah ada satu tanda yang paling mewakili hasil? Bisakah kita memberi panitia
tanda khas untuk meringkas temuan? Tanda yang paling masuk akal untuk digunakan di
sini adalah tanda tengah atau tengah. Dalam istilah statistik kami mencoba untuk
menemukan ukuran tendensi sentral. Pertanyaan yang sekarang kita hadapi adalah: apa
posisi sentral dalam distribusi frekuensi kita?
Salah satu jawabannya adalah dengan memilih tanda yang paling sering, baris
terpanjang dalam histogram. Statistik ini disebut mode. Seperti yang Anda lihat dari
Gambar 2.1, batang terpanjang berada di tanda 56, di mana tujuh orang memperoleh hasil
ini dalam pemeriksaan. Dalam hal ini, 56 tampaknya merupakan perkiraan yang masuk
akal untuk tanda pusat. Namun, mode tersebut tidak sering digunakan sebagai ukuran
tendensi sentral karena sejumlah alasan. Pertama, apa yang kita lakukan jika ada dua
tanda yang masing-masing memiliki frekuensi tinggi yang sama? Bagaimana jika tujuh
orang mendapat nilai 52 dan tujuh 56, mana yang akan kita pilih? Kedua, akan ada saat-
saat di mana mode secara jelas tidak mewakili tanda pusat. Bayangkan kita memiliki
sepuluh siswa yang sangat lemah yang semuanya mendapat nilai nol dalam ujian, namun
pembagian sisanya sama seperti pada Gambar 2.1. Meskipun akan ada pengelompokan
tanda di tahun 50-an, mode kami akan menjadi nol. Dalam hal ini mode akan menjadi
ukuran yang buruk dari tendensi sentral.
Ukuran lain dari tendensi sentral yang lebih sering digunakan daripada moda
adalah median. Ini adalah skor yang berada di tengah daftar saat kami mengurutkan dari
terendah ke tertinggi. Jika kita memiliki sembilan siswa secara keseluruhan maka median
akan menjadi nilai kelima dalam daftar. Namun, kami memiliki seratus siswa dan, dengan
bilangan genap, tidak ada nilai tengah. Bagian tengahnya terletak di tengah-tengah antara
tanda kelima puluh dan kelima puluh satu. Dalam contoh kita, nilai kelima puluh dan lima
puluh pertama sama-sama 55, jadi mediannya adalah 55. (Jika nilai kelima puluh dan lima
puluh pertama berbeda, median akan menjadi setengahnya. Kami hanya akan
menjumlahkannya dan membagi dua untuk mendapatkan nilai median kami.
Median adalah ukuran yang baik dari tendensi sentral karena mengambil skor di
posisi tengah distribusi. Kelemahannya, jika memang merupakan kelemahan, adalah
seperti modenya, ia tidak menggunakan semua informasi yang diberikan oleh tanda.
Median hanyalah skor di mana kami memotong daftar kami menjadi dua bagian. Tanda di
kedua sisi median masing-masing bisa di bawah atau di atas median. Jika kami
menemukan bahwa seseorang yang telah diberi nilai 9 dalam ujian benar-benar memiliki
nilai 29 atau 39, mengoreksi skor ini tidak akan mengubah median karena 55 akan tetap
menjadi nilai tengah dalam daftar. Median akan tetap sama meskipun sejumlah nilai diubah
(selama nilai di bawah median tidak diubah ke nilai yang lebih tinggi dari median atau
sebaliknya). Median tidak memperhitungkan nilai semua skor, hanya nilai skor di posisi
tengah.
Sementara kita mungkin menganggap median sebagai pilihan yang lebih baik dari
nilai sentral daripada modenya, karena median menemukan skor di posisi tengah daripada
skor yang paling sering, ada ukuran ketiga dari tendensi sentral yang digunakan jauh lebih
sering daripada keduanya. dari dua ukuran di atas. Ini artinya.
Kami mengungkapkan rumus untuk menghitung mean menggunakan simbol
khusus. Kami menggunakan huruf Yunani µ (dilafalkan 'mu') untuk artinya, huruf Yunani
kapital sigma, ∑, untuk berarti 'jumlah dari' (atau 'menjumlahkan'), X untuk menunjukkan
skor (dalam contoh kita, sebuah tanda ujian) dan N untuk jumlah skor. Simbol ∑ X berarti
'tambahkan semua skor'. Mean, µ adalah jumlah skor dibagi N:
Ketika kita berbicara tentang 'rata-rata', kita biasanya mengacu pada mean
(meskipun kata 'rata-rata' sering digunakan lebih longgar daripada kata 'mean' yang
memiliki definisi statistiknya). Untuk menghitung mean, kita menjumlahkan semua nilai dan
membaginya dengan jumlah siswa. Menjumlahkan semua tanda yang kita dapatkan di
5262. Membagi ini dengan 100 memberi kita rata-rata 52,62.
Salah satu cara berpikir tentang mean adalah dengan analogi dengan jungkat-
jungkit. Bayangkan sumbu horizontal dari distribusi frekuensi kita adalah balok kayu dengan
panjang 0 sampai 100. Masing-masing nilai adalah seorang siswa yang duduk pada balok
pada posisi yang ditentukan oleh nilainya (jadi ada tujuh siswa yang duduk pada balok
pada 56 dan satu pada 75 dll). Di mana Anda harus meletakkan tiang penyangga di bawah
balok untuk membuat jungkat-jungkit yang seimbang sempurna? Jawabannya ada di posisi
rata-rata. Kita bisa melihatnya sebagai nilai yang menyeimbangkan skor di kedua sisinya.
Setiap perubahan pada tanda (kami memindahkan siswa di sepanjang balok) menghasilkan
perubahan rata-rata (jungkat-jungkit akan miring ke satu sisi kecuali kita memindahkan
tiang penyangga ke posisi baru untuk memulihkan keseimbangan). Jadi mean adalah
statistik yang peka terhadap semua skor tentangnya, tidak seperti median, seperti yang kita
lihat di atas.
Ada poin lain tentang mean yang bisa kita lihat dari analogi jungkat-jungkit; Artinya,
mean sangat peka terhadap nilai-nilai ekstrim. Skor yang sangat besar atau skor yang
sangat kecil akan memiliki efek yang lebih besar di mana tiang dukungan berakhir daripada
tanda di tengah distribusi. Jika Anda memiliki sejumlah orang yang duduk di atas jungkat-
jungkit yang seimbang, maka tip naik jauh lebih mudah jika orang baru duduk di ujung
daripada di dekat tengah. Dengan demikian, posisi rata-rata, seperti tiang pendukung
jungkat-jungkit, ditentukan baik oleh jumlah skor dan juga oleh jarak mereka dari itu.

Membandingkan ukuran tendensi sentral


Dalam contoh kita, kita sekarang memiliki tiga ukuran tendensi sentral, mode 56,
median 55 dan mean 52,62. Mana yang kita pilih? Jawabannya adalah: apapun yang kita
inginkan. Kami hanya memilih salah satu yang paling mewakili nilai sentral dalam distribusi
kami, untuk tujuan kami. Biasanya hasil ini membuat kita memilih mean karena
memperhitungkan semua skor tetapi ada kalanya kita memilih mode atau median.
Modusnya cepat dan mudah ditentukan setelah kami membuat distribusi frekuensi,
jadi kami dapat menggunakannya sebagai 'ukuran kasar dan siap' tanpa perlu perhitungan
lebih lanjut. Kami juga tidak dapat menghitung median atau mean dengan beberapa jenis
data. Misalnya, jika saya merencanakan perjalanan untuk sekelompok teman dan saya
menyarankan berbagai tempat untuk dikunjungi, saya mungkin akan memilih tempat yang
dipilih dengan jumlah terbesar. Perhatikan bahwa kami tidak dapat menghitung mean atau
median di sini karena nama tempat tidak dapat ditulis dalam urutan numerik atau
dijumlahkan.
Kami menggunakan median ketika kami memiliki nilai besar atau kecil yang tidak
normal dalam distribusi frekuensi kami, yang akan menghasilkan mean yang memberi kami
nilai yang agak terdistorsi untuk tendensi sentral. Sebagai contoh, enam pesawat memiliki
kecepatan maksimum sebagai berikut: 450 km / jam, 480 km / jam, 500 km / jam, 530 km /
jam, 600 km / jam, dan 1100 km / jam. Kita dapat melihat bahwa sebagian besar memiliki
kecepatan maksimum sekitar 500 km / jam tetapi masuknya pesawat supersonik dengan
kecepatan 1100 km / jam memberi kita rata-rata 610 km / jam. Angka ini mungkin tidak
sesuai untuk digunakan sebagai nilai sentral karena 610 km / jam lebih cepat daripada lima
dari enam pesawat yang dapat terbang. Jika kita mengambil median, yaitu 515 km / jam
(setengah jalan antara 500 dan 530) kita memiliki nilai yang lebih representatif untuk titik
pusat kita.
Namun, dalam kebanyakan kasus pengumpulan data, mean adalah ukuran yang
dipilih. Kita akan melihat alasan lebih lanjut tentang pentingnya mean dalam Bab 5.
Ukuran 'penyebaran'
Sejauh ini kami telah memetakan data kami pada distribusi frekuensi dan
menemukan ukuran tendensi sentral. Statistik berguna lainnya untuk meringkas data
adalah ukuran 'penyebaran'. Karena sejumlah alasan penting untuk mengetahui seberapa
tersebar skor tersebut. Dua kelompok siswa yang mengikuti ujian yang sama dapat
menghasilkan distribusi frekuensi yang berbeda namun artinya mungkin sama. Lalu
bagaimana kita dapat mengungkapkan perbedaan dalam distribusi? Hampir dapat
dipastikan bahwa nilai untuk satu kelompok siswa lebih tersebar daripada kelompok
lainnya. Hasil yang sedikit dalam sebuah penelitian sering kali dipandang sebagai hal yang
baik, karena ini menunjukkan bahwa semua orang (atau apa pun yang menghasilkan skor)
berperilaku serupa, dan karenanya nilai rata-rata mewakili skor dengan sangat baik.
Sebaran yang besar mungkin menjadi masalah karena ini menunjukkan bahwa ada
perbedaan besar antara skor individu dan mean oleh karena itu tidak terlalu representatif.
Jadi, kami menginginkan statistik yang memberi kami angka kecil saat skor dikelompokkan
bersama dan angka besar saat skor disebarkan.

Jangkauan
Ukuran spread yang paling sederhana adalah range. Rentang adalah perbedaan
antara skor tertinggi dan terendah. Dalam contoh kita, skor tertinggi adalah nilai 90 dan
terendah 0. Karenanya kisarannya adalah 90.
Ukuran ini agak kasar, menetapkan batas-batas skor tetapi tidak memberi tahu kita
apa pun tentang penyebaran umum mereka. Memang, bahkan jika nilai kita tersebar
merata antara 0 dan 90 daripada berkelompok di 50-an, kisaran kita akan tetap 90.
Rentang ini menggunakan informasi hanya dari dua skor, sisanya bisa berupa apa saja,
jadi agak terbatas pada apa itu memberitahu kita.

Kuartil
Cara lain untuk melihat penyebaran adalah dengan menghitung kuartil. Kita telah
melihat sebelumnya bahwa median memotong data yang dipesan menjadi dua; kuartil
hanya memotong data yang dipesan menjadi empat. Kuartil pertama menunjukkan skor
seperempat naik daftar dari yang terendah. Kuartil kedua menunjukkan skor dua perempat
di atas daftar. Tidak perlu terlalu banyak untuk menyadari bahwa kuartil kedua berada di
tengah-tengah daftar dan karenanya merupakan median. Kuartil ketiga adalah skor tiga
perempat atas daftar. Kuartil keempat adalah sampai akhir daftar dan dengan demikian
merupakan skor tertinggi.
Dari daftar urutan hasil ujian kami, seperempat dari daftar seratus nilai berada di
antara nilai orang kedua puluh lima dan dua puluh enam, sehingga kuartil pertama berada
di tengah-tengah antara 48 dan 49, yaitu 48,5. Kita sudah tahu bahwa kuartil kedua (antara
nilai orang kelima puluh dan kelima puluh satu) adalah 55 saat kita menghitung median di
atas. Kuartil ketiga adalah tiga perempat sepanjang daftar, begitu juga antara nilai orang
ketujuh puluh lima dan tujuh puluh enam: ini adalah 59.5.2 Dan tentu saja kuartil keempat
adalah 90, karena itu adalah skor tertinggi. Jika kita menggunakan simbol Q untuk kuartil,
kita mendapatkan Q1 = 48.5, Q2 = 55, Q3 = 59.5, Q4 = 90.
Ukuran penyebaran yang sedikit lebih canggih daripada kisaran adalah kisaran
interkuartil: yaitu perbedaan antara kuartil ketiga dan pertama, Q3 - Q1. Dalam contoh kita,
ini adalah 59,5 - 48,5 = 11. Ini adalah kisaran dari separuh skor, yang berada di tengah
distribusi. Alasan mengapa kisaran antarkuartil digunakan adalah bahwa, tidak seperti
kisaran, rentang tersebut tidak akan dipengaruhi oleh satu skor yang sangat tinggi atau
rendah dan mungkin mewakili penyebaran distribusi dengan lebih tepat. (Beberapa orang
menggunakan rentang semi-interkuartil, yang merupakan setengah dari rentang interkuartil.
Dalam contoh kita, ini adalah 5,5.)
Menghitung kuartil sangat berguna karena dapat memberi tahu kita beberapa hal
menarik tentang distribusi, khususnya apakah distribusi tersebut simetris tentang median
dalam rentang interkuartil. Q2 - Q1 memberitahu kita kisaran seperempat skor di bawah
median dan Q3 - Q2 menunjukkan kisaran seperempat skor di atas median. Dalam contoh
kita, yang pertama adalah 6,5 dan yang kedua adalah 4,5. Kami memiliki skor yang
dikumpulkan lebih dekat pada kuartal di atas median daripada di kuartal di bawah median,
karena 4,5 adalah kisaran yang lebih kecil dari 6,5, untuk jumlah skor yang sama.
Perlu dicatat di sini bagaimana setiap statistik baru memberi tahu kita sesuatu yang
berbeda tentang data. Ini mungkin sesuatu yang sudah kita ketahui dengan melihat
distribusinya tetapi seringkali statistik membuatnya lebih jelas dan lebih eksplisit, dengan
nomor terlampir. Namun, statistik ini tidak muncul secara ajaib. Mereka diciptakan oleh
orang-orang yang berusaha menemukan cara terbaik untuk mendeskripsikan data mereka.
Ketika kami ingin mendeskripsikan data kami, kami memilih statistik yang paling sesuai
untuk tujuan kami.
Variasi
Menghitung kuartil tidak menggunakan semua informasi yang tersedia dari skor
dalam data, dan sekali lagi, seperti dalam pembahasan kita tentang median, beberapa skor
mungkin berbeda dan kita akan tetap mendapatkan rentang interkuartil yang sama. Oleh
karena itu, pertanyaannya adalah apakah kita dapat membuat ukuran penyebaran yang
memperhitungkan setiap skor. Untuk menjawab pertanyaan inilah sejumlah ukuran
penyebaran telah dikembangkan. Ciri umum dari mereka adalah bahwa mereka semua
dimulai dengan mean (sekali lagi menunjukkan pentingnya mean). Logikanya adalah
sebagai berikut. Jika kita mengambil mean sebagai posisi 'pusat' kita, maka kita dapat
membandingkan masing-masing skor dengan mean dan menemukan seberapa jauh setiap
skor bervariasi atau menyimpang darinya. Jika kita menjumlahkan deviasi masing-masing
skor dari mean, kita akan memiliki ukuran variabilitas total dalam data. Jika kita mau, kita
dapat membagi total ini dengan jumlah skor untuk menemukan deviasi rata-rata skor dari
mean.
Kita dapat menghitung deviasi skor dari mean hanya dengan menghitung X - µ, di
mana X adalah skor dan µ adalah mean. Kami dapat melakukan ini untuk setiap skor.
Namun, kita memiliki masalah: ketika kita menjumlahkannya untuk menemukan variabilitas
total, deviasi cenderung meniadakan satu sama lain. Dalam contoh kita, tanda 55
memberikan deviasi dari mean 55 - 52,62 = +2,38 dan tanda 50 memberikan deviasi dari
mean 50 - 52,62 = −2,62. Jika kita menjumlahkan deviasi ini kita mendapatkan 2,38 plus
−2,62, yang sama dengan - 0,24. Karena tanda minus, dua nilai, keduanya lebih dari dua
nilai rata-rata, akhirnya memberikan deviasi kurang dari satu saat dijumlahkan. Kami tidak
menginginkan ini; ini bukan statistik yang mencerminkan variabilitas sebagaimana adanya.
Memang, karena mean adalah posisi 'keseimbangan' dalam skor, menambahkan semua
penyimpangan akan memberi kita total nol karena semua penyimpangan positif benar-
benar membatalkan penyimpangan negatif. Karena jumlah penyimpangan skor kami selalu
berubah menjadi nol berapa pun skor yang kami miliki, ini tidak berguna sebagai statistik
karena tentu saja tidak memberi kami ukuran tentang seberapa tersebar skor tersebut.
Ketika kita mempertimbangkannya, semua yang ditunjukkan oleh tanda minus dari
penyimpangan adalah bahwa skornya lebih rendah dari mean. Kami sebenarnya tidak
tertarik pada apakah skornya lebih tinggi atau lebih rendah dari mean hanya seberapa
jauhnya dari mean. Apa yang perlu kita lakukan adalah menemukan cara untuk
menjumlahkan deviasi agar tidak saling meniadakan, sehingga kita berakhir dengan
estimasi yang masuk akal dari variabilitas skor yang sebenarnya. Ada dua solusi:
1 Penyimpangan mutlak
Kita bisa menyelesaikan masalah kita dengan mengabaikan tanda minus sama
sekali dan memperlakukan semua penyimpangan sebagai positif. Jika kita mendapatkan
deviasi −2.62 kita menyebutnya +2.62. Kami menempatkan dua garis vertikal di sekeliling
rumus untuk menunjukkan bahwa kami mengambil nilai absolut, yaitu, mengabaikan tanda
minus dalam solusi dan memperlakukannya sebagai positif. Deviasi mutlak adalah | X - µ |.
Kami menjumlahkan penyimpangan untuk semua skor. Untuk menemukan simpangan rata-
rata kita membaginya dengan jumlah skor, dilambangkan dengan N. Kita menyebutnya
simpangan mutlak rata-rata dan merepresentasikannya dengan rumus berikut:
2 Varians
Solusi alternatif untuk mengambil nilai absolut adalah dengan mengkuadratkan
simpangan, karena kuadrat angka selalu positif. Kuadrat dari −2.16 adalah +4.67. Kami
kemudian menjumlahkan kuadrat dari masing-masing simpangan untuk menghasilkan
jumlah kuadrat: ∑ (X - µ) 2. Rumus ini dapat diterjemahkan ke dalam bahasa Inggris
sebagai:
'Temukan deviasi setiap skor dari mean, kuadratkan setiap deviasi, lalu jumlahkan deviasi
yang dikuadratkan'. Kita kemudian dapat membagi gambar ini dengan jumlah skor (N)
untuk menemukan rata-rata deviasi kuadrat. Nilai ini disebut varians.
Varians memberi kita angka untuk variabilitas rata-rata skor tentang mean, yang
dinyatakan sebagai deviasi kuadrat. Ia juga melakukan apa yang kita inginkan: memberi
kita angka besar untuk skor yang disebar dan yang lebih kecil untuk skor yang berdekatan.
Menariknya, karena berurusan dengan deviasi kuadrat, varians memberi bobot lebih pada
skor ekstrem. Misalnya, skor yang menyimpang 2 dari rata-rata akan berkontribusi 4 pada
varians, tetapi skor 4 yang jauh dari rata-rata akan berkontribusi 16 pada varians, jadi
meskipun skor kedua hanya dua kali lebih jauh dari rata-rata seperti skor pertama. itu
berkontribusi empat kali lebih banyak untuk varians.
Jika kita hanya menginginkan ukuran variabilitas maka varians tidak masalah.
Namun, perhatikan bahwa angka yang kami hitung dari 176,52 tidak dapat ditempatkan
pada distribusi frekuensi sebagai jarak dari rata-rata. Ini karena varians adalah rata-rata
deviasi kuadrat, bukan deviasi rata-rata. Untuk mengembalikan statistik ke istilah yang kita
mulai, kita perlu menemukan akar kuadrat. (Saat kita mengkuadratkan penyimpangan
sebelumnya untuk menghilangkan tanda minus kita perlu 'membatalkan' ini sekarang telah
memenuhi tujuannya.) Kita menyebut statistik ini, akar kuadrat dari varians, deviasi standar
dan mewakilinya dengan simbol σ (huruf kecil Yunani sigma).
Contoh sederhana akan menunjukkan bagaimana kita menghitung deviasi standar.
Bayangkan kita hanya memiliki 4 skor 2, 2, 3, 5 dalam data kita. Artinya adalah 3. Kami
mengerjakan σ sebagai berikut:

Membagi jumlah kuadrat (∑ (X - µ) 2 = 6) dengan jumlah skor (N = 4) memberikan


varian 1,5. Mengambil akar kuadrat dari 1,5 memberi kita deviasi standar σ = 1,22. Dalam
contoh pemeriksaan standar deviasi dari nilai seratus adalah 13.29.
Deviasi standar memberi kita ukuran penyebaran tentang mean. Dalam banyak
kasus sebagian besar skor (sekitar dua pertiga) akan berada dalam satu standar deviasi
kurang dari dan satu standar deviasi lebih besar dari mean, yaitu dalam rentang X - σ
hingga X + σ. Simpangan baku memberi kita ukuran jarak 'standar' skor dari rata-rata
dalam kumpulan data ini.
PERINGATAN ! Rumus varians dan deviasi standar di atas digunakan jika hanya
tertarik pada data ini. Ketika data kita adalah subset atau sampel dari kumpulan data yang
lebih besar yang ingin kita wakili, maka kita menggunakan rumus yang sedikit berbeda,
sama seperti di atas kecuali kita akan membagi jumlah kuadrat dengan derajat kebebasan
df, bukan dari ukuran sampel n, di mana df = n - 1. Jika seratus siswa kami bukanlah set
lengkap yang kami minati tetapi merupakan sampel yang diambil dari seribu siswa yang
mengikuti ujian maka kami akan menggunakan yang berbeda rumus:
Alasan perbedaan tersebut dijelaskan di Bab 5 saat kita mempertimbangkan
sampel. Sebagian besar waktu kami menggunakan rumus dengan n - 1 (derajat
kebebasan) daripada n (ukuran sampel) karena sebagian besar waktu kami ingin
menggunakan sampel kami untuk menggeneralisasi ke populasi yang lebih luas daripada
memperlakukan data kami sebagai semua yang kami minati.

Perbandingan ukuran penyebaran


Seperti halnya ukuran tendensi sentral, ukuran spread yang paling berguna
tergantung pada alasan penghitungannya.
Rentang dan rentang interkuartil keduanya mudah dihitung, memberikan ukuran
sebaran yang terbatas namun berpotensi memadai. Kelemahan mereka adalah bahwa
mereka tidak memperhitungkan semua skor dalam data dan mungkin terbatas dalam
kemampuannya untuk mewakili variabilitas skor yang sebenarnya. Rentang, khususnya,
mungkin tidak mencerminkan penyebaran hasil secara umum dengan sangat baik jika ada
skor yang sangat rendah atau sangat tinggi.

Varians adalah ukuran yang baik dari variabilitas dalam data. Ini menggunakan
semua skor dan akan memberikan angka kecil jika semua skor mengelompok
membulatkan mean dan angka besar jika tersebar. Seperti yang akan kita lihat dalam bab-
bab tentang analisis varians, statistik ini sangat penting dalam beberapa analisis statistik.
Namun, ketika kita mendeskripsikan sekumpulan data, varians mungkin tidak terlalu
berguna sebagai deskripsi penyebaran skor karena angka yang dihasilkan tidak dalam
urutan yang sama dengan skor. Ini dinyatakan dalam deviasi kuadrat dari mean. Dalam
contoh kita, varians dari 176,52 tampak besar tetapi ini mungkin karena varians itu
diekspresikan dalam bentuk tanda kuadrat, bukan tanda.
Deviasi absolut rata-rata dan deviasi standar keduanya merupakan statistik
deskriptif yang baik dari penyebaran sekumpulan skor. Keduanya menggunakan informasi
dari semua skor dan keduanya menghasilkan angka yang mengekspresikan penyimpangan
'rata-rata' dari mean dalam istilah yang kita inginkan (dalam contoh kita: tanda). Karena
mereka diekspresikan dalam istilah yang sama dengan skor, mereka mudah dipahami. Kita
bisa, jika kita mau, memplot angka-angka ini sebagai jarak dari mean pada distribusi
frekuensi, sehingga bisa juga ditampilkan secara grafis.
Mengapa penyebaran sekumpulan hasil hampir selalu dinyatakan, dalam laporan
penelitian, sebagai deviasi standar dan jarang sebagai deviasi absolut rata-rata? Jika data
yang kami gambarkan adalah semua yang kami minati, maka tidak ada argumen yang
meyakinkan. Namun, ada keuntungan berbeda menggunakan deviasi standar ketika data
kita adalah sampel dari himpunan yang lebih besar (populasi) yang ingin kita wakili. Dalam
contoh kami, 100 siswa adalah satu-satunya yang kami minati. Namun, jika 1000 siswa
telah mengikuti ujian dan 100 kami adalah sampel yang representatif, maka kami ingin
menggunakan deviasi standar. Alasannya, yang akan dibahas dalam Bab 5, menyangkut
sampel yang mewakili populasi dan penggunaan statistik sampel untuk memperkirakan nilai
populasi.
Menggambarkan satu set data: sebagai kesimpulan
Saat mendeskripsikan sekumpulan data, kami ingin meringkas distribusi frekuensi
dengan dua ukuran, satu menunjukkan nilai sentral yang menunjukkan skor 'rata-rata' dan
yang kedua untuk menunjukkan penyebaran skor. Dua statistik yang paling umum
digunakan untuk pengukuran ini, karena kegunaannya, adalah mean dan deviasi standar.
Hasil pemeriksaan dapat diringkas dengan statistik sebagai berikut: mean = 52,62 mark,
standar deviasi = 13,29 mark.

MEMBANDINGKAN DUA KUMPULAN DATA DENGAN STATISTIK DESKRIPTIF


Statistik ringkasan dengan rapi dan singkat menggambarkan data tetapi dalam
banyak kasus orang ingin menggunakan informasi tersebut untuk membuat poin tertentu.
Dalam contoh kita, seorang anggota komite mungkin prihatin tentang kemungkinan
jatuhnya standar atau efek dari perubahan dalam prosedur pemilihan siswa. Statistik
ringkasan kemudian dapat digunakan untuk membantu membuat keputusan tentang
pertanyaan semacam itu. Perhatikan bahwa poin yang diangkat oleh anggota komite
membutuhkan perbandingan dengan hasil tahun sebelumnya. Penghitungan statistik sering
kali digunakan untuk melampaui deskripsi untuk memungkinkan kita menjawab pertanyaan
penelitian tertentu dan ini selalu melibatkan pembandingan rangkaian hasil yang berbeda.
Sebagai contoh, hasil tahun sebelumnya untuk ujian yang sama, di mana 100
siswa juga mengikuti ujian, ditunjukkan di bawah ini. Perhatikan bahwa tidak mudah untuk
melihat persamaan atau perbedaan antara hasil selama dua tahun dengan sangat baik
hanya dengan melihat dua tabel data mentah. Kedua tahun memiliki campuran tanda di
dalamnya dan, meskipun kami mungkin dapat memilih hasil tertentu yang menarik, seperti
yang tertinggi dan terendah, tabel tersebut tidak memberikan cara yang baik untuk
memungkinkan kami membuat perbandingan antara dua set data.
Sekali lagi, jika kita memesan data dan membuat distribusi frekuensi, kita mungkin
mulai melihat di mana letak perbedaannya. Gambar 2.2 menunjukkan distribusi frekuensi
hasil tahun lalu. Kita dapat membandingkan Gambar 2.2 dengan Gambar 2.1 dengan
melihat. Distribusi hasil terlihat serupa selama dua tahun. Ini sendiri mungkin menjadi bukti
berguna yang menunjukkan konsistensi tahun ke tahun dalam kinerja. Namun, hanya
dengan melihat dengan mata tidak dapat benar-benar memberi tahu kita seberapa mirip
kedua distribusi tersebut, karena kita mungkin melewatkan perbedaan halus di antara
keduanya. Di sinilah statistik dapat membantu.
Jika kita mempertimbangkan ukuran tendensi sentral terlebih dahulu, kita dapat
membandingkan dua tahun secara langsung:
Kita dapat melihat bahwa ketiga ukuran telah turun sedikit sejak tahun lalu. Modus
ini dapat dengan mudah berubah karena pengaruh beberapa siswa saja, sehingga dalam
hal ini statistik bukan yang paling berguna. Median memang menunjukkan bahwa titik pusat
lebih tinggi tahun lalu. Nilai rata-rata menunjukkan penurunan 1,63 dari tahun lalu ke tahun
ini. Ini mungkin tidak terlihat banyak tapi ingat mean memperhitungkan semua siswa, jadi
ada pengurangan 1,63 nilai per siswa. Nah, hal ini bisa jadi karena beberapa faktor yang
perlu diteliti lebih lanjut, seperti: apakah ada siswa yang kurang mampu tahun ini atau ujian
yang lebih berat tahun ini? Sebelum kami melakukannya, kami ingin menghilangkan alasan
alternatif sederhana. Mungkin tahun lalu ada beberapa siswa yang sangat baik atau tahun
ini beberapa siswa yang kurang baik. Ini terjadi sesekali dan tidak menunjukkan bahwa
standar umum berubah. Cara kita dapat melihat hal ini adalah dengan mempertimbangkan
penyebarannya: mungkinkah penyebarannya lebih luas dalam satu dari dua tahun
menunjukkan campuran yang lebih besar dari kemampuan siswa pada tahun itu?
Ada kisaran yang lebih sempit tahun lalu dengan tidak ada yang mendapat skor
serendah 0 atau setinggi 90, tetapi tidak banyak perbedaan dalam kisaran interkuartil dan,
lebih khusus lagi, standar deviasi tidak terlalu berbeda satu sama lain. Mungkin ada
baiknya menyelidiki lebih lanjut untuk melihat mengapa ada penurunan kinerja rata-rata.
Perhatikan bahwa hasil ini sendiri tidak dapat membedakan antara alasan perbedaan, hasil
ini hanya dapat digunakan untuk menyatakan bahwa salah satunya telah terjadi. Alasan
untuk nilai yang sedikit lebih rendah, apakah itu siswa berkemampuan rendah, makalah
yang lebih keras, penilaian yang lebih ketat atau apa pun, memerlukan keterampilan
peneliti untuk mengetahuinya.
Seperti yang dapat dilihat dari gambar di atas, mean dan deviasi standar umumnya
merupakan statistik paling informatif untuk distribusi tertentu. Ini adalah statistik yang paling
sering dipilih, tetapi mungkin ada kalanya Anda merasa statistik lain lebih sesuai atau akan
memberi tahu Anda lebih akurat apa yang ingin Anda ketahui. Ini mengarah ke poin
penting: TIDAK ada gunanya menghitung statistik sampai Anda tahu mengapa Anda
melakukannya dan apa yang Anda ingin statistik ditampilkan. Bisa jadi data mentah
memberi tahu Anda semua yang perlu Anda ketahui, jadi tidak perlu repot menghitung
statistik. Namun, seringkali tidak mungkin untuk melihat karakteristik penting dari data
tanpa beberapa analisis lebih lanjut. Menghitung statistik yang sesuai dapat membantu
Anda memutuskan jawaban atas pertanyaan yang Anda ajukan. Kesulitan dalam
mendeskripsikan dan menganalisis data BUKANLAH menghitung statistik (kami memiliki
program komputer yang melakukan ini) tetapi dalam mengetahui pertanyaan yang ingin
Anda temukan jawabannya, dan statistik yang membantu menginformasikan jawaban
tersebut.
Perhatikan juga bahwa menghitung statistik hanya memberi Anda informasi.
Terserah Anda bagaimana Anda menafsirkan dan menggunakan informasi itu. Perbedaan
cara, atau deviasi standar, mungkin merupakan informasi yang berguna, tetapi itu saja.
Menghitung statistik tidak akan menjelaskan persamaan dan perbedaan antar distribusi.
Apa yang dilakukan statistik adalah memberi kami informasi yang dapat kami tangani:
mereka adalah alat yang akan digunakan untuk tujuan kami sendiri. Setelah itu kita harus
menggunakan penilaian kita.

BEBERAPA INFORMASI PENTING TENTANG ANGKA


Sampai saat ini kami telah menghitung statistik menggunakan kumpulan hasil
pemeriksaan. Ini bagus karena hasil pemeriksaan adalah jenis angka yang masuk akal
untuk menghitung rata-rata dan statistik lainnya. Tetapi ini tidak berlaku untuk semua jenis
angka. Kita perlu mengetahui jenis data yang kita miliki sebelum kita mengetahui statistik
apa yang dapat kita hitung.

Data nominal
Terkadang angka digunakan seperti nama. Misalnya, dalam regu olahraga pemain
nomor 15 di bagian belakang kemeja pemain memungkinkan kami untuk
mengidentifikasinya selama bermain. Bukan berarti pemain nomor 15 itu lebih baik dari
pemain 1 sampai 14 atau lebih buruk dari pemain 16 sampai 22. Tidak ada artinya
menghitung statistik angka-angka ini karena hanya nominal, digunakan sebagai nama.
Ketika kita mengkategorikan seseorang atau sesuatu, kita dapat menggunakan
angka untuk memberi label pada kategori tersebut. Misalnya, jika kita mengelompokkan
orang berdasarkan warna mata kita mungkin memilih untuk memberi label coklat sebagai 1,
biru sebagai 2, hijau sebagai 3 dan seterusnya. Perhatikan bahwa nomor-nomor tersebut
secara sewenang-wenang ditetapkan ke warna: kita dapat memilih nomor lain atau
menetapkan nomor yang sama dengan cara yang berbeda. Penggunaan angka-angka ini
bersifat nominal. Kita tidak dapat menggunakan angka-angka ini untuk menghitung statistik:
tidak masuk akal untuk mengatakan bahwa rata-rata orang bermata coklat (1) dan orang
bermata hijau (3) adalah orang bermata biru (2)!

Data ordinal
Kita dapat menggunakan angka untuk menentukan urutan kinerja. Misalnya, Susan
adalah pemain catur terbaik di kelasnya, diikuti oleh Robert, Marie, dan Peter. Kita dapat
memberi Susan peringkat teratas 1, Robert 2, Marie 3, dan Peter 4. Angka-angka ini
memberi tahu kita urutan peringkat tetapi sedikit yang lain. Mereka TIDAK memberi tahu
kita bahwa perbedaan antara 1 dan 2 (Susan dan Robert) sama dengan perbedaan antara
3 dan 4 (Marie dan Peter) meskipun hanya ada satu tempat di antara mereka di peringkat.
Susan bisa menjadi pemain terbaik untuk usianya di negara ini sedangkan tiga lainnya
mungkin tidak sebagus orang lain seusia mereka dari sekolah terdekat. Karena itu kami
tidak dapat menghitung rata-rata dan deviasi standar pada data ordinal. Bab 16 membahas
data ordinal lebih lanjut dan mempertimbangkan bagaimana kita dapat menghitung statistik
dengannya.
Data interval dan rasio
Waktu, kecepatan, jarak, dan suhu semuanya dapat diukur pada skala interval dan
kami memiliki jam, spedometer, pengukur pita, dan termometer untuk melakukannya.
Mereka disebut skala interval karena perbedaan antara angka-angka berurutan memiliki
interval yang sama: perbedaan antara 1 dan 2 sama dengan perbedaan antara 3 dan 4
atau 10 dan 11. Tidak seperti skala ordinal di mana ini bisa berbeda, pada sebuah skala
interval mereka semua sama. Misalnya, perbedaan antara 6 dan 7 menit sama dengan
perbedaan antara 20 dan 21 menit, yaitu 1 menit pada kedua kasus. Ketika angka kita
berasal dari skala dengan interval yang sama maka kita dapat menghitung rata-rata dan
deviasi standar.
Data rasio adalah jenis data interval khusus. Dengan data interval, nilai nol dapat
berubah-ubah, seperti posisi nol pada beberapa skala suhu: nol Fahrenheit berada pada
posisi yang berbeda dengan skala Celsius, sedangkan dengan data rasio nol sebenarnya
menunjukkan titik di mana 'tidak ada' diberi skor pada skala, seperti nol pada speedometer
saat tidak ada gerakan, jadi nol ini berarti sama terlepas dari apakah kita mengukur dalam
mil per jam atau kilometer per detik. Kita dapat mengilustrasikan perbedaannya dalam
contoh berikut. Dalam ujian terdapat 100 pertanyaan dengan kesulitan yang sama dan
siswa diwajibkan untuk mendapatkan setidaknya 50 jawaban yang benar untuk lulus ujian.
Penguji dapat memilih untuk memberi label nilai kelulusan sebagai nol. Skor 0
menunjukkan 50 jawaban benar, +1 menunjukkan 51 jawaban benar, −1 menunjukkan 49
jawaban benar dan seterusnya. Ini adalah skala interval dengan nol arbitrer: penguji
memilih tempat untuk meletakkannya. Sekarang mari kita pertimbangkan ujian yang sama
di mana nol menunjukkan tidak ada jawaban yang benar dan nilai kelulusan diberi skor 50.
Kali ini nol tidak sewenang-wenang karena menentukan skor 'tidak ada' dalam hal kinerja
ujian. Di sini skala interval menjadi skala rasio.
Hanya pada skala rasio, dengan nol asli, kami dapat membuat klaim terkait rasio,
seperti: skor Susan dua kali lebih baik dari skor John, skor Robyn sepertiga skor Peter. Jika
Susan mendapat skor 80 dan John 40 pada pemeriksaan skala rasio maka skornya benar-
benar dua kali skor John. Pada skala interval dengan nol ditetapkan secara sewenang-
wenang pada 50 skor mereka adalah 30 dan -10. Dengan skala interval kami tidak akan
dapat membuat penilaian rasio dengan tepat.
Banyak dari statistik kami membutuhkan data interval atau rasio. Di sebagian besar
buku ini (hingga Bab 16) kita hanya akan mempertimbangkan data yang merupakan
interval atau rasio karena jenis data ini memungkinkan kita untuk melakukan uji statistik
dengan rentang terbesar. Untuk alasan ini, peneliti sering memilih untuk mengumpulkan
data interval atau rasio untuk dianalisis. Dengan subjek manusia, penelitian sering kali
berfokus pada seberapa cepat atau akurat suatu tugas dapat dilakukan, di mana kecepatan
dan akurasi dapat diukur pada skala rasio.

Anda mungkin juga menyukai