B. BAHASA STATISTIK
Beberapa peneliti menghitung prosedur statistik dengan tangan lagi; kami
memiliki program komputer yang sangat baik tersedia untuk membuat perhitungan ini.
Namun demikian, itu adalah penting untuk memahami perhitungan dasar menjadi
dilakukan oleh komputer. karena tujuan kita di sini adalah untuk membantu Anda
mendapatkan pemahaman konseptual prosedur statistik, tidak menjadi staticians, kita
akan memperkenalkan beberapa rumus dan kemudian memberikan contoh output dari
program statistik. Walaupun rumus untuk prosedur statistik sering muncul lebih
whelming pada pandangan pertama, mereka prosedur matematika Hanya dasar.
Memahami prosedur statistik yang seperti belajar bahasa baru dan dalam hal ini adalah
Yunani: notasi statistik menggunakan huruf Yunani sebagai singkatan. Misalnya, alih-
alih menyatakan bahwa Anda perlu menambahkan nilai semua orang, notasi statistik
menggunakan simbol Yunani huruf besar sigma (∑) berarti "jumlah itu."
Contoh dalam bab ini dihasilkan dari Excel atau SPSS, meskipun spreadsheet
lainnya dan statistik program yang tersedia. Anda mungkin akrab dengan Excel dan
mungkin memiliki akses ke sana melalui microsoft Kantor. SPSS (Paket Statistik dalam
Ilmu Sosial) mungkin kurang akrab bagi Anda, tetapi sering digunakan dan tersedia
dalam versi desktop ataupun jaringan (kami menggunakan contoh dari SPSS 14.0 for
Window –student Versi). Meskipun kami tidak memberikan setiap langkah setiap
prosedur, kami merujuk Anda ke bahan tambahan dalam lampiran.
Kesimpulan penelitian. ls analisis data sama pentingnya dengan komponen lain dari
penelitian, dan prosedur statistik dan teknik penelitian harus diidentifikasi dan dijelaskan
secara rinci dalam rencana penelitian.
Tabel. 12.1
Jenis utama dari statistik deskriptif dibahas dalam bagian-bagian berikut ini
frekuensi, ukuran pemusatan, ukuran variabilitas, langkah-langkah dari posisi relatif, dan
langkah-langkah hubungan.
1. FREKUENSI
Frekuensi mengacu pada jumlah kali sesuatu terjadi; dengan statistik
deskriptif, frekuensi biasanya mengacu pada jumlah kali setiap nilai variabel terjadi.
Sebagai contoh, kita ingin mengetahui jumlah anak laki-laki dan perempuan di kelas
Mrs. Alvarez di Pacific SD, jadi kita menghitung frekuensi menghitung (Yaitu,
jumlah) untuk setiap. Awal analisis kami dengan jumlah frekuensi membantu untuk
memverifikasi data, untuk menjadi pastikan semuanya telah dimasukkan ke dalam
komputer benar. Misalnya, pertimbangkan sebuah studi dari kepala sekolah analisis
pertama (jumlah frekuensi menunjukkan jumlah pelaku dalam setiap kelompok usia
yang relevan dengan studi) menunjukkan salah satu pelaku adalah empat tahun tua.
Dengan asumsi tidak ada probabilitas tinggi dari dewasa sebelum waktunya pokok
empat tahun, para peneliti memeriksa ulang data dan menemukan kepala sekolah
benar-benar 40. Para peneliti tidak akan menemukan ini kesalahan entri data
sederhana yang mereka tidak melakukan jumlah frekuensi variabel ini, usia.
Beberapa pilihan yang tersedia untuk melakukan penghitungan frekuensi awal
dari data kami. Kedua Excel dan SPSS memiliki berbagai fungsi yang memungkinkan
Anda untuk menghitung dan menampilkan jumlah individu atau kejadian untuk setiap
variabel. Misalnya, untuk varable nominal, seperti gender, kita dapat hanya
menghitung ke komputer frekuensi anak laki-laki (14) dan anak perempuan (11) dari
data Pacific Crest pada Tabel 12.1. Untuk variabel nominal atau ordinal, jumlah
frekuensi untuk setiap nilai sangat deskriptif.
Tabel 12.3 menunjukkan, untuk kelas tiga Ibu Alvarez di Pacific Crest Dasar,
jumlah siswa dari masing-masing jenis kelamin dan masing-masing etnis disajikan
dalam tabel pivot Excel. Sebagai pembanding. Tabel 12.4 menunjukkan versi SPSS,
yang dihitung dengan prosedur crosstabs, untuk informasi yang sama hal utama yang
perlu diperhatikan dalam kedua tabel adalah bahwa mereka menyediakan distribusi
nilai untuk setiap variabel kita telah memilih untuk mempertimbangkan.
Kedua tabel, tentu saja, menunjukkan jumlah frekuensi yang sama. Sebagai
contoh, sel pertama dalam tabel menunjukkan ada dua anak laki-laki (Jenis Kelamin #
1) yang Afrika Amerika (Etnis # 1). Bacaan menuruni Columb, sel berikutnya di
bawah Etnis # 1 menunjukkan bahwa tiga anak perempuan Afrika Amerika- Nyonya.
kelas Alvarez sehingga memiliki lima siswa yang Afrika Amerika, ditampilkan di
Grand Total / Jumlah columbs. petunjuk khusus untuk bagaimana menghasilkan
masing-masing analisis ini termasuk dalam lampiran, angka B.12.1 untuk Excel dan
B.12.2 untuk SPSS.
Frekuensi sedikit lebih rumit ketika kita pertimbangkan interval atau rasio
variabel (seperti tes skor) dan ketika kita memiliki satu set data yang jauh lebih besar
daripada 25 siswa. Karena setiap skor atau nilai dari rasio variabel mungkin terjadi
hanya sekali, frekuensi sederhana count biasanya tidak sangat membantu. Sebagai
contoh, Tabel 12.1 mencakup hanya satu contoh dari 18,4 untuk jatuh skor membaca,
satu untuk 24,5, satu untuk 27,4, dua untuk 28,3, dan sebagainya. Menghitung
frekuensi masing-masing nilai variabel rasio biasanya tidak summarlze keluar datang
bagi kita yang sangat efektif. Oleh karena itu, perhitungan dari rata-rata keseluruhan,
atau berarti, rasio atau data interval memberikan indikator deskriptif jauh lebih baik
daripada jumlah frekuensi. mean adalah salah satu ukuran sebuah pusat dijelaskan
pada bagian berikutnya.
2. UKURAN TEDENSI SENTRAL
Ukuran pemusatan adalah indeks yang mewakili nilai khas antara sekelompok
skor. Mereka menyediakan cara yang nyaman menggambarkan satu set data dengan
nomor tunggal yang mewakili nilai umumnya di tengah-tengah (yaitu, pusat) dataset.
Tiga langkah yang paling sering digunakan dari tendensi sentral adalah mean, median,
dan modus. Setiap indeks digunakan dengan skala pengukuran yang berbeda: mean
ini cocok untuk menggambarkan atau data rasio, median untuk menggambarkan
ordinal, dan modus untuk menggambarkan data nominal.
a. MEAN
Karena pengukuran yang paling kuantitatif dalam penelitian pendidikan
menggunakan skala interval, rata-rata adalah ukuran yang paling umum
digunakan dari tendensi sentral. Mean adalah rata-rata hitung dari nilai. Hal ini
dihitung dengan menjumlahkan semua skor dan membagi jumlah tersebut dengan
jumlah skor.
Rumus untuk mean, X dengan bar di atasnya (𝑋̅) adalah :
𝑋̅ = ∑X/n
Terlihat benar buruk? Namun, itu benar-benar cukup sederhana dan
formula ini memberikan ilustrasi yang baik dari penggunaan simbol-simbol
statistik. Rumus untuk X berarti tanpa bar di atas itu merupakan skor individu,
dan Σ (seperti dibahas sebelumnya) adalah simbol penjumlahan. Dengan
demikian, ΣX meminta Anda untuk menambahkan semua X; yaitu, semua jumlah
scores.The titik data (yaitu, individu atau siswa dalam contoh thls) diwakili oleh
huruf n. Untuk menghitung mean, kita menjumlahkan X dan dibagi dengan
jumlah siswa.
Median adalah titik tengah dalam distribusi: 50% dari nilai di atas median,
dan 50% berada di bawah median. jika jumlah total skor ganjil, median adalah
nilai tengah (dengan asumsi nilai busur diatur dalam urutan nilai). Jika jumlah
skor bahkan, median adalah titik tengah antara dua nilai tengah. Median, oleh
karena itu, nol tentu salah satu nilai yang sebenarnya dalam pengaturan data.
c. MODUS
Modus adalah skor yang dicapai oleh lebih subyek daripada skor lainnya.
Untuk data yang disajikan dalam Tabel 12.6, misalnya, modus adalah 85; lebih
Pacific Crest siswa (12) mencapai skor yang dari yang lain. Modus ini tidak
ditetapkan melalui perhitungan; itu menentukan dengan melihat satu set nilai atau
grafik skor dan melihat yang mencetak paling sering terjadi. Modus umumnya
nilai terbatas dan tidak sering digunakan dalam penelitian pendidikan. Untuk satu
hal, satu set skor mungkin memiliki dua (atau lebih) mode, huruf set digambarkan
sebagai bimodal atau multi-modal. Selain itu, mode adalah ukuran anunstable dari
pusat kecenderungan; sama-ukuran sampel yang dipilih secara acak dari populasi
diakses sama cenderung memiliki model yang berbeda. ketika data nominal
sedang dianalisis, bagaimanapun, modus adalah satu-satunya ukuran yang sesuai
tendensi sentral karena menceritakan apa yang terjadi paling sering.
dalam kasus ini, median jelas terbaik mewakili skor khas. Mode: adalah toilet
rendah, dan rata-rata adalah lebih tinggi dari semua nilai kecuali satu. Mean
adalah "menarik" ke arah skor 195, sedangkan median dasarnya mengabaikan itu.
kedua serikat dan administrasi guru bisa over kasus-kasus mereka, serikat dengan
menggunakan modus dan administrasi dengan menggunakan mean. mode lebih
rendah dari semua gaji kecuali satu, kecuali satu, dan rata-rata lebih tinggi dari
setiap gaji kecuali satu (yang kemungkinan besar adalah gaji guru dengan 30 atau
lebih tahun pengalaman). Jadi, dalam situasi ini indeks paling tepat gaji khas akan
median. Ingat, bagaimanapun bahwa dalam penelitian kami tidak tertarik pada
"pembuatan kasus "melainkan dalam menggambarkan data di paling cara yang
akurat; untuk sebagian besar dataset, rata-rata adalah langkah yang tepat tendensi
sentral.
3. UKURAN VARIABILITAS
Rentang ini hanya perbedaan antara nilai tertinggi dan terendah dalam
distribusi; itu dihitung dengan pengurangan. Sebagai contoh, kisaran nilai tes
musim gugur membaca (Baca F) untuk siswa Pacific Crest adalah 5 5.1 polnts.
atau dari 18,4 ke 73.S poin (lihat Tabel 12.1). Seperti mode, kisaran bukan
merupakan ukuran sangat stabil, dan keuntungan utamanya adalah memberikan
cepat, perkiraan kasar dari variabilitas sampel tertentu.
b. KUARTIL DEVIASI
Kuartil deviasi adalah salah satu setengah dari selisih antara kuartil atas
dan kuartil bawah dalam distribusi. Kuartil atas mengacu pada top 25% dari nilai,
juga dikenal sebagai persentil ke-75. Sejalan dengan itu, kuartil bawah adalah
persentil 25, atau terendah 25% dari skor. Pada Pacific Crest, misalnya, jatuh
membaca nilai (Baca F pada Tabel 12.1) di atas 56,8 berada di kuartil atas; skor
di bawah 36,4 berada di kuartil yang lebih rendah. Dengan mengurangi titik
cutoff untuk kuartil yang lebih rendah dari titik cutoff untuk kuartil atas dan
kemudian membagi hasilnya dengan dua, kita mendapatkan ukuran variabilitas.
Jika kuartil penyimpangan kecil, skor busur dekat bersama; jika besar,
skor lebih menyebar. Ini informasi dapat memberitahu kita, misalnya, bagaimana
siswa Pacific Crest lakukan pada tingkat baca. Membandingkan anak laki-laki
dan perempuan, kita melihat anak laki-laki, sebagai kelompok, yang tidak
konsisten sebagai gadis-gadis. juga, kita akan menemukan bahwa deviasi kuartil
untuk anak-anak lebih kecil daripada deviasi boys.The kuartil adalah ukuran lebih
stabil dari variabillty dari jangkauan dan tepat setiap kali median adalah prosedur
yang paling sesuai. Perhitungan deviasi kuartil melibatkan proses yang sangat
mirip dengan yang digunakan untuk menghitung rata-rata, yang merupakan titik
cutoff untuk kuartil kedua (50%).
35 – 32 = 3
25 - 32 = -7
30 - 32 = -2
40 - 32 = 8
30 - 32 = -2
Ada sedikit varians komputasi sedikit masalah menggunakan skor perbedaan ini,
bagaimanapun, karena jika kita jumlah mereka, kita mendapatkan nol.
Menemukan 0 ls tidak sangat membantu, sehingga cara matematis keluar dari
dilema ini ls persegi perbedaan. Mengkuadratkan dan kemudian menjumlahkan
setiap perbedaan memberikan:
35 – 32 = 3 32 = 9
25 - 32 = -7 -72 = 49
30 – 32 = -2 -22 = 4
40 – 32 = 8 82 = 64
30 – 32 = -2 -22 = 4
Kami kemudian jumlah kuadrat perbedaan dan membagi dengan jumlah skor
untuk menghitung varians:
9 + 49 + 4 + 64 + 4 = 130
= 130/5 = 26
Rumus komputasi untuk varians, kemudian, adalah
∑ (X - X)2/n
d. STANDAR DEVIASI
Standar deviasi adalah akar kuadrat dari varians dari satu set nilai. akar
kuadrat dari varians dalam contoh sebelumnya (26) adalah 5.1, yang merupakan
standar deviasi dari lima skor. standar deviasi, digunakan dengan data interval
dan rasio, adalah jauh indeks yang paling sering digunakan variabilitas. mirip
dengan mean, rekan kecenderungan yang berada di pusat, standar deviasi adalah
ukuran paling stabil variabilitas dan mencakup setiap skor dalam perhitungan.
Anda telah tidak diragukan lagi mendengar tentang "gradasi pada th Tapi
apa yang "kurva?" Konsep ini berasal dari distribusi normal, di mana terdapat
jumlah yang sama tapi kecil dari A dan F, lebih B dan D dan kemudian banyak C
di tengah. Grafik frekuensi masing-masing hasil kelas dalam kurva berbentuk
lonceng, dengan lebih sedikit nilai pada ekstrem dan paling di tengah (lihat
Gambar 12.1). Sebagai contoh lain, Anda mungkin tahu sangat sedikit, jika ada,
adultswho lebih tujuh kaki tinggi. Demikian juga, Anda mungkin tahu sangat
sedikit orang dewasa yang berada di bawah empat kaki. kebanyakan orang adalah
antara lima kaki dan enam kaki. di tengah-tengah distribusi kurva A berbentuk
lonceng dengan orang-orang yang lebih sedikit (atau skor) pada ekstrem dan lebih
banyak orang di tengah dianggap "normal". banyak variabel yang terdistribusi
secara normal, termasuk tinggi, berat, skor IQ, SAT, dan prestasi lainnya skor.
1. Lima puluh persen dari nilai di atas rata-rata dan 50% di bawah rata-rata.
2. Mean. median, dan modus yang memiliki nilai yang sama.
3. Kebanyakan skor yang dekat berarti Semakin jauh fron skor adalah, semakin
sedikit jumlah peserta yang mencapai skor itu. saya.
4. Untuk setiap nilai tersebut yang biasa jatuh antara mean dan satu standar
deviasi di atas e berarti, dan 34,13% dari nilai tersebut berada satu standar
deviasi di bawah rata-rata (lihat Gambar 12. Saya menemukan titik tengah
pada kurva dan melihat bagian bawah kurva ditandai 34,13%. dengan kata
lain, 68,26% dari nilai ar dalam satu standar deviasi dari mean 34,13%
34,13%), lebih dari 99% dari nilai akan jatuh di suatu tempat antara tiga
standar deviasi di atas dan tiga standar deviasi bawah rata-rata.
Mengetahui di mana skor berada pada kurva normal membantu kita
memahami di mana mereka ditempatkan relatif dari dataset penuh. Misalnya,
melihat garis 12,1 lalu. ditandai Deviasi IQ-rata skor IQ 100, jatuh di tengah
grafik dan langsung di bawah puncak kurva normal di atas itu. Kurva normal
menunjukkan bahwa 50% dari populasi memiliki skor IQ di atas juga, dan 50%
memiliki skor di bawah 100, Selain itu, skor IQ memiliki standar deviasi 15,
sehingga 34,13% dari seluruh nilai IQ adalah antara 85 dan 100 dan 34,13%
adalah antara 100 dan 115. Secara keseluruhan, kemudian. 68,26% 34,13%
34,13%) dari skor IQ berada dalam Gplus atau satu standar deviasi dari mean
antara 115 dan 85.
Mari kita misalkan kita memiliki mahasiswa di Pacific Crest Dasar, Justin,
yang memiliki skor 1Q dari 115 Dengan pengetahuan Anda tentang kurva
normal, Anda sekarang dapat menentukan bahwa skor Justin dari 115
cukup good.An skor IQ dari 115 adalah salah satu standar deviasi di atas th rata-
rata 100, dan 50% dari nilai yang di bawah rata-rata. Dengan demikian kita dapat
menghitung berapa banyak nilai IQ busur skor Justin dari 115-50% Goclow
ditambahkan ke 34,13% antara 100 dan 115), dengan total 84,13%. Dengan kata
lain, skor Justin lebih baik dari 84,13% dari nilai IQ lainnya. Ia juga dapat
menghitung persentase siswa yang mendapat nilai lebih tinggi dari Justin dengan
mengurangi 84,13% fron 100%: hanya 15,879 berada di atas skor Justin
perhitungan 115.From thesc, jelas bahwa skor IQ Justin dari 115 relatif tinggi;
kita, oleh karena itu, mengharapkan hasil nasional baik pendidik dari dia di
sekolah.
Sekarang anggaplah kita memiliki siswa lain di Pacific Crest, Dolores,
yang memiliki skor IQ-standar deviasi dard (.e..15 15) di atas rata-rata 100
Gambar 12.1 menunjukkan bahwa 47,72% dari nilai bahwa dalam dua devitions
standar di atas rata-rata. dengan kata lain, 47,72% dari populasi memiliki IQ
antara 100 dan 130 antara 100 dan 115 dan 13,59% antara 100 dan 130.
Mengetahui bahwa 50% dari populasi memiliki skor IQ di bawah 100, kita dapat
menghitung persentase orang dengan arah skor IQ odcr, kita dapat bahwa hanya
2,27 dari R di scorc Dolores untuk 130 c.2.14 otniously, kita tidak menemukan
banyak siswa (onl yang scorc serta Dolores tidak pada saya dengan pemahaman
dasar normii.
Anda dapat lebih mudah memahami makna standar nilai, seperti untuk
contoh SAT Asanother, menganggap Dolores memiliki saudara area, Ivan, yang
mencetak 800 pada SAT maitu gabungan. Gambar 12.1 menunjukkan SAT di La
ditandai skor CEEB ( untuk Masuk Perguruan tinggi tion Dewan tampak hingga
skr biasa i 800 adalah tiga standar deviasi di di rata-rata 500, dan skornya
menempatkan dia di McD: 99 (dikenal sebagai ekor kurva hanya INoftt mencetak
lebih tinggi dari Ivan.
Untuk meringkas, jika skor terdistribusi secara normal, pernyataan berikut benar:
Pada Gambar 12.1. ujung pernah menyentuh baseline, dan tidak ada kurva
numbot pasti selalu memungkinkan untuk keberadaan ekstrem unexpo di akhir
cither, dan cach tambahan stas penyimpangan termasuk sebagian kecil dari nilai
persen, kita perlu meninggalkan ruang untuk extremelyn yang delapan atau 160
(e. deviasi standar di atas rata-rata).
Misalnya, ry kebetulan memiliki siswa khususnya cerdas dalam satu tahun.
Dalam hal ini, meskipun intelijen m menjadi normal, akan lebih terdistribusi
secara normal jika kita melihat distrik sekolah bole (e. Populasi), studi Bocause
berurusan dengan jumlah peserta, doften bukan angka, penelitian sangat besar
Data cfrom smple) hanya dapat mendekati kurva normal. Untuk ark perbedaan
ini, peneliti menggunakan SD untuk mewakili e standar deviasi dari sampel dan
simbol o e, Yunani huruf kecil sigma untuk tepresent yang stan. deviasi ard
penduduk (catatan bahwa Gambar 12.1 ses karena nilai yang ditampilkan adalah
dari bos populasi. Dalam bahasa statistik, o merupakan parameter pulation,
sedangkan SD merupakan statistik berdasarkan cukup.
f. KEWED DISTRIBUSI
Maka distribusi tidak normal, itu dikatakan kewed, distribusi normal adalah
simetris; grafik adalah kurva berbentuk lonceng dengan mean, median, dan
modus semua sama. ingat bahwa distribusi normal memiliki sekitar jumlah yang
sama dari skor ekstrim pada setiap akhir distribusi. distribusi miring, namun tidak
simetris; nilai-nilai mean, median dan modus yang berbeda, dan ada nilai lebih
ekstrim pada satu dan dari yang lain. Sebuah distribusi negatif miring memiliki
skor ekstrim di ujung bawah dari distribusi, dan distribusi miring positif memiliki
skor ekstrim di akhir lebih tinggi,
Angka 12.2 memberikan dua contoh dari distribusi miring dari tes 100-
item. distribusi negatif miring di sebelah kiri menunjukkan kasus di mana
sebagian besar peserta melakukannya dengan baik tapi beberapa tidak skor sangat
buruk-rendah berada di sebelah kiri dari distribusi dan skor yang lebih tinggi di
sebelah kanan atas rata-rata. sebaliknya, distribusi kedua di angka 12.2 adalah
positif miring: sebagian besar peserta melakukan buruk, tetapi beberapa
melakukannya dengan sangat baik. dalam kedua kasus mean "ditarik" ke arah
nilai ekstrim.
Dalam distribusi miring, rata-rata selalu lebih dekat nilai ekstrim daripada
median karena mean dipengaruhi oleh nilai ekstrim bertindak seperti magnet dan
menarik mean ke arah mereka. Dengan demikian, untuk distribusi negative
miring, mean (X) selalu lebih rendah, atau lebih kecil dari median (md), untuk
distribusi miring positif berarti selalu lebih tinggi atau lebih besar dari modus
median, tidak terpengaruh oleh nilai extreme. Misalnya, pertimbangan usia
dimana perempuan memiliki wanita bayi. Mereka banyak melahirkan ketika
mereka muda (dibawah 30), distribusi usia ibu saat melahirkan adalah popsitif
miring dan usia rata-rata lebih besar dari median atau modus untuk semua wanita.
Untuk ringkasan:
Negative skewed: mean < median < mode
Positively skewed: mean > median > mode
Selain itu, jauh terpisah mean dan median, semakin miring distribusi, mengetahui
jika distribusi miring penting karena pengetahuan ini membantu kita memilih
statistic lain untuk menganalisa data. Jika distribusi sangat miring, maka sumsi
noramlitas diperlukan untuk banyak statistic (lihat bab 13) dilanggar. Untuk
Dari gambar 12,1 menunjukkan, jika satu set nilai adalah dibentuk menjadi
skor set, distribusi baru memiliki deviasi standar.
Keuntungan utama dari 2 skor adalah mereka memungkinkan skor dari tes
yang berbeda atau subyek yang akan dibandingkan seluruh individu. Misalnya,
perhatikan ringkasan dari nilai tes justin pada table 12.7 juga disebut skor mentah
dikonversi ke nilai z dan setara persentil.
Kita dapat menggunakan Gambar 12.1 untuk memperkirakan inequivalents
untuk skor givenz, tetapi hanya jika seluruh nomor scores2re atau jatuh rapi di
skor scale. Estimating yang jatuh antara nilai yang diberikan dalam angka lebih
sulit. Sebuah pendekatan yang lebih tepat, oleh karena itu, adalah dengan
menggunakan Tabel A-3 pada Lampiran A Untuk setiap z antara-3,00 dan 3,00,
kolom berlabel Lokasi proporsi cascs yang disertakan sampai saat itu. Dengan
kata lain, untuk setiap nilai 2, daerah dibuat di sebelah kiri garis pada kurva
merupakan proporsi kasus yang jatuh di bawah skor z. Dengan demikian, untuk
z.00 (nilai rata-rata), kita membaca menuruni colununs sampai kita
datang to.00.The daerah 5000 yang sesuai, yang mewakili 50% dari kasus dan 50
per icentile.To menentukan daerah di bawah kurva atau per -. sentil untuk
Justin'szscore dari 1,0 kita hanya membaca bawah ther kolom sampai kita datang
ke 1.00 c, skor z nya membaca sesuai arca di bawah kurva adalah 813. dengan
mengalikan oleh 100, kami sec bahwa Justin membaca. skor sesuai dengan
sekitar sentil per- 84 (yang adalah apa yang kami temukan Carlier ketika kita
eimated persentil dari Gambar 12.1) Begitu pula, untuk skor membaca Dolores
untuk z + 2,00, kita menemukan daerah di bawah is.9772 kurva atau 97. 72% apa
yang kami temukan sebelumnya The oMableA.3 manfaat isthat memungkinkan
kita untuk membuat estimasi dari lebih tepat 2 skor.
Seperti Gambar 12.1 menunjukkan, nilai z adalah blok bangunan untuk
sejumlah nilai standar lainnya, yang merupakan transformasi dari z skor yang
komunikasi- makan informasi yang sama dalam bentuk andable lebih umum di
bawah dengan menghilangkan negatif, desimal, Tscores.
Jika Anda melihat dekat pada rumus Pearson rauu akan melihat bahwa
Anda sudah berada famili dengan semua potongan ar formula kecuali satu, exy,
yang bol untuk penjumlahan produk skor Xandy setiap orang (tes pertama ega
siswa skor multipli co skor kedua siswa), Jelas, jika kita dataset, mul plying besar
dan menjumlahkan setiap band score6i cukup membosankan. Untungnya,
computeE Rives pada nilai yang sama dalam waktu lebih.
Untuk contoh konkret, kita kembali ke anaia kami hasil di kelas tiga Mrs.
Alvarez clzi Pacific Crest Dasar. Pertama, kita ingin mencari thc3 sociation atau
korelasi antara Kejatuhan Membaca skor Kejatuhan Matematika untuk siswa kita
harapkan dari pengalaman bahwa Membaca skor dan Mathscores wgul
kemungkinan akan berkorelasi; yaitu, siswa yang mendapat skor membaca wdt0
juga akan melakukannya dengan baik pada matematika dan sebaliknya.
Komputasi korelasi menggunakan SPSS adalah rchtho sederhana Kami memilih
opsi berikut, seperti illustratoo dalam Lampiran B, Gambar B.12.5:
Analyze
Correlate
Bi-Variate
Setelah memilih opsi SPSS yang sesuai, kemudian pilih variable yang kita
ingin analisa. SPSS kemudian output ditampilkan ih Toble 12,8 ini display output
pertama CCL matriks menunjukkan koefisien korelasi sendiri ReadEThis ne fect
orrelation (1), tentu saja, seperti meja shows.If membaca seluruh matriks ke sel
kedua, cakrawala. ully, kita menemukan korelasi antara ReadF dan MathF 618
dengan tingkat signifikansi of.001.The sel ketiga memberikan korelasi yang sama
antara MathF dan MathF oleh MathF 1, terdaftar pertama Sel terakhir adalah
melawan dirinya sendiri, yang merupakan korelasi fect sempurna tentu saja
korelasi dua sel yang menunjukkan per- i G, e pertama dan keempat disebut
diagonal dari matrix.The dua sel lain dalam matriks disebut sel off-diagonal.
Karena hanya ada dua variabel dalam analisis ini. kedua kotak offdiagonal
menunjukkan koefisien korelasi yang sama Meskipun kita hanya perlu satu nilai
koefisien (618), SPSS mencetak informasi lengkap untuk semua sel. Setelah
semua informasi ini dalam matriks menjadi lebih impor. tant ketika kita
berhubungan lebih dari dua variabel dan matriks tumbuh 3 x 3, 4 x 4, atau lebih
besar. Dalam dataset besar kita sering menghitung korelasi untuk semua variabel
rasio dalam persiapan untuk melakukan beberapa re gression, seperti yang kita
jelaskan di Bab 13.
Bagaimana kita menafsirkan temuan ini dari koefisien korelasi r 618
dengan nilai signifikansi 001? Apakah ini baik? Apakah itu mewakili hubungan
yang benar? Apakah koefisien korelasi ini secara signifikan berbeda from.00?
Jika Anda ingat diskusi terkait dalam Bab 8, Anda tahu bahwa koefisien korelasi
of.618 Bly proba- menunjukkan hubungan yang kuat antara variabel. Selain itu,
bahkan dengan ukuran sampel kecil kami 25 r.618 signifikan at.001.In kata lain,
lihood seperti-menemukan korelasi ini besar, hanya dengan (gambar) di
pembuatan jalan dan matematika itu akan menjadi penting bagi kami pada akhir
tahun THC untuk menguji korelasi lagi: yaitu, untuk melihat wheth membaca dan
matematika skor yang er dudents 'telah meningkat pada tingkat yang sama.
Catatan Tambahan
Hampir selalu dalam studi penelitian, statistik deskriptif seperti mean dan deviasi
standar dihitung secara terpisah untuk setiap kelompok dalam penelitian. Sebuah
koefisien korelasi biasanya dihitung hanya dalam studi korelasional (kecuali digunakan
untuk menghitung keandalan instrumen yang digunakan dalam studi banding atau
eksperimental kausal). Nilai standar jarang digunakan dalam studi penelitian. Namun,
untuk menguji hipotesis, kita hampir selalu membutuhkan lebih dari statistik
deskriptif; kita memerlukan aplikasi dari satu atau lebih inferensial statistik untuk
menguji hipotesis dan menentukan signifikansi hasil. Kami membahas statistik
inferensial dalam bab berikutnya.
F. Kesimpulan
1. Bahasa Statistik
a. rumus untuk r statistik prosedur matematika hanya dasar, penggunaan notasi
statistik huruf yunani sebagai singkatan.
2. Mempersiapkan Data Untuk Analisis
a. Langkah pertama menuju analisis melibatkan mengkonversi respon perilaku ke
dalam beberapa sistem numerik atau organisasi kategoris.
b. Semua instrumen harus bernilai akurat dan konsisten, dengan menggunakan
prosedur dan kriteria yang sama. Nilai instrument yang dikembangkan lebih
kompleks dari pada nilai instrumen standar terutama jika item terbuka terlibat.
3. Tabulasi Dan Pengkodean Prosedur
a. Tabulasi melibatkan pengorganisasian data sistematik, misalnya dengan subject
individu. Jika analisis direncanakan melibatkan perbandingan subkelompok, skor
harus ditabulasi untuk setiap sub kelompok.
b. Berikut tabulasi. Langkah berikutnya adalah untuk meringkas data menggunakan
statistik deskriptif.
4. Jenis Statistik Deskriptif
a. Nilai-nilai dihitung untuk sampel yang diambil dari populasi A disebut sebagai
statistik. Nilai-nilai dihitung untuk seluruh populasi disebut sebagai parameter.
5. Frekuensi
a. Frekuensi mengacu pada jumlah kali sesuatu terjadi, dengan statistik deskriptif,
frekuensi biasanya mengacu pada jumlah kali setiap nilai variabel terjadi.
b. Untuk variabel nominal atau ordinal jumlah frekuensi dengan masing-masing
nilai sangat deskriptif. Frekuensi lebih rumit untuk interval atau rasio vaiables,
langkah-langkah lain dari tendensi sentral lebih disukai untuk menggambarkan
frekuensi.
6. Ukuran Tendensi Sentral
a. Ukuran tendensi sentral adalah indeks yang respresent skor khas antara
sekelompok skor. Mereka menyediakan cara yang nyaman untuk
menggambarkan satu set data dengan satu nomor.
b. Mean adalah rata-rata aritmatika dari varable dan paling frekuensi yang
digunakan mengukur tendensi sentral adalah tepat untuk diskriptf interval atau
rasio data.
c. Median adalah titik tengah dalam distribusi dari nilai di atas median, sebuah 50 di
bawah median. Median adalah yang paling banyak digunakan ketika melihat
variabel ordinal atau dataseat yang skor bervariasi selama distribusi.
d. Modus adalah skor yang dicapai oleh sebagian besar mata pelajaran daripada nilai
lain (yaitu, terjadi frekuensi). Satu kelompok skor mungkin memiliki dua
mode. Ketika data nominal yang memiliki modus adalah satu-satunya ukuran
yang tepat dari tendensi sentral.
7. Memutuskan antara Mean, Median, dan Modus
a. Secara umum mean lebih suka diukur
dari tendensi sentral. Ketika sekelompok skor tes berisi satu atau skor yang lebih
ekstrim median adalah indeks terbaik dari kinerja khas.
8. Ukuran Variabilitas
a. Dua set data yang sangat berbeda dapat memiliki berarti identik atau median,
sehingga menciptakan perlunya langkah-langkah variabilitas, indeks yang
menunjukkan bagaimana menyebar sekelompok skor yang.
b. Rentang ini hanya perbedaan antara nilai tertinggi dan terendah dalam distribusi
dan ditentukan oleh pengurangan. Hal ini tidak sangat stabilukuran variabilitas,
tapi adventage utamanya adalah memberikan perkiraan kasar cepat variabelity.
c. Kuartil deviasi adalah salah satu setengah perbedaan antara kuartil atas
(persentase 75) dan kuartil bawah (persentase 25) dalam distribusi. Kuartil
deviasi ukuran lebih stabil variabilitas dari jangkauan dan tepat setiap kali median
sesuai.
d. Variansi didefinisikan sebagai jumlah penyebaran antar skor. Jika varians kecil,
skor dekat bersama-sama, jika itu adalah besar, skor lebih menyebar.
e. Standar deviasi adalah akar kuadrat dari varians dari satu set nilai. Ini adalah
ukuran paling stabil variabilitas dan memperhitungkan setiap skor.
9. Kurva Normal
a. Sebuah distribusi dengan orang yang lebih sedikit (atau skor) pada ekstrim dan
lebih banyak orang di tengah dianggap "normal." Ketika diplot sebagai grafik
frekuensi, distribusi normal membentuk bentuk lonceng, yang dikenal sebagai
kurva normal.
b. Jika variabel apakah terdistribusi normal, maka 50% dari nilai di atas rata-rata,
dan 50% dari nilai yang di bawah rata-rata. Mean, median, dan modus yang
sama.Kebanyakan skor yang dekat mean, dan jauh dari maksud skor adalah,
semakin sedikit jumlah mata pelajaran yang mencapai skor itu. Untuk distribusi
normal pernah Y,34,13% dari nilai tersebut berada antara mean dan satu standar
deviasi di atas rata-rata, dan 34 13% dari nilai tersebut berada satu standar deviasi
di bawah rata-rata lebih dari 99% dari nilai akan jatuh di suatu tempat antara tiga
deviasi standar di atas dan tiga standar deviasi di bawah rata-rata.
c. Karena studi penelitian berurusan dengan jumlah terbatas pelajaran, dan sering
sejumlah tidak sangat besar, data dari sampel hanya bisa mendekati kurva normal.
10. Distribusi Miring
a. Ketika distribusi tidak normal, itu dikatakan miring, dan ada nilai lebih ekstrim di
salah satu ujung dari yang lain. Jika skor ekstrim di ujung bawah dari distribusi,
distribusi dikatakan miring negatif; jika skor ekstrim di atas, atau lebih tinggi,
ujung distribusi, distribusi dikatakan miring positif. Untuk distribusi negatif
miring, mean (X) selalu lebih rendah, atau lebih kecil, dibandingkan dengan
median (md): untuk distribusi miring positif, berarti selalu lebih tinggi, atau lebih
besar, daripada median.
b. Jika variabel apakah terdistribusi normal, maka 50% dari nilai di atas rata-rata,
dan 50% dari nilai yang di bawah rata-rata, mean, median, dan modus yang sama.
Kebanyakan skor yang dekat mean, dan jauh dari maksud skor adalah, semakin
sedikit jumlah mata pelajaran yang mencapai skor itu. Untuk setiap distribusi
normal, 34.13% dari nilai tersebut berada antara mean dan satu standar deviasi di
atas rata-rata, dan 34 13% dari nilai tersebut berada satu standar deviasi di bawah
rata-rata lebih dari 99% dari nilai akan jatuh di suatu tempat antara tiga standar
deviasi di atas dan tiga standar deviasi di bawah rata-rata.
c. Karena studi penelitian berurusan dengan jumlah terbatas pelajaran, dan sering
sejumlah tidak sangat besar, data dari sampel dapat hanya perkiraan kurva
normal.
11. Ukuran Posisi Relatif
a. Ukuran posisi relatif menunjukkan di mana skor jatuh dalam distribusi relatif
terhadap semua skor lainnya dalam distribusi. Mereka memungkinkan untuk
membandingkan kinerja satu orang pada dua atau lebih tes yang berbeda.
b. Sebuah peringkat menunjukkan persentase skor yang jatuh pada atau di bawah
nilai yang diberikan. Persen kebohongan yang sesuai untuk data yang diukur
dalam skala ordinal, meskipun mereka sering dihitung untuk data interval.
Median dari satu set nilai sesuai dengan persentil ke-50.
c. Sebuah skor standar mencerminkan berapa banyak standar deviasi skor siswa
berada di atas atau di bawah rata-rata. Skor z langsung mengungkapkan seberapa
jauh skor adalah dari mean dalam unit standar deviasi. Sebuah skor yang setara
dengan rata-rata sesuai dengan skor z skor 0. A itulah salah satu standar deviasi di
atas rata-rata sesuai dengan skor z dari + 1,00, dan nilai z dari -1.00 adalah salah
satu standar deviasi di bawah rata-rata. Jika seperangkat skor berubah menjadi
satu set nilai z, distribusi baru memiliki mean 0 dan deviasi standar.
d. Sebuah skor T (juga disebut skor Z) adalah skor z diubah untuk menghilangkan
plus atau minus.
12. Ukuran Hubungan
a. Langkah-langkah hubungan menunjukkan sejauh mana dua set nilai
terkait. Derajat hubungan dinyatakan sebagai koefisien korelasi, yang dihitung
dari dua set nilai dari satu kelompok peserta. Jika dua variabel yang sangat
terkait, koefisien korelasi dekat 1,00 atau -1,00 akan diperoleh; jika dua variabel
tidak terkait, koefisien dekat akan diperoleh 0,00.
b. Nilai r adalah ukuran yang paling tepat korelasi ketika kumpulan data yang akan
berkorelasi dinyatakan sebagai salah interval atau rasio skala. Nilai r tidak
berlaku jika hubungan antara variabel tidak linear.
c. Spearman rho adalah ukuran yang tepat korelasi ketika variabel dinyatakan
sebagai jajaran.
13. Data grafik
a. Data grafik selalu membantu untuk memberikan kembali presentasi grafis dari
data, dan dalam beberapa penyakit (i.e., Hubungan lengkung antara variabel)
bentuk distribusi dapat mempengaruhi pilihan peneliti dari statistik deskriptif.
b. Metode yang paling umum dari grafik data penelitian adalah untuk membangun
sebuah poligon frekuensi. Data juga dapat ditampilkan dalam grafik batang, plot
pencar, diagram lingkaran, dan batang dan daun grafik.
14. Perhitungan Data Interval
Simbol
Simbol yang biasa digunakan dalam rumus statistik adalah sebagai berikut:
X = skor setiap
Σ = jumlah; menambahkan mereka
Σ.X = jumlah semua skor
𝑋̅ = Mean, atau aritmetika rata, dari skor
N = jumlah mata pelajaran
n = jumlah subyek dalam kelompok tertentu
Mean
∑.X
Rumus untuk mean adalah =𝑋̅ = 𝑁
Standard Deviasi
Rumus untuk standardeviasi
𝑆𝑆 (∑X)2
SD = √𝑁−1, where SS = ∑X2 - 𝑁
Sstandar Skor
𝑋− 𝑋̅
Rumus untuk skor az adalah z = 𝑆𝐷