B. BAHASA STATISTIK
Beberapa peneliti menghitung prosedur statistik dengan tangan lagi; kami
memiliki program komputer yang sangat baik tersedia untuk membuat perhitungan ini.
Namun demikian, itu adalah penting untuk memahami perhitungan dasar menjadi
dilakukan oleh komputer. karena tujuan kita di sini adalah untuk membantu Anda
mendapatkan pemahaman konseptual prosedur statistik, tidak menjadi staticians, kita
akan memperkenalkan beberapa rumus dan kemudian memberikan contoh output dari
program statistik. Walaupun rumus untuk prosedur statistik sering muncul lebih
whelming pada pandangan pertama, mereka prosedur matematika Hanya dasar.
Memahami prosedur statistik yang seperti belajar bahasa baru dan dalam hal ini adalah
Yunani: notasi statistik menggunakan huruf Yunani sebagai singkatan. Misalnya, alih-
alih menyatakan bahwa Anda perlu menambahkan nilai semua orang, notasi statistik
menggunakan simbol Yunani huruf besar sigma (∑) berarti "jumlah itu."
Contoh dalam bab ini dihasilkan dari Excel atau SPSS, meskipun spreadsheet
lainnya dan statistik program yang tersedia. Anda mungkin akrab dengan Excel dan
mungkin memiliki akses ke sana melalui microsoft Kantor. SPSS (Paket Statistik dalam
Ilmu Sosial) mungkin kurang akrab bagi Anda, tetapi sering digunakan dan tersedia
dalam versi desktop ataupun jaringan (kami menggunakan contoh dari SPSS 14.0 for
Window –student Versi). Meskipun kami tidak memberikan setiap langkah setiap
prosedur, kami merujuk Anda ke bahan tambahan dalam lampiran.
Kesimpulan penelitian. ls analisis data sama pentingnya dengan komponen lain dari
penelitian, dan prosedur statistik dan teknik penelitian harus diidentifikasi dan dijelaskan
secara rinci dalam rencana penelitian.
Tabel. 12.1
Jenis utama dari statistik deskriptif dibahas dalam bagian-bagian berikut ini
frekuensi, ukuran pemusatan, ukuran variabilitas, langkah-langkah dari posisi relatif, dan
langkah-langkah hubungan.
1. FREKUENSI
Frekuensi mengacu pada jumlah kali sesuatu terjadi; dengan statistik deskriptif,
frekuensi biasanya mengacu pada jumlah kali setiap nilai variabel terjadi. Sebagai
contoh, kita ingin mengetahui jumlah anak laki-laki dan perempuan di kelas Mrs.
Alvarez di Pacific SD, jadi kita menghitung frekuensi menghitung (Yaitu, jumlah) untuk
setiap. Awal analisis kami dengan jumlah frekuensi membantu untuk memverifikasi data,
untuk menjadi pastikan semuanya telah dimasukkan ke dalam komputer benar. Misalnya,
pertimbangkan sebuah studi dari kepala sekolah analisis pertama (jumlah frekuensi
menunjukkan jumlah pelaku dalam setiap kelompok usia yang relevan dengan studi)
menunjukkan salah satu pelaku adalah empat tahun tua. Dengan asumsi tidak ada
probabilitas tinggi dari dewasa sebelum waktunya pokok empat tahun, para peneliti
memeriksa ulang data dan menemukan kepala sekolah benar-benar 40. Para peneliti tidak
akan menemukan ini kesalahan entri data sederhana yang mereka tidak melakukan
jumlah frekuensi variabel ini, usia.
Beberapa pilihan yang tersedia untuk melakukan penghitungan frekuensi awal
dari data kami. Kedua Excel dan SPSS memiliki berbagai fungsi yang memungkinkan
Anda untuk menghitung dan menampilkan jumlah individu atau kejadian untuk setiap
variabel. Misalnya, untuk varable nominal, seperti gender, kita dapat hanya menghitung
ke komputer frekuensi anak laki-laki (14) dan anak perempuan (11) dari data Pacific
Crest pada Tabel 12.1. Untuk variabel nominal atau ordinal, jumlah frekuensi untuk
setiap nilai sangat deskriptif.
Tabel 12.3 menunjukkan, untuk kelas tiga Ibu Alvarez di Pacific Crest Dasar,
jumlah siswa dari masing-masing jenis kelamin dan masing-masing etnis disajikan
dalam tabel pivot Excel. Sebagai pembanding. Tabel 12.4 menunjukkan versi SPSS,
yang dihitung dengan prosedur crosstabs, untuk informasi yang sama hal utama yang
perlu diperhatikan dalam kedua tabel adalah bahwa mereka menyediakan distribusi nilai
untuk setiap variabel kita telah memilih untuk mempertimbangkan.
Kedua
tabel, tentu saja, menunjukkan jumlah frekuensi yang sama. Sebagai contoh, sel pertama
dalam tabel menunjukkan ada dua anak laki-laki (Jenis Kelamin # 1) yang Afrika
Amerika (Etnis # 1). Bacaan menuruni Columb, sel berikutnya di bawah Etnis # 1
menunjukkan bahwa tiga anak perempuan Afrika Amerika- Nyonya. kelas Alvarez
sehingga memiliki lima siswa yang Afrika Amerika, ditampilkan di Grand Total / Jumlah
columbs. petunjuk khusus untuk bagaimana menghasilkan masing-masing analisis ini
termasuk dalam lampiran, angka B.12.1 untuk Excel dan B.12.2 untuk SPSS
Frekuensi sedikit lebih rumit ketika kita pertimbangkan interval atau rasio
variabel (seperti tes skor) dan ketika kita memiliki satu set data yang jauh lebih besar
daripada 25 siswa. Karena setiap skor atau nilai dari rasio variabel mungkin terjadi hanya
sekali, frekuensi sederhana count biasanya tidak sangat membantu. Sebagai contoh,
Tabel 12.1 mencakup hanya satu contoh dari 18,4 untuk jatuh skor membaca, satu untuk
24,5, satu untuk 27,4, dua untuk 28,3, dan sebagainya. Menghitung frekuensi masing-
masing nilai variabel rasio biasanya tidak summarlze keluar datang bagi kita yang sangat
efektif. Oleh karena itu, perhitungan dari rata-rata keseluruhan, atau berarti, rasio atau
data interval memberikan indikator deskriptif jauh lebih baik daripada jumlah frekuensi.
mean adalah salah satu ukuran sebuah pusat dijelaskan pada bagian berikutnya.
a. MEAN
Karena pengukuran yang paling kuantitatif dalam penelitian pendidikan
menggunakan skala interval, rata-rata adalah ukuran yang paling umum digunakan dari
tendensi sentral. Mean adalah rata-rata hitung dari nilai. Hal ini dihitung dengan
menjumlahkan semua skor dan membagi jumlah tersebut dengan jumlah skor.
Rumus untuk mean, X dengan bar di atasnya (X) adalah :
X = ∑X/n
Terlihat benar buruk? Namun, itu benar-benar cukup sederhana dan formula ini
memberikan ilustrasi yang baik dari penggunaan simbol-simbol statistik. Rumus untuk X
berarti tanpa bar di atas itu merupakan skor individu, dan Σ (seperti dibahas sebelumnya)
adalah simbol penjumlahan. Dengan demikian, ΣX meminta Anda untuk menambahkan
semua X; yaitu, semua jumlah scores.The titik data (yaitu, individu atau siswa dalam
contoh thls) diwakili oleh huruf n. Untuk menghitung mean, kita menjumlahkan X dan
dibagi dengan jumlah siswa.
Tabel 12.5 menunjukkan nilai rata-rata pada musim gugur membaca penilaian
untuk anak laki-laki dan anak perempuan di kelas Mrs.Alvarez ini. Tabel ini juga
menunjukkan standar deviasi, yang dibahas kemudian dalam bab ini. Perhitungan
dihitung dengan Excel dengan memilih Tools, Analis Data, dan Statistik Deskriptif,
maka menyoroti skor gugur membaca (Read F) memeriksa ringkasan Statisticss, dan klik
OK. menyortir membaca skor berdasarkan gender Apakah accompliebed dengan
menyorot kolom yang tepat dan kemudian memilih data, semacam, untuk mengatur skor
berdasarkan jenis kelamin (laki-laki = 1; girls = 2).
b. MEDIAN
Median adalah titik tengah dalam distribusi: 50% dari nilai di atas median, dan
50% berada di bawah median. jika jumlah total skor ganjil, median adalah nilai tengah
(dengan asumsi nilai busur diatur dalam urutan nilai). Jika jumlah skor bahkan, median
adalah titik tengah antara dua nilai tengah. Median, oleh karena itu, nol tentu salah satu
nilai yang sebenarnya dalam pengaturan data.
Median adalah paling berguna ketika melihat variabel yang mungkin berbeda
secara luas selama distribusi, seperti pendapatan. Sebagai contoh, jika kita menghitung
rata-rata atau rata-rata pendapatan orang tua di Pacific Crest, itu akan cenderung mirip
dengan sekolah lain di kabupaten. Namun, salah satu orang tua di Pacific Crest adalah
bintang rock yang membuat jutaan dolar. Secara signifikan lebih dari orang lain di
masyarakat. Pendapatan bintang rock itu membawa pendapatan mean naik, sehingga
indeks yang bukan representasi yang baik dari dataset lengkap. Dalam contoh ini, kita
dapat menggunakan median sebagai indeks tendensi sentral. Pendapatan terlampau tinggi
dari bintang rock adalah salah satu penghasilan di atas median, tidak peduli berapa
banyak lebih tinggi itu adalah dari pendapatan familie lain. median juga merupakan
ukuran yang sesuai tendensi sentral ketika data merupakan skala ordinal
c. MODUS
Modus adalah skor yang dicapai oleh lebih subyek daripada skor lainnya. Untuk
data yang disajikan dalam Tabel 12.6, misalnya, modus adalah 85; lebih Pacific Crest
siswa (12) mencapai skor yang dari yang lain. Modus ini tidak ditetapkan melalui
perhitungan; itu menentukan dengan melihat satu set nilai atau grafik skor dan melihat
yang mencetak paling sering terjadi. Modus umumnya nilai terbatas dan tidak sering
digunakan dalam penelitian pendidikan. Untuk satu hal, satu set skor mungkin memiliki
dua (atau lebih) mode, huruf set digambarkan sebagai bimodal atau multi-modal. Selain
itu, mode adalah ukuran anunstable dari pusat kecenderungan; sama-ukuran sampel yang
dipilih secara acak dari populasi diakses sama cenderung memiliki model yang berbeda.
ketika data nominal sedang dianalisis, bagaimanapun, modus adalah satu-satunya ukuran
yang sesuai tendensi sentral karena menceritakan apa yang terjadi paling sering.
Memutuskan antara Mean, median dan modus secara umum, rata-rata adalah
ukuran disukai tendensi sentral. adalah tepat ketika data mewakili baik selang atau skala
rasio. itu lebih tepat daripada median atau modus karena jika sampel yang sama-ukuran
yang dipilih secara acak dari populasi yang sama, cara mereka sampel akan lebih mirip
satu sama lain dari baik median atau mode. Namun, dengan sifat setiap dari cara di mana
itu dihitung, berarti memperhitungkan (yaitu, berdasarkan) skor masing-masing peserta.
karena semua skor menghitung, rata-rata dapat dipengaruhi oleh nilai ekstrim seperti
pendapatan bintang rock. sama, dalam penelitian pendidikan, ketika sekelompok nilai
ujian berisi satu atau skor yang lebih ekstrim, themedian adalah indeks terbaik dari
kinerja khas.
Sebagai contoh, misalkan sembilan dari kami Pacific Crest Siswa memiliki nilai
berikut IQ: 96, 96, 97, 99100, 101, 102, 104, 195. Untuk skor ini, tiga ukuran tendensi
sentral adalah:
dalam kasus ini, median jelas terbaik mewakili skor khas. Mode: adalah toilet rendah,
dan rata-rata adalah lebih tinggi dari semua nilai kecuali satu. Mean adalah "menarik" ke
arah skor 195, sedangkan median dasarnya mengabaikan itu.
Gambar yang berbeda disajikan oleh berbagai Tindakan adalah bagian dari alasan
untuk frase berbohong dengan statistik. Meskipun perhitungan prosedur statistik
mungkin terbantahkan, seleksi dan aplikasi yang terbuka untuk interpretasi lebar.
Memilih satu indeks tendensi sentral atas satu sama lain dapat menimbulkan sudut
pandang tertentu dalam cahaya yang kuat. Di sengketa serikat guru-versus-administrasi
atas gaji, misalnya, perkiraan yang sangat berbeda dari gaji guru yang khas akan
diperoleh tergantung pada indeks tendensi sentral digunakan. Jika guru yang khas adalah
gaji yang $ 28.000, $ 30.000, $ 30.000, $ 33.000, 3,4,000, $ 37.000, dan $ 78.000,
langkah-langkah dari pusat kecenderungan yang
kedua serikat dan administrasi guru bisa over kasus-kasus mereka, serikat dengan
menggunakan modus dan administrasi dengan menggunakan mean. mode lebih rendah
dari semua gaji kecuali satu, kecuali satu, dan rata-rata lebih tinggi dari setiap gaji
kecuali satu (yang kemungkinan besar adalah gaji guru dengan 30 atau lebih tahun
pengalaman). Jadi, dalam situasi ini indeks paling tepat gaji khas akan median. Ingat,
bagaimanapun bahwa dalam penelitian kami tidak tertarik pada "pembuatan kasus
"melainkan dalam menggambarkan data di paling cara yang akurat; untuk sebagian besar
dataset, rata-rata adalah langkah yang tepat tendensi sentral.
3. UKURAN VARIABILITAS
Meskipun ukuran pemusatan sangat berguna statistik untuk describeing satu set
data, mereka tidak cukup. Dua stes dari nilai siswa yang sangat beragam bisa berarti
identik atau median. misalnya, jika semua siswa mencetak 50%, kelompok mean dan
median akan 50-tetapi jika, dalam kelompok kedua, skor satu siswa 100 dan satu skor 0,
kelompok mean dan median juga 50, dan jelas kelompok yang tidak same.to memahami
situasi seperti ini, kita perlu langkah-langkah variabilitas, indeks bagaimana menyebar
sekelompok nilai adalah. Tiga langkah yang paling sering digunakan adalah rentang,
simpangan kuartil, dan standar deviasi. Meskipun deviasi standar yang paling sering
digunakan, kisaran adalah satu-satunya ukuran yang sesuai kemampuan variabel untuk
data nominal, dan kuartil deviasi adalah indeks yang tepat variabilitas untuk data ordinal.
Rentang ini hanya perbedaan antara nilai tertinggi dan terendah dalam distribusi;
itu dihitung dengan pengurangan. Sebagai contoh, kisaran nilai tes musim gugur
membaca (Baca F) untuk siswa Pacific Crest adalah 5 5.1 polnts. atau dari 18,4 ke 73.S
poin (lihat Tabel 12.1). Seperti mode, kisaran bukan merupakan ukuran sangat stabil, dan
keuntungan utamanya adalah memberikan cepat, perkiraan kasar dari variabilitas sampel
tertentu.
b. KUARTIL DEVIASI
Kuartil deviasi adalah salah satu setengah dari selisih antara kuartil atas dan
kuartil bawah dalam distribusi. Kuartil atas mengacu pada top 25% dari nilai, juga
dikenal sebagai persentil ke-75. Sejalan dengan itu, kuartil bawah adalah persentil 25,
atau terendah 25% dari skor. Pada Pacific Crest, misalnya, jatuh membaca nilai (Baca F
pada Tabel 12.1) di atas 56,8 berada di kuartil atas; skor di bawah 36,4 berada di kuartil
yang lebih rendah. Dengan mengurangi titik cutoff untuk kuartil yang lebih rendah dari
titik cutoff untuk kuartil atas dan kemudian membagi hasilnya dengan dua, kita
mendapatkan ukuran variabilitas.
Jika kuartil penyimpangan kecil, skor busur dekat bersama; jika besar, skor lebih
menyebar. Ini informasi dapat memberitahu kita, misalnya, bagaimana siswa Pacific
Crest lakukan pada tingkat baca. Membandingkan anak laki-laki dan perempuan, kita
melihat anak laki-laki, sebagai kelompok, yang tidak konsisten sebagai gadis-gadis. juga,
kita akan menemukan bahwa deviasi kuartil untuk anak-anak lebih kecil daripada deviasi
boys.The kuartil adalah ukuran lebih stabil dari variabillty dari jangkauan dan tepat
setiap kali median adalah prosedur yang paling sesuai. Perhitungan deviasi kuartil
melibatkan proses yang sangat mirip dengan yang digunakan untuk menghitung rata-rata,
yang merupakan titik cutoff untuk kuartil kedua (50%).
Varians didefinisikan sebagai jumlah menyebarkan antara skor jika varians kecil,
skor yang berdekatan; jika besar, skor lebih menyebar. Perhitungan varians ini cukup
sederhana karena ringkasan statistik menunjukkan, rata-rata, seberapa jauh masing-
masing skor adalah dari mean. Sebagai contoh, misalkan lima siswa Pacific Crest
menerima membaca 'puluhan 35, 25, 30, 40, dan 30. Rerata nilai ini adalah 32 (∑X/n=
160/5). Perbedaan masing-masing siswa skor dari mean adalah sebagai berikut:
35 – 32 = 3
25 - 32 = -7
30 - 32 = -2
40 - 32 = 8
30 - 32 = -2
Ada sedikit varians komputasi sedikit masalah menggunakan skor perbedaan ini,
bagaimanapun, karena jika kita jumlah mereka, kita mendapatkan nol. Menemukan 0 ls
tidak sangat membantu, sehingga cara matematis keluar dari dilema ini ls persegi
perbedaan. Mengkuadratkan dan kemudian menjumlahkan setiap perbedaan
memberikan:
35 – 32 = 3 32 = 9
25 - 32 = -7 -72 = 49
30 – 32 = -2 -22 = 4
40 – 32 = 8 82 = 64
30 – 32 = -2 -22 = 4
Kami kemudian jumlah kuadrat perbedaan dan membagi dengan jumlah skor untuk
menghitung varians:
9 + 49 + 4 + 64 + 4 = 130
= 130/5 = 26
Rumus komputasi untuk varians, kemudian, adalah
∑ (X - X)2/n
d. STANDAR DEVIASI
Standar deviasi adalah akar kuadrat dari varians dari satu set nilai. akar kuadrat
dari varians dalam contoh sebelumnya (26) adalah 5.1, yang merupakan standar deviasi
dari lima skor. standar deviasi, digunakan dengan data interval dan rasio, adalah jauh
indeks yang paling sering digunakan variabilitas. mirip dengan mean, rekan
kecenderungan yang berada di pusat, standar deviasi adalah ukuran paling stabil
variabilitas dan mencakup setiap skor dalam perhitungan.
Sebagai contoh, meninjau data pada Tabel 12.5. tabel menunjukkan bahwa rata-
rata Jatuh Reading Skor (Baca F) untuk anak-anak di Pacific Crest secara keseluruhan
lebih tinggi dari skor untuk anak-anak (48,7 vs 43,9), dan anak-anak standar deviasi
(16,813) jauh lebih tinggi dari gadis itu (12,313). Deviasi standar menunjukkan bahwa
skor anak perempuan lebih dekat bersama-sama (yaitu, berkerumun di sekitar mean)
dibandingkan dengan skor anak itu ada lebih banyak variabilitas di antara anak laki-laki
dari kalangan anak-anak.
e. KURVA NORMAL
Anda telah tidak diragukan lagi mendengar tentang "gradasi pada th Tapi apa
yang "kurva?" Konsep ini berasal dari distribusi normal, di mana terdapat jumlah yang
sama tapi kecil dari A dan F, lebih B dan D dan kemudian banyak C di tengah. Grafik
frekuensi masing-masing hasil kelas dalam kurva berbentuk lonceng, dengan lebih
sedikit nilai pada ekstrem dan paling di tengah (lihat Gambar 12.1). Sebagai contoh lain,
Anda mungkin tahu sangat sedikit, jika ada, adultswho lebih tujuh kaki tinggi. Demikian
juga, Anda mungkin tahu sangat sedikit orang dewasa yang berada di bawah empat kaki.
kebanyakan orang adalah antara lima kaki dan enam kaki. di tengah-tengah distribusi
kurva A berbentuk lonceng dengan orang-orang yang lebih sedikit (atau skor) pada
ekstrem dan lebih banyak orang di tengah dianggap "normal". banyak variabel yang
terdistribusi secara normal, termasuk tinggi, berat, skor IQ, SAT, dan prestasi lainnya
skor.
Misalnya, ry kebetulan memiliki siswa khususnya cerdas dalam satu tahun. Dalam
hal ini, meskipun intelijen m menjadi normal, akan lebih terdistribusi secara normal jika
kita melihat distrik sekolah bole (e. Populasi), studi Bocause berurusan dengan jumlah
peserta, doften bukan angka, penelitian sangat besar Data cfrom smple) hanya dapat
mendekati kurva normal. Untuk ark perbedaan ini, peneliti menggunakan SD untuk
mewakili e standar deviasi dari sampel dan simbol o e, Yunani huruf kecil sigma untuk
tepresent yang stan. deviasi ard penduduk (catatan bahwa Gambar 12.1 ses karena nilai
yang ditampilkan adalah dari bos populasi. Dalam bahasa statistik, o merupakan
parameter pulation, sedangkan SD merupakan statistik berdasarkan cukup.
f. SKEWED DISTRIBUSI
Maka distribusi tidak normal, itu dikatakan kewed, distribusi normal adalah
simetris; grafik adalah kurva berbentuk lonceng dengan mean, median, dan modus semua
sama. ingat bahwa distribusi normal memiliki sekitar jumlah yang sama dari skor ekstrim
pada setiap akhir distribusi. distribusi miring, namun tidak simetris; nilai-nilai mean,
median dan modus yang berbeda, dan ada nilai lebih ekstrim pada satu dan dari yang
lain. Sebuah distribusi negatif miring memiliki skor ekstrim di ujung bawah dari
distribusi, dan distribusi miring positif memiliki skor ekstrim di akhir lebih tinggi,
Angka 12.2 memberikan dua contoh dari distribusi miring dari tes 100-item.
distribusi negatif miring di sebelah kiri menunjukkan kasus di mana sebagian besar
peserta melakukannya dengan baik tapi beberapa tidak skor sangat buruk-rendah berada
di sebelah kiri dari distribusi dan skor yang lebih tinggi di sebelah kanan atas rata-rata.
sebaliknya, distribusi kedua di angka 12.2 adalah positif miring: sebagian besar peserta
melakukan buruk, tetapi beberapa melakukannya dengan sangat baik. dalam kedua kasus
mean "ditarik" ke arah nilai ekstrim.
Dalam distribusi miring, rata-rata selalu lebih dekat nilai ekstrim daripada median
karena mean dipengaruhi oleh nilai ekstrim bertindak seperti magnet dan menarik mean
ke arah mereka. Dengan demikian, untuk distribusi negative miring, mean (X) selalu
lebih rendah, atau lebih kecil dari median (md), untuk distribusi miring positif berarti
selalu lebih tinggi atau lebih besar dari modus median, tidak terpengaruh oleh nilai
extreme. Misalnya, pertimbangan usia dimana perempuan memiliki wanita bayi. Mereka
banyak melahirkan ketika mereka muda (dibawah 30), distribusi usia ibu saat melahirkan
adalah popsitif miring dan usia rata-rata lebih besar dari median atau modus untuk semua
wanita.
Untuk ringkasan:
Negative skewed: mean < median < mode
Positively skewed: mean > median > mode
Selain itu, jauh terpisah mean dan median, semakin miring distribusi, mengetahui jika
distribusi miring penting karena pengetahuan ini membantu kita memilih statistic lain
untuk menganalisa data. Jika distribusi sangat miring, maka sumsi noramlitas diperlukan
untuk banyak statistic (lihat bab 13) dilanggar. Untuk distribusi miring, peneliti
seringmnggunakan analisis dirancang untuk data nominal atau ordinal, bukan rasio atau
data interval.
Distribusi dengan kata lain, langkah-langkah dari posisi relative menunjukkan seberapa
baik seorang individu telah dilakukan dibandingkan dengan semua individu lain dalam
Sampel yang telah diukur dalam variable yang sama. Dalam bab 6 topik topic ini
ditujukan sebagai norma diferensikan mencetak hasil.
Keuntungan utama dari langkah-langkah dari posisi relative bahwa mereka
memungkinkan untuk membandingkan kinerja individu pada dua atau lebih tes yang
berbeda. Sengai contoh. Jika skor jatuh membaca justin di pacific crest adalah 40 dan
skor matematikanya adalah 35, itu otomatis bahwa ia melakukan yang lebuh baik dalam
mebaca. Skor dari 40 mungkin skor yang terendah pada test membaca dan nilai 35
tertinggi pada tes matematika. Langkah-langkah dari posisi relative mengungkapkan nilai
yang berbeda pada skala umum. Dua langkah yang paling sering digunakan dari posisi
relative yang peringkat persentil dan skor standar.
b. STANDAR SKOR
Perhitungan yang mengekspresikan nilai tes siswa n individu adalah dari unit
deviasi standar tn kata lain, skor mencerminkan berapa banyak standar deviatioa atau di
bawah rata-rata atau rasio n'ost umum repong digunakan nilai standar arcz scorcs Tscore
yang ditunjukkan pada Gambar 12.
Skor Standard memungkinkan skor dari yang berbeda untuk dibandingkan pada
skala umum dan th operasi matematika yang valid untuk melakukan. Misalnya, scorcs
membaca di Pacific Crest dan langsung dibandingkan dengan nilai matematika karena
berdasarkan diffcrent skala 40 pada dikalangan de berarti sama sebagai dalam
matematika. Namun, dengan uji untuk nilai kita bisa averageu dan tiba di indikator rata-
rata performan sebanding di tes.
Jika seperangkat skor baku, seperti tes siswa terdistribusi normal, maka begitu
juga setara standar, sama kurva normal cquivaler akurat 12.1 untuk standard scores
hanya jika distribusi adalah skor yang normal dapat diubah secara matematis untuk inare
bahwa distribusi skor standar akan maupun Selanjutnya, nilai standar dapat dibandingkan
hanya jika untuk skor yang diperoleh didasarkan pada skor mentah tersebut yang
kelompok yang sama. Misalnya, meskipun kedua Appar memiliki skor az dari 2,0
(seperti yang dibahas dalam tion Ctr), sebuah CEEB (Masuk Perguruan Tinggi skor
Pemeriksaan Dewan 7oo tidak setara dengan Wechsler IQ dari 130 Dol karena tes
bernorma pada kelompok-kelompok yang berbeda z skor. skor Az adalah yang paling
dasar dan paling ton standar skor z skor mengungkapkan skor langsung howfat adalah
dari mean dalam hal ofstandard unit devation blok. Sebuah skor yang setara dengan
sponds berarti corre cetak ulang untuk skor.
Az 0. A skor yang tepat sekali Cote standar deviasi di atas rata-rata sesuai sampai
17 skor stnc 1,00, dan nilai az of-1.00 adalah salah satu standiro atau penyimpangan
bawah rata-rata. Dua deviasi standar di atas rata-rata adalah skor az dari
+ 2.oo.and sehingga forh untuk T Sc membuat perhitungan tertentu skor az, kita
menggunakan d berikut rumus untuk mengkonversi skor mentah untuk 2 z sogre Score
ttansi mana X adalah skor.
Dari gambar 12,1 menunjukkan, jika satu set nilai adalah dibentuk menjadi skor
set, distribusi baru memiliki deviasi standar.
Keuntungan utama dari 2 skor adalah mereka memungkinkan skor dari tes yang
berbeda atau subyek yang akan dibandingkan seluruh individu. Misalnya, perhatikan
ringkasan dari nilai tes justin pada table 12.7 juga disebut skor mentah dikonversi ke
nilai z dan setara persentil.
Kita dapat menggunakan Gambar 12.1 untuk memperkirakan inequivalents untuk
skor givenz, tetapi hanya jika seluruh nomor scores2re atau jatuh rapi di skor scale.
Estimating yang jatuh antara nilai yang diberikan dalam angka lebih sulit. Sebuah
pendekatan yang lebih tepat, oleh karena itu, adalah dengan menggunakan Tabel A-3
pada Lampiran A Untuk setiap z antara-3,00 dan 3,00, kolom berlabel Lokasi proporsi
cascs yang disertakan sampai saat itu. Dengan kata lain, untuk setiap nilai 2, daerah
dibuat di sebelah kiri garis pada kurva merupakan proporsi kasus yang jatuh di bawah
skor z. Dengan demikian, untuk z.00 (nilai rata-rata), kita membaca menuruni colununs
sampai kita datang to.00.The daerah 5000 yang sesuai, yang mewakili 50% dari kasus
dan 50 per icentile.To menentukan daerah di bawah kurva atau per -. sentil untuk
Justin'szscore dari 1,0 kita hanya membaca bawah ther kolom sampai kita datang ke 1.00
c, skor z nya membaca sesuai arca di bawah kurva adalah 813. dengan mengalikan oleh
100, kami sec bahwa Justin membaca. skor sesuai dengan sekitar sentil per- 84 (yang
adalah apa yang kami temukan Carlier ketika kita eimated persentil dari Gambar 12.1)
Begitu pula, untuk skor membaca Dolores untuk z + 2,00, kita menemukan daerah di
bawah is.9772 kurva atau 97. 72% apa yang kami temukan sebelumnya The oMableA.3
manfaat isthat memungkinkan kita untuk membuat estimasi dari lebih tepat 2 skor.
Seperti Gambar 12.1 menunjukkan, nilai z adalah blok bangunan untuk sejumlah
nilai standar lainnya, yang merupakan transformasi dari z skor yang komunikasi- makan
informasi yang sama dalam bentuk andable lebih umum di bawah dengan
menghilangkan negatif, desimal, Tscores.
a. THE PEARSON R
Koefisien Pearson r korelasi adalah yang paling ap propriate ukuran ketika
variabel menjadi corrc lated dinyatakan sebagai salah interval atau rasio data yang Mirip
dengan mean dan standar deviasi, yang pearson r memperhitungkan setiap orang di
ributions juga paling stabil mengukur hubungan. Dalam penelitian pendidikan, paling
ukuran mewakili skala interval Pearson r adalah koefisien yang paling sering digunakan
untuk pengujian untuk hubungan.
Asumsi yang terkait dengan penerapan pearson r adalah bahwa ppl variabel
adalah hubungan antara variabel adalah salah satu linear. Jika hubungan tidak linier,
pearson r tidak akan lapangan indikasi yang valid dari relasi. Meskipun rumus komputasi
yang kompleks pada pandangan pertama, Pearson beberapa r adalah basicallo
perhitungan matematis yang menganggap hubungan ative uji cach orang, atau
occunu Kc.gx adalah skor seseorang untuk tes pertama, Andari skor orang itu untuk tes
sccond ).
Jika Anda melihat dekat pada rumus Pearson rauu akan melihat bahwa Anda
sudah berada famili dengan semua potongan ar formula kecuali satu, exy, yang bol untuk
penjumlahan produk skor Xandy setiap orang (tes pertama ega siswa skor multipli co
skor kedua siswa), Jelas, jika kita dataset, mul plying besar dan menjumlahkan setiap
band score6i cukup membosankan. Untungnya, computeE Rives pada nilai yang sama
dalam waktu lebih.
Untuk contoh konkret, kita kembali ke anaia kami hasil di kelas tiga Mrs. Alvarez
clzi Pacific Crest Dasar. Pertama, kita ingin mencari thc3 sociation atau korelasi antara
Kejatuhan Membaca skor Kejatuhan Matematika untuk siswa kita harapkan dari
pengalaman bahwa Membaca skor dan Mathscores wgul kemungkinan akan berkorelasi;
yaitu, siswa yang mendapat skor membaca wdt0 juga akan melakukannya dengan baik
pada matematika dan sebaliknya. Komputasi korelasi menggunakan SPSS adalah rchtho
sederhana Kami memilih opsi berikut, seperti illustratoo dalam Lampiran B, Gambar
B.12.5:
Analyze
Correlate
Bi-Variate
Setelah memilih opsi SPSS yang sesuai, kemudian pilih variable yang kita ingin
analisa. SPSS kemudian output ditampilkan ih Toble 12,8 ini display output pertama
CCL matriks menunjukkan koefisien korelasi sendiri ReadEThis ne fect orrelation (1),
tentu saja, seperti meja shows.If membaca seluruh matriks ke sel kedua, cakrawala. ully,
kita menemukan korelasi antara ReadF dan MathF 618 dengan tingkat
signifikansi of.001.The sel ketiga memberikan korelasi yang sama antara MathF dan
MathF oleh MathF 1, terdaftar pertama Sel terakhir adalah melawan dirinya sendiri, yang
merupakan korelasi fect sempurna tentu saja korelasi dua sel yang menunjukkan per- i G,
e pertama dan keempat disebut diagonal dari matrix.The dua sel lain dalam matriks
disebut sel off-diagonal. Karena hanya ada dua variabel dalam analisis ini. kedua kotak
offdiagonal menunjukkan koefisien korelasi yang sama Meskipun kita hanya perlu satu
nilai koefisien (618), SPSS mencetak informasi lengkap untuk semua sel. Setelah semua
informasi ini dalam matriks menjadi lebih impor. tant ketika kita berhubungan lebih dari
dua variabel dan matriks tumbuh 3 x 3, 4 x 4, atau lebih besar. Dalam dataset besar kita
sering menghitung korelasi untuk semua variabel rasio dalam persiapan untuk melakukan
beberapa re gression, seperti yang kita jelaskan di Bab 13.
Bagaimana kita menafsirkan temuan ini dari koefisien korelasi r 618 dengan nilai
signifikansi 001? Apakah ini baik? Apakah itu mewakili hubungan yang benar? Apakah
koefisien korelasi ini secara signifikan berbeda from.00? Jika Anda ingat diskusi terkait
dalam Bab 8, Anda tahu bahwa koefisien korelasi of.618 Bly proba- menunjukkan
hubungan yang kuat antara variabel. Selain itu, bahkan dengan ukuran sampel kecil kami
25 r.618 signifikan at.001.In kata lain, lihood seperti-menemukan korelasi ini besar,
hanya dengan (gambar) di pembuatan jalan dan matematika itu akan menjadi penting
bagi kami pada akhir tahun THC untuk menguji korelasi lagi: yaitu, untuk melihat wheth
membaca dan matematika skor yang er dudents 'telah meningkat pada tingkat yang sama.
Kasus menggunakan SPSS untuk menentukan korelasi indlevel dari significancc
cukup jelas, tapi ingat jika kita sedang membuat perhitungan ini dengan tangan, suka itu
daripada menggunakan SPSS atau software statistik lainnya, kita harus tiba di Pearson r
sama of.618. SPSS mengikuti prosedur mic Anda akan untuk menghitung Pcarson r,
menyimpulkan produk dari skor X dan Y mengurangkan jumlah x kali dari Y,
membaginya dengan N di pembilang, dan kemudian membaginya dengan com
perhitungan rumit dalam denominator.Once Pearson r ditentukan, SPSS menghitung
signifikansi r ini didasarkan pada ukuran sampel dan derajat kebebasan (yang kita bahas
secara singkat dalam Bab 8 dan membahas secara lebih rinci dalam Bab 13) dan
mencetak persis tingkat signifikansi bagi mereka parameter, temuan kami dari of.001
tingkat signifikansi pada tabel 12.8 meyakinkan kita korelasi yang kami temukan adalah
tidak sangat mungkin karena kebetulan
Sedangkan SPSS menentukan tingkat cance signifi otomatis, ketika melakukan
analisis korelasi dengan tangan kita harus berkonsultasi meja koefisien korelasi, dengan
mempertimbangkan jumlah siswa atau peserta pengaruh jumlah tudents pada tingkat
signifikansi dilakukan melalui pertimbangan derajat kebebasan, sebagaimana tercantum
dalam Tabel A.2 di Lampiran A. Untuk derajat Pearson r kebebasan selalu dihitung
dengan rumus n-2 dengan n mewakili jumlah peserta untuk siapa kita telah dipasangkan
Data Ge, X dan n. Jadi, misalnya kita dengan Pacific Crest, derajat kebebasan (dD-N-2
25 2 23 Dengan tingkat signifikansi ditetapkan at.05 kita membaca menuruni labeled.05
kolom pada Tabel A.2 untuk garis yang sesuai dengan df nilai 20 dan 25 Ge., di kolom
pertama) nilai p pada Tabel A.2 adalah koefisien korelasi populasi th e digunakan
sebagai patokan untuk perbandingan dengan ple koefisien korelasi sam kami Meskipun
drvalue kami jatuh antara 20 dan 25, kita menemukan bahwa r Pearson kami 618 adalah
signifikan ifaf 25,3809) ordf 20 (p ex kami Perhatikan juga bahwa ifour Pearson r negatif
di A.2 di cukup (r 618) kita masih akan berkonsultasi Tabel dengan cara yang sama
karena arah relasi positif atau negatif) tidak mempengaruhi tingkat.
Spearman rho adalah di antara yang paling populer Ketika menggunakan rho
Spear manusia, kedua variabel berkorelasi harus peringkat. Sebagai contoh, jika intelijen
itu harus berkorelasi dengan peringkat kelas atau status cconomic, skor telligence di-
siswa harus diterjemahkan ke dalam jajaran Cc.g., rendah, sedang, tinggi), Spearman rho
memiliki kelemahan, namun , ketika lebih dari satu re individu ceives skor yang sama
ada dasi di ranking.In kasus ini sesuai jajaran dirata-ratakan. Misalnya, dua peserta
dengan skor tertinggi yang sama masing-masing akan ditugaskan Ranking 1,5, rata-rata
Rank dan Golongan 2. berikutnya skor tertinggi akan menjadi seperti menandatangani
Ranking 3. Demikian pula, tanggal 24 dan 25 nilai tertinggi, jika identik, masing-masing
akan ditugaskan peringkat 24,5. Seperti kebanyakan koefisien korelasi lain, Spearman
rho menghasilkan koefisien suatu tempat tween-1.000 dan + 1.00.If, misalnya, kelompok
ticipants nominal dicapai jajaran identik pada kedua koefisien variables.the akan 1,00.
b. DATA GRAFIK
Sebuah manfaat yang berbeda dari paket perangkat lunak kal statisti adalah
bahwa mereka menyediakan berbagai cara untuk menyajikan data dalam bentuk grafik.
Misalnya, Excel dan menyebar serupa. program lembar menawarkan cara yang sangat
mudah untuk membuat grafik data dengan diagram lingkaran yang umum digunakan dan
grafik garis. Karena bentuk distribusi tidak dapat Sel jelas, terutama jika sejumlah besar
skor yang terlibat, itu selalu membantu ful untuk memberikan representasi grafis dari
data, dan dalam beberapa kasus (misalnya, hubungan lengkung antara variabel bentuk
distribusi dapat mempengaruhi pilihan peneliti dari data statistik. 319 menampilkan
grafis data berkisar dari grafik simp ke yang lebih kompleks poligon frekuensi thu du
bermain tho bentuk data seperti dalam distributou.t bell kurva berbentuk normal. Gambar
menunjukkan simplcbak dibuat dalam Excel untuk distribusi Pacific Cres penyok, yang
diselenggarakan oleh gender dan lev ekonomi grafik Li diciptakan pertama dengan
membuat tabel pivot penjelasan, sosok B.12.3 di Appendu kemudian memilih Chart
Wizard. Gender pada mereka (tingkat vertikal dan ekonomi ic adalah pada horisontal X
Sebagai menunjukkan grafik, enam anak laki-laki di th tingkat ekonomi, empat anak
laki-laki berada di lev menengah sebagainya. Namun, perlu diketahui bahwa perangkap
thrcc dimensi memberikan yang efektif ilustrasi data untuk penonton yang tidak selalu
mudah untuk mengidentifikasi dari yang sebenarnya nilai poros meja islach hem. Jika
presisi adalah tujuan, maka pilihan lebih untuk menampilkan data.