Edisi Kesatu
Cetakan pertama, Agustus 2015
Cetakan kedua, Mei 2016
370.21
WAH WAHYUDIN
m Materi pokok statistika pendidikan; 1 – 9/ MPDR5202/ 3 sks/
Wahyudin, Jarnawi Afgani Dahlan; -- Cet.2; Ed.1 --. Tangerang
Selatan: Universitas Terbuka, 2016.
575 hal; ill.; 21 cm
ISBN: 978-602-392-005-1
1. statistika pendidikan
I. Judul II. Dahlan, Jarnawi Afgani
iii
Daftar Isi
Kegiatan Belajar 2:
Pengamatan ........................................................................................ 1.16
Latihan ................................................................................................ 1.22
Rangkuman ......................................................................................... 1.23
Tes Formatif 2 .................................................................................... 1.23
Kegiatan Belajar 3:
Konsep Dasar Matematika Pendukung .............................................. 1.25
Latihan ................................................................................................ 1.31
Rangkuman ......................................................................................... 1.32
Tes Formatif 3 .................................................................................... 1.33
Kegiatan Belajar 2:
Populasi dan Sampel .......................................................................... 2.43
Latihan ................................................................................................ 2.50
iv
Kegiatan Belajar 2:
Korelasi dan Regresi .......................................................................... 3.40
Latihan ................................................................................................ 3.64
Rangkuman ......................................................................................... 3.67
Tes Formatif 2 .................................................................................... 3.68
Kegiatan Belajar 2:
Skor-skor Baku dan Kurva Normal .................................................... 4.13
Latihan ................................................................................................ 4.22
Rangkuman ......................................................................................... 4.23
Tes Formatif 2 .................................................................................... 4.23
v
Kegiatan Belajar 2:
Distribusi Mean Penyampelan Acak .................................................. 5.11
Latihan ................................................................................................ 5.24
Rangkuman ......................................................................................... 5.26
Tes Formatif 2 .................................................................................... 5.26
Kegiatan Belajar 2:
Uji Hipotesis Dobel Mean (Kasus Dua-Sampel) ............................... 6.32
Rangkuman ......................................................................................... 6.37
Tes Formatif 2 .................................................................................... 6.38
Kegiatan Belajar 2:
Anova Dua Arah ................................................................................. 7.34
Latihan ................................................................................................ 7.48
Rangkuman ......................................................................................... 7.51
Tes Formatif 2 .................................................................................... 7.52
Kegiatan Belajar 3:
Analisis Kovarians ............................................................................. 7.55
Latihan ................................................................................................ 7.68
Rangkuman ......................................................................................... 7.69
Tes Formatif 3 .................................................................................... 7.69
Kegiatan Belajar 2:
Analisis Regresi .................................................................................. 8.34
Latihan ................................................................................................ 8.76
Rangkuman ......................................................................................... 8.79
Tes Formatif 2 .................................................................................... 8.80
Kegiatan Belajar 2:
Struktural Equation Model ................................................................. 9.39
Latihan ................................................................................................ 9.86
Rangkuman ......................................................................................... 9.92
Tes Formatif 2 .................................................................................... 9.92
Peta Kompetensi
MPDR5202 Statistika Pendidikan/3 sks
Modul 1
Pengantar Statistika
Dr. Jarnawi Afgani Dahlan
PEN D AH U LU A N
A. DESKRIPSI SINGKAT
B. RELEVANSI
Kegiatan Belajar 1
A. DEFINISI STATISTIKA
Menurut Steel & Torrie (1995) statistika merupakan subjek yang sedang
tumbuh cepat, sehingga banyak hasil penemuan dalam bidang statistika yang
belum ada dalam buku-buku teks. Statistika tumbuh sebagai jawaban
statistikawan terhadap persoalan-persoalan yang diajukan oleh para peneliti.
Namun demikian, para pelopor dalam statistika juga masih banyak yang
berperan aktif dalam menyumbangkan karya-karyanya.
Kebutuhan akan statistika terasa di berbagai bidang. Baik secara praktis
dan sederhana sampai dengan yang sangat kompleks. Secara sederhana
statistika banyak digunakan dalam evaluasi kegiatan yang menggunakan
data. Sebagai contoh dalam bidang pendidikan, sekolah ingin mengetahui
perkembangan kualitas pendidikan yang dilihat dari mutu lulusan dari hasil
ujian, statistika membantu para pegiat lingkungan mengkaji tentang dampak
lingkungan, membantu pemerintah dalam menentukan suatu kebijakan, dan
lain sebagainya. Untuk kebutuhan itu, maka semakin banyak penelitian yang
melibatkan statistikawan.
Luasnya ruang lingkup statistika membuatnya sulit untuk didefinisikan.
Statistika dikembangkan untuk mengatasi persoalan-persoalan yang
diselesaikan melalui pengamatan-pengamatan individu, sehingga hukum
sebab akibatnya tidak jelas dan oleh karena itu diperlukan pendekatan yang
objektif. Dalam persoalan yang demikian tentu saja ada unsur-unsur
ketidakpastian mengenai penarikan yang hanya didasarkan pada sejumlah
pengamatan secara terbatas. Untuk tujuan itu, Steel &Torrie (1995)
mendefinisikan statistika sebagai ilmu pengetahuan, murni dan terapan,
mengenai penciptaan, pengembangan, dan penerapan teknik-teknik
sedemikian rupa sehingga ketidakpastian inferensia induktif dapat dievaluasi
(diperhitungkan).Lebih lanjut Steel & Torrie mengatakan bahwa sebagian
ilmuwan memberikan definisi statistika sebagai logika atau akal sehat
(commonsense) yang disertai dengan prosedur-prosedur aritmetika. Logika
memberikan metode yang selanjutnya dipakai untuk mengumpulkan dan
menentukan data yang diperlukan. Sedangkan aritmetika, bersama-sama
dengan tabel tertentu, menghasilkan sesuatu yang dipakai sebagai dasar
1.4 Statistika Pendidikan
C. MEMPELAJARI STATISTIKA
belajar”. Kita simpulkan dari petunjuk kuat atau bukti bahwa nilai t hitung
lebih besar dari ttabel dengan tingkat signifikansi yang dipilih. Atau kita
punya bukti kuat hubungan antara dua variabel dengan bukti adanya
r = 0,87 (misalnya). Lebih jauh Kerlingger memberikan dua ciri dari
statistika inferensi, yakni pertama inferensi dibuat dari sampel ke/untuk
populasi. Ketika kita berkata bahwa variabel A berelasi dengan variabel
B karena bukti statistikanya ialah r = 0,87, kita membuat inferensi bahwa
karena dalam sampel ini r = 0,87, maka r = 0,87 (atau mendekati 0,87)
terjadi juga dalam populasi di mana sampel tersebut diambil. Artinya
kita melakukan inferensi dengan memperhatikan populasinya. Jenis
inferensi kedua digunakan apabila peneliti tidak menaruh perhatian pada
populasinya, atau bila perhatian hanya bersifat sekunder. Misalnya
peneliti dalam bidang pendidikan tengah mengkaji akibat yang diduga
timbul dari relasi antara anggota-anggota dinas pendidikan dan pimpinan
administrasi pendidikan di satu pihak, dengan motivasi dan semangat
guru di pihak lain. Hipotesis penelitiannya adalah jika hubungan antara
anggota-anggota dinas pendidikan dan pimpinan administrasi pendidikan
itu kurang baik, maka semangat dan motivasi guru akan rendah. Peneliti
hanya berminat atau berkepentingan untuk menguji hipotesis tersebut
dalam wilayah X. Kajian yang dilakukannya memperoleh hasil statistika
yang mendukung hipotesis penelitiannya. Namun demikian, misalnya,
jika moral guru lebih rendah dalam sistem A daripada dalam sistem B
dan sistem C. Dia menginferensi dari petunjuk statistika mengenai
perbedaan antara sistem A di satu pihak dengan sistem B dan C di pihak
lain, bahwa proporsi hipotesis tersebut betul (di wilayah X). Tetapi
terbuka kemungkinan bahwa minat dan pembahasannya hanya terbatas
pada wilayah X itu saja.
LAT IH A N
R A NG KU M AN
TES F OR M AT IF 1
Kegiatan Belajar 2
Pengamatan
sesungguhnya terjadi pada objek dengan data yang dapat dilaporkan oleh
peneliti. Misalnya ketika guru menghitung tingkat ekonomi orang tua siswa
di suatu sekolah. Jika terdapat 100 orang siswa dengan orang tuanya masuk
dalam kategori ekonomi miskin, maka dilaporkan juga 100 orang, tidak
ditambah atau dikurangi. Jika dilakukan penambahan atau pengurangan,
maka datanya menjadi invalid atau tidak valid. Lainnya misalkan capaian
hasil ulangan siswa. Jika siswa A mendapat hasil tes 50 dilaporkan 50, dan
jika siswa mendapat skor 100 juga dilaporkan 100. Artinya tidak ditambah
dan dikurangi. Reliabel berkaitan dengan derajat keajegan atau konsistensi,
yaitu konsisten dalam interval waktu tertentu. Misalnya, jika data yang
terkumpul dari sumber data kemarin jumlahnya 100 siswa dengan ekonomi
orang tuanya miskin, maka sekarang atau besok juga tetap menyatakan 100
orang. Sedangkan objektif berkaitan dengan derajat persamaan pandangan
atau persepsi antar orang. Jika satu guru telah mendata banyak siswa dari
orang tua miskin ada 100 orang, maka guru lainnya pun memperoleh hasil
yang sama.
Berikutnya akan dibahas lebih rinci tentang data, yang dimulai dengan
peubah dan jenis-jenisnya.
Pada contoh pertama di atas, kita punya data “Tinggi Ahmad 165 cm”,
jika kita mengukur tinggi badan yang lainnya, misal Andi, maka Andi akan
mempunyai ukuran tinggi juga, dengan kemungkinan ukurannya sama
dengan Ahmad, dapat juga berbeda, tetapi yang jelas Andi mempunyai
ukuran tinggi badan tertentu. Demikian juga untuk “Mira berambut hitam”,
jika kita amati lagi nama lainnya, misalnya Ani, mungkin rambutnya hitam,
pirang, dan lain sebagainya. Untuk itulah tinggi badan, jenis rambut, berat
karung beras, dan hasil ulangan mempunyai ciri sama yakni keragaman. Ciri
yang menunjukkan keragaman disebut peubah atau variabel acak. Dalam
beberapa buku, peubah acak sering kali dilambangkan dengan X atau Y.
Misalkan pengamatan kita tetapkan lambang X sebagai peubah acak,
dan Xi menyatakan pengamatan ke-i. Jika pada suatu saat kita melakukan
pengamatan khusus, kita ganti i dengan bilangan tertentu. Misalkan dalam
suatu kelompok yang terdiri dari 5 siswa mempunyai hasil ulangan akhir
semester mata pelajaran matematika masing-masing 45, 75, 80, 70, dan 75.
Jika X menyatakan hasil ulangan, maka X1 45, X 2 75, X 3 80, X 4 70,
dan X 5 75. Secara umum, jika kita mempunyai segugus n pengamatan
dapat dinyatakan dengan X1 , X 2 , , X n . Dalam hal ini, X n merupakan
pengamatan terakhir, indeks atau subskrip n menyatakan banyaknya
pengamatan seluruhnya, sedangkan tiga titik antara X 2 dan X n menyatakan
pengamatan lainnya, bila ada.
Secara umum terdapat dua jenis peubah acak, yakni kuantitatif dan
kualitatif. Peubah acak kuantitatif merupakan peubah hasil pengukuran yang
mempunyai sifat urutan secara alami. Misalnya tinggi badan, berat badan,
hasil ulangan siswa, kecemasan belajar, motivasi belajar, dan lain
sebagainya. Hasil pengamatan dari peubah kuantitatif ini dapat
dikelompokkan atas kontinu dan diskrit.
Variabel kontinu adalah variabel yang pada suatu selang tertentu dapat
mengambil sebarang nilai. Tinggi dan berat badan merupakan contoh yang
dipahami oleh kita, bahwa tinggi badan dapat diukur sampai dengan 1/10 kg,
MPDR5202/MODUL 1 1.19
dan bahkan mungkin sudah ada yang sampai 1/100, 1/1000 satuan terdekat,
bergantung alat ukurnya. Dengan demikian, pengukuran dalam peubah
kontinu bergantung dari alat ukur yang digunakan.
Variabel acak diskrit merupakan peubah yang mungkin mempunyai
batas pemisah antara nilai-nilainya. Jika variabel kontinu berupa bilangan riil,
maka peubah diskrit berupa bilangan bulat, bahkan sebagian besar dalam
bilangan cacah, karena dihasilkan dari mencacah. Misalnya, banyaknya
rumah dalam tiap RT di suatu kelurahan, banyaknya siswa yang memperoleh
beasiswa di setiap sekolah dasar di suatu kecamatan, banyaknya bayi lahir di
setiap kelurahan. Dalam data diskrit ini, jarak antara dua nilai berurutan tidak
harus sama dengan satu. Misalkan rata-rata banyak titik yang muncul dari
dua dadu yang diundi. Nilai yang mungkin berkisar dari 1 sampai 6 dengan
kenaikan sebesar setengah.
Variabel kualitatif adalah variabel yang tidak memungkinkan dilakukan
pengukuran secara numerik. Pengamatannya dilakukan dengan cara
memasukkan suatu individu (objek) yang diamati ke dalam satu dari
beberapa kategori yang saling terpisah. Pengamatan-pengamatan tersebut
tidak dapat diurutkan, hanya diklasifikasi dan kemudian dicacah. Misalnya
warna mata penduduk di suatu daerah tertentu. Kajian lebih rinci dari skala
pengukuran variabel kuantitatif dan kualitatif dibahas pada pasal-pasal
berikutnya dalam Kegiatan Belajar 2 ini.
Bagaimana jika sesuatu yang ditetapkan dalam penelitian kita tidak
mempunyai keragaman. Misalnya dalam penelitian tentang situasi sekolah
kebidanan berdasarkan gender (jenis kelamin), pastilah semua siswanya
berjenis kelamin perempuan. Apabila kita meneliti jenis kelamin di sekolah
kebidanan, maka tidak akan ada keragaman. Dengan demikian, jenis kelamin
tersebut bukan peubah, tetapi konstanta.
B. SKALA PENGUKURAN
berat badan anaknya. Juga selisihnya akan sama antara dua orang yang
beratnya 35kg dengan 45kg, dengan dua orang yang beratnya 65 kg dengan
75kg, yakni 10 kg. Berbeda dengan nilai mahasiswa dalam skala 5, yakni A =
5, B = 4, C = 3, D = 1, dan E = 0. Antara seorang mahasiswa yang
memperoleh nilai A pada mata kuliah statistika, dengan mahasiswa lainnya
mendapat nilai C, tidak berarti bahwa kemampuan mahasiswa yang
memperoleh C itu setengah dari kemampuan mahasiswa yang memperoleh
A. Untuk membantu memperjelasnya, seorang ahli psikologi S. S. Stevens
tahun 1946 telah mengidentifikasi dan mengklasifikasi hasil pengukuran
dalam empat skala pengukuran yang berbeda, yakni skala nominal, ordinal,
interval, dan rasio. Perlu ditekankan juga untuk diketahui bahwa skala
pengukuran dari hasil pengamatan kita akan memberi dampak pada
pemilihan teknik statistika yang digunakan dalam mengolahnya. Oleh karena
itu, Anda diharapkan dapat memahaminya dengan baik.
1. Skala Nominal
Misalkan kita melakukan pengamatan terhadap siswa kita berdasarkan
jenis kelamin (gender), suku, dan agama. Kategori-kategori tersebut termasuk
dalam variabel kualitatif atau kategorial. Beberapa kategori dari suatu
variabel sebagaimana contoh tersebut dinamakan skala nominal (yang berasal
dari kata name).
Dalam skala nominal, kategori-kategorinya harus saling lepas (mutallly
exlusive) dan lengkap (exhaustive). Mutually exlusive maksudnya satu
pengamatan tidak akan jatuh pada lebih dari satu kategori, sedangkan
mutually exhaustive dimaksudkan bahwa pengakategorian dipandang cukup
untuk semua kemungkinan dari hasil pengamatan. Sebagai contoh,
pengamatan jenis kelamin siswa, setiap siswa hanya mempunyai satu jenis
kelamin, laki-laki saja atau perempuan saja, sehingga pengkategorian jenis
kelamin saling lepas. Kemudian, tidak mungkin ada anak yang tidak termuat
dalam jenis kelamin (laki-laki atau perempuan), dengan demikian
pengkategorian telah cukup lengkap mengakomodir semua kemungkinan dari
objek yang diamati. Lain lagi jika kita melakukan pengamatan dengan
pabrikan mobil dengan kategori Astra motor, Honda, Suzuki, Toyota.
2. Skala Ordinal
Data dengan skala ordinal memiliki kualitas yang sama dengan skala
nominal, tetapi lebih maju dalam kategorinya yakni dapat diberi peringkat
MPDR5202/MODUL 1 1.21
(ranked) atau diberi urutan (ordered) dari tingkat yang tinggi ke rendah atau
sebaliknya. Contohnya dalam tingkat kelas, apakah seorang siswa SD kelas I,
kelas II, kelas III, Kelas IV, kelas V atau kelas VI. Siswa kelas I tentu lebih
rendah dari siswa kelas II, dan seterusnya. Dengan demikian, seseorang tidak
hanya dapat digolongkan dalam satu dan hanya satu kategori, tetapi juga
dapat mengurutkan kategori-kategori tersebut.
Perlu Anda ketahui bahwa dalam skala ini tidak ada titik nol yang
sebenarnya atau sejati, yang artinya tidak dapat dikatakan bahwa siswa kelas
III merupakan tiga kali lebih tinggi dari siswa kelas I. Kita hanya dapat
mengatakan bahwa siswa kelas III lebih tinggi daripada siswa kelas I.
Beberapa contoh lain dari skala ordinal di antaranya kelas sosial di
masyarakat, angket dengan pengukuran yang dimulai dari “sangat tidak
setuju ke sangat setuju” atau sebaliknya.
3. Skala Interval
Skala pengukuran interval lebih maju dibandingkan dengan ordinal,
yakni jarak (interval) yang pasti antar kategori-kategori diketahui. Skala ini
sering juga disebut dengan skala equal-interval. Sebagai contoh dalam
pengukuran suhu udara dikenal beberapa jenis, yakni Celcius, Fahrenheit,
Reamur, dan Kelvin. Peningkatan suhu udara dari 00 ke 100celcius, sama
dengan peningkatan dari 200 ke 300Celcius, yakni meningkat 100Celcius.
Ukuran yang membatasi pengukuran suhu udara adalah tidak adanya batasan
bermakna yang berkaitan dengan perbandingan antara dua pengukuran.
Misalkan diberikan hasil pengukuran dalam derajat Celcius: 0 0 , 500, dan
1000. Cobalah Anda bayangkan apakah 1000 C dua kali lebih panas daripada
500 C? bagaimanapun nilai nol derajat dalam skala ini adalah bentuk
sederhana sebagai referensi bagi titik beku air dan tidak berakibat bahwa
tidak ada panas (heat). Untuk itulah, tidak bisa dimaknai bahwa temperatur
pada 1000 C dua kali lebih panas daripada 500C atau kenaikan suhu dari 900 C
menjadi 990C adalah 10%.
4. Skala Rasio
Skala pengukuran rasio memuat semua sifat-sifat pada skala interval dan
mempunyai tambahan yakni “ada nilai nol mutlak”. Di atas telah diketahui
bahwa pengukuran suhu dalam derajat celcius tidak punya sifat
kesebandingan dan nilai nol mutlak. Pengukuran suhu lainnya adalah derajat
Kelvin. Pengukuran dalam derajat Kelvin mempunyai nol mutlak, titik yang
1.22 Statistika Pendidikan
menentukan keberadaannya adalah suatu bahan atau zat kimia yang tidak
memberi isyarat adanya pergerakan molekul (no molecular motion) dan
akibatnya tidak ada panas. Dengan demikian, 1000Kelvin dua kali lebih panas
daripada 500Kelvin (pada derajat Celcius 1000 C lebih panas 1,15 kali
dibandingkan dengan 500 C). Contoh lain dari skala pengukuran rasio adalah
pengukuran panjang, berat, dan waktu yang digunakan. Perbedaan antara 40
cm dengan 41 cm sama dengan perbedaan antara 80 cm dengan 81 cm, juga
80 cm dua kali lebih panjang dibandingkan dengan 41 cm.
Pemahaman tentang skala pengukuran yang hierarkis ini sangat penting
dalam statistika. Skala pengukuran nominal mempunyai informasi yang
paling sedikit, karena dalam pengkatagoriannya kita hanya memasukkan
objek ke dalam kategori-kategori saja, dan hanya satu kategori untuk setiap
subjek. Sedangkan pada skala pengukuran ordinal, kita sudah dapat
melakukan pengurutan subjek-subjek berdasarkan kategorinya. Kedua skala
pengukuran, nominal dan ordinal, tidak dapat memberlakukan operasi
matematis. Misalkan, jika kita menetapkan bahwa 1 kategori untuk laki-laki
dan 2 untuk kategori perempuan, maka tentu kita tidak dapat menjumlahkan
1 dengan 2, karena akan muncul angka baru yang tidak ada dalam kategori
tersebut.
LAT IH A N
R A NG KU M AN
TES F OR M AT IF 2
Kegiatan Belajar 3
A. NOTASI SIGMA
x
i 1
i
x
i 1
i x1 x2 x3 x4 x5 x6
x
i2
i x2 x3 x4
3,3 3,8 4, 2
11,3
n
Secara umum, lambang i 1
berarti kita menggantikan i – yang berada di
a i 1
i a1 a2 an
Indeks i dalam aturan tersebut bisa saja dengan indeks lain, seperti j, k, l, dan
lainnya. Dengan demikian,
n n
a a
i 1
i
j 1
j
Contoh:
Misalkan diketahui x1 2, x 2 5, x3 1, x4 7, dan x5 11 , maka
x
i 1
i 2 5 (1) 7 11 24
5
x
i 1
2
i 22 52 (1) 2 7 2 112 4 25 1 49 121 200
2
5
xi 24 576
2
i 1
Dalil 1
Penjumlahan dari jumlah dua atau lebih variabel sama dengan jumlah
masing-masing penjumlahannya.
MPDR5202/MODUL 1 1.27
n n n n
x y
i 1
i i zi xi yi zi
i 1 i 1 i 1
Bukti:
Dengan cara menguraikan dari notasi sigma dan mengelompokkan kembali,
kemudian menggunakan sifat pengelompokan pada operasi bilangan, maka
diperoleh
n
x y
i 1
i i zi x1 y1 z1 x2 y2 z2 xn yn zn
x1 x2 xn y1 y2 yn z1 z2 zn
n n n
xi yi zi
i 1 i 1 i 1
Dalil 2.
n n
Jika c adalah suatu konstanta, maka cx
i 1
i c xi .
i 1
Bukti.
Pembuktiannya dimulai dengan menguraikan notasi sigma sebelah kiri, yakni
n
cx
i 1
i cx1 cx2 cxn
c x1 x2 xn
n
c xi
i 1
Dalil 3.
n
Jika c adalah suatu konstanta, maka c nc .
i 1
Bukti.
Pandang bahwa jika dalil dua di atas xi 1 untuk semua i, maka
n
c c c c
i 1
c nc .
n
1.28 Statistika Pendidikan
Tidak jarang dalam perhitungan statistika kita dihadapkan pada analisis yang
melibatkan beberapa klasifikasi, dua atau lebih. Misalnya xij melambangkan
skor klasifikasi ke-i dan pengamatan objek ke-j. Jika banyaknya
klasifikasinya adalah k (i 1, 2,, k ) dan banyak pengamatan adalah
n j 1, 2,3,, n , maka untuk memudahkan penjumlahan data yang
demikian kita menjumlahkannya dengan notasi sigma ganda.
k n
x
i 1 j 1
ij
Tabel 1.1
Contoh Data dengan Lebih dari Satu Klasifikasi
j
Metode A Metode B Metode C
i
1 25 65 70
2 30 70 75
3 45 76 78
4 50 78 80
5 70 80 90
6 80 90 90
7 87 95 95
8 85 100 80
9 90 58 85
10 60 80 80
Ket: data rekayasa
k n
x
i 1 j 1
ij 25 30 45 80 85 80 2237
x
i 1
2
ij 252 302 452 802 852 802 176377
MPDR5202/MODUL 1 1.29
B. PEMBULATAN BILANGAN
Dengan di adalah digit atau bit mantisa yang nilainya dari 0 sampai (B –1), B
adalah basis sistem bilangan yang dipakai (2, 8, 16, dan sebagainya), dan p
adalah pangkat (berupa bilangan bulat).
1.30 Statistika Pendidikan
LAT IH A N
i 2i
5
2
c.
i 1
ij
i 1 j 1 i 1 j 1 i 1 j 1 i 1 j 1
8
1) a. 3i 1 100
i 1
1.32 Statistika Pendidikan
10
b. 2k
k 1
2
770
i 2i 25
5
2
c.
i 1
2) Hasil perhitungan
90
a. 1 + 2 + 3 + 4 + …+ 90 = i
i 1
50
b. 2 + 4 + 6 + 8 + … + 100 = 2ii 1
n
c.
a1 a2 a3 an = a
i 1
i
20
d.
b3 b4 b5 b22 = b
i 1
i2
e. Perlihatkan bahwa
3) Dengan menggunakan kelinieran dari
m n m n
xij yij zij xij yij zij xij yij yij
m n n n m n m n
i 1 j 1
i 1 j 1 j 1 j 1 i 1 j 1 i 1 j 1 i 1 j 1
R A NG KU M AN
n
1. a
i 1
i a1 a2 an
MPDR5202/MODUL 1 1.33
dn , jika d n 1 5
d 1 , jika d n 1 5
dˆn n
dn , jika d n 1 5 dan d n genap
d n 1 , jika d n 1 5 dan d n ganjil
TES F OR M AT IF 3
c mnc
i 1 j 1
3) Perlihatkan bahwa
m n
m n
x y
i 1 j 1
xi y j
i j
i 1 j 1
4) Bulatkanlah bilangan-bilangan berikut teliti hingga ribuan.
a. Rp 2.456.832,63
b. 300.972 m2
c. 2.012,4 meter
d. 7.542 unit
5) Perhatikan tabel produksi minyak dan gas bumi periode tahun 1956 –
1960 (dikutip dari Sudjana (1989))
1.34 Statistika Pendidikan
Dalam tabel di atas, isilah dahulu jumlahnya lalu buat tabel baru dengan
produksi yang telah dibulatkan menjadi jutaan kilogram, kemudian
berikan komentar dari hasil yang diperoleh!
Test Formatif 1
1) Tetap diperlukan, karena ketika seorang peneliti akan menganalisis data
walaupun perhitungannya dengan komputer, tentu dia harus memilih
dengan tepat uji statistik yang digunakannya. Selain itu, peneliti juga
perlu memahami bagaimana membaca hasil (output) pengolahan
datanya.
2) Ya, karena dengan sensus semua data dari objek yang diteliti turut serta
dalam proses perhitungan, sehingga tidak akan terjadi kesalahan
penaksiran atau derajat kepercayaannya 100%.
3) a. deskrpitif, b. deskriptif, c. deskriptif, d. inferensial, e. inferensial.
4) Penalaran yang dilakukan dalam statistika inferensial adalah penalaran
induktif, yakni peneliti mengambil kesimpulan (generalisasi) dari hasil
empirik yang dilakukan berdasarkan sampling.
Test Formatif 2
1) Ilustrasi
3)
Variabel Klasifikasi
Warna mata Kualitatif
Banyak serangga Kuantitatif diskrit
Banyak kesalahan per murid dalam Kuantitatif diskrit
perlombaan mengeja kata
Kilometer ban sampai bocor Kuantitatif kontinu
pertama
waktu yang diperlukan antara dua Kuantitatif kontinu
pengisian pulpen dalam pengisian
penggunaan biasa
hasil jagung per petak Kuantitatif kontinu
banyaknya anak yang lahir di Kuantitatif diskrit
rumah sakit terdekat pada hari
tahun baru
hasil yang mungkin dari Kuantitatif diskrit
pengundian 50 keping mata uang
banyaknya ikan di suatu kolam Kuantitatifdiskrit
Test Formatif 3
1) n = 10. Y2 = 2, Y7 = 5, I = 1, 3,dan 4. I = 6, 8 dan 9. Yi – 1 Yi-1. Untuk
I = 3Yi – 1 = 1 dan Yi-1 = 6.
2) Bukti
m n m n m
i 1 j 1
c mnc
c
i 1 j 1 i 1
nc m nc mnc
3) Bukti
m n m m m m m n
xi y j xi y j xi y j xi y j
i 1 j 1 i 1 j 1 i 1 i 1 i 1 j 1
MPDR5202/MODUL 1 1.37
Setelah pembulatan
Tahun Minyak Mentah Gas Bumi Jumlah
1956 13.000.000 3.000.000 16.000.000
1957 15.000.000 3.000.000 18.000.000
1958 16.000.000 3.000.000 19.000.000
1959 18.000.000 3.000.000 21.000.000
1960 20.000.000 3.000.000 23.000.000
Jumlah 82.000.000 15.000.000 97.000.000
1.38 Statistika Pendidikan
Daftar Pustaka
Steel, R. G. D. & Torrie, J. H., 1995. Prinsip dan Prosedur Statistika. Suatu
Pendekatan Biometrik. Alih Bahasa: Sumantri, B. Jakarta: Gramedia
Pustaka Utama.
Penyajian Data
Dr. Jarnawi Afgani Dahlan
PEN D AH U LU A N
D ata hasil pengukuran atau perhitungan perlu ditulis secara ringkas dan
mudah dibaca, sehingga makna dari data dapat terungkap. Untuk
meringkas data dapat digunakan tabel. Dalam statistika tabel terdiri dari dua
jenis, yakni tabel baris-kolom dan tabel frekuensi. Dari kedua tabel tersebut,
kita dapat menyusun diagram atau grafik. Penulisan data dalam diagram atau
grafik bertujuan agar penyajian lebih mudah membaca dan juga lebih
menarik.
Hal yang penting untuk dipelajari oleh kita adalah diagram mana yang
tepat digunakan dalam menyajikan data yang kita punyai. Sering kali terdapat
ketidaktepatan penyajian data dalam bentuk diagram/garis. Dengan demikian,
agar kesalahan-kesalahan dalam menyusun tabel dan memilih diagram yang
tepat, maka Anda perlu membaca dan menyelesaikan latihan-latihan dalam
Modul 2 ini.
A. DESKRIPSI SINGKAT
B. RELEVANSI
Kegiatan Belajar 1
Penyajian Data
Penulisan data di atas tentu tidak mudah dibaca dan dimaknai lebih
lanjut, sehingga kurang memberikan informasi yang jelas. Untuk itu kita
perlu menyajikannya dalam bentuk tabel. Salah satu bentuk tabel yang dapat
dibuat adalah sebagai berikut.
Tabel 2.1
Rekapitulasi Siswa SD X Tahun Ajaran 2014 – 2015
Kelas
Jenis
1 2 3 4 5 6 Jumlah
Kelamin
A B A B A B A B A B A B
Laki-Laki 12 13 11 10 12 12 18 17 14 12 10 13 154
Perempuan 12 12 17 16 16 15 15 16 14 15 12 11 171
Jumlah 24 25 28 26 28 27 33 33 28 27 22 24 325
Sumber: rekayasa
antara penyajian data secara naratif di atas dengan yang sudah tersusun pada
tabel 1. Jauh lebih mudah membaca atau menggali informasi dari Tabel 2.1.
Interpretasi tentu saja sangat beragam, dan setiap orang tentu akan
mempunyai ide atau gagasan dari suatu gambar atau tabel. Seperti kata
pepatah gambar menunjukkan sejuta makna. Dengan memunculkan berbagai
gagasan-gagasan tersebut, maka kita diajak untuk berpikir secara kritis dan
kreatif. Cobalah Anda ungkapkan ide atau gagasan apa saja yang dapat
diungkapkan dari data pada tabel tersebut, kemudian diskusikan dengan
teman-teman Anda!
Secara formal, menyajikan tabel tidak ada aturan yang khusus. Hal yang
perlu diperhatikan dalam menyusun tabel adalah semua informasi yang
diperoleh harus termuat dalam tabel. Artinya tidak boleh ada data yang
tertinggal. Selain itu, penyajian kategori bagi judul (baik kolom maupun
baris) harus jelas, bebas dan saling lepas. Misalnya informasi tentang kualitas
kemampuan siswa, kita mengkategorinya sebagai berikut:
0 – 30 : sangat kurang
30 – 50 : kurang
50 – 70 : cukup
65 – 80 : baik
80 – 100 : sangat baik
Catatan : skala pengukuran 0 – 100
61 67 70 75 80 85 90 96
62 68 70 76 80 85 91 68
70 77 81 86 69 72 77 81
86 72 78 82 86 73 78 82
86 78 82 86 78 83 86 79
84 87 79 84 87 88 88 89
89 89
Diagram 2.1
Data Hasil Tes Tema 4 Kelas IV-A dan IV-B
Catatan: data hasil modifikasi dari Minium, dkk. (1993).
Tabel 2.2
Tabel Distribusi Frekuensi dari Skor-Skor yang Mungkin
pada Hasil Tes Formatif Tema 4
Tabel 2.3
Beberapa Tabel Distribusi yang Mungkin dari Data Tabel 2
A B C
Panjang Interval = 3 Panjang Interval = 5 Panjang Interval = 5
SKOR FREKUENSI SKOR FREKUENSI SKOR FREKUENSI
60 - 62 2 60 – 64 2 61 - 65 2
63 - 65 0 65 – 69 4 66 - 70 7
66 - 68 3 70 – 74 6 71 - 75 4
69 - 71 4 75 – 79 10 76 - 80 11
72 - 74 3 80 – 84 10 81 - 85 10
75 - 77 4 85 – 89 15 86 - 90 14
78 - 80 8 90 – 94 2 91 - 95 1
81 - 83 6 95 – 99 1 96 - 100 1
84 - 86 10 Jumlah 50 Jumlah 50
87 - 89 7
90 - 92 2
93 - 95 0
96 - 98 1
Jumlah 50
Dari tabel di atas, nampak bahwa dari data yang sama, kita dapat
mengembangkan beberapa tabel distribusi frekuensi yang berbeda. Apabila
kita memilih panjang interval kelasnya sama, mungkin tabel distribusi
frekuensinya bisa sama atau berbeda. Hal ini sangat bergantung pada
pemilihan skor terendah pada kelas interval pertamanya. Begitu juga jika kita
memilih skor terendah sama, tetapi menggunakan panjang interval berbeda,
maka tabelnya akan berbeda juga. Dengan demikian dapat disimpulkan
bahwa penyajian data dalam tabel distribusi frekuensi tidaklah tunggal.
Terdapat hal penting yang perlu diperhatikan oleh kita dalam menyusun
interval-interval pada tabel distribusi frekuensi sebagaimana telah disebutkan
di atas, yakni semua data termuat dalam kelas-kelas interval yang ada, tidak
ada interval yang beririsan (overlap), dan jika memungkinkan sebaiknya
menggunakan panjang interval untuk setiap kelasnya sama. Kemudian
muncul sebuah pertanyaan, bagaimana cara terbaik dalam menyusun tabel
distribusi frekuensi? Menurut Minium, dkk. (1993) terdapat suatu konsensus
yang dapat dijadikan acuan dalam menyusun tabel distribusi frekuensi.
Namun ini hanyalah pedoman yang sifatnya tidak kaku.
1. Pastikan bahwa kelas-kelas interval yang dibuat saling lepas
(mutallyexlusive). Interval-interval tidak boleh overlap, sehingga tidak
ada skor yang termuat ke lebih dari satu interval.
2.8 Statistika Pendidikan
35
1, 75 . Karena satuan pengukuran data di atas adalah 1 satuan, maka
20
panjang kelas yang mungkin dengan banyak kelas interval 10 buah adalah 2
atau 3. Sedangkan jika kita memilih banyak kelas 20 buah, maka panjang
kelas yang mungkin adalah 1 atau 2. Misalkan untuk banyak kelas interval 10
buah, kita pilih panjang kelasnya 3, atau p = 3.
Berikutnya kita dihadapkan pada pemilihan kelas interval yang pertama.
Karena data terkecil kita adalah 61 dan kita telah memilih panjang kelasnya
3, maka kemungkinan dari kelas interval pertama adalah 59 – 61, 60 – 62,
atau 61 – 63. Kita lebih baik memilih interval 60 – 62 dibandingkan dengan
lainnya. Hal ini disebabkan 60 merupakan kelipatan dari panjang kelasnya,
yakni 3.
Setelah kelas interval pertama diperoleh, kemudian lanjutkan penulisan
interval-interval berikutnya dan lakukanlah tabulasi data. Untuk
membantunya kita dapat menggunakan tabel tally sebagai berikut.
Tabel 2.4
Tabulasi untuk Menentukan Tabel Frekuensi
(susunan kelas interval naik)
SKOR Tali F
60 - 62 2
63 - 65 0
66 - 68 3
69 - 71 4
72 - 74 3
75 - 77 4
78 - 80 8
81 - 83 6
84 - 86 10
87 - 89 7
90 - 92 2
93 - 95 0
96 - 98 1
Jumlah 50
MPDR5202/MODUL 2 2.11
Tabel 2.5
Tabulasi untuk Menentukan Tabel Frekuensi
(susunan kelas interval turun)
SKOR Tali F
96 – 98 1
93 – 95 0
90 – 92 2
87 – 89 7
84 – 86 10
81 – 83 6
78 – 80 8
75 – 77 4
72 – 74 3
69 – 71 4
66 – 68 3
63 – 65 0
60 - 62 2
Jumlah 50
Jika kita mengacu pada pendapat Sturges, maka banyak kelas interval
dari data di atas adalah
b 1 3,3(log 50)
1 (3,3)(1, 69897)
1 5, 606601
6, 6066001
Dari hasil di atas, maka banyak kelas yang mungkin adalah 6 atau 7.
Misalkan kita memilih b = 7. Untuk banyak kelas 6, silakan Anda
mencobanya. Dengan memilih banyak kelas 7 buah, maka dapat dihitung
panjang kelas, yakni
2.12 Statistika Pendidikan
35
p 5
7
Dalam memilih panjang kelas (p), kita dapat menggunakan p = 5 atau 6.
Misalkan dipilih p = 6. Jika dipilih p = 5, maka apa yang akan terjadi?
Silakan Anda kerjakan sendiri sebagai latihan.
Pemilihan ujung bawah kelas pertama dimisalkan adalah 60 – 65. Ini
berpatokan pada pendapat Minium, 60 merupakan kelipatan 6. Dengan
demikian, tabel distribusi frekuensi adalah sebagai berikut
Tabel 2.6
Tabulasi untuk menentukan tabel frekuensi
SKOR Tali F
60 – 65 2
66 – 71 7
72 – 77 7
78 – 83 14
84 – 89 17
90 – 95 2
96 – 101 1
Jumlah 50
Secara umum, batas-batas riil (real limits) dari suatu skor dipandang
sebagai perluasan dari setengah dari satuan pengukuran datanya. Misalkan
untuk data di atas, satuan pengukurannya adalah 1 satuan. Dengan demikian
batas-batas riil datanya adalah X 0,5 ; 0,5 diperoleh dari satuan pengukuran
dibagi 2 atau setengah kali satuan pengukuran. Dengan demikian, jika skor
seorang siswa adalah 42, maka batas-batasnya adalah 42 0,5, yakni 41,5
dan 42,5. Angka 41,5 disebut batas bawah dan angka 42,5 disebut batas atas.
Jika satuan pengukuran data kita satu tempat desimal, misalkan 42,3; 60,8;
dan seterusnya, maka untuk menentukan batas-batas riilnya adalah
0,1
X X 0,05 . Dengan demikian, batas-batas bagi skor 42,3 adalah
2
42,3 0,05, yakni batas bawahnya 42,25 dan batas atasnya 42,35.
Ilustrasinya dapat dilihat pada diagram berikut.
Gambar 2.1
Contoh Batas-Batas Riil dari Suatu Skor
Tabel 2.7
Tabel Frekuensi Skor Siswa
Tabel 2.8
Tabel Frekuensi Skor Siswa
Dari tabel frekuensi relatif tersebut memberikan makna yang lebih, misalkan
34% siswa mencapai skor di antara 84 – 89, dan tentu makna lainnya.
Dalam banyak kegiatan, sering kali kita tertarik bukan pada banyaknya
pengamatan dalam suatu kelas tertentu, namun pada banyaknya pengamatan
yang jatuh di bawah sebuah skor atau nilai tertentu. Misalkan berapa banyak
skor siswa yang kurang dari 70, atau berapa banyak siswa yang skornya di
atas 80, dan seterusnya. Hal ini tentu akan bermanfaat bagi guru (sebagai
contoh) untuk menentukan siswa mana saja yang sudah mencapai kriteria
ketuntasan, dan siswa mana saja yang sudah mencapainya. Untuk menyusun
tabel frekuensi kumulatif, perhatikan kembali tabel 2.8 frekuensi di atas.
Dalam tabel di atas banyaknya siswa yang skornya kurang dari 72 ada 9
siswa, yakni 2 + 7 dari frekuensi-frekuensi kelas sebelumnya. Artinya
frekuensi kumulatif (kurang dari) merupakan frekuensi total semua nilai
yang lebih kecil daripada batas atas kelas suatu selang (interval) kelas
tertentu. Sebaliknya frekuensi kumulatif (atau lebih) merupakan frekuensi
total semua nilai yang lebih besar dari batas bawah kelas suatu selang
(interval) kelas tertentu. Hal yang sama dengan tabel frekuensi, dari tabel
frekuensi kumulatif juga dapat diperoleh tabel frekuensi kumulatif relatif
(persen) dengan perhitungan sama dengan apa yang dikerjakan dalam
menyusun tabel frekuensi relatif. Dari pengertian di atas, maka dapat kita
susun tabel frekuensi kumulatif (kurang dari) dan tabel frekuensi kumulatif
(atau lebih) sebagai berikut.
2.16 Statistika Pendidikan
Tabel 2.9
Tabel Frekuensi Kumulatif (kurang dari) bagi Skor Siswa
Frekuensi Frekuensi
Batas kelas
Kumulatif Kumulatif Relatif
Kurang dari 59,5 0 0,00
Kurang dari 65,5 2 0,14
Kurang dari 71,5 9 0,18
Kurang dari 77,5 16 0,32
Kurang dari 83,5 30 0,60
Kurang dari 89,5 47 0,94
Kurang dari 95,5 49 0,98
Kurang dari 101,5 50 1,00
Dan tabel frekuensi kumulatif (atau lebih) dari tabel di atas adalah sebagai
berikut.
Tabel 2.10
Tabel Frekuensi Kumulatif (kurang dari) bagi Skor Siswa
Frekuensi
Batas Kelas Frekuensi Kumulatif
Kumulatif relatif
59,5 atau lebih 50 1,00
65,5 atau lebih 48 0,96
71,5 atau lebih 41 0,82
77,5 atau lebih 34 0,68
83,5 atau lebih 20 0,40
89,5 atau lebih 3 0,06
95,5 atau lebih 1 0,02
101,5 atau lebih 0 0,00
Tabel 2.11
Mobil Milik Perusahaan Penyewaan
Model Banyaknya
Buick Regal 12
Chevrolet Monte Carlo 15
OldsmobileCutlass 15
Pontiac Grand Prix 9
Ford Thunderbird 5
Ford Fairmont 10
Pontiac Phoenix 12
ChevroletCitation 20
BuickSkylark 13
Toyota Corolla 5
Honda Accord 6
Cadillac Seville 2
Lincoln Versailles 3
Sumber : Walpole (1995)
Selain itu, tabel frekuensi data kategorial juga digunakan 2 atau lebih
kategori, atau tahun sebagai kategori. Misalkan dapat dilihat dari contoh-
contoh yang diambil dari Sudjana (1989) berikut ini.
Tabel 2.12
Hasil Padi, Ketela, dan Jagung di Indonesia 1955 - 1964
(Ribuan Kilogram)
HASIL
TAHUN
PADI KETELA JAGUNG
1955 144.324 93.170 19.708
1956 146.188 91.409 19.647
1957 146.769 101.182 19.601
1958 153.443 112.783 26.342
1959 159.500 126.969 20.920
1960 168.600 113.765 24.601
1961 159.001 111.895 22.831
1962 171.113 115.860 32.429
1963 152.561 115.752 23.586
1964 162.530 117.464 36.497
Sumber: BPS, Jakarta (Sudjana, 1989)
2.18 Statistika Pendidikan
Penetapan kategori dalam tabel ini jauh lebih mudah, karena memang
kategorinya sudah ada, jadi kita tidak perlu menetapkan kategori baru untuk
kepentingan penyusunan tabel. Hal yang sama (penting) untuk diketahui
bahwa kategori-kategori yang ada harus mencakup semua data dan tidak ada
satu pun pengamatan yang masuk ke dalam lebih dari satu kategori. Konsep
tentang batas kelas titik tengah kelas biasanya tidak menarik perhatian kita
apabila kita membuat sebaran bagi data kategori.
Gambar 2.2
Digram Batang Banyak Mobil yang Dimiliki Perusahaan Penyewaan
MPDR5202/MODUL 2 2.19
Gambar 2.3
Diagram Lingkaran Banyak Mobil yang Dimiliki Perusahaan Penyewaan
Perlu diperhatikan oleh kita bagaimana menentukan besar juring dari masing-
masing kategorinya, sehingga besar juring proporsional dengan frekuensi
masing-masing kategorinya. Untuk menentukan besar juring yang
proporsional, kita perlu mengetahui sudut pusat dari juring yang akan dibuat,
misalkan untuk data di atas dapat dihitung sudut pusatnya adalah sebagai
berikut.
12
Buick Regal : 3600 34, 0157484 34, 00
127
15
Cherolet Monte Carlo : 3600 42,5196864 42,50
127
15
Oldsmobile Cutlass : 3600 42,5196864 42,50
127
Gambar 2.4
Hasil Padi, Ketela, dan Jagung di Indonesia 1955 - 1964
(ribuan kilogram)
Dari gambar di atas, kita dapat memberikan interpretasi yang banyak dan
tentu saja bermakna. Misalkan pada periode tersebut hasil padi selalu lebih
tinggi dibandingkan dengan Ketela dan Jagung, ketiga hasil bumi cenderung
selalu naik sehingga di tahun mendatang punya peluang untuk naik juga,
serta interpretasi lainnya. Dengan demikian, kelebihan dari diagram/grafik
garis dapat digunakan untuk interpolasi dan ekstrapolasi (Interpolasi adalah
menaksir suatu nilai di antara nilai-nilai yang diketahui, sedangkan
ekstrapolasi adalah menaksir suatu nilai di luar yang diketahui).
Diagram atau grafik untuk data numerik atau kuantitatif dapat juga
dikembangkan dari tabel frekuensi. Diagram yang pertama dalam data
kuantitatif adalah histogram. Dalam membuatnya menurut Walpole (1995)
akan lebih baik apabila sumbu tegaknya menyatakan frekuensi atau frekuensi
relatif. Histogram frekuensi akan memiliki bentuk yang persis sama dengan
histogram frekuensi relatif, hanya skala sumbu tegaknya yang berbeda.
Untuk lebih jelasnya perhatikan kembali Tabel 2.8 di atas.
MPDR5202/MODUL 2 2.21
Gambar 2.5
Histogram Frekuensi Skor Siswa
Gambar 2.6
Histogram Frekuensi Relatif Skor Siswa
gabungkan kelas interval kedua dan ketiga (65,5 – 71,5 dengan dengan 71,5 –
77,5). Apakah diagramnya menjadi seperti berikut ini?
Gambar 2.7
Histogram Frekuensi yang tidak Benar dengan Lebar Kelas yang Tidak Sama
Gambar 2.8
Histogram Frekuensi dengan Lebar Selang Berbeda dari Skor Siswa
Cara kedua yang bermanfaat bagi penyajian data kuantitatif adalah poligon
frekuensi. Sebelumnya perlu dikenalkan terlebih dahulu tanda kelas atau titik
tengah kelas interval yang sering dilambangkan dengan xi dengan i
menunjukkan kelas interval. Untuk lebih jelasnya perhatikan kembali tabel
frekuensi skor siswa di atas dengan telah memuat kolom baru untuk x i.
Selang Kelas xi f
60 – 65 62,5 2
66 – 71 68,5 7
72 – 77 74,5 7
78 – 83 80,5 14
84 – 89 86,5 17
90 – 95 92,5 2
96 – 101 98,5 1
Jumlah 50
Gambar 2.9
Poligon Frekuensi Skor Siswa
Gambar 2.10
Histogram Poligon Frekuensi Skor Siswa
Kurva lain yang sering digunakan dari tabel distribusi frekuensi adalah
ogive. Ogive diperoleh dari tabel distribusi frekuensi kumulatif baik kurang
dari dan kumulatif atau lebih. Sebagai contoh, ogive dari tabel kumulatif dari
skor siswa untuk kurang adalah sebagai berikut.
Gambar 2.11
Ogive Frekuensi Kumulatif (Kurang Dari) Skor Siswa
Dan untuk ogive kumulatif (atau lebih) dari tabel di atas adalah sebagai
berikut.
Gambar 2.12
Ogive Frekuensi Kumulatif (Atau Lebih) Skor Siswa
Gambar 2.13
Ogive Frekuensi Relatif Kumulatif (Kurang Dari) Skor Siswa
Selain histogram dan poligon frekuensi, ada diagram lain yang dapat
dikembangkan, yakni Diagram Batang – Daun atau StemandLeaf. Diagram
ini memuat dua sisi, yakni batang (stem) di satu sisi kanan dan daun (leaf) di
sisi lainnya atau kiri. Kedua sisi dipisahkan oleh garis.
Berbeda pada histogram atau poligon, pada diagram batang daun kita
menuliskan skor data pada diagram tersebut. Sebagai contoh perhatikan data
pada diagram 2.1 tentang skor siswa di atas. Dengan menggunakan kelas-
kelas interval 60 – 64, 65 – 69, 70 – 74, 75 – 79, 80 – 84, 85 – 89, 90 – 94,
dan 95 – 100, maka kita dapat menggambarkan diagram batang-daunnya
sebagai berikut!
Gambar 2.14
Diagram Batang – Daun (StemandLeaf) Skor Siswa
1. Bentuk (Shape)
Bentuk kurva banyak dipengaruhi oleh ukuran sampel (banyak data)
yang diambil dan juga penetapan atau pemilihan panjang interval pada
distribusi frekuensi. Perhatikan tiga gambar berikut yang diambil dari
Minium, dkk. (1993).
2.30 Statistika Pendidikan
Gambar 2.15
Perubahan Bentuk Kurva Poligon Atas Banyak Data
Gambar 2.16
Histogram dari suatu distribusi dengan panjang kelas berbeda
(Minium, dkk., 1993)
Gambar 2.17
Bentuk-Bentuk Kurva Frekuensi
(Minium, dkk., 1993)
Gambar 2.18
Contoh Dua Kurva dengan Ukuran Gejala Pemusatan Berbeda
(Minium, dkk., 1993)
3. Penyebaran/Keragaman (Variabilitas)
Ukuran ketiga yang dapat muncul/dibaca dari kurva frekuensi adalah
keragaman data. Keragaman data memperlihatkan apakah data cenderung
berkumpul pada ukuran pusatnya atau menyebar. Kadang untuk suatu
distribusi, kita mungkin akan mengalami kesulitan dalam menerjemahkan
atau memaknai ukuran sebaran data ini. Namun apabila kita membandingkan
dua distribusi dengan satuan ukuran yang sama, maka makna yang diambil
dari ukuran penyebaran data ini akan lebih mudah. Sebagai contoh,
perhatikanlah gambar berikut!
2.34 Statistika Pendidikan
Kurva 2
Kurva 1
Gambar 2.19
Contoh Dua Kurva dengan Ukuran Gejala Pemusatan Berbeda
(Minium, dkk., 1993)
LAT IH A N
1) Untuk setiap kelas interval berikut, manakah yang menurut Anda bisa
digunakan dan tidak bisa digunakan. Berikan alasan yang mendasari
jawaban Anda.
a. 50 atau lebih b. 20 – 25 c. 5 – 9
44 – 49 14 – 19 10 – 14
38 – 43 8 – 13 14 – 19
26 – 31 0–7 20 – 24
MPDR5202/MODUL 2 2.35
Kelas Interval f
13,0 - 17,4 2
17,5 - 21,9 3
22,0 - 26,4 0
26,5 - 30,9 12
31,0 - 35,4 22
35,5 - 39,9 13
40,0 - 44,4 13
Jumlah 65
R A NG KU M AN
TES F OR M AT IF 1
a.
Buatlah frekuensi relatif dari keduanya!
b.
Jika misalkan dari hasil tersebut ingin dibandingkan untuk skor pada
interval 130 – 139, yang manakah lebih mudah memberikan makna
perbandingan keduanya, dari frekuensi atau frekuensi relatif?
Berikan alasan atas jawaban Anda!
2) Konstruksi histogram dan poligon dari data soal nomor 1 di atas,
kemudian bandingkan hasilnya apabila dilihat dari kemiringan,
pemusatan, serta penyebarannya!
3) Data berikut melukiskan berapa kali pencacah harus datang untuk
melengkapi wawancara terhadap responden.
Frekuensi
harus datang 8 7 6 5 4 3 2 1
Responden 3 10 8 48 57 76 166 305
MPDR5202/MODUL 2 2.41
Upah Karyawan
Upah ($) frekuensi
50.00 – 59.99 8
60.00 – 69.99 10
70.00 – 79.99 16
80.00 – 89.99 15
90.00 – 99.99 10
100.00 – 119.99 8
120.00 – 149.99 3
a. Gambarkan histogramnya distribusi frekuensi!
b. Dari hasil (a), berapa banyak karyawan yang berpenghasilan kurang
dari $130?
Jumlah
Wilayah Geografis
Mahasiswa
New England 524
Middle Atlatic 818
E.N. Central 815
W.N. Central 367
S. Atlantic 679
E.S. Atlantic 196
W.S. Atlantic 436
Mountain 346
Pacific 783
Kegiatan Belajar 2
P ada Kegiatan Belajar 2 dari Modul 2 ini akan dibahas tentang beberapa
konsep atau prosedur yang perlu dipahami oleh kita dalam mempelajari
dan menggunakan statistika. Beberapa istilah penting yang perlu dipahami
oleh kita di antaranya tentang data, peubah acak dan konstanta, sampel acak,
skala pengukuran, serta yang terakhir adalah populasi dan sampel. Untuk
itulah, dua istilah terakhir, yakni populasi dan sampel akan dibahas dalam
kegiatan belajar ini, dan Anda perlu membaca dan mempelajari sampai
paham.
Suatu populasi adalah himpunan yang lengkap dari pengamatan sehingga
investigator dapat membuat sebuah kesimpulan. Suatu sampel adalah bagian
dari populasi. Perlu Anda catat bahwa menurut Minium (1993) yang pertama
adalah population is definedin terms of observations rather than people.
Dengan definisi tersebut, maka orang akan bekerja melalui statistika dengan
lebih baik. Misalkan, kita ingin mengetahui skor ujian masuk perguruan
tinggi dan IPK pada semester pertama dari mahasiswa suatu PTN A Program
Studi tertentu. Kita sedang berbicara tentang dua populasi, walaupun
faktanya adalah kita mengambil data dari subjek yang sama. Dengan
demikian, populasi adalah hal yang berkaitan dengan pengamatan bukan
dengan orangnya (subjeknya).
Hal yang kedua yang perlu dicatat oleh kita adalah Population is defined
by the interest of the inverstigator. Jika para surveyor (orang yang melakukan
survei) mencoba untuk melakukan survei pendahuluan dari pemilihan umum
atau pemilihan presiden, target populasi mereka haruslah memuat preferensi
orang- orang yang akan ikut serta dalam pemilihan umum atau pemilihan
presiden.
Mengapa ada populasi dan sampel? Seperti diketahui bahwa statistika
terbagi dalam dua fase, yakin statistik deskriptif dan statistik inferensial atau
induktif. Fase pertama dikerjakan untuk mengerjakan fase kedua. Fase kedua,
yakni statistik induktif berupaya mengambil kesimpulan tentang karakteristik
populasi yang pada umumnya berdasarkan sampel dari populasi.
2.44 Statistika Pendidikan
Gambar 2.20
Diagram Pengambilan sampel Sederhana
Contoh 2.1:
Misalkan sampel berukuran 100 mahasiswa pascasarjana akan diambil dari
mahasiswa tahun pertama, kedua, dan tiga ke atas dengan jumlah berturut-
turut 300, 350, dan 500 mahasiswa. Jumlah dari keseluruhan mahasiswa
adalah 1150 orang. Dengan demikian dapat dihitung:
300
Dari strata I (TK I) diambil sebanyak 100 26,1 26
1150
350
Dari strata II (TK II) diambil sebanyak 100 30, 4 30
1150
Dan dari strata III (TK III ke atas) diambil sebanyak
500
100 43, 45 44
1150
Secara diagram pengambilan sampel stara dapat digambarkan sebagai
berikut.
Gambar 2.21
Diagram Pengambilan sampel Strata
Gambar 2.22
Diagram Pengambilan Sampel Klaster
Contoh 2.2:
Untuk meneliti pendapatan keluarga di suatu daerah, pengambilan sampel
klaster dapat dilakukan. Misalkan daerah itu terdiri dari kabupaten/kota.
Kabupaten dan kota terdiri dari kecamatan, kecamatan terdiri dari desa dan
desa terdiri dari rukun tetangga. Untuk mendapatkan sampel klaster mula-
mula secara acak diambil sampel terhadap kabupaten, dari tiap kabupaten
dalam sampel (kabupaten sampel) diambil kecamatan yang disebut
kecamatan sampel. Begitu juga dari kecamatan sampel diambil desa. Dan
dari desa sampel diambil rukun tetangga. Keluarga-keluarga dalam rukun
tetangga inilah setelah digabungkan merupakan anggota sampel klaster.
Pengambilan sampel lainnya selain pengambilan sampel acak adalah
pengambilan sampel non acak di antaranya: pengambilan sampel sistematik,
pengambilan sampel kuota, pengambilan sampel incidental, purposive
sampling, pengambilan sampel jenuh, dan snowball sampling.
Pengambilan sampel sistematik dilakukan dengan cara mengambil
anggota sampel pada jarak interval tertentu (waktu, ruang atau ukuran yang
uniform). Jika populasi berukuran N dan akan diambil sampel berukuran n,
N
maka jarak interval besarnya . Dengan demikian diperoleh n buah interval
n
dan dari tiap interval itu diambil sebuah anggota dengan pengambilan
anggota pertama dilakukan secara acak.
Pengambilan sampel kuota adalah teknik untuk menentukan sampel
dari populasi yang mempunyai karakteristik tertentu sampai jumlah kuota
yang diinginkan. Sebagai contoh, akan melakukan penelitian dengan jumlah
sampel 100. Jika pengumpulan data belum memenuhi kuota 100, maka
penelitian dianggap belum selesai.
MPDR5202/MODUL 2 2.49
Dalam penelitian terdapat dua jenis kekeliruan pokok yang dapat terjadi,
yakni kekeliruan pengambilan sampel dan nonpengambilan sampel.
Kekeliruan pengambilan sampel dapat terjadi sebagai akibat adanya
pemeriksaan yang tidak lengkap tentang populasi dan penelitian hanya
berdasarkan sampel. Jelaslah bahwa penelitian yang dilakukan terhadap
sampel dengan penelitian terhadap populasi tentu akan berbeda. Perbedaan
yang terjadi antara hasil penelitian terhadap sampel dan terhadap populasi
dengan prosedur yang sama disebut kekeliruan pengambilan sampel. Untuk
meminimalkan kekeliruan ini, maka pengambilan sampel hendaknya
dilakukan secara acak.
Kekeliruan nonpengambilan sampel dapat diakibatkan oleh:
1. Populasi tidak didefinsikan sebagaimana mestinya
2. Populasi yang menyimpang dari populasi yang seharusnya dipelajari
3. Instrumen tidak dirumuskan sebagaimana mestinya
4. Istilah-istilah dalam penelitian yang didefinisikan secara tidak tepat atau
digunakan tidak konsisten.
5. Responden tidak memberi jawab yang akurat, menolak untuk menjawab
atau tidak ada di tempat.
2.50 Statistika Pendidikan
LAT IH A N
1) Penjelasan dari:
a. Sampling peluang: Subjek yang diambil dari populasi mempunyai
peluang yang sama untuk terambil
b. Sampling nonpeluang: Pengambilan subjek dalam populasi
memperhatikan berbagai kondisi sehingga setiap subjek tidak
mempunyai peluang yang sama untuk terambil
c. Sampling seadanya: merupakan teknik sampling yang dilakukan
secara kebetulan, yakni siapa saja yang kebetulan/insidental bertemu
peneliti, maka digunakan sebagai sampel, bila subjek itu dipandang
cocok sebagai sumber penelitian.
MPDR5202/MODUL 2 2.51
R A NG KU M AN
TES F OR M AT IF 2
1) Kapan kita harus melakukan sensus dan kapan kita harus melakukan
pengambilan sampel? Jelaskan !
2) Berikan perbedaan antara populasi hingga dan tak hingga, kemudian
berikan contoh untuk memperjelasnya!
3) Buatlah contoh cara pengambilan sampel secara sederhana, strata, dan
klaster!
4) Berikan contoh pengambilan sampel dengan sistematika, incidental,
purposive, jenuh, dan snowball!
5) Misalkan pada penelitian tentang hasil belajar matematika siswa sekolah
dasar di kota Anda. Karena jumlah siswanya banyak, maka dilakukan
pengambilan sampel. Tuliskan langkah-langkah pengambilan subjek
(siswa) yang akan diteliti oleh Anda!
MPDR5202/MODUL 2 2.53
Tes Formatif 1
1) Tabel distribusi frekuensi relatifnya adalah
a.
GOOD BAD frel frel
SKOR
MOOD MOOD (goodmood) (badmood)
155 – 159 0 1 0,00 0,02
150 – 154 2 2 0,01 0,04
145 – 149 4 7 0,03 0,14
140 – 144 7 12 0,05 0,24
135 – 139 12 10 0,08 0,20
130 – 134 14 7 0,09 0,14
125 – 129 25 4 0,17 0,08
120 – 124 23 3 0,15 0,06
115 – 119 18 0 0,12 0,00
110 – 114 20 2 0,13 0,04
105 – 109 12 1 0,08 0,02
100 – 104 8 0 0,05 0,00
95 – 99 3 1 0,02 0,02
90 – 94 2 0 0,01 0,00
Jumlah 150 50 1,00 1,00
Frek
kedatangan Fkum (reponden)
1 305
2 471
3 547
4 604
5 652
6 660
7 670
8 673
Diagram lingkaran
Test Formatif 2
1) Sensus dilakukan apabila subjek dalam penelitian kita kecil sehingga
peneliti memungkinkan untuk menggunakan subjek tersebut secara
keseluruhannya. Pengambilan sampel dilakukan apabila cakupan subjek
penelitiannya luas bahkan mungkin tak hingga sehingga peneliti tidak
mungkin menjadikan keseluruhan subjek tersebut karena adanya
keterbatasan peneliti, misalnya waktu.
2) Populasi dengan subjek yang terhitung dan berhingga. Sebaliknya
populasi tak hingga dipandang sebagai populasi yang berisikan
konseptual peneliti akan mengalami kesukaran dalam melakukan sensus.
Walaupun demikian, pada ovulasi terhingga pun belum tentu dapat
dilakukan sensus akibat terlalu banyak anggotanya. Selain itu, ketika kita
melakukan pengambilan sampel dengan teknik pengembalian, maka
populasi yang hingga dapat dianggap menjadi populasi tak hingga.
3) Contoh pengambilan sampel sederhana. Misalkan akan dilakukan survei
tentang pendapat mahasiswa pascasarjana Pendidikan Dasar UT terhadap
layanan akademik. Peneliti memandang semua mahasiswa pada tiap
angkatan mempunyai peluang yang sama untuk menjadi responden.
Contoh pengambilan sampel strata. Misalkan akan dilakukan survei
pengaruh pendidikan orang tua terhadap gaya belajar anak di sekolah
dasar. Subjek dalam penelitian adalah anak dan orang tua. Pendidikan
orang tua diklasifikasi menjadi, tidak tamat SD, tamatan SD, SMP,
MPDR5202/MODUL 2 2.59
Daftar Pustaka
Statistika Deskriptif
Dr. Jarnawi Afgani Dahlan
PEN D AH U LU A N
A. DESKRIPSI SINGKAT
B. RELEVANSI
Kegiatan Belajar 1
Statistika Deskriptif
1. Modus
Dalam kehidupan sehari-hari modus dimaknai sebagai “paling sering
muncul” dan dalam statistika, modus mempunyai makna yang hampir sama.
Dalam suatu distribusi, modus merupakan data yang paling sering muncul
atau frekuensinya terbesar. Simbol untuk modus dilambangkan dengan Mo.
Perlu diketahui bahwa modus dari suatu distribusi data mungkin ada dan
tidak ada. Dan jika ada mungkin juga tunggal atau lebih dari satu. Sehingga
jika dilihat dari modusnya, distribusi data ada yang tidak ada modus, uni
modus, bimodus atau multimodus. Untuk lebih memahaminya, perhatikanlah
gambar berikut.
MPDR5202/MODUL 3 3.5
multimodus bimodus
Gambar 3.1
Kurva Distribusi Frekuensi Ditinjau dari Modus
Untuk menghitung modus dari data yang disajikan dalam tabel distribusi
frekuensi dapat digunakan rumus sebagai berikut.
b
M0 b p 1
b1 b2
Dengan
M0 : modus
b : batas bawah kelas modus
p : panjang interval kelas modus
b1 : selisih frekuensi kelas modus dengan frekuensi sebelum kelas modus
b2 : selisih frekuensi kelas modus dengan frekuensi setelah kelas modus
Contoh 3.1
Tentukan modus dari data berikut.
a. 2, 4, 5, 6, 7, 8
b. 3, 4, 4, 5, 5, 6, 6, 12, 12
c. 2, 3, 4, 4, 5, 5, 6, 6, 6, 8
d. 3, 4, 4, 4, 5, 5, 6, 6, 6, 8
e. 3, 4, 4, 4, 5, 5, 5, 6, 6, 6, 8
3.6 Statistika Pendidikan
Jawab.
Modus dari data di atas adalah
a. Tidak ada modus karena setiap data kemunculannya sama, yakni 1 kali
b. Tidak ada modus karena setiap data kemunculannya sama, yakni 2 kali
c. Mo = 6 (tiga kali muncul, paling banyak)
d. Mo = 4 dan 6 (masing-masing muncul 3 kali, paling banyak)
e. Mo = 4, 5 dan 6 (masing-masing muncul 4 kali, paling banyak.
Contoh 3.2 :
Hitung modus dari data berikut.
Tabel 3.1
Distribusi Frekuensi
Jawab.
Untuk menentukan modus dari data yang telah disusun dalam tabel distribusi
frekuensi, langkah pertama adalah menentukan kelas modus. Kelas modus
dipilih dari kelas interval yang frekuensinya paling tinggi. Untuk tabel di
atas, kelas modusnya adalah kelas ineteval ke-9. Dari kelas tersebut, maka
diperoleh.
b = 71,5
p =3
b1 = 12 – 9 = 3
b2 = 12 – 6 = 6
MPDR5202/MODUL 3 3.7
2. Median
Median adalah nilai yang membagi distribusi menjadi dua bagian yang
sama banyak. Dalam statistika median disimbolkan dengan Me.
Untuk data mentah, kita pikirkan bahwa median sebagai skor tengah dari
suatu distribusi didasarkan pada frekuensi skor. Untuk mencari median,
pertama-tama kita harus menyusun skor-skor secara terurut dari yang paling
rendah ke yang paling tinggi. Ada beberapa kemungkinan dari nilai median
ini. Pertama, jika n (banyak data) ganjil, maka median akan terletak pada
skor data yang kita punya. Misalkan contohnya sebagai berikut.
2, 3, 4, 6, 9, 10, 11
Median dari data di atas adalah 6. Banyaknya data yang lebih kecil dari
median ada 3 buah, pun sebaliknya, banyak data yang lebih besar dari median
ada 3 buah juga. Apabila banyak datanya genap, maka median akan terletak
di antara dua buah data yang mengapit kedudukan median. Misalkan data di
atas jika ditambah 1 buah lagi
2, 3, 4, 6, 9, 10, 11, 13
Maka median dari distribusi data tersebut terletak di antara 6 dan 8 dan dapat
dihitung dengan sebagai berikut.
96
Me 6 6 1,5 7,5
2
Minium, dkk. (1993) memberi kasus bagaimana jika datanya berulang seperti
berikut.
5, 7, 8, 8, 8, 8
Mediannya terletak di antara 8 yang pertama dengan 8 yang kedua. Untuk
masalah ini sering kali orang lebih suka menetapkan bahwa mediannya
adalah 8. Namun menurut Minium, dkk., untuk kasus di atas kita harus
menggunakan teknik interpolasi untuk menentukan mediannya. Dalam data
tersebut, 8 mewakili semua nilai antara batas riil di bawah 7,5 dan batas riil
atas 8,5 (masalah batas bawah dan batas atas sudah dibahas pada tabel
distribusi frekuensiModul 2). Oleh karena itu median dari distribusi data di
3.8 Statistika Pendidikan
atas terletak setelah 8 yang pertama, atau seperempat selang lewat lebar
1
interval 1,0. Jadi mediannya adalah 7,5 ( 1,0) 7,75 .
4
Apabila kita telah menyusun datanya dalam bentuk tabel distribusi
frekuensi, maka median dapat dihitung (sebenarnya perkiraan) dengan rumus
sebagai berikut.
1 N F
Me b p 2
f
Dengan:
Me : Median
b : Batas bawah kelas median
p : Panjang interval kelas median
N : Banyak Data
F : Frekuensi kumulatif sebelum kelas median
f : Frekuensi kelas median
Tabel 3.2
Distribusi Frekuensi Kumulatif Relatif
Dari tabel di atas, maka dapat kita hitung mendiannya adalah sebagai berikut.
40 32
M e 71,5 3
12
8
71,5 (3)
12
71,5 2
73,5
X
i 1
i X1 X 2 X 3 Xn
Apabila ada dua kelompok data, maka kita menggunakan simbol lain,
misalkan Y untuk melambangkan himpunan kedua.
3.10 Statistika Pendidikan
X i
X i 1
(rata-rata untuk populasi, dengan N = ukuran populasi)
N
n
X i
X i 1
(rata-rata untuk sampel, dengan n = ukuran sampel)
n
Apabila datanya sudah disusun dalam tabel distribusi frekuensi, maka rata-
rata dihitung dengan menggunakan aturan sebagai berikut.
k
fX i i
X i 1
k
f i 1
i
dengan :
k : banyak kelas interval
Xi : titik tengah kelas interval ke-i
fi : frekuensi kelas interval ke-i
Tabel 3.3
Tabel untuk Perhitungan Rata-Rata dari Data
dalam Tabel Frekuensi
Dengan demikian
4007
X 80,14
50
Dan apabila kita gunakan tabel distribusi lainnya untuk menghitung rata-rata,
maka diperoleh
Tabel 3.4
Tabel untuk Perhitungan Rata-Rata dari Data
dalam Tabel Frekuensi
SKOR Xi fi Xi fi
96 – 98 97 1 97
93 – 95 94 0 0
90 – 92 91 2 182
87 – 89 88 7 616
84 – 86 85 10 850
81 – 83 82 6 492
78 – 80 79 8 632
75 – 77 76 4 304
72 – 74 73 3 219
69 – 71 70 4 280
66 – 68 67 3 201
63 – 65 64 0 0
60 - 62 61 2 122
Jumlah 50 3995
3.12 Statistika Pendidikan
Tabel 3.5
Pendapat Responden Tentang Film
E G F P
Purple Passion 0 10 40 50
Puzzle Me Not 5 25 55 15
Sumber: Minium, dkk. (1993)
Dari ilustrasi tabel di atas, modusnya dituliskan pada sel yang diarsir,
pembaca dapat dengan mudah menyimpulkan kualitas film-film melalui
modus dalam klasifikasi-klasifikasi tersebut. Dengan demikian, modus
merupakan cara untuk mempercepat kerja seseorang dalam memilih film-film
mana yang akan ditontonnya.
Ukuran gejala pemusatan kedua adalah rata-rata. Seperti sudah
dijelaskan di atas, bahwa rata-rata banyak berperan dalam statistika
inferensial. Namun sekarang kita akan membahas sifat rata-rata sebagai salah
satu ukuran gejala pemusatan (statistika deskriptif). Rata-rata merupakan
ukuran yang sensitif atau sering dikatakan juga responsif. Hal ini disebabkan
apabila kita menaikkan atau menurunkan nilai skor yang mana saja dari data
kita, maka akan terjadi perubahan pada rata-rata. Penyebabnya adalah rata-
n
rata sangat bergantung pada jumlah data X i . Apabila kita mengubah
i 1
salah satu nilai data, maka jumlah data juga akan berubah.
Selain responsif, rata-rata dapat dipandang sebagai titik kesimbangan
dari suatu distribusi. Ini makna yang paling mudah ditafsirkan dari rata-rata.
Bayangkan oleh Anda tentang mekanika, dalam hal ini jungkat-jungkit. Pada
jungkat-jungkit tentunya ada titik tumpu (titik keseimbangan), papan dengan
berat diabaikan, dan skor-skor suatu distribusi yang tersebar pada papan
tersebut. Untuk lebih jelasnya, perhatikan ilustrasinya dari gambar berikut.
3.14 Statistika Pendidikan
1 2 3 4 5 6 7 8 12 12
X 6
X X 15 X X 15
Gambar 3.2
Rata-Rata sebagai Titik Kesimbangan Data
Jika kita menghitung XX sebelah kiri rata-rata dan sebelah kanan
rata-rata, maka hasilnya akan sama, yakni 15. Dengan demikian jungkat-
jungkit tersebut akan berada dalam posisi yang seimbang.
Dari hasil di atas juga kita peroleh bahwa apabila kita
menghitung X X , maka hasilnya akan sama dengan nol (0). Untuk
n
i 1
Tabel 3.6
Gaji Pemain Atalanta Pada Tahun 1989
Nama Pemain Besar Gaji ($) Nama Pemain Besar Gaji ($)
Murphy 2.000.000 Glavine 117.500
Sutter 1.729.167 Treadway 95.000
Davis 886.667 Smoltz 86.000
Perry 662.500 Blauser 82.000
Thomas 485.000 Gregg 82.000
McDowell 405.000 Castillo 71.000
L. Smith 400.000 Berroa 70.500
Benedict 370.000 Clary 68.000
Evans 322.000 Lillinquist 68.000
Eirchon 272.000 Stanton 68.000
Russell 145.000 Valdez 68.000
Alvarez 125.000 Wetherby 68.000
P. Smith 125.000 Whited 68.000
Boever 124.000
Sumber : Minium, dkk. (1993)
Gaji yang merupakan median dari ke-27 gaji pemain tersebut adalah
$124.500, tetapi rata-rata dari gajinya adalah $335.753,11 yang besarnya
hampir tiga kali lebih besar dari median. Gaji untuk dua pemain termahal,
yakni Murphy ($2.000.000) dan Sutter ($ 1.729.167) sekitar tiga kali dari
pemain termahal ketiga (Davis). Gaji dua pemain termahal sangat
mempengaruhi keseluruhan (jumlah total) gaji pemain, dan hal tersebut
3.16 Statistika Pendidikan
Dalam grafik yang simetri, harga-harga ketiganya akan sama. Dan apabila
kurvanya miring ke kiri atau ke kanan, hubungan empirik dari model
matematika di atas dapat diandalkan. Keterkaitan antara ukuran-ukuran
gejala pemusatan dengan kemiringan atau kecenderungan kurva distribusi
dapat terlihat dari gambar berikut.
Gambar 3.3
Pola Kemiringan Kurva Distribusi Berdasarkan Ukuran Gejala Memusat
B. UKURAN LETAK
Ada tiga ukuran letak yang digunakan dalam statistika, yakni kuartil,
desil, dan persentil. Ukuran letak mempunyai fungsi yang hampir sama
dengan ukuran gejala memusat, yakni melihat informasi kecenderungan
distribusi data.
Kuartil membagi distribusi data menjadi empat kelompok yang sama
banyak melalui kuartil ke-1 atau Q1, kuartil ke-2 atau Q2 kuartil ke-3 atau Q3.
Untuk data mentah, letak kuartil ke-i dapat ditentukan dengan rumus
i n 1
Letak Qi data ke , i 1, 2,3
4
3.18 Statistika Pendidikan
Contoh 3.5
Misalkan diketahui sampel dengan data yang sudah tersusun sebagai berikut.
2, 5, 6, 7, 8, 10, 11, 12, 15, 16, 16, 17
4 .
Jadi nilai Q1 data ke -3 1
4 data ke-4 - data ke-3 6 14 7 6 6 14 .
2 12 1
Letak Q2 data ke data ke-6 2
1
4
Jadi nilai Q2 data ke -6 12 data ke-7 - data ke-6 10 12 11 10 10 12 .
3 12 1
Letak Q3 data ke data ke-9 4
3
4
Jadi
nilai Q3 data ke -9 34 data ke-10 - data ke-9 15 34 16 15 15 34 .
Dengan demikian, jika digambarkan masing-masing kuartil dari data tersebut
adalah sebagai berikut.
6 14 10 12 15 34
Secara grafik, letak kuartil dapat digambarkan dalam grafik atau diagram
Bloxplot, yakni sebagai berikut.
MPDR5202/MODUL 3 3.19
Gambar 3.4
Contoh Diagram Boxplot
Adapun jika datanya sudah dinyatakan dalam tabel distribusi frekuensi, maka
untuk menentukan kuartil atau lebih jelasnya pendekatan dari kuartil dapat
dihitung dengan rumus sebagai berikut.
i nF
Qi b p 4
f
i 1,2 ,3
Dengan :
b : batas bawah kelas Qi, yakni kelas interval di mana Qi akan terletak
p : panjang kelas interval Qi
F : jumlah frekuensi kumulatif dengan tanda kelas lebih kecil dari tanda
kelas Qi
f : frekuensi kelas Qi
sebagai contoh perhatikan tabel frekuensi kumulatif di bahwa, yakni
Contoh 3.6
Tabel 3.7
Distribusi Frekuensi Kumulatif Relatif
1 80 15
Q1 65,5 3 4 65,5 3(0, 45) 66,85 .
11
1 80 32
Q2 71,5 3 2 71,5 3(0, 67) 73,51 .
12
Dan
3 80 53
Q3 77,5 3 4 77,5 3(0,875) 80,125
8
Andaikan data di atas merupakan skor ulangan siswa, maka sebanyak 75%
siswa mendapat nilai ulangan paling besar 80,125, sedangkan 25% lagi
paling rendah mendapat nilai ulangan 80,125.
Jika kumpulan data dibagi ke dalam 10 bagian yang sama banyak, maka
didapat sembilan pembagi dan tiap pembagi dinamakan desil. Untuk
menghitung desil dari data mentah prinsipnya sama dengan menentukan
kuartil, yakni ditentukan terlebih dahulu letaknya dengan rumus
i n 1
Letak Di data ke , i 1, 2,3, ,9
10
MPDR5202/MODUL 3 3.21
i nF
Di b p 10
f
i 1,2 ,3, ,9
Cobalah Anda hitung D2 dan D5 dari data yang telah disusun pada tabel 3.7.
Ukuran letak yang ketiga adalah persentil, yakni membagi data menjadi
100 bagian sama banyak. Dan kita akan memperoleh 99 pembagi yang
dinamakan dengan persentil pertama, kedua, dan seterusnya hingga persentil
ke-99. Dan untuk persentilnya ke-I, dilambangkan dengan Pi dengan i = 1, 2,
3, …, 99.
Untuk data mentah, perhitungan Pi prosedurnya sama dengan
perhitungan Ki dan Di, dengan letak persentilnya dihitung melalui rumus
berikut.
i n 1
Letak Pi data ke , i 1, 2,3, ,99
100
Apabila datanya dalam tabel frekuensi, maka menentukan desil ke-i dihitung
dengan aturan sebagai berikut.
i nF
Pi b p 100
f
i 1,2 ,3, ,99
Cobalah Anda hitung P25 dan P75 dari data yang telah disusun pada tabel 3.7
dan bandingkan hasilnya dengan Q1, Q2 dan Q3 yang telah dihitung.
C. UKURAN PENYEBARAN
Gambar 3.5
Kemungkinan Dua Distribusi Kurva Berdasarkan
Rata-Rata dan Simpangan Baku
1. Rentang
Rentang atau jangkauan merupakan ukuran variabilitas yang paling
sederhana dan kita sudah mengetahui serta menggunakannya dalam
penyusunan tabel distribusi frekuensi. Rentang dihitung dengan
mengurangkan skor terbesar dengan skor terkecil dari skor data mentah.
Ukuran rentang menurut Sudjana (1989) banyak digunakan dalam bidang
industri. Dalam bidang pendidikan, rentang biasa digunakan untuk melihat
jarak perbedaan maksimum antara siswa yang mendapat skor terendah
dengan siswa yang memperoleh skor tertinggi.
1
Varians Populasi : 2 X X
2
X X atau s 2
1 SS x
2
Varians sampel : s 2 ,
n 1 n 1
X 2 2 XX X 2
X 2 2 XX X 2
X X
2 2
X 2
2 n
n n
X X
2 2
X 2
2
n n
X
2
X2
n
X
2
Jadi SS X X 2
n
Contoh 3.7:
dari contoh data
Diperoleh tabel:
3.26 Statistika Pendidikan
Tabel 3.8
Tabel untuk Membantu Perhitungan Varians
X X
2
X X2
2 4 68,89
5 25 28,09
6 36 18,49
7 49 10,89
8 64 5,29
9 81 1,69
10 100 0,09
11 121 0,49
12 144 2,89
15 225 22,09
16 256 32,49
16 256 32,49
17 289 44,89
134 1650 268,77
= 10,3
s 2
(Sudjana, 1989).
n n 1
X
Rumus ini membantu kita ketika data sudah disusun atau disajikan dalam
tabel frekuensi, yakni sebagai berikut.
MPDR5202/MODUL 3 3.27
2
k
k
f X X
k
n fi X i2 fi X i
2
i i
sX2 i 1
atau sX2 i 1 i 1
n 1 n n 1
Dengan:
K : banyak kelas interval
fi : frekuensi kelas interval ke-i
Xi : tanda kelas (titik tengah kelas) interval ke-i
Contoh 3.8:
Sebagai contoh, perhatikan data pada tabel berikut.
Tabel 3.9
Tabel untuk Membantu Perhitungan Varian
Dari tabel di atas, maka kita dapat menghitung varainsnya sebagai berikut.
ada sedikit perbedaan dibandingkan rata-rata. Jika setiap skor ditambah atau
dikurangi suatu konstanta tertentu, maka rata-ratanya juga bertambah atau
berkurang sebesar konstanta penambah dan pengurangnya. Tetapi hal
tersebut tidak terjadi pada varians. Untuk lebih jelasnya perhatikan contoh
berikut.
Contoh 3.9:
2, 5, 6, 7, 8, 9, 10, 11, 12, 15, 16, 16, 17
Rata-rata dan varians dari data tersebut adalah 10,3 dan 22,3975 atau
simpangan bakunya 4,733. Jika misalkan kita tambahkan seluruh skor dengan
2, maka datanya menjadi
4. Angka Baku
Misalkan kita mempunyai sampel yang berukuran n dengan rata-rata
X dan simpangan bakunya s. Dari data tersebut dapat dibentuk data baru,
yakni Z1, Z2, …, Zn dengan rumus transformasi sebagai berikut.
Xi X
Zi untuk i = 1, 2, 3, …, n
s
Data dalam bentuk Zi untuk setiap i dinamakan angka/skor baku. Skor-Z ini
sangat penting ketika kita bekerja dalam statistika. Dapat Anda tunjukkan
bahwa untuk sebarang distribusi data, X, rata-rata dan simpangan baku dari
skor bakunya berturut-turut 0 dan 1.
3.30 Statistika Pendidikan
Salah satu contoh penting dari kegunaan angka baku adalah sebagai
berikut.
Contoh 3.10
Seorang siswa memperoleh hasil ujian matematika, bahasa Indonesia,
PKn, dan IPA. Pada pelajaran matematika siswa tersebut memperoleh
nilai 86 dengan rata-rata dan simpangan baku kelompoknya (kelas)
berturut-turut 78 dan 10,0. Nilai ujian Bahasa Indonesianya 90 dengan
rata-rata kelasnya 86 dan simpangan bakunya 11,8. Nilai PKn 88 dengan
rata-rata kelompoknya 84 dan simpangan bakunya 12,4. Dan untuk IPA
dia memperoleh nilai 80 dengan rata-rata kelasnya 75 dan simpangan
baku 9,6. Dalam mata pelajaran mana anak tersebut mencapai
kedudukan yang lebih baik dalam kelompoknya?
Gambar 3.6
Persentase Sebaran Data Berdasarkan Rata-Rata dan Simpangan Baku
Dari gambar di atas, skor dari suatu distribusi data yang menyebar
normal 99,7% akan terletak pada X 3s dan X 3s atau apabila skornya
sudah disusun dalam angka baku, maka skor-skor akar terletak di antara -3
dengan 3. Jadi apabila ada skor dengan angka bakunya yang lebih kecil dari -
3 atau lebih besar dari +3, maka skor tersebut merupakan pencilan.
3.32 Statistika Pendidikan
4. Koefisien Variasi
Pada bagian atas kita telah membahas variablitis atau keragaman suatu
distribusi data. Namun kita kesulitan dalam membandingkan keragaman
beberapa distribusi data yang satuan pengukuran atas skor-skornya berbeda.
misalkan kita ingin membandingkan keragaman barat badan siswa dengan
keragaman tinggi badan siswa pada suatu kelas, atau juga dengan keragaman
uang sakunya. Kita ketahui bahwa satuan ketiga pengukuran tersebut
berbeda, sehingga jika kita membandingkan secara langsung dari simpangan
bakunya maka dapat dipastikan akan bias. Satuan pengukuran tinggi badan
siswa biasanya menggunakan sentimeter (cm), berat badan dengan satuan
kilogram (kg), dan uang saku siswa tentunya satuan rupiah. Jika dihitung
simpangan baku masing-masing pengukuran ketiganya, maka sangat
mungkin bahwa nilai numerik keragaman berat badan lebih kecil
dibandingkan dengan tinggi badan, dan tentunya juga akan lebih kecil dari
uang saku siswa. Untuk itu, sama dengan membandingkan skor melalui
angka baku, kita perlu ukuran lain yang hasilnya standar. Ukuran yang
digunakan adalah koefisien variasi. Dan koefisien variasi tidak bergantung
pada satuan yang digunakan, karenanya dapat dipakai untuk membandingkan
variasi relatif beberapa kumpulan data dengan satuan berbeda (Sudjana,
1989).
Koefisien variasi, dilambangkan dengan KV, merupakan ukuran dispersi
relatif yang digunakan untuk membandingkan variasi dua atau lebih
kelompok data.
s
KV 100%
X
Untuk lebih jelasnya perhatikan contoh berikut.
Contoh 3.11
Lampu jenis A rata-rata mampu menyala selama 1.500 jam dengan
simpangan baku 275 jam. Lampu jenis B rata-rata mampu menyala selama
MPDR5202/MODUL 3 3.33
1.750 jam dengan simpangan baku 300 jam. Tentukan lampu mana yang
memiliki kualitas lebih baik!
Dari data di atas, kita dapat menghitung koefisien variasi masing-masing
lampu sebagai berikut.
275 300
KVA 100% 18,3% dan KVB 100% 17,1%
1500 1750
Dari hasil perhitungan di atas, diperoleh informasi bahwa lampu jenis B
memiliki koefisien variasi yang lebih kecil daripada lampu jenis A. Dengan
kata lain, kemampuan menyala lampu jenis B lebih seragam dibandingkan
dengan lampu jenis A. Karena itu dapat disimpulkan bahwa kualitas lampu
jenis B lebih baik daripada lampu jenis A.
LAT IH A N
4) Misalkan diberikan dua kelompok data tentang waktu reaksi dari 2 jenis
pemberian stimulus sebagai berikut.
Waktu Stimulus Sederhana Stumulus Kompleks
(dalam detik) f F
300 – 319 1 3
280 – 299 1 6
260 – 279 2 10
240 – 259 4 18
220 – 239 3 25
200 – 219 6 35
180 – 199 11 28
160 – 179 12 16
140 – 159 8 7
120 – 139 2 2
Jumlah 50 150
a.
Carilah simpangan antar kuartilnya keduanya!
b.
Himpunan skor manakah yang menurut Anda variasinya lebih
besar? Berikan alasan
5) Misalkan diberikan skor 2, 5, 7, 8, 9, 11, dan 14.
a. Carilah S dan simpangan antar kuartilnya!
b. Misalkan dimasukkan skor ekstrem 24, carilah S dan simpangan
bakunya! Berapakah kenaikan S dan simpangan kuartilnya?
c. Generalisasi apa yang dapat diambil dari kasus di atas?
6) Berat 10 bungkus makanan kecil mempunyai rata-rata 278 gram per
bungkus dengan simpangan baku 9,64 gram. Bila ke-10 bungkus tersebut
dibeli dari 10 toko yang berbeda dengan harga rata-rata Rp12.000,00 per
bungkus dengan simpangan baku Rp100,00, dapatkah disimpulkan
bahwa berat bungkus-bungkus itu relatif lebih homogen dibandingkan
dengan harganya!
10(50) 20(40)
2) Rata-rata untuk n = 30 adalah X 43,33 .
30
n X n X nk X k
Aturan umumnya X 1 1 2 2
n1 n2 nk
3) Dari data pada tabel dapat dihitung:
Kelompok 1
214,5 163,7
Q1 163,7 dan Q3 214,5 sehingga SK1 25, 4
2
Kelompok 2
239,7 188, 4
Q1 188,4 dan Q3 239,7 sehingga SK1 25,65
2
Dari kedua hasil di atas sedikit berbeda, atau hampir sama.
4) Dari data tersebut diperoleh SX= 3,92 dan SK = 3. Setelah ditambah
dengan skor 24, diperoleh SXbaru = 6,72 dan SKbaru = 3,875. Simpangan
baku sangat dipengaruhi oleh pencilan, tetapi SK tidak terlalu
dipengaruhi oleh adanya pencilan. Simpangan baku lebih baik dalam
mencerminkan sebaran data.
5) Gajinya Rp69.600.000,
6) Untuk membandingkannya digunakan koefisien variasi.
9, 64
Untuk berat : KVbungkus 100% 3, 47%
278
100
Untuk harga : KVharga 100% 8,33%
12000
Dari hasil di atas, berat bungkus-bungkus lebih homogen.
R A NG KU M AN
TES F OR M AT IF 1
Waktu (detik) f
241 atau lebih 4
181 – 240 5
121 – 180 8
61 – 180 5
1 - 60 3
Persen
Sekolah Jumlah Siswa Tidak Lulus
Tidak Lulus
A 300 30 10,0
B 600 20 3,3
C 450 90 20,0
Rata-rata X 10,4
a. Bagaimana rata-rata yang tidak lulus sebanyak 10,4% diperoleh dari
data tersebut, jelaskan!
b. Berapa persen rata-rata yang lulus dari tiap sekolah?
5) Bagaimana hubungan antara X , Me, dan M0? Jika diketahui Median dan
Modus skor ujian siswa adalah 67,8 dan 84,9, dapatkah rata-ratanya
dihitung dan ke arah mana kecenderungan sebaran datanya? Lengkapi
penjelasan Anda dengan grafik!
6) Misalkan distribusi X adalah : 15, 14, 11, 11, 9, dan 6 dan distribusi Y
adalah 17, 16, 13, 13, 11, dan 8.
a. Carilah varians dan simpangan baku kedua distribusi tersebut
dengan metode simpangan!
b. Dari hasil a) varians dan simpangan baku kedua distribusi, X dan Y,
hasilnya sama, mengapa?
7) Periksalah bahwa varians dari data: 4, 9, 3, 6, 4, dan 7 adalah 5,1.
Dengan menggunakan hasil tersebut hitunglah
a. Varians dari data : 12, 27, 9, 18, 12, dan 21.
b. Varians dari data : 9, 14, 8, 11, 9, dan 12
8) Ada tiga calon masing-masing datang dari tiga sekolah tingkat akhir
yang berbeda. Di sekolahnya masing-masing calon A mendapat nilai
matematika 83 sedangkan rata-rata kelasnya 62 dan simpangan bakunya
16. Calon B mendapat nilai 97 dengan rata-rata kelasnya 83 dan
simpangan bakunya 23, sedangkan calon C mendapat nilai 87 dengan
rata-rata kelasnya 65 dan simpangan bakunya 14. Dari ketiganya akan
dipilih satu orang calon, sebaiknya calon mana yang diterima?
MPDR5202/MODUL 3 3.39
Kegiatan Belajar 2
A. ANALISIS KORELASI
Seperti yang dijelaskan di atas bahwa tujuan dari analisis korelasi adalah
untuk mengetahui kekuatan hubungan di antara dua variabel, dan jika ada
hubungan bagaimanakah arah hubungan dan seberapa besar hubungan
tersebut. Data pada analisis korelasi dapat berupa data kualitatif maupun
kuantitatif, yang masing-masing mempunyai ukuran korelasi sendiri-sendiri.
Sebelum kita memulai analisis kita perhatikan dahulu apakah data yang
akan kita peroleh berskala nominal, ordinal, interval atau rasio? Sebab
perlakuan terhadap data tersebut akan berbeda ketika kita akan melakukan
analisis korelasi. Untuk data yang ukuran skalanya interval atau rasio analisis
korelasi yang digunakan adalah Pearson Correlation atau istilah lainnya
adalah Product Moment Correlation. Untuk data yang berskala ordinal
MPDR5202/MODUL 3 3.41
Tabel 3.10
Data Tinggi Badan Orang Tua dan Keturunannya Hasil Observasi Galton
Pertama kita baca bilangan yang ada dalam sel pada tabel di atas.
Perhatikan angka 36 yang berada pada baris 66–67 (tinggi turunan) dan
kolom 67–68 (tinggi orang tua). Angka 36 merupakan frekuensi
menunjukkan banyaknya 36 anak (keturunan) yang tinggi badannya antara 66
–67 inci serta orang tuanya yang bertinggi badan antara 67 – 68 inci. Dari
data tersebut, Galton menyimpulkan bahwa para orang tua yang lebih tinggi
secara umum (tetapi tidak mutlak) akan menghasilkan keturunan yang juga
relatif tinggi. Hubungan tersebut terlihat jelas dari telusuran terhadap median
pada masing-masing kelompok data setiap kolomnya. Garis lurus pada tabel
MPDR5202/MODUL 3 3.43
Tabel 3.11
Hasil Pengukuran Stress (X) dan Kesulitan Makan (Y)
Gambar 3.7
Diagram Pencar Variabel Stres (X) dan Kesulitan makan (X)
Langkah 1.
Tentukan satu variabel sebagai X dan lainnya Y. Penentuan variabel dapat
dilakukan secara acak, artinya penetapan X dan Y dipilih secara bebas.
Namun demikian apabila digunakan untuk memprediksi, maka X haruslah
merupakan variabel bebas/prediktor, dan Y sebagai variabel terikat.
Langkah 2.
Gambar sumbu-sumbu vertikal dan horizontal yang panjangnya kira-kira
sama. Perlu diketahui bahwa sumbu-sumbu ini berbeda dengan yang dipakai
dalam membuat kurva dari distribusi frekuensi.
MPDR5202/MODUL 3 3.45
Langkah 3.
Tempatkan nilai-nilai X yang tinggi ke kanan sumbu horizontal, dan nilai-
nilai Y yang tinggi ke puncak sumbu vertikal. Beri label titik-titik dengan
baik sepanjang masing-masing sumbu.
Langkah 4.
Untuk setiap pasang skor, cari titik potong untuk nilai-nilai X dan Y dan
tandai dengan noktah/titik.
Langkah 5.
Beri nama masing-masing sumbu sesuai dengan variabelnya dan juga nama
judul diagram yang telah kita buat.
Seperti yang dijelaskan di atas bahwa diagram pencar sangat baik
sebagai langkah awal untuk melihat hubungan antara dua variabel. Prosedur
Person mengasumsikan hubungan dasar linear yang ditandai dengan garis
lurus. Namun demikian, tidak semua hubungan antara dua variabel sifatnya
linear. Minimum, dkk. (1993) memberi contoh tentang hubungan antara efek
tingkat dosis pentobaribital suatu barbinat pada tekanan hati pada
penambahan makan dalam merpati. Hubungan diantar keduanya,
pentobarbital dengan kecepatan sesudah/sebelum diberikan obat ternyata
berbentuk curvilinear, yakni titik-titik pada diagram pencar berkumpul di
sekitar suatu kurva yang tentunya tidak linear.
Selain hubungan antar variabel, diagram pencar juga dapat memberikan
informasi sifat hubungan keduanya. Jika skor-skor yang tinggi pada variabel
X umumnya berpasangan dengan skor-skor yang tinggi pada variabel Y, dan
sebaliknya skor-skor yang rendah pada variabel X berpasangan dengan skor-
skor yang rendah pada variabel Y, maka arah korelasi antara kedua variabel
tersebut adalah positif. Dalam diagram akan nampak titik-titiknya terpencar
meliuk dari arah kiri yang rendah ke sebelah kanan atas. Hal tersebut akan
tetap sama pencarannya walaupun kita terbalik dalam menempatkan variabel
X dan Y. Misalkan untuk contoh di atas, kita ubah stres menjadi variabel Y
dan kesulitan makan menjadi variabel X, maka diagram pencarannya akan
tetap condong ke sebelah kanan. Untuk itu coba Anda buat diagram
pencarnya!
3.46 Statistika Pendidikan
1. Derajat Korelasi
Di atas kita sudah membahas tentang kecenderungan hubungan atau
asosiasi antara dua variabel. Pertanyaan yang muncul, bagaimana kita
mengetahui kuat atau lemahnya hubungan di antara kedua variabel. Tingkat
asosiasi yang dimiliki bersama oleh dua variabel ditandai oleh koefisien
korelasi, yang pertama kali dikemukakan oleh Pearson pada tahun 1896
(Minium, dkk., 1993). Galton adalah orang yang pertama menggunakan
simbol r untuk koefisien korelasi sampel. Atau sering kali menggunakan
subskrip rXY . Koefisien ini dihitung dengan menggunakan skor-skor kedua
variabelnya.
Secara matematis, nilai korelasi merupakan rasio antara kovarians kedua
distribusi data dengan kedua variansnya. Karena nilai kovarians dapat
bernilai negatif, nol, atau positif, dan varians akan selalu bernilai positif,
maka akibatnya nilai korelasi antara dua variabel dapat bernilai negatif, nol,
dan positif sebagaimana yang telah dijelaskan di atas. Adapun rentang dari
korelasi adalah –1 r +1 atau antara 0 1. Tanda positif dan negatif
MPDR5202/MODUL 3 3.47
Tabel 3.12
Pemaknaan dari Korelasi Sejati
X i X Yi Y
1 n
Untuk Sampel : S XY (2)
n 1 i 1
rXY
X X Y Y (5)
n 1 S X SY
Rumus tersebut diturunkan dari rumus korelasi (4). Dan apabila dimisalkan
bahwa x X X dan y Y Y , maka dari (5) akan diperoleh
rXY
xy (6)
x y
2 2
Dengan:
X Y
xy XY n
X
2
x X 2
n
Y
2
y Y 2 n
3.50 Statistika Pendidikan
rXY
Z X ZY (8)
n 1
X X Y Y
Dengan Z X dan ZY dan n adalah banyaknya pasangan skor.
SX SY
Ketika kita menghitung koefisien korelasi melalui rumus-rumus di atas, maka
secara matematis hasilnya akan sama.
Untuk lebih jelasnya bagaimana menghitung koefisien korelasi melalui
rumus-rumus di atas, ita perhatikan contoh berikut.
Contoh 3.12:
Kita kembali pada data stress (X) dan kesulitan makan (Y) dari 10 orang
siswa di atas. Kita mulai dengan rumus koefisien korelasi (5). Untuk
membantu perhitungan kita gunakan tabel berikut.
Tabel 3.13
Perhitungan Koefisien Korelasi
Siswa X Y
X X Y Y X X Y Y X X Y Y
2 2
Siswa X Y
X X Y Y X X Y Y X X Y Y
2 2
X X
2
492, 4
b. SX 54, 71 7,39
n 1 9
Y Y
2
662, 4
c. SY 73, 6 8,58
n 1 9
Jadi jika menggunakan rumus (5) diperoleh koefisien korelasi antara
stress dan kesulitan makan adalah
r
X X Y Y 385, 6
385, 6
0, 676
n 1 S X SY 9 7,39 8,58 570, 66
d. S XY
X X Y Y
385,6
42,84
n 1 9
42,84 42,84
Jika menggunakan rumus (4) maka r 0, 676
7,39 8,58 63, 41
hasilnya sama dengan menggunakan rumus (5) di atas.
Apabila dalam menghitung koefisien korelasinya menggunakan angka
kasar dan angka baku, maka perhitungannya adalah sebagai berikut.
Tabel 3.14
Perhitungan Koefisien Korelasi
Siswa X Y X2 Y2 XY ZX ZY Z X ZY
A 17 9 289 81 153 0.054054 -0.51282 -0.02772
B 8 13 64 169 104 -1.16216 -0.04662 0.05418
C 8 7 64 49 56 -1.16216 -0.74592 0.866881
D 20 18 400 324 360 0.459459 0.536131 0.24633
E 14 11 196 121 154 -0.35135 -0.27972 0.09828
F 7 2 49 4 14 -1.2973 -1.32867 1.723682
G 21 5 441 25 105 0.594595 -0.97902 -0.58212
H 22 15 484 225 330 0.72973 0.18648 0.13608
3.52 Statistika Pendidikan
Siswa X Y X2 Y2 XY ZX ZY Z X ZY
I 19 26 361 676 494 0.324324 1.468531 0.47628
J 30 28 900 784 840 1.810811 1.701632 3.081333
Jumlah 166 134 3248 2458 2610 6.073206
Dari tabel di atas, maka kita dapat menghitung koefisien korelasinya sebagai
berikut.
n XY X Y
rXY
n X 2 X
2
n Y 2 Y
2
10 2610 166 134
10 3248 166
2
10 2458 134
2
0, 676
Dan juga
rXY
Z X ZY
6, 073
0, 675
n 1 9
Contoh.3.13:
Misalkan diberikan data dari dua kelompok sebagai berikut.
X 4 5 7 8 9 12 16
Y 100 120 118 130 128 130 120
a. Hitunglah rata-rata dan simpangan baku keduanya!
b. Tentukan koefisien korelasi dari X dan Y!
c. Jika setiap data dari variabel X dikurangi dengan 100, hitung rata-rata,
simpangan baku yang baru. Kemudian hitung kembali korelasi dari
kedua variabel tersebut!
Jawab.
a. Rata-rata dan simpangan baku dari X dan Y adalah sebagai berikut.
61 846
X 8, 71 dan Y 120,86
7 7
103, 43 662,86
SX 4,15 dan SY 10,51
6 6
b. Dari hasil a), maka dapat kita hitung korelasinya adalah sebagai berikut.
r
X X Y Y 125, 71
0, 48
n 1 S X SY 6 4,1510,51
c. Jika data variabel Y dikurangi 100, maka jika misalkan Y 1 sebagai
variabel yang barunya, maka datanya adalah sebagai berikut.
X 4 5 7 8 9 12 16
Y1 0 20 18 30 28 30 20
Dari tabel di atas, kita hitung rata-rata dan simpangan baku dari Y1
146 662,86
Y1 20,86 dan SY1 10,51
7 7
Bandingkan hasilnya dengan a), Y1 Y 100 dan SY 1 SY .
Adapun korelasi dari X dan Y1 adalah sebagai berikut.
r
X X Y1 Y1 125, 71
0, 48 .
n 1 S X SY 1 6 4,1510,51
Dengan demikian koefisien korelasinya sama dengan X dan Y.
Kita juga dapat melihatnya dari diagram pencar keduanya seperti yang
terlihat pada gambar berikut.
3.54 Statistika Pendidikan
Gambar 3.9
Diagram Pencar antara X dan Y
Gambar3.10
Diagram Pencar antara X dan Y1
Jika diperhatikan kedua diagram pencar tersebut sama, hanya ada perubahan
dari nilai Y ke Y1. Jika sumbu horizontalnya dari gambar (a) ditransformasi
ke nol (0), maka diagram pencar tersebut akan ekuivalen.
Dari hasil di atas dapat disimpulkan bahwa koefisien korelasi (r) tidak
dipengaruhi oleh transformasi linear manapun atas skor-skor mentahnya.
Untuk latihan cobalah contoh di atas dihitung kembali oleh Anda, dengan
menambah seluruh skor pada variabel X dengan 100, kemudian lakukan
perhitungan seperti pada contoh tersebut!
MPDR5202/MODUL 3 3.55
Tabel 3.15
Batas-Batas untuk r dengan Derajat Kepercayaan 95%
pada Berbagai Ukuran Sampel
B. REGRESI
d5
d4 d6
d2
d3
Gambar 3.11
Contoh Pendekatan Garis Regresi
Perhatikanlah diagram pencar dari enam pasang data (titik) pada diagram
di atas dengan garis regresinya. Nilai prediksi dari garis regresi terhadap nilai
aktual dari Y, misalkan dengan Y’. Dalam kenyataannya garis regresi
tersebut ada yang tepat melalui titik-titik pasangan data, ada juga yang tidak
tepat. Jika garis regresi melalui titik-titik pengamatan, maka garis tersebut
memprediksi dengan tepat Y’ atau Y = Y’, tetapi apabila garis regresi
tersebut tidak melalui titik-titik pengamatan, maka Y Y’ . Misalkan
kesalahan/penyimpangan prediksi garis regresi terhadap pengamatannya
adalah d, atau secara matematik kita tuliskan dalam bentuk d = Y – Y’.
Pendekatan kuadrat terkecil yang digunakan oleh Pearson adalah menentukan
persamaan garis sedemikian hingga d 2 sekecil mungkin. Sebagai catatan
yang diminimalkan jumlah kuadrat dari selisih, mengapa tidak
meminimalkan jumlah selisih atau d ? Silakan dicari alasannya.
Seperti diketahui pada aljabar atau ilmu ukur analitik bidang di sekolah
menengah (SMP atau SMA) bentuk persamaan garis lurus adalah sebagai
berikut.
Y ' a bX
3.58 Statistika Pendidikan
Dengan:
Y’ menyatakan hampiran dari Y.
a menyatakan intersep atau perpotongan dengan sumbu vertikal.
b menyatakan kemiringan garis atau gradien.
n n n
n X iYi X i Yi
b i 1 i 1 i 1
2
n
n
n X i2 X i
i 1 i 1
a Y bX
Contoh. (diadopsi dari Walpole, 1995)
MPDR5202/MODUL 3 3.59
Tabel 3.16
Data Skor Intelegensia (X) dan Skor Matematika (Y)
Tabel 3.17
Tabel Bantun untuk Perhitungan Koefisien Regresi
Siswa X Y X^2 XY
1 65 85 4225 5525
2 50 74 2500 3700
3 55 76 3025 4180
4 65 90 4225 5850
5 55 85 3025 4675
6 70 87 4900 6090
7 65 94 4225 6110
8 70 98 4900 6860
9 55 81 3025 4455
10 70 91 4900 6370
11 50 76 2500 3800
12 55 74 3025 4070
Jumlah 725 1011 44475 61685
Rata-Rata 60.42 84.25
3.60 Statistika Pendidikan
Gambar 3.12
Diagram Pencar dan Garis Regresi dari Skor Intelegensia
dan Skor Matematika
Dari hasil di atas tidak ada satu pun siswa yang skor intelegensianya 65
memperoleh skor matematika 88 (misalkan dibulatkan). Skor 88 yang
MPDR5202/MODUL 3 3.61
diperoleh dari persamaan regresi ditafsirkan sebagai skor ramalan atau nilai
harapan bagi semua siswa yang skor intelegensianya 65.
Y Y '
2
SYX
n2
Ketika korelasi sempurna, setiap nilai dari Y Y ' adalah nol dan kesalahan
2
baku penaksirannya juga nol SYX 0 . Dengan demikian nilai dari SYX
akan mempunyai range dari nol ketika korelasi sempurna sampai dengan S Y
ketika antara X dan Y tidak ada korelasi. Kondisi keragaman dari SYX dapat
terlihat seperti gambar berikut.
3.62 Statistika Pendidikan
Nilai-nilai dari
(Y – Y’) cukup
(Yi – Y’) besar sehingga
korelasinya
kecil. Hal ini
menimbulkan
nilai SYX yang
besar
Nilai-nilai dari
(Y-Y’) kecil,
sehingga
korelasinya
(Yi – Y’) besar. Hal ini
mengakibatkan
nilai dari SYX
menjadi kecil
Gambar 3.13
Perbandingan Kesalahan Baku dari Penaksiran (SYX)
Sebagai Suatu Fungsi dari (Y – Y’)
Tabel 3.18
Perhitungan SY dan SYX
Y Y Y Y ' Y Y '
2 2
Siswa X Y Y’
Y Y
2
728, 25
SY 8,14 dan
n 1 11
Y Y '
2
186,557
SYX
4,32
n2 10
Dan Anda dapat lihat bahwa Y Y ' 0,003 mendekati nol. Nilainya
tidak sama dengan nol diakibatkan pengaruh pembulatan yang dilakukan
dalam perhitungan.
3.64 Statistika Pendidikan
ZˆY rZ x
Di mana :
ZY : prediksi angka baku dari Y
r : koefisien korelasi antara X dan Y
Z X : angka baku dari X
LAT IH A N
X 65 63 64 68 62 70 66 68 67 69 71
Y 68 66 68 69 66 68 65 71 67 68 70
1) Sifat hubungan :
a. Tidak keduanya
b. Korelasi dan regresi (positif)
c. Korelasi (positif)
d. Korelasi (positif)
e. Korelasi dan Regresi (positif)
f. Tidak keduanya
g. Korelasi dan regresi (positif)
2) Dari data pada tabel diperoleh
a. Diagram pencar
b.
Besar korelasi : r = 0,772
c.
Hasilnya sama
d.
Gunakan tabel 11. Siswa yang mendapat nilai ulangan formatif di
atas median, sekitar 75% juga memperoleh ulangan semester di atas
median dan 25% hasil ulangan semesternya di bawah median.
3) Dari data dapat dihitung persamaan regresinya sebagai berikut.
a. Diagram pencar
MPDR5202/MODUL 3 3.67
b. Yˆ 42,38 0,381X
c. Xˆ 2,546 1,020Y
d. Grafik kedua persamaan
a. Grafik kedua persamaan
Yˆ 42,38 0,381X
72
71
70
69
68
Y
67
Xˆ 2,546 1,020Y
66
65
64
60 62 64 66 68 70 72
X
R A NG KU M AN
TES F OR M AT IF 2
Tes Formatif 1
1) X 7,3 dan Me = 7,25 (Skor 5)
2) Median, karena perhitungan rata-rata tidak dapat dilakukan dengan
menggunakan asumsi untuk titik tengah kelas yang pertama. (Skor 5)
3) Karena X
X , dan misalkan data yang hilang adalah Y, maka
n
3 5 9 1 9 2 0 3 9 Y
4,8
10
48 41 Y
Y 7
Jadi data yang hilang adalah 7. (skor 5)
4) Jumlah keseluruhan yang tidak lulus 140 orang, sedangkan jumlah
seluruh siswa 1350, dengan demikian persentase yang tidak lulus adalah
140
100% 10, 4% .
1350
Dan persentase yang lulus tiap sekolah adalah:
Sekolah A = 90%
Sekolah B = 96,7%
Sekolah C = 80%
Dan keseluruhan rata-rata yang lulus dari ketiga sekolah adalah 100% –
10,4% = 89,6%.
(Skor 5)
5) Hubungan antara ketiganya adalah X Mo 3 X Me . Karena
median dan modusnya 67,8 dan 84,9, maka rata-ratanya adalah 59,25.
Dengan demikian hubungan ketiganya X Me Mo . Kemiringan
distribusinya negatif atau ke arah kiri.
(Skor 5)
6) Misalkan data tersebut merupakan data sampel, maka dengan
menggunakan simpangan dapat dihitung varian dan simpangan bakunya
adalah.
3.72 Statistika Pendidikan
NO X ( X X )2 Y (Y Y ) 2
1 15 9 17 9
2 14 4 16 4
3 11 1 13 1
4 11 1 13 1
5 9 9 11 9
JMLH 60 24 70 24
Dari tabel di atas maka dapat dihitung
24
sX 6 2, 45
4
24
sY 6 2, 45
4
Hasilnya varians dan simpangan baku dari X dan Y adalah sama. Hal ini
disebabkan data dari Y adalah data pada masing-masing X ditambah 2,
sehingga variabilitasnya tetap sama.
(skor 5)
7) Varians data kedua 9 × 5,1 = 45,9 dan varians data kedua adalah 5,1
(skor 5)
8) Untuk memudahkan membandingkan hasil ketiga calon tersebut
digunakan angka baku.
83 62
Untuk calon A : Z 1,3125
16
97 83
Untuk calon B : Z 0, 7087
23
87 65
Untuk calon C : Z 1,5714
14
Dengan demikian urutan dari ketiga calon tersebut adalah C, A, dan B.
Direkomendasikan calon C yang dipilih.
(skor 5)
Test Formatif 2
1) Positif, karena semakin banyak merokok, semakin tinggi peluang
berkembangnya penyakit kanker.
2) Mungkin benar, tetapi tidak menjamin kepercayaannya. Nilai korelasi
sangat dipengaruhi oleh variasi sampling (kesalahan dalam sampling).
MPDR5202/MODUL 3 3.73
Taksiran skor nilai akhir dengan skor masuk 1100 dan 950 adalah
Yˆ 0, 00125 950 0, 75 1,9375 dan
Yˆ 0, 00125 1100 0, 75 2,125
3.74 Statistika Pendidikan
Dari diagram pencar hubungan antara tes awal dan tes akhir adalah
positif, karena data bergerombol miring ke sebelah kanan.
Nilai korelasinya r = + 0,845 dan persamaan regresinya adalah
Y 17,394 1,37 X .
Jika dilihat dari diagram pencar, korelasi dan garis regresi dapat diduga
bahwa hubungannya linear
MPDR5202/MODUL 3 3.75
Daftar Pustaka
Steel, R. G. D. & Torrie, J. H., 1995. Prinsip dan Prosedur Statistika. Suatu
Pendekatan Biometrik. Alih Bahasa: Bambang Sumantri. Jakarta:
Gramedia Pustaka Utama.
PEN D AH U LU A N
Jika kita melapiskan suatu kurva ke atas histogram dalam Gambar 4.1,
bangun kurva yang terbentuk itu mendekati kurva normal berbangun-genta.
Jika kita men-tos 14 koin, bukannya 6, akan ada semakin banyak batang di
dalam histogram, dan kurva normal akan semakin cocok baginya, seperti
diilustrasikan dalam Gambar 4.2. Tampaklah jelas bahwa kurva normal
menjadi suatu aproksimasi yang bagus untuk distribusi relatif yang diperoleh
dari operasi faktor-faktor peluang dalam situasi seperti dideskripsikan tadi.
Jika jumlah koin bertambah terus sampai tak hingga, jumlah batang dalam
histogram pun demikian, dan histogram terus semakin mulus.
Gambar 4.1
Frekuensi-frekuensi Relatif Munculnya “Gambar” yang Diperoleh Saat 6 Koin
Ditos Sebanyak tak Terhingga Kali
MPDR5202/MODUL 4 4.3
Gambar 4.2
Frekuensi-frekuensi Relatif Munculnya “Gambar” yang Diperoleh Saat 10
Koin Ditos Sebanyak tak Terhingga Kali
Antusiasme dari Galton ini tidaklah berlebihan dan layak kita apresiasi.
Teorinya, bagaimanapun, mestilah diperhalus berdasarkan pengetahuan masa
kini.
MPDR5202/MODUL 4 4.5
Jadi sudah tiba saatnya kita mengkaji kurva normal secara lebih dekat.
Kita perlu mengetahui apakah kurva normal itu, apa saja sifat-sifatnya, cara-
cara di mana kurva normal berguna sebagai suatu model statistik, serta
bagaimana menerapkannya di dalam menjawab pertanyaan-pertanyaan.
Setelah menyelesaikan modul ini, Anda diharapkan memiliki
kemampuan:
1. menjelaskan apakah kurva normal itu;
2. menjelaskan sifat-sifat kurva normal;
3. menggunakan kurva normal sebagai suatu model statistik untuk
menyelesaikan soal-soal yang berkaitan dengan statistik.
4.6 Statistika Pendidikan
Kegiatan Be lajar 1
Kurva Normal
1
Apabila kurva normal merupakan suatu model yang tepat untuk kejadian-kejadian
nyata, paling seringkali populasi kejadian-kejadian nyata itulah yang dimodelkan
demikian. Oleh karena itu, dalam bab ini kita akan memakai dan sehubungan
dengan kurva normal daripada X dan S.
MPDR5202/MODUL 4 4.7
Kurva 1
1 Kurva 2
Kurva 3
Kurva4
4 2
Gambar 4.3
Variasi-variasi Kurva Nomal dalam Mean dan Varians
(Diunduh dari: https://irmasafitri07.wordpress.com/)
Gambar 4.4
Hubungan antara distribusi normal (kurva normal)
dengan rata-rata () dan simpangan baku ()
Contoh 4.1
Skor hasil-hasil tes seleksi CPNS yang diikuti oleh seribu orang berdistribusi
normal dengan rata-rata 200 dan simpangan bakunya 30. Dengan memakai
keterangan di atas dan Gambar 4.2, berapakah:
a. banyaknya peserta seleksi yang skornya mulai dari 170 sampai dengan
230?
b. banyaknya peserta seleksi yang skornya mulai dari 200 sampai 260?
c. banyaknya peserta yang akan diterima, apabila syarat yang diterima
CPNS berskor paling rendah 260?
Jawab:
Jika kita misalkan rata-rata 200 adalah , dan simpangan baku 30 adalah ,
maka skor-skor 170 = – 1, 230 = + 1, dan 260 = + 2, sehingga
dengan merujuk pada keterangan yang terdapat dalam Gambar4.4 dapat
diketahui bahwa:
a. proporsi peserta seleksi CPNS yang skornya antara 170 dan 230 sama
dengan area pada kurva normal yang berada di antara – 1dan + 1
yaitu sekitar 68%. Jadi, banyaknya peserta seleksi yang skornya mulai
dari 170 sampai 230 adalah sekitar 1000 68% = 680 orang.
b. proporsi peserta seleksi CPNS yang skornya antara 200 dan 260 sama
dengan area pada kurva normal yang berada di antara dan + 2
1
yaitu 95% = 47,5%. Jadi, banyaknya peserta yang skornya mulai
2
dari 200 sampai 260 adalah sekitar 1000 47,5% = 475 orang.
c. karena proporsi peserta seleksi CPNS yang skornya paling rendah 260
sama dengan area pada kurva normal yang berada di atas + 2 yaitu
sekitar 50% – 47,5% = 2,5%. Jadi, banyaknya peserta seleksi CPNS
yang akan diterima adalah sekitar 2,5% 1000 = 25 orang.
LAT IH A N
2) Skor-skor hasil tes seleksi mahasiswa baru yang diikuti oleh 2000 orang
di sebuah perguruan tinggi berdistribusi normal dengan rata-rata 400 dan
simpangan bakunya 50.
a. Berapakah banyaknya peserta seleksi yang skornya antara 300
sampai 450?
b. Jika yang akan diterima adalah peserta dengan skor paling rendah
500, berapakah banyaknya calon yang akan diterima?
c. Jika peserta tes yang akan diterima adalah mereka yang skornya
termasuk 16% terbaik, carilah skor terkecil yang dapat diterima
menjadi mahasiswa baru di perguruan tinggi tersebut.
1) Histogram dan poligon (kurva) dari soal ini tampak pada Gambar 4.5.
Gambar 4.5
Histogram dan poligon
R A NG KU M AN
TES F OR M AT IF 1
Kegiatan Belajar 2
Berkenaan dengan suatu distribusi skor, kita sering kali tertarik untuk
mengetahui berapakah proporsi skor-skor yang berada di bawah atau di atas
suatu nilai tertentu atau di antara dua nilai tertentu. Jika bangun kurvanya
bisa dimodelkan secara baik oleh kurva normal, kita bisa menggunakan Tabel
Luas Daerah Di bawah Kurva Normal untuk menjawab pertanyaan-
pertanyaan seperti demikian. Di dalam tabel ini, total area di bawah kurva
ditentukan sebagai satu. Untuk menggunakan tabel tersebut, kita hanya perlu
mengingat bahwa kurva normal adalah simetris dan maka itu 50% dari total
areanya berada di bawah mean (z = 0) dan 50% di atas mean.
Gambar 4.6
Proporsi skor-skor di dalam suatu distribusi normal yang bercirikan
= 100 dan = 20 (a) melebihi skor 120 dan (b) berada di atas skor 80
MPDR5202/MODUL 4 4.15
Gambar 4.7
Proporsi Skor-skor di Dalam Suatu Distribusi Normal yang Bercirikan
= 100 dan = 20 (a) di Bawah Skor 85 dan (b) di Bawah Skor 120
bahwa proporsi itu adalah 0,3413, yang kemudian ditambahkan pada 0,5000
menghasilkan 0,8413. Dengan demikian, (0,8413 × 3.000) atau sekitar 2.524
mahasiswa baru tidak memperoleh skor yang cukup pada ujian masuk untuk
bisa ditempatkan dalam perkuliahan unggulan matematika.
Gambar 4.8
Proporsi Skor-skor di Dalam Suatu Distribusi Normal yang Bercirikan
= 100 dan = 20 yang Berada (a) di antara skor 85 dan Skor 120 dan
(b) di antara Skor 110 dan Skor 120
Gambar 4.9
Skor-skor yang Memisahkan (a) 20% Atas dan (b) 20% Bawah dari Skor-skor
Lainnya di Dalam Suatu Distribusi Normal yang Bercirikan = 100 dan = 20
adalah 0,84. Nilai 0,84 ini bisa positif atau negatif. Manakah yang kita
kehendaki? Karena kita hendak memperbedakan 20% teratas dari yang
lainnya, nilai skor z kita adalah positif: z = +0,84. Kita kemudian
substitusikan nilai ini ke dalam rumus untuk z dan menyelesaikan X:
X X
z =
X
X 100
+ 0,84 =
20
(0,84) (20) = X – 100
16,8 = X – 100
116,8 = X
bahwa nilai z untuk skor itu adalah 1,65. Skor-skor yang dikehendaki ini
dengan demikian berkedudukan di 1,65 simpangan baku di atas dan di bawah
mean. Memasukkan nilai ini ke dalam rumus untuk z dan menyelesaikan X
kita peroleh:
Dengan demikian, 90% dari skor-skor pada ujian ini berada di antara
(100 – 33) = 67 dan (100 + 33) = 133.
Gambar 4.10
Batas-batas yang Meliputi Sentral 90% Skor-skor di Dalam Suatu Distribusi
Normal yang Bercirikan = 100 dan X = 20
LAT IH A N
R A NG KU M AN
TES F OR M AT IF 2
Tes Formatif 1
1) Histogram dan poligon (kurva) dari hasil pengetosan 16 mata uang
logam sebanyak tak terhingga kali tampak seperti pada gambar berikut.
Tes Formatif 2
1) a. Banyaknya mahasiswa yang dapat masuk kelas unggulan adalah
sekitar 0,0668 500 orang = 34 atau 35 orang.
b. Skor terbesar yang harus masuk kelas remedial adalah 76,7.
2) Batas-batas skor tersebut adalah 39,6 dan 60,4.
4.26 Statistika Pendidikan
Daftar Pustaka
Dowdy, et al. 1991. Statistics for Research, second edition, New York: John
Wiley & Sons.
Lampiran2.
Tabel Z “untuk area di bawah kurva normal baku dari 0 sampai z”
Diunduh dari: http://www.kiddofuntime.com/math-table-chart/
MPDR5202/MODUL 4 4.29
Lampiran3.Tabel Z untuk“znegatif”
Diunduh dari: http://www.stat.ufl.edu/~athienit/Tables/Ztable.pdf
4.30 Statistika Pendidikan
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
Modul 5
PEN D AH U LU A N
M ustafa penasaran tentang “adil” atau tidaknya koin yang dia pegang
(yaitu, kemunculan “gambar” sama seperti kemunculan “angka”). Dia
memutuskan untuk menguji koin itu dengan men-tos-nya sebanyak 100 kali.
Jika gambar muncul 53 kali, apakah kesimpulan dia seharusnya? Jika gambar
muncul 94 kali, apakah kesimpulan dia seharusnya?
Dr. Hasan, direktur penelitian tingkat lembaga di sebuah universitas
yang besar, ingin mengetahui apakah kelas mahasiswa baru di universitasnya
mempunyai skor TPA (Tes Potensi Akademik) sebaik para mahasiswa di
tingkat nasional. Di universitasnya, terdapat 6000 mahasiswa baru, terlalu
banyak untuk dikaji tanpa merepotkan. Oleh karena itu, dia menyeleksi 300.
Penyeleksian yang dilakukan Dr. Hasan, sering kali menjadi kegiatan awal
penelitian para peneliti. Peneliti harus melakukan sampling, agar kesimpulan
yang diperoleh dari perilaku sampel penelitian, merupakan representasi dari
perilaku populasinya.
Modul ini akan membahas masalah-masalah dalam statistika inferensial
dan distribusi mean penyampelan acak, dan setelah menyelesaikan modul ini,
Anda diharapkan memiliki kemampuan:
1. menemukan peluang terambilnya sampel acak dengan rata-rata tertentu
yang diambil dari sebuah populasi yang terdistribusi normal;
2. menemukan rata-rata sampel yang diambil secara acak dari populasi
yang terdistribusi normal, apabila peluang terambilnya sampel acak
tersebut diketahui.
5.2 Statistika Pendidikan
Kegiatan Belajar 1
Masalah-Masalah dalam
Statistika Inferensial
dari dua populasi yang mereka pilih untuk dikaji. Bahkan jika AZT dan ddI
memiliki pengaruh sama pada para penderita AIDS, mean jumlah sel T-4
pada dua sampel yang dipakai CDC itu barangkali akan berbeda, dan
perbedaan tersebut tidak akan tepat sama dari pengulangan ke pengulangan
oleh karena faktor-faktor kebetulan dalam penyampelan.
Tugas statistika inferensial yaitu menarik kesimpulan tentang suatu
parameter (karakteristik suatu populasi) dari studi statistik-sampel
(karakteristik sebagian populasi itu). Oleh karena variasi penyampelan, kita
tidak mungkin (kecuali dalam beberapa kasus sederhana) untuk membuat
suatu inferensi seperti itu dan mengetahui pasti bahwa inferensi itu benar.
Kepastian hanya datang apabila setiap unsur di dalam populasi diketahui.
Tetapi situasi tersebut bukanlah tanpa harapan. Perhatikan kembali
pertanyaan Mustafa tentang keadilan koinnya. Dia ingin mengetahui apakah
dalam populasi semua tos yang mungkin gambar akan muncul 50% kejadian.
Dia men-tos koin itu 100 kali dan memperoleh 53 gambar serta 47 angka. Dia
tahu bahwa hasil sampel seperti demikian bisa saja terjadi disebabkan variasi
penyampelan. Tetapi seberapa mungkinkah? Jika dia mengetahui seberapa
sering sampel-sampel 100 tos akan memunculkan hasil yang menyimpang
sedemikian dari harapan 50 gambar dan 50 angka (hal itu dapat ditentukan
dengan memakai ekspansi binomial untuk P = Q = 1/2), dia akan berada
dalam posisi lebih baik untuk memutuskan apakah (a) hipotesis itu bisa
secara mudah saja benar (sebab 53 – 47 merupakan hasil penyampelan yang
akan sudah terjadi jika hipotesis itu memang benar), atau (b) hipotesis itu
mungkin salah (sebab 53 – 47 sedemikian menyimpang sehingga tidak
cenderung terjadi jika hipotesis itu memang benar).
Kunci pada sebarang masalah dalam statistika inferensial adalah
mengungkap berapakah nilai-nilai sampel yang akan muncul dalam
penyampelan berulang dan dengan peluang berapa. Sebuah sampel diambil
dan mean-nya kita hitung. Sebuah sampel kedua yang berukuran sama
menghasilkan suatu mean yang bernilai agak berbeda. Sebuah sampel ketiga
pun nilainya tidak sama demikian. Distribusi semacam apakah yang akan
terbentuk oleh mean-mean itu apabila penyampelan diulangi dari waktu ke
waktu? Distribusi semacam ini dikenal sebagai suatu distribusi penyampelan.
Kita harus bisa mendeskripsikannya secara lengkap jika kita hendak
mengatakan apa yang akan muncul apabila sampel-sampel ditarik.
Untuk mempelajari berapakah nilai-nilai sampel yang akan muncul dan
dengan peluang berapa, mestilah ada aturan-aturan yang diketahui yang
5.4 Statistika Pendidikan
C. PENYAMPELAN ACAK
Suatu sampel acak dari suatu populasi tertentu adalah sampel yang
ditarik sedemikian hingga masing-masing sampel yang mungkin yang
seukuran memiliki peluang sama untuk terpilih dari populasi.
Gambar 5.1
Dua Sampel yang Mungkin Muncul dari Skema Penyampelan Sistematis
Di dalam data dunia nyata, seringkali sukar atau mahal (dan terkadang
mustahil!) bagi kita untuk menarik suatu sampel acak sederhana dari populasi
yang sungguh kita hendak pelajari. Untuk mengerjakannya secara benar, kita
akan harus mengenali setiap elemen populasi kemudian mengatur untuk
mengikuti implikasi-implikasi dari definisi secara acak.
5.6 Statistika Pendidikan
menggigit jari-jari tangan dan yang tidak? Dari Hukum Statistika Minium
yang ke-3: “Human beings are rotten randomizers.” [Manusia adalah
pengacak yang buruk].
Sebagai suatu pilihan lain, kita bisa menuliskan nomor tiap tikus pada
sebuah kartu, menempatkan kartu-kartu itu dalam sebuah wadah,
menggoyang-goyangkan wadah itu dengan benar-benar, dan melakukan
pilihan acak sebarang subyek-subyek untuk dua grup tadi. Bagaimanapun,
suatu metode yang lebih baik yaitu memakai tabel nomor acak untuk memilih
sampel (atau gunakan program komputer yang menyelesaikan hal tersebut).
Untuk penggunaan tabel nomor acak, akan dijelaskan pada bagian
berikutnya.
angka, dari 000 hingga 799 atau dari 001 hingga 800, jika anda lebih suka
demikian. Agar sederhana, misalkan bahwa skema kita memintakan seleksi
dimulai pada kiri atas halaman pertama tabel dan membaca ke bawah. (Kita
bisa mulai di sebarang tempat lain). Nomor acak pertama adalah 113, dan
elemen pertama yang akan dimasukkan dalam sampel adalah yang bernomor
identifikasi 113. Angka acak selanjutnya adalah 969; kita melewatinya sebab
tidak ada elemen populasi yang bernomor itu. Nomor selanjutnya adalah 077,
yang mengidentifikasi skor kedua yang akan dimasukkan dalam sampel. Kita
lanjutkan hingga terpilih 30 elemen.
Jika penyampelan kita dengan penempatan kembali dan elemen yang
sama terpilih kembali, kita mesti memasukkannya kembali. Jika
penyampelan kita tanpa penempatan kembali dan suatu nomor identifikasi
muncul lagi, kita melewatinya.
LAT IH A N
2) Salah, karena yang benar adalah bahwa rata-rata dari populasi tersebut
adalah sekitar 75.
3) Langkah-langkahnya adalah (1) memberi nomor dengan 3 digit untuk
tiap anggota populasi, (2) dengan memakai Tabel Nomor Acak, pilihlah
(yang mana saja) sebuah nomor dengan 3 digit dan lanjutkan nomor
berikutnya dengan memilih arah horizontal atau boleh juga vertikal
sebagai nomor awal; (3) dan sebagainya.
R A NG KU M AN
TES F OR M AT IF 1
Kegiatan Belajar 2
A. PENGANTAR
POPULASI
= 80
Gambar 5.2
Mean-Mean untuk Sampel-Sampel Acak Berurutan
Tabel 5.1
Sampel-Sampel yang Mungkin dan Mean-Mean Sampel untuk Sampel-Sampel
Berukuran Dua (Penyampelan dengan Penempatan Kembali)
POPULASI :2,4,6,8
Sampel Peluang Kemunculan Mean
2,2 1/16 2,0
2,4 1/16 3,0
2,6 1/16 4,0
2,8 1/16 5,0
4,2 1/16 3,0
4,4 1/16 4,0
4,6 1/16 5,0
4,8 1/16 6,0
6,2 1/16 4,0
6,4 1/16 5,0
6,6 1/16 6,0
6,8 1/16 7,0
8,2 1/16 5,0
8,4 1/16 6,0
8,6 1/16 7,0
8,8 1/16 8,0
Tabel 5.2
Distribusi Mean Penyampelan (Data dari Tabel 5.1)
1
Sampel (2,4) mesti dianggap berbeda dari sampel (4,2). Masing-masingnya
mungkin, dan masing-masing menghasilkan sebuah mean sampel yang mesti
diperhitungkan, seperti gambar–angka dari angka–gambar.
MPDR5202/MODUL 5 5.15
Gambar 5.3
Distribusi Mean untuk 16 Sampel yang Mungkin dengan Ukuran Dua
yang Bisa Diperoleh dari Sebuah Populasi Empat Skor
Data dari Tabel 5.2. Populasi: 2, 4, 6, dan 8
X X (Rumus 1)
Menggunakan Gambar 5.3 sebagai contoh, X X 5,0.
Kedua, simpangan baku ditribusi mean penyampelan acak, disebut
standar error mean, bergantung pada simpangan baku populasi, X, dan
ukuran sampel, n. Secara simbolis:
Gambar5.4
Distribusi skor yang terdistribusi normal dan
distribusi sampling mean acak untuk n = 3 dan n = 9
Gambar5.5
Efek dari Teorema Limit Sentral
Gambar 5.6
Mencari Proporsi Mean-mean Sampel yang Melebihi
Suatu Nilai Tertentu
X X 80 70
Maka itu, Z = = = + 2,50
X 4
Gambar 5.7
Mencari Proporsi Mean-mean Sampel yang Berbeda dari Mean Populasi
Sebesar Lebih dari Suatu Nilai Tertentu
Contoh 5.3 Berapakah nilai mean jika peluang munculnya nilai sebesar mean
itu atau lebih di dalam penyampelan acak adalah 0,05? Masalah ini
diilustrasikan pada Gambar5.8.
Gambar 5.8
Mencari Nilai di Atas Mana Proporsi Tertentu Mean-
Mean Sampel akan Berada
5.22 Statistika Pendidikan
Contoh 5.4 Dari populasi yang diketahui di atas tadi, tentukanlah batas
bawah dan batas atas dari mean (rata-rata) sampel tadi, apabila mean
dari sampel-sampel tersebut berada 95% di tengah distribusi?
Solusi Jika 0,95 nilai-nilai berada di tengah, sisa 0,05 mestilah dibagi rata
di antara dua ekor distribusi itu. Dengan demikian, kita mesti
mencari nilai Z di luar mana 0,025 mean-mean sampel berada.
Metode ini sama seperti untuk Soal 3, dan garis besar solusinya
adalah sebagai berikut:
Untuk contoh ini 95% mean-mean sampel berada di antara 62,16 dan 77,84.
Di dalam penyampelan acak, peluang untuk memperoleh sebuah mean di
dalam batas-batas ini adalah 0,95, dan peluang untuk memperoleh mean di
luar batas-batas tersebut adalah 0,05. Masalah ini diilustrasikan dalam
Gambar 5.9.
Gambar 5.9
Mencari Batas-batas Skor Tengah di antara Mana Proporsi tertentu Mean-
mean Sampel akan Berada
LAT IH A N
15 9 1 10
1) (a) (b) (c) (d)
16 16 16 16
2) (a) 25 sampel, di mana sampel-sampel tersebut adalah:
(3,3), (3,5), (3,7), (3,9), (3,11), (5,3), (5,5), (5,7), (5,9), (5,11), (7,3),
(7,5), (7,7), (7,9), (7,11), (9,3), (9,5), (9,7), (9,9), (9,11), (11,3),
(11,5), (11,7), (11,9), dan (11,11).
(b) Mean sampel Frekuensi relatif
1
3
25
2
4
25
3
5
25
4
6
25
5
7
25
4
8
25
1
9
25
2
10
25
1
11
25
(c) x 7 dan x 2 .
(d) Karena x = 7, dan x = 2,828, sehingga x = x, dan
2,828
x 2 yang berarti bahwa x x .
2 2
x
Jadi, benar bahwa x = x dan x .
2
3) (a) 0,2266 atau 22,66%.
(b) 0,2174 atau 21,74%.
5.26 Statistika Pendidikan
R A NG KU M AN
TES F OR M AT IF 2
Tes Formatif 1
1) Karena frekuensi harapan munculnya gambar pada percobaan men-tos
1
sekeping uang logam adalah 150 = 75 kali, maka kelompok A
2
hasilnya lebih realistis dari percobaan yang dilakukan oleh kelompok B.
1
2) (a) 70 kali. (b) .
1000
3) Hampir pasti tidak dapat terjadi, karena mean (rata-rata) cenderung stabil
dari sampel ke sampel.
Tes Formatif 2
1) a. 16 buah sampel, yaitu dimulai dari (1,1), (1,5), ... , dan seterusnya
sampai dengan (11,11).
b. Mean Frekuensi Relatif
1 1/16
3 2/16
4 2/16
5 1/16
6 4/16
7 1/16
8 2/16
9 2/16
11 1/16
5.30 Statistika Pendidikan
c.
Daftar Pustaka
Dowdy et al. 1991. Statistics for Research. Second edition. New York: John
Wiley & Sons.
PEN D AH U LU A N
Kegiatan Belajar 1
Distribusi Distribusi
mean-mean mean-mean
sampel sampel
X 85 X X 85 X
X hitung X hitung
Gambar 6.1
Kemungkinan Lokasi-lokasi Mean Sampel yang Diperoleh Relatif terhadap
Distribusi Mean-meanSampel Harapan Apabila Hipotesis itu Benar
Logika dan prosedur umum untuk menguji semua hipotesis statistik, baik
mengenai mean, frekuensi, atau pun karakteristik-karakteristik populasi
lainnya, adalah pada dasarnya apa yang dideskripsikan dalam bagian-bagian
sebelumnya.
Langkah 1 : Suatu hipotesis spesifik, disebut hipotesis nol, dirumuskan
berkenaan dengan suatu parameter dari populasi (misal,
tentang mean populasi) bersama dengan suatu hipotesis
alternatif.
Langkah 2 : Suatu sampel acak diambil dari populasi observasi-observasi,
dan nilai statistik sampel (misal, nilai mean sampel) diperoleh.
Langkah 3 : Karakteristik-karakteristik distribusi penyampelan acak dari
statistik yang sedang dipertimbangkan diperiksa untuk
mempelajari berapakah hasil-hasil sampel yang akan terjadi
(serta dengan berapakah frekuensi-frekuensi relatifnya) jika
hipotesis nol adalah benar.
Langkah 4 : Hipotesis nol dipertahankan jika hasil sampel tertentu adalah
sejalan dengan hasil-hasil yang diharapkan jika hipotesis itu
benar; jika tidak begitu, hipotesis tadi ditolak dan hipotesis
alternatif diterima.
Distribusi
penyampelan X
hyp 85
Gambar 6.2
Masalah Pak Hassan : Distribusi penyampelan acak atas X untuk sampel
n = 100 diambil secara acak dari populasi dengan X = 85; = 0,05
MPDR5202/MODUL 6 6.7
Tabel 6.1
Rumus-Rumus untuk Menghitung z
Misalkan mean sampel yang didapatkan Pak Hassan adalah 90. Bahkan
jika mean populasi sungguh adalah 85, kita hendak mengharapkan bahwa
mean suatu sampel yang diambil secara acak dari populasi itu adalah tepat 85
(meskipun mungkin saja). Dengan demikian, yang menjadi pertanyaan
penting adalah, berapakah posisi relatif mean sampel yang diperoleh di antara
semua mean yang mungkin diperoleh secara kebetulan jika hipotesis itu
benar? Untuk menentukan posisi X yang diperoleh, posisi itu haruslah
diungkapkan sebagai skor z:
X hyp X hyp
z
X X / n
Nilai z ini muncul dari berapa banyak standar error dari mean, mean
sampel yang kita peroleh menyimpang dari mean populasi yang kita sudah
hipotesiskan. Untuk mengkonversi X -nya ke dalam z, Pak Hassan
mengetahui X. Mari kita asumsikan X itu adalah 20. Sehingga,
90 85 5
z 2,5
20 / 100 2
Dengan demikian, mean sampel Pak Hassan adalah 2,5 standar error dari
mean lebih besar daripada yang diharapkan jika hipotesis nol adalah benar.
Letak z yang diperoleh ini dalam distribusi penyampelan ditunjukkan dalam
Gambar 6.3. Sebagaimana Anda bisa lihat, nilai itu jatuh dalam daerah
penolakan atas, sehingga Pak Hassan menolak H0 dan mempertahankan HA.
Ringkasnya, dia menyimpulkan bahwa tidaklah masuk akal meyakini bahwa
6.8 Statistika Pendidikan
mean populasi dari mana sampel itu muncul adalah 85. Pada keadaan-
keadaan itu, tampaklah masuk akal dia melangkah lebih jauh dan mengatakan
bahwa mean populasinya amat mungkin lebih besar daripada 85.
Distribusi
X 2,0
penyampelan X
Area = 0,025
Area = 0,025
X = 90,0
z hitung = 2,50
Gambar 6.3
Masalah Pak Hassan : Distribusi penyampelan X untuk sampel-sampel yang
diambil secara acak dari populasi denganX = 85 dan X = 20; = 0,05.
Mean sampel Pak Hassan jatuh dalam daerah penolakan
Distribusi
penyampelan X X 2,00
X = 90,0
z hitung = 2,50
Gambar 6.4
Masalah Pak Hassan : Distribusi Penyampelan Atas X untuk Sampel-sampel
yang Diambil Secara Acak dari Populasi denganX = 85 dan X = 20; = 0,01.
Mean sampel Pak Hassan Jatuh dalam Daerah Pemertahanan
Dalam praktek, suatu sampel yang benar-benar acak sering kali sukar
dicapai. Pelanggaran asumsi ini bisa mempengaruhi mean dan simpangan
baku distribusi penyampelan dalam cara-cara yang tidak bisa terduga.
Agar model inferensi tentang mean-mean tunggal yang dijabarkan dalam
bagian ini benar secara ketat, diasumsikan bahwa penyampelan adalah
dengan penempatan kembali. Bagaimanapun, mengambil sampel tanpa
penempatan kembali adalah praktek yang biasa. Error sebab ini di dalam
inferensi amatlah kecil asalkan ukuran besarnya sampel adalah suatu pecahan
kecil dari besarnya populasi, katakan, 0,05 atau lebih kecil.
Asumsi ketiga yaitu bahwa kita boleh memperlakukan distribusi
penyampelan atas X sebagai suatu kurva normal. Apabila skor-skor dalam
populasi tidak terdistribusi normal, teorema limit sentral menjadi penolong
apabila besarnya sampel adalah 25 atau lebih besar. Pada situasi ini,
mengasumsi bahwa distribusi penyampelan mengikuti kurva normal
membawakan error yang minimal.
Asumsi ke-empat yaitu kita mengetahui X, simpangan baku populasi
dari mana sampel kita diambil. Memang, X muncul di dalam rumus untuk
uji z (yaitu pembilang pada standar error mean). Tetapi dalam praktek
sesungguhnya, kita akan harus mengestimasi X dari data sampel.
X X X X X X
z
X X n ? n
s X2
( X X )2
n
Telah ditunjukkan bahwa kecenderungan ke arah terlalu rendahnya estimasi
akan diperbaiki jika (X – X )2 dibagi oleh n – 1 menggantikan oleh n.
Rumus di bawah ini memasukkan koreksi tersebut.
s X2
(X X ) 2
SS X
(Rumus-1)
n n 1
6.12 Statistika Pendidikan
sX
(X X ) 2
n 1
Di dalam Tabel 6.2 berikut ditunjukkan suatu demonstrasi, dimana tabel ini
menghadirkan 16 sampel yang mungkin yang muncul apabila sampel
berukuran besarnya dua diambil dari suatu populasi empat observasi.
(X X )
2
Perhitungan varians keempat skor dengan rumus S 2 atau
n
SS X
menghasilkan X2 5,0. Sekarang mari kita hitung sX2 dengan
n
menggunakan Rumus-1 dari masing-masing keenam belas sampel yang
mungkin tersebut. Keenam belas sampel dan 16 estimasi varians itu
ditampilkan, berurutan, dalam kolom pertama dan terakhir pada tabel itu.
Kita melihat bahwa mean dari estimasi-estimasi ini adalah 5,0, yang
adalah juga nilai sesungguhnya dari X2 , kuantitas yang kita estimasi. Ini
memperlihatkan bahwa s2 merupakan estimator tanpa bias untuk 2 karena
mean keseluruhan estimasi-estimasi itu sama dengan kuantitas yang
diestimasi. Jelaslah, jika keenam belas estimas itu dibuat dengan membagi
oleh n = 2 bukannya n – 1 = 1, mean dari estimasi-estimasi ini akanlah lebih
kecil daripada 5,0. Meskipun koreksi yang dikedepankan untuk mengestimasi
standar error mean menjadikan estimasi yang lebih baik pada yang rata-
rata [secara umum],
MPDR5202/MODUL 6 6.13
Tabel 6.2
Sampel-Sampel yang Mungkin, Bersama dengan Estimasi-Estimasi
Varians Populasi yang Dihitung untuk Masing-Masingnya
POPULASI : 2, 4, 6, 8
VARIANS POPULASI : X2
( X X )2 = 5,0
N
Estimasi Varians
Populasi
Sampel X (X X )
2
s X2
(X X ) 2
n 1
2,2 2 0 0
2,4 3 2 2
2,6 4 8 8
2,8 5 18 18
4,2 3 2 2
4,4 4 0 0
4,6 5 2 2
4,8 6 8 8
6,2 4 8 8
6,4 5 2 2
6,6 6 0 0
6,8 7 2 2
8,2 5 18 18
8,4 6 8 8
8,6 7 2 2
8,8 8 0 0
Nilai mean s X2 : 5,0
Catat bahwa huruf s kecil menandakan suatu estimasi simpangan baku dalam
kedua simbol itu. Saat kita menyubstitusi s X untuk X dalam rumus untuk z,
hasilnya adalah suatu statistik yang baru (aproksimasi z) disebut t. Tidak
seperti z, bagaimanapun, t tidaklah terdistribusi normal.
Distribusi t
Jika asumsi-asumsi pada bagian D di atas terpenuhi, z sebenarnya yang
berkorespondensi pada mean sampel merupakan suatu variabel yang
terdistribusi normal. Kenapa? Nilai-nilai dari X akan beragam saat kita
berpindah sampel acak demi sampel acak, tetapi nilai-nilai X dan X
akanlah tetap. Sebagai akibatnya, nilai-nilai z terbentuk sebagai berikut :
variabel terdistribusi normal konstanta
z
kostanta
di mana : X = variabel yang terdistribusi normal
X = suatu konstanta
X = suatu konstanta
X X
t (Rumus-2)
sX
MPDR5202/MODUL 6 6.15
Statistik ini berbeda dari z dalam hal bahwa penyebut dari ekspresi ini adalah
suatu variabel. Saat kita berpindah sampel acak demi sampel acak, tidak saja
nilai-nilai X akan beragam, tetapi masing-masing sampel akan mungkin
menghasilkan suatu estimasi s X X yang berbeda-beda.1 Statistik hasilnya
itu terbentuk sebagai berikut:
(variabel yang terdistribusi normal) (konstanta)
t
(variabel)
1
Distribusi penyampelan atas s X cenderung miring positif.
6.16 Statistika Pendidikan
df ¥
df = 12
df = 4
Gambar 6.5
Distribusi t Student untuk Tiga Tingkat Derajat Kebebasan
Tabel 6.3
Nilai-Nilai Kritis untuk Distribusi t Student untuk = 0,05 dan Beberapa
Derajat Kebebasan yang Dipilih
df 5 10 25 50 100 500 ¥
t0,05 2,571 2,228 2,060 2,008 1,984 1,965 1,960
6.18 Statistika Pendidikan
X 2
– X , dan X 3
– X . Sekarang hanya dua (dua mana saja) dari skor-
skor simpangan itu yang ―bebas untuk beragam‖. Kita bisa, jika kita ingin,
secara mana suka memberikan X1 – X nilai +3, dan X 2 – X nilai –7.
MPDR5202/MODUL 6 6.19
Tetapi segera setelah dua dari tiga skor simpangan itu sudah diberi nilai
numerik, yang ketiga tidak lagi bebas untuk beragam. Apakah Anda ingat
bahwa hasil jumlah simpangan-simpangan yang diambil di sekitar mean
adalah selalu nol? Dalam kata lain, ( X X ) 0 . Jadi segera setelah dua
simpangan pertama ditentukan, yang ke-tiga mestilah suatu nilai sedemikian
hingga hasil jumlah ketiga simpangan itu adalah nol. Dalam contoh numerik
tadi, nilai X 3 X mestilah +4.
Untuk suatu estimasi varians yang dibuat dari suatu mean tunggal,
akanlah ada n simpangan. Semua kecuali satu dari simpangan-simpangan itu
akanlah ―bebas untuk beragam,‖ tetapi yang terakhir akan tertentukan oleh
batasan bahwa ( X X ) = 0. Banyaknya derajat kebebasan dalam suatu
persoalan yang melibatkan perhitungan s maka itu adalah n – 1. (Untuk
masalah-masalah jenis lainnya, df mungkin saja berbeda.)
df = 20
t: -2,086 0 +2,086
Gambar 6.6
Distribusi Student :Nilai-nilai t untuk df = 20di antara mana 95% Sentral
Nilai-nilai t akan Berada
df = 20
Area = 0,05
t: 0 + 1,725
Gambar 6.7
Nilai t untuk df = 20yang Berkorespondensi pada Daerah Dalam Ekor-Atas
Distribusi Student = 0,05
df = 24
t: - 2,064 0 +2,064
t obt = -2,40
Gambar 4.8
Menguji Suatu Hipotesis tentang X terhadap Suatu Hipotesis Alternatif
Nondireksional; = 0,05.
MPDR5202/MODUL 6 6.23
LAT IH A N
1) Untuk pertanyaan yang dihadapi oleh Pak Hassan, jika simpangan baku
populasi pada tes pemahaman matematika untuk para siswa kelas enam
adalah 10, apakah yang Pak Hassan akan simpulkan jika dia memakai uji
dua-ekor pada tingkat signifikansi 0,05 dan memperoleh mean sebesar
87,5 untuk sampelnya yang terdiri atas 100 siswa?
2) Untuk Soal 1, hitunglah nilai-nilai kritis X dalam bentuk skor mentah.
3) Jika = 0,10, berapakah nilai-nilai zkritis untuk suatu uji dua-ekor?
4) Anda diberi data berikut: X 63 , X 12 , n = 100, H0 : X = 60, dan
HA : X 60.
6.24 Statistika Pendidikan
(a) uji hipotesis nol pada tingkat signifikasi 0,05 dan kemukakan
konklusi-konklusi Anda.
(b) Uji hipotesis nol pada tingkat signifikansi 0,01 dan kemukakan
konklusi-konklusi Anda.
5) Norma nasional bagi kelas delapan untuk ujian ilmu sosial adalah skor
123. Ahli peneliti sekolah di suatu provinsi ingin mengetahui bagaimana
skor-skor para siswa di provinsinya dibandingkan dengan standar ini.
Dia memilih suatu sampel acak 81 siswa dan menemukan bahwa
X 117. Asumsikan X 10 .
(a) Buatlah hipotesis nol dan hipotesis alternatif yang paling sesuai
untuk sifat inkuirinya.
(b) Uji hipotesis nol itu pada tingkat signifikansi 0,05 dan nyatakan
konklusi-konklusi Anda.
(c) Uji hipotesis nol itu pada tingkat signifikansi 0,01 dan nyatakan
konklusi-konklusi Anda.
6) Kita mengambil = 0,05 dan menguji hipotesis H0 : X = 50. Konklusi
apakah yang seharusnya kita ambil jika (a) n = 10; tcalc = +2,10, dan HA :
X 50? (b) n = 20, tcalc = +2,10, dan HA : X 50? (c) n = 10, tcalc =
+2,10, dan HA : X 50? Tunjukkan nilai kritis t untuk masing-masing
bagian.
7) Kepala Sekolah sebuah SMA ―favorit‖ mengkhawatirkan bahwa para
siswa yang lulus dari sekolah itu, secara pukul rata, pada tes-tes
pemahaman matematika tidak memperoleh skor sebaik para siswa dari
sekolah-sekolah lain di kabupaten itu. Untuk mengatasi keprihatinan
mereka, kepala sekolah SMA favorit tersebut memilih 15 siswa secara
acak dari alumninya dan menyelenggarakan tes pemahaman matematika
yang baku dipakai di kabupaten itu. Skor rata-rata untuk para siswa yang
lulus di kabupaten itu adalah 98. Skor-skor 15 alumni dari SMA favorit
itu adalah sebagai berikut:
105 98 101 110 96 103 104 101
98 105 112 95 105 100 108
(a) Nyatakan secara formal hipotesis-hipotesis yang diperlukan untuk
mengadakan suatu uji non-direksional.
(b) Selesaikan uji tersebut pada tingkat signifikansi 0,05 dan nyatakan
konklusi Anda.
MPDR5202/MODUL 6 6.25
0,025
0,025
Z hitung
thitung
0,025 0,025
0,05
thitung
0 1,833 2,1
R A NG KU M AN
kuadrat-kuadrat sampel, X X oleh n 1 menggantikan n. Ini
yaitu bahwa ada konsentrasi area yang lebih besar dalam ekor-ekor
distribusi t. Maka itu, untuk menolak H0 memakai t akanlah mengambil
simpangan yang lebih besar dari harapan X . Bagaimanapun,
hyp
TES F OR M AT IF 1
a.
Tulislah hipotesis penelitiannya!
b.
Tulislah secara formal hipotesis nol (H0) dan hipotesis penelitiannya
(H1), kemudian ujilah hipotesis nol tersebut pada = 0,05, dan
kemukakan konklusi statistiknya!
c. Kesimpulan apakah yang sebaiknya dikemukakan oleh peneliti tadi!
3) Kita mengambil = 0,01 dan akan menguji H0 : X = 70. Konklusi
apakah yang seharusnya kita ambil, jika:
a. n = 25, thitung = 2,75, dan HA : X 70.
b. n = 30, thitung = –1,50, dan HA : X< 70.
4) Diperoleh informasi bahwa pada 30 tahun yang lalu rata-rata tinggi
badan mahasiswa S-1 tingkat I di suatu negara adalah 170 cm. Seorang
peneliti yang tertarik terhadap tinggi badan mahasiswa S-1 menyatakan
bahwa karena perbaikan gizi secara ilmiah pada saat ini, maka peneliti
tersebut mengklaim bahwa tinggi badan mahasiswa S-1 tingkat I pasti
tidak lagi seperti badan mahasiswa S-1 pada 30 tahun yang lalu. Untuk
membuktikan klaimnya, peneliti tersebut mengobservasi 20 mahasiswa
S-1, dan ternyata tinggi badannya adalah sebagai berikut:
160 175 180 180 160 180 175 165 179 175
170 175 172 180 169 176 182 165 160 170
Kegiatan Belajar 2
Contoh 6.4
Seorang peneliti memiliki permasalah sebagai berikut: ―Apakah terdapat
perbedaan yang signifikan dalam kemampuan berpikir kritis antara siswa pria
dan wanita kelas 8 SMP?
Untuk menjawab pertanyaan penelitian (rumusan masalah) tersebut, gunakan
model hipotesis lima langkah, jika memungkinkan; gunakan data hasil
observasi tentang kemampuan berpikir kritis berikut, serta gunakan = 0,05.
Asumsikan bahwa semua asumsi dan persyaratan uji dipenuhi.
Pria Wanita
X 1 80 X 2 84
N1 60 N 2 63
S1 10 S2 9
Jawab
Dari soal di atas, kita harus melakukan uji hipotesis dua sampel (dobel mean)
dua ekor (dua pihak) dari mean-mean sampel besar, karena N1 + N2 = 123
100. Dengan menggunakan model lima langkah untuk pengujian hipotesis,
maka:
X1 X 2
Langkah 4 : Menghitung Z, memakai rumus Z = , dengan lebih
x x
1 2
S12 S2
2 .
N1 1 N 2 1
10 2 92
x x = = –2,309.
1 2
60 1 63 1
Contoh 6.5
Seorang peneliti ingin mengetahui ―Apakah kemampuan berpikir kreatif
siswa yang belajar dengan model A lebih baik dari siswa yang belajar dengan
model B? Untuk memperoleh jawaban atas permasalahan tersebut, peneliti
itu melakukan eksperimen, dan diperoleh data tentang kemampuan berpikir
kreatif sebagai berikut:
Model A 7 7 7 7 8 8 8 9 9 9 10 -
Model B 5 6 7 7 7 8 8 8 9 9 9 10
Jawab
a. Kemampuan berpikir kreatif siswa yang belajar dengan model A lebih
baik dari siswa yang belajar dengan model B.
b. (i) H0 : 1 = 2 dan H1 : 1 2.
(ii) Untuk = 0,05, df = 11 + 12 – 2 = 21, dan uji satu ekor (ke kanan),
maka diperoleh tkritis = 1,721.
(Catatan: digunakan statistik t, karena N1 + N2 = 11 + 12 < 100).
Karena X 1 = 8,09, S1 = 0,99, N1 = 11, X 1 = 7,75, S2 = 1,36, danN2
= 12, maka dengan memakai rumus x1 x2 =
N1 S12 N 2 S2 2 N1 N 2 X1 X 2
, dan t = , maka
N1 N 2 2 N1 N 2 x1 x2
diperoleh x1 x2 = 0,532 dan thitung = 0,65.
Karena thitung = 0,65 terletak di daerah penerimaan H0, maka H1
ditolak.
b. Kesimpulan
Tidak ada evidensi untuk menerima bahwa kemampuan berpikir kreatif
siswa yang belajar dengan model A lebih baik dari siswa yang belajar
dengan model B.
R A NG KU M AN
X1 X 2 N1 S12 N 2 S2 2 N1 N 2
t= , dan x1 x2 ,
x x
1 2
N1 N 2 2 N1 N 2
Dengan derajat kebebasannya (df) adalah N1 + N2 – 2.
TES F OR M AT IF 2
1) Tentukanlah nilai kritis untuk suatu uji 2 ekor (2 pihak) dua sampel
dengan tingkat = 0,01, di mana N1 = 20 dan N2 = 26.
2) Seorang peneliti memiliki permasalahan sebagai berikut: ―Apakah
kecerdasan sosial siswa yang mengikuti ekstrakurikuler lebih tinggi dari
siswa yang tidak mengikuti ekstrakurikuler?‖
a. Tulislah hipotesis penelitian untuk permasalahan tersebut!
b. Tulislah secara formal hipotesis statistik (H0) dan hipotesis
penelitian (H1) yang sesuai dengan permasalahan itu.
c. Ujilah hipotesis nol pada (b) untuk tingkat = 0,04, apabila
diketahui data tentang kecerdasan sosial dari kedua kelompok siswa
sebagai berikut:
Mengikuti Tidak mengikuti
ekstrakurikuler ekstrakurikuler
X1 = 80 X 1 = 84
N1 = 60 N2 = 63
S1 = 10 S2 = 9
Mengikuti
6 6 7 7 8 9 9 9 9 10 10 -
ekstrakurikuler
Tidak mengikuti
5 5 6 7 7 7 8 8 8 8 9 9
ekstrakurikuler
Tes Formatif 1
1) (a) Untuk = 0,05 dan uji 1 ekor (ke kiri, karena HA : X < 77, maka
diperoleh Zkritis = –1,645.
75 77
Zhitung = = –2.
11/ 121
Karena Zhitung = –2 terletak di daerah penolakan H0, maka dapat
disimpulkan bahwa HA diterima atau tidak cukup fakta (evidence)
untuk menolak HA.
(b) Untuk = 0,01 dan uji 1 ekor (ke kiri, karena HA : X < 77) maka
diperoleh nilai Zkritis = –2,33.
Karena Zhitung = –2 terletak di daerah penerimaan H0, maka dapat
disimpulkan bahwa HA ditolak atau tidak cukup fakta untuk
menerima HA.
2) (a) Terdapat perbedaan yang signifikan antara IPK mahasiswa-atlet
dengan IPK para mahasiswa di universitas tersebut.
(b) H0 : X = 3,1 dan HA : X 3,1.
2,9 3,1
Zhitung = = –1,63.
2,3 / 350
Untuk = 0,05 dan uji 2 ekor (karena HA : X 3,1), maka
diperoleh Zktitis = 1,96.
Karena Zhitung = –1,63 terletak di daerah penerimaan H0, maka HA
ditolak.
(c) Tidak terdapat perbedaan yang signifikan antara IPK para
mahasiswa-atlet dengan IPK para mahasiswa di universitas tersebut!
3) (a) Untuk = 0,01, df = 25 – 1 = 24, dan uji satu ekor (ke kanan, karena
HA : X 70), maka diperoleh tkritis = 2,492.
Karena thitung = 2,75 terletak di daerah penolakan H0, maka HA
diterima.
(b) Untuk = 0,01, df = 30 – 1 = 29, dan uji satu ekor (ke kiri, karena
HA : X < 70), maka diperoleh tkritis = –2,462.
Karena thitung = –1,50 terletak di daerah penerimaan H0, maka HA
ditolak.
4) (a) Apakah tinggi badan mahasiswa S-1 sekarang tidak lagi sama
dengan tinggi badan mahasiswa S-1 pada 30 tahun yang lalu?
MPDR5202/MODUL 6 6.41
Atau
Apakah terdapat perbedaan tinggi badan mahasiswa S-1 sekarang
dengan tinggi badan mahasiswa S-1 pada 30 tahun yang lalu?
(b) Tinggi badan mahasiswa S-1 sekarang tidak lagi sama dengan tinggi
badan mahasiswa S-1 pada tiga puluh tahun yang lalu.
Atau
Terdapat perbedaan tinggi badan mahasiswa S-1 sekarang dengan
tinggi badan mahasiswa pada 30 tahun yang lalu.
(c) H0 : X = 170 dan HA : X 170.
Untuk = 0,01, df = 20 – 1 = 19, dan uji 2 ekor, maka diperoleh
tkritis = 2,861.
172, 4 170
Karena X 172, 4 dan SX = 7,1, maka thitung 1, 48,
7,1/ 19
nilai thitung ini terletak di daerah penerimaan H0, maka HA ditolak.
(d) Kesimpulan: Tinggi badan mahasiswa sekarang tidak berbeda secara
signifikan dengan mahasiswa pada 30 tahun yang lalu.
Tes Formatif 2
1) tkritis = 2,690.
2) a. Kecerdasan sosial siswa yang mengikuti ekstrakurikuler lebih tinggi
dari siswa yang tidak mengikuti ekstrakurikuler.
b. H0 : 1 = 2; dan H1 : 1 2.
X1 X 2
c. Dengan memakai formula Z = , dan x1 x2 =
x x
1 2
S12 S2
2 , maka diperoleh Zhitung = 3,84.
N1 1 N 2 1
Untuk = 0,04 dan uji 1 ekor (ke kanan, karena H1 : 12), maka
diperoleh Zkritis = 1,75.
Karena Zhitung = 3,84 terletak di daerah penolakanH0, maka H1
diterima.
d. Diperoleh evidensi bahwa kecerdasan sosial siswa yang mengikuti
ekstrakurikuler lebih tinggi dari kecerdasan sosial siswa yang tidak
mengikuti ekstrakurikuler.
5) a. Terdapat perbedaan kemampuan menulis antara siswa yang belajar
dengan learning cycle Approach dan siswa yang belajar dengan
communication approach.
6.42 Statistika Pendidikan
N S N 2 S2
2 2
N1 N 2
1 1
, maka diperoleh thitung = 1,612.
N1 N 2 2 N1 N 2
Karena thitung = 1,612 terletak di daerah penerimaan H0, maka H1
ditolak.
c. Tidak terdapat perbedaan kemampuan menulis yang signifikan
antara siswa yang belajar melalui learning cycle approach dan siswa
yang belajar melalui communication approach.
MPDR5202/MODUL 6 6.43
Daftar Pustaka
Dowdy. et al. 1991. Statistics for Research, Second Edition. New York: John
Wiley & Sons.
PEN D AH U LU A N
A. DESKRIPSI SINGKAT
Analisis varians memuat materi tentang analisis varians satu arah (one
way ANOVA), analisis varians dua arah dengan dan tanpa interaksi (Two
way ANOVA), analisis lanjutan pada ANOVA, serta pada akhir pembahasan
akan disajikan uji-uji asumsi pada ANOVA, terutama untuk pengujian
kehomogenan varians. Bahasan berikutnya adalah analisis kovarians atau
disingkat dengan ANAKOVA atau ANCOVA. Analisis ini berkaitan dengan
dua atau lebih variabel terukur dengan variabel bebasnya tidak ditentukan
lebih dulu nilainya. Analisis isi memanfaatkan sekaligus konsep analisis
varians dan regresi. Pada akhir setiap kegiatan pembelajaran disajikan contoh
perhitungan secara manual dan melalui bantuan program komputer, SPSS.
B. RELEVANSI
Kegiatan Belajar 1
1 2 … k
Gambar 7.1
Gambaran Pengujian K > 2 Kelompok
dalam Kasus Varians Homogen ( 1 2 k )
A
B
C
A: X XX XXXX X X X
XA
B: X XX X X X X XXX
XB
C: X X X XXX X XX X
XC
(a)
A: X XX XXXX X X X
XA
B: X XX X X X X XXX
XB
C: X X X XXX X XX X
XC
(b)
Gambar 7.2
Variasi Antar dan Dalam Kelompok
s 2
estimator 2
k
Dengan demikian kita mempunyai satu estimator dari varians populasi.
Perlu dicatat bahwa estimator ini tidak bergantung pada benar atau salahnya
H 0.
7.8 Statistika Pendidikan
2
X2
n
nS X2 estimator 2
Hasil di atas memberi kita dua estimator bagi varians populasi. Jika
hipotesis nol benar, maka keduanya merefleksikan variasi inheren, dan kita
menduganya berukuran hampir sama. Bagaimanapun jika hipotesis nol salah,
estimator antar kelompok-kelompok akan lebih cenderung besar, dan
estimator itu akan merefleksikan pengaruh perbedaan perlakuan bukan
sekedar variasi inheren. Jika estimator antar grup begitu lebih besar daripada
estimator di dalam kelompok-kelompok sehingga variasi sampling tidak
dapat secara masuk akal menjadi alasan hal tersebut. Untuk itulah kita
menolak hipotesis nol.
Sebagaimana namanya, yakni analisis varians, maka varians menjadi
ukuran dasar bagi variasi. Ingat kembali bagian sebelumnya bahwa
pembilang dari varians adalah hasil dari jumlah simpangan-simpangan data
terhadap rata-rata yang dikuadratkan, atau sering disebut dengan jumlah
kuadrat (JK) atau sum of square (SS). Dengan begitu, ANOVA melibatkan
perhitungan hasil-hasil jumlah dari bilangan-bilangan kuadrat, untuk
berikutnya kita akan membahas prosedur ANOVA dengan menggunakan
varians-varians, namun perlu dipahami bahwa ANOVA merupakan suatu uji
tentang hipotesis nol yang berkaitan dengan perbedaan antar rata-rata
kelompok-kelompok.
xij i ij .................................... 1)
dengan ijsimpangan nilai pengamatan xij dari i.
Masing-masing dari idapat ditulis dalam bentuk
i i .................................... 2)
dengan i adalah pengaruh baris ke-i. Jika persamaan 2) disubstitusikan ke
persamaan 1), maka diperoleh persamaan berikut.
xij i ij .................................... 3)
Dengan demikian adanya perbedaan antar kelompok dapat dilihat pada ,
sehingga hipotesis di atas menjadi:
H’0 : 1 = 2 = ... = k = 0
H’1 : sekurang-kurangnya ada satu i tidak sama dengan nol
Untuk memudahkan dalam menurutkan pengujian hipotesisnya,
misalkan kita pandang bahwa pada semua kelompok diambil sampel yang
sama n1 n2 ... nk n .
Secara matematis diketahui bahwa
xij xij (sifat refleksi)
xij xij x x xi. xi.
xij x xi. x xij xi.
Jika keduanya dikuadratkan, maka diperoleh
x x xi. x xij xi.
2 2
ij
i 1 j 1 i 1 j 1 i 1 j 1
Suku pertama dari persamaan sebelah kanan konstan terhadap j, dan suku
terakhir dapat ditunjukkan sama dengan nol, sehingga diperoleh identitas
sebagai berikut
k n
T..2
SSTotal xij2
i 1 j 1 nk
k
T i
2
T..2
SSbetween i 1
n nk
SS within JKTotal JK Kolom
atau dfwithin ntotal – k . Dimana ntotal adalah total banyaknya kasus (yang
diteliti) dan k adalah banyak kelompok yang dibandingkan.
Bagi SSbetween terdapat simpangan dari rata-rata sebanyak rata-rata
sampel (atau jumlah kelompok). Oleh karena itu, derajat bebasnya adalah
dfbetween k –1
untuk sebarang analisis varians, maka hubungan antara derajat bebas dari
SStotal , SSwithin , dan SSbetween adalah sebagai berikut
dftotal df within dfbetween
Jika kita membagi masing-masing jumlah kuadrat dengan derajat
bebasnya masing-masing, maka diperoleh dua estimator varians yang
diperlukan untuk menguji hipotesis nol, yaitu estimator varians dalam
kelompok-kelompok swithin
2
dan estimator varians antar kelompok-
kelompok s2
between . Estimator-estimator tersebut sebagaimana yang
diestimasinya.
SS
sb2(between ) b
estimator
2 (variasi inheren)
dfb
SS w estimator
sw2 ( witihin ) 2 pengaruh perlakuan
df w
Dalam statistika simbol dari sw2 sering disebut dengan mean square error
(MSe) atau mean square within (MSw), dan sb2 sering disebut dengan mean
square between (MSb).
Jika hipotesis nol benar (tidak ada perbedaan antara kelompok-
kelompok), maka rata-rata dari kelompok-kelompok akan cenderung dekat
dengan X (rata-rata keseluruhan), dan sb2 akan menjadi estimator tak bias
untuk varians inheren ( 2 ) . Estimator ini akan menaksir kuantitas yang
sama seperti yang ditaksir oleh sw2 . Dan keduanya haruslah sama di dalam
batas-batas variasi sampling. Di sisi lain, jika hipotesis nol salah (minimal
ada dua kelompok yang berbeda), hasil jumlah kuadrat simpangan rata-rata
tiap kelompok X sekitar X akan cenderung lebih besar, dan sb2 akan
lebih besar daripada sw2 sehingga melampaui batas-batas variasi sampling.
Untuk melengkapi pengujian melalui analisis varians ini diperlukan
suatu metode untuk membandingkan sb2 dengan sw2 , dan kita menggunakan
7.12 Statistika Pendidikan
rasio F, yang merupakan statistik yang dibentuk oleh rasio dua estimator
varians independen, dengan F adalah
s2
F b2
sw
Jika hipotesis nol benar, sb2 dan sw2 keduanya akan menjadi estimator
varians inheren saja, dan rasio ini mestilah sekitar 1,0. Semakin besar
pengaruh perbedaan perlakuan, maka F akan makin cenderung melampaui
satuan tadi. Atau dengan kata lain nilai F yang diperoleh akan berada pada
daerah ujung sebelah kanan dari kurva distribusi F.
Secara ringkas perhitungan analisis varians yang dijelaskan di atas dapat
dirangkum dalam tabel anova sebagai berikut.
Tabel 7.1
Tabel ANOVA dengan n Tiap Kelompok Sama
Fh fa k 1, k n – 1 .
Tabel 7.2
Tabel ANOVA untuk n Tiap Kelompok Berbeda
Keputusan sama dengan di atas, yakni Ho ditolak pada taraf nyata bila:
Fh F k 1, N k .
Contoh 7.1
Misalkan diketahui hasil ulangan siswa yang belajar dengan 5 model
pembelajaran yang berbeda A, B, C, D, dan E sebagai berikut:
A B C D E
5 9 3 2 7
4 7 5 3 6
8 8 2 4 9
6 6 3 1 4
3 9 7 4 7
Ujilah dengan taraf nyata 0,05 bahwa rata-rata hasil ulangan melalui kelima
model pembelajaran tersebut tidak berbeda!
Jawab:
1. Hipotesis yang diuji:
H0 : 1 =2 = 3 =4 = 5 = 0
H1 : sekurang-kurangnya ada i tidak sama dengan nol
2. Taraf signifikansi yang diambil 0,05.
3. Dengan df = (4,20) dan = 0,05, wilayah kritiknya F >2,87
7.14 Statistika Pendidikan
4. Perhitungan :
Perhatikan tabel berikut:
A B C D E
5 9 3 2 7
4 7 5 3 6
8 8 2 4 9
6 6 3 1 4
3 9 7 4 7
Jumlah 26 39 20 14 33 132
Jumlah kuadrat 150 311 96 46 231 834
1322
SStotal 52 42 ... 42 7 2 834 696,960 137, 040
25
262 392 202 142 332 1322
SSbetween 776, 400 696,960 79, 440
5 25
SSwithin 137, 040 79, 440 57, 600
5. Keputusan:
Karena F = 6,90 > 2,87, maka Ho ditolak, artinya minimal ada dua rata-
rata hasil ulangan yang berbeda dari kelima model pembelajaran
tersebut.
Contoh 7.2
Dalam sebuah percobaan biologi 4 konsentrasi bahan kimia digunakan
untuk merangsang pertumbuhan sejenis tanaman tertentu selama periode
waktu tertentu. Data pertumbuhan berikut, dalam sentimeter, dicatat dari
tanaman yang hidup.
MPDR5202/MODUL 7 7.15
Konsentrasi
1 2 3 4
8,2 7,7 6,9 6,8
8,7 8,4 5,8 7,3
9,4 8,6 7,2 6,3
9,2 8,1 6,8 6,9
8,0 7,4 7,1
6,1
Jawab:
Hipotesis yang diuji :
H0 : 1 =2 = 3 =4 = 0
H’1 : sekurang-kurangnya ada i tidak sama dengan nol
Taraf signifikansi yang diambil 0,05 dan dengan
dk k –1, N – k 4, 20 – 4 3,16 maka wilayah kritisnya adalah
F > 5,29
Perhitungan:
Perhatikan tabel berikut:
Konsentrasi
1 2 3 4
8,2 7,7 6,9 6,8
8,7 8,4 5,8 7,3
9,4 8,6 7,2 6,3
9,2 8,1 6,8 6,9
8,0 7,4 7,1
6,1
Jumlah 35,5 40,8 40,2 34,4 150,9
Jumlah
Kuadrat 315,93 333,42 271,3 237,24 1157,89
2
SSTotal 8, 22 8, 7 2 6,92 7,12
150,9
20
19,3495
Tabel Anova
Sumber Keragaman Jumlah Kuadrat df MS F
Antar Kelompok 15,46 3 5,15
21,21
Dalam Kelompok 3,89 16 0,21
Total 19,35
Karena F = 21,21 lebih besar dari 5,29, maka hipotesis nol ditolak. Artinya
minimal terdapat dua jenis pertumbuhan yang disebabkan oleh empat
konsentrat.
Seperti juga dalam uji-t pada pengujian rata-rata kelompok saling bebas,
sedikit terpenuhinya syarat distribusi normal tidaklah mengganggu hasil
pengujian, secara khusus dapat benar untuk sampel yang semakin besar.
Tetapi, dengan populasi-populasi dengan kurva distribusinya yang miring,
ANOVA menghasilkan kesimpulan yang tidak akurat. Apabila ukuran
sampel-sampelnya kecil bahkan sangat kecil dan ada pertanyaan serius
tentang asumsi normalitas, maka salah satu alternatif yang dapat dilakukan
adalah menggunakan uji nonparametrik, yakni Uji Krukal-Wallis.
MPDR5202/MODUL 7 7.17
Ho : i j 0 VS H a : i j 0
Dari kelima prosedur di atas, metode yang kelima, menurut Dowdy &
Wearden (1985), uji Tukey HSD merupakan uji yang moderat, sedangkan
Scheffe merupakan metode yang paling konservatif.
Pertama hitung xi x j untuk i, j 1,2,3,, k dengan i j dan
susunlah dalam tabel, kemudian lakukan pengujian sesuai dengan statitsitik
uji berikut ini.
X1 X 2 X1 X 2
t
2 2
s s 2 s 2p
p p
n n n
MSe
xi x j q( , r , k ( n 1))
n
MSe
HSD q ,
n
MSe
xi x j q( , r , N k ))
n
c. Scheffe’sMethode
Untuk membandingkan dua rata-rata menurut metode ini adalah sebagai
berikut.
Tolak hipotesis nol jika:
2MSe
xi x j (k 1) F( ;( k 1, k ( n 1)
n
7.20 Statistika Pendidikan
MSe MSe
xi x j (k 1) F( ;( k 1, N k )
ni nj
Contoh 7.3
Pada contoh 7.1 sudah dibahas bahwa hipotesis nol pada uji ANOVA ditolak,
dengan demikian minimal ada dua mean dari kelima kelompok tersebut
berbeda. Untuk itu kita akan melakukan pengujian lebih lanjut, perbandingan
mean antar kelompok mana saja yang berbeda.
Langkah pertama dalam melakukan uji posthoc adalah sama dengan uji
hipotesis lainnya, yakni menyusun hipotesis yang diujinya. Karena ada lima
kelompok yang dibandingkan maka uji lanjutannya ada kombinasi 2 dari 5,
yakni
5 5! 5 4 3 2 1
C2 10
5 2 ! 2! (3 2 1) (2 1)
Jadi ada 10 buah hipotesis yang diuji. Hipotesis-hipotesis tersebut adalah
H0 : a b VS H1 : a b
H0 : a c VS H1 : a c
H0 : a d VS H1 : a d
H0 : a e VS H1 : a e
H0 : b c VS H1 : b c
H0 : b d VS H1 : b d
H0 : b e VS H1 : b e
H0 : c d VS H1 : c d
H0 : c e VS H1 : c e
H0 : d e VS H1 : d e
MPDR5202/MODUL 7 7.21
XD XC XA XE XB
XD 1,2 2,4 3,8 5,0
XC 1,2 2,6 3,8
XA 1,4 2,6
XE 1,2
2 MSe 2(2,88)
t( , k ( n 1)) t0,025(20) 2, 24
2
n 5
Dengan demikian, kita menolak Ho apabila X i X j 2, 24 . Dari tabel
selisih mutlak di atas, maka diperoleh hasilnya adalah sebagai berikut.
XD XC XA XE XB
XD 1,2 2,4* 3,8* 5,0*
XC 1,2 2,6* 3,8*
XA 1,4 2,6*
XE 1,2
*) menunjukkan ada perbedaan yang berarti pada taraf nyata 0,05.
Dari tabel di atas, maka kelompok-kelompok yang berbeda adalah
D dengan A
D dengan E
D dengan B
C dengan E
C dengan B
A dengan B
7.22 Statistika Pendidikan
XD XC XA XE XB
XD 1,2 2,4 3,8* 5,0*
XC 1,2 2,6 3,8*
XA 1,4 2,6
XE 1,2
*) berbeda secara berarti pada taraf nyata 0,05
3) Scheffe Method
Dengan mengambil = 0,05, dengan dk = ((5 -1),5(5-1)) = (4,20), dari
tabel Fisher (F) diperoleh F0,05; (4,20) = 3,098
2MSe 2(2,88)
(k 1) F( ;( k 1, k ( n 1) 4(3, 098 3,52 1, 07 3, 78
n 5
MPDR5202/MODUL 7 7.23
Jadi hasil uji Scheffe Method sama dengan Tukey HSD, kelompok-
kelompok yang berbeda adalah :
D dengan E
D dengan B
C dengan B
d. Jika ingin sekaligus melakukan analisis lanjutan anova klik POST HOC,
maka akan muncul pilihan sebagai berikut
Tabel Anova
ANOVA HASIL
Sum of Mean
Df F Sig.
Squares Square
Between Groups 79.440 4 19.860 6.896 .001
Within Groups 57.600 20 2.880
Total 137.040 24
MultipleComparisons
LSD
(I) (J) MeanDifference Std. 95% Confidence Interval
Sig.
MODEL MODEL (I-J) Error LowerBound UpperBound
Model A Model B -2.60000* 1.07331 .025 -4.8389 -.3611
Model C 1.20000 1.07331 .277 -1.0389 3.4389
Model D 2.40000* 1.07331 .037 .1611 4.6389
Model E -1.40000 1.07331 .207 -3.6389 .8389
Model B Model A 2.60000* 1.07331 .025 .3611 4.8389
Model C 3.80000* 1.07331 .002 1.5611 6.0389
Model D 5.00000* 1.07331 .000 2.7611 7.2389
Model E 1.20000 1.07331 .277 -1.0389 3.4389
Model C Model A -1.20000 1.07331 .277 -3.4389 1.0389
Model B -3.80000* 1.07331 .002 -6.0389 -1.5611
Model D 1.20000 1.07331 .277 -1.0389 3.4389
Model E -2.60000* 1.07331 .025 -4.8389 -.3611
Model D Model A -2.40000* 1.07331 .037 -4.6389 -.1611
Model B -5.00000* 1.07331 .000 -7.2389 -2.7611
Model C -1.20000 1.07331 .277 -3.4389 1.0389
Model E -3.80000* 1.07331 .002 -6.0389 -1.5611
Model E Model A 1.40000 1.07331 .207 -.8389 3.6389
Model B -1.20000 1.07331 .277 -3.4389 1.0389
Model C 2.60000* 1.07331 .025 .3611 4.8389
Model D 3.80000* 1.07331 .002 1.5611 6.0389
*. The meandifferenceissignificantatthe 0.05 level.
Kita cukup melihat tanda bintang yang ada pada kolom mean – diffrenece (I – J) atau
kolom Sig. Keputusannya sama dengan di atas, yakni :
- Tolak Ho jika probabilitas <
- Terima Ho jika probabilitas >.
Dari tabel di atas terlihat kelompok-kelompok yang berbeda adalah:
A dengan B
A dengan D
B dengan C
B dengan D
C dengan E
D dengan E
hasilnya sama dengan perhitungan di atas. Nah cobalah Anda lihat bagaimana jika
kita memilih metode Scheffe atau Tukey HSD.
7.28 Statistika Pendidikan
LAT IH A N
Laboratorium
A B C D
58,7 62,7 55,9 60,7
61,4 64,5 56,1 60,3
60,9 63,1 57,3 60,9
59,1 59,2 55,2 61,4
58,2 60,3 58,1 62,3
2) Tiga kelas Statistika Dasar diberikan oleh tiga dosen. Nilai akhirnya
tercatat sebagai berikut:
A 73 89 82 43 80 73 66 60 45 93 36 77
Dosen B 88 78 48 91 51 85 74 77 31 78 62 76 96 80 56
C 68 79 56 91 71 71 87 41 59 68 53 79 15
Uji, apakah ada selisih yang nyata di antara nilai rata-rata yang diberikan
oleh ketiga dosen tersebut! Gunakan taraf nyata 0,05!
3) Dalam edisi karya tulis yang sama dari tiga penulis fiksi detektif, jumlah
kalimat per halaman secara acak pada halaman-halaman yang terpilih
dari masing-masing karya adalah sebagai berikut:
MPDR5202/MODUL 7 7.29
C.E. Vulliamy 13 27 26 22 26
Ellery Queen 43 35 47 32 31 37
Helen McCloy 37 37 26 26 33 33 54
Tabel Anova
Sum of Square Mean
Sumber dk F
(SS) Square (MS)
Antar kelompok 85,925 3 28,642 13,330
Dalam Kelompok 34,380 16 2,149
Total 120,305 19
Dari tabel Fisher dengan taraf signifikansi 0,05 dan derajat bebas (3, 16)
diperoleh Ftabel = 3,24 yang lebih kecil daripada 13,330. Hasil ini
memperlihatkan bahwa hipotesis nol ditolak. Artinya minimal ada dua
rata-rata yang berbeda dari keempat rata-rata hasil pengujian ke empat
kelompok tersebut.
2) Hipotesis yang diuji adalah:
H0 : 1 2 3
H1 : Minimal ada dua rata-rata yang berbeda
Hasil perhitungan dapat dilihat pada tabel ANOVA berikut
7.30 Statistika Pendidikan
Tabel Anova
Sum of Square Mean
Sumber dk F
(SS) Square (MS)
Antar kelompok 335,353 2 167,676 0,465
Dalam Kelompok 13349,747 37 360,804
Total 13685,100 39
Dari tabel Fisher dengan taraf signifikansi 0,05 dan derajat bebas (2, 37)
diperoleh Ftabel = 3,255 yang lebih besar daripada 0,465. Hasil ini
memperlihatkan bahwa hipotesis nol diterima. Artinya tidak ada
perbedaan nilai mahasiswa yang berarti dari ketiga dosen tersebut.
3) Hipotesis yang diuji adalah
H0 : 1 2 3
H1 : Minimal ada dua rata-rata yang berbeda
Hasil perhitungan dapat dilihat pada tabel ANOVA berikut
Tabel Anova
Sum of Square Mean
Sumber dk F
(SS) Square (MS)
Antar kelompok 669,343 2 334,671 5,749
Dalam Kelompok 873,157 15 58,749
Total 1542,500 17
Dari tabel Fisher dengan taraf signifikansi 0,05 dan derajat bebas (2, 15)
diperoleh Ftabel = 3,68 yang lebih kecil daripada 5,749. Hasil ini
memperlihatkan bahwa hipotesis nol ditolak. Artinya minimal ada dua
pengarang yang hasil karyanya menuliskan banyak kalimat yang berbeda
pada setiap halamannya.
R A NG KU M AN
TES F OR M AT IF 1
b.
Tentukanlah dkbet, dkwithin, dan dktotal!
Tentukanlah S2b , S2W
c.
Ujilah hipotesis nol bahwa 1 = 2 = 3 = 4 pada = 0,05! Berikan
d.
Kesimpulan!
4) Kita bekerja dengan analisis anova satu jalur terhadap skor performance
dari lima kelompok yang terdiri dari masing-masing delapan kasus dan
hasilnya menunjukkan signifikansi. Dalam analisis ini sW2 18, 2 dan
rata-rata masing-masing kelompoknya adalah X1 14,5; X 2 11,5;
X 3 19,0; X 4 18,1dan X 5 5 . Gunakanlah uji LSD, Tukey HSD, dan
Scheffe dengan menggunakan = 0,05 untuk menguji perbandingan
antar kelompoknya! Berikan kesimpulan!
5) Suatu analisis varians dilakukan untuk membandingkan berbagai media
pembelajaran dengan tabel ANOVA sebagai berikut
Sumber Dk SS MS
Antar Kelompok …………….. …………. 598
Dalam Kelompok 20 3600 ………
Kegiatan Belajar 2
P ara peneliti sering tertarik dalam mengkombinasikan dua jenis atau tipe
perlakuan. Sebagai contoh, sebuah peneliti tentang penurunan berat
badan melalui berbagai kombinasi diet dengan berbagai jenis olah raga
jogging pada setiap hari yang dilakukan oleh peserta diet. Misalkan
kombinasi dari kedua jenis tersebut adalah sebagai berikut.
Diet
Protein Lemak Karbohidrat
Normal
tinggi tinggi tinggi
Jogging
0 mil
1 mil
2 mil
1. Dalam jogging, contoh di atas, kedua faktor adalah perlakuan, faktor diet
berbentuk kualitatif, sedangkan faktor jogging merupakan perlakuan
kuantitatif.
2. Dalam perubahan tingkat gula darah yang diukur melalui berbagai dosis
dari vitamin C yang dikombinasikan dengan berbagai dosis aspirin,
kedua faktornya (vitamin C dan aspirin) merupakan perlakuan yang
kuantitatif.
3. Jika penjualan produk tertentu dicatat dalam berbagai Standard
Metropolitan Statistical Area dan pada berbagai tipe rangkaian
penyimpanan, maka faktornya adalah area dan rangkaian. Keduanya
klasifikasi, artinya kedua faktornya adalah klasifikasi kualitatif.
4. Jika masa pakai ban yang ditentukan oleh perusahaan produsennya dan
diukur berdasarkan permukaan jalan yang berbeda, maka faktor
perusahaan merupakan klasifikasi kualitatif, sedangkan permukaan jalan
merupakan perlakuan kualitatif.
Hal penting yang perlu diperhatikan dalam desain ini adalah randomisasi
(randomization). Dalam contoh di atas, jogging dan vit C-aspirin, sampel
harus diambil secara acak pada masing-masing kombinasi level. Dalam
contoh penjualan, penyimpanan harus dipilih secara acak dari rangkaian
penyimpanan dalam area. Dan dalam contoh kasus pengujian ban di atas, ban
dari perusahaan harus dipilih secara acak untuk berbagai tipe jenis jalan.
Interaksi merupakan pengaruh tambahan yang memperlihatkan pengaruh
kombinasi dari level-level yang ada. Sebagai contoh, kombinasi dari level
diet dan level jogging mungkin menghasilkan penurunan berat badan sebagai
pengaruh dari kedua level tersebut secara bersamaan. Dalam hal ini, analisis
data harus dilakukan untuk interaksi-interaksi yang mungkin, penelitian harus
mengamati lebih dari subjek pada setiap kombinasinya.
Secara geometrik, tidak adanya interaksi diperlihatkan dengan garis-
garis yang paralel ketika rata-rata dari variabel respons digambar untuk
berbagai level kombinasi faktor-faktornya. Adanya interaksi ditandai dengan
adanya deviasi atau penyimpangan dari kesejajaran garis-garisnya. Untuk
mengilustrasikan ada atau tidak adanya interaksi dapat dilihat pada gambar
berikut.
7.36 Statistika Pendidikan
Gambar 7.3
Pola Perbedaan dan Interaksi Antara 2 Faktor
MPDR5202/MODUL 7 7.37
Kolom Nilai
Baris Total
1 2 … C Tengah
x111 x121 … x1c1
x112 x122 … x1c2
1 . . . T1.. x1..
. . .
. . .
x11n x12n … x1cn
x211 x221 … x2c1
x212 x222 x2c2
2 . . . T2.. x2..
. . .
. . .
x21n x22n x2cn
. . . . . . .
. . . . . . .
. . . . . . .
xr11 xr21 … xrc1
xr12 xr22 xrc2
r . . . Tr.. xr..
. . .
. . .
xr1n xr2n Xrcn
Total T.1. T.2. … T.c. T…
Mean x.1. x.2. x.c. x...
Setiap pengamatan dapat ditulis dalam bentuk xijk ij ijk , k 1, 2, ... n;
j 1, 2, ..., c; dan i 1, 2, ..., r . Dengan cara yang sama sebagaimana
anova 2 jalur tanpa interaksi, model di atas dapat ditulis dalam bentuk
7.38 Statistika Pendidikan
i 1, 2, , a
j 1, 2, , b
k 1, 2, , n
Dengan :
: mean keseluruhan dalam percobaan
i : pengaruh dari level ke-i dari faktor A; level-levelnya mungkin
ditetapkan secara acak.
j : pengaruh dari level ke-j dari faktor B;level-level mungkin
ditetapkan secara acak.
ij : pengaruh interaksi antar level ke-i dari faktor A dan level ke-j
dari faktor B. perlu diketahui bahwa satu simbol, bukan
perkalian antara dengan .
ijk : pengaruh acak dari sampling dan ijk : IND (0,2).
Pandang bahwa
xijk x... ( xi.. x... ) ( x. j. x... ) ( xij . xi.. x. j . x... ) ( xijk xij . )
Analog pada kasus anova satu jalur, maka diperoleh persamaan Identitas
sebagai berikut:
MPDR5202/MODUL 7 7.39
i 1 j 1 i 1 j 1 k 1
i 1 j 1 k 1
r
JKB cn xi.. x...
2
i 1
j 1
i 1 j 1
r 1 j 1 k 1
Atau
r c n T2
JKT xijk 2 ...
i 1 j 1 k 1 rcn
r
T 2
i ..
T...2
JKB i 1
cn rcn
c
T
j 1
2
. j.
T...2
JKK
rn rcn
r c r c
T
i 1 j 1
2
ij . Ti..2 T
j 1
2
. j.
T...2
JK ( BK ) i 1
n cn rn rcn
JKG JKT JKB JKK JK ( BK )
7.40 Statistika Pendidikan
Tabel 7.4
Tabel ANOVA Dua Jalur
Contoh 7.4
Data berikut adalah nilai akhir yang dicapai 5 siswa dalam penyelesaian
pemecahan masalah yang diberikan dalam proses bimbingan individual yang
dilakukan melalui 4 model berbeda pada tiga kelompok siswa berdasarkan
kelas, yakni kelas IV, V, dan VI.
Model Pembinaan
Kelas
A B C D
IV 2 4 3 1
1 2 1 1
4 3 6 6
V
5 3 7 5
6 8 7 5
VI
4 8 8 6
Gunakan taraf nyata 0,05 untuk menguji hipotesis berdasarkan model, kelas,
dan interaksi antara model dan kelas!
7.42 Statistika Pendidikan
Jawab:
Hipotesis yang diuji dari soal di atas adalah:
1. H0: Tidak ada perbedaan kemampuan pemecahan masalah siswa
berdasarkan kelas.
2. H0: Tidak ada perbedaan kemampuan pemecahan masalah siswa dalam
model pembinaan
3. H0: Tidak ada interaksi antara kelas dan model pembinaan terhadap
kemampuan pemecahan masalah siswa.
Model Pembinaan
Kelas Total
A B C D
2 4 3 1
IV 15
1 2 1 1
4 3 6 6
V 39
5 3 7 5
6 8 7 5
VI 52
4 8 8 6
Total (KOLOM) 22 16 15 24 106
Tests of Between-SubjectsEffects
Dependent Variabel: Pemecahan Masalah
Type III
Mean Partial Eta
Source Sum of df F Sig.
Square Squared
Squares
Corrected 118.833a 11 10.803 14.404 .000 .930
Model
Intercept 468.167 1 468.167 624.222 .000 .981
Kelas 88.083 2 44.042 58.722 .000 .907
Model 9.833 3 3.278 4.370 .027 .522
Kelas * Model 20.917 6 3.486 4.648 .011 .699
Error 9.000 12 .750
Total 596.000 24
Corrected 127.833 23
Total
a. R Squared = .930 (Adjusted R Squared = .865)
4) Interpretasi.
Untuk interpretasi, kita hanya perlu memperhatikan kolom sig, dan
bandingkan hasilnya dengan taraf nyata yang dipilih, atau dapat juga
membandingkan seperti dalam perhitungan manual, yakni
membandingkan F hitung yang dilingkari dengan F tabel.
5) Uji perbandingan menggunakan Plot profil
Catatan: Anda juga dapat memberikan interpretasi dari gambar di atas. Perlu
juga diketahui bahwa hasil plot bersifat deskriptif, artinya hanya berlaku pada
sampel. Apakah perbedaan-perbedaan tersebut berarti, Anda dipersilakan
untuk melakukan uji lanjutannya.
LAT IH A N
Sumber df SS MS F
Kolom (Galur) 2 18654,167 9327,083 9,225
Baris (Lingkungan) 1 15229,688 15229,688 15,113
Kolom X Baris 2 1098,500 549,250 0,545
Antar sel (error) 42 42325,125 1007,741
Total 47 77307,479
L2
L1
R A NG KU M AN
TES F OR M AT IF 2
R2
2) Data berikut merupakan hasil empat kali formatif yang diperoleh 5 siswa
untuk mata pelajaran matematika, bahasa Indonesia, IPA, dan IPS:
Kegiatan Belajar 3
Analisis Kovarians
B. SEKILAS ANAKOVA
melalui skala psikologi termasuk dalam kelompok ini misalnya: harga diri,
motivasi belajar, IQ, Hasil Tes Matematika. Kategorikal Variabel hasil
pengkodean terhadap kategori (nominal). Misalnya: jenis kelamin, kelas,
lokasi tempat tinggal, bidang pekerjaan. Kesimpulannya dalam anakova,
variabel tergantungnya berbentuk kontinum dan harus ada dua jenis variabel
dalam variabel bebas, yaitu kategorikal dan kontinum.
Tabel 7.5
Contoh Masalah Anakova
Desain penelitian yang dipakai adalah desain pra and paska uji (pretest-
posttest design). Peneliti membagi kelompok penelitian menjadi dua secara
acak (randomized design), yaitu kelompok perlakuan (KP) dan kelompok
kontrol (KK). Kelompok perlakuan akan mendapatkan pelatihan sedangkan
kelompok kontrol mendapatkan program pelatihan lain sebagai placebo.
MPDR5202/MODUL 7 7.59
Dalam hal ini yang dijadikan kovarian adalah motivasi belajar. Sebelum
perlakuan diberikan, pengukuran kepercayaan diri dan motivasi belajar
dilakukan. Setelah perlakukan diberikan pengukuran hanya dilakukan pada
kepercayaan diri.
Tabel 7.6
Penyajian Data
I II III
X Y X Y X Y
X11 Y11 X21 Y21 X31 Y31
X12 Y12 X22 Y22 X31 Y32
X13 Y13 X23 Y33 X32 Y33
X14 Y14 X24 Y34 X34 Y34
T1.(X) T1.(Y) T2.(X) T2.(Y) T3.(X) T3.(Y) T..(x) T..(Y)
7.60 Statistika Pendidikan
Tabel 7.7
Jumlah Kuadrat dan Hasil Kali Tidak Terkoreksi
X XY Y
T( X ) X ij2 T( XY ) X ij Yij T(Y ) Yij2
i j i j i j
2
T Ti.( X )Ti.(Y ) Ti.(2Y )
A( X ) A( XY ) A(Y )
i .( X )
i ni i ni i ni
2 2
T T..( X )T..(Y ) T
CF( X ) CF( XY ) CF(Y )
..( X ) ..(Y )
N N N
Adapun tabel Jumlah hasil Kuadrat dan hasil kali terkoreksinya adalah
Tabel 7.8
Jumlah Kuadrat dan Hasil Kali Tidak Terkoreksi
Sumber Df SS(X) SP SS(Y)
Perlakuan a – 1 SSa ( X ) A( X ) CF( X ) SPa A( XY ) CF( XY ) SSa (Y ) A(Y ) CF(Y )
Galat N – a SSe( X ) T( X ) A( X ) SPe( XY ) T( XY ) A( XY ) SSe(Y ) T(Y ) A(Y )
Total N – 1 SSt ( X ) T( X ) CF( X ) SPt ( XY ) T( XY ) CF( XY ) SSt (Y ) T(Y ) CF(Y )
Dan tabel jumlah kuadrat termurnikannya (adjusted) adalah
Tabel 7.9
Jumlah Kuadrat yang Termurnikannya
Sumber Df SS’(Y) MS’(Y) F
Perlakuan a–1 SS 'a (Y ) SS 't (Y ) SS 'e(Y ) SS 'a (Y ) MS 'a (Y )
MS 'a (Y ) F
a 1 MS 'e(Y )
N – a – 1 SS '
e (Y ) SSe (Y ) SPe SSe ( X )
Galat 2
SS 'e (Y )
MS 'e (Y )
N a 1
Total N–2 SS 't (Y ) SSt (Y ) SPt 2 SSt ( X )
Tolak H0 jika F > F(a-1, N-a-1)
MPDR5202/MODUL 7 7.61
Jenis Media
RADIO Surat Kabar Televisi
X Y X Y X Y
10 30 21 24 34 17
14 18 26 20 39 11
19 13 31 7 43 3
25 6 36 4 47 -6
27 3 41 -5 52 -10
Dari data tersebut ujilah apakah ada perbedaan keuntungan yang diperoleh
berdasarkan jenis media yang digunakan untuk beriklan dengan
memperhatikan faktor banyaknya pekerja dalam masing-masing restoran?
Dari hasil di atas, maka hitung jumlah kuadrat dan jumlah hasil kali dari
masing-masing sebagaimana dalam tabel berikut.
7.62 Statistika Pendidikan
X XY Y
T( X ) X ij 16505 T( XY ) X ij Yij 2544
2
T(Y ) Yij2 3059
i j i j i j
Hasilnya adalah kita menerima hipotesis nol, yakni tidak ada perbedaan
yang berarti antara keuntungan-keuntungan yang diperoleh ketiga perusahaan
tersebut.
Langkah yang pertama kita hitung adalah jumlah kuadrat dan hasil kali
silang masing-masing kelompok S(XX)i, S(XY)i, S(YY)i, dan koefisien regresi
masing-masing kelompok bi dan ai dengan i = 1, 2, 3, …, a. Masing-masing
dari jumlah kuadrat dan hasil kali silangnya dihitung dengan
S( XX )i X ij2 Ti.(2 X ) / ni
j
Y
2
Yˆij
ij
S(YY )i S(2XY )i S( XX )i
dengan si2
j
, kemudian hitunglah nilai
ni 2 ni 2
si2 (terbesar )
Fmax, dengan Fmax . Bandingkan nilai Fmax hasil perhitungan
si2 (terkecil )
tersebut dengan Fmax (tabel) pada taraf signifikansi dan dk = (a, n – 2).
JikaFmax ≥ daripada Fmax(tabel) maka kita tolak hipotesis nol.
Untuk pengujian keseragaman kemiringan garis-garis regresinya atau
1 2 a dapat dilakukan dengan analisis varians. Langkah
pertama yang harus dihitung adalah menentukan nilai b gabungan. Nilai
dapat dihitung dengan menggunakan rumus sebagai berikut.
SPe
b
SS e ( X )
Kemudian hitung jumlah kuadrat deviasi yang diperoleh dari taksiran
untuk kemiringan gabungan b, yakni G, dengan
G SS 'e(Y )
Dan jumlah kuadrat deviasi individualnya dari bi misalkan H dan
dihitung dengan
H SYY (i ) S XY
2
( i ) S XX ( i ) .
i
j n1 5
Dan selanjutnya hingga i = 3.
Kemudian kita hitung koefisien regresi pada masing-masing kelompoknya
adalah sebagai berikut.
S xy (1) 300
b1 1, 46
S xx (1) 206
a1 y1 b1 x1 14 (1, 46)(19) 41,74
Lakukan seterusnya untuk i = 2 dan 3.
Secara keseluruhan, hasilnya dapat dilihat pada tabel berikut.
I II II
X Y X Y X Y
Sxx 206 250 194
Sxy –300 –370 –311
Syy 458 566 510
Mean (x) 19 31 43
Mean (y) 14 10 3
B –1.46 –1.48 –1.6
A 41.74 55.88 71.6
7.66 Statistika Pendidikan
ni 2 ni 2
Hasilnya dapat dilihat pada tabel berikut.
media df s yy (i ) sxy2 (i ) sxx (i ) si2
I 3 21.11 7.04
II 3 18.4 6.13
III 3 11.44 3.81
50.95
G SSe( y ) 53, 44
Dengan memilih = 0,05, dari tabel F (Fisher) diketahui F0,05 (2,9) = 4,256
nilainya lebih besar dibandingkan dengan Fhitung = 0,220. Dengan demikian
kita terima H0 yakni koefisien-koefisien kemiringan garis regresi ketiganya
sama.
Untuk mengetahui apakah analisis kovarian layak digunakan untuk
pengujian perbedaan keuntungan ketiga perusahaan dengan memperhatikan
banyaknya pekerja, digunakan hipotesis sebagai berikut
H0 : = 0 melawan H1: 0
Yang diuji melalui nilai F, dengan
981
2
SPe2 SSe ( x ) 650
F 304, 777
MSe( y ) 4,858
Dengan derajat bebas 1, N – a –1 1,11 dan jika diambil = 0,05 dari
tabel F diperoleh F0,05(1, 11) = 4,844 yang jauh lebih kecil dari 304,777.
Dengan demikian kita tolak hipotesis nol. Dan hal tersebut menunjukkan
bahwa kita layak menggunakan analisis kovarians.
7.68 Statistika Pendidikan
LAT IH A N
Sampel dari tiga varietas gandum A, B, dan C yang diperoleh dalam tiap
meter persegi (y) dengan curah hujan masing-masing dalam inci adalah
sebagai berikut.
A B C
x y x y x y
1 2 2 3 3 2
2 6 3 7 4 6
4 10 5 11 6 10
5 10 6 11 7 10
R A NG KU M AN
TES F OR M AT IF 3
Tes Formatif 1
1) Karena penolakan hipotesis nol sudah cukup apabila minimal ada dua
kelompok yang berbeda.
2) Karena perhitungan dalam analisis varians menggunakan jumlah
kuadrat, sehingga nilai F hitung (rasio antara rata-rata antar kelompok
dengan rata-rata dalam kelompok) tidak akan pernah negatif.
3) Dari hasil perhitungan diperoleh:
Hipotesis uang diuji adalah:
H0 : 1 = 2 = 3 = 4
H1 : minimal ada dua mean yang berbeda.
Dari data yang ada diperoleh
SSbetween = 119,65; SSwithin = 44,92; dan SStotal = 164,57;
dkbetween = 3; dkwithin = 8; dan dktotal= 11.
S b2 39,88;, S W2 5,62.
Secara ringkas dapat dilihat pada table berikut
ANOVA
Persentase
Sum of Squares df Mean Square F Sig.
BetweenGroups 119.649 3 39.883 7.103 .012
WithinGroups 44.920 8 5.615
Total 164.569 11
Dari tabel di atas, terlihat bahwa nilai Fhitung = 7,103 yang memberikan
nilai penolakan hipotesis nol sebesar 0,012. Karena telah dipilih
0, 05, maka kita menolak hipotesis nol.
4) Pertama kita susun dulu tabel nilai mutlak selisih rata-rata antar
kelompoknya.
X5 5 X 2 11,5 X1 14,5 X 4 18 X 3 19
X5 5 6,5 9,5 13 14
X 2 11,5 3 6,5 7,5
X1 14,5 3,5 4,5
X 4 18 1
MPDR5202/MODUL 7 7.73
Dengan LSD:
2 sw2 2 18, 2
Nilai dari t t0,025;35
2, k n 1
2, 030 4,55 4,33 .
n 8
Dengan demikian selisih mutlak antar rata-rata yang lebih besar dari 4,33
adalah sebagai berikut.
X5 5 X 2 11,5 X1 14,5 X 4 18 X 3 19
X5 5 6,5* 9,5* 13* 14*
X 2 11,5 3 6,5* 7,5*
X1 14,5 3,5 4,5*
X 4 18 1
Keterangan *: signifikan dalam taraf nyata 0,05
Dengan Scheffemethod:
2 sw2 2 18, 2
Kita hitung 4 F0,05;4,28
k 1 F ; k 1, k n 1 7, 022
n 8
Dengan demikian, selisih mutlak antar rata-rata yang lebih besar dari
7,022 adalah sebagai berikut:
7.74 Statistika Pendidikan
X5 5 X 2 11,5 X1 14,5 X 4 18 X 3 19
X5 5 6,5 9,5* 13* 14*
X 2 11,5 3 6,5 7,5*
X1 14,5 3,5 4,5
X 4 18 1
Keterangan *: signifikan dalam taraf nyata 0,05
C 20 22 23 33
A 2 5 13
D 3 11
B 8
sw2 180
Kita hitung HSD q 3,96 23, 76 . Dari hasil ini dapat
n 5
diketahui bahwa yang berbeda hanyalah kelompok C dengan F.
Tes Formatif 2
1) Dari gambar dapat disimpulkan:
Secara keseluruhan grafik (a, b dan c) ada perbedaan dalam main effect
R (R1 selalu lebih tinggi dari R2), tetapi bagi main effect C tidak dapat
disimpulkan.
2) Hasil perhitungan dengan SPSS diperoleh tabel ANOVA adalah sebagai
berikut:
MPDR5202/MODUL 7 7.75
Test Formatif 3
1) Kondisi penelitian yang menyebabkan anakova menjadi penting dan
perlu digunakan adalah:
a. Peneliti ingin mengendalikan galat dan meningkatkan ketepatan
analisis.
b. Menyesuaikan atau mengoreksi rata-rata perlakuan dari variabel tak
bebas.
c. Membantu menafsirkan data, khususnya yang berkaitan dengan
pengaruh alamiah perlakuannya.
d. Menguraikan kovariat total atau jumlah hasil kali menjadi bagian-
bagiannya.
e. Menduga nilai yang hilang.
2) Hasil perhitungan dengan memperhatikan berat awal anak domba.
Sumber df SS MS F
Perlakuan 1 15,509 15,509 1,038
Galat 13 194,234 14,941
Karena F0,05 (1,13) = 4,67 lebih besar dari 1,038, maka hipotesis nol
diterima. Artinya dengan memperhatikan berat awal, pertambahan berat
badan kedua kelompok tidak menunjukkan perbedaan.
Apabila pengujian tanpa memperhatikan berat awalnya hasilnya adalah
sebagai berikut.
Sumber df SS MS F
Perlakuan 1 22,563 22,563 0,594
Galat 14 531,455 37,961
Karena F0,05 (1, 14) = 4,60, maka hipotesis nol juga diterima. Dari kedua
tabel tersebut, kesimpulan yang diperoleh adalah sama yakni menerima
hipotesis nol. Tetapi ada perbedaan dalam besar probabilitas penolakan
hipotesis nol (Anda hitung dengan SPSS), terlihat bahwa besar
MPDR5202/MODUL 7 7.77
ANOVA
Skor Tes
Sum of Mean
df F Sig.
Squares Square
Between Groups 22.154 1 22.154 .327 .572
Within Groups 1623.846 24 67.660
Total 1646.000 25
Dari tabel di atas, besar signifikansi penolakan hipotesis nolnya
adalah 0,572. Artinya tidak ada perbedaan skor antara siswa pada
model A dengan Model B.
7.78 Statistika Pendidikan
Daftar Pustaka
Steel, R. G. D. & Torrie, J. H., 1995. Prinsip dan Prosedur Statistika. Suatu
Pendekatan Biometrik. Alih Bahasa: Bambang Sumantri. Jakarta:
Gramedia Pustaka Utama.
PEN D AH U LU A N
P ada Modul 3 kita telah membahas tentang statistik deskriptif dari dua
distribusi, yakni korelasi dan regresi. Sebagaimana telah Anda ketahui
bahwa bahasan kedua dalam analisis statistika adalah inferensial. Pada
Modul 8 ini kita akan mempelajari lebih lanjut tentang korelasi dan regresi
secara inferensial. Sebagaimana analisis inferensial pada statistik lainnya,
analisis inferensial pada korelasi juga berkaitan dengan penaksiran dan
pengujian hipotesis. Dalam modul ini kita akan membahas keduanya, yakni
penaksiran dan pengujian hipotesis bagi korelasi.
Selain membahas korelasi Pearson, penyajian dalam modul ini
dilengkapi juga dengan analisis korelasi bagi data dengan skala pengukuran
nominal dan ordinal. Hal ini penting untuk dipahami, mengingat tidak semua
data dalam penelitian pendidikan mempunyai skala pengukuran interval atau
rasio. Ada beberapa korelasi lain yang digunakan untuk perhitungan pada
skala pengukuran nominal kategorial dan ordinal. Dalam modul ini hanya
dibahas 2 buah saja, yakni Kontingensi C dan Rank Spearman. Untuk
melengkapinya Anda dapat membaca referensi lain, sebagaimana yang ada
dalam daftar pustaka.
Penyajian berikutnya adalah regresi. Regresi membahas tentang
hubungan antara variabel-variabel dapat berupa hubungan yang memiliki
sebab dan akibat (kausalitas). Variabel yang menjadi sebab adalah “variabel
bebas” atau prediktor. Sedangkan variabel yang menjadi akibat adalah
“variabel terikat” atau respons. Langkah awal dalam analisis regresi adalah
menaksir atau menentukan persamaan regresi. Masalah tersebut sudah
dibahas juga dalam Modul 3. Dalam modul ini kita akan membahas lebih
mendalam, yakni pengujian apakah persamaan regresi tersebut fit (cocok)
dengan data, mengkaji besar pengaruh variabel bebas dalam model terhadap
variabel terikatnya (R2), serta uji asumsi-asumsi yang harus dilakukan dalam
analisis regresi.
8.2 Statistika Pendidikan
Akhir dari pembahasan modul ini adalah korelasi parsial dan korelasi
ganda. Korelasi ini disimpan di akhir pembahasan bertujuan agar Mahasiswa
lebih mudah dalam memahaminya. Kedua korelasi tersebut sangat berkaitan
dengan regresi, dengan demikian lebih mudah dipahami jika keduanya
(korelasi dan regresi) telah dibahas.
A. DESKRIPSI SINGKAT
Modul ini terdiri dari dua kegiatan belajar. Kegiatan belajar pertama
merupakan kelanjutan dari Modul 3, yakni membahas pengujian inferensi
untuk analisis korelasi Pearson. Selain itu untuk melengkapi penyajian,
korelasi rank Spearman, dan kontingensi C. Pada Kegiatan Belajar 2
disajikan analisis lanjutan bagi regresi sederhana, yakni membahas koefisien
determinasi, pengujian untuk model regresi. Selain regresi sederhana, dibahas
juga regresi jamak (multiple). Pada penyajiannya dibahas penaksiran untuk
model persamaan regresi, koefisien determinasi, pengujian secara
keseluruhan, dan pengujian secara parsial (individual). Untuk melengkapi
pembahasan, pada akhir kegiatan disajikan tentang pengujian asumsi bagi
regresi, yakni normalitas residual, autokorelasi, dan homoskedastisitas.
Untuk melengkapi pembahasan, materi pada modul ini disajikan tentang
korelasi parsial dan pengujiannya, serta korelasi ganda.
B. RELEVANSI
dalam konsep regresi mempunyai keterbatasan. Dan hal itu perlu dipahami
oleh peneliti.
Kegiatan Belajar 1
Analisis Korelasi
A. KORELASI PEARSON
Hal ini mengindikasikan bahwa setengah skor yang di atas median pada
variabel pertama akan di bawah median pada variabel kedua.
Dalam kasus korelasi antara Skor SAT dan GPA mahasiswa baru di atas
yang besarnya +0,35 tabel di bawah menyatakan bahwa skor yang di atas
median pada SAT harapannya 61,2% juga akan terjadi pada skor GPA, dan
sisanya 38,8% akan mempunyai skor GPA di bawah median.
Untuk membantu Anda memaknai nilai korelasi sebagaimana dijelaskan
di atas, berikut disajikan tabel diambil dari Minium, dkk. (1993) yang Anda
telah pelajari pada Modul 3.
Tabel 8.1
Pemaknaan dari Korelasi Sejati
r
Z x Zy
n 1
Dengan n adalah banyaknya pasangan skor X dan Y, dan Z adalah angka
baku.
Catatan : di beberapa buku, pembaginya adalah (n).
8.6 Statistika Pendidikan
r
xy
x y 2 2
Dengan
X Y
xy XY n
X Y
2 2
x X
2 2
n
dan y Y
2 2
n
Contoh 8.1
Perhatikan kembali data tentang hasil pengukuran tingginya tekanan (Stress)
dan tingkat Kesulitan Makan (Eating Difficulty) yang diperoleh dari hasil
penelitian Bear (Minium, dkk., 1993).
Tabel 8.2
Data Stress dan Kesulitan Makan
Y
2
1342
y2 Y 2 n
2458
10
662, 4
r
xy
385, 6
0, 675
x y
2 2
(492, 4)(662, 4)
Dengan demikian ada hubungan positif (searah) antara Tingkat Stres (X) dan
Tingkat Kesulitan Makan (Y).
Cobalah Anda hitung dengan menggunakan dua rumus korelasinya lainnya!
Dari persamaan di atas dapat dilihat bahwa semakin besar ukuran sampel (n
besar), maka nilai simpangan baku dan distribusi sampling r akan makin
MPDR5202/MODUL 8 8.9
kecil, artinya apabila kita mengambil sampel acak dengan jumlah yang besar.
Dan ketika nilai meningkat besar, maka simpangan baku akan menjadi
kecil, artinya nilai r akan lebih tidak beragam dari sampel ke sampel apabila
korelasi sebenarnya cukup besar (kuat).
Secara teoritis distribusi sampling dari r tidak membentuk distribusi
normal. Apabila = 0, maka kita peroleh distribusi yang simetris dan dapat
dikatakan akan mendekati normal. Namun ketika nilainya tidak nol, maka
distribusi sampling ini akan miring disebabkan nilainya tidak akan lebih kecil
dari -1 dan tidak akan lebih besar dari +1. Semakin besar nilai mutlak dari
(mendekati 1), maka semakin miring bentuk kurvanya. Oleh karena itu,
dibutuhkan pendekatan lain untuk melakukan inferensi dari korelasi populasi.
Untuk beberapa masalah menurut Minium, dkk. (2003) kita dapat
menggunakan distribusi t-student sebagai model yang sesuai, dan bagi yang
lainnya transformasi r pada suatu variabel Z’ akan menawarkan solusi
terbaik.
Pendapat Minium di atas diperkuat jika oleh Steel dan Torrie (1995)
yang mengatakan bahwa nilai r sangat bervariasi untuk sampel-sampel kecil,
khususnya untuk di atau dekat dengan nol. Sepasang nilai pengamatan
dapat mengubah nilai r besar sekali. Hal ini menyebabkan sulitnya
mendeteksi nilai yang kecil bila sampelnya berukuran kecil. Untungnya
nilai yang kecil mempunyai kegunaan praktis yang kecil pula.
Inferensi yang akan dibahas pertama dalam modul ini adalah penaksiran
interval bagi . Menurut Steel & Torrie (1995), cara yang mudah untuk
membuat selang kepercayaan bagi adalah menggunakan tabel grafik yang
dibuat oleh David yang terlihat pada gambar berikut.
8.10 Statistika Pendidikan
Gambar 8.1
Selang Kepercayaan bagi Koefisien Korelasi : P = 0,95
Inteval) Dengan demikian, selang kepercayaan bagi nilai korelasi di atas, jika
dipilih = 0,05 adalah CI Z Z Z 1 Z 0, 748 1,96 0,378
2
Karena thitung= 2,24 > 1,943, maka kita tolak H0. Dengan demikian, Stres dan
Kesulitan berkorelasi positif secara berarti pada taraf signifikansi 0,05. Dan
apabila kita gunakan tabel kritis bagi r, dengan = 0,05 dan dk = 8,
diperoleh rtabel = 0,549. Karena rhitung= 0,675lebih besar dari0,549, maka kita
dapat menolak H0 pada taraf nyata 0,05. Kesimpulan yang diperoleh sama
dengan pengujian melalui statistik t.
Selain pengujian hipotesis secara tunggal terhadap nilai korelasi, kita
juga dapat melakukan pengujian perbandingan antara dua korelasi dari dua
kelompok yang saling bebas. Misalkan, Anda telah menghitung nilai korelasi
antara motivasi dan hasil belajar terhadap siswa perempuan sebesar +0,50,
dan terhadap siswa laki-laki +0,35 dengan masing-masing banyaknya siswa
perempuan yang diukur adalah 20 orang dan siswa laki-laki sebanyak 25
orang. Apakah ada perbedaan korelasi di antara kedua kelompok tersebut?
Sebagaimana pada uji beda dua rata-rata terhadap dua kelompok yang
saling bebas, maka kita harus menyusun hipotesis nol dan alternatifnya.
Penyusunan hipotesis alternatifnya mirip dengan uji beda rata-rata, dapat
MPDR5202/MODUL 8 8.13
Jika kita pilih taraf signifikansi 0,05, maka titik kritisnya adalah
z 1,96 atau z 1,96 . Karena z-hitung berada di antara -1,96 dan 1,96,
maka kita terima Ho. Artinya tidak ada perbedaan korelasi di antara kedua
kelompok tersebut.
Menurut Minium, dkk. (1993) prosedur di atas hanya pada situasi
dimana kedua kelompok saling bebas (independent). Tidak ada kejelasan
bagaimana jika korelasinya diukur pada dua kelompok yang dipasangkan
(matched).
4. Kontingensi C
Koefisien kontingensi C adalah ukuran kadar asosiasi atau relasi antara
dua himpunan atribut. Ukuran ini berguna khususnya apabila hanya
mempunyai informasi kategorial (nominal) mengenai satu di antara
himpunan-himpunan atribut. Misalkan, kita ingin mengetahui hubungan
antara jenis kelamin mahasiswa dengan pemilihan program studi pada
fakultas ilmu kependidikan. Kita ketahui bahwa jenis kelamin mempunyai
skala pengukuran nominal, begitu juga program studi pada fakultas ilmu
kependidikan. Contoh lain, misalkan level hasil belajar siswa kita kategori
menjadi sangat baik, baik, cukup, kurang, dan sangat kurang. Pihak lain kita
MPDR5202/MODUL 8 8.15
Tabel 8.3
Bentuk Tabel Kontingensi untuk Menghitung C
A1 A2 … Ak Total
B1 (A1B1) (A1B2) … (AkB1)
B2 (A1B2) (A2B2) … (AkB2)
…
Br (A1Br) (A2Bk) … (AkBr)
Total N
2
C
N 2
O Eij
2
r k
Dengan 2 ij
i 1 j 1 Eij
Artinya untuk menghitung C kita terlebih dahulu harus menghitung2 (chi-
square). Untuk lebih memahaminya perhatikanlah contoh berikut.
Tabel 8.4
Frekuensi Pengamatan antara Kemampuan
dan Keterampilan Mekanik Sumber
Tidak terampil 20 30 10
pilan
Cukup terampil 10 40 30
Terampil 5 10 20
Hitunglah kaitan antara skor dalam kemampuan mekanik dengan
keterampilan dari para pekerja otomotif tersebut!
Langkah pertama kita lengkapi tabel di atas dengan sel yang memuat
frekuensi pengamatan (Oij) dengan frekuensi harapannya (Eij). Hasilnya
adalah sebagai berikut.
Tabel8.5
Tabel Kontingensi Frekuensi Pengamatan dan harapan dari
Kemampuan dan Keterampilan Pekerja
i 1 j1 Eij
20 12 30 27, 43 10 20,57 10 14,97 40 36,57
2 2 2 2 2
12 27, 43 20,57 14,97 36,57
30 27, 43 5 7 10 16 20 12
2 2 2 2
27, 43 7 16 12
5,333 0, 2411 5, 4325 1, 6518 0,3214 0, 2411 0,5714 2, 250 5,333
21,376
x X X dan y Y Y
Dan rumus korelasinya adalah
r
xy
x y 2 2
x X X X
2
2 2
, maka
N
N N 1 2 N 1 N N 1
2
N3 N
x2 6
4
12
.
Kemudian, karena
d x y
d 2 x y x 2 2 xy x 2 , dengan kelinearan notasi sigma, maka
d 2
x y 2 xy
2 2
Dan karena
r
xy rs
x y 2 2
x y d
2 2 2
N3 N
rs , jika kita substitusikan x 2
y2
2 x y 2 2 12
N3 N N3 N
d2
rs 12 12
N3 N N3 N
2
12 12
N3 N
d
2
2
12
N3 N
2
12
6 d 2
1
N3 N
Dengan demikian, harga dari koefisien korelasi rank Spearman (rs) adalah
N
6 d i2
rs 1 i 1
N3 N
Untuk memberikan pemahaman dalam perhitungannya, perhatikan
kembali contoh tentang korelasi antara Stress (X) dengan Kesulitan Makan
(Y) yang telah dihitung menggunakan r-Pearson dengan datanya adalah
sebagai berikut.
Tabel 8.6
Skor Stress (X) dan Kesulitan Makan (Y)
Tabel 8.7
Tabel Bantuan Perhitungan Korelasi Rank Spearman
Rangking
Siswa Stress Kesulitan Makan di di2
(X) (Y)
A 5 4 1 1
B 2.5 6 -3.5 12.25
C 2.5 3 -0.5 0.25
D 7 8 -1 1
E 4 5 -1 1
F 1 1 0 0
G 8 2 6 36
H 9 7 2 4
I 6 9 -3 9
J 10 10 0 0
Jumlah 64.5
atau negatif. Keputusannya adalah jika harga nilai mutlak observasi rs sama
dengan atau lebih besar dari harga tabel yang bersesuaian dengan N dan taraf
signifikansi yang dipilih, maka kita menolak hipotesis nol, dan sebaliknya
jika harga nilai mutlak obeservasi rs kurang dari harga tabel, maka kita
terima hipotesis nol. Adapun pengujian menggunakan statistik t-student,
pengambilan keputusan seperti yang telah dipelajari dalam r-Pearson.
Sebagai contoh untuk kasus di atas, misalkan kita akan menguji bahwa
ada kaitan yang positif antara Stress (X) dan Kesulitan Makan (Y), dan kita
telah menghitungnya rs = 0,609. Jika kita pilih = 0,05, maka dari tabel
harga-harga kritis rs diperoleh r-tabel = 0,564, nilainya lebih kecil dari harga
rs. Dengan demikian, kita dapat menolak hipotesis nol. Artinya terdapat
kaitan yang positif antara Stress (X) dengan kesulitan makan (Y).
Selanjutnya, misalkan kita lakukan pengujian dengan statistik t-student
dengan hipotesis nol yang diujinya sama. Kita hitung nilai statistiknya
sebagai berikut
N 2 10 2
t rs 0, 609 0, 609(3,566) 2,172
1 rs 1 0, 609
2 2
Gambar 8.2
Penyajian Data dalam SPSS untuk Perhitungan Korelasi
Gambar 8.3
Kotak Dialog Perhitungan Korelasi Bivariat
8.26 Statistika Pendidikan
Correlations
X Y
X Pearson Correlation 1 .675*
Sig. (1-tailed) .016
N 10 10
Y Pearson Correlation .675* 1
Sig. (1-tailed) .016
N 10 10
*. Correlationissignificantatthe 0.05 level (1-tailed).
Koefisien korelasi r Pearson untuk data di atas adalah 0,675 (sesuai dengan
apa yang telah kita hitung) dengan probabilitas penolakan hipotesis nolnya
adalah 0,016. Jika kita memilih = 0,05, harga sig. (1-tailed) = 0,016 lebih
kecil dari . Dengan demikian dapat disimpulkan bahwa ada hubungan yang
positif antara Stress dengan Kesulitan Makan.
Jika kita analisis dengan nonparametric, dalam hal ini r Spearman,
hasilnya adalah sebagai berikut.
Tabel 8.9
Hasil Perhitungan Korelasi Spearman
Correlations
X Y
Spearman'srho X Correlation Coefficient 1.000 .608*
Sig. (1-tailed) . .031
N 10 10
Y Correlation Coefficient .608* 1.000
Sig. (1-tailed) .031 .
N 10 10
*. Correlationissignificantatthe 0.05 level (1-tailed).
MPDR5202/MODUL 8 8.27
Hasil dari perhitungan pada tabel di atas adalah rs = 0,608, dengan peluang
penolakan hipotesis nolnya adalah 0,031. Jadi jika kita memilih = 0,05,
maka kita menolak H0. Kesimpulan ini sama dengan pengujian melalui
Pearson, yakni ada hubungan yang positif antara Stress dengan Kesulitan
Makan.
LAT IH A N
Siswa A B C D E F G
SKOR X 3 9 7 8 4 6 7
SKOR Y 2 7 8 6 6 5 7
a. +3,00
b. –2,00
c. 0,00
d. –1,00
e. +1,00
f. –0,500
4) Dari 10 mahasiswi (perempuan) yang mengikuti kuliah statistika,
diketahui korelasi antara kemampuan matematika dan skor hasil
ujiannya adalah 0,5. Sedangkan untuk 10 mahasiswa (laki-laki) besar
korelasinya 0,3. Seseorang beranggapan bahwa korelasi antara kedua
variabel (kemampuan matematika dan hasil ujian statistika) untuk
mahasiswi lebih kuat dibandingkan dibandingkan dengan mahasiswa,
berikan alasan!
5) Seorang guru ingin mengetahui apakah ada kaitan antara pengukuran
sikap yang diperoleh siswa dengan jenis kelamin siswanya di
sekolahnya. Dia menghitung modus dari masing-masing sikap anak
berdasarkan jenis kelaminnya terhadap sebagian siswa di sekolahnya,
hasilnya adalah sebagai berikut.
Sikap
Jenis Kelamin Sangat Sangat
Baik Kurang
Baik Kurang
Laki-Laki 7 23 19 12
Perempuan 3 14 18 10
Catatan:
a. data rekayasa.
b. Frekuensi pengamatan menunjukkan banyaknya siswa yang
mempunyai modus tertentu berdasarkan jenis kelamin. Misalkan
pada O11 = 7, artinya ada 7 siswa laki-laki yang mempunyai modus
dengan sikap sangat baik.
1) Tetapkan hipotesis yang ingin diuji oleh guru tersebut!
2) Apakah ada kaitan antara jenis kelamin dengan sikap siswa di
sekolah tersebut?
MPDR5202/MODUL 8 8.29
Dari tabel di atas dapat dihitung bahwa 2 1,62 dan dengan demikian
2 1,62
besar asosiasinya adalah C 0,123 .
N 2
106 1,62
Besar korelasi di atas sangat kecil, dan berdasarkan nilai chi-square
hitungnya dengan dk = 3 diperoleh besar signifikansi penolakan
hipotesis nolnya adalah 0,345 yang jauh lebih besar dari 0,05. Dengan
demikian tidak ada kaitan antara jenis kelamin dengan jenis sikap yang
diberikan.
MPDR5202/MODUL 8 8.31
R A NG KU M AN
TES F OR M AT IF 1
III 14 12 10
IV 16 10 8
V 16 8 12
VI 8 10 6
Catatan : data rekayasa
Uji apakah ada kaitan antara orang tua siswa berdasarkan kelas
menentukan pendapat peraturan baru tersebut!
Kegiatan Belajar 2
Analisis Regresi
en
e2 ei
e1
Gambar 8.4
Diagram Pencar Data Stres dan Kesulitan Makan
a
Y X X X Y
i i
2
i i i
n X X 2 2
i i
n X Y X Y
b
i i i i
n X X 2 2
i i
a Y bX
X iYi
X Y i i
n
Dengan cara yang sama, Anda dapatkan juga bahwa
S XX X i X
2
X
2
X
2 i
i
n
Dan
SYY Yi Y
2
Y
2
Yi
2 i
n
Dan dari rumus
b
n X iYi X i Yi
X Y X Y
i i i i n
X X Y Y
i i
n X X i X X n X X
2 2 2 2 2
i i i i
Akibatnya
S XY
b
S XX
8.38 Statistika Pendidikan
Contoh 8.3
Misalkan Skor Stres (X) dan Skor Kesulitan Makan (Y) dengan data yang
diukur 10 orang siswa adalah sebagai berikut.
Tabel 8.10
Skor Stres (X) dan Skor Kesulitan Makan (Y)
S XY X iYi
X i Yi 2610 166 134 385, 6
n 10
Dan
X 166
2 2
S XX X 3248 492, 4
2 i
i
n 10
Dengan demikian diperoleh
S XY 385, 6
b 0, 783 dan a Y bX 13, 4 (0,783)(16,6) 0, 4005 .
S XX 492, 4
Jadi persamaan regresinya adalah Yˆ 0, 4005 0,783 X .
ZˆY rZ x
Di mana :
ZY : prediksi angka baku dari Y
r : koefisien korelasi antara X dan Y
Z X : angka baku dari X
Y
Y pada X
X
X
Gambar 8.5
Hubungan antara rata-rata X dan Y dengan Garis Regresi dengan r 0
Kedua, jika r = 0, maka diprediksi nilai angka baku dari Y akan selalu 0,
karena ZY 0 Zx 0 . Dengan demikian, jika korelasinya nol (r = 0), maka
nilai prediksi bagi Y adalah rata-rata dari Y berapa pun nilai dari X yang
digunakan untuk memprediksinya. Hal ini sebagaimana terlihat pada gambar
berikut.
Y
Y Y pada X
X
X
Gambar 8.6
Hubungan antara rata-rata X dan Y dengan Garis Regresi dengan r = 0
MPDR5202/MODUL 8 8.41
Contoh 8.4
Perhatikan kembali contoh data stress dan kesulitan makan di atas.
Korelasinya telah dihitung pada kegiatan belajar 1, yakni +0,675. Dari data
pada Tabel 8.9 dapat kita hitung rata-rata dan simpangan bakunya berturut-
turut
X 16,6 ; Y 13, 4 ; sX 7,397 dan sY 8,580
Dengan demikian persamaan regresinya adalah
S S 8,580 8,580
Yˆ r Y X r Y X Y 0,675 X 0,675 16,6 13, 4
SX SX 7,397 7,397
Contoh 8.5
Misalkan dari 19 mahasiswa yang mengikuti ujian Statistika Terapan
mempunyai rata-rata tinggi badan 165 cm dan simpangan bakunya 9,5 cm.
Sedangkan rata-rata berat badannya adalah 65 kg dengan simpangan baku 3,3
cm. Jika korelasi antara keduanya +0,83,
a. Tentukan persamaan garis regresi dari berat badan (Y) dalam tinggi
badan (X)!
b. Prediksilah berat badan mahasiswa yang tingginya 160cm!
8.42 Statistika Pendidikan
Jawab:
Karena diketahui
X 165 cm, S X 9,5 cm, Y 65 cm, SY 3,3 cm, dan r 0,83 , maka
3,3 3,3
Yˆ 0,83 X 0,83 165 65
9,5 9,5
0, 288 X 17, 42
Jadi berat badan orang yang tingginya 160 cm diperkirakan 63,55 kg.
Catatan: penggunaan regresi untuk prediksi ini hanya digunakan sebagai
interpolasi, bukan ekstrapolasi. Artinya nilai Y yang ditaksir haruslah
menggunakan nilai X yang berada pada rentang X terkecil dan X terbesar.
Y Yˆ
2
i i
SY2. X Se2
n 2
Aturan atau rumus di atas dapat juga ditulis sebagai
n 1 2
SY2. X Se2
n 2
SY b S X
2 2
Atau jika kita akan memanfaat nilai korelasi antar variabelnya, maka
SY . X SY 1 r 2
ˆ
SY SY . X
2 2
2
n X 0 X
Jika kita asumsikan bahwa keragaman amatan di sekitar garis regresi bersifat
normal, artinya galat ei semuanya berasal dari sebaran normal yang sama
N (0, s 2 ), dapat ditunjukkan bahwa selang kepercayaan bagi 1 adalah
SY . X
b t
atau b t
Sb
,( n 2)
X X ,( n 2)
2
2 2
i
Contoh 8.6
Kembali pada contoh tentang stres dan kesulitan makan, misalkan terdapat
hubungan yang linear antara stres dengan tingkat kesulitan makan, dimana
tingkat stres dapat menyebabkan kesulitan makan. Kita dapat telah
menghitung persamaan regresnya, yakni Yˆ 0, 400 0,783 X . Kedudukan
garis regresi terhadap titik-titik datanya dapat dilihat pada gambar berikut.
Gambar 8.7
Grafik Diagram Pencar dan Garis Regresi Linearnya
Dari gambar di atas terlihat bahwa hanya ada satu titik yang hampir dilalui
oleh garis regresi, yakni untuk X = 8. Dan jika kita memprediksi tingkat
(skor) kesulitan makan untuk skor stres X = 12 adalah sebagai berikut:
Artinya jika skor tingkat stres seseorang 12, maka diprediksi skor kesulitan
makannya adalah 9,80.
Dari persamaan regresi di atas kita juga dapat menghitung besar variasi
yang ditimbulkan oleh garis regresi. perhatikan tabel berikut.
MPDR5202/MODUL 8 8.45
Tabel 8.11
Bantuan dalam Perhitungan
Stres Kesulitan
Siswa (Yi Y )2 (Yˆi Y )2 (Yi Yˆi ) 2
(X) Makan (Y)
A 17 9 19.36 0.10 22.20
B 8 13 0.16 45.37 40.14
C 8 7 40.96 45.37 0.11
D 20 18 21.16 7.08 3.76
E 14 11 5.76 4.15 0.13
F 7 2 129.96 56.53 15.07
G 21 5 70.56 11.86 140.27
H 22 15 2.56 17.86 6.90
I 19 26 158.76 3.53 114.97
J 30 28 213.16 110.05 16.89
Jumlah 166 134 662.40 301.89 360.44
1 1 16, 62
X2
Dan Sa2 SY2. X 2
45, 06 29, 72
n X X 10 492, 4
i
Atau Sa 5, 45.
Dari hasil tersebut kita dapat menghitung taksiran bagi dan . Pertama
kita hitung taksiran interval bagi . Misalkan kita mengambil derajat
kepercayaan 95%. Dari tabel t-student diperoleh t ( n 2) t(0,025)(8) 2,31 ,
2
12,99). Selanjutnya kita hitung selang kepercayaan bagi . Dari data di atas
kita hitung t S 2,31 0,303 0,700 . Jadi selang kepercayaan
b
,( n 2)
2
Yi Yi (sifat reflektif)
Yi Y Yˆi Y Yi Yˆi (kedua ruas dikuadratkan dan dijumlahkan dari i 1, 2, 3, ,n)
Y Y Yˆ Y Y Yˆ
2 Yˆi Y Y Yˆ
2 2 2
i i i i i i
b2 X i X
2
b 2 S XX
bS XY
MPDR5202/MODUL 8 8.47
antara nilai ramalan ke-I dengan rata-rata pengamatan, dan Yi Yˆi adalah
simpangan antara pengamatan ke-I dengan nilai ramalannya
(residu/sisaan/galat ke-i). menurut Draper (1992) identitas (1) di atas dapat
ditulis dengan kata-kata sebagai berikut.
Y
Yi
ei Yˆi Yi
Yi Yˆ
Yˆ Y
Y Y
Y
Yi Yˆ
Yˆ a bX
X X
Xi
Gambar 8.8
Variasi Menurut Unsurnya
(Sembiring, 1995)
Setiap jumlah pada identitas (1) di atas mempunyai derajat bebas (degree
of freedom). Bilangan ini menunjukkan berapa banyak informasi yang bebas
di antaran pengamatan Y1, Y2, … , Yn yang dibutuhkan untuk mendapatkan
jumlah kuadrat itu. Misalnya JKTotal membutuhkan (n – 1) informasi yang
bebas, sebab di antara bilangan-bilangan Y1 Y , Y2 Y , , Yn Y , hanya (n –
1) di antaranya yang bebas karena jumlah semua n bilangan itu sama dengan
nol. JKReg dihitung dari suatu fungsi Y1, Y2, … , Yn yaitu b karena
Yˆ Y b2 X X , sehingga jumlah kuadrat ini memiliki satu
2 2
i i
derajat bebas. Melalui pengurangan antara derajat bebas dari JK Total dengan
derajat bebas JKReg, maka derajat bebas bagi JKRes (residu) adalah (n – 2).
MPDR5202/MODUL 8 8.49
Tabel 8.12
Anova Regresi Linear Sederhana
Yˆ Y
2
Karena Regresi 1 RKreg
i
n–2
Y Yˆ
2
Sekita Regresi JK res
i i RK res
(residu) n2
n–1
Y Y
2
Total (sekitar rata-
i
rata)
E RK Re g 2 2 X i X dan
2
E s2 2
H0 : = 0
H1 : 0
Bila F-hitung lebih besar dari F-tabel pada taraf nyata () yang dipilih,
maka hipotesis nol ditolak dan bila sebaliknya, maka hipotesis nol diterima.
Jika hipotesis nol ditolak, maka model regresi sangat baik dalam
mencerminkan pencaran datanya.
Untuk contoh pengujiannya, perhatikan kembali contoh persamaan
regresi dari Stress (X) dengan Kesulitan Makan (Y). Pada tabel sebelumnya
JK Yˆ Y 301,89
2
telah dihitung bahwa reg i dan
JK res Yi Yˆi
2
360, 44 . Dengan demikian dari keduanya diperoleh
JKTotak Yi Y 662, 40 . Dari data tersebut kita susun tabel ANOVA
2
sebagai berikut.
Tabel8.13
Analisis Varians untuk Regresi Yˆ 0, 400 0,783 X
Sumber dk JK RK F hitung
Regresi 1 301,89 301,89 6,70
Residu 8 360,44 45,06
Total 9 662,40
Karena hipotesis nol ditolak, maka dapat disimpulkan bahwa Stres (X)
mempengaruhi secara linear terhadap kesulitan makan (Y) seseorang. dan
jika kita hitung berapa besar pengaruh dari Stres (X) terhadap kesulitan
makan (Y), dapat dihitung dari besar koefisien determinasinya, yakni
2
Yˆi Y 301,89
R
2
0, 46
i
2
Y Y 662, 40
Dan nilai R2 = 0,46 merupakan akar kuadrat dari nilai korelasi yang sudah
dihitung di atas. R2 = 0,46 artinya 46% Kesulitan makan (Y) dipengaruhi
oleh Stress (X), dan sisanya oleh faktor lain.
Pasca pengujian keseluruhan model dengan ANOVA adalah uji masing-
masing koefisien atau pengujian individual. Dalam regresi linear sederhana,
karena koefisien yang diuji hanya satu, yakni , maka hasil pengujian ini
sama dengan pengujian keseluruhan model.
Hipotesis yang diuji dalam pengujian individual ini adalah
H0 : = 0 melawan
H1 : 0 atau H1 : > 0 atau H1 : < 0
Dengan asumsi-asumsi yang dipenuhi (akan dibahas pada bagian akhir modul
ini), maka pengujiannya menggunakan statistik
b 0
t
Sb
Dan jika 0 = 0, maka statistik ujinya adalah
b
t
Sb
Dengan dk untuk distribusi t adalah (n – 2). Kriteria pengujian seperti yang
telah kita ketahui ditentukan oleh Hipotesis Alternatifnya (H 1). Jika H1 :
0, misalnya, maka tolak H0 jika thitung t 1 , dk atau thitung t 1 , dk .
2 2
Contoh 8.7
Jika untuk regresi di atas, Yˆ 0, 400 0,783 X , kita uji apakah kesulitan
makan (Y) independen dengan Stress (X), maka hipotesis yang diuji adalah
H0 : = 0 melawan H1 : 0
Dari data di atas, kita ketahui bahwa b = 0,783 dan Sb = 0,303. Jadi
0, 783
t 2,584
0,303
8.52 Statistika Pendidikan
Gambar 8.9
Contoh Input Data Untuk Regresi Linear Sederhana
MPDR5202/MODUL 8 8.53
Gambar 8.10
Contoh Kotak Dialog dalam Perhitungan Regresi Linear
Tabel 8.14
Contoh Model Summary Hasil Perhitungan
Model Summary
Std. Error of the
Model R R Square Adjusted R Square
Estimate
1 .675a .456 .388 6.71226
a. Predictors: (Constant), Stress
8.54 Statistika Pendidikan
Nilai R dalam regresi linear sederhana akan sama dengan koefisien korelasi
anatar X dan Y, sedangkan R square merupakan koefisien determinasi yang
menunjukkan besar pengaruh dari variabel bebas (X) terhadap perubah
terikatnya (Y). Hasil perhitungan di atas menujukan R square sebesar 0,456.
Artinya 45,6% variabel Y dalam hal ini kesulitan makan dipengaruhi oleh X
(stress), sedangkan sisanya 54,4% dipengaruhi oleh faktor lain. R2 Adjusted
atau sering disebut dengan R2 yang disesuaikan. Nilai ini menurut Draper &
Smith (1992) dihitung dengan rumus sebagai berikut
n 1
Ra2 1 1 R 2
n p
Peran dari R2 yang disesuaikan ini akan terlihat dalam regresi ganda dalam
pencarian regresi terbaik.
Ouput berikutnya adalah tabel anova untuk menguji ketepatan garis
regresi sebagaimana yang terlihat pada tabel berikut.
Tabel 8.15
Contoh Tabel Anova bagi Regresi Linear
ANOVAb
Sum of
Model df Mean Square F Sig.
Squares
1 Regression 301.965 1 301.965 6.702 .032a
Residual 360.435 8 45.054
Total 662.400 9
a. Predictors: (Constant), Stress
b. Dependent Variabel: Kesulitan Makan
Hasil dari perhitungan pada tabel di atas sama seperti yang telah dihitung
oleh kita secara manual. Hanya ada tambahan, yakni kolom sig. Nilai dari
sig. merupakan nilai peluang penolakan hipotesis nol ketika hipotesis nol
bernilai benar. Jadi untuk memudahkan dalam pengambilan kesimpulan kita
cukup membandingkan nilai sig. yang diperoleh dengan taraf signifikansi
yang dipilih oleh kita. Jika kita memilih = 0,05, maka nilainya sig. = 0,032
lebih kecil daripada, maka kita simpulkan bahwa hipotesis nol ditolak.
Dengan demikian model regresi dapat dipakai untuk memprediksi
kesulitan makan.
Hasil output berikutnya adalah tabel koefisien regresi beserta
pengujiannya. Hasil perhitungannya adalah sebagai berikut.
MPDR5202/MODUL 8 8.55
Tabel 8.16
Contoh Hasil Perhitungan Koefisien Regresi Linear Sederhana
Coefficientsa
Unstandardized Standardized
Model Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) .400 5.452 .073 .943
Stress .783 .302 .675 2.589 .032
a. Dependent Variabel: Kesulitan Makan
Pada kolom pertama berisi informasi nama konstanta dan variabel bebas
dalam model regresi, yakni stress. Pada kolom kedua berisi koefisien dari
variabel bebas (stress) dan konstanta dengan standar error bagi konstanta
dan variabel bebas (Sa dan Sb). Hasil perhitungan ini sama dengan yang telah
dilakukan sehingga tafsirannya sama dengan di atas. Pada kolom keempat
berisi beta, yakni koefisien bagi variabel bebas ketika kita menghitung
regresi menggunakan angka baku. Nilai dari beta akan sama dengan korelasi
antara variabel bebas dan terikat sebagaimana yang telah dijelaskan di atas.
Dan dua kolom terakhir dari tabel di atas adalah pengujian terhadap koefisien
variabel bebas dan konstanta. Hasilnya sama dengan yang dihitung bahwa
kita menolak hipotesis nol pada pengujian koefisien , dan menerima
hipotesis nol pada pengujian konstantanya. Silakan Anda menafsirkan hasil
perhitungan-perhitungan yang telah diperoleh melalui software SPSS di atas!
Yˆ b0 b1 X1 b2 X 2 bk X k
Ŷ b0 b1 X1 b2 X 2
Dalam persamaan tersebut terdapat 3 buah koefisien, yakni b0, b1, dan b2.
Untuk itu diperlukan 3 persamaan dalam bentuk ketiga koefisien tersebut,
sehingga kita dapat menentukan nilai-nilai koefisiennya. Melalui pendekatan
kuadrat terkecil, koefisien-koefisien b0, b1, dan b2 dapat diperoleh dengan
menyelesaikan sistem persamaan linear berikut
nb0 b1 X 1i b2 X 2i Yi
b0 X 1i b1 X 12i b2 X 1i X 2i Yi X 1i
b0 X 2i b2 X 1i X 2i b2 X 22i Yi X 2i
Perlu dijelaskan kembali yang dicari oleh kita adalah b0 , b1 , dan b2.
Dalam matematika penyelesaian persamaan di atas dapat dilakukan
dengan berbagai cara, di antaranya eliminasi-substitusi (coba Anda ingat
kembali pelajaran matematikas SMP atau SMA tentang Sistem Persamaan
Linear tiga variabel) atau dapat juga dengan menggunakan matriks. Jika
disusun dalam matriks, maka sistem persamaan linear di atas dapat ditulis
sebagai
X Xb X Y
MPDR5202/MODUL 8 8.57
Dengan
Y1
Y 1 X 11 X 21
1 X b0
2 X 22
Y Y3 , X
12
, b b1 .
b2
Yn 1 X 1n X 2n
Dengan syarat X’X tak singular atau diskriminannya tidak sama dengan nol.
Untuk memudahkan perhitungan operasi matriks di atas, Anda dapat
memanfaatkan program Excel.
Untuk memudahkannya perhatikan contoh berikut.
Misalkan
2 2 3
A , B 4
1 4
Kita akan menghitung
- AB
- A-1
Bukalah program Excel, dan tuliskan matriks A dan B pada sel-sel dalam
Excel, misalkan sebagai berikut.
Gambar 8.11
Kotak Dialog untuk Perkalian Dua Buah Matriks
Kemudian masukan data pada Array1 untuk matriks A dan Array2 untuk
matriks B (hati-hati jangan tertukar).
MPDR5202/MODUL 8 8.59
Gambar 8.12
Kotak Dialog untuk Input Matriks yang Dioperasikan (perkalian)
Hasilnya adalah
2 2 3 10
AB
1 4 4 11
Sekarang cobalah Anda lakukan untuk menghitung A-1!
Penggunaan perhitungan melalui matriks ini dapat digunakan untuk
menghitung persamaan regresi secara umum, yakni menaksir persamaan
Yˆ b0 b1 X1 b2 X 2 bk X k
8.60 Statistika Pendidikan
Contoh 8.8
Misalkan diketahui bahwa hasil belajar siswa dipengaruhi oleh beberapa
variabel antara lain kompetensi dan motivasi belajar.
Misalkan
X1 : kompetensi awal,
X2 : motivasi belajar, dan
Y : hasil belajar.
Jika dari hasil pengambilan data terhadap 15 siswa di suatu sekolah diperoleh
data sebagai berikut:
Tabel 8.17
Data Kompetensi Awal, Motivasi dan Hasil Belajar
Res X1 X2 Y
1. 30 45 56
2. 40 64 47
3. 43 70 66
4. 45 62 68
5. 43 52 76
6. 23 56 70
7. 45 78 45
8. 56 76 56
9. 54 51 76
10. 54 45 78
11. 56 34 76
12. 60 45 56
13. 67 56 80
14. 75 74 87
15 78 89 89
Sumber : rekayasa
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
X 30 40 43 45 43 23 45 56 54 54 56 60 67 75 78
45 64 70 62 52 56 78 76 51 45 34 45 56 74 89
Dan
1026
X Y 54256
61331
8.62 Statistika Pendidikan
Tabel 8.18
Anova Regresi Ganda
Yˆ Y
2 JK reg
Karena Regresi k i
2
sreg
k
Y Yˆ
Sekitar Regresi 2 JK res
n – (k – 1)
2
sres
(residu) i i
n (k 1)
Y Y
Total (sekitar rata- 2
n–1 i
rata)
Gambar 8.13
Contoh Input Data Regresi Linear Jamak
8.64 Statistika Pendidikan
Gambar 8.14
Kota Dialog Perhitungan Regresi Linear Jamak
Tabel 8.19
Variabel yang Masuk dan Dikeluarkan dengan Metode Backward
Variabels Entered/Removedb
Variabels Variabels
Model Method
Entered Removed
1 Motivasi, . Enter
Kompetensi
Awal
2 . Motivasi Backward (criterion:
Probability of F-to-remove >
= .100).
a. All requested variabels entered.
b. Dependent Variabel: Hasil Belajar
Dari tabel di atas, variabel motivasi dan kompetensi awal masuk secara
bersama dalam perhitungan analisis regresi, tetapi pada langkah berikutnya
variabel motivasi dikeluarkan dari persamaan regresi. Hal ini disebabkan
variabel motivasi tidak berpengaruh secara individual terhadap hasil belajar.
Proses iteratif dalam perhitungan ini sampai diperoleh regresi terbaik adalah
2 tahap, yakni sampai dengan model 2. Untuk lebih jelasnya dapat dilihat
pada hasil perhitungan berikutnya.
Hasil perhitungan berikutnya adalah model summary. Seperti yang telah
dijelaskan di atas, bahwa model ini berisi R2 , R2 yang disesuaikan dan
kesalahan baku dari penaksiran.
Tabel 8.20
Model Summary untuk Regresi Linear Jamak
Model Summary
Adjusted R Std. Error of the
Model R R Square
Square Estimate
1 .599a .359 .252 11.89227
2 .564b .319 .266 11.77571
a. Predictors: (Constant), Motivasi, Kompetensi Awal
b. Predictors: (Constant), Kompetensi Awal
8.66 Statistika Pendidikan
Tabel 8.21
Anova untuk Pengujian Keberartian Model Regresi Jamak
ANOVAc
Sum of Mean
Model df F Sig.
Squares Square
1 Regression 948.488 2 474.244 3.353 .070a
Residual 1697.112 12 141.426
Total 2645.600 14
2 Regression 842.924 1 842.924 6.079 .028b
Residual 1802.676 13 138.667
Total 2645.600 14
a. Predictors: (Constant), Motivasi, Kompetensi Awal
b. Predictors: (Constant), Kompetensi Awal
c. Dependent Variabel: Hasil Belajar
Analisis varians pertama dilakukan pada model regresi yang memuat dua
variabel bebas, yakni kemampuan awal dan motivasi. Hasil analisis
menunjukkan bahwa hipotesis nol ditolak pada taraf signifikansi 0,070.
Untuk model kedua yang hanya memuat variabel bebas kemampuan awal,
analisis varians menunjukkan bahwa model yang sesuai dalam menaksir hasil
belajar dengan model regresinya adalah Yˆ 42,311 0,509 X1 seperti yang
terlihat pada tabel di bawah ini.
MPDR5202/MODUL 8 8.67
Tabel 8.22
Hasil Perhitungan dan Pengujian Koefisien Regresi Secara Individual
Coefficientsa
Unstandardized Standardized
Model Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) 50.537 14.639 3.452 .005
Kompetensi .570 .220 .632 2.589 .024
Awal
Motivasi -.190 .220 -.211 -.864 .405
2 (Constant) 42.311 11.010 3.843 .002
Kompetensi .509 .206 .564 2.466 .028
Awal
a. Dependent Variabel: Hasil Belajar
C. PENGUJIAN ASUMSI
2. Error menyebar normal dengan rata-rata nol dan suatu ragam (variance)
tertentu.
Penulisan matematis dari asumsi kedua ini adalah
i N 0, 2
Gambar 8.15
Asumsi Sebaran Pengamatan dari Distribusi Normal dan Varians yang Sama
bahwa ujung-ujung dari titik-titik data tersebut agak menjauh dari garis
lurus. Hal ini adalah hal yang wajar dan tidak perlu dianggap serius.
Fokus perhatian kita sebenarnya adalah pada daerah tengah dari
kumpulan titik data tersebut. Bila dapat didekati atau digambarkan
dengan garis lurus, maka data tersebut dapat dikatakan menyebar
normal.
Keterangan:
DW = nilai statistik uji Durbin-Watson hasil perhitungan
dL = batas bawah tabel Durbin-Watson bounds pada suatu n dan k
tertentu
du = batas atas tabel Durbin-Watson bounds pada suatu n dan k
tertentu
n = banyaknya pengamatan
k = banyaknya variabel bebas dalam model regresi
Invers dari matriks R, misalkan sebagai berikut (kembali baca materi di atas
dalam mencari invers matriks)
C11 C12 C1k
C C22 C2 k
R 1 C 21
Ck1 Ck 2 Ckk
1 r12 r1 y
R 1 r2 y
1
Matriks inversnya adalah (Anda pelajari cara mencari invers matriks dengan
kofaktor)
1 rY22 r12 r1Y rY 2 r1Y r12 r2Y
1
R C r21 rY 1r2Y 1 rY21 r2Y r21r1Y
rY 1 r21rY 2 rY 2 r12 rY 1 1 r122
Jadi jika kita hitung:
C12 r12 r1Y rY 2 r12 r1Y rY 2
r12.Y
C11C22
1 rY 2 1 rY 1
2 2
1 rY22 1 rY21
Dengan cara yang sama, kita dapat menghitung
CY 1 rY 1 r21rY 2
rY 1.2
CYY C11 1 r122 1 rY22
Dan
CY 2 rY 2 r12 rY 1
rY 2.1
CYY C11 1 r 1 r
2
12
2
Y2
Akhir dari pembahasan kedua korelasi ini (parsial dan ganda), Sudjana
(1989) mengemukakan hubungan antara korelasi parsial dan korelasi ganda.
Jika misalkan diketahui variabel X1, X2 dan Y, didapat hubungan bahwa
1 R 1 r 1 r
2
Y .12
2
Y1
2
Y 2.1
1 R 1 r 1 r 1 r
2
Y .123
2
Y1
2
Y 2.1
2
Y 3.12
LAT IH A N
Mahasiswa X Y Mahasiswa X Y
22 12 39 52 14 28
23 9 36 53 21 42
24 10 33 54 21 53
25 19 36 55 20 23
26 34 42 56 35 44
27 23 34 57 27 53
28 34 56 58 39 48
29 19 38 59 21 52
30 18 44 60 24 40
R A NG K U M AN
TES F OR M AT IF 2
Tentukanlah :
a. Rata-rata, jumlah kuadrat dan jumlah hasil kali silang
x 2 , y 2 , xy simpangan baku, dan korelasi antara X dan Y!
b. Persamaan regresi dari Y dalam X
MPDR5202/MODUL 8 8.81
X1 X2 Y X1 X2 Y
2 5 2 4 3 3
2 4 1 3 6 3
1 5 1 6 9 6
1 3 1 6 8 6
3 6 5 8 9 10
4 4 4 9 6 9
5 6 7 10 4 6
5 4 6 9 5 6
7 3 7 4 8 9
6 3 8 4 9 10
Hitunglah
a. Jumlah, rata-rata, simpangan baku, jumlah kuadrat dan jumlah hasil
kali silang, dan korelasi antar dua variabelnya!
b. Regresi Y dalam X1 dan X2!
c. SSreg, SSres, R2y.12, F, dan S2Y.12!
d. Harga t untuk masing-masing koefisien!
e. Y Yˆ dan Y Yˆ
2
Test Formatif 1
1) Diketahui sebuah sampel acak berukuran n = 24 menghasilkan r = –0,37.
Untuk menentukan interval kepercayaan bagi , kita hitung terlebih
dahulu !
1 1 1
Z 0, 218
n3 24 3 4,582
1 r 1 0,37 0, 63
Z 0,5ln 0,5ln 0,5ln 0,388
1 r 1 0,37 1,37
Selang kepercayaan bagi Z’ adalah CI Z Z Z 1 Z . (CI:
2
2
7,19
15,36 10,18 5,97
Dan dari hasil tersebut kita dapat menghitung nilai C sebagai berikut
2 7,19
C 0,196
n
2
7,19 179
Jadi besar asosiasi antara kelas dengan respons yang diberikan adalah
0,196. Selanjutnya kita uji keberartiannya.
Dari tabel chi-square dengan dk 6 1 3 1 10 dan = 0,05
diperoleh (0,05)(10)
2
18,31 . Karena nilai 2 hitung = 0,196 lebih kecil
dari 2 tabel, maka kita menerima hipotesis nol. Artinya tidak ada kaitan
subjek dalam kelas (orang tua siswa) dengan respons yang diberikannya.
Test Formatif 2
1) a. Nilai korelasinya 0, karena untuk setiap nilai X harga taksirannya
konstan.
b. Rata-rata Y sama dengan nilai taksiran dari Y, jadi Y Yˆ 317 .
c. Dapat, dengan menggunakan persamaan regresi dari angka baku.
Yˆ Y X X X X
r 0 0
SY SX SX
2) a. Persamaan regresi Yˆ 2 X 5 diperoleh dari angka kasar, karena
koefisien dari X adalah 2 yang lebih besar dari 1. Jika diperoleh dari
angka baku, koefisien dari X merupakan korelasi antara X dan Y.
Selain itu, persamaan regresinya memuat konstanta. Regresi dalam
angka baku tidak memuat konstanta
MPDR5202/MODUL 8 8.87
Daftar Pustaka
Leech, N.L., Barret, K.C. & Morgan, G.A. 2005. SPSS for Intermediate
Statistics (Use and Interpretation). London: Lawrence Erlbaum
Associate Publishers.
Steel, R.G.D. & Torrie, J. H. 1995. Prinsip Dan Prosedur Statistika. Suatu
Pendekatan Biometrik. Alih Bahasa: Bambang Sumantri. Jakarta:
Gramedia Pustaka Utama.
PEN D AH U LU A N
A. DESKRIPSI SINGKAT
B. RELEVANSI
Kegiatan Belajar 1
Y1 , Y2 , , Yp.
Gambar 9.1
Jenis Model Diagram Jalur
Gambar 9.2
Contoh Diagram Jalur yang Menyatakan Hubungan Kausal
dari X1, X2, X3 ke X4
1 2
X1
51
e1 e2
r12 41
r13 X2 X4 54
42 X5
r32 43
53
X3
Gambar 9.3
Hubungan kausal dari X1, X2,X3 ke X4 dan
dari X1, X3 dan X4ke X5
X1 1
e1
r12 41
r13 X2 42 X4
r32 43
X3
Gambar 9.4
Substruktur 1
Substruktur 2:
X1
2
51 e2
41
r13 54
X4 X5
43
53
X3
Gambar 9.5
Substruktur 2
Gambar 9.6
Hubungan kausal dari X1, X2 ke X3
rXY
xy ,
x2 y2
Dengan:
X Y
xy XY n
X
2
x X 2
n
Y
2
y Y 2
n
atau dapat juga menggunakan perhitungan melalui angka kasar yakni
n XY X Y
rXY
n X 2 X
2
n Y 2 Y
2
R 1 r3k
1
9.10 Statistika Pendidikan
ru1
r k
Rx2u ( x1 pu1 pu 2 puk u 2 pui rui , dengan pui pxu xi dan
k )
i 1
ruk
rui rxu xi
Gambar 9.7
Contoh Diagram Dekomposisi Kausalitas dalam Analisis Jalur
Pengaruh
Pengaruh IE Total
Variabel DE Melalui
Melalui (x3) Melalui (x4) DE + IE
(x3 dan X4)
X1 thd X3 (a) - - - (a)
X1 thd X4 (c) (a)(f) - - (c)+ (a)(f)
(h)+(a)(g)+(c)(j)+
X1 thd Y (h) (a)(g) (c)(j) (a)(e)(j) (a)(e)(j)
X2 thd X3 (b) - - - (b)
X2 thd X4 (d) (b)(e) - - (d)+(b)(e)
(i)+(b)(g)+(d)(j)+
X2 thd Y (i) (b)(g) (d)(j) (b)(e)(j) (b)(e)(j)
X3 thd X4 (e) - - - (e)
X3 thd Y (g) - (e)(j) - (g)+(e)(j)
X4 thd Y (j) - - - (j)
Dan silakan Anda coba estimasi nilai dari r23 , r24 , r2 y dan r34 dari
diagram struktural di atas. Perlu diketahui bahwa korelasi yang diperoleh
melalui perhitungan di atas disebut dengan expected correlation atau
reproduced correlation.
Contoh 9.1 (masalah Studi Jencks dengan n = 628 yang diambil dari Buku
Kusnendi, 2005)
Misalkan hubungan antara variabel-variabel diketahui sebagai berikut:
X1 (pendidikan orang tua), X 2 (pendapatan orang tua), X0 (kecerdasan anak
sebelum sekolah), D (pendidikan anak), Q (kecerdasan anak setelah dewasa).
9.18 Statistika Pendidikan
Jawab.
1. Langkah pertama adalah menyusun diagram atau model struktural untuk
menjawab pertanyaan di atas. Sesuai dengan pertanyaan di atas, kita
susun diagram struktur sebagai berikut
X1 H1 X0
H2 H6
H5 Q
H3
H7
X2 H4 D
akibat. Full path diagram Studi Jencks dapat diidentifikasi 3 model atau
3 sub struktur yang akan diestimasi koefisien jalurnya.
Substruktur 1
Model X0:
X1 01 X0 X0 = 01X1 + 02X2 + e1
Variabel eksogen X1 dan X2
r12
02 dan endogennya X0
e1
X2
Substruktur 2
Model D:
X1 X0
D = D1X1 + D2X2 + D0X0 + e2
Variabel eksogen :
r12 D0 X1, X2 dan X0, dan
D1 variabel endogen D
X2 D2 D e2
Substruktur 3
X0
Model Q:
Q0 Q = Q0X0 + QDD + e3
Variabel penyebab:
Q e3
X0 dan D, dan
QD variabel endogen Q
D
1, 000 X1
0,509 1, 000 X
2
R 0,300 0,300 1, 000 X0
0,382 0, 420 0,550 1, 000 D
0,305 0,314 0,830 0, 630 1, 000 Q
Sub struktur 2
1, 000 0,509 0,300 X 1
R2 0,509 1, 000 0,300 X 2
0,300 0,300 1, 000 X 0
Substruktur 3
1, 000 0,550 X 0
R3
0,550 1, 000 D
C C12 r01
11
C21 C22 r02
01 1,3497 0, 6870 0,300
ij ( Ri1 )(rY X )
i
02 0, 6870
j
1,3497 0,300
(1,3497)(0,300) (0,6870)(0,300) 0,1988
(0,6870)(0,300) (1,3497)(0,300) 0,1988
Dengan demikian diperoleh p01 0,300 dan p02 0,300 . Dari hasil di
atas, kita dapat menghitung koefisien determinasinya sebagai berikut.
Ri2 ( ij )(rYiXj ) R12 01 r01 02 r02
R12 0,1988 0,300 0,1988 0,300 0,1193
Dan akhirnya kita dapat menghitung koefisien dari p0e1 sebagai berikut
e 1 Ri2 e1 1 0,1193 0,9385
i
(n k 1) R0.12
2
(628 2 1)0,1193
F 42,331
k (1 R0.12 )
2
2(1 0,1193)
Pengujian:
01 0,1988
t1 Cr1 4,5586
(1 R )C11
1
2
(1 0,1193)1,3497
n k 1 628 2 1
Dan
02 0,1988
t2 cr2 4,5586
(1 R )C22
1
2
(1 0,1193)1,3497
n k 1 628 2 1
Dengan = 0,05 dan dk = 625, diperoleh t0,05(625) = 1,647 yang jauh lebih
kecil dari t1 dan t2 di atas. Dengan demikian, kedua koefisien jalur
tersebut sangat berarti. Untuk itu, tidak perlu dilakukan trimming.
Artinya semua jalur-jalur tersebut tetap ada.
Hasil di atas diperoleh diagram jalurnya adalah sebagai berikut
X1 X0
0,509
e1
X2
Untuk itu kita dapat melanjutkan pada perhitungan koefisien jalur untuk
substruktur pertama.
Koefisien jalur yang akan dihitung adalah D1, D2 dan D0
MPDR5202/MODUL 9 9.23
e 2 1 0,3878 0,7824
Dengan cara yang sama kita lakukan pengujian baik secara Uji overall
maupun secara individual
Hipotesis yang diuji untuk overall adalah
H0 : D1 = D2 = D0 = 0 : X1, X2 dan X0 tidak mempengaruhi D.
H1 : Sekurang-kurangnya satu di antara X1, X2 dan X0 mempengaruhi D.
(n k 1) RD2 .120 (628 3 1)0,3878
F 131, 758
k (1 RD2 .120 ) 3(1 0,3878)
Dengan dk = (3, 624) dan memilih = 0,05 maka F0,05 (3, 624) = 2,619 yang
jauh lebih kecil daripada F hitung. Artinya, di antara variabel X1, X2 dan X0
ada yang mempengaruhi D. Variabel apa yang mempengaruhi D? Dijelaskan
hasil uji individual kebermaknaan masing-masing koefisien jalur D1 ,D2,
dan D0.
Hipotesis yang diuji secara individual adalah:
H0 : Di = 0: Secara individual X1 (X2 dan X0) tidak berpengaruh terhadap D.
H1 : Di> 0: Secara individual X1 (X2 dan X0) berpengaruh positif terhadap D.
9.24 Statistika Pendidikan
D1 0,1389
t3 cr3 3,7551
(1 R )C11
2
2
(1 0,3878)1,3946
n k 1 628 3 1
D2 0, 2163
t4 cr4 5,8475
(1 R )C22
2
2
(1 0,3878)1,3946
n k 1 628 3 1
D0 0, 4434
t5 cr5 13,2834
(1 R )C33
2
2
(1 0,3878)1,1354
n k 1 628 3 1
Dengan cara yang sama kita lihat pada tabel bahwa t0,05(624) = 1,647 yang
lebih kecil dari semua nilai t (t3, t4, dan t5) di atas. Dengan demikian semua
H0ditolak. Artinya, dengan tingkat kepercayaan 5% model D yang diusulkan
seutuhnya dapat diterima, dengan modelnya sebagai berikut.
X1 X0
e2
X2 D
Hasilnya adalah
Q 0 1, 4337 0,830 0, 7885 0, 630 0, 6932
QD 0, 7885 0,830 1, 4337 0, 630 0, 2488
MPDR5202/MODUL 9 9.25
Dengan dk = (2, 625) dan memilih taraf nyata 0,05 diperoleh F 0,05(2,625) = 3,01
yang jauh lebih kecil dari F hitung. Dengan demikian kita tolak Ho yang
artinya ada minimal satu di antara X0 dan D mempengaruhi D.
Langkah berikutnya adalah pengujian secara parsial (individual) bagi
kedua variabel eksogen.
Hipotesis yang diuji :
H0 :Q0 (QD) = 0: Secara individual X0 dan D tidak berpengaruh terhadap Q.
H1 : Q0 (QD)> 0: Secara individual X0 dan D berpengaruh positif terhadap Q.
Q 0 0, 6932
t6 cr6 27,9629
(1 R3 )C11
2
(1 0, 7321)1, 4337
n k 1 628 3 1
QD 0, 2488
t7 cr7 10, 0363
(1 R )C22
2
3
(1 0, 7321)1, 4337
n k 1 628 3 1
e3
X0
X1 0,1988 X0 0,7824 e2 e3
0,5176
0,1988 0,6932
0,509 Q
0,4434
0,1389
0,2488
X2 0,2163 D 0,9385 e1
Sebelum dilakukan penafsiran hasil, kita uji dulu apakah model fit atau
tidak.
MPDR5202/MODUL 9 9.27
Model pada diagram di atas merupakan model yang telah diuji baik
secara overall maupun secara individual, dengan koefisien determinasi pada
masing-masing substrukturnya adalah 0,1193; 0,3878; dan 0,7321. Dengan
nilai-nilai ini, maka kita dapat menghitung.
0,8556
1 0,8556
Q 1
1 0,8556
LAT IH A N
Mental
Ability
(1)
Years of F Scale
Education (3)
(2)
Misalkan korelasi antar variabel di atas adalah sebagai berikut: r12 = 0,6;
r13 = -0,5 dan r23 = -0,6.
a. Hitunglah koefisien dari diagram jalur di atas!
9.30 Statistika Pendidikan
X1
X3
X2
X1
P21
E1 P2e1 X2
Substruktur 2.
E2
P3e2
X1
P31
X3
P32
X2
1,06667 0,26667
Karena R 1,00 0,25 , maka C R 1
0,25 1,00 0,26667 1,06667
R A NG KU M AN
TES F OR M AT IF 1
1) Misalkan korelasi antar empat variabel (IQ, SES, n Ach, dan GPA)
dengan SES: Sosioeconomic status, IQ : Intelgence, n Ach : need
achievement, dan GPA : Grade-point Average dihipotesiskan bahwa :
Hipotesis yang diajukan adalah sebagai berikut!
a. Sosio ekonomi berpengaruh terhadap need achievement dan juga
GPA.
b. IQ berpengaruh terhadap terhadap need achievement dan GPA.
c. Need achievement berpengaruh terhadap GPA.
d. Sosio ekonomi berkorelasi dengan IQ.
Dari hasil pengumpulan data melalui sampel berukuran 100
diperoleh matriks korelasi sebagai berikut.
1 2 3 Y
SES IQ n Ach GPA
1 1,00 0,30 0,41 0,33
2 1,00 0,16 0,57
3 1,00 0,50
Y 1,00
e. Hipotesis di atas, susunlah model strukturalnya!
9.34 Statistika Pendidikan
f.
Dengan menggunakan data yang diketahui hitunglah besar pengaruh
langsung, tidak langsung, dan pengaruh total dari:
SES terhadap n ach
SES terhadap GPA
IQ terhadap n Ach
IQ terhadap GPA
n ach terhadap GPA
2) Misalkan tabel berikut menyatakan tentang korelasi antara variabel-
variabel dan diagram juga strukturnya (n = 300)
1 2 3 4 5 6
Race IQ School Self Level of Verbal
Quality Concept Aspiration Achievment
1 1,00 0,30 0,25 0,30 0,30 0,25
2 1,00 0,20 0,20 0,30 0,60
3 1,00 0,20 0,30 0,30
4 1,00 0,40 0,30
5 1,00 0,40
6 1,00
MPDR5202/MODUL 9 9.35
Race
(1)
Self
Conc
ept
(4)
Verbal
IQ Achieve
(2) ment
(6)
Level
of
Aspirat
ion
(5)
Scho
ol
Qual
ity
(3)
X1
X3 X4
X2
MPDR5202/MODUL 9 9.37
X1
X3 Y
X2
No res X1 X2 X3 Y
13 58 19 84 19
14 58 18 84 12
15 58 18 82 16
16 56 19 79 15
17 50 19 76 14
18 50 20 72 14
19 50 20 79 13
20 50 20 71 12
Kegiatan Belajar 2
T eori dan model dalam ilmu sosial dan perilaku umumnya diformulasikan
dengan menggunakan konsep teoritis atau istilah lainnya konstruk
(construct) yang tidak dapat diamati atau diobservasi secara langsung.
Meskipun demikian para peneliti dapat menggunakan indikator atau gejala
yang dapat diukur untuk digunakan dalam mempelajari konsep-konsep
teoritisnya (Wijayanto, 2008). Namun demikian, ada dua dampak
permasalahan yang ditimbulkan dalam memperoleh kesimpulan ilmiahnya.
Menurut Joreskog dan Sorborn (Wijayanto, 2008), kedua permasalahan
tersebut adalah Masalah Pengukuran dan Masalah Hubungan Kausal antar
Variabel.
1. Masalah Pengukuran berkaitan dengan “apa sebenarnya yang diukur
oleh suatu pengukuran? Dengan cara apa dan seberapa baik seseorang
dapat mengukur sesuatu yang perlu diukur? Dan bagaimana validitas dan
reliabilitas dari sebuah pengukuran?
2. Masalah hubungan kausal antar variabel berkaitan dengan pertanyaan-
pertanyaan:Bagaimana cara menyimpulkan kausal antar variabel-
variabel yang kompleks dan tidak teramati secara langsung, melainkan
melalui indikator-indikator? Bagaimana cara menilai kekuatan hubungan
antara variabel-variabel tersebut dengan indikator-indikatornya?
Untuk itulah Anda harus berupaya untuk memiliki kedua software tersebut,
sehingga dapat memudahkan dalam mempelajari bagian modul ini.
masing diukur dengan menggunakan banyak indikator, dan satu atau dua
variabel tergantung laten yang juga masing-masing diukur dengan beberapa
indikator. Dengan demikian menurut definisi ini SEM dapat digunakan
sebagai alternatif lain yang lebih kuat dibandingkan dengan menggunakan
regresi berganda, analisis jalur, analisis faktor, analisis time series, dan
analisis kovarian
Yamin (2009) mengemukakan bahwa di dalam SEM peneliti dapat
melakukan tiga kegiatan sekaligus, yaitu pemeriksaan validitas dan
reliabilitas instrumen (setara dengan analisis faktor konfirmatori), pengujian
model hubungan antar variabel laten (setara dengan analisis jalur), dan
mendapatkan model yang bermanfaat untuk prediksi (setara dengan model
struktural atau analisis regresi). Dua alasan yang mendasari digunakannya
SEM adalah (1) SEM mempunyai kemampuan untuk mengestimasi
hubungan antar variabel yang bersifat multiple relationship. Hubungan ini
dibentuk dalam model struktural (hubungan antara konstruk dependen dan
independen). (2) SEM mempunyai kemampuan untuk menggambarkan pola
hubungan antara konstruk laten dan variabel manifes atau variabel indikator.
Untuk memahami SEM, kita mulai dengan pemahaman terhadap
komponen-komponen dalam SEM.
1. Ada 2 jenis variabel, yakni variabel laten (latent variable) dan variabel
teramati (observed atau manifest atau measured variable)
2. Ada dua jenis model, yakni model struktural (structural model) dan
model pengukuran (measurement model)
3. Ada 2 jenis kesalahan, yakni kesalahan struktural (structural error) dan
kesalahan pengukuran (measurement error).
1. Variabel Laten
Dalam SEM variabel kunci yang menjadi perhatian adalah variabel laten
(VL). Dalam beberapa buku sering juga diistilahkan dengan variabel
konstruk. Variabel laten merupakan konsep abstrak yang menandai suatu
kategori tertentu. Misalnya perilaku orang, sikap, motivasi berprestasi,
prestasi belajar, kecemasan belajar, kemandirian belajar. Variabel laten hanya
MPDR5202/MODUL 9 9.43
dapat diamati secara tidak langsung dan tidak sempurna melalui efeknya pada
variabel teramati.
Dalam SEM dikenal dua jenis variabel laten, yakni variabel eksogen dan
variabel endogen. Variabel eksogen mempunyai sifat yang mirip dengan
variabel bebas, yakni variabel penyebab atau variabel yang mempengaruhi.
Adapun variabel endogen adalah variabel akibat, variabel terikat yang
termuat pada paling sedikit satu persamaan dalam model. Dalam SEM
variabel eksogen dilambangkan dengan””, dibaca ”ksi”, dan variabel
endogen dilambangkan dengan ”” dibaca ”eta”.
Dalam gambar diagram jalur atau lintasan, variabel laten disimbolkan
lingkaran (atau dapat juga ellips) dan hubungan kausalnya dinyatakan dengan
anak panah. Simbol untuk variabel eksogen ditandai dengan lingkaran yang
memuat semua anak panahnya menuju keluar. Adapun variabel endogen
ditandai dengan lingkaran yang anak panahnya paling sedikit ada yang
menuju atau masuk ke lingkarannya, walaupun terdapat anak panah lain
menuju keluar lingkaran. Untuk lebih jelasnya perhatikan gambar di bawah.
Gambar 9.8
Simbol untuk Variabel Eksogen dan Endogen dalam SEM
2. Variabel Teramati
Variabel teramati atau observed variable biasanya disimbolkan dengan
MV adalah variabel yang dapat diukur secara empiris. Variabel teramati
merupakan efek atau ukuran dari variabel laten. Secara mudahnya, variabel
ini dinamakan dengan indikator. Sebagai contoh, untuk mengukur Kualitas
orang tua digunakan indikator pendidikan, pekerjaan, dan penghasilan. Untuk
mengukur kualitas sekolah digunakan indikator layanan administrasi, layanan
guru, iklim atau lingkungan belajar, partisipasi siswa, hasil ujian nasional,
dan mungkin masih banyak lagi indikator yang digunakan. Dari contoh
tersebut, variabel kualitas orang tua merupakan variabel laten, sedangkan
9.44 Statistika Pendidikan
X Y
Gambar 9.9
Simbol Variabel Teramati
GAMMA 11 BETA 21
(11) (21)
KSI 1 ETA 1 ETA 2
(1) (1) (2)
21
BETA 31
2 GAMMA 12
21 (31)
(12)
KSI 2 ETA 3
(2) (3)
GAMMA 32
(32)
Gambar 9.10
Contoh Model Struktural
Gambar 9.11
Contoh Model Pengukuran
ZETA 1 ZETA 2
(1) (2)
GAMMA 11 BETA 21
(11) (21)
KSI 1 ETA 1 ETA 2
(1) (1) (2)
21 BETA 31
2
21
GAMMA 12
(12)
(31)
KSI 2 ETA 3
(2) (3)
GAMMA 32
(32)
ZETA 3
Gambar 9.12 (3)
Diagram Lintasan Kesalahan dalam Model Struktural
9.48 Statistika Pendidikan
DELTA 1
(1) X1
LAMBDA X11 (X11)
ETA 1 1
(1) Y1 0
Gambar 9.13
Diagram Lintasan Kesalahan dalam Model Pengukuran
X1 X2 X3 Y1 Y2 Y3 Y4 Y5 Y6 Y7
(11) (21)
KSI 1 ETA ETA
(1) 1 (1) 2 (2)
ZETA
2
(2)
21
2
21 ZETA
1
(31)
(12) (1)
KSI 2 ETA
(2) 3 (3)
(32)
ZET
A3
(3)
X4 X5 Y8 Y9 Y10
4 5
8 9 10
Gambar 9.14
Contoh Model Hybrid (Diambil dari Wijayanto, 2008)
MPDR5202/MODUL 9 9.51
Dari hasil di atas, maka notasi matematika dari model full hybrid ini
dapat ditulis sebagai berikut.
Struktural model
atau secara umum dapat ditulis sebagai
m1 m m m1 m n n1 m1
Perlu juga diketahui bahwa dalam diagram di atas, ada simbol variabel,
koefisien (bilangan Riil), dan matriks. Adapun rinciannya adalah sebagai
berikut.
Variabel:
dibaca eta adalah variabel laten endogen
dibaca ksi adalah variabel laten eksogen
dibaca zeta adalah kesalahan laten dalam persamaan
X adalah indikator yang diamati dari
Y adalah indikator yang teramati dari
dibaca epsilon adalah kesalahan pengukuran dari Y
dibaca delta adalah kesalahan pengukuran dari X
9.54 Statistika Pendidikan
Matriks koefisien:
B (beta) berordo m × m adalah matriks koefisien untuk variabel laten
endogen
(gamma) berordo m × n adalah matriks koefisien untuk variabel laten
eksogen.
X (lambda X) berordo q × n adalah matriks koefisien yang mengaitkan
Y ke .
Y(lambda Y) berordo p × m adalah matriks koefisien yang mengaitkan
X dengan .
Matriks kovarians:
(phi) berorodo n × n adalah matriks kovarians dari .
(psi) berordo m × m adalah matriks kovarians dari .
(theta – epsilon) berordo p × p adalah matriks kovarians dari .
(theta – delta) berordo q × q adalah matriks kovarians dari .
B. PATH MODEL
Bentuk umum dari SEM yang telah dipelajari di atas memuat variabel
latent dan variabel teramati. Dalam penelitian banyak ditemukan model yang
semuanya variabel teramati dan tidak memuat variabel laten. Model semacam
ini dinamakan dengan path model, seperti yang terlihat pada diagram berikut.
1
11 4
X1 Y1 2
21
23
33
X3 Y3
3
Gambar 9.15
Contoh Path Model
MPDR5202/MODUL 9 9.55
Y1 11 X 1 1
Y2 21Y1 23Y2 22 X 2 2
Y3 31Y1 33 X 3 3
Y4 42Y2 4
Y1 0 0 0 0 Y1 11 0 0 1
Y 23 0 0 Y2 0 22 X 1
2 21
0 X 2
Y3 31 0 0 0 Y3 0 0 33 2 3
X3
Y4 0 0 0 43 Y4 0 0 0 4
X1 1
X2 2
X3 3
X4 4
KK
X5 5
X6 6
X7 7
X8 8
Gambar 9.16
Contoh Diagram CFA
D. PROSEDUR SEM
Gambar 9.17
Pencocokan Model terhadap Data
MPDR5202/MODUL 9 9.59
b. Identifikasi
Tahap ini berkaitan dengan pengkajian tentang kemungkinan
diperolehnya nilai yang unik untuk setiap parameter yang ada di dalam model
dan kemungkinan persamaan simultan tidak ada solusinya.
c. Estimasi
Tahap ini berkaitan dengan estimasi terhadap model untuk menghasilkan
nilai-nilai parameter dengan menggunakan salah satu metode estimasi yang
tersedia. Pemilihan metode estimasi yang digunakan ditentukan berdasarkan
karakteristik dari variabel-variabel yang dianalisis.
d. Uji kecocokan
Tahap ini berkaitan dengan pengujian kecocokan antara model dengan
data. Beberapa kriteria ukuran kecocokan atau diistilahkan dengan
goodnessof fit (GOF) dapat digunakan untuk melaksanakan langkah ini.
MPDR5202/MODUL 9 9.61
e. Respesifikasi
Tahap ini berkaitan dengan respesifikasi model berdasarkan atas hasil uji
kecocokan tahap sebelumnya.
2. Spesifikasi Model
Prosedur dalam SEM dimulai dari mengembangkan spesifikasi model
penelitian yang akan diuji atau disestimasi. Spesifikasi model mencerminkan
permasalahan yang diteliti dan informasinya diperoleh dari kajian baik secara
teori maupun hasil penelitian-penelitian sebelumnya. Hubungan-hubungan
tersebut akan diperoleh dengan berbagai tahapan, yakni:
a. Spesifikasi model pengukuran
1) Definisikan seluruh variabel-variabel yang ada dalam penelitian.
2) Definisikan variabel-variabel yang teramati.
3) Definisikan hubungan-hubungan antara setiap variabel laten dan
variabel teramati yang terkait.
3. Identifikasi
Tahap identifikasi digunakan untuk pengkajian solusi persamaan
simultan yang diperoleh dari model hybrid. Identifikasi ini berkaitan dengan
jumlah data dan jumlah parameter dalam persamaan simultan. Mungkin Anda
pernah belajar persamaan simultan atau sistem persamaan linier. Solusi
persamaan simultan salah satunya ditentukan oleh jumlah persamaan dan
jumlah variabel dalam persamaan simultannya. Terkait jumlah persamaan
dan jumlah variabel, ada tiga kemungkinan, yakni pertama jumlah variabel
lebih banyak dari jumlah persamaan, kedua jumlah variabel sama dengan
jumlah persamaan, dan yang ketiga jumlah variabel lebih sedikit daripada
jumlah persamaan. Nah, demikian juga dalam SEM, persamaan simultan dari
model hybrid memunculkan tiga kemungkinan, tiga kemungkinan tersebut
dikatagori dala tiga jenis, yakni under identified, just identified, dan over
identified. Under identified adalah model degan jumlah parameter yang
9.62 Statistika Pendidikan
diestimasi lebih besar dari jumlah data yang diketahui (data varian dan
kovarian dari variabel teramati). Just identified adalah model dengan jumlah
parameter yang diestimasi sama dengan data yang diketahui, serta over
identified adalah model dengan jumlah parameter yang diestimasi lebih kecil
dari jumlah data yang diketahui.
Selain informasi perbandingan jumlah variabel dan jumlah data, dalam
identifikasi ini juga kita akan memperoleh informasi dalam menentukan
derajat bebas (degree of freedom). Tentu Anda sudah mengetahui
sebelumnya apa yang dimaksud dengan derajat bebas dalam suatu uji
statistika. Derajat bebas dihitung dengan mengurangkan jumlah data yang
diketahui dengan jumlah persamaan dalam persamaan simultan. Dengan
demikian, dari kategori di atas, maka untuk kategori under identified, derajat
bebasnya akan negatif. Untuk just identified derajat bebasnya sama dengan
nol, dan untuk over identified derajat bebasnya bernilai positif.
Dalam SEM kita mengusahakan agar model hasil identifikasinya
berkategori over identified dan menghindari under identified. Meskipun
demikian menurut Wijayanto (2008) jika ada indikasi permasalahan berkaitan
dengan identifikasi, maka diperlukan melihat sumber-sumber kesalahan yang
sering terjadi. Hair, et. al. (Wijayanto, 2008) menemukan sumber-sumber
kesalahannya adalah 1) banyaknya parameter yang diestimasi relatif terhadap
varian kovarian matriks sampel yang menandakan derajat bebas yang kecil,
2) penggunaan reciprocal effect, 3) kegagalan dalam menetapkan skala dari
konstruk.
Sedangkan Muller (Wijayanto, 2008) menyarankan salah satu usaha
yang dapat dilakukan untuk memperoleh model yang over identified, yakni
memilih satu dari 2 pilihan sebagai berikut: 1) menetapkan salah satu muatan
faktor dari setiap variabel laten yang ada dalam model dengan nilai 1,0.
Atau 2) variabel laten yang distandarisasikan ke unit varians dengan cara
menetapkan nilai 1 pada komponen diagonal dari matriks .
Saran lain yang dikemukakan oleh Wijayanto (2008) adalah ketika
sebuah variabel laten hanya mempunyai satu variabel teramati tunggal, maka
lazimnya kita menetapkan nilai sama dengan 0 dan nilai error variens sama
dengan 0 2 atau 2 . Hal ini menunjukkan bahwa kita mengasumsikan
variabel teramati 100% merefleksikan variabel laten. Meskipun demikian,
jika kita menganggap bahwa variabel teramati tidak seratus persen
merefleksikan variabel laten, tetapi misalnya hanya 90% (atau R2 = 0,90),
MPDR5202/MODUL 9 9.63
4. Estimasi
Tahap ini dilakukan setelah tahap identifikasi memperoleh persamaan
simultan dengan kategori just identified atau over identified. Tahap estimasi
ini dilakukan untuk memperoleh nilai-nilai dari parameter-parameter yang
ada dalam model. Parameter-parameter yang harus diperoleh nilainya
adalah, , , , x, y, , dan , sedemikian hingga matriks kovarian
yang diturunkan model () sedekat mungkin dengan matriks kovarian
populasi dari variabel teramati, .
Sebagaimana lazimnya dalam analisis statistika, pengolahan data
dilakukan melalui data sampel, untuk itulah dalam perhitungan atau
pengolahannya kita menggunakan estimator (yang tentu saja terbaik) bagi ,
yakni S (matriks kovarian sampel dari variabel-variabel teramati). Estimator
bagi () dapat diturunkan dengan menyelesaikan persamaan S = (), yakni
sebagai berikut.
Cov Y , Y Cov Y , X
Cov X , Y Cov X , X
1
y I ' I y y I x
1 1
1
x I y x x
fitting function, yakni F(S, ()). Minimisasi dilakukan secara iteratif dan
jika hasil estimasi dari ˆ disubstitusikan ke () maka diperoleh ̂ dan
fungsi hasil minimisasi untuk ˆ adalah F(S, ̂ ).
Terdapat banyak pendekatan yang digunakan untuk meminimalkan dari
F, di antaranya Instrumen Variabel (TF), Two Stage Least Square (TSLS),
Unweighted Least Square (ULS), Generalized Least Square (GLS),
Maximum Likelihood (ML), Weighted Least Square (WLS), Diagonally
Weighted Least Square (DWLS). Untuk memilih mana pendekatan yang
digunakan diserahkan pada peneliti masing-masing. Untuk pengolahan data
lebih lanjut, dalam modul ini kita akan menggunakan WLS. Dalam LISREL
estimasi ini di adaptasi dari ADF (Asymptotically Distributrion Free) yang
dikembangkan oleh Browne.
Umumnya yang digunakan dalam SEM adalah pendekatan ML dan
WLS. WLS memiliki kelebihan dibandingkan dengan ML, tetapi ukuran
sampel yang diperlukan untuk melakukan estimasi dengan WLS lebih besar
ketika menggunakan ML. Ada beberapa persyaratan dalam penggunaan
pendekatan ini, yakni paling rendah rasio 5 responden per variabel teramati
akan mencukupi untuk distribusi normal ketika sebuah variabel laten
mempunyai beberapa indikator (variabel teramati), dan rasio 10 responden
per variabel teramati akan mencukupi untuk distribusi yang lain (Bentler dan
Chou dalam Wijayanto, 2008). Untuk itulah, ukuran sampel yang diperlukan
apabila kita menggunakan ML adalah minimal 5 responden untuk setiap
variabel teramati yang ada dalam model, sedangkan apabila kita
menggunakan WLS memerlukan minimal 10 responden untuk setiap variabel
teramati. Misalkan kita mempunyai model 20 variabel teramati, maka apabila
kita menggunakan ML akan diperlukan 100 responden, dan apabila kita
menggunakan WLS diperlukan 200 responden.
Hasil perhitungan dari estimasi ini memuat beberapa kemungkinan, dan
hal itulah yang perlu diperhatikan oleh kita. Kemungkinannya adalah adanya
nilai-nilai estimasi yang melebihi batas yang data diterima atau diistilahkan
dengan offending estimates. Beberapa jenis dari hasil ini adalah 1) negative
error variances atau nonsignificant error variances untuk konstruk-konstruk
yang ada. 2) standardized coefficients yang melebihi atau dekat dengan 1.
Dan 3) standard errors yang berhubungan dengan koefisien-koefisien yang
diestimasi mempunyai nilai sangat besar.
Ketika terjadi negative errors atau Heywoods cases, maka salah satu cara
untuk memperbaikinya adalah dengan menetapkan error variances tersebut
MPDR5202/MODUL 9 9.65
ke nilai positif yang sangat kecil misalnya 0,005 atau 0,01. Jika korelasi
dalam solusi standar melebihi nilai 1 atau dua estimasi berkorelasi tinggi,
maka kita perlu mempertimbangkan untuk mengeliminasi salah satu. Dalam
banyak hal, keadaan di atas sebagai akibat dari model yang dibentuk tanpa
justifikasi teori yang mencukupi atau modifikasi dilakukan hanya
berdasarkan pertimbangan empirik.
Tabel 9.3
Perbandingan Ukuran-Ukuran GOF
Comparative Fit Index Nilai berkisar antara 0 – 1, dengan nilai lebih tinggi
(CFI) adalah lebih baik. CFI 0,90 adalah good fit, sedang
0,80 CFI < 0,90 adalah marginal fit
PARSIMONIOUS FIT MEASURES
Parsiomiuous Goodness of Spesifikasi ulang dari GFI, dimana nilai yang lebih
Fit (PGFI) tinggi menunjukkan parsimoni yang lebih besar.
Ukuran ini digunakan untuk perbandingan di antara
model-model
Normed Chi-Square Rasio antara Chi-Square dengan degree of freedom.
Nilai yang disarankan: batas bawah: 1,0, batas atas: 2,0
atau 3,0 dan yang lebih longgar 5,0
Parsimonious Normed Fit Nilai tinggi menunjukkan kecocokan lebih baik, hanya
Index (PNFI) digunakan untuk perbandingan antar model alternatif
Akaike Information Nilai positif lebih kecil menunjukkan parsimoni lebih
Criterion (AIC) baik. Digunakan untuk perbandingan antar model.
Pada model tunggal, AIC dari model yang mendekati
nilai saturated AIC menunjukkan good fit
Consistent Akaike Nilai positif lebih kecil menunjukkan parsimoni lebih
Information Criterion baik. Digunakan untuk perbandingan antar model.
(CAIC) Pada model tunggal, NAIC dari model yang mendekati
nilai saturated NAIC menunjukkan good fit
OTHER GOFI
Critical ”N” (CN) CN 200 menunjukkan ukuran sampel mencukupi
untuk digunakan mengestimasi model. Kecocokan
yang memuaskan atau baik
Contoh 9.2
Contoh yang disajikan diambil dari Schumacker dan Lomax yang diambil
dalam Kusnedi (2004). Schumacker dan Lomax meneliti hubungan antara
home bacground (HOME), ability, (ABILITY), aspirations (ASPIRATION)
dan achivement (ACHIEVE) dengan hubungan teoritisnya adalah sebagai
berikut.
MPDR5202/MODUL 9 9.69
1
Farminc EdAsp
ASPIRA
FaEd HOME TION
OccAsp
MoEd
VerbAch
VerbAb
ABILI ACHI
TY EVE
Quant Quant
Ab Ach
2
Analisis data dimulai dengan membuka program LISREL. Klik FILE >
New, kemudian pilih Syntax only, klik OK. Layar monitor akan menunjukkan
sebagai berikut.
Gambar 9.18
Tampilan Awal Layar Kerja
Berdasarkan model yang telah dirumuskan dana data yang diperoleh kita
susun sintax di dalam kotak syntax sesuai dengan rumusan masalahnya.
Gambar 9.19
Input Program Kerja
MPDR5202/MODUL 9 9.71
Save Syntax dengan cara Klik gambar, sehingga dimonitor tampil kota
dialog File Save As.Dalam kota File name isikan nama file dalam bentuk
ekstension SPL. Misalkan beri nama LATIHAN 1.SPL.
Kemudian Klikyang menunjukkan Run Lisrel untuk mengeksekusi
Syntax, maka hasilnya diperoleh output program SIMPLIS dalam bentuk
OUT dan PATH sebagai berikut.
a. Output rumusan sintaks yang dilakukan oleh kita adalah sebagai berikut
DATE: 3/ 7/2015
TIME: 21:17
L I S R E L 9.10 (STUDENT)
BY
Penjelasan:
Keluaran ini sesuai dengan apa yang kita tulis dalam syntax. Kita perlu
memeriksa apakah semuanya sintax sudah sesuai atau belum dengan yang
diinginkan.
Covariance Matrix
Covariance Matrix
Penjelasan.
Output pertama dari LISREL adalah matriks korelasi yang telah kita
masukkan. Pada akhir penulisan ada istilah Total Variance, generalize
varians, serta nilai eigen maksimum dan minimum. Hasil di atas merupakan
pencocokkan matriks kovarians dari variabel teramati dengan matriks
kovarian model. Matriks kovarians teramati dan ukuran sampel dituliskan
pada hasil output di atas. Total varians maksudnya adalah jumlah dari elemen
diagonal utama matriks kovarians, sedangkan generalized variance dihitung
dari nilai determinan matriks kovarians. Nilai eigen merupakan nilai
karakteristik dari matriks kovarins. Nilai eigen ini mempunyai peran penting
dalam statistika multivariate.
MPDR5202/MODUL 9 9.73
c. Estimasi LISREL
STUDI TENTANG HUBUNGAN ANTARA HOME BACKGROUND (HOME),ABILITY, ASPIRATION,
DAN A
Number of Iterations = 11
Measurement Equations
Structural Equations
Penjelasan
Bagian ini memuat informasi hasil estimasi dari berbagai parameter model,
yakni elemen dari matriks X, Y, , , , , , dan yang disajikan
dalam bentuk persamaan. Estimasi LISREL memuat dua model, yakni model
pengukuran dan model struktural. Model pengukuran adalah persamaan yang
menghubungkan antara variabel laten dengan variabel manifestnya. Dalam
setiap persamaan dilengkapi dengan statistik uji untuk masing-masing
koefisien, serta koefisien determinasi.
Model Pengukuran (measurement equations)
Sebagai contoh untuk variabel laten ASPIRATION (ASPIRATI)
Besarnya koefisien jalur dari HOME ke ASPIRATI adalah 0,328, dan dari
ABILITY ke ASPIRATI sebesar 0,509 dengan nilai kesalahan standar
masing-masingnya adalah 0,103 dan 0,106. Secara umum hasil pengujian
modelnya memberikan nilai Z = 5,754 dengan probabilitas penolakan
hipotesis nolnya 0,000 yang jauh lebih kecil dari 0,05. Dengan demikian
minimal ada satu variabel eksogen (HOME atau ABILITY) berpengaruh
terhadap variabel endogen ASPIRATI. Dari hasil pengujian terhadap
koefisien jalur secara individual diperoleh nilai Z masing-masing 3,186 dan
4,811 dengan probabilitas penolakan Ho bagi keduanya berturut-turut 0,001
dan 0,000. Jika kita pilih taraf nyata 0,05 maka keduanya jauh lebih kecil dari
0,05. Artinya Ho ditolak, atau dapat disimpulkan bahwa secara individual
kedua variabel eksogen berpengaruh terhadap variabel endogen. Nilai
koefisien determinasi R2 = 0,616 menurut Joreskog (Wijayanto, 2008) pada
persamaan struktural tidak mempunyai interpretasi yang jelas. Untuk
menginterpretasikan R2 seperti halnya pada persamaan regresi kita harus
mengambilnya dari reduce form equations. Dengan demikian, kita tidak
dapat mengiterpretasi R2 = 0,616 pada persamaan struktural di atas.
Structural Equations
HOME ABILITY
-------- --------
HOME 1.000
Penjelasan
Matriks kovarians dari variabel independen adalah matriks kovarians dari
variabel eksogen (), yaitu matriks . Dalam contoh di atas ada dua variabel
eksogen yakni Home dan Ability.
Log-likelihood Values
Penjelasan
Matriks yang diperoleh dari perhitungan di atas merupakan matrik dari
variabel laten ( dan ) yang ada dalam model. Dalam contoh ini ada 4
variabel latent, yakni ASPIRATI, ACHIEVE, HOME, dan ABILITY. Kita
lihat bahwa variabel HOME dan ABILITY mempunyai dua fungsi, sebagai
variabel eksogen dan variabel latent.
Penjelasan:
Bagian ini merupakan ukuran Goodness of Fit (GOFI) yang dapat digunakan
untuk menguji kecocokan keseluruhan model (overall). Dalam perhitungan di
atas, terdapat beberapa kelompok pengujian kecocokan, yaitu:
Kelompok 1 : Chi-Square
Kelompok 2 : RMSEA
Kelompok 3 : ECVI
Kelompok 4 : NFI, NNFI, PNFI, CFI, IFI, dan RFI
Kelompok 5 : Critical N (CN)
Kelompok 6 : RMR, Standardized RMR, GFI, AGFI, dan PGFI.
Kelompok 1
Nilai Chi-Square hasil pengujian kecocokan adalah 60,668 yang cukup besar
sehingga penolakan hipotesis nolnya, p-value = 0,000 < 0,05, maka
kecocokannya kurang baik (yang diinginkan adalah p-value > 0,05, sehingga
hipotesis nol diterima).
Kemudian nilai NCP = 38,668 yang cukup besar dengan p-value = 0,000
dan 90% tingkat kepercayaan dari NCP = (19,206 ; 65,781) yang cukup
MPDR5202/MODUL 9 9.79
lebar, sehingga kecocokan modle keseluruhannya kurang baik. Hasil uji ini
sesuai dengan uji Ch-Square di atas.
Kelompok 2
Nilai RMSEA dari model yang diuji adalah 0,0937 yang lebih besar dari
0,08, sehingga kecocokan keseluruhan model kurang baik. (catatan RMSA
0,05 adalah close fit dan 0,05 < RMSE 0,08 adalah good fit).
Hasil di atas didukung nilai P-value RMSEA adalah 0,00629 < 0,05
yang menunjukkan model keseluruhan kurang baik (p-value RMSEA yang
diinginkan adalah lebih besar dari 0,05).
Kelompok 3
Kelompok 4
Kelompok 5
Kelompok 6
Kelompok pengujian ini ada 4, yakni RMR, GFI, AGFI dan PGFI. Nilai
dari standaridized RMR = 0,0506 0,05, artinya kecocokan keseluruhan
model cukup baik (catatan model kococokan keseluruhan model adalah baik,
jika nilai standardizednya 0,05). Dalam kasus nilainya hampir sama, jadi
dapat dikatakan cukup baik. Nilai GFI = 0,936 0,90 artinya kecocokan
keseluruhan model adalah baik. AGFI = 0,868 0,90 kecocokan keseluruhan
model kurang baik. Dan PGFI = 0,457 digunakan untuk perbandingan model.
Hasil dari uji kecocokan di atas dapat dirangkum sebagai berikut.
MPDR5202/MODUL 9 9.81
Tabel 9.4
Hasil Uji Kecocokan Keseluruhan Model
h. Indikasi Modifikasi
Penjelasan
Modification indices(indeksmodifikasi) merupakan informasi yang
disarankan oleh lisrel terhadap hasil perhitungan di atas agar diperoleh model
yang lebih baik. Dalam implementasinya, peneliti perlu mempertimbangkan
aspek teori yang mengaitkan variabel-variabel yang disarankan. Untuk kasus
di atas misalnya, 1) peneliti perlunya pengukuran error variance variabel
laten MoEd dikorelasikan dengan FaEd, sehingga dapat menurunkan chi-
square sebesar 39,9. Atau 2) dibuat jalur antara variabel manifes Faminc
dengan variabel laten ABILITY (variabel Faminc dijadikan sebagai indikator
dari variabel ABILITY), sehingga dapat menurunkan Chi-Square sebesar
35,9. Upaya ini perlu dijastifikasi secara teori oleh peneliti.
Analisis terakhir dari hasil pengolahan data melalui lisrel adalah
membaca grafik. Keluaran grafik ada berbagai jenis. Untuk keluaran bentuk
PTH ada tiga jenis yakni Estimates, Standard Solution, dan T-Values.
Jika pada kotak paling kanan kita pilih Estimates, maka bentuk keluaran
garfiknya adalah sebagai berikut.
Gambar 9.20
Diagram Lengkap Estimates dari Pengaruh HOME dan ABILITY terhadap
ASPIRATION dan ACHIEVEMENT
Gambar 9.21
Diagram Lengkap Standardized
dari Pengaruh HOME dan ABILITY terhadap
ASPIRATION dan ACHIEVEMENT
Dan jika kita pilih T-Values, maka garifknya akan terlihat di bawah ini.
Gambar 9.22
Diagram Lengkap T-Values
dari Pengaruh HOME dan ABILITY terhadap
ASPIRATION dan ACHIEVEMENT
9.84 Statistika Pendidikan
Dari kedua persamaan di atas terlihat bahwa nilai z dan p-value bagi
koefisien ASPIRATI dan ACHIEVE tidak ada. Dengan demikian, EdAsp
bukan indikator yang baik bagi ASPIRATION dan VerbAch juga bukan
indikator yang baik bagi ACHIEVEMENT.
Jika kita menginginkan grafik yang terpisah antara variabel laten
eksogen (X-Model) dan endogen (Y-Model) maupun model strukturalnya,
maka kita Klik Show Models pada Kota yang di tengah (BASIC MODEL),
kemudian pilih grafik yang kita inginkan.
Jika kita pilih X-MODEL, maka hasilnya adalah sebagai berikut.
MPDR5202/MODUL 9 9.85
Gambar 9.23
Diagram Jalur Model Pengukuran Laten Eksogen
Dan jika kita pilih Y-MODEL, maka hasilnya adalah sebagai berikut
Gambar 9.24
Diagram Jalur Model Pengukuran Laten Endogen
9.86 Statistika Pendidikan
Gambar 9.25
Diagram Jalur Model Struktural
LAT IH A N
Self1
Self2
Structural Equations
DEPRESS
--------
1.00
Degrees of Freedom = 51
Minimum Fit Function Chi-Square = 129.99 (P = 0.00)
Normal Theory Weighted Least Squares Chi-Square = 111.89 (P = 0.00)
Estimated Non-centrality Parameter (NCP) = 60.89
90 Percent Confidence Interval for NCP = (34.11 ; 95.42)
9.90 Statistika Pendidikan
R A NG KU M AN
Variabel dalam SEM terdiri dari variabel Laten (latent) dan Variabel
Teramati (observed/manifest/measured). Variabel laten merupakan
konstruk atau konsep abstrak. Variabel teramati adalah variabel yang
dapat diamati atau dapat diukur secara empiris dan sering disebut dengan
indikator.
Ada dua model struktural dan model pengukuran dan dua model
inilah yang diestimasi. Model struktural adalah model yang
menghubungkan variabel-variabel laten, dan umumnya bersifat linear.
Model pengukuran merupakan model yang menghubungkan antara
variabel teramati dengan variabel laten, di mana satu variabel teramati
hanya berhubungan dengan satu variabel laten.
Dua jenis kesalahan dalam SEM adalah kesalahan struktural dan
kesalahan pengukuran.
Bentuk SEM terdiri dari Hybrid Model, Path Model, dan CFA.
SEM merupakan salah satu teknik analisis data multivariate tingkat
lanjut dengan prosedur komputasinya dilakukan secara iterative.
Pengujian pada SEM dilakukan terhadap kecocokan keseluruhan
model, kecocokan model pengukuran dan kecocokan model struktural.
Pengujian keseluruhan model diistilahkan dengan GOF (Goodness Of
Fit). GOF terdiri dari beberapa statistik uji, di antaranya Chi-Square,
NCP, SNCP, GFI, RMR, RMSEA, dan ECVI.
Karena proses perhitungan dalam SEM cukup kompleks, maka
diperlukan pengolah data, di antaranya lisrel.
TES F OR M AT IF 2
X2 X2 2
1
4 3
SES
1
2
1 2 3
Y2
2
SAS
2 LOC P
1 2
6
5 1
Y2 2 Y2 4
1 Y2
Derajat
Orientasi
Pasar
Kinerja Keunggulan
Pemasaran bersaing
berkelanjutan
Strategi
Promosi
X1 X2 X3 X4 Y1 Y2 Y3 Y4 Y5 Y6
X1 1,000
X2 0,149 1,000
X3 0,154 0,699 1,000
X4 0,194 0,658 0,664 1,000
Y1 0,226 0,072 0,040 0,163 1,000
Y2 0,460 0,258 0,263 0,160 0,377 1,000
Y3 0,357 0,153 0,232 0,055 0,385 0,473 1,000
Y4 0,353 0,094 0,131 0,029 0,305 0,368 0,479 1,000
Y5 0,309 0,067 0,114 0,032 0,114 0,262 0,399 0,759 1,000
Y6 0,406 0,114 0,128 0,101 0,348 0,330 0,416 0,815 0,778 1,000
MPDR5202/MODUL 9 9.95
Test Formatif 1
1) Berdasarkan hipotesis
a. Sosio ekonomi berpengaruh terhadap need achievement dan juga
GPA.
b. IQ berpengaruh terhadap terhadap need achievement dan GPA.
c. Need achievement berpengaruh terhadap GPA.
d. Sosio ekonomi berkorelasi dengan IQ.
Maka diagram jalurnya adalah sebagai berikut
SES N Ach
IQ GPA
1 2 3 Y
SES IQ n Ach GPA
1 1,00 0,30 0,41 0,33
2 1,00 0,16 0,57
3 1,00 0,50
Y 1,00
Dari diagram di atas, terlihat ada dua variabel endogen, yakni N ach dan
GPA. Dengan demikian, model struktur tersebut memuat dua sub
struktur. Keduanya adalah sebagai berikut.
SES N SES N
Ach Ach
IQ IQ GPA
NAch p N 1 SES p N 2 IQ .
N1 0,398 0,398
t1 4,19
1 R C
1
2
11
1 0,17 1, 099 0, 095
n k 1 97
N 2 0, 041 0, 041
t1 0, 431
1 R C
1
2
22
1 0,17 1, 099 0, 095
n k 1 97
SES N Ach
IQ GPA
1 2 3 Y
SES IQ n Ach GPA
1 1,00 0,30 0,41 0,33
2 1,00 0,16 0,57
3 1,00 0,50
Y 1,00
Pengujian keseluruhan:
SES
NA GPA
IQ
Substruktur 1
Variables Entered/Removedb
Model Variables Entered Variables Removed Method
1 X2, X1a . Enter
2 . X2 Backward (criterion:
Probability of F-to-
remove >= ,100).
a. All requested variables entered.
b. Dependent Variable: X3
ANOVAc
Sum of
Model Squares df Mean Square F Sig.
1 Regression 603,600 2 301,800 19,794 ,000a
Residual 259,200 17 15,247
Total 862,800 19
2 Regression 598,487 1 598,487 40,758 ,000b
Residual 264,313 18 14,684
Total 862,800 19
a. Predictors: (Constant), X2, X1
b. Predictors: (Constant), X1
c. Dependent Variable: X3
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 45,590 6,387 7,138 ,000
X1 ,539 ,168 ,727 3,212 ,005
X2 ,279 ,482 ,131 ,579 ,570
2 (Constant) 46,732 5,962 7,838 ,000
X1 ,618 ,097 ,833 6,384 ,000
a. Dependent Variable: X3
Substruktur 2
Dalam perhitungan substruktur juga, X2 removed dari model. Akhirnya
dalam substruktur 2 tidak ada jalur dari X2 ke Y. Sedangkan jalur
lainnya X1 ke Y dan X3 ke Y dipertahankan.
Coefficientsa
Unstandardized Standardized
Model Coefficients Coefficients
B Std. Error Beta t Sig.
1 (Constant) -65,957 17,209 -3,833 ,001
X1 ,379 ,287 ,330 1,322 ,205
X2 ,788 ,657 ,239 1,201 ,247
X3 ,598 ,327 ,386 1,830 ,086
2 (Constant) -65,286 17,422 -3,747 ,002
X1 ,567 ,243 ,493 2,333 ,032
X3 ,653 ,328 ,421 1,991 ,063
MPDR5202/MODUL 9 9.105
a. Dependent Variable: Y
Model Summary
Adjusted R Std. Error of the
Model R R Square Square Estimate
1 ,887a ,786 ,746 5,26231
2 ,876b ,767 ,740 5,33016
a. Predictors: (Constant), X3, X2, X1
b. Predictors: (Constant), X3, X1
Hasil akhirnya adalah sebagai berikut.
E2
X1 0,483
0,493
0,833
X3 Y
0,421
0,553
X2
E2
Test Formati 2
1) adalah vektor dari variabel latent endogen
adalah vektor dari variabel eksogen
adalah matriks koefisien dari pengaruh variabel endogen terhadap
variabel endogen
adalah matriks koefisien dari pengaruh variabel eksogen terhadap
variabel endogen
2) Hasil perhitungannya adalah sebagai berikut dan silahkan Anda silahkan
Anda analisis!
9.106 Statistika Pendidikan
Number of Iterations = 8
Measurement Equations
Structural Equations
SES
--------
1.00
Degrees of Freedom = 6
Minimum Fit Function Chi-Square = 13.98 (P = 0.030)
Normal Theory Weighted Least Squares Chi-Square = 13.31 (P = 0.038)
Estimated Non-centrality Parameter (NCP) = 7.31
90 Percent Confidence Interval for NCP = (0.35 ; 21.93)
Glosarium
1
N x; , e 2
, untuk - x .
2
Distribusi normal baku adalah distribusi variabel acak normal dengan rata-
rata nol dan simpangan baku 1.
Distribusi sampling rata-rata adalah distribusi dengan peubah acaknya
rata-rata X dari keseluruhan sampel yang mungkin dari suatu
populasi.
Kuartil adalah nilai-nilai yang membagi segugus pengamatan menjadi 4
bagian yang sama.
Kurva normal adalah suatu kurva yang merupakan refresentasi dari fungsi
peubah acak normal (X) dengan rata-rata dan varians 2.
MPDR5202/MODUL 9 9.111
Hipotesis statistik adalah pernyataan atau dugaan mengenai satu atau lebih
populasi.
Hipotesis nol adalah hipotesis yang dirumuskan dengan harapan akan
ditolak.
Hipotesis asosiatif adalah suatu pernyataan yang menunjukkan dugaan
hubungan antara dua variabel atau lebih
Hipotesis komparatif adalah pernyataan yang menunjukkan dugaan nilai
dalam satu variabel atau lebih yang berbeda.
Level signifikansi atau taraf nyata adalah peluang kesalahan atau eror atau
galat jenis I yakni peluang penolakan hipotesis nol yang benar.
Model struktural adalah hubungan antar variabel yang diperoleh dari
kerangka berpikir atau analisis teori.
Parameter adalah sebarang nilai yang menjelaskan ciri suatu populasi.
Penduga tak bias. Jika statistik adalah penduga suatu parameter , maka
E .
Penduga paling efisien adalah penduga dari semua kemungkinan penduga
tak bias bagi parameter yang mempunyai varians terkecil.
Pengaruh langsung adalah pengaruh dari satu variabel eksogen terhadap
satu variabel endogen.
Pengaruh tidak langsung adalah pengaruh dari satu variabel eksogen
terhadap variabel endogen melalui variabel endogen lain.
Pengaruh total adalah jumlah pengaruh dari satu variabel eksogen terhadap
endogen yang diperoleh dari keseluruhan jumlah pengaruh langsung dan
pengaruh tidak langsung.
Peubah acak atau variabel acak adalah suatu fungsi dengan nilainya
berupa bilangan nyata/riil yang ditentukan oleh setiap unsur dalam ruang
sampel.
Populasi adalah keseluruhan pengamatan yang menjadi perhatian kita
(peneliti).
Regresi adalah persamaan/model matematika yang menghubungkan secara
fungsional antara beberapa variabel bebas (1 atau lebih) dengan satu
variabel terikat.
Regresi linear sederhana adalah model regresi dengan model matematikanya
berbentuk persamaan linear dari satu variabel bebas dengan satu variabel
terikat.
9.112 Statistika Pendidikan
Daftar Pustaka
Steel, R.G.D. & Torrie, J. H. 1995. Prinsip dan Prosedur Statistika (Suatu
Pendekatan Biometrik). Alih Bahasa: Bambang Sumantri. Jakarta:
Gramedia Pustaka Utama.