Anda di halaman 1dari 570

Hak Cipta  dan Hak Penerbitan dlindungi Undang-undang ada pada

Universitas Terbuka - Kementerian Riset, Teknologi, dan PendidikanTinggi


Jalan Cabe Raya, Pondok Cabe, Pamulang, Tangerang Selatan - 15418
Banten – Indonesia
Telp.: (021) 7490941 (hunting); Fax.: (021) 7490147;
Laman: www.ut.ac.id

Dilarang mengutip sebagian ataupun seluruh buku ini


dalam bentuk apa pun, tanpa izin dari penerbit

Edisi Kesatu
Cetakan pertama, Agustus 2015
Cetakan kedua, Mei 2016

Penulis: 1. Prof. Dr. Wahyudin


2. Dr. Jarnawi Afgani Dahlan
Penelaah Materi: Dr. Endang Wahyuningrum, M.Si.
Pengembang Desain Instruksional: Dr. Sandra Sukmaning Adji

Desain Cover & Ilustrator: Sunarty


Lay-outer : Nono Suwarno
Copy Editor : Dr. Sandra Sukmaning Adji

370.21
WAH WAHYUDIN
m Materi pokok statistika pendidikan; 1 – 9/ MPDR5202/ 3 sks/
Wahyudin, Jarnawi Afgani Dahlan; -- Cet.2; Ed.1 --. Tangerang
Selatan: Universitas Terbuka, 2016.
575 hal; ill.; 21 cm
ISBN: 978-602-392-005-1

1. statistika pendidikan
I. Judul II. Dahlan, Jarnawi Afgani
iii

Daftar Isi

TINJAUAN MATA KULIAH ........................................................... ix

MODUL 1: PENGANTAR STATISTIKA ..................................... 1.1


Kegiatan Belajar 1:
Pengertian dan Peran Statistika .......................................................... 1.3
Latihan ................................................................................................ 1.12
Rangkuman ......................................................................................... 1.13
Tes Formatif 1 .................................................................................... 1.14

Kegiatan Belajar 2:
Pengamatan ........................................................................................ 1.16
Latihan ................................................................................................ 1.22
Rangkuman ......................................................................................... 1.23
Tes Formatif 2 .................................................................................... 1.23

Kegiatan Belajar 3:
Konsep Dasar Matematika Pendukung .............................................. 1.25
Latihan ................................................................................................ 1.31
Rangkuman ......................................................................................... 1.32
Tes Formatif 3 .................................................................................... 1.33

KUNCI JAWABAN TES FORMATIF.............................................. 1.35


DAFTAR PUSTAKA......................................................................... 1.38

MODUL 2: PENYAJIAN DATA 2.1


Kegiatan Belajar 1:
Penyajian Data .................................................................................... 2.3
Latihan ................................................................................................ 2.34
Rangkuman ......................................................................................... 2.39
Tes Formatif 1 .................................................................................... 2.40

Kegiatan Belajar 2:
Populasi dan Sampel .......................................................................... 2.43
Latihan ................................................................................................ 2.50
iv

Rangkuman ......................................................................................... 2.52


Tes Formatif 2 .................................................................................... 2.52

KUNCI JAWABAN TES FORMATIF.............................................. 2.54


DAFTAR PUSTAKA ........................................................................ 2.61

MODUL 3: STATISTIKA DESKRIPTIF ....................................... 3.1


Kegiatan Belajar 1:
Statistika Deskriptif ............................................................................ 3.3
Latihan ................................................................................................ 3.33
Rangkuman ......................................................................................... 3.35
Tes Formatif 1 .................................................................................... 3.37

Kegiatan Belajar 2:
Korelasi dan Regresi .......................................................................... 3.40
Latihan ................................................................................................ 3.64
Rangkuman ......................................................................................... 3.67
Tes Formatif 2 .................................................................................... 3.68

KUNCI JAWABAN TES FORMATIF.............................................. 3.71


DAFTAR PUSTAKA ........................................................................ 3.75

MODUL 4: KURVA NORMAL DAN KURVA NORMAL YANG 4.1


BAKU
Kegiatan Belajar 1:
Kurva Normal ..................................................................................... 4.6
Latihan ................................................................................................ 4.9
Rangkuman ......................................................................................... 4.11
Tes Formatif 1 .................................................................................... 4.11

Kegiatan Belajar 2:
Skor-skor Baku dan Kurva Normal .................................................... 4.13
Latihan ................................................................................................ 4.22
Rangkuman ......................................................................................... 4.23
Tes Formatif 2 .................................................................................... 4.23
v

KUNCI JAWABAN TES FORMATIF.............................................. 4.25


DAFTAR PUSTAKA......................................................................... 4.26

MODUL 5: DASAR STATISTIKA INFERENSIAL 5.1


Kegiatan Belajar 1:
Masalah-Masalah dalam Statistika Inferensial .................................. 5.2
Latihan ................................................................................................ 5.8
Rangkuman ......................................................................................... 5.9
Tes Formatif 1 .................................................................................... 5.9

Kegiatan Belajar 2:
Distribusi Mean Penyampelan Acak .................................................. 5.11
Latihan ................................................................................................ 5.24
Rangkuman ......................................................................................... 5.26
Tes Formatif 2 .................................................................................... 5.26

KUNCI JAWABAN TES FORMATIF.............................................. 5.29


DAFTAR PUSTAKA ........................................................................ 5.31

MODUL 6: UJI HIPOTESIS TENTANG MEAN-MEAN


TUNGGAL DAN DOBEL MEAN (z dan t) 6.1
Kegiatan Belajar 1:
Uji Hipotesis tentang Mean Tunggal ................................................. 6.3
Latihan ............................................................................................... 6.23
Rangkuman ......................................................................................... 6.27
Tes Formatif 1 .................................................................................... 6.29

Kegiatan Belajar 2:
Uji Hipotesis Dobel Mean (Kasus Dua-Sampel) ............................... 6.32
Rangkuman ......................................................................................... 6.37
Tes Formatif 2 .................................................................................... 6.38

KUNCI JAWABAN TES FORMATIF.............................................. 6.40


DAFTAR PUSTAKA ........................................................................ 6.43
vi

MODUL 7: ANALISIS VARIANS DAN KOVARIANS 7.1


Kegiatan Belajar 1:
Analisis Varians Satu Jalur ................................................................. 7.4
Latihan ............................................................................................... 7.28
Rangkuman ......................................................................................... 7.30
Tes Formatif 1 .................................................................................... 7.31

Kegiatan Belajar 2:
Anova Dua Arah ................................................................................. 7.34
Latihan ................................................................................................ 7.48
Rangkuman ......................................................................................... 7.51
Tes Formatif 2 .................................................................................... 7.52

Kegiatan Belajar 3:
Analisis Kovarians ............................................................................. 7.55
Latihan ................................................................................................ 7.68
Rangkuman ......................................................................................... 7.69
Tes Formatif 3 .................................................................................... 7.69

KUNCI JAWABAN TES FORMATIF.............................................. 7.72


DAFTAR PUSTAKA......................................................................... 7.78

MODUL 8: ANALISIS KORELASI DAN REGRESI 8.1


Kegiatan Belajar 1:
Analisis Korelasi ................................................................................ 8.4
Latihan ............................................................................................... 8.27
Rangkuman ......................................................................................... 8.31
Tes Formatif 1 .................................................................................... 8.32

Kegiatan Belajar 2:
Analisis Regresi .................................................................................. 8.34
Latihan ................................................................................................ 8.76
Rangkuman ......................................................................................... 8.79
Tes Formatif 2 .................................................................................... 8.80

KUNCI JAWABAN TES FORMATIF.............................................. 8.83


DAFTAR PUSTAKA ........................................................................ 8.89
vii

MODUL 9: ANALISIS JALUR DAN MODEL PERSAMAAN


STRUKTURAL 9.1
Kegiatan Belajar 1:
Analisis Jalur (Path Analysis) ............................................................ 9.3
Latihan ............................................................................................... 9.29
Rangkuman ......................................................................................... 9.32
Tes Formatif 1 .................................................................................... 9.33

Kegiatan Belajar 2:
Struktural Equation Model ................................................................. 9.39
Latihan ................................................................................................ 9.86
Rangkuman ......................................................................................... 9.92
Tes Formatif 2 .................................................................................... 9.92

KUNCI JAWABAN TES FORMATIF.............................................. 9.96


GLOSARIUM ................................................................................... 9.110
DAFTAR PUSTAKA......................................................................... 9.113
ix

Tinjauan Mata Kuliah

S tatistika merupakan instrumen atau alat peneliti dalam menjawab


permasalahan yang ditelitinya, serta merupakan alat berkomunikasi
antara peneliti. Dengan peran tersebut, maka tentu saja dibutuhkan
pemahaman dari peneliti agar teknik statistika yang digunakan tepat sesuai
dengan kebutuhannya. Artinya, peneliti perlu mempelajarinya agar tidak
salah memilih dan mampu menafsirkan hasil dari pengolahan data yang telah
dilakukannya.
Secara umum, statistika terbagi dalam dua kelompok, yakni statistika
deskriptif dan statistika inferensial. Statistika deskriptitif berbicara tentang
kondisi data sampel, sedangkan statistika inferensial menyajikan suatu
inferensi kondisi data dalam populasi. Bahasan dalam inferensi ini memuat
dua hal, yakni penaksiran dan pengujian hipotesis. Dalam beberapa kasus,
peneliti lebih banyak membahas statistika deskriptif dan pengujian hipotesis.
Berkaitan dengan dua hal tersebut, yakni ketepatan peneliti dalam memilih
uji statistika dan penafsiran baik itu statistika deskriptif dan inferensial, maka
buku materi pokok (BMP) ini mencoba menyajikan materi tidak terfokus
pada prosedur pengolahan data, tetapi juga pemaknaan tentang hasil-hasil
perhitungan baik dalam statistika deskriptif maupun inferensial.
Secara sistematika, mahasiswa dapat mempelajari BMP ini secara terurut
dari Modul 1 sampai dengan Modul 9. Modul 1 mungkin tidak perlu ada
tutorial, karena sifatnya membahas tentang sejarah singkat statistika dan
beberapa mengingatkan kembali mahasiswa materi matematika yang banyak
digunakan untuk perhitungan-perhitungan dalam statistika, seperti notasi
sigma untuk jumlah, serta pembulatan bilangan. Dengan demikian tutorial
dapat dimulai dari Modul 2 tentang penyajian data.
Modul 2 dan 3 walaupun mungkin pada saat kuliah program sarjana
materi tersebut sudah dibahas, tetapi mahasiswa perlu mencermati beberapa
hal yang mungkin belum dibahas. Misalnya dalam penyajian data, apa yang
perlu diperhatikan dalam penyusunan tabel distribusi frekuensi, ketepatan
dalam memilih diagram yang sesuai dengan data, bagaimana menafsirkan
diagram, makna dan kegunaan dari ukuran-ukuran gejala memusat (rata-rata,
modus, dan median), ukuran penyebaran (rentang, rentang antar kuartil,
varians, dan simpangan baku), serta angka baku. Dengan demikian, Modul 2
ini sudah perlu ada tutorial bagi mahasiswa.
x

Modul 4 dan 5 merupakan dasar untuk statistika inferensial. Pada modul


4 hanya dibahas distribusi normal baku, sejatinya banyak distribusi variabel
acak dalam statistika. Namun karena keterbatasan “tempat”, maka dalam
modul ini hanya dibahas salah satu saja. Untuk itu, mahasiswa perlu
melengkapinya dengan membaca sumber lain, misalnya yang ada dalam
pustaka modul ini. Perlu pendalaman yang sangat baik dari mahasiswa dalam
mempelajari Modul 5, karena materi dalam modul tersebut merupakan
loncatan proses pengolahan data dari deskriptif ke inferensial. Kegagalan
umum yang sering terjadi dalam menafsirkan hasil perhitungan statistika
inferensial, misalnya pengujian hipotesis, terjadi ketika kita tidak paham
prinsip-prinsip dalam statistika inferensial.
Modul 6 sampai dengan 9 menyajikan analisis pengujian hipotesis baik
hipotesis komparatif maupun keterhubungan (korelasi dan regresi). Modul 6
berisi pengujian hipotesis komparatif dimulai dari uji satu kelompok,
kemudian dua kelompok baik yang saling bebas maupun tidak saling bebas.
Modul 7 berisi tentang pengujian perbandingan k kelompok sampel baik yang
saling bebas ataupun berpasangan melalui ANOVA, analisis dua jalur
melalui ANOVA baik tanpa interaksi maupun dengan interaksi, dan diakhiri
dengan analisis kovariat (ANACOVA). Mahasiswa perlu mencermati tentang
apa yang menjadi perbedaan antara uji – z dan uji - t student, dan juga uji-t’.
Kapan ketiga uji tersebut digunakan.
Setelah mempelajari dengan tuntas pengujian komparatif, dalam modul 8
mahasiswa akan belajar pengujian keterhubungan (relationship) baik uji
asosiatif maupun fungsional (regresi). Mahasiswa perlu memahami dengan
baik, apa perbedaan di antara keduanya (korelasi dan regresi linear
sederhana). Pengujian-pengujian apa yang diperlukan dalam regresi. Selain
itu, pemahaman yang baik dalam regresi akan memudahkan mahasiswa
dalam mempelajari modul 9 yang berisi materi analisis jalur dan model
persamaan struktural. Dasar dari kedua materi ini adalah korelasi dan regresi.
Untuk memudahkan mahasiswa dalam memberikan makna baik dalam
statistika deskriptif maupun inferensial, seluruh penulisan dalam modul ini
diawali dengan masalah kontesktual, dan diakhiri juga dengan contoh
penerapannya. Untuk memudahkan perhitungan, terutama dalam modul 9,
penyajian materi dilengkapi dengan contoh perhitungan melalui program
komputer, seperti Excel, SPSS, dan LISREL. Dengan demikian, mahasiswa
perlu juga memiliki ketiga program tersebut.
xi

Terakhir, karena keterbatasan dalam “tempat”, penulisan modul ini lebih


banyak membahas statistika parametrik. Untuk itulah, mahasiswa perlu
melengkapi dan mempelajari lebih lanjut statistika nonparametrik. Selamat
belajar dan semoga bermanfaat!
xii

Peta Kompetensi
MPDR5202 Statistika Pendidikan/3 sks
Modul 1

Pengantar Statistika
Dr. Jarnawi Afgani Dahlan

PEN D AH U LU A N

S tatistika adalah pengetahuan yang berhubungan dengan cara-cara


pengumpulan data, pengolahan atau penganalisisannya dan penarikan
kesimpulan berdasarkan kumpulan data serta penganalisisan yang dilakukan
(Sudjana, 1989). Dari pengertian di atas nampak bahwa statistika merupakan
suatu rangkaian sistematis yang dilakukan dalam proses pengambilan
kesimpulan. Selanjutnya apa peran statistika dalam kehidupan? Dan apa
bedanya antara statistika dengan statistik?
Modul 1 ini diawali dengan membahas pengertian, peran statistika,
bagaimana statistika berkembang, serta dilengkapi dengan kajian umum
tentang jenis-jenis statistika. Anda diharapkan membacanya sampai Anda
paham, sehingga Anda dapat mengerti peran yang terbatas dari statistika
tetapi walaupun terbatas, peran tersebut sangatlah penting. Selain itu, Anda
juga akan memahami bahwa dalam statistika hanya dibahas dua fokus, yakni
statistika deskriptif dan inferensial.

A. DESKRIPSI SINGKAT

Modul 1 ini terdiri dari 3 kegiatan belajar. Kegiatan belajar pertama


membahas tentang tinjauan umum statistika, seperti pengertian statistika,
peran statistika, perbedaan statistika dengan statistik, data statistik dan
sumber serta jenis-jenisnya. Adapun kegiatan belajar 2 membahas tentang
jenis-jenis statistika, populasi sampel, permasalahan-permasalahan yang
dapat diajukan pada statistikawan, serta kegiatan belajar 3 berkaitan dengan
materi dasar matematika yang banyak digunakan dalam perhitungan
statistika, yakni pembulatan bilangan dan notasi sigma.
1.2 Statistika Pendidikan 

B. RELEVANSI

Pemahaman atas konsep dasar statistika akan memberikan gambaran


pada mahasiswa tentang mengapa statistika diperlukan dalam berbagai
bidang kehidupan, khususnya dalam penelitian. Pentingnya statistika dapat
dilihat dari adanya mata kuliah statistika pada keseluruhan program studi dari
mulai jenjang S1 sampai dengan S3.

C. TUJUAN INSTRUKSIONAL KHUSUS

Setelah mempelajari Modul 1 ini diharapkan mahasiswa dapat:


1. Menjelaskan tentang pengertian statistika.
2. Menjelaskan dengan singkat perkembangan statistika.
3. Menjelaskan peran statistika dalam penelitian.
4. Menjelaskan perbedaan statistika deskriptif dan inferensial.
5. Menjelaskan data berdasarkan sumbernya.
6. Menjelaskan jenis-jenis skala pengukuran.
7. Menjelaskan tentang pembulatan bilangan dan menerapkannya dalam
perhitungan.
8. Menjelaskan notasi sigma dan menggunakannya dalam perhitungan.
 MPDR5202/MODUL 1 1.3

Kegiatan Belajar 1

Pengertian dan Peran Statistika

A. DEFINISI STATISTIKA

Menurut Steel & Torrie (1995) statistika merupakan subjek yang sedang
tumbuh cepat, sehingga banyak hasil penemuan dalam bidang statistika yang
belum ada dalam buku-buku teks. Statistika tumbuh sebagai jawaban
statistikawan terhadap persoalan-persoalan yang diajukan oleh para peneliti.
Namun demikian, para pelopor dalam statistika juga masih banyak yang
berperan aktif dalam menyumbangkan karya-karyanya.
Kebutuhan akan statistika terasa di berbagai bidang. Baik secara praktis
dan sederhana sampai dengan yang sangat kompleks. Secara sederhana
statistika banyak digunakan dalam evaluasi kegiatan yang menggunakan
data. Sebagai contoh dalam bidang pendidikan, sekolah ingin mengetahui
perkembangan kualitas pendidikan yang dilihat dari mutu lulusan dari hasil
ujian, statistika membantu para pegiat lingkungan mengkaji tentang dampak
lingkungan, membantu pemerintah dalam menentukan suatu kebijakan, dan
lain sebagainya. Untuk kebutuhan itu, maka semakin banyak penelitian yang
melibatkan statistikawan.
Luasnya ruang lingkup statistika membuatnya sulit untuk didefinisikan.
Statistika dikembangkan untuk mengatasi persoalan-persoalan yang
diselesaikan melalui pengamatan-pengamatan individu, sehingga hukum
sebab akibatnya tidak jelas dan oleh karena itu diperlukan pendekatan yang
objektif. Dalam persoalan yang demikian tentu saja ada unsur-unsur
ketidakpastian mengenai penarikan yang hanya didasarkan pada sejumlah
pengamatan secara terbatas. Untuk tujuan itu, Steel &Torrie (1995)
mendefinisikan statistika sebagai ilmu pengetahuan, murni dan terapan,
mengenai penciptaan, pengembangan, dan penerapan teknik-teknik
sedemikian rupa sehingga ketidakpastian inferensia induktif dapat dievaluasi
(diperhitungkan).Lebih lanjut Steel & Torrie mengatakan bahwa sebagian
ilmuwan memberikan definisi statistika sebagai logika atau akal sehat
(commonsense) yang disertai dengan prosedur-prosedur aritmetika. Logika
memberikan metode yang selanjutnya dipakai untuk mengumpulkan dan
menentukan data yang diperlukan. Sedangkan aritmetika, bersama-sama
dengan tabel tertentu, menghasilkan sesuatu yang dipakai sebagai dasar
1.4 Statistika Pendidikan 

penarikan kesimpulan dan mengukur ketidakpastiannya. Bagi pengguna,


tidaklah perlu khawatir. Karena aritmetika ini sering bersifat rutin, tidak
memerlukan latihan matematika khusus. Definisi lain dikemukakan oleh
Sudjana (1989) Statistika adalah pengetahuan yang berhubungan dengan
cara-cara pengumpulan data, pengolahan atau penganalisisannya dan
penarikan kesimpulan berdasarkan kumpulan data serta penganalisisan yang
dilakukan. Kedua definisi di atas mempunyai kesamaan, yakni menempatkan
statistika sebagai sebuah pengetahuan yang memuat proses berpikir secara
induktif.
Dalam bahasan ini kita juga perlu sedikit membuka informasi tentang
sejarah statistika. Perkembangan statistika diawali sebagai suatu ilmu yang
membahas cara-cara mengumpulkan angka sebagai hasil pengamatan
menjadi bentuk yang lebih mudah dipahami. Menurut Spiegel (Sunaryo,
dkk., tanpa tahun) statistika berasal dari kata “status” yang berarti negara.
Sehingga pada awalnya statistika berkaitan dengan ilmu untuk angka-angka
(keterangan) atas perintah raja suatu negara, yang ingin mengetahui kekayaan
negaranya, jumlah penduduk, hewan piaraan, hasil pertanian, dan modal. Hal
tersebut juga dikemukakan oleh Steel &Torrie (1995) bahwa sejarah
statistika mengungkapkan keadaan alamiah statistika terjadi pada abad
keduapuluh. Istilah statistika sendiri sudah sangat tua. Statistika bermula
sebagai suatu cara perhitungan untuk membantu pemerintah yang ingin
mengetahui kekayaan dan banyaknya warganya yang bertujuan untuk
menarik pajak ataupun berperang. Hal ini terungkap ketika Kaisar Agustus
mengeluarkan suatu dekrit yang mengharuskan semua daerah dikenai pajak.
Akibatnya ia mewajibkan semua orang untuk melapor kepada statistikawan
terdekat, yang saat itu berperan sebagai pengumpul pajak. Pemimpin lainnya
adalah Wiliam si Penakluk memerintahkan diadakannya survei di seluruh
Inggris untuk tujuan pajak dan tugas kemiliteran. Hasil survei ini
dikumpulkan dalam sebuah buku yang bernama DomesdayBook.
Sejak tahun 1700-an analisis data yang dilakukan secara deskriptif
berdasarkan tabel-tabel frekuensi, rata-rata, dan ragam untuk sampel (contoh)
ukuran besar. Tahun 1800-an merupakan awal penggunaan grafik-grafik
untuk penyajian data, seperti histogram, sejalan dengan penemuan sebaran
(kurva) Normal. Florence Nightengale (1820-1920) adalah seorang perawat
yang terkenal dengan inovasi di bidang ilmu perawatan merupakan pelopor
dalam penyajian data secara grafik. Selama perang Crimean, Nightengale
mengumpulkan data dan membuat sistem pencatatan. Dari data tersebut dapat
 MPDR5202/MODUL 1 1.5

ditentukan tingkat mortalitas yang dapat menunjukkan hasil perbaikan


kondisi kesehatan yang cenderung menurunkan tingkat kematian. Selanjutnya
data tersebut disajikan dalam bentuk grafik yang merupakan suatu inovasi
statistika waktu itu.
Seperti diketahui bahwa statistika berkembang dengan dukungan dari
teori peluang. Dalam sejarahnya teori peluang muncul dari perjudian yang
dikembangkan oleh Pascal dan Fermat pada sekitar abad ketujuhbelas.
Keduanya mengembangkan teori ini berdasarkan pengalaman penjudi
Chevalieerde Me’re’. Penjudi tersebut ingin mengetahui bagaimana pola
pembagian uang taruhan pada suatu perjudian apabila permainannya terpaksa
dihentikan sebelum selesai. Dari surat-menyurat antara kedua pemikir (Pascal
dengan Fermat) inilah kemudian timbul dasar-dasar cabang matematika yang
dinamakan teori peluang (thetheory of probability) pada tahun 1654
(Sunaryo, dkk., tanpa tahun).
Menurut Sunaryo, dkk. (tanpa tahun) dalam statistika deskriptif tidak ada
perbedaan antara data yang diperoleh dari sampel dengan populasinya,
kemudian apa yang dihitung dari sampel digunakan untuk menandai
populasi. Pada taraf selanjutnya orang tidak puas hanya mengumpulkan
angka-angka pengamatan saja. Mereka juga tidak puas bahwa yang diperoleh
dari sampel digunakan untuk mencirikan populasi. Timbulah usaha-usaha
untuk memperbaiki kesimpulan dalam melakukan ramalan-ramalan populasi
berdasarkan angka-angka statistik yang dikumpulkan dari sampel tersebut.
Bagian ilmu yang membahas cara-cara mengambil kesimpulan berdasarkan
angka-angka pengamatan ini dinamakan statistika induktif. Perkembangan
statistik induktif tidak lepas dari pengetahuan mengenai peluang, maka ada
baiknya kita lihat terlebih dahulu sejarah perkembangan ilmu peluang yang
mendasari statistika induktif.
Menurut Steel & Torrie (1995) persamaan kurva normal ini pertama kali
ditemukan oleh deMovrie pada tahun 1733. Sebagaimana temuan suatu teori,
khususnya dalam matematika, Abraham deMovrie juga tidak mengetahui
bagaimana menerapkan penemuannya tersebut pada data hasil percobaan.
Dia hanya menemukan sifat-sifat dari kurva normal tersebut. Karyanya itu
tetap tidak diketahui sampai Karl Pearson menemukannya di perpustakaan
pada tahun 1924. Walaupun demikian, menurut Steel & Torrie (1995) hasil
yang sama dalam penemuan kurva normal ini dikembangkan secara terpisah
oleh dua astronom matematik, yakni Laplace (1749 – 1827) dan Gauss (1777
– 1855). Akhirnya, kurva normal ini dipopulerkan Adolph Quetelet (1796-
1874) pada bermacam-macam data biologi dan sosial.
1.6 Statistika Pendidikan 

Pada abad kesembilanbelas, Charles Lyell mengajukan argumentasi yang


bersifat statistik dalam masalah geologi. Dalam periode 1830 - 1833, Lyell
menerbitkan karya Principles of Geology dalam tiga jilid. Karyanya tersebut
memuat urutan batu-batuan tertier dan sekaligus memberi nama pada masing-
masing batuan. Kemudian ia bersama M. Deshayes, seorang ahli biologi,
melakukan identifikasi dan mendaftar spesies-spesies fosil yang terdapat
dalam satu atau lebih strata, dan mereka meramalkan proporsi jenis-jenis
yang masih hidup di bagian-bagian laut tertentu. Berdasarkan proporsi-
proporsi tersebut mereka memberi nama Pleitosen, Pliosen, Miosen, dan
Eosen. Argumentasi Lyell sesungguhnya bersifat statistika. Namun
sayangnya orang lebih mengenal nama-nama spesiesnya dan melupakan
bagaimana metode yang digunakan oleh Lyell. Tidak ada seorang pun ahli
evolusi geologi menurut Steel & Torrie (1995) yang memikirkan apakah
proses yang terjadi bersifat diskrit, seperti yang digunakannya dalam nama-
nama tersebut, ataukah bersifat kontinu dan dapat dipakai untuk peramalan.
Hal yang sama terjadi juga dalam bidang fisika dan biologi. Banyak
temuan-temuan yang menggunakan argumentasi statistika tetapi yang
menjadi perhatian adalah hasil yang ditemukannya, sementara sifat statistik
dari teknik yang digunakan, serta metodenya dilupakan. Steel & Torrie
(1995) memberi contoh Charles Darwin (1809 – 1882) dengan teori
evolusinya. Dikatakan bahwa Darwin menyusun teorinya sangat dipengaruhi
oleh karya Lyell. Karena ketika dia berlayar dengan menggunakan kapal
Beagle sambil membaca buku karya Lyell. Dan memang terbukti bahwa
karya Darwin sangat bernuansa Biometrika atau statistika, yang berhasil
menumbuhkan antusiasme orang untuk lebih memperdalam ilmu biologi.
Ahli biologi lainnya adalah Mendel yang melakukan penelitian mengenai
hibrida tanaman. Karya dari Mendel tersebut banyak nuansa biometrika atau
statistika.
Temuan Darwin selain mendorong antusiasme ahli biologi juga mampu
memotivasi Karl Pearson, seorang fisika matematika. Dia memandang
perlunya landasan yang lebih kokoh bagi statistika. Hampir setengah abad
Pearson melewatkan waktunya dalam penelitian statistika dengan serius.
Untuk memfasilitasinya ia mendirikan jurnal Biometrika dan sebuah aliran
statistika. Melalui hal tersebut, kajian-kajian statistika menjadi lebih besar.
Kajian-kajian Karl Pearson lebih banyak memperhatikan pada sampel
besar (largesamples). Hal tersebut tidak memuaskan para peneliti lainnya,
salah satunya adalah Willian S. Gosset (1876 – 1937) yang merupakan murid
 MPDR5202/MODUL 1 1.7

Karl Pearson dan bekerja pada perusahaan bir Guienness. Kemampuan


matematika Gosset nampaknya tidak memadai untuk mendapatkan sebaran-
sebaran pasti dari simpangan baku sampel, rasio antara rata-rata sampel
dengan simpangan baku sampel, dan koefisien korelasi (statisitik-statistik
yang banyak diperhatikannya saat itu). Akibatnya, Gosset terpaksa
mendasarkan pada kartu dengan cara mengocok, mengambil, dan kemudian
membuat sebaran frekuensi empiriknya. Artikel dari Gosset dipublikasikan
pada Biometrika tahun 1908dengan menuliskan nama Student sebagai
samaran nama dirinya (Steel &Torrie, 1995). Dari hasil penelitian Gosset
tersebut, banyak uji-uji dalam statistika yang menggunakan dasar distribusi
t-student, sehingga ada istilah yang lazim dikalangan statistikawan dan
peneliti, yakni men-student-kan. Namun demikian, distribusi-t ini secara
matematika juga ditemukan oleh astronom Jerman pada tahun 1875, yakni
Helmert.
Statistikawan yang banyak memberikan kontribusi besar dalam
perkembangan statistika adalah R.A. Fisher (1890 – 1962). Kajiannya banyak
dipengaruhi oleh hasil-hasil dari Karl Pearson dan Student yang banyak
menggunakan prosedur statistika pada penelitian bidang-bidang pertanian,
biologi, dan genetika.
Statistikawan J. Neyman dan E. S. Pearson pada tahun 1936 dan 1938
mengemukakan teori dalam pengujian hipotesis. Teori ini berimplikasi besar
dalam penelitian dan kegunaan statistika secara praktis.

B. RUANG LINGKUP KAJIAN DALAM STATISTIKA

Pada bagian A dijelaskan bahwa pada awalnya statistika digunakan oleh


pemerintah untuk mendata penduduk tentang pekerjaan, pendapatan, dan lain
sebagainya. Kemudian, seiring dengan kebutuhan dan kemampuan berpikir
manusia, melalui bantuan teori statistika berkembang menjadi pengetahuan
suatu prosedur dalam memperoleh, mengolah dan melakukan inferensi. Dari
hal tersebut, nampak bahwa kajian statistika tidak terlepas dari dua hal yakni
menyajikan data sehingga diperoleh gambaran tentang apa yang diteliti, serta
yang kedua memprediksi. Untuk memahaminya perhatikan contoh berikut.
Misalkan pada awal tahun ajaran tepatnya semester ganjil, seorang dosen
Statistika salah satu program studi ingin mengetahui tentang seberapa banyak
mahasiswa di program studi tersebut paham tentang konsep dasar matematika
yang digunakan dalam perkuliahan statistika. Dia ingin mengetahui
1.8 Statistika Pendidikan 

kemampuan awal statistika, serta dia juga ingin mengetahui keragaman


kemampuan mahasiswanya. Hal tersebut sangat penting diketahui agar proses
perkuliahan statistika dapat dilakukan secara optimal. Langkah yang
dilakukannya pada pertemuan pertama perkuliahannya adalah memberikan
tes yang memuat standar kompetensi dasar statistika dan konsep dasar
matematika (aritmetika) yang digunakan dalam mempelajari statistika.
Dengan tes tersebut dia memperoleh gambaran tentang kemampuan konsep
dasar matematika. Kesimpulan yang diperoleh dosen tersebut didasarkan
pada ukuran-ukuran yang diperoleh dari mahasiswa yang mengikuti tes
konsep dasar matematika. Apa yang dilakukan oleh dosen tersebut dalam
statistika disebut dengan statistika deskriptif. Dengan demikian, statistika
deskriptif adalah metode-metode yang berkaitan dengan pengumpulan data
penyajian data sehingga memberikan informasi.
Statistika inferesial mencakup semua metode yang berkaitan dengan
analisis sebagian data (sampel) atau yang sering disebut dengan sampel untuk
digunakan sebagai peramalan atau penarikan kesimpulan mengenai
keseluruhan data induknya (populasi). Statistika inferensial meliputi
pendugaan parameter dan pengujian hipotesis, sehingga diperoleh suatu
kesimpulan yang berlaku umum. Metode ini sering disebut juga metode
induktif, karena kesimpulan ditarik berdasarkan pada informasi dari sebagian
data saja. Pengambilan kesimpulan yang hanya didasarkan pada sebagian
data tersebut memunculkan sifat tidak pasti, memungkinkan terjadinya
kesalahan dalam pengambilan keputusannya, untuk itulah diperlukan
dukungan dari teori peluang.
Di samping itu perlu juga ditambahkan bahwa dalam kajian-kajian
penelitian kita dihadapkan pada pengujian hubungan (relationship) antara
beberapa variabel serta memprediksinya. Misalkan apakah prestasi belajar
siswa ada hubungannya dengan lama belajar siswa di rumah? Jika ada
hubungannya, maka muncul pertanyaan lanjutan, berapa lamakah seorang
siswa harus belajar di rumah agar diperoleh hasil yang baik?Masalah tersebut
berkaitan dengan korelasi dan regresi yang membahas tentang kekuatan
hubungan antara dua peubah atau lebih, serta kemampuan memprediksi suatu
peubah untuk peubah lainnya.
Hasil dari proses statistika yang mungkin memuat suatu kesalahan
memunculkan suatu argumentasi atau pertanyaan “apakah statistika itu
bohong?” sebagaimana dikemukakan oleh Benjamin Disraeli yang dikutip
oleh Minium, dkk. (1993) bahwa ada tiga hal yang memuat kebohongan,
 MPDR5202/MODUL 1 1.9

yakni berbohong/berdusta, mengutuk kebohongan, dan statistika. Apakah


statistika nyata bohongnya? Untuk mengetahui jawabannya, silakan Anda
membaca buku karya Minium, dkk. (1993).
Dari bahasan di atas, maka dalam statistika ada dua analisis yang
dipelajari, yakni statistika deskriptif (descriptive statistics) dan statistika
inferensial (inferential statitistics). Keduanya akan Anda pelajari keseluruhan
modul ini.

C. MEMPELAJARI STATISTIKA

Modul statistika ini tidak bermaksud membuat mahasiswa menjadi


seorang statistikawan profesional. Tujuan dari penulisan dalam modul ini
adalah mendorong pembaca untuk berpikir tertib, runtut, dan jelas, terutama
yang berkaitan dengan pengumpulan dan interpretasi data numerik, serta
menyediakan sejumlah teknik-teknik statistika yang berguna dalam
penelitian, terutama penelitian kuantitatif yang dilaksanakan oleh mahasiswa
dalam program studi pendidikan dasar.
Mungkin untuk mahasiswa program pendidikan dasar di sekolah pasca
sarjana telah pernah mengikuti kuliah sewaktu di S1 (Strata satu), namun
demikian pada umumnya sering kali dipandang bahwa statistika merupakan
cara berpikir yang baru, dan berpikir tentang ketidakpastian. Sebagian
mahasiswa menganggap bahwa belajar statistika merupakan beban mental
sehingga dapat mengganggu emosinya. Hal ini disebabkan adanya rumus-
rumus matematika, serta adanya perhitungan-perhitungan numerik. Untuk
membantu hal tersebut, dalam modul ini pada setiap pengolahan datanya
akan dikenalkan perhitungan-perhitungan melalui program komputer, yakni
SPSS atau excel. Dengan menggunakan bantuan pengolah data tersebut
diharapkan tidak menjadikan mahasiswa takut dalam belajar statistika.
Terakhir penulis kutip dari bukunya Steel & Torrie (1995) bahwa perlu
diketahui bahwa teknik-teknik statistika merupakan alat bagi penelitian.
Penelitian itu tidak hanya dilakukan dalam bidang pendidikan, tetapi juga
dalam bidang genetika, pemasaran, gizi, agronomi, kesehatan, psikologi dan
bidang-bidang lainnya. Jadi bidang penelitian itu sendirilah yang harus
mengisinya dengan aspek “mengapa”-nya suatu penelitian. Hal ini sering
dilupakan dan pemakai statistika tergoda untuk melupakan bahwa mereka
harus berpikir, bahwa statistika tidak dapat berpikir untuk mereka. Walaupun
demikian, statistikawan dapat membantu para peneliti untuk merancang
1.10 Statistika Pendidikan 

percobaan mereka dan mengevaluasi secara objektif data numerik yang


diperolehnya. Dengan demikian, tujuan dari modul ini adalah membekali
Anda, sebagai peneliti, dengan alat statistika yang bermanfaat bagi keperluan
penelitian.
Secara rinci, Kerlinger (2006) mengemukakan 4 kegunaan dari statistika
sesuai dengan definisi yang dikemukakannya. Menurutnya statistika adalah
teori dan metode analisis data kuantitatif yang diperoleh dari sampel-sampel
observasi, dalam rangka menelaah dan membandingkan sumber-sumber
keragaman fenomena, membantu pembuatan keputusan untuk menerima atau
menolak relasi yang dihipotesiskan antara satu fenomena dengan lainnya, dan
menolong penyusunan kesimpulan yang andal dari pengamatan-pengamatan
empiris.
Dari definisi tersebut, Kerlinger merinci kegunaan dari statistika sebagai
berikut.
1. Kegunaan yang paling umum dan tradisional: meringkas data dalam
kuantitatif besar ke dalam bentuk yang mudah dipahami dan ditangani.
Misalnya, kita mustahil mengingat 100 skor di luar kepala. Akan tetapi
bila mean (rata-rata) atau simpangan baku telah dihitung, maka skor-skor
itu akan mudah dan cepat ditafsirkan oleh orang yang terlatih.
2. Membantu kita menelaah atau mengkaji populasi dari sampel-sampel.
Menurutnya, kegunaan ini telah demikian luas sehingga tidak usah
dibicarakan lagi, apalagi kita telah mempelajari ihwal populasi dan
sampel.
3. Membantu pembuatan keputusan. Misalkan seorang psikolog pendidikan
perlu mengetahui manakah di antara ketiga metode mengajar yang paling
membantu proses belajar dengan biaya yang paling rendah. Penggunaan
statistika akan membantunya mengetahui hal tersebut. Penggunaan
statistika semacam ini boleh dikatakan baru dalam perbandingannya
dengan penggunaan dan kegunaan lainnya.
4. Membantu pembuatan inferensi yang andal berdasarkan data observasi.
Ini erat berkaitan dengan kegunaannya untuk membantu membuat
keputusan di antara sejumlah hipotesis. Suatu inferensi adalah proporsi
atau generalisasi yang diperoleh melalui penalaran dari proporsi-proporsi
lain atau dari petunjuk yang kuat. Dalam pengertian umum, inferensi
adalah kesimpulan berdasarkan penalaran. Misalkan kita dapat menarik
sejumlah inferensi dari statistika, kita menyimpulkan “bahwa metode A
dan metode B sungguh-sungguh berbeda dalam meningkatkan hasil
 MPDR5202/MODUL 1 1.11

belajar”. Kita simpulkan dari petunjuk kuat atau bukti bahwa nilai t hitung
lebih besar dari ttabel dengan tingkat signifikansi yang dipilih. Atau kita
punya bukti kuat hubungan antara dua variabel dengan bukti adanya
r = 0,87 (misalnya). Lebih jauh Kerlingger memberikan dua ciri dari
statistika inferensi, yakni pertama inferensi dibuat dari sampel ke/untuk
populasi. Ketika kita berkata bahwa variabel A berelasi dengan variabel
B karena bukti statistikanya ialah r = 0,87, kita membuat inferensi bahwa
karena dalam sampel ini r = 0,87, maka r = 0,87 (atau mendekati 0,87)
terjadi juga dalam populasi di mana sampel tersebut diambil. Artinya
kita melakukan inferensi dengan memperhatikan populasinya. Jenis
inferensi kedua digunakan apabila peneliti tidak menaruh perhatian pada
populasinya, atau bila perhatian hanya bersifat sekunder. Misalnya
peneliti dalam bidang pendidikan tengah mengkaji akibat yang diduga
timbul dari relasi antara anggota-anggota dinas pendidikan dan pimpinan
administrasi pendidikan di satu pihak, dengan motivasi dan semangat
guru di pihak lain. Hipotesis penelitiannya adalah jika hubungan antara
anggota-anggota dinas pendidikan dan pimpinan administrasi pendidikan
itu kurang baik, maka semangat dan motivasi guru akan rendah. Peneliti
hanya berminat atau berkepentingan untuk menguji hipotesis tersebut
dalam wilayah X. Kajian yang dilakukannya memperoleh hasil statistika
yang mendukung hipotesis penelitiannya. Namun demikian, misalnya,
jika moral guru lebih rendah dalam sistem A daripada dalam sistem B
dan sistem C. Dia menginferensi dari petunjuk statistika mengenai
perbedaan antara sistem A di satu pihak dengan sistem B dan C di pihak
lain, bahwa proporsi hipotesis tersebut betul (di wilayah X). Tetapi
terbuka kemungkinan bahwa minat dan pembahasannya hanya terbatas
pada wilayah X itu saja.

Hampir sama dengan Kerlingger, Sugiyono (2008) juga memberikan


gambaran tentang peranan statistika dalam penelitian, yakni sebagai berikut:
1. Alat untuk menghitung besarnya anggota sampel yang diambil dari suatu
populasi. Dengan demikian jumlah sampel yang diperlukan dapat
dipertanggungjawabkan.
2. Alat untuk menguji validitas dan reliabilitas instrumen. Sebelum
instrumen digunakan untuk penelitian, maka harus diuji validitas dan
reliabilitasnya terlebih dahulu.
1.12 Statistika Pendidikan 

3. Teknik-teknik untuk menyajikan data, sehingga data lebih komunikatif.


Teknik-teknik penyajian data ini antara lain: tabel, gambar/diagram, dan
grafik.
4. Alat untuk analisis data seperti menguji hipotesis penelitian yang
diajukan. Dalam hal ini uji statistika yang digunakan sangatlah banyak,
dan peneliti perlu memilih uji mana yang paling tepat.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!
1) Jelaskan apa yang dimaksud dengan statistika!
2) Jelaskan perbedaan statistika deskriptif dan inferensial!
3) Nyatakan apakah pernyataan-pernyataan berikut ini termasuk dalam
statistika deskriptif atau inferesial. Dan berikan alasan yang mendasari
jawaban Anda!
a) Akibat penurunan produksi minyak oleh negara-negara penghasil
minyak, maka diramalkan harga minyak akan menjadi dua kali lipat
pada tahun yang akan datang.
b) Sekurang-kurangnya 5% dari semua kebakaran yang dilaporkan
tahun lalu di sebuah kota tertentu diakibatkan oleh tindakan sengaja
orang-orang yang tidak bertanggung jawab.
c) Sebanyak 60% di antara pasien yang menerima obat tertentu
ternyata kemudian mendapat efek samping.
d) Dengan mengasumsikan bahwa kerusakan akibat musim kemarau
yang lalu pada tanaman mangga adalah kurang dari 15%, maka
diramalkan kenaikan harganya di akhir tahun nanti tidak akan lebih
dari Rp 500 per kilogramnya.
e) Dalam satu survei yang dilakukan oleh pemerintahan Kota A
diketahui bahwa sebagian besar warga kota menyetujui didirikannya
Pusat Tenaga Nuklir.
4) Jelaskan kegunaan statistika dalam penelitian! berikan contoh masing-
masing kegunaan dan peran-peran tersebut!
 MPDR5202/MODUL 1 1.13

Petunjuk Jawaban Latihan

1) Statistika adalah pengetahuan yang berhubungan dengan cara-cara


pengumpulan data, pengolahan atau penganalisisannya dan penarikan
kesimpulan berdasarkan kumpulan data dan penganalisisan yang
dilakukan.
2) Statistika deskriptif adalah analisis dan interpretasi data yang diperoleh
dari sampel. Sedangkan statistika inferensial adalah analisis dan
interpretasi kondisi populasi berdasarkan data sampel.
3) a) Inferensial, b) deskriptif, c) deskriptif, d) inferensial, e) inferensial.
4) Statistika dalam penelitian mempunyai banyak peran dan kegunaan, di
antaranya 1) sebagai alat komunikasi antar peneliti, 2) sebagai alat dalam
menjawab permasalahan.

R A NG KU M AN

1. Ada banyak pengertian tentang statistika, di antaranya 1) Statistika


adalah logika atau akal sehat (commonsense) yang disertai dengan
prosedur-prosedur aritmetika. Logika memberikan metode yang
selanjutnya dipakai untuk mengumpulkan dan menentukan data
yang diperlukan. Sedangkan aritmetika, bersama-sama dengan tabel
tertentu, menghasilkan sesuatu yang dipakai sebagai dasar penarikan
kesimpulan dan mengukur ketidakpastiannya. 2) Statistika adalah
pengetahuan yang berhubungan dengan cara-cara pengumpulan
data, pengolahan atau penganalisisan data,serta penarikan
kesimpulan berdasarkan kumpulan data dan penganalisisan yang
dilakukan.
2. Sebagai sebuah pengetahuan, statistika, di awal penggunaannya oleh
pemerintah adalah untuk mendata penduduknya berdasarkan
kategori-kategori yang diinginkan, misalnya pendapatan, untuk
menarik pajak dari masyarakat.
3. Karl Pearson memberikan pengaruh yang besar dalam
perkembangan statistika yang dimulai dengan memberikan
pemaknaan terhadap kurva normal yang sebelumnya telah
ditemukan oleh deMovrie.
4. Perkembangan statistika banyak didukung oleh para peneliti dalam
berbagai bidang ilmu, misalnya Lyell, Charles Darwin, Mendel, dan
lain sebagainya yang telah mendorong para statistikawan untuk
mengembangkan landasan kokoh dan jelas dalam statistika.
1.14 Statistika Pendidikan 

TES F OR M AT IF 1

Jawablah pertanyaan berikut dengan ringkas dan jelas!

1) Dalam penelitian kuantitatif, seorang peneliti mesti menggunakan


statistika baik statistika deskriptif maupun inferensial. Seiring dengan
perkembangan teknologi informatika, seorang peneliti tentu akan dengan
mudah dalam melakukan proses perhitungan. Berikan argumentasi,
apakah masih diperlukan seorang peneliti untuk mempelajari statistika?
2) Kesimpulan yang kita lakukan dalam penelitian dengan menggunakan
statistika akan lebih dapat dipertanggungjawabkan jika pengumpulan
datanya dilakukan secara sensus dan bukan secara sampling. Berikan
argumentasi Anda!
3) Di suatu daerah perumahan baru tercatat 12 rumah berbentuk Kolonial, 4
Tudor, 5 pedalaman Prancis, dan 9 bentuk rancangan kontemporer.
Nyatakan kesimpulan berikut, yang ditarik dari data di atas, termasuk
dalam statistika deskriptif atau inferensial.
a) Di daerah pemukiman baru lebih banyak dibangun rumah bentuk
Kolonial daripada rancangan-rancangan lainnya.
b) Setelah bentuk Kolonial, penghuni di sini menyenangi rancangan
kontemporer.
c) Bentuk Kolonial melebihi Tudor dengan perbandingan 3 banding 1.
d) Sekurang-kurangnya 30% di antara semua rumah yang baru
dibangun mengambil rancangan kontemporer.
e) Jika kecenderungan yang ada ini terus berlanjut, perusahaan real
estate membangun lebih banyak rumah kontemporer daripada rumah
Kolonial dalam lima tahun mendatang.
4) Menurut Kerlinger, statistika inferensi merupakan proses pengambilan
kesimpulan dengan penalaran. Berikan penjelasan tentang hal tersebut
disertai contohnya!
 MPDR5202/MODUL 1 1.15

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 25. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut
untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan
Belajar 1.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang
belum dikuasai.
1.16 Statistika Pendidikan 

Kegiatan Belajar 2

Pengamatan

P engamatan adalah bahan mentah para peneliti. Dalam melakukan


pengamatan, kita akan memperoleh berbagai keterangan atau ilustrasi
mengenai sesuatu hal yang berbentuk kategori, misalnya: rusak, baik, senang,
puas, berhasil, gagal, atau dapat juga berupa bilangan, misalnya tinggi badan
160 cm, berat badan 65 kg, dan lain-lainnya. Kesemuanya itu dinamakan
data (Sudjana, 1989).
Kata data sendiri dalam bahasa Inggris merupakan bentuk jamak dari
datum. Dalam bahasa Indonesia, diartikan “bahan-bahan” atau “keterangan-
keterangan”. Dari sana kita dapat melihat bahwa memang kata “data”
bermakna jamak. Dalam statistika sendiri pembahasan tentang data dapat
ditinjau dari berbagai bentuknya apakah bilangan atau bukan. Jika berbentuk
bilangan disebut data kuantitatif, dan jika bukan bilangan maka disebut
kualitatif. Jika menurut sumbernya, dikenal istilah data intern dan data
ekstern. Misalnya guru mencatat semua hasil pencapaian siswa baik kognitif;
tes fomatif dan sumatif, atau afektif, dan psikomotornya. Data yang diperoleh
guru tersebut merupakan data intern. Contoh lain, kepala sekolah mencatat
aktivitas pendidikan di sekolahnya melalui: keadaan tenaga pendidik dan
kependidikan, keuangan, pencapaian siswa dalam lomba, dan lain
sebagainya. Data yang diperoleh kepala sekolah tersebut merupakan data
intern. Sebaliknya, sebagai pembanding, dia memerlukan data dari sumber
lain di luar sekolahnya. Data demikian merupakan data ekstern.
Data ekstern menurut Sudjana (1989) dibagi menjadi data ekstern primer
atau disingkat data primer, dan data ekstern sekunder atau disingkat data
sekunder. Jika data dikeluarkan dan dikumpulkan oleh badan yang sama,
maka diperoleh data primer. Dalam hal lainnya merupakan data sekunder.
Dalam proses pengumpulan data, misalkan peneliti atau seseorang
memperoleh data dan belum pernah mengalami pengolahan apapun, data
yang demikian disebut data mentah.
Terdapat beberapa syarat yang harus dipenuhi oleh kita dalam
mengumpulkan data. Sudjana (1989) menyebutnya data yang sahih dan
kebenarannya dapat diandalkan. Sedangkan Sugiyono (2008) menuliskan tiga
kriteria yang harus dipenuhi dari data, yakni valid, reliabel, dan objektif.
Valid menunjukkan derajat ketepatan, yaitu ketepatan antara data yang
 MPDR5202/MODUL 1 1.17

sesungguhnya terjadi pada objek dengan data yang dapat dilaporkan oleh
peneliti. Misalnya ketika guru menghitung tingkat ekonomi orang tua siswa
di suatu sekolah. Jika terdapat 100 orang siswa dengan orang tuanya masuk
dalam kategori ekonomi miskin, maka dilaporkan juga 100 orang, tidak
ditambah atau dikurangi. Jika dilakukan penambahan atau pengurangan,
maka datanya menjadi invalid atau tidak valid. Lainnya misalkan capaian
hasil ulangan siswa. Jika siswa A mendapat hasil tes 50 dilaporkan 50, dan
jika siswa mendapat skor 100 juga dilaporkan 100. Artinya tidak ditambah
dan dikurangi. Reliabel berkaitan dengan derajat keajegan atau konsistensi,
yaitu konsisten dalam interval waktu tertentu. Misalnya, jika data yang
terkumpul dari sumber data kemarin jumlahnya 100 siswa dengan ekonomi
orang tuanya miskin, maka sekarang atau besok juga tetap menyatakan 100
orang. Sedangkan objektif berkaitan dengan derajat persamaan pandangan
atau persepsi antar orang. Jika satu guru telah mendata banyak siswa dari
orang tua miskin ada 100 orang, maka guru lainnya pun memperoleh hasil
yang sama.
Berikutnya akan dibahas lebih rinci tentang data, yang dimulai dengan
peubah dan jenis-jenisnya.

A. VARIABEL DAN JENIS-JENISNYA

Pengamatan merupakan bahan mentah para peneliti. Agar statistika dapat


diterapkan, maka hasil pengamatan-pengamatan yang dilakukan oleh peneliti
haruslah berupa bilangan. Dalam penelitian-penelitian pendidikan, bilangan-
bilangan hasil pengamatan tersebut contohnya adalah hasil ulangan siswa,
lama waktu belajar, motivasi belajar, dan lain sebagainya. Dalam kedokteran,
misalnya waktu yang diperlukan untuk pulih kembali setelah diberi perlakuan
tertentu. Dalam bidang industri, misalnya banyaknya produk cacat dari suatu
produksi barang tertentu. Bilangan-bilangan dari hasil pengamatan tersebut
menyusun data.
Berdasarkan contoh-contoh di atas, ada satu kesamaan tentang data,
yakni keragaman. Misalnya, hasil belajar siswa tentu saja berupa bilangan
sesuai dengan skala yang digunakan dalam tes yang diberikan guru. Jika guru
menggunakan skala 10, maka kemungkinan-kemungkinan dari hasil ulangan
siswa tersebut adalah bilangan dari 0 sampai dengan 10. Juga waktu lama
pemulihan pada bidang kedokteran, mungkin 1 menit, 1,6 menit dan mungkin
lama waktu lainnya. Dengan demikian, salah satu ciri dari data adalah
keragaman. Ciri yang menandakan keragaman peubah disebut variabel acak.
1.18 Statistika Pendidikan 

Untuk memahami tentang variabel acak atau random variabel


perhatikanlah pernyataan berikut:
1. Tinggi Ahmad 165 cm
2. Mira berambut hitam
3. Berat karung beras sekitar 100 kg
4. Hasil ulangannya baik

Pada contoh pertama di atas, kita punya data “Tinggi Ahmad 165 cm”,
jika kita mengukur tinggi badan yang lainnya, misal Andi, maka Andi akan
mempunyai ukuran tinggi juga, dengan kemungkinan ukurannya sama
dengan Ahmad, dapat juga berbeda, tetapi yang jelas Andi mempunyai
ukuran tinggi badan tertentu. Demikian juga untuk “Mira berambut hitam”,
jika kita amati lagi nama lainnya, misalnya Ani, mungkin rambutnya hitam,
pirang, dan lain sebagainya. Untuk itulah tinggi badan, jenis rambut, berat
karung beras, dan hasil ulangan mempunyai ciri sama yakni keragaman. Ciri
yang menunjukkan keragaman disebut peubah atau variabel acak. Dalam
beberapa buku, peubah acak sering kali dilambangkan dengan X atau Y.
Misalkan pengamatan kita tetapkan lambang X sebagai peubah acak,
dan Xi menyatakan pengamatan ke-i. Jika pada suatu saat kita melakukan
pengamatan khusus, kita ganti i dengan bilangan tertentu. Misalkan dalam
suatu kelompok yang terdiri dari 5 siswa mempunyai hasil ulangan akhir
semester mata pelajaran matematika masing-masing 45, 75, 80, 70, dan 75.
Jika X menyatakan hasil ulangan, maka X1  45, X 2  75, X 3  80, X 4  70,
dan X 5  75. Secara umum, jika kita mempunyai segugus n pengamatan
dapat dinyatakan dengan X1 , X 2 , , X n . Dalam hal ini, X n merupakan
pengamatan terakhir, indeks atau subskrip n menyatakan banyaknya
pengamatan seluruhnya, sedangkan tiga titik antara X 2 dan X n menyatakan
pengamatan lainnya, bila ada.
Secara umum terdapat dua jenis peubah acak, yakni kuantitatif dan
kualitatif. Peubah acak kuantitatif merupakan peubah hasil pengukuran yang
mempunyai sifat urutan secara alami. Misalnya tinggi badan, berat badan,
hasil ulangan siswa, kecemasan belajar, motivasi belajar, dan lain
sebagainya. Hasil pengamatan dari peubah kuantitatif ini dapat
dikelompokkan atas kontinu dan diskrit.
Variabel kontinu adalah variabel yang pada suatu selang tertentu dapat
mengambil sebarang nilai. Tinggi dan berat badan merupakan contoh yang
dipahami oleh kita, bahwa tinggi badan dapat diukur sampai dengan 1/10 kg,
 MPDR5202/MODUL 1 1.19

dan bahkan mungkin sudah ada yang sampai 1/100, 1/1000 satuan terdekat,
bergantung alat ukurnya. Dengan demikian, pengukuran dalam peubah
kontinu bergantung dari alat ukur yang digunakan.
Variabel acak diskrit merupakan peubah yang mungkin mempunyai
batas pemisah antara nilai-nilainya. Jika variabel kontinu berupa bilangan riil,
maka peubah diskrit berupa bilangan bulat, bahkan sebagian besar dalam
bilangan cacah, karena dihasilkan dari mencacah. Misalnya, banyaknya
rumah dalam tiap RT di suatu kelurahan, banyaknya siswa yang memperoleh
beasiswa di setiap sekolah dasar di suatu kecamatan, banyaknya bayi lahir di
setiap kelurahan. Dalam data diskrit ini, jarak antara dua nilai berurutan tidak
harus sama dengan satu. Misalkan rata-rata banyak titik yang muncul dari
dua dadu yang diundi. Nilai yang mungkin berkisar dari 1 sampai 6 dengan
kenaikan sebesar setengah.
Variabel kualitatif adalah variabel yang tidak memungkinkan dilakukan
pengukuran secara numerik. Pengamatannya dilakukan dengan cara
memasukkan suatu individu (objek) yang diamati ke dalam satu dari
beberapa kategori yang saling terpisah. Pengamatan-pengamatan tersebut
tidak dapat diurutkan, hanya diklasifikasi dan kemudian dicacah. Misalnya
warna mata penduduk di suatu daerah tertentu. Kajian lebih rinci dari skala
pengukuran variabel kuantitatif dan kualitatif dibahas pada pasal-pasal
berikutnya dalam Kegiatan Belajar 2 ini.
Bagaimana jika sesuatu yang ditetapkan dalam penelitian kita tidak
mempunyai keragaman. Misalnya dalam penelitian tentang situasi sekolah
kebidanan berdasarkan gender (jenis kelamin), pastilah semua siswanya
berjenis kelamin perempuan. Apabila kita meneliti jenis kelamin di sekolah
kebidanan, maka tidak akan ada keragaman. Dengan demikian, jenis kelamin
tersebut bukan peubah, tetapi konstanta.

B. SKALA PENGUKURAN

Sebagaimana telah dijelaskan pada bagian A kegiatan belajar di atas


bahwa data diperoleh dengan cara pengamatan. Sedangkan Sudjana (1989)
lebih rinci menjelaskan bahwa data diperoleh dengan cara mengukur dan
menghitung. Hasil pengukuran atau perhitungan tidaklah mempunyai sifat
numerik yang sama. Misalkan antara hasil pengukuran berat benda, berat
badan dan nilai ulangan siswa. Jika berat badan anak A adalah 35 kg,
sedangkan orang tuanya 70 kg, maka berat badan orang tua tersebut dua kali
1.20 Statistika Pendidikan 

berat badan anaknya. Juga selisihnya akan sama antara dua orang yang
beratnya 35kg dengan 45kg, dengan dua orang yang beratnya 65 kg dengan
75kg, yakni 10 kg. Berbeda dengan nilai mahasiswa dalam skala 5, yakni A =
5, B = 4, C = 3, D = 1, dan E = 0. Antara seorang mahasiswa yang
memperoleh nilai A pada mata kuliah statistika, dengan mahasiswa lainnya
mendapat nilai C, tidak berarti bahwa kemampuan mahasiswa yang
memperoleh C itu setengah dari kemampuan mahasiswa yang memperoleh
A. Untuk membantu memperjelasnya, seorang ahli psikologi S. S. Stevens
tahun 1946 telah mengidentifikasi dan mengklasifikasi hasil pengukuran
dalam empat skala pengukuran yang berbeda, yakni skala nominal, ordinal,
interval, dan rasio. Perlu ditekankan juga untuk diketahui bahwa skala
pengukuran dari hasil pengamatan kita akan memberi dampak pada
pemilihan teknik statistika yang digunakan dalam mengolahnya. Oleh karena
itu, Anda diharapkan dapat memahaminya dengan baik.

1. Skala Nominal
Misalkan kita melakukan pengamatan terhadap siswa kita berdasarkan
jenis kelamin (gender), suku, dan agama. Kategori-kategori tersebut termasuk
dalam variabel kualitatif atau kategorial. Beberapa kategori dari suatu
variabel sebagaimana contoh tersebut dinamakan skala nominal (yang berasal
dari kata name).
Dalam skala nominal, kategori-kategorinya harus saling lepas (mutallly
exlusive) dan lengkap (exhaustive). Mutually exlusive maksudnya satu
pengamatan tidak akan jatuh pada lebih dari satu kategori, sedangkan
mutually exhaustive dimaksudkan bahwa pengakategorian dipandang cukup
untuk semua kemungkinan dari hasil pengamatan. Sebagai contoh,
pengamatan jenis kelamin siswa, setiap siswa hanya mempunyai satu jenis
kelamin, laki-laki saja atau perempuan saja, sehingga pengkategorian jenis
kelamin saling lepas. Kemudian, tidak mungkin ada anak yang tidak termuat
dalam jenis kelamin (laki-laki atau perempuan), dengan demikian
pengkategorian telah cukup lengkap mengakomodir semua kemungkinan dari
objek yang diamati. Lain lagi jika kita melakukan pengamatan dengan
pabrikan mobil dengan kategori Astra motor, Honda, Suzuki, Toyota.

2. Skala Ordinal
Data dengan skala ordinal memiliki kualitas yang sama dengan skala
nominal, tetapi lebih maju dalam kategorinya yakni dapat diberi peringkat
 MPDR5202/MODUL 1 1.21

(ranked) atau diberi urutan (ordered) dari tingkat yang tinggi ke rendah atau
sebaliknya. Contohnya dalam tingkat kelas, apakah seorang siswa SD kelas I,
kelas II, kelas III, Kelas IV, kelas V atau kelas VI. Siswa kelas I tentu lebih
rendah dari siswa kelas II, dan seterusnya. Dengan demikian, seseorang tidak
hanya dapat digolongkan dalam satu dan hanya satu kategori, tetapi juga
dapat mengurutkan kategori-kategori tersebut.
Perlu Anda ketahui bahwa dalam skala ini tidak ada titik nol yang
sebenarnya atau sejati, yang artinya tidak dapat dikatakan bahwa siswa kelas
III merupakan tiga kali lebih tinggi dari siswa kelas I. Kita hanya dapat
mengatakan bahwa siswa kelas III lebih tinggi daripada siswa kelas I.
Beberapa contoh lain dari skala ordinal di antaranya kelas sosial di
masyarakat, angket dengan pengukuran yang dimulai dari “sangat tidak
setuju ke sangat setuju” atau sebaliknya.

3. Skala Interval
Skala pengukuran interval lebih maju dibandingkan dengan ordinal,
yakni jarak (interval) yang pasti antar kategori-kategori diketahui. Skala ini
sering juga disebut dengan skala equal-interval. Sebagai contoh dalam
pengukuran suhu udara dikenal beberapa jenis, yakni Celcius, Fahrenheit,
Reamur, dan Kelvin. Peningkatan suhu udara dari 00 ke 100celcius, sama
dengan peningkatan dari 200 ke 300Celcius, yakni meningkat 100Celcius.
Ukuran yang membatasi pengukuran suhu udara adalah tidak adanya batasan
bermakna yang berkaitan dengan perbandingan antara dua pengukuran.
Misalkan diberikan hasil pengukuran dalam derajat Celcius: 0 0 , 500, dan
1000. Cobalah Anda bayangkan apakah 1000 C dua kali lebih panas daripada
500 C? bagaimanapun nilai nol derajat dalam skala ini adalah bentuk
sederhana sebagai referensi bagi titik beku air dan tidak berakibat bahwa
tidak ada panas (heat). Untuk itulah, tidak bisa dimaknai bahwa temperatur
pada 1000 C dua kali lebih panas daripada 500C atau kenaikan suhu dari 900 C
menjadi 990C adalah 10%.

4. Skala Rasio
Skala pengukuran rasio memuat semua sifat-sifat pada skala interval dan
mempunyai tambahan yakni “ada nilai nol mutlak”. Di atas telah diketahui
bahwa pengukuran suhu dalam derajat celcius tidak punya sifat
kesebandingan dan nilai nol mutlak. Pengukuran suhu lainnya adalah derajat
Kelvin. Pengukuran dalam derajat Kelvin mempunyai nol mutlak, titik yang
1.22 Statistika Pendidikan 

menentukan keberadaannya adalah suatu bahan atau zat kimia yang tidak
memberi isyarat adanya pergerakan molekul (no molecular motion) dan
akibatnya tidak ada panas. Dengan demikian, 1000Kelvin dua kali lebih panas
daripada 500Kelvin (pada derajat Celcius 1000 C lebih panas 1,15 kali
dibandingkan dengan 500 C). Contoh lain dari skala pengukuran rasio adalah
pengukuran panjang, berat, dan waktu yang digunakan. Perbedaan antara 40
cm dengan 41 cm sama dengan perbedaan antara 80 cm dengan 81 cm, juga
80 cm dua kali lebih panjang dibandingkan dengan 41 cm.
Pemahaman tentang skala pengukuran yang hierarkis ini sangat penting
dalam statistika. Skala pengukuran nominal mempunyai informasi yang
paling sedikit, karena dalam pengkatagoriannya kita hanya memasukkan
objek ke dalam kategori-kategori saja, dan hanya satu kategori untuk setiap
subjek. Sedangkan pada skala pengukuran ordinal, kita sudah dapat
melakukan pengurutan subjek-subjek berdasarkan kategorinya. Kedua skala
pengukuran, nominal dan ordinal, tidak dapat memberlakukan operasi
matematis. Misalkan, jika kita menetapkan bahwa 1 kategori untuk laki-laki
dan 2 untuk kategori perempuan, maka tentu kita tidak dapat menjumlahkan
1 dengan 2, karena akan muncul angka baru yang tidak ada dalam kategori
tersebut.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!
1) Jelaskan istilah berikut dan lengkapi dengan contohnya!
a. Data statistik
b. Data kuantitatif
c. Data kualitatif
d. Data intern
e. Data ekstern
2) Manakah berikut ini yang merupakan data diskrit dan kontinu!
a. Banyaknya siswa di SD A ada 130 orang.
b. Luas halaman sekolah SD A 250 m2.
c. Data hasil ulangan yang diberikan oleh guru.
d. Berat badan siswa kelas V di SD A.
e. Gaji para karyawan di SD A.
f. Tingkat ekonomi orang tua siswa di SD A.
 MPDR5202/MODUL 1 1.23

3) Anggap bahwa barisan bilangan berikut merupakan skala interval: 1, 2,


3, 4,..., 19,20.
a. Jika setiap bilangan kita tambahkan dengan 10, apakah skalanya
masih tetap interval? Jelaskan!
b. Jika setiap bilangan di atas dikali dengan 10, apakah skalanya masih
tetap interval? Berikan penjelasan!

Petunjuk Jawaban Latihan

1) Penjelasan dari masing-masing istilah


a. Ukuran data yang diperoleh dari sampel
b. Data hasil pengukuran yang mempunyai sifat urutan secara alami.
c. Data berbentuk kualitas
d. Data yang diolah diperoleh secara langsung dari lapangan
e. Data yang diolah diperoleh dari hasil pengukuran lembaga atau
penelitian lain
2) a) Diskrit, b) kontinu, c) kontinu, d) kontinu, e) kontinu, f) diskrit
3) a) Interval,
b) Interval

R A NG KU M AN

1. Data merupakan bentuk jamak dari datum yang diperoleh melalui


pengamatan dalam bentuk pengukuran dan perhitungan.
2. Data harus memenuhi tiga kriteria, yakni valid, reliabel dan objektif
3. Data yang berbentuk bilangan disebut data kuantitatif. Dari data
kuantitatif ini ada dua jenis, yakni diskrit dan kontinu. Data yang
tidak berbentuk bilangan disebut data kualitatif
4. Terdapat empat jenis skala pengukuran dari data, yakni nominal,
ordinal, interval dan rasio.

TES F OR M AT IF 2

Jawablah pertanyaan berikut dengan ringkas dan jelas!


1) Berikan suatu ilustrasi untuk memudahkan memperoleh informasi dari
kondisi data yang valid dan reliabel, tidak valid dan tidak reliabel, tidak
valid tetapi reliabel, serta tingkat validitas dan reliabilitas yang cukup!
1.24 Statistika Pendidikan 

2) Misalkan Anda ingin mengetahui informasi tentang waktu belajar siswa


di rumah. Data yang dikumpulkan adalah rata-rata waktu lama belajar
per hari. Apakah pengamatan yang Anda termasuk pada perhitungan
atau pengukuran? Termasuk pada skala jenis apa data yang terkumpul?
berikan alasan!
3) Klasifikasikan peubah-peubah berikut sebagai kuantitatif, kualitatif,
kontinu, atau diskrit: Warna mata, banyak serangga, banyaknya
kesalahaan per murid dalam suatu perlombaan mengeja kata, kilometer
ban sampai bocor yang pertama, waktu yang diperlukan antara dua
pengisian pulpen dalam pengisian penggunaan biasa, hasil jagung per
petak, banyaknya anak yang lahir di rumah sakit terdekat pada hari tahun
baru, hasil yang mungkin dari pengundian 50 keping mata uang,
banyaknya ikan di suatu kolam.
4) Berikan contoh data dengan skala pengukuran nominal dan ordinal!
Berikan alasan mengapa keduanya dikategorikan pada jenis skala
tersebut!

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang


terdapat di bagian akhir modul ini. Masing-masing soal mempunyai skor 25.
Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut untuk
mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 2.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan Kegiatan Belajar 3. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 2, terutama bagian yang
belum dikuasai.
 MPDR5202/MODUL 1 1.25

Kegiatan Belajar 3

Konsep Dasar Matematika Pendukung

A. NOTASI SIGMA

Dalam statistika sering kali kita dihadapkan untuk melakukan


penjumlahan bilangan yang banyak. Misalnya kita diminta menentukan rata-
rata skor hasil ulangan formatif siswa, menentukan variasi usia siswa sekolah
dasar, atau mungkin kita ingin mengetahui berapa kali sisi muka muncul
apabila tiga koin mata uang dilemparkan beberapa kali.
Perhatikanlah suatu percobaan yang mengamati Kartu Menuju Sehat
(KMS) yang menunjukkan perkembangan berat badan bayi selama 1 bulan.
Misalkan tercatat berat badan bayi tersebut dalam kilogram adalah 3,1; 3,3;
3,8; 4,2; 4,0 dan 4,5. Jika nilai pertama kita lambangkan dengan x1 , kedua
dengan x2 , ketiga dengan x3 , keempat dengan x4 , kelima dengan x5 , dan
keenam dengan x6 , maka kita dapat menuliskan bahwa x1  3,1 , x2  3,3 ,
x3  3,8 , x4  4,2 , x5  4,0 dan x6  4,5 .
Dengan menggunakan notasi huruf Yunani (sigma kapital) untuk
menyatakan penjumlahan, maka kita dapat menuliskan jumlah enam
perubahan berat badan bayi dalam enam bulan tersebut adalah sebagai
berikut.
6

x
i 1
i

Dengan dibaca sebagai penjumlahan xi , i dari 1 sampai 6. Bilangan 1


merupakan batas bawah dan 6 batas atas indeks untuk penjumlahan. Dengan
demikian
6

x
i 1
i  x1  x2  x3  x4  x5  x6

 3,1  3,3  3,8  4, 2  4, 0  4,5


 22,9
1.26 Statistika Pendidikan 

Begitu juga jika


4

x
i2
i  x2  x3  x4

 3,3  3,8  4, 2
 11,3
n
Secara umum, lambang i 1
berarti kita menggantikan i – yang berada di

belakang lambang penjumlahan- dengan 1, 2, dan seterusnya sampai dengan


n, kemudian menjumlahkan suku-sukunya. Secara umum dapat dituliskan
bahwa
n

a i 1
i  a1  a2   an

Indeks i dalam aturan tersebut bisa saja dengan indeks lain, seperti j, k, l, dan
lainnya. Dengan demikian,
n n

a  a
i 1
i
j 1
j

Contoh:
Misalkan diketahui x1  2, x 2  5, x3  1, x4  7, dan x5  11 , maka

x
i 1
i  2  5  (1)  7  11  24
5

x
i 1
2
i  22  52  (1) 2  7 2  112  4  25  1  49  121  200
2
 5 
  xi   24  576
2

 i 1 

Untuk memudahkan perhitungan dalam notasi sigma biasnya digunakan


dalil-dalil atau sifat-sifat dalam operasi notasi sigma. Sifat-sifat dalam notasi
sigma di antaranya adalah sebagai berikut.

Dalil 1
Penjumlahan dari jumlah dua atau lebih variabel sama dengan jumlah
masing-masing penjumlahannya.
 MPDR5202/MODUL 1 1.27

n n n n

 x  y
i 1
i i  zi    xi   yi   zi
i 1 i 1 i 1

Bukti:
Dengan cara menguraikan dari notasi sigma dan mengelompokkan kembali,
kemudian menggunakan sifat pengelompokan pada operasi bilangan, maka
diperoleh
n

 x  y
i 1
i i  zi    x1  y1  z1    x2  y2  z2     xn  yn  zn 

  x1  x2   xn    y1  y2   yn    z1  z2   zn 
n n n
  xi   yi   zi
i 1 i 1 i 1

Dalil 2.
n n
Jika c adalah suatu konstanta, maka  cx
i 1
i  c  xi .
i 1

Bukti.
Pembuktiannya dimulai dengan menguraikan notasi sigma sebelah kiri, yakni
n

 cx
i 1
i  cx1  cx2   cxn

 c  x1  x2   xn 
n
 c  xi
i 1

Dalil 3.
n
Jika c adalah suatu konstanta, maka  c  nc .
i 1

Bukti.
Pandang bahwa jika dalil dua di atas xi  1 untuk semua i, maka
n

c  c  c  c 
i 1
 c  nc .
n
1.28 Statistika Pendidikan 

Tidak jarang dalam perhitungan statistika kita dihadapkan pada analisis yang
melibatkan beberapa klasifikasi, dua atau lebih. Misalnya xij melambangkan
skor klasifikasi ke-i dan pengamatan objek ke-j. Jika banyaknya
klasifikasinya adalah k (i  1, 2,, k ) dan banyak pengamatan adalah
n  j  1, 2,3,, n  , maka untuk memudahkan penjumlahan data yang
demikian kita menjumlahkannya dengan notasi sigma ganda.
k n

 x
i 1 j 1
ij

Misalkan kita mengukur hasil belajar dari tiga metode dalam


pembelajaran yang dilakukan terhadap tiga kelas (k) berbeda dalam
meningkatkan hasil belajar. Masing-masing kelas memiliki jumlah siswa
yang sama, yakni 10(n) siswa. Misalkan hasil belajarnya adalah sebagai
berikut.

Tabel 1.1
Contoh Data dengan Lebih dari Satu Klasifikasi

j
Metode A Metode B Metode C
i
1 25 65 70
2 30 70 75
3 45 76 78
4 50 78 80
5 70 80 90
6 80 90 90
7 87 95 95
8 85 100 80
9 90 58 85
10 60 80 80
Ket: data rekayasa

Jika kita ingin mengetahui jumlah dan kuadrat jumlahnya, maka

k n

 x
i 1 j 1
ij  25  30  45   80  85  80  2237

x
i 1
2
ij  252  302  452   802  852  802  176377
 MPDR5202/MODUL 1 1.29

B. PEMBULATAN BILANGAN

Seperti diketahui bahwa dalam matematika dikenal beberapa jenis


himpunan bilangan yang sering muncul dalam pengukuran atau perhitungan
di antaranya himpunan bilangan Asli (Natural Numbers), himpunan bilangan
Cacah (WholeNumbers), himpunan bilangan Bulat (Zahlen Numbers),
himpunan bilangan Rasional (Rational Numbers), himpunan bilangan Riil
(Real Numbers).
Dalam penulisan bilangan, kita sering menggunakan bentuk penulisan
1 1
desimal, misalnya  0,5 ;  0, 25 . Namun kesulitan muncul manakala
2 4
kita akan menuliskan pecahan dengan bentuk desimal yang berulang atau
1
bentuk desimal dari bilangan irasional. Misalnya  0,333 ;
3
2
 0, 6666 ; atau nilai dari p  3,14159265, e  2, 71828183
3
Karena keterbatasan alat perhitungan, misal kalkulator atau komputer,
maka penulisan desimal berulang atau desimal dari bilangan irasional sering
dibulatkan sesuai dengan kapasitas dari alat hitung yang digunakan. Semakin
“canggih” alat yang digunakan, maka penulisan desimal keduanya makin
baik dalam menghampiri nilai eksaknya.
Kebutuhan pembulatan bilangan juga disebabkan sistem penyimpanan
bilangan dalam komputer. Format bilangan riil dalam komputer berbeda-beda
bergantung pada piranti keras dan compiler bahasa pemrogramannya. Pada
komputer IBM PC, bilangan dalam bentuk desimal dapat disajikan dalam 32
bit yang terdiri atas 1 bit sebagai tanda, 8 bit untuk pangkat dan 23 bit untuk
mantisa.
Bilangan riil dalam komputer umumnya disajikan dalam format bilangan
titik kambang (floatingpint). Jika a adalah suatu bilangan riil, maka
penulisannya dari a adalah sebagai berikut.
a  0, d1d2 d3 dn  B p

Dengan di adalah digit atau bit mantisa yang nilainya dari 0 sampai (B –1), B
adalah basis sistem bilangan yang dipakai (2, 8, 16, dan sebagainya), dan p
adalah pangkat (berupa bilangan bulat).
1.30 Statistika Pendidikan 

Sebagai contoh, bilangan riil 245,7856 ditulis sebagai 0,2457856 × 103


dalam format bilangan titik kembang dengan basis 10. Kemudian bagaimana
jika kita membulatkannya hingga 3 tempat desimal, apakah ditulis0,246 × 103
atau 0,245 × 103. Untuk itulah diperlukan aturan dalam membulatkan
bilangan agar kesalahan dari hasil pembulatan sekecil mungkin.
Ada dua teknik yang lazim dipakai oleh komputer dalam membulatkan
bilangan, yakni pemenggalan (chopping) dan pembulatan ke digit terdekat
(in-rounding).
1. Pemenggalan (chopping)
Pembulatan dengan cara ini dilakukan dengan memotong sampai berapa
digit suatu bilangan akan dituliskan. Jika a adalah suatu bilangan dalam
basis 10 dengan a  0, d1d2 d3 dn dn 1  B p akan dibulatkan hingga n
tempat desimal atau digit mantis dalam komputer. Karena digit mantis a
lebih banyak dari digit komputer, maka bilangan a dipotong sampai n
digit, yakni menjadi achop  0, d1d 2 d3 d n  B p . Sebagai contoh
  0,314159265358 10 , jika dituliskan dalam 7 digit mantis, maka
disimpan sebagai  chop  0,3141592 10 .
2. Pembulatan ke digit terdekat (in-rounding)
Pembulatan ke digit terdekat atau in-rounding menggunakan aturan
tertentu. misalkan a adalah suatu bilangan dalam basis 10 dengan
a  0, d1d2 d3 dn dn 1  B p akan dibulatkan hingga n tempat desimal
atau digit mantis dalam komputer, maka pembulatan mengikuti aturan
sebagai berikut.
 dn , jika d n 1  5
d  1 , jika d n 1  5

dˆn   n
 nd , jika d n 1  5 dan d n genap

d n  1 , jika d n 1  5 dan d n ganjil

Jika kita kembali akan membulatkan nilai  seperti di atas.


  0,314159265358 10 dibulatkan dalam 7 digit mantis dengan
pendekatan ini menjadi   0,3141593  10 . Contoh lainnya, misalkan
diketahui nilai b sebagai berikut b = 0,5682785715287 × 10 -4.
1. Jika dibulatkan 6 digit, maka bround = 0,568278 × 10-4.
2. Jika dibulatkan 7 digit, maka bround = 0,5682786 × 10-4.
3. Jika dibulatkan 8 digit, maka bround = 0,56827857 × 10-4.
4. Jika dibulatkan 9 digit, maka bround = 0,568278572 × 10-4.
 MPDR5202/MODUL 1 1.31

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!

1) Carilah nilai dari jumlah yang ditunjukkan!


8
a.   3i  1
i 1
10
b.  2k
k 1
2

 i  2i 
5
2
c.
i 1

2) Tuliskan jumlah yang ditunjukkan dalam bentuk notasi sigma


a. 1 + 2 + 3 + 4 + …+ 90
b. 2 + 4 + 6 + 8 + … + 100
a1  a2  a3   an
c.
b3  b4  b5   b22
d.
3) Perlihatkan bahwa

  x  yij  zij    xij   yij   zij


m n m n m n m n

ij
i 1 j 1 i 1 j 1 i 1 j 1 i 1 j 1

4) Bulatkan bilangan-bilangan berikut dengan ketelitian hingga ribuan


dengan cara in-rounding:
a. Rp2.456.879,63
b. 300.972 ton
c. 2.012,4 meter
d. 6.142 unit
5) Bulatkan hingga ketelitian yang diminta dengan cara in-rounding:
a. 0,0045 hingga per ribuan
b. 0,000098503 hingga per jutaan
c. 126,99953 hingga dua desimal

Petunjuk Jawaban Latihan

8
1) a.   3i  1  100
i 1
1.32 Statistika Pendidikan 

10
b.  2k
k 1
2
 770

 i  2i   25
5
2
c.
i 1

2) Hasil perhitungan
90
a. 1 + 2 + 3 + 4 + …+ 90 = i
i 1
50
b. 2 + 4 + 6 + 8 + … + 100 =  2ii 1
n

c.
a1  a2  a3   an = a
i 1
i

20

d.
b3  b4  b5   b22 = b
i 1
i2

e. Perlihatkan bahwa
3) Dengan menggunakan kelinieran dari 
m  n  m n
 xij  yij  zij      xij   yij   zij   xij  yij   yij
m n n n m n m n

 i 1  j 1
i 1 j 1 j 1 j 1  i 1 j 1 i 1 j 1 i 1 j 1

4) Pembulatan bilangan-bilangan berikut dengan ketelitian hingga ribuan


dengan cara in-rounding:
a. Rp2.457.000,00
b. 301.000 ton
c. 2.000 meter
d. 6.000 unit
5) Bulatkan hingga ketelitian yang diminta dengan cara in-rounding:
a. 0,004
b. 0,0000985
c. 127,00

R A NG KU M AN

n
1. a
i 1
i  a1  a2   an
 MPDR5202/MODUL 1 1.33

2. Pembulatan bilangan ada dua cara, yakni Chopping dan In-


rounding. Chopping atau pemotongan adalah pembulatan dengan
cara memotong sampai berapa digit suatu bilangan akan dituliskan.
Sedangkan pembulatan dengan cara In-Rounding adalah sebagai
berikut.

 dn , jika d n 1  5
d  1 , jika d n 1  5

dˆn   n
 dn , jika d n 1  5 dan d n genap

d n  1 , jika d n 1  5 dan d n ganjil

TES F OR M AT IF 3

Jawablah pertanyaan berikut dengan ringkas dan jelas!

1) Dalam 10 kali pelemparan 7 keping mata uang, banyaknya gambar yang


muncul adalah: 2, 6, 2, 2,5,3,5,3,3, 4. Jika pengamatannya dilambangkan
dengan Y1 , Y2 , , Yn, berapakah n? berapa nilai Y2? Nilai Y7. Untuk nilai
i berapakah Y sama dengan 2? Sama dengan 3? Sama dengan 4?
Bedakah antara Yi –1 dengan Yi –1 ? Berapakah nilai Yi –1 dan Yi –1 untuk
i = 3?
2) Perlihatkan bahwa
m n

 c  mnc
i 1 j 1

3) Perlihatkan bahwa
m n
 m  n 
 x y
i 1 j 1
   xi    y j 
i j
 i 1   j 1 
4) Bulatkanlah bilangan-bilangan berikut teliti hingga ribuan.
a. Rp 2.456.832,63
b. 300.972 m2

c. 2.012,4 meter
d. 7.542 unit
5) Perhatikan tabel produksi minyak dan gas bumi periode tahun 1956 –
1960 (dikutip dari Sudjana (1989))
1.34 Statistika Pendidikan 

Tahun Minyak Mentah Gas Bumi Jumlah


1956 12.730.160 2.638.570 …………….
1957 15.468.437 2.798.480 …………….
1958 16.109.614 2.693.218 …………….
1959 18.218.270 2.877.344 …………….
1960 20.596.012 3.136.606 …………….
Jumlah ………….. ………… …………….

Dalam tabel di atas, isilah dahulu jumlahnya lalu buat tabel baru dengan
produksi yang telah dibulatkan menjadi jutaan kilogram, kemudian
berikan komentar dari hasil yang diperoleh!

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 3 yang


terdapat di bagian akhir modul ini. Masing-masing soal mempunyai skor 20.
Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut untuk
mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 3.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 3, terutama bagian yang
belum dikuasai.
 MPDR5202/MODUL 1 1.35

Kunci Jawaban Tes Formatif

Test Formatif 1
1) Tetap diperlukan, karena ketika seorang peneliti akan menganalisis data
walaupun perhitungannya dengan komputer, tentu dia harus memilih
dengan tepat uji statistik yang digunakannya. Selain itu, peneliti juga
perlu memahami bagaimana membaca hasil (output) pengolahan
datanya.
2) Ya, karena dengan sensus semua data dari objek yang diteliti turut serta
dalam proses perhitungan, sehingga tidak akan terjadi kesalahan
penaksiran atau derajat kepercayaannya 100%.
3) a. deskrpitif, b. deskriptif, c. deskriptif, d. inferensial, e. inferensial.
4) Penalaran yang dilakukan dalam statistika inferensial adalah penalaran
induktif, yakni peneliti mengambil kesimpulan (generalisasi) dari hasil
empirik yang dilakukan berdasarkan sampling.

Test Formatif 2
1) Ilustrasi

2) Perhitungan, karena dalam memperoleh data tersebut digunakan alat,


yakni wawancara atau angket. Skala dalam pengukuran waktu termasuk
dalam skala rasio. Jika rata-rata belajar A adalah 2 jam, B belajarnya 3
jam, dan C belajarnya 6 jam dalam 1 minggu, maka B lebih banyak 1
jam dari A dalam belajarnya, C belajarnya 3 kali lebih lama dari A.
1.36 Statistika Pendidikan 

3)
Variabel Klasifikasi
Warna mata Kualitatif
Banyak serangga Kuantitatif diskrit
Banyak kesalahan per murid dalam Kuantitatif diskrit
perlombaan mengeja kata
Kilometer ban sampai bocor Kuantitatif kontinu
pertama
waktu yang diperlukan antara dua Kuantitatif kontinu
pengisian pulpen dalam pengisian
penggunaan biasa
hasil jagung per petak Kuantitatif kontinu
banyaknya anak yang lahir di Kuantitatif diskrit
rumah sakit terdekat pada hari
tahun baru
hasil yang mungkin dari Kuantitatif diskrit
pengundian 50 keping mata uang
banyaknya ikan di suatu kolam Kuantitatifdiskrit

4) Contoh data dengan skala nominal: status kewarga negaraan (WNI,


WNA), status perkawinan (belum menikah, menikah, Janda/Duda).
Contoh data dengan skalaordinal: tingkat pendidikan orang tua (SD,
SMP, SMA, PT), Pangkat dan golongan guru (IIIA, IIIB, IIIC, IID, IVA,
IVB, IVC, IVD dan IVE).

Test Formatif 3
1) n = 10. Y2 = 2, Y7 = 5, I = 1, 3,dan 4. I = 6, 8 dan 9. Yi – 1  Yi-1. Untuk
I = 3Yi – 1 = 1 dan Yi-1 = 6.
2) Bukti
m n m  n  m

i 1 j 1
c  mnc     
c
i 1  j 1  i 1
nc  m  nc   mnc

3) Bukti
m n m  m  m  m   m  n 
 xi y j     xi y j     xi  y j     xi    y j 
i 1 j 1 i 1  j 1  i 1  i 1   i 1   j 1 
 MPDR5202/MODUL 1 1.37

4) Bulatkanlah bilangan-bilangan berikut teliti hingga ribuan.


Rp 2.456.832,63 menjadi Rp 2.457.000,00
300.972 m2 menjadi 301.000 m2
2.012,4 meter menjadi 2.000 meter
7.542 unit menjadi 8.000 unit
5) Hasil perhitungan awal
Tahun Minyak Mentah Gas Bumi Jumlah
1956 12.730.160 2.638.570 15.368.730
1957 15.468.437 2.798.480 18.266.917
1958 16.109.614 2.693.218 18.802.832
1959 18.218.270 2.877.344 21.095.614
1960 20.596.012 3.136.606 23.732.618
Jumlah 83.122.493 14.144.218 97.266.711

Setelah pembulatan
Tahun Minyak Mentah Gas Bumi Jumlah
1956 13.000.000 3.000.000 16.000.000
1957 15.000.000 3.000.000 18.000.000
1958 16.000.000 3.000.000 19.000.000
1959 18.000.000 3.000.000 21.000.000
1960 20.000.000 3.000.000 23.000.000
Jumlah 82.000.000 15.000.000 97.000.000
1.38 Statistika Pendidikan 

Daftar Pustaka

Dowdy, S. & Wearden S. 1991. Statistcs for Research (Second edition).


New York: John Wiley & Son.

Kerlinger, F. N. 2006. Asas-asas Penelitian Behavioral (terjemahan).


Jogjakarta: Gadjah Mada University Press.

Hogg, R. V. & Craigh, A. T. 1978. Introduction to Mathematical Statistics


(fourth edition). New York: Mcmillan Publishing Co. Inc.

Minium, E. W., King, B. M. & Bear, G. 1993. Statistical Reasoningin


Psychologyand Education. New York: Joh Wiley & Sons, Inc.

Munir, R. 2003. Metode Numerik. Bandung: Informatika

Purcell, E. J. & Vareberg, D. 1995. Kalkulus dan Geometri Integral. Alih


bahasa: Susila, I. N., Kartasasmita, B. & Rawuh. Jakarta: Erlangga.

Spiegel, Murray R. 1992. Statistik (Versi Metrik). Alih bahasa: I Nyoman


Susila. Jakarta: Erlangga.

Steel, R. G. D. & Torrie, J. H., 1995. Prinsip dan Prosedur Statistika. Suatu
Pendekatan Biometrik. Alih Bahasa: Sumantri, B. Jakarta: Gramedia
Pustaka Utama.

Sudjana, 1989. Metoda Statistika. Bandung: Tarsito.

Sugiyono, 2008. Statistika untuk Penelitian. Bandung: Alfabeta.

Walpole, R. E., 1995. Pengantar Statistika (edisi ke-3). Alih bahasa:


Bambang Sumantri. Jakarta: Gramedia Pustaka Utama.
Modul 2

Penyajian Data
Dr. Jarnawi Afgani Dahlan

PEN D AH U LU A N

D ata hasil pengukuran atau perhitungan perlu ditulis secara ringkas dan
mudah dibaca, sehingga makna dari data dapat terungkap. Untuk
meringkas data dapat digunakan tabel. Dalam statistika tabel terdiri dari dua
jenis, yakni tabel baris-kolom dan tabel frekuensi. Dari kedua tabel tersebut,
kita dapat menyusun diagram atau grafik. Penulisan data dalam diagram atau
grafik bertujuan agar penyajian lebih mudah membaca dan juga lebih
menarik.
Hal yang penting untuk dipelajari oleh kita adalah diagram mana yang
tepat digunakan dalam menyajikan data yang kita punyai. Sering kali terdapat
ketidaktepatan penyajian data dalam bentuk diagram/garis. Dengan demikian,
agar kesalahan-kesalahan dalam menyusun tabel dan memilih diagram yang
tepat, maka Anda perlu membaca dan menyelesaikan latihan-latihan dalam
Modul 2 ini.

A. DESKRIPSI SINGKAT

Modul 2 ini terdiri dari beberapa kegiatan belajar. Kegiatan belajar


pertama membahas tentang penyajian data dalam bentuk tabel. Ada dua tabel
yang lazim digunakan, yakni tabel baris-kolom dan tabel frekuensi. Tabel
baris-kolom digunakan untuk data dengan lebih dari satu atau lebih kategori,
sedangkan tabel frekuensi digunakan hanya untuk data satu kategori. Untuk
lebih memudahkan dalam memperoleh atau membaca informasi data yang
telah disusun dalam tabel dinyatakan dalam grafik atau diagram. Untuk tabel
baris kolom dikenal beberapa grafik/diagram, yakni diagram batang,
lambang, lingkaran, dan garis. Sedangkan dari tabel frekuensi akan diperoleh
histogram, poligon frekuensi, kurva distribusi (pendekatan), serta ogive.
2.2 Statistika Pendidikan 

B. RELEVANSI

Penyajian data merupakan langkah awal dalam pengolahan data secara


deskriptif. Banyak data dalam bidang pendidikan yang harus diringkas dalam
penyajiannya sehingga memudahkan guru, kepala sekolah, dan stakeholder
lainnya dalam pendidikan dalam memperoleh informasi, sehingga
memudahkannya dalam mengambil keputusan.
Data yang berasal dari populasi atau dari sampel untuk keperluan
laporan dan analisis perlu disusun, diatur, dan disajikan dalam bentuk yang
jelas dan baik. Untuk kepentingan tersebut, maka diperlukan pengetahuan
dalam memprosesnya. Kita menyusun tabel sedemikian hingga tidak ada data
yang tertinggal, tidak menimbulkan salah tafsir, dan tentu mudah dalam
membacanya. Diperlukan kemampuan untuk perlu memilih diagram atau
grafik yang tepat sesuai dengan jenis data dan kategori-kategorinya.

C. TUJUAN INSTRUKSIONAL KHUSUS

Setelah membaca modul ini diharapkan mahasiswa dapat:


1. Menyusun daftar/tabel baris kolom
2. Menyusun tabel frekuensi
3. Menyusun grafik/diagram yang sesuai dengan data dari tabel baris kolom
dan menginterpretasikannya
4. Menyusun histogram, poligon frekuensi dan pendekatan kurva distribusi
dan menginterpretasikannya
5. Menyusun ogive dan menginterpretasikannya
 MPDR5202/MODUL 2 2.3

Kegiatan Belajar 1

Penyajian Data

A. PENYAJIAN DATA DALAM TABEL

Perhatikanlah data banyaknya siswa Sekolah Dasar X tahun ajaran


2014 - 2015 sebagai berikut:
Kelas 1A laki-laki 12 orang dan perempuan 12 orang.
Kelas 1B laki-laki 13 orang dan perempuan 12 orang.
Kelas 2A laki-laki 11 orang dan perempuan 17 orang.
Kelas 2B laki-laki 10 orang dan perempuan 16 orang.
Kelas 3A laki-laki 12 orang dan perempuan 16 orang.
Kelas 3B laki-laki 12 orang dan perempuan 15 orang.
Kelas 4A laki-laki 18 orang dan perempuan 15 orang.
Kelas 4B laki-laki 17 orang dan perempuan 16 orang.
Kelas 5A laki-laki 14 orang dan perempuan 14 orang.
Kelas 5B laki-laki 12 orang dan perempuan 15 orang.
Kelas 6A laki-laki 10 orang dan perempuan 12 orang.
Kelas 6B laki-laki 13 orang dan perempuan 11 orang.

Penulisan data di atas tentu tidak mudah dibaca dan dimaknai lebih
lanjut, sehingga kurang memberikan informasi yang jelas. Untuk itu kita
perlu menyajikannya dalam bentuk tabel. Salah satu bentuk tabel yang dapat
dibuat adalah sebagai berikut.

Tabel 2.1
Rekapitulasi Siswa SD X Tahun Ajaran 2014 – 2015

Kelas
Jenis
1 2 3 4 5 6 Jumlah
Kelamin
A B A B A B A B A B A B
Laki-Laki 12 13 11 10 12 12 18 17 14 12 10 13 154
Perempuan 12 12 17 16 16 15 15 16 14 15 12 11 171
Jumlah 24 25 28 26 28 27 33 33 28 27 22 24 325
Sumber: rekayasa

Menyajikan data dalam bentuk tabel bertujuan meringkas dan


memudahkan kita dalam membaca, serta mungkin memberikan interpretasi
secara deskriptif informasi dari data tersebut. Cobalah Anda bandingkan
2.4 Statistika Pendidikan 

antara penyajian data secara naratif di atas dengan yang sudah tersusun pada
tabel 1. Jauh lebih mudah membaca atau menggali informasi dari Tabel 2.1.
Interpretasi tentu saja sangat beragam, dan setiap orang tentu akan
mempunyai ide atau gagasan dari suatu gambar atau tabel. Seperti kata
pepatah gambar menunjukkan sejuta makna. Dengan memunculkan berbagai
gagasan-gagasan tersebut, maka kita diajak untuk berpikir secara kritis dan
kreatif. Cobalah Anda ungkapkan ide atau gagasan apa saja yang dapat
diungkapkan dari data pada tabel tersebut, kemudian diskusikan dengan
teman-teman Anda!
Secara formal, menyajikan tabel tidak ada aturan yang khusus. Hal yang
perlu diperhatikan dalam menyusun tabel adalah semua informasi yang
diperoleh harus termuat dalam tabel. Artinya tidak boleh ada data yang
tertinggal. Selain itu, penyajian kategori bagi judul (baik kolom maupun
baris) harus jelas, bebas dan saling lepas. Misalnya informasi tentang kualitas
kemampuan siswa, kita mengkategorinya sebagai berikut:
0 – 30 : sangat kurang
30 – 50 : kurang
50 – 70 : cukup
65 – 80 : baik
80 – 100 : sangat baik
Catatan : skala pengukuran 0 – 100

Mengkategori data seperti di atas tentu sangat membingungkan. Pertama


untuk batas-batas kategori. Jika anak mempunyai skor 30, apakah dia
termasuk kategori sangat kurang atau kurang, begitu juga untuk skor 50 dan
80. Selain itu, ada interval yang beririsan, yakni interval untuk kategori
cukup dan baik. Jika seorang anak memperoleh skor 68, maka kategorinya
termasuk pada cukup atau baik?
Akan lebih mudah apabila mengkategori data kuantitatif tersebut
memanfaatkan relasi matematika, misalnya untuk pengkategorian di atas kita
menuliskannya sebagai berikut:
0  X < 30 : sangat kurang
30 < X  50 : Kurang
50 < X  65: Cukup
65 < X  80 : Baik
80 < X  100 : Sangat baik.
Dengan X adalah skor siswa dalam skala 0 - 100.
 MPDR5202/MODUL 2 2.5

Sementara untuk batas-batas kategorinya itu diserahkan pada kita sendiri,


apakah menggunakan acuan patokan atau normatif. Kedua acuan dalam
penilaian tersebut dapat Anda pelajari dalam kuliah evaluasi pembelajaran.
Selain tabel baris kolom, ada jenis tabel lain yang dapat disusun, yakni
tabel distribusi frekuensi. Pada tabel baris-kolom, kita dapat membuat tabel
dari data yang mempunyai beberapa kategori. Sebaliknya, pada tabel
distribusi frekuensi, kita hanya dapat menyusun tabel dari satu kategori dan
datanya berupa data mentah yang diperoleh dari hasil pengukuran atau
perhitungan terhadap objek-objek yang kita teliti. Misalnya data hasil
ulangan tema 1 siswa kelas IV Sekolah Dasar Negeri X, data hasil
pengukuran berat badan 40 siswa sekolah dasar kelas I, data pendapatan
orang tua siswa, data tinggi tanaman cabe pada satu petak kebun sekolah
pada usia tanam 1 bulan, dan lain sebagainya.
Data di atas dapat kita peroleh dari hasil perhitungan dan pengukuran.
Hal ini sudah dipelajari pada modul sebelumnya. Kita misalkan saja
mempunyai data hasil pengukuran tes formatif tema 4 kelas IV-A dan IV-B
Sekolah Dasar Negeri II. Misalkan hasil tersebut adalah sebagai berikut.

61 67 70 75 80 85 90 96
62 68 70 76 80 85 91 68
70 77 81 86 69 72 77 81
86 72 78 82 86 73 78 82
86 78 82 86 78 83 86 79
84 87 79 84 87 88 88 89
89 89

Diagram 2.1
Data Hasil Tes Tema 4 Kelas IV-A dan IV-B
Catatan: data hasil modifikasi dari Minium, dkk. (1993).

Secara mudah kita dapat menyusun tabel tersebut berdasarkan


kemunculannya, misalkan 61 satu buah, 62 satu buah, 63 tidak ada, dan
seterusnya. Untuk menyingkatnya kita gunakan tabel frekuensi dari semua
kemungkinan data yang muncul dari data terkecil hingga terbesarnya sebagai
berikut.
2.6 Statistika Pendidikan 

Tabel 2.2
Tabel Distribusi Frekuensi dari Skor-Skor yang Mungkin
pada Hasil Tes Formatif Tema 4

Skor Frekuensi Skor Frekuensi


61 1 79 2
62 1 80 2
63 0 81 2
64 0 82 3
65 0 83 1
66 0 84 2
67 1 85 0
68 2 86 5
69 1 87 2
70 3 88 2
71 0 89 3
72 2 90 1
73 1 91 0
74 0 92 0
75 1 93 0
76 1 94 0
77 2 95 0
78 4 96 1

Penyusunan tabel di atas sudah cukup ringkas dan informasi yang


muncul sudah mudah untuk diperoleh, hanya apabila datanya dalam jumlah
besar dengan jangkauan yang besar juga, maka akan cukup merepotkan.
Untuk itu, kita dapat menyusun atau mengembangkan tabel frekuensi dengan
datanya sudah dibuat kategori-kategori. Untuk mengubahnya dalam bentuk
kategori atau kelompok-kelompok skor, maka diperlukan interval-interval
yang memuat data. Misalnya kita buat pengelompokan data mulai dari60 –
62, sampai dengan 96 – 98. Atau Anda dapat membuat kemungkinan
pengelompokan-pengelompokan lainnya, hal itu boleh saja dilakukan, seperti
yang terlihat pada tabel berikut.
 MPDR5202/MODUL 2 2.7

Tabel 2.3
Beberapa Tabel Distribusi yang Mungkin dari Data Tabel 2

A B C
Panjang Interval = 3 Panjang Interval = 5 Panjang Interval = 5
SKOR FREKUENSI SKOR FREKUENSI SKOR FREKUENSI
60 - 62 2 60 – 64 2 61 - 65 2
63 - 65 0 65 – 69 4 66 - 70 7
66 - 68 3 70 – 74 6 71 - 75 4
69 - 71 4 75 – 79 10 76 - 80 11
72 - 74 3 80 – 84 10 81 - 85 10
75 - 77 4 85 – 89 15 86 - 90 14
78 - 80 8 90 – 94 2 91 - 95 1
81 - 83 6 95 – 99 1 96 - 100 1
84 - 86 10 Jumlah 50 Jumlah 50
87 - 89 7
90 - 92 2
93 - 95 0
96 - 98 1
Jumlah 50

Dari tabel di atas, nampak bahwa dari data yang sama, kita dapat
mengembangkan beberapa tabel distribusi frekuensi yang berbeda. Apabila
kita memilih panjang interval kelasnya sama, mungkin tabel distribusi
frekuensinya bisa sama atau berbeda. Hal ini sangat bergantung pada
pemilihan skor terendah pada kelas interval pertamanya. Begitu juga jika kita
memilih skor terendah sama, tetapi menggunakan panjang interval berbeda,
maka tabelnya akan berbeda juga. Dengan demikian dapat disimpulkan
bahwa penyajian data dalam tabel distribusi frekuensi tidaklah tunggal.
Terdapat hal penting yang perlu diperhatikan oleh kita dalam menyusun
interval-interval pada tabel distribusi frekuensi sebagaimana telah disebutkan
di atas, yakni semua data termuat dalam kelas-kelas interval yang ada, tidak
ada interval yang beririsan (overlap), dan jika memungkinkan sebaiknya
menggunakan panjang interval untuk setiap kelasnya sama. Kemudian
muncul sebuah pertanyaan, bagaimana cara terbaik dalam menyusun tabel
distribusi frekuensi? Menurut Minium, dkk. (1993) terdapat suatu konsensus
yang dapat dijadikan acuan dalam menyusun tabel distribusi frekuensi.
Namun ini hanyalah pedoman yang sifatnya tidak kaku.
1. Pastikan bahwa kelas-kelas interval yang dibuat saling lepas
(mutallyexlusive). Interval-interval tidak boleh overlap, sehingga tidak
ada skor yang termuat ke lebih dari satu interval.
2.8 Statistika Pendidikan 

2. Pastikan bahwa semua interval panjangnya sama, konsensus ini untuk


mempermudah melihat pola yang muncul dari data yang kita sajikan.
3. Buatlah interval-interval tersebut kontinu sehingga membentuk
distribusi. Misalkan pada tabel 3 di atas, kita tetap membuat interval63 –
65, walaupun pada interval tersebut tidak ada frekuensi atau tidak ada
skor yang termuat dalam interval tersebut.
4. Susunlah kelas-kelas interval secara sistematis. Bisa menurun; dari
terbesar hingga terkecil, bisa juga dari yang terkecil hingga besar.
Minium, dkk. (1997) lebih menyarankan dari yang terbesar hingga
terkecil (turun). Minium, dkk. beralasan bahwa jika kita menyusun
interval-interval dari data skor siswa dengan skala 100, maka jika
susunannya naik sangat mungkin kita akan memperoleh interval,
misalnya 98 – 102, dan hal ini misleading. Tetapi jika dari yang terbesar,
maka pastilah kita akan memilih interval ujung bawah interval pertama
kurang dari atau sama dengan 100.
5. Jika range datanya besar, gunakan banyak interval 10 hingga 20 kelas
interval. Sebagai contoh untuk tabel 3 di atas yang terdiri dari 3 buah
tabel distribusi frekuensi berbeda. Tabel A menggunakan lebih banyak
kelas-kelas interval dibandingkan dengan tabel B dan tabel C. Menurut
Minium, dkk. (1993), tabel distribusi frekuensi yang memuat sedikit
kelas-kelas interval akan kehilangan keakuratan (accuracy) lebih
jauhnya kita akan kehilangan banyak informasi dari data tersebut.
Namun demikian, tentu saja, banyak kelas-kelas interval yang kita pilih
sangat bergantung dari ukuran sampel, serta jangkauan dari datanya.
6. Pilihlah panjang kelas interval yang convenient, misalnya panjang kelas
interval 2, 5, 10, 15, 25, dan 50 lebih mudah di konstruksi dan
diinterpretasikan dibandingkan dengan memilih panjang kelas interval 7,
19, atau 33.
7. Jika memungkinkan, pilihlah ujung bawah kelas interval pertama yang
merupakan kelipatan dari panjang kelas intervalnya. Contohnya pada
tabel 3 di atas, tabel A dan B menggunakan ujung-ujung kelas interval
yang lebih baik, yakni ujung bawah interval kelas pertamanya
merupakan kelipatan dari panjang kelas intervalnya, sedangkan tabel C
ujung bawah kelas interval pertamanya bukan kelipatan dari panjang
interval kelasnya. Cobalah Anda amati, apakah memang hal ini benar
dan mengapa harus demikian?
 MPDR5202/MODUL 2 2.9

Sebagai tambahan, Sudjana (1989) menyatakan bahwa untuk memilih


atau memperkirakan banyaknya kelas interval, kita dapat menggunakan
aturan Sturges, yakni jika dimisalkan banyak kelas b, maka b dapat dihitung
dengan rumus
b  1  3,3log n
Dengan n menyatakan banyak data atau ukuran sampel.
Kemudian untuk menghitung panjang kelas interval. Jika kita misalkan p
menyatakan panjang kelas dan R jangkauan atau Range data, maka panjang
kelas dapat dihitung dengan aturan sebagai berikut.
R
p
b
R = Data terbesar – Data terkecil.

Perlu diingat bahwa b (banyak kelas) haruslah berbentuk bilangan bulat,


karena menyatakan “banyak”. Jadi pemilihan b haruslah berbentuk bilangan
Asli, misalnya 1, 2, dan seterusnya. Dan jika mengacu pada pendapat
Minium, dkk. di atas, maka b yang diperoleh dari rumus tentu tidak
semuanya berbentuk bilangan Asli, untuk itu kita perlu melakukan
“pembulatan”. Kemudian untuk pemilihan panjang kelas (p), kita perlu
memperhatikan satuan pengukuran datanya. Jika satuan pengukuran datanya
1 satuan, maka panjang kelas juga satu satuan, jika datanya 1 tempat desimal
(1/10) satuan, maka panjang kelas juga menggunakan bilangan dengan 1
tempat desimal.
Untuk selanjutnya, kita akan mencoba melakukan suatu simulasi dalam
mengembangkan tabel distribusi frekuensi dengan menggunakan pedoman
yang telah Anda baca di atas. Dan sebagai contoh, misalkan kita kembali
pada data tentang skor ulangan siswa di atas, dan kita akan
mengkontruksinya menggunakan beberapa pendekatan.
Langkah pertama yang perlu dilakukan adalah menghitung R (range)
atau jangkauan. Data di atas mempunyai data terbesar 96, dan data
trekecilnya 61, maka rangenya adalah R = 96 – 61 = 35. Jika kita mengacu
pada pendapat Minium, dkk., maka kita dapat memilih banyak kelas interval
10 sampai dengan 20 buah. Jika dimisalkan kita memilihnya 10 buah, maka
kita harus merancang panjang kelas interval dengan banyak kelas 10 buah.
Kita harus membagi range 35 dengan banyak interval 10 buah, yakni
35
 3,5 . Dan jika kita memilih banyak kelas 20, maka panjang kelasnya
10
2.10 Statistika Pendidikan 

35
 1, 75 . Karena satuan pengukuran data di atas adalah 1 satuan, maka
20
panjang kelas yang mungkin dengan banyak kelas interval 10 buah adalah 2
atau 3. Sedangkan jika kita memilih banyak kelas 20 buah, maka panjang
kelas yang mungkin adalah 1 atau 2. Misalkan untuk banyak kelas interval 10
buah, kita pilih panjang kelasnya 3, atau p = 3.
Berikutnya kita dihadapkan pada pemilihan kelas interval yang pertama.
Karena data terkecil kita adalah 61 dan kita telah memilih panjang kelasnya
3, maka kemungkinan dari kelas interval pertama adalah 59 – 61, 60 – 62,
atau 61 – 63. Kita lebih baik memilih interval 60 – 62 dibandingkan dengan
lainnya. Hal ini disebabkan 60 merupakan kelipatan dari panjang kelasnya,
yakni 3.
Setelah kelas interval pertama diperoleh, kemudian lanjutkan penulisan
interval-interval berikutnya dan lakukanlah tabulasi data. Untuk
membantunya kita dapat menggunakan tabel tally sebagai berikut.

Tabel 2.4
Tabulasi untuk Menentukan Tabel Frekuensi
(susunan kelas interval naik)

SKOR Tali F
60 - 62  2
63 - 65 0
66 - 68  3
69 - 71  4
72 - 74  3
75 - 77  4
78 - 80  8
81 - 83  6
84 - 86  10
87 - 89  7
90 - 92  2
93 - 95 0
96 - 98  1
Jumlah 50
 MPDR5202/MODUL 2 2.11

Dalam penulisan lain, kita juga disarankan menuliskannya naik secara


terurut. Jadi tabel di atas dapat ditulis juga dalam bentuk sebagai berikut.

Tabel 2.5
Tabulasi untuk Menentukan Tabel Frekuensi
(susunan kelas interval turun)

SKOR Tali F
96 – 98 1
93 – 95 0
90 – 92 2
87 – 89 7
84 – 86 10
81 – 83 6
78 – 80 8
75 – 77 4
72 – 74 3
69 – 71 4
66 – 68 3
63 – 65 0
60 - 62 2
Jumlah 50

Jika kita mengacu pada pendapat Sturges, maka banyak kelas interval
dari data di atas adalah
b  1  3,3(log 50)
 1  (3,3)(1, 69897)
 1  5, 606601
 6, 6066001

Dari hasil di atas, maka banyak kelas yang mungkin adalah 6 atau 7.
Misalkan kita memilih b = 7. Untuk banyak kelas 6, silakan Anda
mencobanya. Dengan memilih banyak kelas 7 buah, maka dapat dihitung
panjang kelas, yakni
2.12 Statistika Pendidikan 

35
p 5
7
Dalam memilih panjang kelas (p), kita dapat menggunakan p = 5 atau 6.
Misalkan dipilih p = 6. Jika dipilih p = 5, maka apa yang akan terjadi?
Silakan Anda kerjakan sendiri sebagai latihan.
Pemilihan ujung bawah kelas pertama dimisalkan adalah 60 – 65. Ini
berpatokan pada pendapat Minium, 60 merupakan kelipatan 6. Dengan
demikian, tabel distribusi frekuensi adalah sebagai berikut

Tabel 2.6
Tabulasi untuk menentukan tabel frekuensi

SKOR Tali F
60 – 65 2
66 – 71 7
72 – 77 7
78 – 83 14
84 – 89 17
90 – 95 2
96 – 101 1
Jumlah 50

Kelemahan dari tabel di atas menurut Minium adalah adanya misleading,


karena pada interval ketujuh ujung atasnya 101, padahal skor tes formatif
tersebut menggunakan skala 100. Hal ini dapat dipandang aneh. Adapun
kelebihan dari tabel distribusi frekuensi di atas adalah tidak adanya kelas
interval yang frekuensinya sama dengan nol. Hal ini sangat mungkin, karena
panjang kelasnya lebih besar dibandingkan dengan pada tabel sebelumnya.
Contoh yang diuraikan di atas merupakan hasil pengukuran pada
variabel diskrit. Kita tidak mempunyai peluang untuk memperoleh skor
dalam bilangan pecahan, misalnya 82,4; 65,3; dan sebagainya. Dengan
demikian, bagaimana jika seorang siswa memperoleh skor 72,4. Apakah skor
tersebut termuat pada kelas interval 69 – 71 atau 72 – 75 untuk tabel 2.4, dan
66 – 71 atau 72 – 77 untuk tabel 2.5. Bagaimana kita mengembangkan tabel
dengan variabel kontinu.
 MPDR5202/MODUL 2 2.13

Secara umum, batas-batas riil (real limits) dari suatu skor dipandang
sebagai perluasan dari setengah dari satuan pengukuran datanya. Misalkan
untuk data di atas, satuan pengukurannya adalah 1 satuan. Dengan demikian
batas-batas riil datanya adalah X  0,5 ; 0,5 diperoleh dari satuan pengukuran
dibagi 2 atau setengah kali satuan pengukuran. Dengan demikian, jika skor
seorang siswa adalah 42, maka batas-batasnya adalah 42  0,5, yakni 41,5
dan 42,5. Angka 41,5 disebut batas bawah dan angka 42,5 disebut batas atas.
Jika satuan pengukuran data kita satu tempat desimal, misalkan 42,3; 60,8;
dan seterusnya, maka untuk menentukan batas-batas riilnya adalah
0,1
X  X  0,05 . Dengan demikian, batas-batas bagi skor 42,3 adalah
2
42,3  0,05, yakni batas bawahnya 42,25 dan batas atasnya 42,35.
Ilustrasinya dapat dilihat pada diagram berikut.

Gambar 2.1
Contoh Batas-Batas Riil dari Suatu Skor

Dengan demikian, jika tabel frekuensi dituliskan dalam bentuk batas-batas


riilnya adalah sebagai berikut.
2.14 Statistika Pendidikan 

Tabel 2.7
Tabel Frekuensi Skor Siswa

Selang Kelas Batas Kelas F


60 – 65 59,5 – 65,4 2
66 – 71 64,5 – 71,5 7
72 – 77 71,5 – 77,5 7
78 – 83 77,5 – 83,5 14
84 – 89 83,5 – 89,5 17
90 – 95 89,5 – 95,5 2
96 – 101 95,5 – 101,5 1
Jumlah 50

Penulisan tabel frekuensi dalam batas-batas riil bermanfaat nanti dalam


mengembangkan grafik dari data tersebut, serta perhitungan-perhitungan
ukuran-ukuran statistik yang akan dibahas pada kegiatan belajar dan modul
berikutnya.
Variasi yang dapat diperoleh dari tabel frekuensi adalah tabel frekuensi
relatif atau persentase dan tabel frekuensi kumulatif (kumulatif kurang dari
serta atau lebih). Penulisan dalam bentuk persentase atau relatif biasanya
lebih memberikan makna dibandingkan dengan tabel frekuensi. Tabel
frekuensi relatif diperoleh dengan menentukan frekuensi relatif bagi kelas-
kelas interval dengan cara menghitung membagi masing-masing frekuensi
kelas dengan frekuensi total (banyak data). Tabel yang memuat frekuensi
relatif disebut dengan sebaran frekuensi relatif. Bila setiap frekuensi relatif
dikalikan dengan 100%, maka kita memperoleh apa yang disebut sebaran
persentase. Sebagai contoh tabel frekuensi dari tabel di atas adalah sebagai
berikut.
 MPDR5202/MODUL 2 2.15

Tabel 2.8
Tabel Frekuensi Skor Siswa

Selang Kelas Batas Kelas f f relatif


60 – 65 59,5 – 65,5 2 0,04
66 – 71 65,5 – 71,5 7 0,14
72 – 77 71,5 – 77,5 7 0,14
78 – 83 77,5 – 83,5 14 0,28
84 – 89 83,5 – 89,5 17 0,34
90 – 95 89,5 – 95,5 2 0,04
96 – 101 95,5 – 101,5 1 0,02
Jumlah 50 1,00

Dari tabel frekuensi relatif tersebut memberikan makna yang lebih, misalkan
34% siswa mencapai skor di antara 84 – 89, dan tentu makna lainnya.
Dalam banyak kegiatan, sering kali kita tertarik bukan pada banyaknya
pengamatan dalam suatu kelas tertentu, namun pada banyaknya pengamatan
yang jatuh di bawah sebuah skor atau nilai tertentu. Misalkan berapa banyak
skor siswa yang kurang dari 70, atau berapa banyak siswa yang skornya di
atas 80, dan seterusnya. Hal ini tentu akan bermanfaat bagi guru (sebagai
contoh) untuk menentukan siswa mana saja yang sudah mencapai kriteria
ketuntasan, dan siswa mana saja yang sudah mencapainya. Untuk menyusun
tabel frekuensi kumulatif, perhatikan kembali tabel 2.8 frekuensi di atas.
Dalam tabel di atas banyaknya siswa yang skornya kurang dari 72 ada 9
siswa, yakni 2 + 7 dari frekuensi-frekuensi kelas sebelumnya. Artinya
frekuensi kumulatif (kurang dari) merupakan frekuensi total semua nilai
yang lebih kecil daripada batas atas kelas suatu selang (interval) kelas
tertentu. Sebaliknya frekuensi kumulatif (atau lebih) merupakan frekuensi
total semua nilai yang lebih besar dari batas bawah kelas suatu selang
(interval) kelas tertentu. Hal yang sama dengan tabel frekuensi, dari tabel
frekuensi kumulatif juga dapat diperoleh tabel frekuensi kumulatif relatif
(persen) dengan perhitungan sama dengan apa yang dikerjakan dalam
menyusun tabel frekuensi relatif. Dari pengertian di atas, maka dapat kita
susun tabel frekuensi kumulatif (kurang dari) dan tabel frekuensi kumulatif
(atau lebih) sebagai berikut.
2.16 Statistika Pendidikan 

Tabel 2.9
Tabel Frekuensi Kumulatif (kurang dari) bagi Skor Siswa

Frekuensi Frekuensi
Batas kelas
Kumulatif Kumulatif Relatif
Kurang dari 59,5 0 0,00
Kurang dari 65,5 2 0,14
Kurang dari 71,5 9 0,18
Kurang dari 77,5 16 0,32
Kurang dari 83,5 30 0,60
Kurang dari 89,5 47 0,94
Kurang dari 95,5 49 0,98
Kurang dari 101,5 50 1,00

Dan tabel frekuensi kumulatif (atau lebih) dari tabel di atas adalah sebagai
berikut.

Tabel 2.10
Tabel Frekuensi Kumulatif (kurang dari) bagi Skor Siswa

Frekuensi
Batas Kelas Frekuensi Kumulatif
Kumulatif relatif
59,5 atau lebih 50 1,00
65,5 atau lebih 48 0,96
71,5 atau lebih 41 0,82
77,5 atau lebih 34 0,68
83,5 atau lebih 20 0,40
89,5 atau lebih 3 0,06
95,5 atau lebih 1 0,02
101,5 atau lebih 0 0,00

Sebagai catatan, dalam beberapa buku penulisan tabel frekuensi kumulatif


menggunakan ujung bawah kelas interval dan ujung atas kelas interval yang
paling atas (tinggi).
Untuk interpretasinya, silakan Anda buat sebagai bahan untuk
didiskusikan dengan teman-teman Anda.
Contoh yang telah dibahas di atas merupakan data numerik atau
kuantitatif. Tentu saja tabel frekuensi juga data dibuat untuk data kategorik
atau kualitatif. Misalkan data yang diambil dari Walpole (1995) tentang
banyaknya mobil milik agen sebuah penyewaan di sebuah Bandar udara
metropolitan.
 MPDR5202/MODUL 2 2.17

Tabel 2.11
Mobil Milik Perusahaan Penyewaan

Model Banyaknya
Buick Regal 12
Chevrolet Monte Carlo 15
OldsmobileCutlass 15
Pontiac Grand Prix 9
Ford Thunderbird 5
Ford Fairmont 10
Pontiac Phoenix 12
ChevroletCitation 20
BuickSkylark 13
Toyota Corolla 5
Honda Accord 6
Cadillac Seville 2
Lincoln Versailles 3
Sumber : Walpole (1995)

Selain itu, tabel frekuensi data kategorial juga digunakan 2 atau lebih
kategori, atau tahun sebagai kategori. Misalkan dapat dilihat dari contoh-
contoh yang diambil dari Sudjana (1989) berikut ini.

Tabel 2.12
Hasil Padi, Ketela, dan Jagung di Indonesia 1955 - 1964
(Ribuan Kilogram)

HASIL
TAHUN
PADI KETELA JAGUNG
1955 144.324 93.170 19.708
1956 146.188 91.409 19.647
1957 146.769 101.182 19.601
1958 153.443 112.783 26.342
1959 159.500 126.969 20.920
1960 168.600 113.765 24.601
1961 159.001 111.895 22.831
1962 171.113 115.860 32.429
1963 152.561 115.752 23.586
1964 162.530 117.464 36.497
Sumber: BPS, Jakarta (Sudjana, 1989)
2.18 Statistika Pendidikan 

Penetapan kategori dalam tabel ini jauh lebih mudah, karena memang
kategorinya sudah ada, jadi kita tidak perlu menetapkan kategori baru untuk
kepentingan penyusunan tabel. Hal yang sama (penting) untuk diketahui
bahwa kategori-kategori yang ada harus mencakup semua data dan tidak ada
satu pun pengamatan yang masuk ke dalam lebih dari satu kategori. Konsep
tentang batas kelas titik tengah kelas biasanya tidak menarik perhatian kita
apabila kita membuat sebaran bagi data kategori.

B. PENYAJIAN DATA DALAM GRAFIK ATAU DIAGRAM

Informasi yang dikandung dalam sebaran frekuensi dalam bentuk tabel


biasanya lebih mudah dan lebih menarik apabila digambarkan secara grafik
atau diagram. Pada kebanyakan orang menurut Walpole (1995) gambar
visual sangat membantu dalam memahami ciri-ciri penting yang ada pada
suatu sebaran/distribusi frekuensi. Banyak diagram dan grafik yang dapat
dibuat dari suatu tabel, misalnya diagram batang, diagram lingkaran, diagram
lambang, diagram garis, poligon frekuensi, ogive, serta diagram batang-daun.
Penting bagi kita untuk mengetahui diagram yang tepat bagi data yang kita
punya serta cara dalam membuatnya, sehingga pemaknaan terhadap diagram
atau grafik yang telah dibuat sesuai dengan data yang telah kita peroleh.
Diagram batang (balok), lingkaran, lambang dan garis biasanya
digunakan untuk data katagorik. Misalkan perhatikan kembali data
banyaknya mobil yang dimiliki oleh sebuah perusahaan pada Tabel 2.11 di
atas.

Gambar 2.2
Digram Batang Banyak Mobil yang Dimiliki Perusahaan Penyewaan
 MPDR5202/MODUL 2 2.19

Apabila dibuat diagram lingkarannya, hasilnya adalah sebagai berikut.

Gambar 2.3
Diagram Lingkaran Banyak Mobil yang Dimiliki Perusahaan Penyewaan

Perlu diperhatikan oleh kita bagaimana menentukan besar juring dari masing-
masing kategorinya, sehingga besar juring proporsional dengan frekuensi
masing-masing kategorinya. Untuk menentukan besar juring yang
proporsional, kita perlu mengetahui sudut pusat dari juring yang akan dibuat,
misalkan untuk data di atas dapat dihitung sudut pusatnya adalah sebagai
berikut.
12
Buick Regal :  3600  34, 0157484  34, 00
127
15
Cherolet Monte Carlo :  3600  42,5196864  42,50
127
15
Oldsmobile Cutlass :  3600  42,5196864  42,50
127

Untuk yang lainnya silakan Anda lanjutkan sendiri. Mengapa kita


mengalikan dengan 3600? Silakan Anda diskusikan dengan teman-teman!
Kedua diagram tersebut dapat dengan mudah dibuat dengan
menggunakan software pada komputer, salah satunya dengan Microsoft
Excel. Dalam software tersebut Anda dapat membuatnya dengan variasi
yang berbeda-beda. Untuk itu silakan Anda untuk mencobanya!
2.20 Statistika Pendidikan 

Perhatikan bahwa diagram batang, lingkaran atau lambang disusun dari


data kategori yang diperoleh dari hasil pengamatan pada waktu tertentu.
Apabila waktu pengamatannya kontinu (periode waktu), maka lebih tepat kita
menggunakan diagram garis. Seperti contoh data hasil bumi (Padi, Ketela,
Jagung) pada Tabel 2.12 di atas, maka grafik atau diagramnya adalah sebagai
berikut.

Gambar 2.4
Hasil Padi, Ketela, dan Jagung di Indonesia 1955 - 1964
(ribuan kilogram)

Dari gambar di atas, kita dapat memberikan interpretasi yang banyak dan
tentu saja bermakna. Misalkan pada periode tersebut hasil padi selalu lebih
tinggi dibandingkan dengan Ketela dan Jagung, ketiga hasil bumi cenderung
selalu naik sehingga di tahun mendatang punya peluang untuk naik juga,
serta interpretasi lainnya. Dengan demikian, kelebihan dari diagram/grafik
garis dapat digunakan untuk interpolasi dan ekstrapolasi (Interpolasi adalah
menaksir suatu nilai di antara nilai-nilai yang diketahui, sedangkan
ekstrapolasi adalah menaksir suatu nilai di luar yang diketahui).
Diagram atau grafik untuk data numerik atau kuantitatif dapat juga
dikembangkan dari tabel frekuensi. Diagram yang pertama dalam data
kuantitatif adalah histogram. Dalam membuatnya menurut Walpole (1995)
akan lebih baik apabila sumbu tegaknya menyatakan frekuensi atau frekuensi
relatif. Histogram frekuensi akan memiliki bentuk yang persis sama dengan
histogram frekuensi relatif, hanya skala sumbu tegaknya yang berbeda.
Untuk lebih jelasnya perhatikan kembali Tabel 2.8 di atas.
 MPDR5202/MODUL 2 2.21

Gambar 2.5
Histogram Frekuensi Skor Siswa

Dan histogram frekuensi relatifnya adalah sebagai berikut.

Gambar 2.6
Histogram Frekuensi Relatif Skor Siswa

Perhatikan bahwa bentuk histogram keduanya persis sama, hanya skala


pada sumbu tegaknya yang berbeda.
Perlu diperhatikan bahwa sering kali kita terjebak dalam membaca
histogram. Kita cenderung membandingkan tinggi persegi panjang – persegi
panjang tersebut dan bukan luasnya. Untuk interval-interval kelas yang
panjangnya sama hal tersebut dapat diterima, tetapi dapat menyesatkan
apabila ada kelas-kelas interval yang panjangnya berbeda. Andaikan kita
2.22 Statistika Pendidikan 

gabungkan kelas interval kedua dan ketiga (65,5 – 71,5 dengan dengan 71,5 –
77,5). Apakah diagramnya menjadi seperti berikut ini?

Gambar 2.7
Histogram Frekuensi yang tidak Benar dengan Lebar Kelas yang Tidak Sama

Pada histogram di atas, frekuensi kelas interval kedua (65,5 – 77,5)


menjadi 14 (14 pengamatan), sebagai hasil gabungan antara kelas interval
kedua dan ketiga tabel sebelumnya. Hal tersebut kurang tepat. Untuk
menggambarkan batang pada kelas gabungan (65,5 – 77,5), kita harus
membagi dua tinggi persegi panjang pada interval tersebut. Akibatnya tinggi
batang pada interval tersebut menjadi 7. Namun untuk membaca histogram
yang baru bukan didasarkan atas tingginya, tetapi atas luasnya, sehingga kita
tidak memerlukan lagi sumbu tegak. Jadi histogramnya adalah sebagai
berikut.
 MPDR5202/MODUL 2 2.23

Gambar 2.8
Histogram Frekuensi dengan Lebar Selang Berbeda dari Skor Siswa

Cara kedua yang bermanfaat bagi penyajian data kuantitatif adalah poligon
frekuensi. Sebelumnya perlu dikenalkan terlebih dahulu tanda kelas atau titik
tengah kelas interval yang sering dilambangkan dengan xi dengan i
menunjukkan kelas interval. Untuk lebih jelasnya perhatikan kembali tabel
frekuensi skor siswa di atas dengan telah memuat kolom baru untuk x i.

Selang Kelas xi f
60 – 65 62,5 2
66 – 71 68,5 7
72 – 77 74,5 7
78 – 83 80,5 14
84 – 89 86,5 17
90 – 95 92,5 2
96 – 101 98,5 1
Jumlah 50

Pikirkan oleh Anda bagaimana menghitung xi pada setiap kelasnya.


Dari tabel di atas, kita menyusun data poligon frekuensinya, sebagai berikut.
2.24 Statistika Pendidikan 

Gambar 2.9
Poligon Frekuensi Skor Siswa

Poligon merupakan bangun segi banyak (bersisi banyak) yang tertutup.


Untuk menutup poligon frekuensi kita memerlukan sebuah selang kelas
tambahan yang ditambahkan pada kedua ujung distribusi, masing-masing
dengan frekuensi nol. Untuk data di atas, kita tambahkan titik tengah kelas
paling kiri ditambahkan 56,5 dan yang paling kanan dengan 104,5 dengan
frekuensi keduanya nol.
Untuk memudahkan membuat poligon frekuensi, kita dapat membuatnya
dari histogram dengan cara menghubungkan titik-titik tengah puncak persegi
panjang-persegi panjang yang berdekatan dan kemudian menambahkan
kedua selang tersebut pada masing-masing ujung-ujungnya.
 MPDR5202/MODUL 2 2.25

Gambar 2.10
Histogram Poligon Frekuensi Skor Siswa

Manfaat yang diambil dari poligon dan histogram diantarnya dapat


melihat kecenderungan distribusi atau sebaran data. Dari gambar di atas, ada
kecenderungan skor hasil ulangan siswa kearah skor yang besar. Hal itu
terlihat dari poligon yang cenderung ke arah sebelah kanan. Kecenderungan
data ke arah sebelah kiri atau ke sebelah kanan, atau seimbang dalam
statistika dinamakan kemenjeluran atau kemiringan dalam istilah statistika
adalah skewness.
Secara umum skewnees atau kemiringan dari distribusi data ada tiga
kemungkinan sebagaimana yang telah disebutkan. Model positif terjadi
apabila kurvanya mempunyai ekor yang memanjang ke sebelah kanan,
sebaliknya, jika ekornya memanjang ke sebelah kiri didapat model negatif.
Dalam kedua hal tersebut, kurva dari distribusi data tidak simetris.
Sedangkan jika kurva distribusi datanya dapat dilipat sepanjang sumbu
vertical (tegaknya), sehingga kedua belahannya saling menutupi, maka kita
katakan bahwa model kurvanya simetris. Secara perbandingan ketiga grafik
dapat dilihat pada akhir kegiatan modul ini.
Walaupun histogram dapat berbentuk beraneka ragam, namun umumnya
distribusi data yang kita jumpai dalam praktek bentuknya menyerupai genta
yang berarti tidak terlalu miring ke kiri atau ke kanan. Bentuk kurva tersebut
nantinya akan memainkan peran yang penting dalam statistika inferensial.
Dan untuk mengetahui lebih lanjut tentang kemiringan ini secara analitik
akan dibahas pada modul 3 setelah kita mempelajari ukuran-ukuran dalam
statistika deskriptif.
2.26 Statistika Pendidikan 

Kurva lain yang sering digunakan dari tabel distribusi frekuensi adalah
ogive. Ogive diperoleh dari tabel distribusi frekuensi kumulatif baik kurang
dari dan kumulatif atau lebih. Sebagai contoh, ogive dari tabel kumulatif dari
skor siswa untuk kurang adalah sebagai berikut.

Gambar 2.11
Ogive Frekuensi Kumulatif (Kurang Dari) Skor Siswa

Dan untuk ogive kumulatif (atau lebih) dari tabel di atas adalah sebagai
berikut.

Gambar 2.12
Ogive Frekuensi Kumulatif (Atau Lebih) Skor Siswa

Perhatikan dan diskusikan oleh Anda dengan teman-teman, bagaimana


menggambarkan kedua ogive di atas!
 MPDR5202/MODUL 2 2.27

Kurva frekuensi kumulatif atau ogive dapat juga dikembangkan dari


frekuensi kumulatif relatifnya (persen), bahkan untuk kepentingan lebih
lanjut,ogive dari frekuensi kumulatif akan lebih mudah dalam membacanya.
Misalkan kita kembali pada tabel distribusi kumulatif relatif kurang dari di
atas. Kurva ogive dari tabel tersebut adalah sebagai berikut.

Gambar 2.13
Ogive Frekuensi Relatif Kumulatif (Kurang Dari) Skor Siswa

Kurva frekuensi kumulatif relatif (persen) ada kaitannya dengan ukuran


letak. Dari kurva tersebut kita dapat melihat bahwa 25% terbawah dari skor
siswa kurang dari titik tengah interval kelas kedua, yakni 74,5, kemudian
skor yang membagi dua kelompok siswa sama banyak atau 50% di bawahnya
dan 50% lebih di atasnya berada dekat dengan tepi atas kelas interval ketiga,
yakni 82. Sedangkan untuk batas 75% siswa ada di bawahnya dan 25% ada di
atasnya adalah skor yang terletak sekitar titik tengah kelas keempat, yakni
86,5. Untuk menentukan secara eksak letak dan data yang membagi distribusi
menjadi beberapa bagian yang sama akan dibahas pada modul berikutnya.
Kegunaan dari ukuran letak tersebut, misalkan kita akan menentukan 25
siswa terbawah harus mendapatkan bimbingan atau remedial, berapa batas
skor siswa yang harus remedial tersebut. Atau mungkin kita akan memilih 5
siswa terbaik, berapa batas skor untuk memperoleh 5 siswa terbaik tersebut.
Nah untuk kepentingan tersebut kita dapat menggunakan ukuran letak suatu
distribusi.
2.28 Statistika Pendidikan 

C. DIAGRAM BATANG-DAUN(STEM AND LEAF)

Selain histogram dan poligon frekuensi, ada diagram lain yang dapat
dikembangkan, yakni Diagram Batang – Daun atau StemandLeaf. Diagram
ini memuat dua sisi, yakni batang (stem) di satu sisi kanan dan daun (leaf) di
sisi lainnya atau kiri. Kedua sisi dipisahkan oleh garis.
Berbeda pada histogram atau poligon, pada diagram batang daun kita
menuliskan skor data pada diagram tersebut. Sebagai contoh perhatikan data
pada diagram 2.1 tentang skor siswa di atas. Dengan menggunakan kelas-
kelas interval 60 – 64, 65 – 69, 70 – 74, 75 – 79, 80 – 84, 85 – 89, 90 – 94,
dan 95 – 100, maka kita dapat menggambarkan diagram batang-daunnya
sebagai berikut!

Gambar 2.14
Diagram Batang – Daun (StemandLeaf) Skor Siswa

Perhatikan bahwa dengan diagram tersebut kita dapat dengan mudah


memberikan interpretasi kecenderungan datanya. Selain itu, kita juga dapat
memperkirakan kurva frekuensinya seperti yang terlihat pada gambar.
Perlu kehati-hatian dalam membuat diagram batang daun ini, kita tidak
bisa menggunakan kelas interval sehingga sulit dalam membuat batangnya.
Misalnya untuk data di atas kita buat interval-interval 61 – 65, 66 – 70, dan
seterusnya. Kita akan kesulitan menetapkan batang bagi interval kelas kedua
dan seterusnya.
 MPDR5202/MODUL 2 2.29

D. KARAKTERISTIK DARI FREKUENSI

Perhatikan bahwa bentuk kurva poligon frekuensi yang telah digambar di


atas merupakan garis patah-patah. Kurva tersebut dapat didekati oleh sebuah
lengkungan halus yang bentuknya secocok mungkin dengan poligon tersebut.
Lengkungan yang diperoleh dari pencocokan atas poligon tersebut
dinamakan kurva frekuensi. Jika semua data dalam populasi dapat
dikumpulkan kemudian dibuat daftar frekuensinya dan akhirnya digambarkan
kurva frekuensinya, maka kurva tersebut dapat menjelaskan sifat atau
karakteristik populasi.
Kurva tersebut menurut Sudjana (1989) merupakan model populasi yang
akan ikut menjelaskan ciri-ciri populasi. Dalam prakteknya, model populasi
ini biasanya didekati oleh atau diturunkan dari kurva frekuensi yang
diperoleh dari sampel yang representatif.
Secara umum ada tiga hal yang menjadi bahasan utama dalam distribusi
frekuensi. Satu dari tiga faktor sudah dibahas sebelumnya. Ketiga faktor
tersebut adalah bentuk kurva, kecenderungan pemusatan, dan sebaran. Secara
rinci dan analitik ketiganya akan dibahas pada modul 3. Dalam kegiatan
belajar ini ketiganya hanya dibahas secara umum ditinjau dari bentuk
kurvanya.

1. Bentuk (Shape)
Bentuk kurva banyak dipengaruhi oleh ukuran sampel (banyak data)
yang diambil dan juga penetapan atau pemilihan panjang interval pada
distribusi frekuensi. Perhatikan tiga gambar berikut yang diambil dari
Minium, dkk. (1993).
2.30 Statistika Pendidikan 

Gambar 2.15
Perubahan Bentuk Kurva Poligon Atas Banyak Data

Terlihat bahwa bentuk kurva dari poligon walaupun nampak ada


kemiripan, tetapi sangat dipengaruhi oleh banyak data, semakin banyak data,
maka bentuk kurva akan mendekati karakteristik populasinya. Adapun
pengaruh dari panjang interval kelas dapat dilihat pada gambar berikut.
 MPDR5202/MODUL 2 2.31

Gambar 2.16
Histogram dari suatu distribusi dengan panjang kelas berbeda
(Minium, dkk., 1993)

Dari gambar di atas, bentuk histogram (kecenderungannya) masih tetap


walaupun panjang interval kelasnya berbeda, hanya jika kita ingin
sebagaimana menurut Minium, dkk. bahwa semakin besar panjang kelas
interval yang dipilih, maka kita akan banyak kehilangan informasi tentang
data yang kita punya.
Dari bentuk kurva ini, kita akan memperoleh berbagai variasi, di
antaranya adalah sebagai berikut.
2.32 Statistika Pendidikan 

Gambar 2.17
Bentuk-Bentuk Kurva Frekuensi
(Minium, dkk., 1993)

Bentuk kurva yang pertama disebut dengan bentul-J (Gambar 2.17-a),


jenis kurva berbentuk J menurut Sudjana (1989) banyak terjadi pada data
dalam bidang ekonomi, industri dan fisika. Kurva berbentuk Gambar 2.17-b
dan 17-c sudah dibahas di atas, yakni kurva dengan kecenderungan datanya
berkumpul pada skor yang rendah (Gambar 2.17-b) atau istilah lainnya
kemiringannya positif, sedang Gambar 2.17-c menunjukkan kurva dengan
data yang cenderung berkumpul pada skor yang besar atau kemiringannya
negatif. Adapun bentuk kurva Gambar 2.17-d, 17-e, dan 17-f
menggambarkan data dipandang dari data yang paling sering muncul.
Gambar 2.17-d merupakan bentuk kurva yang tidak mempunyai data dengan
frekuensi terbanyak (modus), Gambar 2.17-e mempunyai dua modus, dan
Gambar 2.17-f mempunyai 1 modus.

2. Gejala Pemusatan (centraltendency)


Dimanakah data berkumpul, merupakan suatu representasi terbaik dalam
menggambarkan level keseluruhan (overall) skor-skor dari suatu distribusi
data. Dan ukuran inilah yang menjadi bahasan penting dalam statistika
inferensi. Berikut disajikan dua contoh distribusi yang berbeda ukuran gejala
pemusatannya.
 MPDR5202/MODUL 2 2.33

Gambar 2.18
Contoh Dua Kurva dengan Ukuran Gejala Pemusatan Berbeda
(Minium, dkk., 1993)

Ukuran gejala pemusatan secara rinci akan dibahas pada modul


berikutnya.

3. Penyebaran/Keragaman (Variabilitas)
Ukuran ketiga yang dapat muncul/dibaca dari kurva frekuensi adalah
keragaman data. Keragaman data memperlihatkan apakah data cenderung
berkumpul pada ukuran pusatnya atau menyebar. Kadang untuk suatu
distribusi, kita mungkin akan mengalami kesulitan dalam menerjemahkan
atau memaknai ukuran sebaran data ini. Namun apabila kita membandingkan
dua distribusi dengan satuan ukuran yang sama, maka makna yang diambil
dari ukuran penyebaran data ini akan lebih mudah. Sebagai contoh,
perhatikanlah gambar berikut!
2.34 Statistika Pendidikan 

Kurva 2

Kurva 1

Gambar 2.19
Contoh Dua Kurva dengan Ukuran Gejala Pemusatan Berbeda
(Minium, dkk., 1993)

Gambar di atas memperlihatkan dua distribusi yang mempunyai ukuran


pemusatan sama tetapi penyebaran/keragamannya berbeda. Kurva 1
sebarannya datanya lebih tinggi dibandingkan dengan kurva 2. Hal tersebut
dapat dilihat dari bentuk kurva 1 yang lebih “gemuk” dibandingkan dengan
kurva 2. Artinya keragaman data pada distribusi 1 akan lebih besar dari
distribusi data 2. Untuk lebih jelasnya tentang keragaman ini akan dibahas
pada modul berikutnya.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!

1) Untuk setiap kelas interval berikut, manakah yang menurut Anda bisa
digunakan dan tidak bisa digunakan. Berikan alasan yang mendasari
jawaban Anda.
a. 50 atau lebih b. 20 – 25 c. 5 – 9
44 – 49 14 – 19 10 – 14
38 – 43 8 – 13 14 – 19
26 – 31 0–7 20 – 24
 MPDR5202/MODUL 2 2.35

d. 2,5 – 5,0 e. 5 – kurang dari 10 d. 10,00 – 19,99


5,0 – 7,5 10 – kurang dari 15 20,00 – 39,99
7,5 – 10,0 15 – kurang dari 20 40,00 – 59,99
60,00 atau lebih
2) Jelaskan apa yang dimaksud dengan
a. Kelas interval
b. Rentang
c. Panjang kelas
d. Distribusi frekuensi relatif
e. Distribusi frekuensi kumulatif relatif
f. Histogram
g. Poligon frekuensi
h. Kemiringan kurva
3) Berikut data yang dikutif dari Sudjana (1989) tentang angka kelahiran
per 1000 penduduk di berbagai daerah di Jawa selama periode 1955 –
1959.
32,5 34,8 32,8 39,8 32,4 33,1 35,8
34,2 18,5 40,6 32,9 34,2 27,3 29,8
20,7 31,2 32,4 27,8 35,1 37,4 39,7
44,3 32,0 18,2 40,7 34,5 28,6 33,8
42,0 43,2 35,8 32,5 30,0 36,2 33,1
36,5 31,6 31,6 15,8 39,0 29,7
42,8 33,1 43,1 43,1 43,1 34,5
33,3 27,6 30,6 29,6 13,0 30,1
41,7 43,7 37,5 41,7 35,7 42,9
38,5 37,6 36,8 30,8 30,2 33,4
a. Buatlah tabel distribusi frekuensi dengan mengambil banyak kelas
interval 10 buah.
b. Buatlah tabel distribusi frekuensi dengan menggunakan aturan
Sturges dalam menentukan banyak kelasnya!
c. Susun juga histogram dan poligon frekuensinya, kemudian
perkirakan kurva frekuensinya dan berikan tafsirannya.
4) Buatlah diagram batang daun dari data dari soal nomor 3!
5) Buatlah distribusi kumulatif kurang dari beserta ogive dari data pada soal
nomor 3!
2.36 Statistika Pendidikan 

Petunjuk Jawaban Latihan

1) a) ya, b) tidak, c) tidak, d) tidak, e) ya, f) ya


2) Pengertian dari:
a. Kelas interval: batas-batas skor pada tabel distribusi frekuensi
b. Rentang: Data terkecil dikurangi data terbesar
c. Panjang kelas: skor-skor yang terkover dari suatu kelas interval
d. Distribusi frekuensi relatif: distribusi dengan menggunakan
frekuensi dalam persen
e. Distribusi frekuensi kumulatif relatif: distribusi dengan frekuensi
kumulatif dalam persen
f. Histogram: diagram dalam bentuk batang dari distribusi frekuensi
g. Poligon frekuensi: kurva yang diperoleh dengan menghubungkan
frekuensi dari titik tengah kelas
h. Kemiringan kurva: kecenderungan kurva distribusi
3) Tabel distribusi frekuensi
a. Salah satu alternatif dengan banyak kelas 10 buah
Kelas Interval f
12,0 - 15,4 1
15,5 - 18,9 3
19,0 - 22,4 1
22,5 - 25,9 0
26,0 - 29,4 4
29,5 - 32,9 18
33,0 - 36,4 16
36,5 - 39,9 9
40,0 - 43,4 11
43,5 - 46,9 2
Jumlah 65
b. Dengan aturan Sturges dalam menentukan banyak kelas
Rentang = 44,3 – 13,0 = 31,3
Banyak kelas = 1 + 3,3 log 65 = 6,98
Misal diambil banyak kelasnya 7
Panjang kelas = 31,3/7 = 4,47. Misal panjang kelasnya 4,5.
Dengan memilih tepi bawah kelas pertama 13,0 maka tabel
distribusi frekuensinya adalah sebagai berikut
 MPDR5202/MODUL 2 2.37

Kelas Interval f
13,0 - 17,4 2
17,5 - 21,9 3
22,0 - 26,4 0
26,5 - 30,9 12
31,0 - 35,4 22
35,5 - 39,9 13
40,0 - 44,4 13
Jumlah 65

4) Histogram dan polygon


Tabel distribusi frekuensi dengan 10 kelas
2.38 Statistika Pendidikan 

5) Distribusi kumulatif kurang dari


a. Dari tabel pertama
Skor f kum
Kurang dari 11,95 0
Kurang dari 15,45 1
Kurang dari 18,95 4
Kurang dari 22,45 5
Kurang dari 25,95 5
Kurang dari 29,45 9
Kurang dari 32,95 27
Kurang dari 36,45 43
Kurang dari 39,95 52
Kurang dari 43,45 63
Kurang dari 46,95 65
 MPDR5202/MODUL 2 2.39

b. Dari tabel kedua


Skor f kum
Kurang dari 12,95 0
Kurang dari 17,45 2
Kurang dari 21,95 5
Kurang dari 26,45 5
Kurang dari 30,95 17
Kurang dari 35,45 39
Kurang dari 39,95 52
Kurang dari 44,45 65

R A NG KU M AN

1. Untuk meringkas penyajian data digunakan tabel atau daftar.


Tabel/daftar ada beberapa jenis, di antaranya tabel baris-kolom dan
tabel frekuensi. Tabel baris-kolom dibuat apabila data yang kita
miliki terdiri dari 1 atau lebih kategori, sedangkan tabel frekuensi
dibuat hanya untuk data 1 kategori.
2. Kategori-kategori data harus saling lepas dan lengkap, sehingga kita
tidak akan kehilangan data, serta tidak membingungkan dalam men-
inputnya.
3. Untuk tabel frekuensi, data disusun ke dalam interval-interval yang
disebut kelas interval.
4. Dari tabel baris-kolom dapat disusun beberapa diagram atau grafik,
yakni diagram batang, lingkaran dan garis. Sedangkan dari tabel
frekuensi dapat dibuat histogram, poligon frekuensi, pendekatan
kurva distribusi dan ogive.
5. Melalui kurva distribusi dapat diperkirakan kecenderungan sebaran
data; berbentuk J, U atau lainnya. Selain itu dapat juga diperkirakan
kecenderungan dan sebarannya. Kecenderungan data dapat ke arah
kiri, ke arah kanan, atau simetris.
2.40 Statistika Pendidikan 

TES F OR M AT IF 1

Kerjakan semua soal berikut!

1) Perhatikanlah data tentang 200 sukarelawan yang terlibat dalam


pengujian efek atau pengaruh mood dalam pembelajaran. Datanya dapat
dilihat pada tabel frekuensi sebagai berikut.
SKOR GOOD MOOD BAD MOOD
155 – 159 0 1
150 – 154 2 2
145 – 149 4 7
140 – 144 7 12
135 – 139 12 10
130 – 134 14 7
125 – 129 25 4
120 – 124 23 3
115 – 119 18 0
110 – 114 20 2
105 – 109 12 1
100 – 104 8 0
95 – 99 3 1
90 – 94 2 0
Jumlah 150 50

a.
Buatlah frekuensi relatif dari keduanya!
b.
Jika misalkan dari hasil tersebut ingin dibandingkan untuk skor pada
interval 130 – 139, yang manakah lebih mudah memberikan makna
perbandingan keduanya, dari frekuensi atau frekuensi relatif?
Berikan alasan atas jawaban Anda!
2) Konstruksi histogram dan poligon dari data soal nomor 1 di atas,
kemudian bandingkan hasilnya apabila dilihat dari kemiringan,
pemusatan, serta penyebarannya!
3) Data berikut melukiskan berapa kali pencacah harus datang untuk
melengkapi wawancara terhadap responden.
Frekuensi
harus datang 8 7 6 5 4 3 2 1
Responden 3 10 8 48 57 76 166 305
 MPDR5202/MODUL 2 2.41

Buatlah histogram dan grafik distribusi frekuensi kumulatif untuk


menggambarkan hubungan antara 673 responden dan seringnya
pencacah harus datang!
4) Tabel berikut memperlihatkan distribusi frekuensi upah mingguan dalam
dolar dari 70 karyawan suatu perusahaan.

Upah Karyawan
Upah ($) frekuensi
50.00 – 59.99 8
60.00 – 69.99 10
70.00 – 79.99 16
80.00 – 89.99 15
90.00 – 99.99 10
100.00 – 119.99 8
120.00 – 149.99 3
a. Gambarkan histogramnya distribusi frekuensi!
b. Dari hasil (a), berapa banyak karyawan yang berpenghasilan kurang
dari $130?

The American Physics Association melaporkan data mahasiswa tingkat


akhir program studi Fisika menurut wilayah geografisnya pada tahun
1979 sebagai berikut.

Jumlah
Wilayah Geografis
Mahasiswa
New England 524
Middle Atlatic 818
E.N. Central 815
W.N. Central 367
S. Atlantic 679
E.S. Atlantic 196
W.S. Atlantic 436
Mountain 346
Pacific 783

Gunakan program komputer excel untuk menyajikan data di atas dalam


diagram batang dan lingkaran!
2.42 Statistika Pendidikan 

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 25. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut
untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan
Belajar 1.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang
belum dikuasai.
 MPDR5202/MODUL 2 2.43

Kegiatan Belajar 2

Populasi dan Sampel

P ada Kegiatan Belajar 2 dari Modul 2 ini akan dibahas tentang beberapa
konsep atau prosedur yang perlu dipahami oleh kita dalam mempelajari
dan menggunakan statistika. Beberapa istilah penting yang perlu dipahami
oleh kita di antaranya tentang data, peubah acak dan konstanta, sampel acak,
skala pengukuran, serta yang terakhir adalah populasi dan sampel. Untuk
itulah, dua istilah terakhir, yakni populasi dan sampel akan dibahas dalam
kegiatan belajar ini, dan Anda perlu membaca dan mempelajari sampai
paham.
Suatu populasi adalah himpunan yang lengkap dari pengamatan sehingga
investigator dapat membuat sebuah kesimpulan. Suatu sampel adalah bagian
dari populasi. Perlu Anda catat bahwa menurut Minium (1993) yang pertama
adalah population is definedin terms of observations rather than people.
Dengan definisi tersebut, maka orang akan bekerja melalui statistika dengan
lebih baik. Misalkan, kita ingin mengetahui skor ujian masuk perguruan
tinggi dan IPK pada semester pertama dari mahasiswa suatu PTN A Program
Studi tertentu. Kita sedang berbicara tentang dua populasi, walaupun
faktanya adalah kita mengambil data dari subjek yang sama. Dengan
demikian, populasi adalah hal yang berkaitan dengan pengamatan bukan
dengan orangnya (subjeknya).
Hal yang kedua yang perlu dicatat oleh kita adalah Population is defined
by the interest of the inverstigator. Jika para surveyor (orang yang melakukan
survei) mencoba untuk melakukan survei pendahuluan dari pemilihan umum
atau pemilihan presiden, target populasi mereka haruslah memuat preferensi
orang- orang yang akan ikut serta dalam pemilihan umum atau pemilihan
presiden.
Mengapa ada populasi dan sampel? Seperti diketahui bahwa statistika
terbagi dalam dua fase, yakin statistik deskriptif dan statistik inferensial atau
induktif. Fase pertama dikerjakan untuk mengerjakan fase kedua. Fase kedua,
yakni statistik induktif berupaya mengambil kesimpulan tentang karakteristik
populasi yang pada umumnya berdasarkan sampel dari populasi.
2.44 Statistika Pendidikan 

Populasi adalah totalitas semua nilai yang mungkin, baik merupakan


hasil perhitungan maupun hasil pengukuran, kuantitatif maupun
kualitatif, dari karakteristik tertentu mengenai sekumpulan objek yang
lengkap dan jelas.
Sampel adalah sebagian yang diambil dari populasi dengan
menggunakan cara tertentu.

Agar diperoleh kesimpulan yang valid, maka perlu dilakukan cara-cara


yang benar dalam setiap pengambilan sampel. Pengambilan sampel disebut
dengan sampling.
Terdapat beberapa alasan mengapa kita harus melakukan pengambilan
sampel. Seperti diketahui bahwa analisis statistik memerlukan data.
Pengumpulan data bergantung berbagai faktor kadang dilakukan secara
sensus, kadang dilakukan dengan pengambilan sampel. Namun demikian,
pengambilan data secara sensus sering tidak dapat dilakukan dengan berbagai
alasan, di antaranya:
1. Ukuran populasi yang terhingga tetapi besar, misalkan populasi yang
ukurannya 5 miliar tentulah kita akan mengalami kesulitan dalam
melakukan sensus.
2. Ukuran populasi yang tak hingga. Populasi jenis ini sebenarnya hanya
konseptual, sehingga kita akan mengalami kesulitan dalam melakukan
sensus
3. Masalah biaya.
4. Masalah Waktu.
5. Percobaan yang sifatnya merusak.
6. Masalah ketelitian.
7. Faktor ekonomis.

A. RANCANGAN PENGAMBILAN SAMPEL

Apabila peneliti telah menetapkan akan melakukan pengambilan sampel,


maka perlu diperhatikan beberapa hal, yakni:
1. Rumuskan permasalahan yang akan diteliti
2. Tentukan dengan jelas batas populasi mengenai masalah yang akan
diteliti.
3. Definisikan dengan jelas dan tepat segala unit dan istilah yang
diperlukan.
 MPDR5202/MODUL 2 2.45

4. Tentukan unit pengambilan sampel yang diperlukan. Unit pengambilan


sampel adalah satuan terkecil yang menjadi anggota populasi.
5. Tentukan dan rumuskan cara-cara pengukuran dan penilaian yang
dilakukan
6. Jika ada, kumpulkan segala keterangan tentang hal yang akan diteliti.
7. Tentukan ukuran sampel, yakni berapa unit pengambilan sampel yang
akan diambil dari populasi.
8. Tentukan cara pengambilan sampel yang dianggap tepat agar diperoleh
sampel yang representatif.
9. Tentukan cara pengumpulan data yang akan dilakukan.
10. Tentukan metode analisis yang akan digunakan.
11. Sediakan biaya dan sebaiknya (jika mungkin) meminta bantuan ahli
sebagai pembantu tetap atau konsultan.

B. TEKNIK PENGAMBILAN SAMPEL

Seperti dijelaskan sebelum bahwa teknik pengambilan sampel atau


sering hanya disebut pengambilan sampel merupakan teknik pengambilan
sampel dari populasinya. Salah satu bentuk pengambilan sampel adalah
probability sampling. Sampel yang diperoleh dari pengambilan sampel
peluang yaitu sampel yang anggota-anggotanya diambil dari populasi
berdasarkan peluang yang diketahui. Khususnya jika pengambilan sampel
yang memberikan peluang yang sama bagi setiap anggota populasi untuk
terpilih menjadi anggota sampel, maka sampel yang diperoleh disebut sampel
acak (random). Dengan sampel acak peneliti mempunyai cara objektif untuk
menilai presisi hasilnya dan karenanya memungkinkan untuk menaksir dan
menghitung besarnya variasi pengambilan sampel atau kekeliruan
pengambilan sampel, yakni perbedaan antara statistik sampel dan parameter
populasi dari mana sampel itu diambil secara acak, dilakukan dengan
prosedur yang sama apabila dilakukan dengan sensus.
Perlu diketahui bahwa pengambilan sampel acak ini hanya berlaku untuk
populasi terhingga dimana pengambilan sampel dilakukan dengan
pengembalian. Dengan cara itulah peluang yang sama untuk tiap anggota
dapat terjadi.
2.46 Statistika Pendidikan 

C. BEBERAPA MACAM PENGAMBILAN SAMPEL

Cara pengambilan sampel acak sangat baik dilakukan pada populasi


yang homogen, yakni populasi yang anggotanya di bawah penyebab yang
sama. Jadi homogen diartikan sebagai suatu yang kualitatif. Untuk populasi
yang tidak homogen dilakukan dengan cara lain yakni, pengambilan sampel
strata dan pengambilan sampel klaster.
Pengambilan sampel acak sederhana (simple random sampling)
dilakukan ketika anggota populasi dianggap homogen. Pengambilan sampel
dapat dilakukan dengan cara pengundian atau dengan menggunakan bilangan
acak. Misalnya dari populasi yang terdiri dari 500 anggota akan diambil
sampel sebanyak 20 anggota. Tulislah pada sehelai kertas kecil yang
berukuran sama dan beridentitas sama dengan nomor-nomor masing-masing
anggota. Kemudian kertas tersebut digulung dan dimasukkan ke dalam kotak
serta diaduk. Dengan mata tertutup maka diambilah satu kertas. Sisanya
diaduk kembali dan diambil satu lagi begitu seterusnya dilakukan 20 kali.
Cara ini disebut dengan pengundian. Cara lain dapat digunakan bilangan
acak yang biasanya ada pada lampiran buku.
Secara diagram, teknik pengambilan sampel sederhana dapat disajikan
sebagai berikut.

Gambar 2.20
Diagram Pengambilan sampel Sederhana

Pengambilan sampel strata dilakukan apabila keheterogenan anggota


populasi dapat dibuat petala (strata) berdasarkan karakteristik tertentu
sedemikian hingga pada setiap stratanya menjadi homogeny. Dari setiap
strata tersebut kemudian diambil secara acak anggota-anggotanya. Gabungan
dari pengambilan pada setiap stratanya membentuk sebuah sampel strata.
Apabila pengambilan anggota dari setiap strata tidak dilakukan secara acak,
dengan cara lain, maka terjadilah pengambilan sampel kuota.
 MPDR5202/MODUL 2 2.47

Pengambilan sampel strata paling baik dilakukan dengan menggunakan


cara proporsional, yakni banyak anggota dari setiap strata diambil sebanding
dengan ukuran setiap strata populasinya. Jika cara ini yang dilakukan, maka
biasanya disebut dengan pengambilan sampel acak proporsional.

Contoh 2.1:
Misalkan sampel berukuran 100 mahasiswa pascasarjana akan diambil dari
mahasiswa tahun pertama, kedua, dan tiga ke atas dengan jumlah berturut-
turut 300, 350, dan 500 mahasiswa. Jumlah dari keseluruhan mahasiswa
adalah 1150 orang. Dengan demikian dapat dihitung:
300
Dari strata I (TK I) diambil sebanyak 100  26,1  26
1150
350
Dari strata II (TK II) diambil sebanyak 100  30, 4  30
1150
Dan dari strata III (TK III ke atas) diambil sebanyak
500
100  43, 45  44
1150
Secara diagram pengambilan sampel stara dapat digambarkan sebagai
berikut.

Gambar 2.21
Diagram Pengambilan sampel Strata

Pengambilan sampel klaster dilakukan apabila populasi dibagi-bagi


dalam klaster atau kelompok. Secara acak klaster-klaster yang diperlukan
diambil secara acak. Setiap anggota yang berada di dalam klaster yang
terambil merupakan sampel yang diperlukan.
Secara diagram pengambilan sampel klaster dapat digambarkan sebagai
berikut.
2.48 Statistika Pendidikan 

Gambar 2.22
Diagram Pengambilan Sampel Klaster

Contoh 2.2:
Untuk meneliti pendapatan keluarga di suatu daerah, pengambilan sampel
klaster dapat dilakukan. Misalkan daerah itu terdiri dari kabupaten/kota.
Kabupaten dan kota terdiri dari kecamatan, kecamatan terdiri dari desa dan
desa terdiri dari rukun tetangga. Untuk mendapatkan sampel klaster mula-
mula secara acak diambil sampel terhadap kabupaten, dari tiap kabupaten
dalam sampel (kabupaten sampel) diambil kecamatan yang disebut
kecamatan sampel. Begitu juga dari kecamatan sampel diambil desa. Dan
dari desa sampel diambil rukun tetangga. Keluarga-keluarga dalam rukun
tetangga inilah setelah digabungkan merupakan anggota sampel klaster.
Pengambilan sampel lainnya selain pengambilan sampel acak adalah
pengambilan sampel non acak di antaranya: pengambilan sampel sistematik,
pengambilan sampel kuota, pengambilan sampel incidental, purposive
sampling, pengambilan sampel jenuh, dan snowball sampling.
Pengambilan sampel sistematik dilakukan dengan cara mengambil
anggota sampel pada jarak interval tertentu (waktu, ruang atau ukuran yang
uniform). Jika populasi berukuran N dan akan diambil sampel berukuran n,
N
maka jarak interval besarnya . Dengan demikian diperoleh n buah interval
n
dan dari tiap interval itu diambil sebuah anggota dengan pengambilan
anggota pertama dilakukan secara acak.
Pengambilan sampel kuota adalah teknik untuk menentukan sampel
dari populasi yang mempunyai karakteristik tertentu sampai jumlah kuota
yang diinginkan. Sebagai contoh, akan melakukan penelitian dengan jumlah
sampel 100. Jika pengumpulan data belum memenuhi kuota 100, maka
penelitian dianggap belum selesai.
 MPDR5202/MODUL 2 2.49

Pengambilan sampel insidental merupakan teknik pengambilan sampel


yang dilakukan secara kebetulan, yakni siapa saja yang kebetulan/incidental
bertemu peneliti, maka digunakan sebagai sampel, bila subjek itu dipandang
cocok sebagai sumber penelitian.
Porposive sampling adalah teknik pengambilan sampel dengan
didasarkan pada pertimbangan tertentu. Misalkan akan dilakukan penelitian
tentang pendidikan, maka orang yang ahli pendidikan dipandang sumber
yang relevan untuk menjadi subjek penelitian.
Pengambilan sampel jenuh adalah teknik pengambilan sampel apabila
semua anggota populasinya digunakan sebagai subjek penelitian. Hal ini
dilakukan apabila jumlah anggota populasinya sedikit, kurang dari 30. Atau
peneliti menginginkan generalisasi yang kesalahannya sangat kecil.
Snowball sampling adalah penentuan sampel yang dimulai dari jumlah
kecil, kemudian membesar seperti bola salju. Pengambilan sampel berhenti
apabila peneliti merasa bahwa data yang dibutuhkan sudah dipandang cukup.

D. KEKELIRUAN PENGAMBILAN SAMPEL DAN NON


PENGAMBILAN SAMPEL

Dalam penelitian terdapat dua jenis kekeliruan pokok yang dapat terjadi,
yakni kekeliruan pengambilan sampel dan nonpengambilan sampel.
Kekeliruan pengambilan sampel dapat terjadi sebagai akibat adanya
pemeriksaan yang tidak lengkap tentang populasi dan penelitian hanya
berdasarkan sampel. Jelaslah bahwa penelitian yang dilakukan terhadap
sampel dengan penelitian terhadap populasi tentu akan berbeda. Perbedaan
yang terjadi antara hasil penelitian terhadap sampel dan terhadap populasi
dengan prosedur yang sama disebut kekeliruan pengambilan sampel. Untuk
meminimalkan kekeliruan ini, maka pengambilan sampel hendaknya
dilakukan secara acak.
Kekeliruan nonpengambilan sampel dapat diakibatkan oleh:
1. Populasi tidak didefinsikan sebagaimana mestinya
2. Populasi yang menyimpang dari populasi yang seharusnya dipelajari
3. Instrumen tidak dirumuskan sebagaimana mestinya
4. Istilah-istilah dalam penelitian yang didefinisikan secara tidak tepat atau
digunakan tidak konsisten.
5. Responden tidak memberi jawab yang akurat, menolak untuk menjawab
atau tidak ada di tempat.
2.50 Statistika Pendidikan 

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!
1) Jelaskan apa yang dimaksud dengan:
a. Pengambilan sampel peluang
b. Pengambilan sampel nonpeluang
c. Pengambilan sampel seadanya
d. Pengambilan sampel purposive
e. Pengambilan sampel kuota
f. Pengambilan sampel sistematika
g. Pengambilan sampel sederhana
h. Pengambilan sampel strata
i. Pengambilan sampel klaster
j. Pengambilan sampel multiple
2) Jelaskan apa yang dimaksud dengan kekeliruan pengambilan sampel dan
kekeliruan non-pengambilan sampel!
3) Berikanlah beberapa penyebab terjadinya kekeliruan pengambilan
sampel dan kekeliruan non-pengambilan sampel!
4) Cobalah Anda rumuskan sebuah masalah penelitian. Tetapkan
populasinya dan teknik pengambilan sampel apa yang tepat digunakan
untuk penelitian tersebut! Jelaskan alasan Anda menggunakan teknik
pengambilan sampel tersebut!

Petunjuk Jawaban Latihan

1) Penjelasan dari:
a. Sampling peluang: Subjek yang diambil dari populasi mempunyai
peluang yang sama untuk terambil
b. Sampling nonpeluang: Pengambilan subjek dalam populasi
memperhatikan berbagai kondisi sehingga setiap subjek tidak
mempunyai peluang yang sama untuk terambil
c. Sampling seadanya: merupakan teknik sampling yang dilakukan
secara kebetulan, yakni siapa saja yang kebetulan/insidental bertemu
peneliti, maka digunakan sebagai sampel, bila subjek itu dipandang
cocok sebagai sumber penelitian.
 MPDR5202/MODUL 2 2.51

d. Sampling purposive: teknik sampling dengan didasarkan pada


pertimbangan tertentu. Misalkan akan dilakukan penelitian tentang
pendidikan, maka orang yang ahli pendidikan dipandang sumber
yang relevan untuk menjadi subjek penelitian.
e. Sampling kuota: adalah teknik untuk menentukan sampel dari
populasi yang mempunyai karakteristik tertentu sampai jumlah
kuota yang diinginkan. Sebagai contoh, akan melakukan penelitian
dengan jumlah sampel 100. Jika pengumpulan data belum
memenuhi kuota 100, maka penelitian dianggap belum selesai.
f. Sampling sistematika dilakukan dengan cara mengambil anggota
sampel pada jarak interval tertentu (waktu, ruang atau ukuran yang
uniform). Jika populasi berukuran N dan akan diambil sampel
N
berukuran n, maka jarak interval besarnya . Dengan demikian
n
diperoleh n buah interval dan dari tiap interval itu diambil sebuah
anggota dengan pengambilan anggota pertama dilakukan secara
acak.
g. Sampling sederhana: dilakukan ketika anggota populasi dianggap
homogen. Pengambilan sampel dapat dilakukan dengan cara
pengundian atau dengan menggunakan bilangan acak.
h. Sampling strata: dilakukan apabila keheterogenan anggota populasi
dapat dibuat petala (strata) berdasarkan karakteristik tertentu
sedemikian hingga pada setiap stratanya menjadi homogen.
i. Sampling klaster: dilakukan apabila populasi dibagi-bagi dalam
klaster atau kelompok. Secara acak klaster-klaster yang diperlukan
diambil secara acak. Setiap anggota yang berada di dalam klaster
yang terambil merupakan sampel yang diperlukan.
j. Sampling multiple: teknik sampling probabilitas yang melibatkan
berbagai teknik sampling.
2) Kekeliruan sampling: perbedaan yang terjadi antara hasil penelitian
terhadap sampel dan terhadap populasi dengan prosedur yang sama.
3) Kekeliruan sampling diakibatkan oleh tidak dilakukan secara acak.
Kekeliruan non sampling dapat diakibatkan oleh:
a. Populasi tidak didefinsikan sebagaimana mestinya
b. Populasi yang menyimpang dari populasi yang seharusnya dipelajari
c. Instrumen tidak dirumuskan sebagaimana mestinya
2.52 Statistika Pendidikan 

d. Istilah-istilah dalam penelitian yang didefinisikan secara tidak tepat


atau digunakan tidak konsisten.
e. Responden tidak memberi jawab yang akurat, menolak untuk
menjawab atau tidak ada di tempat.

R A NG KU M AN

1. Populasi adalah totalitas semua nilai yang mungkin, baik


merupakan hasil perhitungan maupun hasil pengukuran, kuantitatif
maupun kualitatif, dari karakteristik tertentu mengenai sekumpulan
objek yang lengkap dan jelas.
2. Sampel adalah sebagian yang diambil dari populasi dengan
menggunakan cara tertentu.
3. Ada 2 jenis kelompok pengambilan sampel, yakni pengambilan
sampel dengan peluang dan pengambilan sampel non peluang.
Pengambilan sampel dengan peluang di antaranya pengambilan
sampel sederhana, starata, dan klaster. Sedangkan pengambilan
sampel non peluang di antaranya pengambilan sampel sistematik,
kuota, purposive, jenuh, incidental, dan snowball.

TES F OR M AT IF 2

Jawablah pertanyaan berikut dengan ringkas dan jelas!

1) Kapan kita harus melakukan sensus dan kapan kita harus melakukan
pengambilan sampel? Jelaskan !
2) Berikan perbedaan antara populasi hingga dan tak hingga, kemudian
berikan contoh untuk memperjelasnya!
3) Buatlah contoh cara pengambilan sampel secara sederhana, strata, dan
klaster!
4) Berikan contoh pengambilan sampel dengan sistematika, incidental,
purposive, jenuh, dan snowball!
5) Misalkan pada penelitian tentang hasil belajar matematika siswa sekolah
dasar di kota Anda. Karena jumlah siswanya banyak, maka dilakukan
pengambilan sampel. Tuliskan langkah-langkah pengambilan subjek
(siswa) yang akan diteliti oleh Anda!
 MPDR5202/MODUL 2 2.53

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 20. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut
untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan
Belajar 2.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 2, terutama bagian yang
belum dikuasai.
2.54 Statistika Pendidikan 

Kunci Jawaban Tes Formatif

Tes Formatif 1
1) Tabel distribusi frekuensi relatifnya adalah
a.
GOOD BAD frel frel
SKOR
MOOD MOOD (goodmood) (badmood)
155 – 159 0 1 0,00 0,02
150 – 154 2 2 0,01 0,04
145 – 149 4 7 0,03 0,14
140 – 144 7 12 0,05 0,24
135 – 139 12 10 0,08 0,20
130 – 134 14 7 0,09 0,14
125 – 129 25 4 0,17 0,08
120 – 124 23 3 0,15 0,06
115 – 119 18 0 0,12 0,00
110 – 114 20 2 0,13 0,04
105 – 109 12 1 0,08 0,02
100 – 104 8 0 0,05 0,00
95 – 99 3 1 0,02 0,02
90 – 94 2 0 0,01 0,00
Jumlah 150 50 1,00 1,00

b. Dilihat dari frekuensi eksak pada interval tersebut, goodmood dua


kali lebih banyak dibandingkan dengan badmood. Tetapi dari
frekuensi relatif, badmood jauh lebih tinggi. Untuk membandingkan
dua ukuran yang berbeda lebih comparable atau adil jika
menggunakan ukuran relatif.

2) Konstruksi histogram dan poligon dari data soal nomor 1 di atas,


kemudian bandingkan hasilnya apabila dilihat dari kemiringan,
pemusatan, serta penyebarannya!
 MPDR5202/MODUL 2 2.55

Histogram Good Mood

Dari kedua histogram dan poligon frekuensi, nampak bahwa badmood


lebih kemiringannya negatif, artinya data berkumpul di sebelah kanan,
skornya besar-besar. Sedangkan yang goodmod agak di sebelah kiri
tetapi hampir di tengah dan mendekati simetris. Jadi sebaran data
goodmood hampir menyebar secara simetris, tetapi badmood lebih
banyak berkumpul pada skor-skor yang besar.
2.56 Statistika Pendidikan 

3) Histogramnya adalah sebagai berikut

Frekuensi Kumulatifnya adalah

Frek
kedatangan Fkum (reponden)
1 305
2 471
3 547
4 604
5 652
6 660
7 670
8 673

4) Dalam membuatnya histogramnya, perlu digunakan pokok bilangannya,


misalnya 10.
Histogramnya adalah sebagai berikut.
 MPDR5202/MODUL 2 2.57

Perhatikan bahwa untuk kelas ke-6, tinggi diagramnya setengah dari


frekuensi kelas ke-3, yakni 4. Dan untuk kelas ke-7, tinggi diagram
adalah 8 seperti kelas ke-1.
Dari diagram batang tersebut, maka banyaknya karyawan yang upahnya
kurang dari $130 adalah 68 orang.

5) Diagramnya adalah sebagai berikut.


Diagram batang
2.58 Statistika Pendidikan 

Diagram lingkaran

Test Formatif 2
1) Sensus dilakukan apabila subjek dalam penelitian kita kecil sehingga
peneliti memungkinkan untuk menggunakan subjek tersebut secara
keseluruhannya. Pengambilan sampel dilakukan apabila cakupan subjek
penelitiannya luas bahkan mungkin tak hingga sehingga peneliti tidak
mungkin menjadikan keseluruhan subjek tersebut karena adanya
keterbatasan peneliti, misalnya waktu.
2) Populasi dengan subjek yang terhitung dan berhingga. Sebaliknya
populasi tak hingga dipandang sebagai populasi yang berisikan
konseptual peneliti akan mengalami kesukaran dalam melakukan sensus.
Walaupun demikian, pada ovulasi terhingga pun belum tentu dapat
dilakukan sensus akibat terlalu banyak anggotanya. Selain itu, ketika kita
melakukan pengambilan sampel dengan teknik pengembalian, maka
populasi yang hingga dapat dianggap menjadi populasi tak hingga.
3) Contoh pengambilan sampel sederhana. Misalkan akan dilakukan survei
tentang pendapat mahasiswa pascasarjana Pendidikan Dasar UT terhadap
layanan akademik. Peneliti memandang semua mahasiswa pada tiap
angkatan mempunyai peluang yang sama untuk menjadi responden.
Contoh pengambilan sampel strata. Misalkan akan dilakukan survei
pengaruh pendidikan orang tua terhadap gaya belajar anak di sekolah
dasar. Subjek dalam penelitian adalah anak dan orang tua. Pendidikan
orang tua diklasifikasi menjadi, tidak tamat SD, tamatan SD, SMP,
 MPDR5202/MODUL 2 2.59

SMA, dan perguruan tinggi. Kemudian peneliti mengambil secara acak


siswa pada masing-masing klasifikasi latar belakang pendidikan orang
tuanya.
Contoh pengambilan sampel kluster. Misalkan peneliti melakukan survei
tentang waktu belajar siswa sekolah dasar di suatu daerah (kabupaten).
Kemudian peneliti menetapkan kecamatan sebagai klusternya, dan
dipilihnya secara acak sederhana beberapa kecamatan.
4) Contoh pengambilan sampel sistematika. Misalkan kita akan mengambil
pengambilan sampel dari buku telepon (buku kuning), kita dapat
menetapkan dengan mudah secara sistematis dalam mengambil
sampelnya. Pengambilan sampel insidental contohnya ketika Anda
mengambil sampel terhadap orang tua siswa pada saat rapat sekolah
dengan orang tua. Subjek dipilih dengan cara siapa yang Anda temui
atau ketika mereka tiba di sekolah. Pengambilan sampel dengan
purposive contohnya dilakukan ketika kita mau menguji sebuah inovasi
dalam media pembelajaran. Anda memilih dua kelas dengan
pertimbangan dari kepala sekolah atau pimpinan lainnya. Pengambilan
sampel jenuh contohnya ketika Anda meneliti anak putus sekolah dasar
di kecamatan Anda. Ternyata jumlahnya sangat sedikit, misalnya 20
orang. Maka seluruh anak tersebut dijadikan sampel. Snowball
pengambilan sampel dilakukan dalam penelitian kualitatif, misalnya
Anda ingin mengetahui penyebab suatu kejadian, Anda pertama
mengambil seorang subjek A yang menurut Anda terkait kejadian,
kemudian dari sana Anda peroleh informasi bahwa subjek tersebut diajak
oleh B, hasil wawancara mendorong Anda untuk memilih C dalam
pendalaman informasi, dan seterusnya sampai data atau informasi yang
diperlukan dipandang cukup.
5) Pengambilan sampel dapat digunakan multistage random sampling.
Misalkan pertama kita jadikan kecamatan sebagai klaster, dari sana kita
ambil beberapa kecamatan. Dalam kecamatan ada beberapa sekolah, kita
lihat apakah sekolah-sekolah tersebut homogeny atau tidak, jika
homogen, maka kita dapat memilih beberapa sekolah. Dari beberapa
sekolah kita buat kelas sebagai strata. Dari kelas-kelas yang ada pada
sekolah pengambilan sampel itulah kita mengambil siswa sebagai unit
analisisnya. Jika sekolah-sekolah tidak homogen kualitasnya, maka dapat
membagi sekolah-sekolah sebagai strata sesuai dengan kualitasnya,
misal tinggi, sedang dan kurang. Dari masing-masing kualitas tersebut
2.60 Statistika Pendidikan 

kita ambil beberapa sekolah. Langkah berikutnya sama setelah diperoleh


sekolah-sekolah pada tiap strata, kita jadikan kelas sebagai strata,
sehingga kita peroleh siswa pada masing-masing kelasnya.
 MPDR5202/MODUL 2 2.61

Daftar Pustaka

Dowdy, S. & Wearden, S. 1991. Statistcs for Research (second edition).


New York: John Wiley & Son.

Kerlinger, F. N. 2006. Asas-Asas Penelitian Behavioral (terjemahan).


Jogjakarta: Gadjah Mada University Press.

Hogg, R. V. & Craigh, A. T. 1978. Introductionto Mathematical Statistics


(fourth edition). New York: Mcmillan Publishing Co. Inc.

Minium, E. W., King, B. M. & Bear, G. 1993. Statistical Reasoning in


Psychology and Education. New York : Joh Wiley & Sons, Inc.

Purcell, E. J. & Vareberg, D. 1995. Kalkulus dan Geometri Integral. Alih


bahasa: I Nyoman Susila, Bana Kartasasmita & Rawuh. Jakarta:
Erlangga.

Spiegel, M. R. 1992. Statistik (Versi Metrik). Alih bahasa : I Nyoman Susila.


Jakarta: Erlangga.

Steel, R. G. D. & Torrie, J. H. 1995. Prinsip dan Prosedur Statistika. Suatu


Pendekatan Biometrik. Alih Bahasa: Bambang Sumantri. Jakarta:
Gramedia Pustaka Utama.

Sudjana, 1989. Metoda Statistika. Bandung: Tarsito.

Sugiyono, 2008. Statistika untuk Penelitian. Bandung: Alfabeta.

Walpole, R. E., 1995. Pengantar Statistika (edisi ke-3). Alih bahasa:


Bambang Sumantri. Jakarta : Gramedia Pustaka Utama.
Modul 3

Statistika Deskriptif
Dr. Jarnawi Afgani Dahlan

PEN D AH U LU A N

S ebagaimana dijelaskan dalam Modul 1 dan 2 bahwa bahasan statistika


dibagi dalam dua bagian, yakni statitistika deskriptif dan statistika
inferensial. Statistika deskriptif berbicara atau memaknai kondisi data
berdasarkan sampel. Sedangkan statistika inferensial difokuskan pada
penaksiran apa yang terjadi dalam populasi berdasarkan data sampelnya.
Perlu diketahui bahwa dalam populasi dan sampel terdapat ukuran-
ukuran. Ukuran-ukuran dalam sampel itulah yang disebut dengan statistika
deskriptif. Apa saja ukuran-ukuran tersebut? Secara umum ada tiga kelompok
ukuran dalam statistika, tetapi ada juga yang mengelompokkannya menjadi
dua bagian. Kelompok-kelompok tersebut adalah ukuran gejala pemusatan
(central tendency), ukuran letak, dan ukuran penyebaran atau variabilitas
(dispersi). Sedangkan dalam statistika inferensial dibahas juga dua kelompok,
yakni penaksiran dan pengujian hipotesis. Dalam Modul 3 ini kita akan
membahas tentang statistika deskriptif.
Selain itu, perlu juga diketahui bahwa jika diketahui dua distribusi data
yang secara teori memiliki kaitan, misalnya ukuran berat badan dengan tinggi
badan, maka kita dapat mengetahui berapa besar kaitan di antara kedua
variabel tersebut. Jika kedua variabelnya berhubungan secara, dalam
statistika, analisisnya dilakukan dengan regresi.

A. DESKRIPSI SINGKAT

Modul 3 ini terdiri dari 2 kegiatan belajar. Kegiatan belajar pertama


membahas tentang statistika deskriptif yang meliputi ukuran gejala
pemusatan, ukuran letak, dan ukuran penyebaran dari suatu distribusi data.
Ukuran gejala pemusatan membahas kecenderungan pemusatan data; apakah
sebelah kiri rata-rata, pada rata-rata, atau sebelah kanan rata-rata. Melalui
ukuran rata-rata, median, dan modus kita dapat memperkirakan
3.2 Statistika Pendidikan 

kecenderungan pemusatannya. Begitu juga ukuran letak; kuartil, desil dan


persentil, pemaknaan dari ukuran tersebut mengarah pada pemusatan data.
Ukuran penyebaran yang terdiri dari rentang, rentang antar kuartil,
simpangan antara kuartil, varians dan simpangan baku. Ukuran ini
memperlihatkan keruncingan distribusi data, apakah menyebar atau lebih
banyak berkumpul di sekitar rata-rata. Bahasan kegiatan belajar1 diakhiri
dengan angka baku dan koefisien variasi. Angka baku banyak berperan
dalam statistika inferensial, sedangkan koefisien variasi lebih memberikan
pemaknaan pada perbandingan variasi antara dua distribusi data. Kegiatan
Belajar 2 membahas tentang statistiska deskriptif untuk distribusi bivariat:
korelasi dan regresi. Korelasi berkaitan dengan derajat kekuatan hubungan
antara dua variabel, sedangkan regresi berkaitan dengan masalah prediksi.

B. RELEVANSI

Statistika deskriptif merupakan langkah pertama dalam melakukan


analisis data. Analisis dilakukan terhadap data sampel. Melalui data sampel
inilah kita akan melakukan inferensi. Ada dua fokus yang dipelajari dalam
statistika deskriptif, yakni ukuran gejala pemusatan (CenralTendency) dan
ukuran penyebaran (dispersion). Penting bagi kita untuk dapat memaknai
keduanya, sehingga akan mempunyai gambaran awal tentang variabel yang
diteliti.

C. TUJUAN INSTRUKSIONAL KHUSUS

Setelah mempelajari Modul 3 ini diharapkan mahasiswa dapat:


1. Menghitung dan menafsirkan ukuran gejala pemusatan (rata-rata, modus,
dan median) dari suatu distribusi.
2. Menghitung dan menjelaskan tafsiran ukuran penyebaran suatu
distribusi.
3. Menghitung dan menjelaskan sifat-sifat angka baku.
4. Menjelaskan perhitungan dan kegunaan koefisien variasi.
5. Menghitung dan menjelaskan nilai korelasi antara dua distribusi.
6. Menghitung persamaan regresi sederhana dan menggunakannya untuk
penaksiran nilai/skor satu variabel jika skor variabel lainnya diketahui.
 MPDR5202/MODUL 3 3.3

Kegiatan Belajar 1

Statistika Deskriptif

A. UKURAN GEJALA PEMUSATAN

Untuk memahami tentang ukuran gejala pemusatan, perhatikan contoh


yang diberikan oleh Minium, dkk. (1993) berikut.

Kepala sekolah SMA Middlebury ingin mengetahui bagaimana para siswa


di sekolahnya dibandingkan dengan siswa-siswa secara nasional pada
hasil belajarnya. Tes dilakukan untuk menguji siswa dalam beragam
mata pelajaran serta merupakan satu ukuran yang dipakai untuk
melihat apakah mereka mengalami kemajuan yang normal. Untuk tiap
mata pelajaran, dia menempatkan kedua distribusi skor-skor (hasil tes
para siswanya dengan tes hasil nasional) tersebut berdampingan dan
membandingkannya. Tetapi hal tersebut hanya dapat memberi dia
jawaban yang sekedar kira-kira. Menyadari tentang hal tersebut, maka
dia menghitung statistik mean, modus, dan median dari kedua
distribusi skor-skor tersebut.

Ukuran-ukuran statistik yang dihitung oleh kepala sekolah tersebut


disebut dengan ukuran gejala pemusatan atau tendensi sentral
(centraltendency). Tujuan dari perhitungan statistik tersebut adalah
memberikan satu bilangan rangkuman yang paling baik dalam
mendeskripsikan kedudukan sentral (pusat) dari suatu distribusi observasi
keseluruhannya. Seperti yang kita telah lihat bahwa ukuran ini membantu
dalam membandingkan performansi suatu kelompok dengan performansi
kelompok lainnya atau kelompok acuan yang standar. Dengan pembandingan
tersebut, kita segera akan memperoleh informasi apakah suatu kelompok
mencapai keberhasilan yang diinginkan. Seperti contoh kepala sekolah di
atas, apakah para siswanya, sebagai suatu kelompok, memerlukan
pembelajaran tambahan atau tidak dalam suatu mata pelajaran yang
dibandingkannya.
Ukuran gejala pemusatan juga membantu menyederhanakan
perbandingan antara dua atau lebih kelompok yang diuji pada kondisi-kondisi
berbeda. Misalkan dalam pendidikan di sekolah dasar, untuk membantu
pemahaman siswa dalam geometri guru menggunakan alat peraga kongkrit
(model-model bangun), alat peraga dengan media Teknologi Informatika dan
3.4 Statistika Pendidikan 

Komputer (TIK), atau tidak menggunakan alat peraga (cukup digambar di


papan tulis). Setelah pembelajaran selesai, kita memberikan tes kepada ketiga
kelompok tersebut dan kemudian kita menghitung ukuran-ukuran
kecenderungan pemusatannya, serta membandingkannya. Walaupun kita
butuh lebih dari analisis lebih lanjut (statistika inferesial) dalam
menyimpulkan bahwa penggunaan alat peraga dapat meningkatkan hasil
belajar siswa dalam pembelajaran materi geometri, tetapi pada langkah awal,
suatu perbandingan di atas akan memperoleh gambaran terdapatnya suatu
kemungkinan.
Sebagaimana telah Anda pelajari waktu perkuliahan S1 atau bahkan di
SMA, terdapat beberapa ukuran dari tendensi sentral ini. Namun demikian,
ada tiga ukuran yang sering digunakan dalam penelitian pendidikan atau
psikologi, bahkan dalam penelitian kuantitatif ilmu-ilmu lainnya. Ketiga
ukuran tersebut adalah mean (rata-rata), median, dan modus. Untuk rumus-
rumus perhitungannya, sangat mungkin Anda telah mengenal dan
mengetahuinya. Dalam bahasan ini, kita akan lebih memfokuskan pada
fungsi dan kebermaknaan atau kasus-kasus, serta kaitan di antara ketiga dari
ukuran-ukuran tersebut.

1. Modus
Dalam kehidupan sehari-hari modus dimaknai sebagai “paling sering
muncul” dan dalam statistika, modus mempunyai makna yang hampir sama.
Dalam suatu distribusi, modus merupakan data yang paling sering muncul
atau frekuensinya terbesar. Simbol untuk modus dilambangkan dengan Mo.
Perlu diketahui bahwa modus dari suatu distribusi data mungkin ada dan
tidak ada. Dan jika ada mungkin juga tunggal atau lebih dari satu. Sehingga
jika dilihat dari modusnya, distribusi data ada yang tidak ada modus, uni
modus, bimodus atau multimodus. Untuk lebih memahaminya, perhatikanlah
gambar berikut.
 MPDR5202/MODUL 3 3.5

tidak ada modus uni modus

multimodus bimodus
Gambar 3.1
Kurva Distribusi Frekuensi Ditinjau dari Modus

Untuk menghitung modus dari data yang disajikan dalam tabel distribusi
frekuensi dapat digunakan rumus sebagai berikut.
 b 
M0  b  p  1 
 b1  b2 

Dengan
M0 : modus
b : batas bawah kelas modus
p : panjang interval kelas modus
b1 : selisih frekuensi kelas modus dengan frekuensi sebelum kelas modus
b2 : selisih frekuensi kelas modus dengan frekuensi setelah kelas modus

Contoh 3.1
Tentukan modus dari data berikut.
a. 2, 4, 5, 6, 7, 8
b. 3, 4, 4, 5, 5, 6, 6, 12, 12
c. 2, 3, 4, 4, 5, 5, 6, 6, 6, 8
d. 3, 4, 4, 4, 5, 5, 6, 6, 6, 8
e. 3, 4, 4, 4, 5, 5, 5, 6, 6, 6, 8
3.6 Statistika Pendidikan 

Jawab.
Modus dari data di atas adalah
a. Tidak ada modus karena setiap data kemunculannya sama, yakni 1 kali
b. Tidak ada modus karena setiap data kemunculannya sama, yakni 2 kali
c. Mo = 6 (tiga kali muncul, paling banyak)
d. Mo = 4 dan 6 (masing-masing muncul 3 kali, paling banyak)
e. Mo = 4, 5 dan 6 (masing-masing muncul 4 kali, paling banyak.

Contoh 3.2 :
Hitung modus dari data berikut.

Tabel 3.1
Distribusi Frekuensi

Interval Batas Riil F


96 – 98 95,5 – 98,5 1
93 – 95 92,5 – 95,5 1
90 – 92 89,5 – 92,5 3
87 – 89 86,5 – 89,5 3
84 – 86 83,5 – 86,5 4
81 – 83 80,5 – 83,5 7
78 – 80 77,5 – 80,5 8
75 – 77 74,5 – 77,5 9
72 – 74 71,5 – 74,5 12
69 – 71 68,5 – 71,5 6
66 – 68 65,5 – 68,5 11
63 – 65 62,5 – 65,5 7
60 – 62 59,5 – 62,5 2
57 – 59 56,5 – 59,5 3
54 – 56 53,5 – 56,5 3

Jawab.
Untuk menentukan modus dari data yang telah disusun dalam tabel distribusi
frekuensi, langkah pertama adalah menentukan kelas modus. Kelas modus
dipilih dari kelas interval yang frekuensinya paling tinggi. Untuk tabel di
atas, kelas modusnya adalah kelas ineteval ke-9. Dari kelas tersebut, maka
diperoleh.
b = 71,5
p =3
b1 = 12 – 9 = 3
b2 = 12 – 6 = 6
 MPDR5202/MODUL 3 3.7

Dengan data tersebut, maka


 3  3
M o  71,5  3    71,5  3    72,5
 3 6  9 .
Jadi modusnya adalah 72,5.
(Perhatikan bahwa skor 72,5 tidak ada pada data mentahnya)

2. Median
Median adalah nilai yang membagi distribusi menjadi dua bagian yang
sama banyak. Dalam statistika median disimbolkan dengan Me.
Untuk data mentah, kita pikirkan bahwa median sebagai skor tengah dari
suatu distribusi didasarkan pada frekuensi skor. Untuk mencari median,
pertama-tama kita harus menyusun skor-skor secara terurut dari yang paling
rendah ke yang paling tinggi. Ada beberapa kemungkinan dari nilai median
ini. Pertama, jika n (banyak data) ganjil, maka median akan terletak pada
skor data yang kita punya. Misalkan contohnya sebagai berikut.
2, 3, 4, 6, 9, 10, 11
Median dari data di atas adalah 6. Banyaknya data yang lebih kecil dari
median ada 3 buah, pun sebaliknya, banyak data yang lebih besar dari median
ada 3 buah juga. Apabila banyak datanya genap, maka median akan terletak
di antara dua buah data yang mengapit kedudukan median. Misalkan data di
atas jika ditambah 1 buah lagi
2, 3, 4, 6, 9, 10, 11, 13
Maka median dari distribusi data tersebut terletak di antara 6 dan 8 dan dapat
dihitung dengan sebagai berikut.
96
Me  6     6  1,5  7,5
 2 
Minium, dkk. (1993) memberi kasus bagaimana jika datanya berulang seperti
berikut.
5, 7, 8, 8, 8, 8
Mediannya terletak di antara 8 yang pertama dengan 8 yang kedua. Untuk
masalah ini sering kali orang lebih suka menetapkan bahwa mediannya
adalah 8. Namun menurut Minium, dkk., untuk kasus di atas kita harus
menggunakan teknik interpolasi untuk menentukan mediannya. Dalam data
tersebut, 8 mewakili semua nilai antara batas riil di bawah 7,5 dan batas riil
atas 8,5 (masalah batas bawah dan batas atas sudah dibahas pada tabel
distribusi frekuensiModul 2). Oleh karena itu median dari distribusi data di
3.8 Statistika Pendidikan 

atas terletak setelah 8 yang pertama, atau seperempat selang lewat lebar
1
interval 1,0. Jadi mediannya adalah 7,5  ( 1,0)  7,75 .
4
Apabila kita telah menyusun datanya dalam bentuk tabel distribusi
frekuensi, maka median dapat dihitung (sebenarnya perkiraan) dengan rumus
sebagai berikut.
 1 N F 
Me  b  p 2 
 f 
Dengan:
Me : Median
b : Batas bawah kelas median
p : Panjang interval kelas median
N : Banyak Data
F : Frekuensi kumulatif sebelum kelas median
f : Frekuensi kelas median

Perlu diperhatikan, bahwa penggunaan rumus di atas diawali dengan


menentukan kelas median. Untuk lebih jelasnya
Contoh 3.3:
Perhatikan data yang diambil dari Minium, dkk, 1993) berikut.

Tabel 3.2
Distribusi Frekuensi Kumulatif Relatif

Interval Batas Riil f f kum


96 – 98 95,5 – 98,5 1 80
93 – 95 92,5 – 95,5 1 79
90 – 92 89,5 – 92,5 3 78
87 – 89 86,5 – 89,5 3 75
84 – 86 83,5 – 86,5 4 72
81 – 83 80,5 – 83,5 7 68
78 – 80 77,5 – 80,5 8 61
75 – 77 74,5 – 77,5 9 53
72 – 74 71,5 – 74,5 12 44
69 – 71 68,5 – 71,5 6 32
66 – 68 65,5 – 68,5 11 26
63 – 65 62,5 – 65,5 7 15
60 – 62 59,5 – 62,5 2 8
57 – 59 56,5 – 59,5 3 6
54 – 56 53,5 – 56,5 3 3
 MPDR5202/MODUL 3 3.9

Dari tabel di atas, maka dapat kita hitung mendiannya adalah sebagai berikut.
 40  32 
M e  71,5  3  
 12 
8
 71,5  (3)  
 12 
 71,5  2
 73,5

Dengan demikian mediannya adalah 73,5.

3. Mean atau Rata-Rata


Mean atau rata-rata atau rataan merupakan salah satu ukuran yang
penting dalam metode statistika, khususnya dalam statistika inferensial.
Hakikatnya dalam statistika dikenal tiga buah mean, yakni mean aritmetika,
mean geometri, dan mean harmonik. Dalam prakteknya, mean arimetika yang
lebih banyak berperan.
Rata-rata (mean) arimetika dan selanjutnya kita sebut dengan rata-rata
(untuk membedakan apabila yang dimaksud bukan mean arimetika, maka
ditambahkan dengan harmonik atau geometrik) adalah hasil dari jumlah
keseluruhan skor dalam suatu distribusi dibagi dengan banyak keseluruhan
skor atau boleh juga jumlah data dari suatu distribusi dibagi dengan banyak
data.
Demi memudahkan dalam mengungkapkan rata-rata dari suatu
distribusi, maka diperlukan simbol. Seperti telah dibahas dalam Modul 1
bahwa X (dalam penulisan kapital) menyatakan kolektif yang
menggambarkan suatu himpunan skor-skor pengamatan, dan Xi menyatakan
suatu skor ke-i dalam suatu distribusi, maka himpunan skor dalam suatu
sampel boleh dinyatakan sebagai berikut:
X : X1 , X 2 , X 3 , , Xn
Seperti telah dibahas sebelumnya, apabila skor-skor tersebut dijumlahkan,
maka kita dapat menggunakan notasi , yakni
n

X
i 1
i  X1  X 2  X 3   Xn

Apabila ada dua kelompok data, maka kita menggunakan simbol lain,
misalkan Y untuk melambangkan himpunan kedua.
3.10 Statistika Pendidikan 

Simbol rata-rata untuk populasi dan sampel tentu harus dibedakan,


untuk rata-rata populasi disimbolkan dengan  X atau  dibaca “miu” dan
untuk rata-rata sampel disimbolkan dengan X dibaca “X bar” atau “X
garis”. Untuk menghitung keduanya digunakan aturan sebagai berikut.

X i
X  i 1
(rata-rata untuk populasi, dengan N = ukuran populasi)
N
n

X i
X  i 1
(rata-rata untuk sampel, dengan n = ukuran sampel)
n

Apabila datanya sudah disusun dalam tabel distribusi frekuensi, maka rata-
rata dihitung dengan menggunakan aturan sebagai berikut.
k

fX i i
X  i 1
k

f i 1
i

dengan :
k : banyak kelas interval
Xi : titik tengah kelas interval ke-i
fi : frekuensi kelas interval ke-i

Dengan mudah kita dapat menyimpulkan bahwa perhitungan rata-rata


dari data yang sudah disusun dalam tabel frekuensi hasilnya berupa
pendekatan. Dengan tabel frekuensi yang berbeda yang disusun dari data
mentah yang sama, maka hasil perhitungan rata-rata yang diperoleh akan
mungkin berbeda juga. Dengan demikian, perhitungan rata-rata yang
dipandang paling akurat dihasilkan dari perhitungan data mentahnya.
Contoh 3.4:
perhatikan kembali data pada Modul 2 tentang skor hasil ulangan siswa. Dari
data mentahnya kita peroleh bahwa
61  67  70   88  89  89  89 3996
X   79,92
50 50
Silahkan Anda memeriksanya!
 MPDR5202/MODUL 3 3.11

Sedangkan apabila kita gunakan tabel berikut untuk menghitung rata-


rata, maka hasilnya adalah sebagai berikut.

Tabel 3.3
Tabel untuk Perhitungan Rata-Rata dari Data
dalam Tabel Frekuensi

Selang Kelas Xi f Xifi


60 – 65 62,5 2 125
66 – 71 68,5 7 479.5
72 – 77 74,5 7 521.5
78 – 83 80,5 14 1127
84 – 89 86,5 17 1470.5
90 – 95 92,5 2 185
96 – 101 98,5 1 98.5
Jumlah 50 4007

Dengan demikian
4007
X  80,14
50
Dan apabila kita gunakan tabel distribusi lainnya untuk menghitung rata-rata,
maka diperoleh

Tabel 3.4
Tabel untuk Perhitungan Rata-Rata dari Data
dalam Tabel Frekuensi

SKOR Xi fi Xi fi
96 – 98 97 1 97
93 – 95 94 0 0
90 – 92 91 2 182
87 – 89 88 7 616
84 – 86 85 10 850
81 – 83 82 6 492
78 – 80 79 8 632
75 – 77 76 4 304
72 – 74 73 3 219
69 – 71 70 4 280
66 – 68 67 3 201
63 – 65 64 0 0
60 - 62 61 2 122
Jumlah 50 3995
3.12 Statistika Pendidikan 

Dari tabel tersebut, diperoleh


3995
X   79,9
50
Dari perhitungan di atas, nampak bahwa rata-rata yang dihitung dari tabel
frekuensi yang ketiga lebih mendekati hasil perhitungan rata-rata yang
dihitung melalui data mentahnya. Hal ini seperti yang diungkapkan Minium,
dkk. (1993) bahwa semakin banyak kelas interval yang digunakan sejatinya
makin baik dalam menggambarkan kondisi data mentahnya.

4. Sifat-sifat dari Median, Modus dan Rata-Rata serta Kaitannya


dengan Kemiringan Kurva
Seperti dijelaskan dalam Modul 1 bahwa statistika merupakan alat yang
dapat digunakan oleh para peneliti dalam memperoleh informasi. Alat dalam
menggambarkan ukuran gejala pemusatan seperti yang telah Anda pelajari
ada 3, yakni modus, median dan mean. Ketika kita menggunakan salah satu
dari ketiganya sebagai alat dalam memaknai data, ada kelebihan dan
kelemahannya. Modus sangat mudah diperoleh, namun sayangnya modus
tidak stabil dari sampel ke sampel. Selain itu, apabila data kita sudah disusun
dalam tabel distribusi frekuensi, letak modus sangat dipengaruhi oleh lebar
atau panjang kelas-kelas interval yang digunakan. Kendala lainnya adalah
modus dari data mungkin tidak tunggal. Namun demikian, modus merupakan
satu-satunya ukuran yang dapat dipakai untuk data yang memiliki skala
nominal. Misalkan, jenis kelamin, warna mata, jenis kendaraan, dan lainnya,
tidak ada ukuran tendensi sentral lain yang sesuai untuk distribusi-distribusi
data tersebut. Mengapa? Coba Anda diskusikan dengan teman-teman Anda!
Secara aplikatif, Minium, dkk. memberi contoh kasus yang tepat dalam
menggunakan modus. Beberapa tahun yang lalu, sebuah majalah
memanfaatkan modus sedemikian hingga sebagai cara yang ideal. Majalah
tersebut melaporkan peringkat-peringkat oleh para pembaca atas film-film
layar lebar dengan kategori Exellent (E), Good (G), Fair (F), dan Poor (P).
Film-film dalam jumlah yang banyak ditanggapi oleh para pembaca majalah,
dan kemudian disusun menurut abjad, hasilnya disajikan contoh tabel
frekuensi relatif dari peringkat-peringkatnya sebagai berikut.
 MPDR5202/MODUL 3 3.13

Tabel 3.5
Pendapat Responden Tentang Film

E G F P
Purple Passion 0 10 40 50
Puzzle Me Not 5 25 55 15
Sumber: Minium, dkk. (1993)

Dari ilustrasi tabel di atas, modusnya dituliskan pada sel yang diarsir,
pembaca dapat dengan mudah menyimpulkan kualitas film-film melalui
modus dalam klasifikasi-klasifikasi tersebut. Dengan demikian, modus
merupakan cara untuk mempercepat kerja seseorang dalam memilih film-film
mana yang akan ditontonnya.
Ukuran gejala pemusatan kedua adalah rata-rata. Seperti sudah
dijelaskan di atas, bahwa rata-rata banyak berperan dalam statistika
inferensial. Namun sekarang kita akan membahas sifat rata-rata sebagai salah
satu ukuran gejala pemusatan (statistika deskriptif). Rata-rata merupakan
ukuran yang sensitif atau sering dikatakan juga responsif. Hal ini disebabkan
apabila kita menaikkan atau menurunkan nilai skor yang mana saja dari data
kita, maka akan terjadi perubahan pada rata-rata. Penyebabnya adalah rata-
 n 
rata sangat bergantung pada jumlah data   X i  . Apabila kita mengubah
 i 1 
salah satu nilai data, maka jumlah data juga akan berubah.
Selain responsif, rata-rata dapat dipandang sebagai titik kesimbangan
dari suatu distribusi. Ini makna yang paling mudah ditafsirkan dari rata-rata.
Bayangkan oleh Anda tentang mekanika, dalam hal ini jungkat-jungkit. Pada
jungkat-jungkit tentunya ada titik tumpu (titik keseimbangan), papan dengan
berat diabaikan, dan skor-skor suatu distribusi yang tersebar pada papan
tersebut. Untuk lebih jelasnya, perhatikan ilustrasinya dari gambar berikut.
3.14 Statistika Pendidikan 

1 2 3 4 5 6 7 8 12 12

X 6

X  X : -5; -4; -3; -2; -1 1; 2; 6; 6

  X  X   15   X  X   15

Gambar 3.2
Rata-Rata sebagai Titik Kesimbangan Data

Jika kita menghitung  XX sebelah kiri rata-rata dan sebelah kanan
rata-rata, maka hasilnya akan sama, yakni 15. Dengan demikian jungkat-
jungkit tersebut akan berada dalam posisi yang seimbang.
Dari hasil di atas juga kita peroleh bahwa apabila kita
menghitung   X  X  , maka hasilnya akan sama dengan nol (0). Untuk
n

i 1

membuktikannya, silakan Anda untuk mencobanya!


Rata-rata juga sensitif terhadap skor-skor ekstrem dari distribusi
dibandingkan dengan ukuran tendensi sentral lainnya; modus dan median.
Modus dan median nilainya tidak akan berpengaruh dengan adanya skor-skor
ekstrem, tetapi rata-rata dapat berpengaruh. Untuk lebih jelasnya akan
dibahas bersamaan dengan sifat-sifat dari median.
Sebagaimana telah dijelaskan bahwa rata-rata sangat berguna dalam
perhitungan statistika inferensial. Salah satu alasannya adalah karena rata-
rata sangat berkaitan erat dengan operasi aritmetika dan aljabar. Sedangkan
modus dan median tidak. Dan dari keseluruhan sifat-sifat rata-rata di atas,
yang paling penting adalah rata-rata stabil dari satu sampel ke sampel
lainnya, sehingga dalam statistika inferensial kita menggunakan distribusi
sampling rata-rata sebagai alat untuk inferensi baik penaksiran maupun
pengujian hipotesis. Misalkan dari suatu populasi berukuran N diambil
serangkaian sampel (sampel-sampel) secara acak yang berukuran sama n,
maka rata-rata dari sampel-sampel itu akan beragam, median-mediannya juga
 MPDR5202/MODUL 3 3.15

akan beragam, dan modus-modusnya juga beragam. Namun demikian, jika


kurva distribusinya berbentuk genta atau lonceng, maka rata-rata dari sampel-
sampel yang berturutan akan mempunyai keragaman paling kecil. Dengan
kata lain, rata-rata paling tahan terhadap variasi penyampelan. Dengan daya
tahan ini, rata-rata merupakan suatu indikator berharga atas apa yang terjadi
tentang ukuran gejala memusat dari populasi.
Ukuran gejala memusat yang ketiga adalah median. Median dapat
menjawab berapa banyak skor yang di bawah atau di atasnya, tetapi tidak
memberi informasi seberapa besar atau jauh skor-skor itu adanya. Apabila
ada skor yang amat rendah atau tinggi (mungkin berupa pencilan), maka akan
diperoleh median yang sama. Dengan demikian, median kurang sensitif akan
adanya skor yang ekstrim. Minium, dkk. memberi contoh dengan data gaji 27
pemain Bisbol Tim Atalanta untuk musim 1989 dengan datanya seperti yang
terlihat pada tabel berikut.

Tabel 3.6
Gaji Pemain Atalanta Pada Tahun 1989

Nama Pemain Besar Gaji ($) Nama Pemain Besar Gaji ($)
Murphy 2.000.000 Glavine 117.500
Sutter 1.729.167 Treadway 95.000
Davis 886.667 Smoltz 86.000
Perry 662.500 Blauser 82.000
Thomas 485.000 Gregg 82.000
McDowell 405.000 Castillo 71.000
L. Smith 400.000 Berroa 70.500
Benedict 370.000 Clary 68.000
Evans 322.000 Lillinquist 68.000
Eirchon 272.000 Stanton 68.000
Russell 145.000 Valdez 68.000
Alvarez 125.000 Wetherby 68.000
P. Smith 125.000 Whited 68.000
Boever 124.000
Sumber : Minium, dkk. (1993)

Gaji yang merupakan median dari ke-27 gaji pemain tersebut adalah
$124.500, tetapi rata-rata dari gajinya adalah $335.753,11 yang besarnya
hampir tiga kali lebih besar dari median. Gaji untuk dua pemain termahal,
yakni Murphy ($2.000.000) dan Sutter ($ 1.729.167) sekitar tiga kali dari
pemain termahal ketiga (Davis). Gaji dua pemain termahal sangat
mempengaruhi keseluruhan (jumlah total) gaji pemain, dan hal tersebut
3.16 Statistika Pendidikan 

berpengaruh terhadap rata-rata, tetapi tidak terhadap median. Apabila kedua


pemain tersebut gajinya sekitar $1.500.000, maka mediannya tidak akan
berubah, tetapi skornya akan lebih dekat dengan rata-rata. Oleh karena itu,
dalam distribusi data yang amat tidak simetris (terlalu miring ke kiri atau ke
kanan) atau memiliki skor pencilan, median boleh jadi merupakan pilihan
yang lebih baik untuk ukuran gejala pemusatan (central tendency).
Bahasan terakhir dari ketiga ukuran gejala memusat ini adalah kaitan
matematis di antara ketiganya. Secara empirik menurut Sudjana (1989)
hubungan antara rata-rata, modus, dan median adalah sebagai berikut.

Mean – Modus = 3(Mean – Median)


Atau
X  M o  3( X  M e )

Dalam grafik yang simetri, harga-harga ketiganya akan sama. Dan apabila
kurvanya miring ke kiri atau ke kanan, hubungan empirik dari model
matematika di atas dapat diandalkan. Keterkaitan antara ukuran-ukuran
gejala pemusatan dengan kemiringan atau kecenderungan kurva distribusi
dapat terlihat dari gambar berikut.

Gambar 3.3
Pola Kemiringan Kurva Distribusi Berdasarkan Ukuran Gejala Memusat

Seperti telah dibahas pada Modul 2, bahwa kurva a) merupakan kurva


distribusi dengan kemiringan ke kiri atau mempunyai kemiringannya negatif.
 MPDR5202/MODUL 3 3.17

Dan kurva b) merupakan kurva dari distribusi yang mempunyai kemiringan


ke kanan atau kemiringannya positif. Minium, dkk. (1989)
menganalogikannya dengan kepalan tangan dengan ibu jarinya teracung. Jika
kepalan tangan itu mewakili kumpulan skor-skor dan ibu jari menyatakan
ekornya, maka ibu jari itu menunjuk ke arah di mana kemiringan terjadi.
Adapun informasi atau penjelasan yang dapat diambil dari ketiga kurva
di atas adalah sebagai berikut. Pertama, kurva a) yang menyatakan distribusi
data dengan kemiringan negatif akan mempunyai urutan gejala memusat
X  Me  Mo . Letak median akan berada di sekitar dua pertiga jarak di
antara modus dan rata-rata. Rendahnya mean dibandingkan dengan median
dan modus dipengaruhi oleh banyaknya skor-skor yang kecil dan relatif
ekstrem pada daerah ekor. Kedua, kurva b) yang menyatakan distribusi data
dengan kemiringan positif mempunyai gejala yang berkebalikan dengan
kurva a), yakni Mo  Me  X . Ketiga, kasus di mana Mo  Me  X , bentuk
kurva ini simetris. Namun demikian, kondisi ini sangat jarang ditemui secara
empirik, jadi bentuk kurva c) bersifat teoritis.
Sebagai contoh untuk kasus data pada Tabel 3.1, di atas telah dihitung
bahwa modus, median, dan rata-ratanya adalah 72,5; 73,5 dan 79,9
 M o  M e  X  . Dengan demikian, sebaran data hasil tes tersebut
kemiringannya positif atau ke arah kanan, yakni datanya memusat pada skor
“kecil”.

B. UKURAN LETAK

Ada tiga ukuran letak yang digunakan dalam statistika, yakni kuartil,
desil, dan persentil. Ukuran letak mempunyai fungsi yang hampir sama
dengan ukuran gejala memusat, yakni melihat informasi kecenderungan
distribusi data.
Kuartil membagi distribusi data menjadi empat kelompok yang sama
banyak melalui kuartil ke-1 atau Q1, kuartil ke-2 atau Q2 kuartil ke-3 atau Q3.
Untuk data mentah, letak kuartil ke-i dapat ditentukan dengan rumus

 i  n  1 
Letak Qi  data ke   , i  1, 2,3
 4 
3.18 Statistika Pendidikan 

Contoh 3.5
Misalkan diketahui sampel dengan data yang sudah tersusun sebagai berikut.
2, 5, 6, 7, 8, 10, 11, 12, 15, 16, 16, 17

Data tersebut banyaknya 12 buah.


 112  1 
Letak Q1  data ke    data ke-3 4
1

 4  .
Jadi nilai Q1  data ke -3  1
4  data ke-4 - data ke-3  6  14  7  6  6 14 .
 2 12  1 
Letak Q2  data ke    data ke-6 2
1

 4 
Jadi nilai Q2  data ke -6  12  data ke-7 - data ke-6   10  12 11  10   10 12 .
 3 12  1 
Letak Q3  data ke    data ke-9 4
3

 4 
Jadi
nilai Q3  data ke -9  34  data ke-10 - data ke-9   15  34 16  15  15 34 .
Dengan demikian, jika digambarkan masing-masing kuartil dari data tersebut
adalah sebagai berikut.

2, 5, 6, 7, 8, 10, 11, 12, 15, 16, 16, 17

6 14 10 12 15 34

Secara grafik, letak kuartil dapat digambarkan dalam grafik atau diagram
Bloxplot, yakni sebagai berikut.
 MPDR5202/MODUL 3 3.19

Gambar 3.4
Contoh Diagram Boxplot

Adapun jika datanya sudah dinyatakan dalam tabel distribusi frekuensi, maka
untuk menentukan kuartil atau lebih jelasnya pendekatan dari kuartil dapat
dihitung dengan rumus sebagai berikut.

 i nF 
Qi  b  p  4 
 f 
i  1,2 ,3
Dengan :
b : batas bawah kelas Qi, yakni kelas interval di mana Qi akan terletak
p : panjang kelas interval Qi
F : jumlah frekuensi kumulatif dengan tanda kelas lebih kecil dari tanda
kelas Qi
f : frekuensi kelas Qi
sebagai contoh perhatikan tabel frekuensi kumulatif di bahwa, yakni

Contoh 3.6
Tabel 3.7
Distribusi Frekuensi Kumulatif Relatif

Interval Batas Riil F f kum f kumrelatif


96 – 98 95,5 – 98,5 1 80 100,0
93 – 95 92,5 – 95,5 1 79 98,8
90 – 92 89,5 – 92,5 3 78 97,5
87 – 89 86,5 – 89,5 3 75 93,8
84 – 86 83,5 – 86,5 4 72 90,0
81 – 83 80,5 – 83,5 7 68 85,0
78 – 80 77,5 – 80,5 8 61 76,2
3.20 Statistika Pendidikan 

Interval Batas Riil F f kum f kumrelatif


75 – 77 74,5 – 77,5 9 53 66,2
72 – 74 71,5 – 74,5 12 44 55,0
69 – 71 68,5 – 71,5 6 32 40,0
66 – 68 65,5 – 68,5 11 26 32,5
63 – 65 62,5 – 65,5 7 15 18,8
60 – 62 59,5 – 62,5 2 8 10,0
57 – 59 56,5 – 59,5 3 6 7,5
54 – 56 53,5 – 56,5 3 3 3,8

Karena banyaknya data 80, maka untuk menentukan Q1 kita perlu ¼  80 =


20 data. Dengan demikian, letak Q1 berada kelas interval 66 – 68 atau kelas
kelima dari bawah. Dari kelas interval tersebut kita peroleh b = 65,5; p = 3,
f = 11, dan F = 3 + 3 + 2 + 7 = 15. Dari informasi tersebut, maka kita
dapatkan bahwa

 1  80  15 
Q1  65,5  3  4   65,5  3(0, 45)  66,85 .
 11 

Dengan cara yang sama, kita dapat menghitung

 1  80  32 
Q2  71,5  3  2   71,5  3(0, 67)  73,51 .
 12 

Dan
 3  80  53 
Q3  77,5  3  4   77,5  3(0,875)  80,125
 8 

Andaikan data di atas merupakan skor ulangan siswa, maka sebanyak 75%
siswa mendapat nilai ulangan paling besar 80,125, sedangkan 25% lagi
paling rendah mendapat nilai ulangan 80,125.
Jika kumpulan data dibagi ke dalam 10 bagian yang sama banyak, maka
didapat sembilan pembagi dan tiap pembagi dinamakan desil. Untuk
menghitung desil dari data mentah prinsipnya sama dengan menentukan
kuartil, yakni ditentukan terlebih dahulu letaknya dengan rumus

 i  n  1 
Letak Di  data ke   , i  1, 2,3, ,9
 10 
 MPDR5202/MODUL 3 3.21

Dan kemudian barulah dihitung desilnya sebagaimana kita menghitung


kuartil. Apabila datanya dalam tabel frekuensi, maka menentukan desil ke-i
dihitung dengan aturan sebagai berikut.

 i nF 
Di  b  p  10 
 f 
i  1,2 ,3, ,9

Cobalah Anda hitung D2 dan D5 dari data yang telah disusun pada tabel 3.7.
Ukuran letak yang ketiga adalah persentil, yakni membagi data menjadi
100 bagian sama banyak. Dan kita akan memperoleh 99 pembagi yang
dinamakan dengan persentil pertama, kedua, dan seterusnya hingga persentil
ke-99. Dan untuk persentilnya ke-I, dilambangkan dengan Pi dengan i = 1, 2,
3, …, 99.
Untuk data mentah, perhitungan Pi prosedurnya sama dengan
perhitungan Ki dan Di, dengan letak persentilnya dihitung melalui rumus
berikut.

 i  n  1 
Letak Pi  data ke   , i  1, 2,3, ,99
 100 
Apabila datanya dalam tabel frekuensi, maka menentukan desil ke-i dihitung
dengan aturan sebagai berikut.

 i nF 
Pi  b  p  100 
 f 
i  1,2 ,3, ,99

Cobalah Anda hitung P25 dan P75 dari data yang telah disusun pada tabel 3.7
dan bandingkan hasilnya dengan Q1, Q2 dan Q3 yang telah dihitung.

C. UKURAN PENYEBARAN

Ukuran penyebaran atau variabilitas menggambarkan secara kuantitatif


yang berkaitan dengan sejauh mana skor-skor dalam suatu distribusi
menyebar atau berkumpul bersama. Ukuran-ukuran ini mendeskripsikan
sebaran suatu dari keseluruhan himpunan skor-skor atau dengan kata lain
3.22 Statistika Pendidikan 

ukuran variabilitas tidak menentukan sejauhmana suatu skor tertentu


menyebar dari pusat kelompok, serta tidak memberikan informasi tentang
bentuk suatu distribusi atau tingkat performansi suatu kelompok. Gambar 3.5
di bawah ini memperlihatkan kemungkinan dua kurva ditinjau dari rata-rata
dan variabilitasnya.

Gambar 3.5
Kemungkinan Dua Distribusi Kurva Berdasarkan
Rata-Rata dan Simpangan Baku

Kurva a) memperlihatkan dua kurva yang mempunyai rata-rata sama


tetapi variabilitasnya berbeda. Kurvanya sama-sama simetris, tetapi
bentuknya berbeda, yang satu lebih runcing daripada yang lainnya. Kurva b)
memperlihatkan sebaliknya, dua kurva dengan rata-rata yang berbeda tetapi
 MPDR5202/MODUL 3 3.23

mempunyai variabilitas yang sama. Bentuk kurvanya sama, tetapi karena


rata-rata berbeda, maka titik simetrinya berbeda. Dan kurva c)
memperlihatkan dua kurva dengan rata-rata dan variabilitas yang tidak sama
dan bentuk kurvanya berbeda.
Sebagaimana ukuran gejala memusat, ukuran variabilitas juga
memegang peranan penting dalam statistika inferensial dan untuk itu, Anda
diharapkan dapat mempelajarinya dengan teliti.
Ada empat jenis ukuran variabilitas yang sering digunakan, yakni
rentang (sudah dibahas pada Modul 2), rentang semi interkuartil, varians, dan
simpangan baku.

1. Rentang
Rentang atau jangkauan merupakan ukuran variabilitas yang paling
sederhana dan kita sudah mengetahui serta menggunakannya dalam
penyusunan tabel distribusi frekuensi. Rentang dihitung dengan
mengurangkan skor terbesar dengan skor terkecil dari skor data mentah.
Ukuran rentang menurut Sudjana (1989) banyak digunakan dalam bidang
industri. Dalam bidang pendidikan, rentang biasa digunakan untuk melihat
jarak perbedaan maksimum antara siswa yang mendapat skor terendah
dengan siswa yang memperoleh skor tertinggi.

2. Rentang Semi Interkuartil


Oleh karena rentang hanya bergantung pada dua skor saja, maka ukuran
variabilitas yang diperoleh tentu saja terlalu kasar, yakni sangat dipengaruhi
oleh nilai-nilai ekstrem suatu distribusi data.
Rentang semi interkuartil yang dilambangkan dengan Q, merupakan
ukuran yang dipandang lebih baik yang bergantung dari bagian pusat
sehingga relatif stabil, khususnya pada 50% tengah dari skor-skor suatu
distribusi. Rentang semi antar kuartil dihitung dengan memanfaatkan ukuran
letak, yakni kuartil ketiga dengan kuartil pertama, yakni
Q3  Q1 P75  P25
Q 
2 2
Menurut Minium, dkk. (1993) salah satu cara memahami Q yakni dengan
menyadari bahwa 2Q sama dengan rentang 50% tengah skor-skor. Oleh
karena Q2 merupakan median, maka rentang semi interkuartil boleh juga
dipandang sebagai jarak rata-rata antara median (Q2) dengan kuartil lainnya.
3.24 Statistika Pendidikan 

3. Varians dan Simpangan Baku


Sebelum membahas varians dan simpangan baku atau deviasi standar,
kita bahas dulu tentang skor simpangan. Pada bagian Modul 2 Anda telah
dikenalkan dengan istilah skor mentah, yakni skor yang belum diolah. Dari
skor mentah kita dapat menghitung mean atau rata-ratanya. Suatu skor
simpangan mengungkapkan letak suatu skor yang mengindikasikan seberapa
banyak poin skor berada di bawah atau di atas rata-ratanya. Secara
matematik, skor simpangan didefinisikan dengan  X  X  .
Seperti sudah dijelaskan pada bahasan tentang makna mean/rata-rata,
jumlah dari keseluruhan  X  X  atau   X  X   0 . Cobalah Anda
buktikan !
Menurut Minium, dkk (1993) untuk mencari suatu ukuran variabilitas
dapat diperoleh dengan menghitung rata-rata skor simpangan. Hal tersebut
menuntut kita untuk menghitung jumlah skor-skor tersebut. Namun, hasilnya
akan selalu nol. Agar hal itu tidak terjadi, maka kita dapat menggunakan
tanda nilai mutlak dan kemudian dapat menghitung rata-ratanya. Akan tetapi
hal tersebut memiliki sifat matematis yang rancu sehingga tidak bermanfaat
dalam statistika inferensial. Untuk itulah, maka cara lain yang dapat
dilakukan adalah dengan cara mengkuadratkan skor simpangan. Dan hasilnya
dinamakan dengan varians.
Varians suatu distribusi data didefinisikan sebagai rata-rata dari kuadrat
skor-skor simpangan. Seperti rata-rata/mean, ada perbedaan simbol untuk
varians populasi dan varians sampel. Untuk populasi, varians dilambangkan
dengan 2 (sigma kecil) dan untuk sampel dilambangkan dengan s 2. Adapun
perhitungan untuk keduanya dapat digunakan aturan sebagai berikut.

1
Varians Populasi :  2    X  X 
2

 X  X  atau s 2 
1 SS x

2
Varians sampel : s 2  ,
n 1 n 1

Pembilang dari varians, SSx sering dipakai dalam pengujian statistika


dengan istilah “sum of square” atau jumlah kuadrat. Sebagai catatan,
beberapa buku menuliskan penyebut dari varians sampel dengan n. Hal
tersebut dikarenakan belum dibahas tentang materi penaksiran. Ketika Anda
 MPDR5202/MODUL 3 3.25

sudah mempelajari teori penaksiran, penyebut  n –1 lebih baik


2
dibandingkan daripada n. Karena s memenuhi kriteria sebagai penaksir
terbaik bagi 2.
Dalam perhitungan varians atau yang lainnya, biasanya jumlah kuadrat
diuraikan sehingga menjadi lebih mudah dalam prosesnya.
SS X    X  X 
2

   X 2  2 XX  X 2 
  X 2  2 XX   X 2

 X  X
2 2

X 2
2  n 
n  n
 
 X    X 
2 2

X 2
2
n n
 X 
2

X2 
n
 X 
2

Jadi SS X   X 2 
n

Untuk penggunaan lebih jelasnya, perhatikan contoh berikut.

Contoh 3.7:
dari contoh data

2, 5, 6, 7, 8, 9, 10, 11, 12, 15, 16, 16, 17

Diperoleh tabel:
3.26 Statistika Pendidikan 

Tabel 3.8
Tabel untuk Membantu Perhitungan Varians

X  X
2
X X2
2 4 68,89
5 25 28,09
6 36 18,49
7 49 10,89
8 64 5,29
9 81 1,69
10 100 0,09
11 121 0,49
12 144 2,89
15 225 22,09
16 256 32,49
16 256 32,49
17 289 44,89
134 1650 268,77
= 10,3

Dari tabel di atas, maka dapat dihitung


1342
SS X  1650   1650  1381, 23  268, 77
13
268,77
Sehingga variansnya adalah: sX2   22,3975
12

Apabila kita memanfaatkan ukuran rata-ratanya, maka varians data


tersebut adalah sebagai berikut.
 X  X 
2
268, 77
s 2
   22,3975 (sama dengan hasil di atas).
n 1
X
12

Dalam bentuk lain, varians sampel juga dapat dihitung dengan


n X 2    X 
2

s  2
(Sudjana, 1989).
n  n  1
X

Rumus ini membantu kita ketika data sudah disusun atau disajikan dalam
tabel frekuensi, yakni sebagai berikut.
 MPDR5202/MODUL 3 3.27

2
k
 k 
 f X X
k
n fi X i2    fi X i 
2
i i
sX2  i 1
atau sX2  i 1  i 1 
n 1 n  n  1
Dengan:
K : banyak kelas interval
fi : frekuensi kelas interval ke-i
Xi : tanda kelas (titik tengah kelas) interval ke-i

Contoh 3.8:
Sebagai contoh, perhatikan data pada tabel berikut.

Tabel 3.9
Tabel untuk Membantu Perhitungan Varian

Interval fi Xi Xi2 fiXi fiXi2


96 – 98 1 97 9409 97 9409
93 – 95 1 94 8836 94 8836
90 – 92 3 91 8281 273 24843
87 – 89 3 88 7744 264 23232
84 – 86 4 85 7225 340 28900
81 – 83 7 82 6724 574 47068
78 – 80 8 79 6241 632 49928
75 – 77 9 76 5776 684 51984
72 – 74 12 73 5329 876 63948
69 – 71 6 70 4900 420 29400
66 – 68 11 67 4489 737 49379
63 – 65 7 64 4096 448 28672
60 – 62 2 61 3721 122 7442
57 – 59 3 58 3364 174 10092
54 – 56 3 55 3025 165 9075
Jumlah 90 5900 442208

Dari tabel di atas, maka kita dapat menghitung varainsnya sebagai berikut.

80  442208  59002 353776640  34810000


s2    89,66
80(80  1) 6320

Karena varians dari suatu data merupakan satuan pengukuran yang


dikuadratkan, maka varians tidak banyak dimanfaatkan dalam statistika
deskriptif. Untuk itulah kita menghitung akar kuadrat dari varians yang
disebut dengan simpangan baku atau deviasi standar yang dilambangkan
3.28 Statistika Pendidikan 

dengan s. Nilai atau bilangan dari s mengembalikan ke satuan pengukuran


asli, dan oleh karenanya kita memperoleh ukuran variabilitas yang luas
digunakan.
Simpangan baku menggambarkan pencaran data dari suatu distribusi.
Semakin berpencar skor-skor mentahnya, maka semakin besar pula
penyimpangan data dari rata-ratanya. Oleh karenanya simpangan baku juga
makin besar atau meningkat.
Namun sayangnya kita tidak mudah memberikan arti atau tafsiran dari
suatu simpangan baku. Mungkin akan lebih mudah ketika kita
membandingkan simpangan baku antara dua distribusi data. Misalkan kita
menggunakan media konkrit dalam pembelajaran materi tertentu. Sebelum
media itu digunakan, kita memberikan tes awal pada siswa. Misalkan dari
skor tes awalnya diketahui atau dihitung rata-rata dan simpangan bakunya
berturut-turut 40,3 dan 6,8 (dengan skor maksimal ideal atau SMI nya 100).
Setelah penggunaan media dilakukan, kita berikan tes kembali dan dari
hasilnya diperoleh rata-rata dan simpangan bakunya berturut-turut 75,8 dan
5,6 dengan SMI 100. Dari kedua hasil tersebut terlihat bahwa simpangan
baku hasil tes akhir lebih rendah dibandingkan dengan tes awal, dengan kata
lain penggunaan media konkrit pada pembelajaran topik tersebut telah dapat
mengurangi kesenjangan kemampuan antar siswa.
Walaupun secara intuitif agak sulit dalam memahami varians dan
simpangan baku, ukuran ini mempunyai sifat yang responsif seperti rata-rata.
Perubahan pada suatu skor akan mengubah (memperkecil atau memperbesar)
simpangannya terhadap rata-rata, akibatnya varians atau simpangan bakunya
juga dapat berubah. Jika perubahan mendekati rata-rata, maka varians atau
simpangan bakunya menjadi lebih kecil. Sebaliknya, jika skornya menjauhi
rata-rata, maka varians dan simpangan baku akan meningkat. Dengan
demikian, simpangan baku jauh lebih sensitif dibandingkan dengan rentang
atau rentang semi antar kuartil.
Sifat yang kedua dari varians yang sangat penting adalah mempunyai
daya tahan terhadap variasi sampling. Dari sampel-sampel acak yang diambil
dengan cara pengembalian dari populasi, besar simpangan baku cenderung
ada perbedaan tetapi sangat kecil dibandingkan dengan ukuran-ukuran yang
dihitung dari sampel-sampel yang sama.
Dalam beberapa hal, sifat-sifat simpangan baku berhubungan dengan
sifat-sifat rata-rata, yakni stabilitas terhadap variasi sampling, responsif
terhadap letak data, dan peka terhadap nilai-nilai ekstrem. Namun demikian,
 MPDR5202/MODUL 3 3.29

ada sedikit perbedaan dibandingkan rata-rata. Jika setiap skor ditambah atau
dikurangi suatu konstanta tertentu, maka rata-ratanya juga bertambah atau
berkurang sebesar konstanta penambah dan pengurangnya. Tetapi hal
tersebut tidak terjadi pada varians. Untuk lebih jelasnya perhatikan contoh
berikut.

Contoh 3.9:
2, 5, 6, 7, 8, 9, 10, 11, 12, 15, 16, 16, 17
Rata-rata dan varians dari data tersebut adalah 10,3 dan 22,3975 atau
simpangan bakunya 4,733. Jika misalkan kita tambahkan seluruh skor dengan
2, maka datanya menjadi

4, 7, 8, 9, 10, 11, 12, 13, 14, 17, 18, 18, 19


Jika dihitung rata-rata dan simpangan bakunya adalah sebagai berikut.
160
X   12,3 bertambah 2 point dari rata-rata awalnya, dan
13
268, 77
s  4,37 sama dengan simpangan baku awalnya.
12
Cobalah Anda lakukan jika semua data dikali 2 dan dibagi 2, bagaimana
rata-rata dan simpangan bakunya?
Jika skor pada setiap distribusi dikali atau dibagi dengan suatu konstanta,
maka variabilitas hasilnya sama dengan variabilitas data awal dikali atau
dibagi dengan konstanta pengali atau pembagi datanya.

4. Angka Baku
Misalkan kita mempunyai sampel yang berukuran n dengan rata-rata
X dan simpangan bakunya s. Dari data tersebut dapat dibentuk data baru,
yakni Z1, Z2, …, Zn dengan rumus transformasi sebagai berikut.

Xi  X
Zi  untuk i = 1, 2, 3, …, n
s

Data dalam bentuk Zi untuk setiap i dinamakan angka/skor baku. Skor-Z ini
sangat penting ketika kita bekerja dalam statistika. Dapat Anda tunjukkan
bahwa untuk sebarang distribusi data, X, rata-rata dan simpangan baku dari
skor bakunya berturut-turut 0 dan 1.
3.30 Statistika Pendidikan 

Salah satu contoh penting dari kegunaan angka baku adalah sebagai
berikut.

Contoh 3.10
Seorang siswa memperoleh hasil ujian matematika, bahasa Indonesia,
PKn, dan IPA. Pada pelajaran matematika siswa tersebut memperoleh
nilai 86 dengan rata-rata dan simpangan baku kelompoknya (kelas)
berturut-turut 78 dan 10,0. Nilai ujian Bahasa Indonesianya 90 dengan
rata-rata kelasnya 86 dan simpangan bakunya 11,8. Nilai PKn 88 dengan
rata-rata kelompoknya 84 dan simpangan bakunya 12,4. Dan untuk IPA
dia memperoleh nilai 80 dengan rata-rata kelasnya 75 dan simpangan
baku 9,6. Dalam mata pelajaran mana anak tersebut mencapai
kedudukan yang lebih baik dalam kelompoknya?

Untuk menjawab pertanyaan tersebut, kita tidak bisa membandingkan


secara langsung dari nilai-nilai yang diperoleh pada setiap mata pelajaran.
Karena tiap mata pelajaran mempunyai distribusinya masing-masing. Untuk
itulah kita dapat menggunakan angka baku.
86  78
a. Untuk matematika : Z  0,800
10
90  86
b. Untuk Bahasa Indonesia : Z   0,338
11,8
88  84
c. Untuk PKn : Z  0,322
12, 4
80  75
d. Untuk IPA : Z  0,52
9, 6

Dengan demikian, dari angka baku masing-masing nilai tersebut terlihat


bahwa anak tersebut mempunyai nilai matematika yang paling baik dalam
kelompoknya, kemudian diikuti IPA, Bahasa Indonesia, dan PKn. Padahal
jika dilihat nilainya (skor mentah), urutan nilainya adalah Bahasa Indonesia,
PKn, Matematika, dan yang terakhir IPA.
Selain untuk perbandingan, angka baku juga dapat digunakan untuk
memeriksa pencilan (data ekstrem). Jika kita mengacu pada sebaran normal
(akan dibahas lebih rinci pada modul berikutnya), maka secara teoritis
persentasi banyaknya data dapat dilihat melalui rata-rata dan varians.
 MPDR5202/MODUL 3 3.31

atau jika dalam bentuk angka baku, maka

Gambar 3.6
Persentase Sebaran Data Berdasarkan Rata-Rata dan Simpangan Baku

Dari gambar di atas, skor dari suatu distribusi data yang menyebar
normal 99,7% akan terletak pada X  3s dan X  3s atau apabila skornya
sudah disusun dalam angka baku, maka skor-skor akar terletak di antara -3
dengan 3. Jadi apabila ada skor dengan angka bakunya yang lebih kecil dari -
3 atau lebih besar dari +3, maka skor tersebut merupakan pencilan.
3.32 Statistika Pendidikan 

Secara deskriptif persentase letak skor-skor suatu distribusi yang


berbentuk kurva normal dapat dituliskan sebagai berikut:
  1 terdiri dari atas sekitar 68% skor.
  2 terdiri dari atas sekitar 95% skor.
  3 terdiri dari atas sekitar 99,7% skor.

4. Koefisien Variasi
Pada bagian atas kita telah membahas variablitis atau keragaman suatu
distribusi data. Namun kita kesulitan dalam membandingkan keragaman
beberapa distribusi data yang satuan pengukuran atas skor-skornya berbeda.
misalkan kita ingin membandingkan keragaman barat badan siswa dengan
keragaman tinggi badan siswa pada suatu kelas, atau juga dengan keragaman
uang sakunya. Kita ketahui bahwa satuan ketiga pengukuran tersebut
berbeda, sehingga jika kita membandingkan secara langsung dari simpangan
bakunya maka dapat dipastikan akan bias. Satuan pengukuran tinggi badan
siswa biasanya menggunakan sentimeter (cm), berat badan dengan satuan
kilogram (kg), dan uang saku siswa tentunya satuan rupiah. Jika dihitung
simpangan baku masing-masing pengukuran ketiganya, maka sangat
mungkin bahwa nilai numerik keragaman berat badan lebih kecil
dibandingkan dengan tinggi badan, dan tentunya juga akan lebih kecil dari
uang saku siswa. Untuk itu, sama dengan membandingkan skor melalui
angka baku, kita perlu ukuran lain yang hasilnya standar. Ukuran yang
digunakan adalah koefisien variasi. Dan koefisien variasi tidak bergantung
pada satuan yang digunakan, karenanya dapat dipakai untuk membandingkan
variasi relatif beberapa kumpulan data dengan satuan berbeda (Sudjana,
1989).
Koefisien variasi, dilambangkan dengan KV, merupakan ukuran dispersi
relatif yang digunakan untuk membandingkan variasi dua atau lebih
kelompok data.
s
KV  100%
X
Untuk lebih jelasnya perhatikan contoh berikut.

Contoh 3.11
Lampu jenis A rata-rata mampu menyala selama 1.500 jam dengan
simpangan baku 275 jam. Lampu jenis B rata-rata mampu menyala selama
 MPDR5202/MODUL 3 3.33

1.750 jam dengan simpangan baku 300 jam. Tentukan lampu mana yang
memiliki kualitas lebih baik!
Dari data di atas, kita dapat menghitung koefisien variasi masing-masing
lampu sebagai berikut.
275 300
KVA  100%  18,3% dan KVB  100%  17,1%
1500 1750
Dari hasil perhitungan di atas, diperoleh informasi bahwa lampu jenis B
memiliki koefisien variasi yang lebih kecil daripada lampu jenis A. Dengan
kata lain, kemampuan menyala lampu jenis B lebih seragam dibandingkan
dengan lampu jenis A. Karena itu dapat disimpulkan bahwa kualitas lampu
jenis B lebih baik daripada lampu jenis A.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!

1) Dua tabel berikut diperoleh dari skor mentah yang sama.


DATA A DATA B
SKOR f SKOR f
60 – 64 4 60 – 65 4
50 – 59 7 54 – 59 9
50 – 54 6 48 - 53 7
45 – 49 3
Tentukanlah rata-rata, median dan modus dari data pada tabel berikut!
Berikan tafsiran dari hasil yang diperoleh!
2) Sebanyak 10 buah skor mempunyai rata-rata 50,0. Dua puluh skor
mempunyai rata-rata 40,0. Jika kita menggabungkannya sehingga n = 30,
apa yang terjadi dengan rata-rata setelah digabungkan? Tulislah aturan
atau rumus untuk menghitung rata-rata dari kedua sub kelompok
tersebut! Jika dimisalkan subkelompok 1 mempunyai X1 berukuran n1,
sub kelompok 2 mempunyai X 2 berukuran n2 dan seterusnya sampai
dengan subkelompok p, nyatakanlah rata-rata bagi gabungan p kelompok
tersebut!
3.34 Statistika Pendidikan 

4) Misalkan diberikan dua kelompok data tentang waktu reaksi dari 2 jenis
pemberian stimulus sebagai berikut.
Waktu Stimulus Sederhana Stumulus Kompleks
(dalam detik) f F
300 – 319 1 3
280 – 299 1 6
260 – 279 2 10
240 – 259 4 18
220 – 239 3 25
200 – 219 6 35
180 – 199 11 28
160 – 179 12 16
140 – 159 8 7
120 – 139 2 2
Jumlah 50 150

a.
Carilah simpangan antar kuartilnya keduanya!
b.
Himpunan skor manakah yang menurut Anda variasinya lebih
besar? Berikan alasan
5) Misalkan diberikan skor 2, 5, 7, 8, 9, 11, dan 14.
a. Carilah S dan simpangan antar kuartilnya!
b. Misalkan dimasukkan skor ekstrem 24, carilah S dan simpangan
bakunya! Berapakah kenaikan S dan simpangan kuartilnya?
c. Generalisasi apa yang dapat diambil dari kasus di atas?
6) Berat 10 bungkus makanan kecil mempunyai rata-rata 278 gram per
bungkus dengan simpangan baku 9,64 gram. Bila ke-10 bungkus tersebut
dibeli dari 10 toko yang berbeda dengan harga rata-rata Rp12.000,00 per
bungkus dengan simpangan baku Rp100,00, dapatkah disimpulkan
bahwa berat bungkus-bungkus itu relatif lebih homogen dibandingkan
dengan harganya!

Petunjuk Jawaban Latihan

1) Rata-rata, modus, dan median dari kedua tabel tersebut adalah


Tabel 1 : X  55,0; M e  55, 21; M o  55,75
Tabel 2 : X  55,6; M e  55,5; M o  55,01
 MPDR5202/MODUL 3 3.35

10(50)  20(40)
2) Rata-rata untuk n = 30 adalah X   43,33 .
30
n X  n X   nk X k
Aturan umumnya X  1 1 2 2
n1  n2   nk
3) Dari data pada tabel dapat dihitung:
Kelompok 1
214,5  163,7
Q1  163,7 dan Q3  214,5 sehingga SK1   25, 4
2
Kelompok 2
239,7  188, 4
Q1  188,4 dan Q3  239,7 sehingga SK1   25,65
2
Dari kedua hasil di atas sedikit berbeda, atau hampir sama.
4) Dari data tersebut diperoleh SX= 3,92 dan SK = 3. Setelah ditambah
dengan skor 24, diperoleh SXbaru = 6,72 dan SKbaru = 3,875. Simpangan
baku sangat dipengaruhi oleh pencilan, tetapi SK tidak terlalu
dipengaruhi oleh adanya pencilan. Simpangan baku lebih baik dalam
mencerminkan sebaran data.
5) Gajinya Rp69.600.000,
6) Untuk membandingkannya digunakan koefisien variasi.
9, 64
Untuk berat : KVbungkus  100%  3, 47%
278
100
Untuk harga : KVharga  100%  8,33%
12000
Dari hasil di atas, berat bungkus-bungkus lebih homogen.

R A NG KU M AN

1. Ukuran gejala pemusatan menyatakan suatu bilangan rangkuman


mendeskripsikan lokasi sentral suatu distriusi data.
2. Ukuran gejala pemusatan berguna khususnya apabila digunakan
untuk membandingkan performance dua atau lebih kelompok
variabel yang sama. Ada tiga ukuran yang lazim dipakai dalam
ukuran gejala pemusatan, yakni median, mean, dan modus.
3. Rata-rata adalah jumlah semua skor dibagi dengan banyaknya skor.
Rata-rata merupakan titik keseimbangan distribusi data. Rata
responsif terhadap posisi terhadap posisi pasti masing-masing skor
dalam distribusi, sehingga sensitif terhadap skor-skor ekstrem.
3.36 Statistika Pendidikan 

4. Median menunjukkan titik pada skala-skala skor-skor yang mungkin


yang membagi skor-skor sebelah bawah dan sebelah atasnya sama
banyak. Median responsif terhadap banyaknya skor di atas dan di
bawahnya, tetapi tidak terhadap tinggi skor-skornya. Oleh
karenanya median kurang terpengaruh oleh adanya skor ekstrem.
5. Modus merupakan ukuran yang baik digunakan untuk data
kualitatif. Modus mendeskripsikan skor atau kategori data yang
paling sering muncul. Modus kadang-kadang tidak tunggal dan
kadang bukanlah suatu titik/skor dalam distribusinya.
6. Apabila kita melakukan penambahan atau pengurangan terhadap
semua skor-skor pada suatu distribusi data, maka akan
meningkatkan atau menurunkan ukuran gejala pemusatannya.
Begitu juga ketika kita menggali atau membagi skor oleh suatu
konstanta akan berakibat menggali atau membagi ukuran-ukuran
gejala pemusatan sebesar konstanta.
7. Rentang adalah jarak di antara skor tertinggi dan terendah di dalam
suatu distribusi. Ukuran ini tidak responsif terhadap kedudukan
skor-skor yang berada di antara titik-titik ekstremnya. Rentang
kurang banyak manfaatnya dalam statistika inferensial.
8. Rentang semi antar kuartil adalah setengah jarak di antara titik
kuartil pertama dan kuartil ketiga. Ukuran ini responsif terhadap
banyaknya skor yang berada di atas atau di bawah titik-titik kuartil
sebelah luar, tetapi tidak terhadap kedudukan pasti skor-skor
tersebut. Sama halnya dengan rentang, rentang semi antar kuartil
juga kurang banyak manfaatnya dalam statistika inferensial.
9. Varians adalah rata-rata dari kuadrat-kuadrat simpangan skor-skor
dari rata-rata distribusi. Ukuran ini responsif terhadap posisi pasti
tiap skor di dalam distribusi, tetapi kecil manfaatnya dalam statistika
deskriptif karena kuantitas yang dinyatakan dalam satuan kuadrat.
Varian memiliki peran penting dalam statistika inferensial karena
tahan terhadap variasi penyampelan.
10. Simpangan baku merupakan akar kuadrat dari varians. Oleh karena
dinyatakan dalam satuan skor yang asli, maka simpangan baku
merupakan ukuran variabilitas yang paling luas digunakan dalam
statistika deskriptif. Ukuran ini juga meluas digunakan di dalam
prosedur-prosedur statistika lanjutan dan juga besar manfaatnya
dalam statistika inferensial.
11. Untuk membandingkan ukuran-ukuran variabel yang memakai
satuan berbeda dilakukan dengan cara mengubah satuan-satuan
pengukuran menjadi skor-skor baku atau disebut dengan skor Z.
Skor-Z dari suatu variabel tidak mengubah bangun distribusinya.
 MPDR5202/MODUL 3 3.37

TES F OR M AT IF 1

Jawablah pertanyaan berikut dengan ringkas dan jelas!

1) Carilah median dan rata-rata dari hasil ulangan 20 siswa berikut!

8,2 5,4 6,8 7,3


7,0 7,2 8,5 8,0
7,5 8,4 6,5 7,0
8,5 7,8 7,0 8,1
6,5 6,2 7,3 6,8

2) Seorang psikolog mengadakan eksperimen belajar di mana dia mencatat


waktu yang diperlukan tikus-tikus untuk berlari melewati jalan yang
diberi rintangan ketika dilakukan pemberian makanan. Beberapa tikus
tidak melampaui jalan itu dalam waktu 4 menit, dan karena pembatasan
waktu, dia menyisihkan tikus-tikus tadi dari jaringan jalan. Ukuran
gejala pemusatan mana yang akan Anda gunakan apabila diketahui
distribusi data dari waktu-waktu tikus melewati jalan adalah sebagai
berikut.

Waktu (detik) f
241 atau lebih 4
181 – 240 5
121 – 180 8
61 – 180 5
1 - 60 3

3) Misalkan terdapat satu data dari 10 buah data 3, 5, 9, 1, 2, 0, 4, 3 dan 9


hilang. Jika rata-rata dari kesepuluh data tersebut 4,8 dapatkah Anda
menentukan data yang hilang tersebut? Jelaskan bagaimana Anda dapat
menghitungnya!
4) Di bawah ini diberikan data tentang jumlah siswa kelas terakhir dari tiga
sekolah dan jumlah yang tidak lulus pada ujian akhir sekolah.
3.38 Statistika Pendidikan 

Persen
Sekolah Jumlah Siswa Tidak Lulus
Tidak Lulus
A 300 30 10,0
B 600 20 3,3
C 450 90 20,0
Rata-rata  X  10,4
a. Bagaimana rata-rata yang tidak lulus sebanyak 10,4% diperoleh dari
data tersebut, jelaskan!
b. Berapa persen rata-rata yang lulus dari tiap sekolah?
5) Bagaimana hubungan antara X , Me, dan M0? Jika diketahui Median dan
Modus skor ujian siswa adalah 67,8 dan 84,9, dapatkah rata-ratanya
dihitung dan ke arah mana kecenderungan sebaran datanya? Lengkapi
penjelasan Anda dengan grafik!
6) Misalkan distribusi X adalah : 15, 14, 11, 11, 9, dan 6 dan distribusi Y
adalah 17, 16, 13, 13, 11, dan 8.
a. Carilah varians dan simpangan baku kedua distribusi tersebut
dengan metode simpangan!
b. Dari hasil a) varians dan simpangan baku kedua distribusi, X dan Y,
hasilnya sama, mengapa?
7) Periksalah bahwa varians dari data: 4, 9, 3, 6, 4, dan 7 adalah 5,1.
Dengan menggunakan hasil tersebut hitunglah
a. Varians dari data : 12, 27, 9, 18, 12, dan 21.
b. Varians dari data : 9, 14, 8, 11, 9, dan 12
8) Ada tiga calon masing-masing datang dari tiga sekolah tingkat akhir
yang berbeda. Di sekolahnya masing-masing calon A mendapat nilai
matematika 83 sedangkan rata-rata kelasnya 62 dan simpangan bakunya
16. Calon B mendapat nilai 97 dengan rata-rata kelasnya 83 dan
simpangan bakunya 23, sedangkan calon C mendapat nilai 87 dengan
rata-rata kelasnya 65 dan simpangan bakunya 14. Dari ketiganya akan
dipilih satu orang calon, sebaiknya calon mana yang diterima?
 MPDR5202/MODUL 3 3.39

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor seperti tertera pada Kunci Jawaban Latihan. Hitunglah jawaban yang
benar. Kemudian, konversikan dengan skala 100 lalu gunakan rumus berikut
untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan
Belajar 1.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang
belum dikuasai.
3.40 Statistika Pendidikan 

Kegiatan Belajar 2

Korelasi dan Regresi

P ara mahasiswa tingkat awal yang mempelajari Statistika sering kali


bingung dengan dua istilah ini, analisis korelasi dan analisis regresi.
Kebingungannya berkisar kepada fungsi kedua alat analisis, apakah
fungsinya sama atau beda? kalau beda, kapan kita menggunakan analisis
korelasi dan kapan dan pada situasi bagaimana kita menggunakan analisis
regresi. Berikut ini akan dijelaskan perbedaan kedua alat analisis tersebut.
Tujuan analisis korelasi adalah ingin mengetahui apakah ada hubungan
antara dua variabel atau lebih? Sedangkan tujuan analisis regresi adalah
untuk memprediksi seberapa jauh pengaruh yang ada tersebut (yang telah
dianalisis melalui analisis korelasi). Misalnya, dengan analisis korelasi ingin
diketahui apakah ada hubungan antara lama rata-rata belajar per minggu
dalam matematika dengan hasil belajarnya. Bila melalui analisis korelasi
terbukti bahwa ada hubungan di antara kedua variabel tersebut, maka analisis
regresi dapat digunakan untuk memperkirakan jika rata-rata lama belajar per
minggu dinaikkan sekian jam jumlahnya maka hasil belajarnya akan seperti
apa terjadinya.
Untuk itulah kita akan membahas keduanya, analisis korelasi dan regresi.
Pada Kegiatan Belajar 2 Modul 3 ini pembahasan difokuskan korelasi dan
regreasi sebagai statistika deskriptif antara dua distribusi (bivariat).

A. ANALISIS KORELASI

Seperti yang dijelaskan di atas bahwa tujuan dari analisis korelasi adalah
untuk mengetahui kekuatan hubungan di antara dua variabel, dan jika ada
hubungan bagaimanakah arah hubungan dan seberapa besar hubungan
tersebut. Data pada analisis korelasi dapat berupa data kualitatif maupun
kuantitatif, yang masing-masing mempunyai ukuran korelasi sendiri-sendiri.
Sebelum kita memulai analisis kita perhatikan dahulu apakah data yang
akan kita peroleh berskala nominal, ordinal, interval atau rasio? Sebab
perlakuan terhadap data tersebut akan berbeda ketika kita akan melakukan
analisis korelasi. Untuk data yang ukuran skalanya interval atau rasio analisis
korelasi yang digunakan adalah Pearson Correlation atau istilah lainnya
adalah Product Moment Correlation. Untuk data yang berskala ordinal
 MPDR5202/MODUL 3 3.41

digunakan Spearman Correlation atau Kendal , dan untuk data yang


berskala pengukuran nominal digunakan Kontingensi C. Selain itu ada juga
korelasi ganda, korelasi biserial, korelasi etha, korelasi parsial, dan lain-lain.
Tidak semua korelasi di atas akan dijelaskan dalam modul ini, untuk itu
Anda perlu membaca lebih lanjut tentang hal tersebut, sehingga tidak salah
dalam menggunakannya.
Mengawali pembahasan dalam kegiatan belajar ini, kita membahas
tentang korelasi Pearson. Korelasi ini mengukur derajat asosiasi atau
hubungan antara dua variabel yang mempunyai skala pengukuran minimal
interval, dengan syarat sebarannya normal. Misalkan hubungan antara tinggi
dan berat badan siswa sekolah dasar, usia suami dengan usia istri, rata-rata
belajar per minggu dengan hasil belajar pada mata pelajaran tertentu,
kemampuan matematika dengan IPA, dan lain sebagainya. Korelasi juga
berkaitan dengan prediksi. Jika terdapat korelasi antara dua variabel, maka
skor seseorang (subjek) pada satu variabel, kita bisa menentukan prediksi
skor lainnya dengan peluang lebih baik. Secara umum dapat dikatakan bahwa
makin besar hubungan atau asosiasi antara dua variabel, makin akurat kita
memprediksi kedudukan skor suatu skor pada suatu distribusi dari kedudukan
skor distribusi data lainnya.
Dalam pendidikan, khususnya penilaian, korelasi amat penting dalam
mengonstruksi tes yang baku. Seperti diketahui bahwa suatu tes haruslah
memenuhi validitas dan reliabilitas. Validitas atau kehandalan salah satunya
ditentukan oleh kuat tidaknya korelasi antara item tes dengan skor totalnya.
Semakin tinggi korelasi antara item tes dengan skor total, makin valid item-
item tes yang dikontruksi. Selain itu, tes juga harus memenuhi kekonsistenan
atau reliabilitas. Suatu tes yang reliabel akan menghasilkan data yang
konsisten ketika digunakan dalam waktu dan tempat yang berbeda. Suatu tes
menjadi tidak berguna apabila hasil yang diperolehnya mempunyai fluktuatif
yang besar dari waktu ke waktu. Dengan demikian, konsep korelasi sangat
penting peranannya dalam bidang pendidikan.
Secara historis, konsep korelasi muncul ketika Galton (seperti yang
sudah dibahas pada Modul 1) mempunyai ketertarikan terhadap
permasalahan “tentang ciri-ciri yang berbeda pada organisme-organisme dari
spesies yang sama, serta bagaimana ciri-ciri itu dipengaruhi oleh heriditas?”
Salah satu topik yang ditelaah Galton adalah pewarisan tinggi. Ia
mengumpulkan data dengan mengobservasi keluarga-keluarga yang terdiri
dari para orang tua (ibu-bapak) dan anak-anaknya yang sudah dewasa. Untuk
3.42 Statistika Pendidikan 

menyederhanakan datanya, dari masing-masing keturunan dihitung tinggi


badan orang tua rata-rata pasangan ibu dan bapak. Untuk memudahkannya ia
mengatur hasil pengamatannya dalam bentuk tabel baris kolom, dengan
kolom menunjukkan interval-interval rata-rata tinggi badan orang tua, dan
untuk baris ditempatkan interval-interval tinggi badan keturunan yang sudah
dewasa. Data hasil observasinya dapat dilihat pada tabel berikut.

Tabel 3.10
Data Tinggi Badan Orang Tua dan Keturunannya Hasil Observasi Galton

Tinggi Rata-rata Tinggi Badan Orang Tua (inci)


Badan Lebih
Kurang
Keturunan 64-65 65-66 66-67 67-68 68-69 69-70 70-71 71-72 72-73 dari
dari 64
(inci) 73
Lebih dari 5 3 2 4
74
73 – 74 3 4 3 2 2 3
72 – 73 1 4 4 11 4 9 7
71 – 72 2 11 18 20 7 4 2
70 – 71 5 4 19 21 25 14 10 1
69 – 70 1 2 7 13 38 48 33 18 5 2
68 – 69 1 7 14 28 34 20 12 3 1
67 – 68 2 5 11 17 38 31 27 3 4
66 – 67 2 5 11 17 36 25 17 1 3
65 – 66 1 1 7 2 15 16 4 1 1
64 – 65 4 4 5 5 14 11 16
63 – 64 2 4 9 3 5 7 1 1
62 – 63 1 3 3
Kurang 1 1 1 1 1
dari 62
Ket : semua tinggi badan perempuan dikali dengan 1,08 untuk
menyesuaikan perbedaan gender

Pertama kita baca bilangan yang ada dalam sel pada tabel di atas.
Perhatikan angka 36 yang berada pada baris 66–67 (tinggi turunan) dan
kolom 67–68 (tinggi orang tua). Angka 36 merupakan frekuensi
menunjukkan banyaknya 36 anak (keturunan) yang tinggi badannya antara 66
–67 inci serta orang tuanya yang bertinggi badan antara 67 – 68 inci. Dari
data tersebut, Galton menyimpulkan bahwa para orang tua yang lebih tinggi
secara umum (tetapi tidak mutlak) akan menghasilkan keturunan yang juga
relatif tinggi. Hubungan tersebut terlihat jelas dari telusuran terhadap median
pada masing-masing kelompok data setiap kolomnya. Garis lurus pada tabel
 MPDR5202/MODUL 3 3.43

menunjukkan median dari setiap kelompok. Misalnya, orang tuanya yang


mempunyai tinggi antara 68 – 69 inci median datanya 34, dan ternyata tinggi
keturunannya di antara 68 – 69 inci. Akhirnya, Galton merangkum dari
median-median tersebut dengan garis yang menunjukkan relasi antara rata-
rata tinggi badan orang tua dengan tinggi badan keturunannya. Selain itu,
Galton juga melihat bahwa suatu garis yang makin curam (miring)
menunjukkan adanya hubungan yang lebih dekat atau kuat di antara kedua
variabel. Hasil dari Galton di atas kemudian dianalisis oleh Karl Pearson,
seorang ahli matematika, dan pada akhirnya menjadi dasar dalam
pengembangan teori korelasi secara matematis.
Sebelum menelaah secara matematis, langkah awal dalam menilai
hubungan antara dua variabel dilakukan dengan melihat diagram pencar
(scatter plot). Dari diagram ini kita dapat melihat kecenderungan hubungan
kedua variabel, apakah mungkin liner atau tidak linear. Jika linear apakah
searah atau berkebalikan, atau mungkin juga tidak ada kaitan di antara
keduanya.
Menggambar scatter plot memerlukan dua sumbu, yakni sumbu
horizontal dan vertikal (ingat kembali tentang koordinat kartesius pada mata
pelajaran matematika SMP). Satu sumbu merepresentasikan satu variabel.
untuk lebih jelasnya perhatikan contoh data yang disusun oleh Cohen &
Wiliamson (Minium, dkk., 1993) tentang pengukuran stress (tekanan) dan
kesulitan makan. Kondisi tekanan (stress) pada siswa diukur dengan 10 item,
sedangkan kesulitan makan diukur dengan 14 item. Hasil pengukuran
terhadap 10 siswa terlihat pada tabel berikut.

Tabel 3.11
Hasil Pengukuran Stress (X) dan Kesulitan Makan (Y)

Siswa Stress(X) Kesulitan makan (Y)


A 17 9
B 8 13
C 8 7
D 20 18
E 14 11
F 7 2
G 21 5
H 22 15
I 19 26
J 30 28
Sumber : Minium, dkk. (1993)
3.44 Statistika Pendidikan 

Untuk menggambar diagram dari data di atas, misalkan variabel stress


(X) digambar pada sumbu mendatar (horizontal) dan variabel kesulitan
makan (Y) digambar pada sumbu vertikal. Pasangan data tiap responden
menunjukkan titik-titik pada gambar. Misalnya responden A, ukuran stresnya
17, dan kesulitan makannya 9, maka kita tetapkan titik koordinata bagi A
adalah (17, 9). Keseluruhan gambar titik-titik yang mewakili responden itu
dinamakan diagram pencar atau scatter plot.

Gambar 3.7
Diagram Pencar Variabel Stres (X) dan Kesulitan makan (X)

Secara ringkas Minimum, dkk. (1993) memberikan pedoman dalam


menyusun diagram pencar dalam 5 langkah sebagai berikut.

Langkah 1.
Tentukan satu variabel sebagai X dan lainnya Y. Penentuan variabel dapat
dilakukan secara acak, artinya penetapan X dan Y dipilih secara bebas.
Namun demikian apabila digunakan untuk memprediksi, maka X haruslah
merupakan variabel bebas/prediktor, dan Y sebagai variabel terikat.

Langkah 2.
Gambar sumbu-sumbu vertikal dan horizontal yang panjangnya kira-kira
sama. Perlu diketahui bahwa sumbu-sumbu ini berbeda dengan yang dipakai
dalam membuat kurva dari distribusi frekuensi.
 MPDR5202/MODUL 3 3.45

Langkah 3.
Tempatkan nilai-nilai X yang tinggi ke kanan sumbu horizontal, dan nilai-
nilai Y yang tinggi ke puncak sumbu vertikal. Beri label titik-titik dengan
baik sepanjang masing-masing sumbu.

Langkah 4.
Untuk setiap pasang skor, cari titik potong untuk nilai-nilai X dan Y dan
tandai dengan noktah/titik.

Langkah 5.
Beri nama masing-masing sumbu sesuai dengan variabelnya dan juga nama
judul diagram yang telah kita buat.
Seperti yang dijelaskan di atas bahwa diagram pencar sangat baik
sebagai langkah awal untuk melihat hubungan antara dua variabel. Prosedur
Person mengasumsikan hubungan dasar linear yang ditandai dengan garis
lurus. Namun demikian, tidak semua hubungan antara dua variabel sifatnya
linear. Minimum, dkk. (1993) memberi contoh tentang hubungan antara efek
tingkat dosis pentobaribital suatu barbinat pada tekanan hati pada
penambahan makan dalam merpati. Hubungan diantar keduanya,
pentobarbital dengan kecepatan sesudah/sebelum diberikan obat ternyata
berbentuk curvilinear, yakni titik-titik pada diagram pencar berkumpul di
sekitar suatu kurva yang tentunya tidak linear.
Selain hubungan antar variabel, diagram pencar juga dapat memberikan
informasi sifat hubungan keduanya. Jika skor-skor yang tinggi pada variabel
X umumnya berpasangan dengan skor-skor yang tinggi pada variabel Y, dan
sebaliknya skor-skor yang rendah pada variabel X berpasangan dengan skor-
skor yang rendah pada variabel Y, maka arah korelasi antara kedua variabel
tersebut adalah positif. Dalam diagram akan nampak titik-titiknya terpencar
meliuk dari arah kiri yang rendah ke sebelah kanan atas. Hal tersebut akan
tetap sama pencarannya walaupun kita terbalik dalam menempatkan variabel
X dan Y. Misalkan untuk contoh di atas, kita ubah stres menjadi variabel Y
dan kesulitan makan menjadi variabel X, maka diagram pencarannya akan
tetap condong ke sebelah kanan. Untuk itu coba Anda buat diagram
pencarnya!
3.46 Statistika Pendidikan 

Pada kasus di mana skor-skor yang tinggi pada variabel X umumnya


berpasangan dengan skor-skor yang rendah pada variabel Y, maka arah
korelasi kedua variabel tersebut negatif. Pada diagram pencar akan terlihat
titik-titiknya bergerombol dari arah kiri atas menurun ke kanan bawah.
Perlu juga ditambahkan, bahwa korelasi positif tidak secara otomatis
dikatakan baik, dan korelasi negatif jelek. Korelasi hanya menunjukkan sifat
hubungan antara dua variabel apakah searah atau berkebalikan. Misalnya
kedua contoh di atas, stres berkorelasi positif dengan kesulitan makan.
Semakin tinggi tingkat stres, maka makin tinggi pula kesulitan makannya.
Sebaliknya hubungan antara lama menonton televisi dengan hasil tes
membaca. Ternyata korelasinya negatif, dapat diartikan bahwa semakin lama
waktu yang dilakukan anak dalam menonton TV, maka makin jelek
kemampuan membaca dan juga matematikanya.
Dalam kasus tidak ada korelasi di antara variabel, yakni nilai-nilai yang
tinggi pada variabel X dan yang rendah berpasangan sama dengan nilai-nilai
Y yang tinggi maupun yang rendah. Selain itu, tidak ada arah dalam pola titik
pencarannya. Titik-titiknya tersebar secara tidak beraturan. Ada juga yang
menyebutkan pencarannya akan berbentuk melingkar dengan pusatnya
adalah  X , Y  .

1. Derajat Korelasi
Di atas kita sudah membahas tentang kecenderungan hubungan atau
asosiasi antara dua variabel. Pertanyaan yang muncul, bagaimana kita
mengetahui kuat atau lemahnya hubungan di antara kedua variabel. Tingkat
asosiasi yang dimiliki bersama oleh dua variabel ditandai oleh koefisien
korelasi, yang pertama kali dikemukakan oleh Pearson pada tahun 1896
(Minium, dkk., 1993). Galton adalah orang yang pertama menggunakan
simbol r untuk koefisien korelasi sampel. Atau sering kali menggunakan
subskrip rXY . Koefisien ini dihitung dengan menggunakan skor-skor kedua
variabelnya.
Secara matematis, nilai korelasi merupakan rasio antara kovarians kedua
distribusi data dengan kedua variansnya. Karena nilai kovarians dapat
bernilai negatif, nol, atau positif, dan varians akan selalu bernilai positif,
maka akibatnya nilai korelasi antara dua variabel dapat bernilai negatif, nol,
dan positif sebagaimana yang telah dijelaskan di atas. Adapun rentang dari
korelasi adalah –1  r  +1 atau antara 0  1. Tanda positif dan negatif
 MPDR5202/MODUL 3 3.47

menunjukkan arah hubungan atau korelasinya, tanda (+) untuk menunjukkan


korelasi positif dan (–) menunjukkan korelasi negatif.
Perlu diketahui bahwa korelasi positif (+) tidak berarti hubungannya
lebih kuat daripada korelasi negatif (–). Dua korelasi yang mempunyai nilai
mutlak sama tetapi berbeda tandanya (positif dan negatif) menunjukkan
derajat hubungannya yang sama, tetapi arahnya yang berbeda. Dengan
demikian, derajat hubungan antara dua korelasi -0,6 dengan +0,6 mempunyai
derajat yang sama kuat.
Secara ringkas Minium, dkk. (1993) menjelaskan bahwa koefisien
korelasi adalah suatu bilangan yang menunjukkan seberapa baik titik-titik
data dalam suatu diagram pencar “bergerombol” terhadap suatu garis yang
paling tepat. Artinya suatu korelasi yang sempurna, maka titik-titik datanya
akan tepat jatuh pada suatu garis dengan nilai koefisien korelasinya 1.
Sebaliknya apabila sebaran titik-titiknya kurang dari sempurna, yakni jauh
dari garis lurus yang mencerminkan hubungan kedua variabel itu, maka
koefisien korelasi (mutlaknya) akan lebih kecil dari 1. Semakin jauh
hubungan itu, maka semakin menyebar titik-titiknya dan nilai mutlak
korelasinya makin mendekati 0.
Permasalahan lain dalam korelasi adalah arti dari nilai bilangan atau
koefisien korelasi. Misalkan apa makna dari r = +0,5? Apa makna yang
membedakan r = +0,5 dengan r = +0,6? Koefisien korelasi tidak berarti
menandakan persentase (%) suatu asosiasi. Misalkan r = +0,5 tidak diartikan
menandakan asosiasi 50%. Nilai korelasi 0,25 tidak menunjukkan setengah
kekuatan asosiasinya dibandingkan dengan korelasi 0,5. Untuk
memudahkannya, Minimum, dkk. (1993) memberikan daftar yang telah
disusun oleh Michel W.B yang menulis artikel “An interpretation of the
coefficients of predictive validity and of determination in terms of the
proportions of correct inclusions or exclusions in cells of fourted tabel” yang
diterbitkan pada jurnal Educational and Psychological Measurement, 26,
No. 2 (1966): 419 – 424. Melalui daftar tersebut kita dibantu dalam
memaknai arti dari nilai koefisien korelasi. Daftarnya adalah sebagai berikut.
3.48 Statistika Pendidikan 

Tabel 3.12
Pemaknaan dari Korelasi Sejati

Kejadian-Kejadian yang Diharapkan


Korelasi Sejati pada Variabel yang Kedua (%)
Di atas median Di bawah median
0,00 50,0 50,0
0,10 53,1 46,9
0,20 56,2 43,8
0,30 59,5 40,5
0,35 61,2 38,8
0,40 63,0 37,0
0,50 66,5 33,5
0,60 70,5 29,7
0,70 74,3 25,5
0,80 79,3 20,7
0,90 85,3 14,7
1,00 100,0 0,0

Misalkan diketahui koefisien korelasi dari variabel X dan Y adalah 0,40.


Artinya adalah responden pada variabel X yang skornya di atas median dapat
diperkirakan 63,0% juga memperoleh skor Y yang di atas median dan
sebanyak 37,0% responden yang skor pada variabel Y di bawah median. Jadi
dalam kasus korelasinya sempurna nilai mutlaknya 1,00, maka skor-skor
pada variabel pertama yang di atas median, memperoleh atau mempunyai
pasangan 100% skor pada variabel keduanya juga di atas median, dan 0%
(tidak ada) yang skor variabel keduanya di bawah median. Begitu juga jika
korelasinya 0,0, maka skor-skor pada variabel pertama yang di atas median,
setengahnya (50,0%) akan berpasangan dengan skor-skor pada variabel
kedua yang di atas median, dan 50,0% pasangannya berada di bawah
median.
Perlu dicatat bahwa tabel tersebut digunakan dengan asumsi bahwa skala
pengukuran datanya kontinu, menyebar normal, dan representatif pada
populasinya.

2. Menghitung Koefisien Korelasi Pearson


Sebelum membahas tentang rumus atau aturan perhitungan koefisien
korelasi, terlebih dahulu kita perlu mengetahui tentang kovarians antara dua
distribusi.
 MPDR5202/MODUL 3 3.49

Kovarians dari dua distribusi variabel X dan Y didefinisikan dengan


1 N
Untuk populasi :  XY    X i   X Yi  Y  (1)
N i 1

  X i  X Yi  Y 
1 n
Untuk Sampel : S XY  (2)
n  1 i 1

Korelasi Person didefinisikan dengan


 XY
Untuk populasi :  XY  (3)
 X2  Y2
S XY
Untuk sampel : rXY  (4)
S X2 SY2
Untuk bahasan selanjutnya kita lebih banyak membahas koefisien
korelasi pada sampel (r).
Penulisan atau formula dari koefisien korelasi di atas kemudian
berkembang menjadi beberapa representasi. Perhitungannya dapat
menggunakan angka kasar, angka baku, dan simpangan.
Rumus koefisien korelasi menggunakan simpangan adalah sebagai
berikut:

rXY 
  X  X Y  Y  (5)
 n  1 S X SY
Rumus tersebut diturunkan dari rumus korelasi (4). Dan apabila dimisalkan
bahwa x   X  X  dan y  Y  Y  , maka dari (5) akan diperoleh

rXY 
 xy (6)
x y
2 2

Dengan:
  X   Y 
 xy   XY  n
 X 
2

x  X 2

n
Y 
2

 y  Y 2  n
3.50 Statistika Pendidikan 

Rumus ini banyak berguna nanti dalam pembahasan pengujian


keberartian regresi dan analisis jalur.
Bentuk representasi lain yang dikembangkan dari rumus (4) adalah
sebagai berikut
n XY   X  Y
rXY 
  
(7)
n X    X  n Y    Y 
2 2 2 2

Rumus inilah yang paling banyak dikenal atau digunakan dalam


perhitungan koefisien korelasi.
Apabila kita menggunakan angka baku dari X dan Y, yakni ZX dan ZY,
maka koefisien korelasi dapat dihitung dengan menggunakan aturan sebagai
berikut.

rXY 
  Z X ZY  (8)
n 1
X X Y Y
Dengan Z X  dan ZY  dan n adalah banyaknya pasangan skor.
SX SY
Ketika kita menghitung koefisien korelasi melalui rumus-rumus di atas, maka
secara matematis hasilnya akan sama.
Untuk lebih jelasnya bagaimana menghitung koefisien korelasi melalui
rumus-rumus di atas, ita perhatikan contoh berikut.

Contoh 3.12:
Kita kembali pada data stress (X) dan kesulitan makan (Y) dari 10 orang
siswa di atas. Kita mulai dengan rumus koefisien korelasi (5). Untuk
membantu perhitungan kita gunakan tabel berikut.

Tabel 3.13
Perhitungan Koefisien Korelasi

Siswa X Y
 X  X   Y  Y   X  X  Y  Y   X  X   Y  Y 
2 2

A 17 9 0.4 -4.4 0.16 19.36 -1.76


B 8 13 -8.6 -0.4 73.96 0.16 3.44
C 8 7 -8.6 -6.4 73.96 40.96 55.04
D 20 18 3.4 4.6 11.56 21.16 15.64
E 14 11 -2.6 -2.4 6.76 5.76 6.24
F 7 2 -9.6 -11.4 92.16 129.96 109.44
G 21 5 4.4 -8.4 19.36 70.56 -36.96
 MPDR5202/MODUL 3 3.51

Siswa X Y
 X  X   Y  Y   X  X  Y  Y   X  X   Y  Y 
2 2

H 22 15 5.4 1.6 29.16 2.56 8.64


I 19 26 2.4 12.6 5.76 158.76 30.24
J 30 28 13.4 14.6 179.56 213.16 195.64
Jumlah 166 134 0 0 492.4 662.4 385.6
Dari tabel di atas maka diperoleh:
166 134
a. X  16, 6 dan Y   13, 4
10 10

 X  X 
2
492, 4
b. SX    54, 71  7,39
n 1 9

 Y  Y 
2
662, 4
c. SY    73, 6  8,58
n 1 9
Jadi jika menggunakan rumus (5) diperoleh koefisien korelasi antara
stress dan kesulitan makan adalah

r
  X  X Y  Y   385, 6

385, 6
 0, 676
 n  1 S X SY  9  7,39 8,58 570, 66

d. S XY 
  X  X Y  Y  
385,6
 42,84
n 1 9
42,84 42,84
Jika menggunakan rumus (4) maka r    0, 676
 7,39  8,58  63, 41
hasilnya sama dengan menggunakan rumus (5) di atas.
Apabila dalam menghitung koefisien korelasinya menggunakan angka
kasar dan angka baku, maka perhitungannya adalah sebagai berikut.

Tabel 3.14
Perhitungan Koefisien Korelasi

Siswa X Y X2 Y2 XY ZX ZY Z X ZY
A 17 9 289 81 153 0.054054 -0.51282 -0.02772
B 8 13 64 169 104 -1.16216 -0.04662 0.05418
C 8 7 64 49 56 -1.16216 -0.74592 0.866881
D 20 18 400 324 360 0.459459 0.536131 0.24633
E 14 11 196 121 154 -0.35135 -0.27972 0.09828
F 7 2 49 4 14 -1.2973 -1.32867 1.723682
G 21 5 441 25 105 0.594595 -0.97902 -0.58212
H 22 15 484 225 330 0.72973 0.18648 0.13608
3.52 Statistika Pendidikan 

Siswa X Y X2 Y2 XY ZX ZY Z X ZY
I 19 26 361 676 494 0.324324 1.468531 0.47628
J 30 28 900 784 840 1.810811 1.701632 3.081333
Jumlah 166 134 3248 2458 2610 6.073206

Dari tabel di atas, maka kita dapat menghitung koefisien korelasinya sebagai
berikut.
n XY   X  Y
rXY 

n X 2    X 
2

n Y 2    Y 
2

10  2610   166 134 

 10  3248  166 
2

10  2458   134 
2

 0, 676
Dan juga

rXY 
Z X ZY 

6, 073
 0, 675
n 1 9

Dari hasil perhitungan di atas, semua formula yang digunakan tersebut


ekuivalen.

2. Beberapa Sifat Korelasi


Sebelum membahas tentang korelasi sebagai prediksi, perlu diketahui
bahwa efek transformasi linear pada data tidak mempengaruhi besar
koefisien korelasi. Jika dimisalkan setiap skor mentah data yang dipunyai
dikurangi atau ditambah bilangan tertentu, maka rata-ratanya akan berubah
sebesar bilangan pengurang atau penambahnya, sedangkan varians dan
korelasinya tidak berubah. Misalkan tinggi badan siswa dalam sentimeter,
125, 145, 155, 136, 148, dst, Jika setiap datanya kita kurangi dengan 100,
maka diperoleh data baru yakni 1,25; 1,45; 1,55; 1,36; 1,48; dst. Rata-ratanya
akan berkurang 100, tetapi variannya akan tetap. Begitu juga jika
dikorelasikan dengan data lain, misalnya berat badan, atau usia, maka
korelasi antara kedua variabel setelah ditambah atau dikurangi skor
mentahnya akan tetap seperti semula. Cobalah Anda lakukan simulasi untuk
kedua kelompok data berikut!
 MPDR5202/MODUL 3 3.53

Contoh.3.13:
Misalkan diberikan data dari dua kelompok sebagai berikut.
X 4 5 7 8 9 12 16
Y 100 120 118 130 128 130 120
a. Hitunglah rata-rata dan simpangan baku keduanya!
b. Tentukan koefisien korelasi dari X dan Y!
c. Jika setiap data dari variabel X dikurangi dengan 100, hitung rata-rata,
simpangan baku yang baru. Kemudian hitung kembali korelasi dari
kedua variabel tersebut!

Jawab.
a. Rata-rata dan simpangan baku dari X dan Y adalah sebagai berikut.
61 846
X  8, 71 dan Y   120,86
7 7
103, 43 662,86
SX   4,15 dan SY   10,51
6 6
b. Dari hasil a), maka dapat kita hitung korelasinya adalah sebagai berikut.

r
  X  X Y  Y   125, 71
 0, 48
 n  1 S X SY  6  4,1510,51
c. Jika data variabel Y dikurangi 100, maka jika misalkan Y 1 sebagai
variabel yang barunya, maka datanya adalah sebagai berikut.
X 4 5 7 8 9 12 16
Y1 0 20 18 30 28 30 20

Dari tabel di atas, kita hitung rata-rata dan simpangan baku dari Y1
146 662,86
Y1   20,86 dan SY1   10,51
7 7
Bandingkan hasilnya dengan a), Y1  Y  100 dan SY 1  SY .
Adapun korelasi dari X dan Y1 adalah sebagai berikut.

r
  X  X Y1  Y1   125, 71
 0, 48 .
 n  1 S X SY 1  6  4,1510,51
Dengan demikian koefisien korelasinya sama dengan X dan Y.
Kita juga dapat melihatnya dari diagram pencar keduanya seperti yang
terlihat pada gambar berikut.
3.54 Statistika Pendidikan 

Gambar 3.9
Diagram Pencar antara X dan Y

Gambar3.10
Diagram Pencar antara X dan Y1

Jika diperhatikan kedua diagram pencar tersebut sama, hanya ada perubahan
dari nilai Y ke Y1. Jika sumbu horizontalnya dari gambar (a) ditransformasi
ke nol (0), maka diagram pencar tersebut akan ekuivalen.
Dari hasil di atas dapat disimpulkan bahwa koefisien korelasi (r) tidak
dipengaruhi oleh transformasi linear manapun atas skor-skor mentahnya.
Untuk latihan cobalah contoh di atas dihitung kembali oleh Anda, dengan
menambah seluruh skor pada variabel X dengan 100, kemudian lakukan
perhitungan seperti pada contoh tersebut!
 MPDR5202/MODUL 3 3.55

Namun demikian kita perlu hati-hati. Korelasi Spearman hanya berlaku


pada hubungan yang linear. Menurut Minium, dkk (1993) prinsip
menggerombol data terhadap garis lurus merupakan cerminan dari koefisien
korelasi. Semakin erat skor-skor menggerombol garis lurus yang paling
sesuai, maka semakin tinggi koefisien korelasinya. Jika diagram pencarnya
membentuk kurvilinear (misalkan berbentuk ), maka jika kita hitung
koefisien r dari kedua variabelnya, hasilnya akan bernilai positif. Tanda
positif muncul disebabkan titik-titik skor data bergerombol dari kiri bawah
ke kanan atas. Tetapi nilai r akan tetap memberi informasi seberapa erat titik-
titik tersebut bergerombol terhadap garis lurus. Karena titik-titik tersebut
menyebar terhadap garis lurus, maka nilai r absolutnya akan rendah atau
kecil. Dengan demikian, sifat pertama dari koefisien r adalah jika hubungan
antara dua variabel adalah kurvilinear, maka apabila tingkat asosiasi dengan
koefisien korelasi Pearson hasilnya akan kecil.
Sifat lainnya dari koefisien korelasi adalah sangat bergantung kepada
variasi penyampelan. Sifat ini sama dengan statistik lainnya, seperti rata-rata
dan simpangan baku. Pada sampel yang berbeda dari populasi yang sama,
nilai korelasinya mempunyai kemungkinan untuk berbeda. Koefisiennya
akan berfluktuasi dari sampel ke sampel. Untuk sampel-sampel yang sangat
kecil, nilai r sering tidak stabil dari sampel ke sampelnya, sehingga tidak
dapat mendekati nilai korelasi bagi populasinya. Minium, dkk (1993)
memberikan gambaran kaitan antara ukuran sampel dengan batas-batas
korelasi dengan derajat kepercayaan 95% ketika korelasi pada populasinya
adalah nol.

Tabel 3.15
Batas-Batas untuk r dengan Derajat Kepercayaan 95%
pada Berbagai Ukuran Sampel

Ukuran Sampel Batas-Batas untuk r (95%)


5 –0,88 s.d +0.88
15 –0,51 s.d +0,51
25 –0,40 s.d +0,40
50 –0,28 s.d +0,28
100 –0,20 s.d +0,28
200 –0,14 s.d +0,14
3.56 Statistika Pendidikan 

Tabel di atas memperlihatkan ketika sampelnya makin besar, maka batas-


batas bagi r makin mendekati nol. Artinya koefisien korelasi pada sampel
makin mendekati koefisien korelasi pada populasi. Untuk ukuran sampel 5
pasang skor, 95% sampel-sampel itu akan menghasilkan koefisien korelasi di
antara -0,88 sampai dengan +0,88, dan 5% dari sampel-sampelnya akan
mempunyai koefisien korelasinya akan lebih jauh dari nilai korelasi
sebenarnya. Ukuran sampel yang besar cenderung memberikan nilai r yang
relatif stabil. Untuk menguji apakah besarnya koefisien korelasi dari sampel
berbeda secara berarti dari nol akan dibahas dalam pengujian hipotesis pada
modul berikutnya.
Selain kedua sifat di atas, sifat lain dari r adalah mempunyai
ketergantungan terhadap subyek-subyek yang kebetulan terambil, bagaimana
peneliti melakukan pengukuran terhadap variabel-variabelnya, dan kondisi-
kondisi khusus di mana variabel-variabel beroperasi. Ketergantungan pada
subyek-subyek yang diukur sudah dibahas di atas. Yang kedua adalah
ketergantungan pada bagaimana peneliti melakukan pengukuran terhadap
variabel-variabelnya, hal ini berkaitan dengan perubahan variabel yang
dikorelasikan. Jika kita mengkorelasikan tes masuk perguruan tinggi melalui
SNMPTN dengan tes dengan IPK mahasiswa, tentu akan berbeda apabila kita
menggunakan tes masuk lainnya, misalkan Ujian mandiri, dengan IPK. Dan
yang terakhir, kondisi-kondisi khusus jika dimisalkan mahasiswa mengambil
mata kuliah dengan mengulang, tentu hasil korelasi antara tes masuk dengan
IPK akan berubah.

B. REGRESI

1. Persamaan Regresi Linear


Sebagaimana telah dijelaskan di atas bahwa jika dua peubah memiliki
hubungan yang kuat maka diagram pencar pasangan data yang berupa titik-
titik dalam sumbu koordinat akan bergerombol terhadap suatu garis lurus
yang paling tepat. Untuk itu, kita perlu mencari garis yang paling cocok atau
diistilahkan dengan best fit tersebut. Best fit didefinisikan lebih dari satu
cara. Solusi Karl Pearson’s untuk masalah tersebut menggunakan apa yang
disebut dengan kriteria kuadrat terkecil atau leastsquare.
Untuk mengetahui bagaimana pendekatan kuadrat terkecil mampu
memprediksi atau menentukan garis yang paling cocok perhatikanlah
diagram berikut ini.
 MPDR5202/MODUL 3 3.57

d5
d4 d6
d2
d3

Gambar 3.11
Contoh Pendekatan Garis Regresi

Perhatikanlah diagram pencar dari enam pasang data (titik) pada diagram
di atas dengan garis regresinya. Nilai prediksi dari garis regresi terhadap nilai
aktual dari Y, misalkan dengan Y’. Dalam kenyataannya garis regresi
tersebut ada yang tepat melalui titik-titik pasangan data, ada juga yang tidak
tepat. Jika garis regresi melalui titik-titik pengamatan, maka garis tersebut
memprediksi dengan tepat Y’ atau Y = Y’, tetapi apabila garis regresi
tersebut tidak melalui titik-titik pengamatan, maka Y Y’ . Misalkan
kesalahan/penyimpangan prediksi garis regresi terhadap pengamatannya
adalah d, atau secara matematik kita tuliskan dalam bentuk d = Y – Y’.
Pendekatan kuadrat terkecil yang digunakan oleh Pearson adalah menentukan
persamaan garis sedemikian hingga  d 2 sekecil mungkin. Sebagai catatan
yang diminimalkan jumlah kuadrat dari selisih, mengapa tidak
meminimalkan jumlah selisih atau  d ? Silakan dicari alasannya.
Seperti diketahui pada aljabar atau ilmu ukur analitik bidang di sekolah
menengah (SMP atau SMA) bentuk persamaan garis lurus adalah sebagai
berikut.
Y '  a  bX
3.58 Statistika Pendidikan 

Dengan:
Y’ menyatakan hampiran dari Y.
a menyatakan intersep atau perpotongan dengan sumbu vertikal.
b menyatakan kemiringan garis atau gradien.

Di antara semua kemungkinan garis lurus yang dapat dibuat pada


diagram pencar, melalui pendekatan kuadrat terkecil dipilih suatu garis
regresi yang membuat jumlah kuadrat jarak vertikal dari titik-titik
pengamatan ke garis regresi tersebut sekecil mungkin. Di atas sudah
dimisalkan bahwa di menyatakan simpangan vertikal dari titik ke-i ke garis
regresi, seperti terlihat pada gambar di atas, maka pendekatan kuadrat terkecil
menghasilkan rumus untuk menghitung a dan b sehingga jumlah kuadrat
semua simpangan itu minimum. Jumlah kuadrat semua simpangan ini
biasanya disebut dengan jumlah kuadrat galat sekitar garis regresi. Jadi jika
mempunyai sejumlah n pasang data  X i , Yi  , maka kita dapat menentukan a
dan b dengan cara meminimumkan
n n

d   Yi  Y '   Yi  a  bX i 


2 2 2
i
i 1 i 1

Untuk memperoleh a dan b dengan meminimukan jumlah kuadrat galat


digunakan kalkulus diferensial. Tetapi itu tidak akan dilakukan di sini. Bagi
Anda yang ingin memahaminya dapat dipelajari pada akhir modul ini.
Melalui langkah di atas, maka jika diketahui n pasangan data sampel
 X i , Yi  diperoleh nilai dugaan kuadrat terkecil bagi parameter dalam garis
regresi
Y '  a  bX

Dapat diperoleh melalui rumus

n n n
n X iYi   X i  Yi
b i 1 i 1 i 1
2
n
 n 
n X i2    X i 
i 1  i 1 
a  Y  bX
Contoh. (diadopsi dari Walpole, 1995)
 MPDR5202/MODUL 3 3.59

Perhatikanlah data skor intelegensia dengan skor matematika bagi 12 siswa


yang terdapat dalam tabel berikut.

Tabel 3.16
Data Skor Intelegensia (X) dan Skor Matematika (Y)

Siswa Skor Tes Intelegensia (X) Skor Matematika (Y)


1 65 85
2 50 74
3 55 76
4 65 90
5 55 85
6 70 87
7 65 94
8 70 98
9 55 81
10 70 91
11 50 76
12 55 74
Sumber : Walpole (1995)

Garis regresinya dapat dihitung dengan bantuan tabel berikut.

Tabel 3.17
Tabel Bantun untuk Perhitungan Koefisien Regresi

Siswa X Y X^2 XY
1 65 85 4225 5525
2 50 74 2500 3700
3 55 76 3025 4180
4 65 90 4225 5850
5 55 85 3025 4675
6 70 87 4900 6090
7 65 94 4225 6110
8 70 98 4900 6860
9 55 81 3025 4455
10 70 91 4900 6370
11 50 76 2500 3800
12 55 74 3025 4070
Jumlah 725 1011 44475 61685
Rata-Rata 60.42 84.25
3.60 Statistika Pendidikan 

Dari tabel di atas, maka dapat dihitung

12  61685   7251011


b  0,897
12  44475   725
2

a  84, 25   0,897  60, 42   30, 056

Dengan demikian persamaan regresinya adalah Y '  30, 056  0,897 X .


Jika diagram pencar dan persamaannya digambarkan, maka hasilnya dapat
dilihat pada gambar berikut.

Gambar 3.12
Diagram Pencar dan Garis Regresi dari Skor Intelegensia
dan Skor Matematika

Perhatikan dengan teliti gambar di atas! Jika garis regresinya


diperpanjang, maka akan memotong sumbu vertikal di titik 30,056, kemudian
jika kita substitusikan suatu skor intelegensia, misalkan 65, maka
berdasarkan garis regersi yang telah dibuat ramalan skor matematikanya
adalah
Y '  30,056  0,897(65)  88,361

Dari hasil di atas tidak ada satu pun siswa yang skor intelegensianya 65
memperoleh skor matematika 88 (misalkan dibulatkan). Skor 88 yang
 MPDR5202/MODUL 3 3.61

diperoleh dari persamaan regresi ditafsirkan sebagai skor ramalan atau nilai
harapan bagi semua siswa yang skor intelegensianya 65.

2. Kesalahan Baku dari Penaksiran


Dari contoh di atas, kita memperoleh informasi bahwa Y’ adalah nilai
harapan dari Y melalui persamaan regresi ketika diberikan nilai X tertentu.
Tentu saja nilai Y’ tidak sama dengan nilai aktual dari Y pada nilai X
pasangannya. Seperti kasus di atas, jika kita mempunyai skor intelegensi 65,
maka harapannya ia memperoleh skor matematika 88,361 yang berbeda
dengan nilai aktual skor matematika bagi siswa yang mempunyai
intelegensia 65. Dengan demikian, perlu dipahami bahwa nilai prediksi
hanyalah suatu estimasi dari nilai rata-rata dari Y untuk kasus-kasus ketika
kita memberikan nilai X.
Lebih lanjut, kita perlu mengetahui suatu cara untuk mengukur
kesalahan prediksi, keragaman dari nilai Y sebenarnya yang diperoleh dari
nilai prediksi Y’. Kesalahan baku dari taksiran dilambangkan dengan SYX ,
yang secara eksak dapat dihitung dengan rumus

 Y  Y ' 
2

SYX 
n2

Ketika korelasi sempurna, setiap nilai dari Y  Y '  adalah nol dan kesalahan
2

baku penaksirannya juga nol  SYX  0  . Dengan demikian nilai dari SYX
akan mempunyai range dari nol ketika korelasi sempurna sampai dengan S Y
ketika antara X dan Y tidak ada korelasi. Kondisi keragaman dari SYX dapat
terlihat seperti gambar berikut.
3.62 Statistika Pendidikan 

Nilai-nilai dari
(Y – Y’) cukup
(Yi – Y’) besar sehingga
korelasinya
kecil. Hal ini
menimbulkan
nilai SYX yang
besar

Nilai-nilai dari
(Y-Y’) kecil,
sehingga
korelasinya
(Yi – Y’) besar. Hal ini
mengakibatkan
nilai dari SYX
menjadi kecil

Gambar 3.13
Perbandingan Kesalahan Baku dari Penaksiran (SYX)
Sebagai Suatu Fungsi dari (Y – Y’)

Apakah SYX merupakan simpangan baku yang nyata? Sebagaimana


disebutkan di atas bahwa nilai Y’ merupakan rata-rata dari Y untuk nilai-nilai
X yang merupakan pasangannya. Dengan demikian, SYX adalah simpangan
baku (standard deviation); SYX is the standard deviation of obtained Y scores
about the predicted Y scores.
 MPDR5202/MODUL 3 3.63

Karena SYX merupakan simpangan baku, maka haruslah mempunyai sifat


bahwa jumlah kuadrat dari simpangan setiap skor-skor dari rata-ratanya,
 Y  Y ' 
2
, adalah minimum sebagaimana sifat dari simpangan baku. Sifat
yang kedua berkaitan dengan SYX adalah jumlah dari selisih nilai Y dengan
Y’ haruslah nol atau  Y  Y '  0 . Hal ini sebagaimana yang telah kita
bahas sebelumnya bahwa  Y  Y   0 .
Untuk lebih jelasnya, perhatikan kembali contoh di atas yang berkaitan
dengan data skor intelegensia dan skor matematika.

Tabel 3.18
Perhitungan SY dan SYX

Y  Y  Y  Y ' Y  Y '
2 2

Siswa X Y Y’

1 65 85 88.361 0.5625 -3.361 11.29632


2 50 74 74.906 105.0625 -0.906 0.820836
3 55 76 79.391 68.0625 -3.391 11.49888
4 65 90 88.361 33.0625 1.639 2.686321
5 55 85 79.391 0.5625 5.609 31.46088
6 70 87 92.846 7.5625 -5.846 34.17572
7 65 94 88.361 95.0625 5.639 31.79832
8 70 98 92.846 189.0625 5.154 26.56372
9 55 81 79.391 10.5625 1.609 2.588881
10 70 91 92.846 45.5625 -1.846 3.407716
11 50 76 74.906 68.0625 1.094 1.196836
12 55 74 79.391 105.0625 -5.391 29.06288
Jumlah 725 1011 728,25 0,003 186,557
Rata-Rata 60.42 84.25 728,25 186,557

Dari tabel tersebut dapat dihitung:

 Y  Y 
2
728, 25
SY    8,14 dan
n 1 11

 Y  Y ' 
2
186,557
SYX  
 4,32
n2 10
Dan Anda dapat lihat bahwa  Y  Y '  0,003 mendekati nol. Nilainya
tidak sama dengan nol diakibatkan pengaruh pembulatan yang dilakukan
dalam perhitungan.
3.64 Statistika Pendidikan 

Terakhir dari pembahasan dalam kegiatan belajar ini adalah hubungan


antara korelasi dan regresi. Sebagaimana diungkapkan di atas, bahwa
biasanya (tetapi tidak selalu) pasca perhitungan korelasi di antara dua
variabel kita lanjutkan dengan perhitungan regresi. Persamaan regresi yang
diperoleh di atas, dapat juga diturunkan dari korelasi, begitu juga sebaliknya,
dari persamaan regresi kita dapat memperoleh rumus korelasi, korelasi
Pearson.
Jika kita menggunakan angka baku dalam perhitungan, maka persamaan
regresi dapat dihitung dengan menggunakan hubungan sebagai berikut.

ZˆY  rZ x

Di mana :
ZY : prediksi angka baku dari Y
r : koefisien korelasi antara X dan Y
Z X : angka baku dari X

Dari persamaan tersebut, maka kita dapat memperoleh persamaan regresi


S  S 
Yˆ  r  Y  X  r  Y  X  Y
 SX   SX 
Dan juga jika kita menghitung standar eror regresinya adalah sebagai
SYX  SY 1  r 2
Karena ada materi terkait yang belum dibahas dalam modul ini, maka
penurunan persamaan korelasi dari regresi akan dibahas pada Modul 8.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!

1) Sebutkanlah, apakah yang berikut merupakan masalah korelasi, regresi,


keduanya (korelasi dan regresi). Dan jika hubungannya korelasi,
sebutkan apakah korelasinya negatif, nol, atau, positif.
a. Hubungan antara IQ dengan berat anak berumur 10 - 15 tahun
b. Hubungan antara curah hujan dan hasil jagung di suatu daerah
c. Hubungan antara keramaian kota dengan banyaknya kejahatan
 MPDR5202/MODUL 3 3.65

d. Hubungan antara berat telur dengan umur ayam petelur


e. Hubungan antara tinggi dan berat badan anak sekolah dasar
f. Hubungan antara tinggi badan dan kecerdasan orang dewasa
g. Hubungan antara usia suami dan istri dari pasangan yang sudah
menikah
2) Berikut disajikan skor hasil ulangan formatif (X) dan hasil ulangan
semester (Y) sebagian siswa di kelas VI.
Siswa A B C D E F G H I J
X 3 9 7 8 4 6 7 9 5 6
Y 2 6 7 9 5 6 8 9 6 8
a. Gambar diagram pencarnya, kemudian perkirakan besar
korelasinya!
b. Hitung nilai r dengan menggunakan angka kasar!
c. Hitung nilai r dengan menggunakan simpangan!
d. Apakah hasil b) dan c) sama? Manakah yang menurut Anda lebih
mudah dalam perhitungannya? Berikan penjelasan!
e. Berikan interpretasi dari nilai korelasi yang diperoleh!
3) Apakah nilai r yang kecil di antara dua variabel senantiasa menunjukkan
bahwa terdapat asosiasi yang kecil saja di antaravariabel-variabel itu?
Jelaskan!
4) Tabel berikut menyajikan berat badan X dan Y dari sejumlah sampel
yang terdiri dari 12 orang laki-laki dewasa dengan putra mereka yang
tertua.

X 65 63 64 68 62 70 66 68 67 69 71
Y 68 66 68 69 66 68 65 71 67 68 70

a. Buatlah diagram pencarnya!


b. Carilah regresi Y terhadap X!
c. Carilah regresi X terhadap Y!
d. Gambar kedua persamaan yang diperoleh dari b) dan c) pada
diagram pencar yang dibuat pada a)! berikan interpretasi!
5) Dari soal 4) di atas, hitunglah standar eror bagi kedua persamaan
regresinya (SYX dan SXY)!
3.66 Statistika Pendidikan 

Petunjuk Jawaban Latihan

1) Sifat hubungan :
a. Tidak keduanya
b. Korelasi dan regresi (positif)
c. Korelasi (positif)
d. Korelasi (positif)
e. Korelasi dan Regresi (positif)
f. Tidak keduanya
g. Korelasi dan regresi (positif)
2) Dari data pada tabel diperoleh
a. Diagram pencar

b.
Besar korelasi : r = 0,772
c.
Hasilnya sama
d.
Gunakan tabel 11. Siswa yang mendapat nilai ulangan formatif di
atas median, sekitar 75% juga memperoleh ulangan semester di atas
median dan 25% hasil ulangan semesternya di bawah median.
3) Dari data dapat dihitung persamaan regresinya sebagai berikut.
a. Diagram pencar
 MPDR5202/MODUL 3 3.67

b. Yˆ  42,38  0,381X
c. Xˆ  2,546  1,020Y
d. Grafik kedua persamaan
a. Grafik kedua persamaan
Yˆ  42,38  0,381X
72
71
70
69
68
Y

67
Xˆ  2,546  1,020Y
66
65
64
60 62 64 66 68 70 72
X

R A NG KU M AN

1. Dalam analisis deskriptif distribusi bivariat, di mana kita bekerja


dengan dua variabel acak terdapat dua kerja dasar yang biasanya
dilakukan berurutan, yakni menghitung derajat asosiasi/hubungan di
antara dua variabel, dan kedua adalah menghitung prediksi satu
variabel atas variabel lainnya.
3.68 Statistika Pendidikan 

2. Korelasi Pearson yang disimbolkan dengan r, merupakan ukuran


derajat asosiasi yang digunakan ketika skala pengukuran dua
variabel acaknya minimal interval. Ukuran ini menyatakan
kesesuaian antara posisi relatif satu variabel dalam posisi relatif satu
variabel lainnya, sehingga dapat mencerminkan seberapa baik
incaran titik-titik data menggerombol garis lurus yang paling cocok.
3. Tanda pada koefisien korelasi (positif atau negatif) menyatakan arah
hubungan kedua variabel. Tanda positif menyatakan hubungan yang
searah, sedangkan tanda negatif menyatakan hubungan
berkebalikan. Keeratan hubungannya baik positif maupun negatif
ditentukan oleh harga mutlaknya. Jadi r = + 0,6 dengan r = 0,6
mempunyai makna derajat yang sama, hanya sifat arah
hubungannya yang berbeda.
4. Nilai korelasi antara dua variabel tidak mesti menyatakan adanya
hubungan sebab akibat.
5. Regresi menyatakan hubungan fungsional antara dua peubah. Model
atau persamaan regresi digunakan untuk memprediksi skor variabel
terikat oleh variabel bebas yang diketahui.
6. Model regresi ditaksir dengan menggunakan kuadrat terkecil,
dengan cara meminimalkan kuadrat residu antara skor sebenarnya
dengan skor yang ditaksir.

TES F OR M AT IF 2

Jawablah pertanyaan berikut dengan ringkas dan jelas!

1) Dalam bidang kesehatan sudah diyakini bahwa banyaknya rokok yang


dikonsumsi seseorang selama hidupnya semakin besar kemungkinan
bahwa kanker paru-paru sudah berkembang dalam orang itu.
a. Apakah arah korelasi dari kedua variabel tersebut?
b. Jika merokok tidak menyebabkan kanker paru-paru, apakah yang
mungkin dari korelasi di antara kedua variabel tersebut?
c. Apa yang menjadi bukti dari keyakinan para otoritas dalam bidang
kesehatan tentang hubungan kedua variabel tersebut?
2) Misalkan korelasi dari 10 siswi (siswa wanita) dalam tes pelajaran
matematika dengan tes pelajaran bahasa adalah 0,5. Dan untuk 10 orang
siswa (siswa laki-laki) korelasinya kedua hasil tes adalah 0,3. Seorang
guru mengatakan bahwa hubungan antara kedua mata pelajaran tersebut
lebih kuat pada siswa wanita dibandingkan dengan siswa laki-laki.
Apakah hal tersebut dapat diterima.
 MPDR5202/MODUL 3 3.69

3) Jelaskan arti dari


a. r = –0 ,6
b. r = 0,0
c. r = +0,7
d. r = +0,8
4) Misalkan diketahui data skor masuk perguruan tinggi (X) dengan skor
hasil ujian statistika (Y) X  1000 , SX = 140 , Y  2,00 , SY = 0,50, dan
r = + 0,35.
a. Prediksilah Skor hasil ujian Statistika jika skor ujian masuknya 950
dan 1100!
b. Hitunglah SYX!
5) Misalkan diberikan data tentang hasil ujian matematika sebelum
pembelajaran (X) dan setelah pembelajaran (Y)
Siswa X Y
1 29 56
2 9 26
3 14 43
4 18 44
5 16 34
6 21 41
7 9 36
8 21 53
9 11 37
10 27 54
11 19 38
12 15 29
13 20 54
14 10 28
15 18 43
16 15 34
17 25 53
18 20 45
19 14 38
20 18 40
a. Gambarkan diagram pencar dari data tersebut dengan X sebagai
sumbu horizontal dan Y sumbu vertikal
b. Gunakan kalkulator untuk menghitung koefisien korelasinya!
Berikan kesimpulan yang diperoleh dari nilai korelasinya!
3.70 Statistika Pendidikan 

c. Hitunglah persamaan regresinya! Dapatkah dikatakan bahwa ada


hubungan yang linear antara hasil tes awal dengan akhir pada mata
pelajaran matematika? Berikan alasan!

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 20. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut
untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan
Belajar 2.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 2, terutama bagian yang
belum dikuasai.
 MPDR5202/MODUL 3 3.71

Kunci Jawaban Tes Formatif

Tes Formatif 1
1) X  7,3 dan Me = 7,25 (Skor 5)
2) Median, karena perhitungan rata-rata tidak dapat dilakukan dengan
menggunakan asumsi untuk titik tengah kelas yang pertama. (Skor 5)

3) Karena X 
 X , dan misalkan data yang hilang adalah Y, maka
n
3  5  9 1 9  2  0  3  9  Y
4,8 
10
 48  41  Y
Y 7
Jadi data yang hilang adalah 7. (skor 5)
4) Jumlah keseluruhan yang tidak lulus 140 orang, sedangkan jumlah
seluruh siswa 1350, dengan demikian persentase yang tidak lulus adalah
140
100%  10, 4% .
1350
Dan persentase yang lulus tiap sekolah adalah:
Sekolah A = 90%
Sekolah B = 96,7%
Sekolah C = 80%
Dan keseluruhan rata-rata yang lulus dari ketiga sekolah adalah 100% –
10,4% = 89,6%.
(Skor 5)
5) Hubungan antara ketiganya adalah X  Mo  3  X  Me  . Karena
median dan modusnya 67,8 dan 84,9, maka rata-ratanya adalah 59,25.
Dengan demikian hubungan ketiganya X  Me  Mo . Kemiringan
distribusinya negatif atau ke arah kiri.
(Skor 5)
6) Misalkan data tersebut merupakan data sampel, maka dengan
menggunakan simpangan dapat dihitung varian dan simpangan bakunya
adalah.
3.72 Statistika Pendidikan 

NO X ( X  X )2 Y (Y  Y ) 2
1 15 9 17 9
2 14 4 16 4
3 11 1 13 1
4 11 1 13 1
5 9 9 11 9
JMLH 60 24 70 24
Dari tabel di atas maka dapat dihitung
24
sX   6  2, 45
4
24
sY   6  2, 45
4
Hasilnya varians dan simpangan baku dari X dan Y adalah sama. Hal ini
disebabkan data dari Y adalah data pada masing-masing X ditambah 2,
sehingga variabilitasnya tetap sama.
(skor 5)
7) Varians data kedua 9 × 5,1 = 45,9 dan varians data kedua adalah 5,1
(skor 5)
8) Untuk memudahkan membandingkan hasil ketiga calon tersebut
digunakan angka baku.
83  62
Untuk calon A : Z   1,3125
16
97  83
Untuk calon B : Z   0, 7087
23
87  65
Untuk calon C : Z   1,5714
14
Dengan demikian urutan dari ketiga calon tersebut adalah C, A, dan B.
Direkomendasikan calon C yang dipilih.
(skor 5)

Test Formatif 2
1) Positif, karena semakin banyak merokok, semakin tinggi peluang
berkembangnya penyakit kanker.
2) Mungkin benar, tetapi tidak menjamin kepercayaannya. Nilai korelasi
sangat dipengaruhi oleh variasi sampling (kesalahan dalam sampling).
 MPDR5202/MODUL 3 3.73

Dari sampel ke sampel nilai korelasi dapat berbeda. Tingginya korelasi


dalam kelompok siswa wanita sangat mungkin kebetulan pada sampel
yang dipilih. Selain itu nilai korelasi dapat terjadi hanya karena
keterbatasan variabilitas antara rata-rata skor dalam matematika dan skor
hasil ujian.
3) Untuk membaca nilai korelasi dapat menggunakan tabel yang dibuat
oleh Michael yang disajikan dalam modul.
a. Arti dari r = –0,6 menurut tabel tersebut adalah responden yang
skor-skor variabel pertama yang di atas median sebanyak 70,3%
juga memperoleh skor variabel keduanya di atas median, sisanya
29,7% memperoleh skor di bawah median. Ingat arti tanda negatif
sama dengan positif, hanya hubungannya yang berkebalikan
b. Arti r = 0,00 adalah responden yang skornya di atas median pada
variabel pertama sebanyak 50% memperoleh skor di atas median
pada variabel kedua, dan sisanya 50% di bawah median.
c. Arti r = +0,7 adalah responden yang skornya di atas median pada
variabel pertama sebanyak 74,5% juga memperoleh skor di atas
median pada variabel kedua, dan sisanya 20,7% skornya di bawah
median.
d. Arti r = +0,8 adalah responden yang skornya di atas median pada
variabel pertama sebanyak 79,3% memperoleh skor di atas median
pada variabel kedua, dan sisanya 50% di bawah median.
4) Diketahui: X  1000 , SX= 140 , Y  2,00 , SY = 0,50, dan r = + 0,35,
maka persamaan regresinya adalah
S  S 
Yˆ  r  Y  X  r  Y  X  Y
 SX   SX 
 0,50   0,50 
  0,35    X   0,35    1000   2, 00
 140   140 
 0, 00125 X  1, 25  2, 00
 0, 00125 X  0, 75

Taksiran skor nilai akhir dengan skor masuk 1100 dan 950 adalah
Yˆ  0, 00125  950   0, 75  1,9375 dan
Yˆ  0, 00125 1100   0, 75  2,125
3.74 Statistika Pendidikan 

Harga dari SYX adalah


SYX  SY 1  r 2  0,50 1   0,35   0,50  0,93675   0, 468
2

5) Diagram pencarnya adalah sebagai berikut.

Dari diagram pencar hubungan antara tes awal dan tes akhir adalah
positif, karena data bergerombol miring ke sebelah kanan.
Nilai korelasinya r = + 0,845 dan persamaan regresinya adalah
Y   17,394  1,37 X .
Jika dilihat dari diagram pencar, korelasi dan garis regresi dapat diduga
bahwa hubungannya linear
 MPDR5202/MODUL 3 3.75

Daftar Pustaka

Dowdy, S. & Wearden, S. 1991. Statistcs for Research (secondedition). New


York: John Wiley & Son.

Kerlinger, F. N. 2006. Asas-asas Penelitian Behavioral (terjemahan).


Jogjakarta: Gadjah Mada University Press.

Hogg, Robert V. & Craigh, A. T. 1978. Introduction to Mathematical


Statistics (fourth edition). New York: Mcmillan Publishing Co. Inc.

Minium, E. W., King, B. M. & Bear, Gordon, 1993. Statistical Reasoning in


Psychology and Education. New York : Joh Wiley & Sons, Inc.

Purcell, E. J. & Vareberg, D. 1995. Kalkulus dan Geometri Integral. Alih


bahasa: I Nyoman Susila, I. N. Kartasasmita, B. & Rawuh. Jakarta:
Erlangga.

Spiegel, M. R. 1992. Statistik (Versi Metrik). Alih bahasa : I Nyoman Susila.


Jakarta: Erlangga.

Steel, R. G. D. & Torrie, J. H., 1995. Prinsip dan Prosedur Statistika. Suatu
Pendekatan Biometrik. Alih Bahasa: Bambang Sumantri. Jakarta:
Gramedia Pustaka Utama.

Sudjana, 1989. Metoda Statistika. Bandung: Tarsito.

Sugiyono, 2008. Statistika untuk Penelitian. Bandung: Alfabeta.

Walpole, R.E. 1995. Pengantar Statistika (edisi ke-3). Alih bahasa:


Bambang Sumantri. Jakarta : Gramedia Pustaka Utama.
Modul 4

Kurva Normal dan Kurva


Normal yang Baku
Prof. Dr. Wahyudin

PEN D AH U LU A N

D i dalam pembahasan-pembahasan sebelumnya, kita telah beberapa kali


membicarakan tentang kurva normal. Sejarah kurva normal membantu
kita untuk memahami penggunaannya yang meluas sebagai suatu model
untuk observasi-observasi statistik.
Teori statistik dimulai pada pertengahan abad ke-tujuh belas. Pada masa
itu, sumbangan-sumbangan penting pertama diberikan pada prinsip-prinsip
yang berkenaan dengan kejadian-kejadian dan peluang, pada teori
probabilitas. Untuk mengilustrasikan hal yang demikian, misalkan kita men-
tos 6 koin dan mencatat kemunculan gambar (garuda). Jumlah kemunculan
itu beragam dari 0 hingga 6. Tiap koin berkemungkinan sama untuk muncul
sebagai gambar seperti halnya munculnya angka, dan hasil tos sebarang salah
satu koin tadi 6 koin itu sama sekali tidak mempengaruhi hasil tos sebarang
koin lainnya. Oleh karena faktor-faktor kesempatan, kita tidak bisa katakan
secara pasti berapa banyak gambar akan muncul dalam percobaan sebarang
percobaan 6 koin itu. Tetapi misalkan saja kita ajukan pertanyaan-pertanyaan
lain: Jika kita ulangi men-tos 6 koin itu terus sampai kesekian kali, dengan
jumlah yang sangat besar, seberapa sering kita akan mendapatkan 0 gambar?
Seberapa sering gambar akan muncul sekali? Dua kali? Para matematikawan
dahulu mengembangkan suatu teori yang memberikan jawaban-jawaban
untuk permasalahan di atas. Pada Gambar 4.1 akan ditunjukkan distribusi
frekuensi relatif yang diturunkan dari teori itu (disebut distribusi binomial).
Gambar tersebut memperlihatkan bahwa secara rata-rata akan muncul 3
gambar dan bahwa semakin berbeda jumlah gambar dan jumlah angka dalam
sebarang percobaan (misal, 5 gambar dan 1 angka), semakin kecil frekuensi
relatif kejadiannya.
4.2 Statistika Pendidikan 

Jika kita melapiskan suatu kurva ke atas histogram dalam Gambar 4.1,
bangun kurva yang terbentuk itu mendekati kurva normal berbangun-genta.
Jika kita men-tos 14 koin, bukannya 6, akan ada semakin banyak batang di
dalam histogram, dan kurva normal akan semakin cocok baginya, seperti
diilustrasikan dalam Gambar 4.2. Tampaklah jelas bahwa kurva normal
menjadi suatu aproksimasi yang bagus untuk distribusi relatif yang diperoleh
dari operasi faktor-faktor peluang dalam situasi seperti dideskripsikan tadi.
Jika jumlah koin bertambah terus sampai tak hingga, jumlah batang dalam
histogram pun demikian, dan histogram terus semakin mulus.

Gambar 4.1
Frekuensi-frekuensi Relatif Munculnya “Gambar” yang Diperoleh Saat 6 Koin
Ditos Sebanyak tak Terhingga Kali
 MPDR5202/MODUL 4 4.3

Gambar 4.2
Frekuensi-frekuensi Relatif Munculnya “Gambar” yang Diperoleh Saat 10
Koin Ditos Sebanyak tak Terhingga Kali

Pada tahun 1733, matematikawan berkebangsaan Prancis Abraham


deMoivre menemukan rumus untuk kurva normal sebagai kasus pembatas
yang memberi sifat pada tidak terhingga banyaknya kejadian yang
independen (seperti tos-tos koin). Oleh karena asal mulanya ini, kurva normal
telah sering kali dihubungkan dengan pemikiran bahwa keberadaannya
merupakan deskripsi keadaan (sifat; nature) apabila faktor-faktor dalam
jumlah besar sedang beroperasi, masing-masing independen satu sama lain
dan dikendalikan oleh peluang kejadian.
Pengembangan selanjutnya yang signifikan tidak terjadi hingga
permulaan abad ke-sembilan belas. Kemudian tampaklah bahwa dua
matematikawan yang brilian, seorang berkebangsaan Prancis Pierre-Simon
(Marquis de Laplace) dan seorang bangsa Jerman Carl Friedrich Gauss,
menemukan kembali kurva normal secara sendiri-sendiri. Gauss tertarik pada
permasalahan dalam astronomi seperti penentuan orbit suatu planet. Solusi-
solusinya didasarkan pada observasi-observasi yang tunduk pada error (yang
dia temukan terdistribusi dalam pola bangun genta), dan ini membimbingnya
menuju suatu teori error-error dalam observasi. Teori ini sedemikian
berpengaruh hingga pada tahun 1800-an kurva normal dikenal sebagai
“hukum error yang normal.” Nama ini sekarang tidak dipakai lagi, tetapi sisa
dari peristilahan ini bertahan.
4.4 Statistika Pendidikan 

Pengangkatan hal bisa diterapkannya kurva normal sebagai suatu model


untuk situasi-situasi lain terutama dikarenakan kerja Adolphe Quetelet,
berkebangsaan Belgia, pada pertengahan abad ke-sembilan belas. Dia
mengajar matematika dan astronomi, menciptakan metode-metode dasar
antropometrika fisik, serta membantu mendirikan sosiologi. Dia
berkeyakinan bahwa kurva normal dapat diperluas penerapannya pada
masalah-masalah di dalam meteorologi, antropologi, dan urusan-urusan
manusia. Dia berpendapat bahwa “ciri-ciri mental dan moral,” apabila diukur,
akan sesuai pada “hukum normal.” Salah satu konsepsinya yaitu
’hommemoyeni atau “manusia yang rata-rata.” Dia membandingkan distribusi
normal pada gagasan bahwa Alam, dalam mengarahkan pada satu tanda
sasaran, meleset dan dengan begitu menghasilkan suatu distribusi “error” di
dalam upayanya.
Di bagian selanjutnya dari abad ke-sembilan belas, orang Inggris yang
jenius Sir Francis Galton memulai studi serius tentang perbedaan-perbedaan
individual untuk yang pertama kalinya, suatu topik yang menentukan bagi
psikologi dan pendidikan. Dia menemukan bahwa banyak ciri-ciri mental dan
fisik yang cukup cocok dengan kurva normal, dan dia sangat terkesan oleh
hal bisa diterapkannya kurva normal pada fenomena alam. Pada tahun 1889
dia menulis yang artinya kira-kira sebagai berikut:
Saya tahu hampir tidak ada satu pun yang sedemikian mudahnya
membuat takjub imajinasi seperti bentuk mengagumkan dari tata alam
semesta yang diekspresikan oleh “Hukum Frekuensi Error.” Hukum itu
akanlah diperlambangkan oleh bangsa Yunani dan didewakan, anda saja
mereka dulu mengenalnya. Hukum itu merajalela dengan ketenangan
dan dalam pemupusan-diri seutuhnya di tengah-tengah kebingungan
terliar. Semakin besar kerumunan dan semakin besar anarki yang jelas
kelihatan, semakin sempurnalah kekuasaannya. Inilah hukum agung dari
keadaan tanpa-nalar. Bilamana sebuah sampel besar dari elemen-
elemen yang kacau balau diambil dan disusun menurut urut besarnya,
suatu bentuk keteraturan yang paling indah dan tak disangka-sangka
terbukti selama ini telah terpendam.

F. GALTON, Natural Inheritance, MacMillanand Co., London, 1889, hlm.


66

Antusiasme dari Galton ini tidaklah berlebihan dan layak kita apresiasi.
Teorinya, bagaimanapun, mestilah diperhalus berdasarkan pengetahuan masa
kini.
 MPDR5202/MODUL 4 4.5

Jadi sudah tiba saatnya kita mengkaji kurva normal secara lebih dekat.
Kita perlu mengetahui apakah kurva normal itu, apa saja sifat-sifatnya, cara-
cara di mana kurva normal berguna sebagai suatu model statistik, serta
bagaimana menerapkannya di dalam menjawab pertanyaan-pertanyaan.
Setelah menyelesaikan modul ini, Anda diharapkan memiliki
kemampuan:
1. menjelaskan apakah kurva normal itu;
2. menjelaskan sifat-sifat kurva normal;
3. menggunakan kurva normal sebagai suatu model statistik untuk
menyelesaikan soal-soal yang berkaitan dengan statistik.
4.6 Statistika Pendidikan 

Kegiatan Be lajar 1

Kurva Normal

P enting kita membedakan di antara data yang terdistribusi normal (atau


mendekati demikian) dan kurva normal itu sendiri. Kurva normal adalah
suatu abstraksi matematis yang mempunyai persamaan pendefinisiannya
yang khusus (diberikan pada Catatan-1 pada akhir bab ini). Sebagai suatu
abstraksi matematis, kurva normal tidak berhubungan dengan (atau
ditentukan oleh) sebarang kejadian atau kejadian-kejadian di dunia nyata.
Dengan demikian, kurva normal bukanlah suatu “hukum alam,” bertentangan
pada pemikiran dan peristilahan yang berkenaan dengannya pada satu abad
silam. Sama demikian, persamaan suatu lingkaran merupakan abstraksi
matematis dan bukan hukum alam. Kita dapat menemukan sebuah batu besar
yang kelilingnya mendekati suatu lingkaran dengan persamaan tertentu, atau
amati bahwa keliling bumi secara kasar sesuai dengan persamaan sebuah
lingkaran lainnya, atau potong permukaan meja supaya sesuai dengan
persamaan sebuah lingkaran yang ketiga. Bagaimanapun, benda-benda bulat
ini tidak niscaya ada disebabkan abstraksi matematis yang disebut suatu
lingkaran. Kita akan kembali pada persoalan ini nanti.
Seperti persamaan suatu lingkaran mendeskripsikan suatu famili
lingkaran, beberapa besar dan beberapa kecil, demikian pula persamaan
kurva normal mendeskripsikan suatu famili kurva normal. Famili tersebut
berbeda-beda dalam mean-mean dan simpangan-simpangan bakunya. Pada
Gambar 4.3 diilustrasikan tiga buah kemungkinan: mean-mean sama dan
simpangan-simpangan baku sama, serta mean-mean berbeda dan varians
(merupakan kuadrat dari simpangan baku) yang berbeda.1

1
Apabila kurva normal merupakan suatu model yang tepat untuk kejadian-kejadian
nyata, paling seringkali populasi kejadian-kejadian nyata itulah yang dimodelkan
demikian. Oleh karena itu, dalam bab ini kita akan memakai dan  sehubungan
dengan kurva normal daripada X dan S.
 MPDR5202/MODUL 4 4.7

Kurva 1
1 Kurva 2
Kurva 3
Kurva4

4 2

Gambar 4.3
Variasi-variasi Kurva Nomal dalam Mean dan Varians
(Diunduh dari: https://irmasafitri07.wordpress.com/)

Dalam hal-hal lain, anggota-anggota dari famili ini mempunyai


karakteristik-karakteristik yang sama. Semua kurva normal adalah distribusi-
distribusi yang simetris; yaitu, sebelah kiri kurva normal merupakan
pencerminan dari sebelah kanannya. Kurva-kurval normal adalah distribusi-
distribusi yang unimodal, dengan modusnya berada di tengah-tengah. Mean,
median, dan modus mempunyai nilai yang sama. Dimulai pada tengah-tengah
kurva dan bergerak ke arah ke luar, ketinggian kurva pada awalnya menurun
sedikit demi sedikit, kemudian lebih cepat, dan akhirnya melambat. Situasi
yang aneh dan penting berada di ekstrim-ekstrim kurva. Walaupun kurva
normal turun cepat menuju sumbu horizontal, kurva itu tidak akan pernah
benar-benar menyentuhnya, seberapa panjang pun kurva itu. Oleh karena itu,
kurva normal disebut sebagai kurva asimptotis dalam hubungannya pada
sumbu horizontal. Anda mungkin berpikiran bahwa jika kurva normal ini
tidak akan pernah menyentuh sumbu X, proporsi yang besar dari total area di
bawah kurva mestilah berada di ekstrim-ekstrim kurva, tetapi hal ini tidaklah
demikian. Suatu hal penting yang perlu diingat kembali tentang keistimewaan
kurva normal dan distribusi normal adalah hubungannya dengan ukuran
variabilitas, khususnya dengan rata-rata () dan simpangan baku (), yang
menyatakan bahwa di dalam sebarang distribusi normal, interval:
  1 terdiri atas sekitar 68% skor-skor
4.8 Statistika Pendidikan 

  2 terdiri atas sekitar 95% skor-skor


  3 terdiri atas sekitar 99,7% skor-skor

Hubungan antara distribusi normal dan simpangan baku tersebut dapat


digambarkan seperti tampak pada Gambar 4.4 berikut.

Gambar 4.4
Hubungan antara distribusi normal (kurva normal)
dengan rata-rata () dan simpangan baku ()

Sebagai contoh, area yang termasuk ke dalam rentang  3 meliputi


sekitar 99,7 % total area.
Kurva normal adalah suatu distribusi yang kontinu. Ingatlah bahwa nilai-
nilai dari observasi-observasi yang kita catat selalu membentuk suatu
rangkaian yang diskrit. Dengan demikian, apabila kurva normal kejadian
model untuk kejadian-kejadian dunia nyata, kurva ini hanyalah bisa sebagai
aproksimasi.
Akhirnya, untuk semua kurva normal, proporsi area yang berada di
bawah kurva yang relatif terhadap rentang tertentu dari nilai-nilai pada
sumbu horizontal adalah sama apabila nilai-nilai itu dinyatakan pada satu
basis yang sebanding. Sebagai contoh, sekitar dua pertiga (68,26 %) dari area
di bawah suatu kurva normal berada di dalam rentang  1. Maka itu di
dalam suatu kurva normal yang dicirikan oleh  = 100 dan  = 20, sekitar
dua per tiga area itu berada di antara nilai 80 dan 120, dan di dalam kurva
normal yang dicirikan oleh  = 500 dan  = 100, sekitar dua per tiga area
berada di antara nilai 400 dan 600. Kita akan kaji permasalahan seperti ini
nanti.
 MPDR5202/MODUL 4 4.9

Contoh 4.1
Skor hasil-hasil tes seleksi CPNS yang diikuti oleh seribu orang berdistribusi
normal dengan rata-rata 200 dan simpangan bakunya 30. Dengan memakai
keterangan di atas dan Gambar 4.2, berapakah:
a. banyaknya peserta seleksi yang skornya mulai dari 170 sampai dengan
230?
b. banyaknya peserta seleksi yang skornya mulai dari 200 sampai 260?
c. banyaknya peserta yang akan diterima, apabila syarat yang diterima
CPNS berskor paling rendah 260?

Jawab:
Jika kita misalkan rata-rata 200 adalah , dan simpangan baku 30 adalah ,
maka skor-skor 170 =  – 1, 230 =  + 1, dan 260 =  + 2, sehingga
dengan merujuk pada keterangan yang terdapat dalam Gambar4.4 dapat
diketahui bahwa:
a. proporsi peserta seleksi CPNS yang skornya antara 170 dan 230 sama
dengan area pada kurva normal yang berada di antara  – 1dan  + 1
yaitu sekitar 68%. Jadi, banyaknya peserta seleksi yang skornya mulai
dari 170 sampai 230 adalah sekitar 1000  68% = 680 orang.
b. proporsi peserta seleksi CPNS yang skornya antara 200 dan 260 sama
dengan area pada kurva normal yang berada di antara  dan  + 2
1
yaitu  95% = 47,5%. Jadi, banyaknya peserta yang skornya mulai
2
dari 200 sampai 260 adalah sekitar 1000  47,5% = 475 orang.
c. karena proporsi peserta seleksi CPNS yang skornya paling rendah 260
sama dengan area pada kurva normal yang berada di atas  + 2 yaitu
sekitar 50% – 47,5% = 2,5%. Jadi, banyaknya peserta seleksi CPNS
yang akan diterima adalah sekitar 2,5%  1000 = 25 orang.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!
1) Gambarlah histogram dan kurva (poligon) dari hasil percobaan
pengetosan 12 mata uang logam sebanyak tak terhingga kali dan yang
dicatat adalah kejadian munculnya “gambar” yang muncul pada koin-
koin tersebut! Apakah kurvanya normal?
4.10 Statistika Pendidikan 

2) Skor-skor hasil tes seleksi mahasiswa baru yang diikuti oleh 2000 orang
di sebuah perguruan tinggi berdistribusi normal dengan rata-rata 400 dan
simpangan bakunya 50.
a. Berapakah banyaknya peserta seleksi yang skornya antara 300
sampai 450?
b. Jika yang akan diterima adalah peserta dengan skor paling rendah
500, berapakah banyaknya calon yang akan diterima?
c. Jika peserta tes yang akan diterima adalah mereka yang skornya
termasuk 16% terbaik, carilah skor terkecil yang dapat diterima
menjadi mahasiswa baru di perguruan tinggi tersebut.

Petunjuk Jawaban Latihan

1) Histogram dan poligon (kurva) dari soal ini tampak pada Gambar 4.5.

Gambar 4.5
Histogram dan poligon

Dari Gambar 4.5 tampak bahwa kurvanya adalah normal.

2) (a) 2000  (47,5% + 34%) = 1630 orang


(b) 2000  2,5% = 50 orang
(c) 450
 MPDR5202/MODUL 4 4.11

R A NG KU M AN

Kurva normal adalah suatu abstraksi matematis yang didefinisikan


oleh sebuah persamaan. Persamaan ini mendefinisikan tidak hanya satu
kurva, tetapi suatu famili kurva-kurva yang demikian. Meskipun kurva-
kurva itu berbeda dalam mean-mean dan simpangan-simpangan baku,
semua kurva normal adalah simetris, unimodal, dan kontinu, dengan
ekor-ekor yang asimptotis terhadap sumbu horizontal.

TES F OR M AT IF 1

Selesaikan soal-soal berikut dengan singkat dan jelas!

1) Gambarlah histogram dan kurvanya (poligon) dari hasil percobaan


pengetosan 16 keping uang logam sebanyak tak terhingga kali dan yang
dicatat adalah kejadian munculnya “gambar” yang muncul pada koin-
koin tersebut! Apakah kurva normal?
2) Skor-skor hasil tes calon karyawan di sebuah perusahaan yang besar
diikuti oleh 1000 orang, ternyata berdistribusi normal dengan rata-rata
200 dan simpangan bakunya 40.
a. Berapa banyaknya peserta tes yang skornya berada di antara 120 dan
240?
b. Jika yang akan diterima adalah peserta yang skor tesnya paling
rendah 240, berapa orang yang akan diterima sebagai karyawan di
perusahaan tersebut?
c. Jika peserta tes yang akan diterima adalah mereka yang skornya
termasuk 25% terbaik, carilah skor terkecil yang dapat diterima oleh
perusahaan tersebut!
4.12 Statistika Pendidikan 

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 50. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut
untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan
Belajar 1.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang
belum dikuasai.
 MPDR5202/MODUL 4 4.13

Kegiatan Belajar 2

Skor-skor Baku dan Kurva Normal

I ngat kembali bahwa persamaan yang mendefinisikan kurva normal


sesungguhnya mendeskripsikan keseluruhan famili kurva normal. Mean-
meannya berbeda, dan simpangan-simpangan bakunya berbeda-beda;
bangun-nyalah yang sama pada kurva-kurva itu. Untuk menggunakan kurva
normal sebagai suatu model, kita memerlukan cara untuk menemukan suatu
kedudukan di dalam distribusi normal yang tidak bergantung pada mean
tertentu dan simpangan baku tertentu dari distribusi itu. Kita melakukan ini
dengan mengubah skor-skor mentah menjadi skor-skor baku.
Dalam hal apakah kurva-kurva itu bisa dianggap sebangun, yaitu bangun
yang normal? Bangun-bangun itu sama dalam hal bahwa area di bawah
masing-masing kurva itu terdistribusi dalam cara yang sama. Sebuah tabel
saja untuk area-area di bawah kurva normal maka itu memadai untuk
digunakan bersama semua distribusi yang normal, tidak masalah berapa pun
mean-mean dan simpangan bakunya. Apa yang kita perlukan yaitu
menterjemahkan skor mentah yang relevan ke dalam skor z supaya masuk ke
dalam tabel itu. Tabel Luas Daerah Di bawah Kurva Normal memberi Anda
area di bawah setengah ke-atas kurva normal yang berada di atas atau di
bawah suatu titik tertentu pada sumbu horizontal apabila titik itu
diekspresikan sebagai skor baku.
Kenapa belajar menghitung area di bawah kurva normal untuk suatu
rentang tertentu pada absis penting bagi kita? Oleh karena proporsi area di
bawah kurva berkorespondensi dengan proporsi skor-skor di dalam
distribusi. Dengan demikian, jika sekitar 68% area di bawah kurva normal
berada di dalam simpangan baku dari mean (di atas dan di bawah), kita
mengetahui bahwa 68% kasus-kasus di dalam distribusi berada di dalam
rentang itu. Sebagai contoh, jika kita mengetahui bahwa skor-skor oleh para
mahasiswa tahun ke-4 di perguruan tinggi pada Graduate Record Exam
(GRE) mendekati suatu kurva normal dengan mean 500 dan simpangan baku
100, kita bisa dengan cepat menentukan bahwa sekitar 68% para mahasiswa
tingkat IV itu mendapatkan skor-skor di antara 400 dan 600. Sama halnya,
jika IQ saat diukur oleh Wechsler Adult Intelligance Scale (WAIS) adalah
terdistribusi normal dengan mean 100 dan simpangan baku 15, kita
mengetahui bahwa sekitar 95% orang dewasa di Amerika Serikat mempunyai
4.14 Statistika Pendidikan 

IQ di antara 70 dan 130. Dua bagian mendatang hanya akan berkenaan


dengan distribusi-distribusi yang mengikuti kurva normal.

A. KURVA NORMAL YANG BAKU: MENEMUKAN AREA-AREA


APABILA SKOR DIKETAHUI

Berkenaan dengan suatu distribusi skor, kita sering kali tertarik untuk
mengetahui berapakah proporsi skor-skor yang berada di bawah atau di atas
suatu nilai tertentu atau di antara dua nilai tertentu. Jika bangun kurvanya
bisa dimodelkan secara baik oleh kurva normal, kita bisa menggunakan Tabel
Luas Daerah Di bawah Kurva Normal untuk menjawab pertanyaan-
pertanyaan seperti demikian. Di dalam tabel ini, total area di bawah kurva
ditentukan sebagai satu. Untuk menggunakan tabel tersebut, kita hanya perlu
mengingat bahwa kurva normal adalah simetris dan maka itu 50% dari total
areanya berada di bawah mean (z = 0) dan 50% di atas mean.

Contoh 4.1. Menemukan Area Di bawah Kurva Normal yang Berada di


Atas suatu Skor yang Diketahui.
Pertanyaan semacam berikut ini sering kali muncul di dalam kerja
statistik. Diketahui suatu variabel yang terdistribusi normal dengan mean 100
dan simpangan baku 20, berapakah proporsi skor-skor yang akan berada di
atas 120? Misalkan, 3.000 orang mahasiswa baru di sebuah Universitas
diberikan sebuah tes masuk dalam matematika dan ternyata skor-skornya
terdistribusi normal dengan mean 100 dan simpangan baku 20. Jika
universitas itu memutuskan untuk memasukkan semua siswa yang berskor di
atas 120 ke dalam kuliah-kuliah unggulan matematika, berapa orang yang
dapat masuk kelas unggulan? Soal ini diilustrasikan dalam Gambar 4.6.

Gambar 4.6
Proporsi skor-skor di dalam suatu distribusi normal yang bercirikan
= 100 dan = 20 (a) melebihi skor 120 dan (b) berada di atas skor 80
 MPDR5202/MODUL 4 4.15

Langkah pertama kita yaitu menerjemahkan skor sebesar 120 menjadi


X X
skor z; dengan menggunakan rumus Z  nilainya adalah z =  1,00.
SX
Kita sekarang dapat memakai Tabel Luas Daerah Di bawah Kurva Normal
yaitu Tabel Z (pada Lampiran 1. Di halaman terakhir Modul 4 ini).
Di dalam tabel ini, temukan nilai z = 1,00 di dalam kolom pertama dan cari
pada baris itu adalah 0,1587, yang memberi tahu kita bahwa di dalam
sebarang kumpulan skor yang terdistribusi normal, 0,1587 dari skor-skor itu
berada di atas z =  1,00, berapa pun nilai  dan . Oleh karena total area di
bawah kurva ditentukan sebagai satu di dalam tabel ini, kita boleh
menginterpretasikan nilai 0,1587 tadi sebagai proporsi total area yang berada
di ekor itu. Sebagaimana kita sudah ketahui di bagian sebelumnya, area di
bawah kurva adalah proporsional pada frekuensi skor-skor. Dengan
demikian, pertanyaan kita dijawab sebagai berikut : Oleh karena 0,1587 dari
skor-skor tersebut berada di atas skor 120, (0,1587 × 3.000) atau 476
mahasiswa baru itu akan dimasukkan ke dalam kuliah-kuliah unggulan
matematika.
Misalkan permasalahan kita tadi adalah menentukan jumlah mahasiswa
baru yang berskor lebih besar daripada 80 pada ujian tersebut. Gambar 4.6(b)
mengilustrasikan masalah ini. Skor z yang ekuivalen dengan 80 dan –1,00.
Skor-skor z yang negatif tidak terdapat di dalam tabel. Oleh karena kurva
normal adalah simetris, banyaknya skor yang berada di bawah –1,00 adalah
sama dengan yang berada di atas skor z = + 1,00. Maka itu tabel tidak perlu
menunjukkan sekaligus nilai-nilai skor z positif dan negatif. Pada
permasalahan ini, kita sudah tahu bahwa 0,5000 dari skor-skor berada di atas
mean, jadi yang kita perlu tentukan yaitu proporsi skor-skor di antara mean
dan suatu skor yang berada di satu simpangan baku di bawah mean.
Keterangan ini bisa dilihat dalam Tabel Z (Luas Daerah Di bawah Kurva
Normal) pada Lampiran 2 di halaman terakhir modul ini. Untuk skor dengan
nilai z sebesar –1,00, proporsi itu adalah 0,3413. Dengan menambahkan
0,3413 pada 0,5000, kita temukan total proporsi mahasiswa yang berskor
lebih dari 80 adalah 0,8413 (dapat di lihat pada Lampiran 4 di halaman
terakhir modul ini). Dengan demikian, sekitar (0,8413 × 3.000) atau 2.524
mahasiswa berskor di atas 80 pada ujian masuk.
4.16 Statistika Pendidikan 

Contoh 4.2. Menemukan Area di Bawah Kurva Normal yang Berada di


Bawah suatu Skor yang Diketahui
Misalkan di Universitas yang disebutkan tadi juga telah memutuskan
untuk memasukkan semua mahasiswa baru yang berskor kurang dari 85 ke
dalam perkuliahan perbaikan matematika. Berapa banyak mahasiswa baru itu
yang mesti mengambil kuliah perbaikan matematika? Masalah ini
diilustrasikan dalam Gambar 4.7(a). Untuk menyelesaikannya, kita mesti
menentukan ekuivalen skor z untuk 85, yaitu (85 – 100) / 20 = –15/20 = –
0,75. Dengan memakai Tabel Z (pada Lampiran 3. Di halaman terakhir
modul ini) kita melihat bahwa dalam sebarang distribusi normal 0,2266 area
berada di bawah suatu skor yang tiga perempat simpangan baku di bawah
mean. Oleh karena itu, 0,2266 × 3.000 = 679,8, atau kasarnya 680 mahasiswa
baru harus mengikuti perbaikan matematika.

Gambar 4.7
Proporsi Skor-skor di Dalam Suatu Distribusi Normal yang Bercirikan
 = 100 dan  = 20 (a) di Bawah Skor 85 dan (b) di Bawah Skor 120

Sebagaimana Anda bisa lihat, jawaban-jawaban untuk jenis


permasalahan ini sangatlah mirip dengan jawaban-jawaban pada kasus
pertama. Sebagai contoh, misalnya berapa banyak mahasiswa di Universitas
tadi yang tidak masuk ke dalam perkuliahan unggulan matematika (berapa
banyak skor di bawah 120)? Ini diilustrasikan dalam Gambar 4.7(b). Kita
mengetahui bahwa 0,5000 dari skor-skor berada di bawah mean, jadi kita
mesti menambahkan proporsi ini pada proporsi skor-skor yang berada di
antara mean dan suatu skor yang satu simpangan baku di atas mean: z = (120
– 100) / 20 = + 1,00. Di dalam Tabel Luas Daerah di bawah Kurva Normal
(pada Lampiran 2 di halaman terakhir modul ini) ternyata menunjukkan
 MPDR5202/MODUL 4 4.17

bahwa proporsi itu adalah 0,3413, yang kemudian ditambahkan pada 0,5000
menghasilkan 0,8413. Dengan demikian, (0,8413 × 3.000) atau sekitar 2.524
mahasiswa baru tidak memperoleh skor yang cukup pada ujian masuk untuk
bisa ditempatkan dalam perkuliahan unggulan matematika.

Contoh 4.3. Menemukan Area di Bawah Kurva Normal yang Berada


di Antara Dua Skor yang Diketahui
Berdasarkan hasil-hasil ujian masuk dari Kasus 1, berapa banyak mahasiswa
barudi Universitas tadi yang ditempatkan dalam kuliah-kuliah matematika
yang biasa untuk mahasiswa tingkat I (yaitu, tidak dimasukkan ke dalam
perkuliahan perbaikan atau pun unggulan)? Dengan kata lain, berapa banyak
yang berskor di antara 85 dan 120? Masalah ini diilustrasikan dalam Gambar
4.8(a). Kembali, langkah pertama kita yaitu mencari ekuivalen-ekuivalen
X  X
skor z untuk dua skor tersebut. Dengan memakai rumus Z  atau
X
X X
Z , kita temukan nilai-nilai itu adalah z = –0,75 dan z = + 1,00,
SX
berturut-turut. Jika kita mencari area di bawah kurva di antara skor
z = –0,75, dan mean serta menambahkan ini pada area di antara mean dan
skor z + 1,00, kita akan memperoleh proporsi skor yang berada di dalam
rentang tertentu itu. Dalam Tabel Kurva Normal, kolom ke-dua, “Area di
antara mean dan z,” memberikan nilai-nilai:

Area di antara z = –0,75 dan mean : 0,2734


Area di antara mean dan z = + 1,00 : 0,3413
Total area : 0,6147

Mengalikan 3.000 dengan 0,6147, kita menemukan bahwa 1.844,1 atau


kasarnya 1844 mahasiswa itu berskor di antara 85 dan 120 pada ujian masuk.
4.18 Statistika Pendidikan 

Gambar 4.8
Proporsi Skor-skor di Dalam Suatu Distribusi Normal yang Bercirikan
 = 100 dan  = 20 yang Berada (a) di antara skor 85 dan Skor 120 dan
(b) di antara Skor 110 dan Skor 120

Untuk distribusi para mahasiswa baru ini, misalkan kita ingin


mengetahui berapa banyak skor yang berada di antara 110 dan 120? Kita
akan berasumsi bahwa mean dan simpangan baku adalah sama seperti
sebelumnya. Sebuah cara untuk menjawabnya yaitu dengan menentukan
proporsi skor yang berada di atas 110 dan nilai ini dikurangi oleh proporsi
skor yang lebih dari 120. Masalah dan solusinya ditampilkan pada Gambar
4.8(b). Kita mulai, seperti biasa, dengan mengkonversi skor-skor menjadi
skor-skor z : X = 110 menjadi Z = + 0,50 dan X = 120 menjadi z = + 1,00.
Menggunakan Tabel Z atau Tabel Kurva Normal, solusinya adalah

Area di atas z = + 0,50 : 0,3085


Area di atas z = + 1,00 : –0,1587
Perbedaan : 0,1498

Dengan mengalikan 0,1498 × 3.000, kita mendapatkan 449,4 atau


kasarnya 449 skor. Dalam memecahkan persoalan seperti ini, para pemula
terkadang tergoda untuk mengurangi satu skor z dari satu skor z lainnya dan
mencari area sehubungan pada perbedaan itu. Pemikiran sejenak
menunjukkan bahwa ini tidak akan bekerja. Perbedaan di antara dua area
itulah yang dimintakan. Untuk menjaga skor-skor z dan area-area itu terpisah
dalam pikiran Anda, pisahkanlah skor-skor dan area-area itu di halaman kerja
Anda. Saat Anda membuat sketsa suatu permasalahan yang melibatkan kurva
normal, tampilkan skor-skor z hanya di bawah absis dan area-area hanya di
atas absis seperti di dalam diagram-diagram yang ditampilkan pada bab ini.
 MPDR5202/MODUL 4 4.19

B. KURVA NORMAL YANG BAKU: MENEMUKAN SKOR-SKOR


APABILA AREANYA DIKETAHUI

Permasalahan seperti ini mirip dengan masalah-masalah di bagian


sebelumnya, kecuali bahwa bentuknya dibalikkan. Di sana, skor yang
diketahui dan area di bawah kurva yang dimintakan; di sini, area diketahui
dan skorlah yang dimintakan. Kita selesaikan permasalah ini dengan
membaca Tabel Kurva Normal secara “balik arah,” yaitu, dengan
menemukan area di kolom 2 atau 3 mengidentifikasi skor-z yang ekuivalen
pada skor yang dikehendaki.

Contoh 4.4. Menemukan Skor yang di Atas atau di Bawahnya Terdapat


suatu Persentase Tertentu dari Keseluruhan Skor
Misalkan bahwa sebuah Universitas lainnya juga mempunyai kuliah-
kuliah perbaikan dan unggulan matematika bagi para mahasiswa baru, tetapi
universitas ini menentukan penempatan dalam cara yang agak lain. Para
mahasiswa baru itu mengambil ujian masuk yang sama, tetapi Universitas
tersebut menempatkan 20% teratas ke dalam perkuliahan unggulan
matematika. Mari kita asumsikan bahwa meannya juga adalah 100 dan
simpangan bakunya juga 20. Berapa besar skor yang memisahkan 20% atas
para mahasiswa baru itu dari 80% bawahnya? Jika (dan hanya jika) bangun
distribusi skor-skor ini terdekati dengan baik oleh kurva normal, Tabel Kurva
Normal bisa menolong kita.

Gambar 4.9
Skor-skor yang Memisahkan (a) 20% Atas dan (b) 20% Bawah dari Skor-skor
Lainnya di Dalam Suatu Distribusi Normal yang Bercirikan  = 100 dan  = 20

Masalah itu tampak dalam Gambar 4.9(a). Di dalam Tabel Z pada


Lampiran 1., kita mencari suatu nilai yang sedekat mungkin pada 0,2000 di
dalam kolom dan memperhatikan bahwa skor z yang berkenaan dengannya
4.20 Statistika Pendidikan 

adalah 0,84. Nilai 0,84 ini bisa positif atau negatif. Manakah yang kita
kehendaki? Karena kita hendak memperbedakan 20% teratas dari yang
lainnya, nilai skor z kita adalah positif: z = +0,84. Kita kemudian
substitusikan nilai ini ke dalam rumus untuk z dan menyelesaikan X:

X  X
z =
X
X  100
+ 0,84 =
20
(0,84) (20) = X – 100
16,8 = X – 100
116,8 = X

Oleh karena itu, agar dimasukkan dalam perkuliahan unggulan


matematika di Universitas tersebut, seorang mahasiswa baru akan harus
mendapatkan skor yang tidak kurang dari 117 pada ujian masuk.
Jika Universitas tadi menempatkan para siswa yang skornya termasuk
dalam 20% terbawah pada ujian masuk itu ke dalam perkuliahan perbaikan
matematika, berapakah besar skor yang memisahkan para mahasiswa baru ini
dari 80% di atasnya? Masalah ini diilustrasikan dalam Gambar 4.9(b) dan
kita mengerjakannya sama seperti di atas kecuali bahwa, dalam kasus ini, kita
mesti menggunakan nilai negatif untuk skor z yang berkenaan dengan 0,2000
pada Tabel Z pada Lampiran 1. Mensubstitusikan nilai ini, –0,84, dalam
rumus untuk z, kita temukan bahwa X = 100 – 16,8, atau 83,2. Karena itu,
para mahasiswa yang berskor 83 atau kurang pada ujian masuk akan harus
mengambil kuliah perbaikan matematika.

Contoh 4.5 Menemukan Batas-batas yang di dalamnya Terdapat suatu


Persentase Skor-skor Tertentu yang Sama Jaraknya dari
Mean
Misalkan sebuah Universitas tertarik untuk mengetahui nilai-nilai pada
ujian masuk matematika yang membatasi tempat beradanya 90% skor-skor.
Permasalahan ini ditampilkan dalam Gambar 4.10. Di dalam kasus ini, 45%
dari skor-skor dalam rentang yang dikehendaki ini berada di atas mean dan
4% lagi terdapat di bawah mean, menyisakan 5% pada masing-masing ekor
distribusi. Berapakah besar skor yang membiarkan 45% skor-skor berada di
antara skor itu dan mean? Dari Tabel Z pada Lampiran 2., kita temukan
 MPDR5202/MODUL 4 4.21

bahwa nilai z untuk skor itu adalah 1,65. Skor-skor yang dikehendaki ini
dengan demikian berkedudukan di 1,65 simpangan baku di atas dan di bawah
mean. Memasukkan nilai ini ke dalam rumus untuk z dan menyelesaikan X
kita peroleh:

BATAS BAWAH BATAS ATAS


X  X X  X
z z
X X
X  100 X  100
–1,65 = +1,65 =
20 20
(–1,65) (20) = X – 100 (+1,65) (20) = X – 100
–33 = X – 100 +33 = X – 100
67 = X 133 = X

Dengan demikian, 90% dari skor-skor pada ujian ini berada di antara
(100 – 33) = 67 dan (100 + 33) = 133.

Gambar 4.10
Batas-batas yang Meliputi Sentral 90% Skor-skor di Dalam Suatu Distribusi
Normal yang Bercirikan  = 100 dan X = 20

Di dalam ilustrasi-ilustrasi sebelumnya, perubahan-perubahan dari skor z


menjadi skor mentah dilakukan berdasarkan makna dari suatu skor z. Rumus
yang ekuivalen untuk melakukan transisi ini bisa diperoleh dengan
X  X X X
menyelesaikan rumus Z  dan Z  untuk X :
X SX
RUMUS UNTUK Untuk populas-populasi (Rumus-1a)
MENGKONVERSI X = X + zX
SKOR z KE DALAM SKOR Untuk sampel-sampel (Rumus-1b)
MENTAH X = X + zSX
4.22 Statistika Pendidikan 

Menerapkannya untuk menyelesaikan batas atas dalam masalah di atas, kita


dapatkan:
X = 100 + (+165) (20) = 133,0
nilai yang sama dengan nilai yang kita dapatkan tadi.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!
1) Di sebuah Universitas, semua mahasiswa baru diberi ujian kemampuan
bahasa Inggris pada waktu mahasiswa tersebut melakukan pendaftaran.
Skor-skor hasil ujian Bahasa Inggris mereka terdistribusi normal dengan
rata-rata 65 dan simpangan bakunya 12.
a. Jika banyaknya mahasiswa yang mendaftar ada 500 orang,
berapakah kira-kira jumlah mahasiswa yang skornya berada di
antara 59 dan 72?
b. Jika universitas tersebut akan menempatkan 30% mahasiswa teratas
perolehan skornya ke dalam kelas unggulan bahasa Inggris, carilah
skor terendah yang dapat masuk kelas unggulan tersebut!
2) Untuk bergabung dengan organisasi internasional Gifted, seseorang
harus memberikan bukti yang membenarkan bahwa orang tersebut
memiliki skor paling sedikit 150 pada Wechles Adult Intelligence Scale
(WAiS). Skor-skor WAiS terdistribusi normal di dalam populasi dengan
rata-rata 100 dan simpangan bakunya 15.
a. Berapakah proporsi dari populasi yang memenuhi syarat untuk
bergabung?
b. Jika sebuah negara berpenduduk 250 juta orang dewasa, maka
berapakah banyaknya orang di negara tersebut yang dapat
bergabung dengan organisasi tadi?

Petunjuk Jawaban Latihan

1) a. Kira-kira sebanyak 0,4139  500 orang = 207 orang


b. Skor terkecil yang dapat masuk kelas unggulan adalah 71,24.
 MPDR5202/MODUL 4 4.23

2) a. Proporsi dari populasi yang memenuhi syarat untuk bergabung


adalah sekitar 0,0005 atau 0,05%.
b. Banyaknya penduduk dewasa di negara tersebut yang dapat
bergabung dengan organisasi Gifted adalah sekitar 0,0005  250 juta
orang = 125.000 orang.

R A NG KU M AN

Area di bawah kurva-kurva normal terdistribusi dalam cara yang


sama. Maka itu, untuk menggunakan kurva normal sebagai suatu model,
kita memerlukan suatu cara untuk menemukan sebuah posisi di dalam
suatu distribusi normal yang tidak bergantung pada mean atau
simpangan baku tertentu dari distribusi itu. Kita dapat membandingkan
variabel-variabel yang memakai satuan-satuan pengukuran berbeda
dengan mengubah variabel-variabel itu menjadi skor yang baku.
Pengubahan skor-skor mentah di dalam distribusi menjadi skot-skor z
tidak mengubah bangun distribusi. Oleh karena itu, apabila kita
mengkonversi skor-skor mentah di dalam suatu distribusi normal yang
menjadi skor-skor z, hasilnya adalah kurva normal yang baku. Oleh
karena area di bawah kurva adalah proporsional pada frekuensi skor-skor
di dalam distribusi, kita bisa memakai tabel Z untuk menghitung
banyaknya skor dalam suatu distribusi normal yang berada di atas atau di
bawah sebarang nilai di antara sebarang dua poin skor. Berdasarkan
suatu proporsi skor-skor (misalnya, 20 % atas), kita juga bisa
menentukan nilai yang menandai proporsi ini.
Tidak ada satu pun variabel nyata yang terdistribusi normal dengan
tepat, tetapi kemiripannya cukuplah dekat di dalam beberapa kasus
sehingga kurva normal berperan sebagai model yang bermanfaat.
Sebagaimana akan kita lihat di dalam bab-bab selanjutnya, ini terutama
benar untuk distribusi-distribusi dari beberapa statistik sampel (misalnya
X ).

TES F OR M AT IF 2

Selesaikan semua soal berikut dengan singkat dan benar!

1) Sebuah universitas menerima 500 mahasiswa baru pada Program Studi


Ekonomi. Pada saat mendaftar ulang, ke 500 mahasiswa baru itu diberi
tes kemampuan dasar matematika, karena kemampuan dasar matematika
itu diperlukan dalam perhitungan yang berkaitan dengan masalah-
4.24 Statistika Pendidikan 

masalah ekonomi. Ternyata skor-skor kemampuan dasar matematika


para mahasiswa tersebut berdistribusi normal dengan rata-rata 7 dan
simpangan bakunya 10.
a. Jika para mahasiswa yang berskor paling kecil 85 dimasukkan ke
dalam kelas unggulan matematika, berapakah kira-kira banyaknya
mahasiswa yang dapat masuk kelas unggulan matematika tersebut?
b. Jika 25% mahasiswa yang memiliki skor terendah akan dimasukkan
ke dalam kelas remedial matematika, berapakah skor terbesar yang
harus masuk ke dalam kelas remedial itu?
2) Perusahaan General Machines sedang merekrut karyawan-karyawan
baru. Posisi-posisi-posisi di sana membutuhkan beberapa skill
matematika, tetapi perusahaan itu khawatir bahwa pekerjaan itu tidak
cukup menantang untuk bisa mempertahankan minat orang-orang yang
berkeahlian tinggi. Oleh karena itu, pihak perusahaan menyelenggarakan
tes masuk bagi semua pelamar, dan memutuskan untuk menyisihkan
siapa saja yang berskor di 15% terbawah dan juga 15% teratas. Jika skor-
skor tes masuk itu terdistribusi normal dengan rata-rata 50 dan
simpangan bakunya 10, berapakah batas-batas luar yang menandai skor-
skor para pelamar yang akan dipertimbangkan untuk posisi-posisi di
perusahaan itu?

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang


terdapat di bagian akhir modul ini. Hitunglah jawaban yang benar.
Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan
Anda terhadap materi Kegiatan Belajar 2.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan modul selanjutnya. Masing-masing nomor soal
mempunyai skor 50. Bagus! Jika masih di bawah 80%, Anda harus
mengulangi materi Kegiatan Belajar 2, terutama bagian yang belum dikuasai.
 MPDR5202/MODUL 4 4.25

Kunci Jawaban Tes Formatif

Tes Formatif 1
1) Histogram dan poligon (kurva) dari hasil pengetosan 16 mata uang
logam sebanyak tak terhingga kali tampak seperti pada gambar berikut.

Dari gambar tampak bahwa kurvanya normal.


2) a. 81,5%  1000 orang = 815 orang.
b. Sekitar 16%  1000 orang = 160 orang.
c. Skor terkecil yang diterima adalah 360 orang.

Tes Formatif 2
1) a. Banyaknya mahasiswa yang dapat masuk kelas unggulan adalah
sekitar 0,0668  500 orang = 34 atau 35 orang.
b. Skor terbesar yang harus masuk kelas remedial adalah 76,7.
2) Batas-batas skor tersebut adalah 39,6 dan 60,4.
4.26 Statistika Pendidikan 

Daftar Pustaka

Dowdy, et al. 1991. Statistics for Research, second edition, New York: John
Wiley & Sons.

Bannach. 2007. Study Guide for the Essential of Statistics, Singapore:


Thomson-Wadsworth.

Minium, et al. 1993. Statistical Reasoning in Psychology and Education,


New York: John Wiley & Sons.
 MPDR5202/MODUL 4 4.27

Lampiran 1.Tabel Z untuk“Area di luar z.”


Diunduh dari: http://flylib.com/books/3/194/1/html/2/images/fig109_01.jpg
4.28 Statistika Pendidikan 

Lampiran2.
Tabel Z “untuk area di bawah kurva normal baku dari 0 sampai z”
Diunduh dari: http://www.kiddofuntime.com/math-table-chart/
 MPDR5202/MODUL 4 4.29

Lampiran3.Tabel Z untuk“znegatif”
Diunduh dari: http://www.stat.ufl.edu/~athienit/Tables/Ztable.pdf
4.30 Statistika Pendidikan 

Lampiran 4. Tabel Z. Tabel Z “untuk area di bawah kurva normal


baku dari -00 sampai z”
Diunduh dari:
http://www2.parkland.edu/businesstraining/documents/zscoretable.pdfhttp://c
osstatistics.pbworks.com/f/1281154582/6368.png

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
Modul 5

Dasar Statistika Inferensial


Prof. Dr. Wahyudin

PEN D AH U LU A N

M ustafa penasaran tentang “adil” atau tidaknya koin yang dia pegang
(yaitu, kemunculan “gambar” sama seperti kemunculan “angka”). Dia
memutuskan untuk menguji koin itu dengan men-tos-nya sebanyak 100 kali.
Jika gambar muncul 53 kali, apakah kesimpulan dia seharusnya? Jika gambar
muncul 94 kali, apakah kesimpulan dia seharusnya?
Dr. Hasan, direktur penelitian tingkat lembaga di sebuah universitas
yang besar, ingin mengetahui apakah kelas mahasiswa baru di universitasnya
mempunyai skor TPA (Tes Potensi Akademik) sebaik para mahasiswa di
tingkat nasional. Di universitasnya, terdapat 6000 mahasiswa baru, terlalu
banyak untuk dikaji tanpa merepotkan. Oleh karena itu, dia menyeleksi 300.
Penyeleksian yang dilakukan Dr. Hasan, sering kali menjadi kegiatan awal
penelitian para peneliti. Peneliti harus melakukan sampling, agar kesimpulan
yang diperoleh dari perilaku sampel penelitian, merupakan representasi dari
perilaku populasinya.
Modul ini akan membahas masalah-masalah dalam statistika inferensial
dan distribusi mean penyampelan acak, dan setelah menyelesaikan modul ini,
Anda diharapkan memiliki kemampuan:
1. menemukan peluang terambilnya sampel acak dengan rata-rata tertentu
yang diambil dari sebuah populasi yang terdistribusi normal;
2. menemukan rata-rata sampel yang diambil secara acak dari populasi
yang terdistribusi normal, apabila peluang terambilnya sampel acak
tersebut diketahui.
5.2 Statistika Pendidikan 

Kegiatan Belajar 1

Masalah-Masalah dalam
Statistika Inferensial

A. SUATU MASALAH DALAM STATISTIKA INFERENSIAL:


ESTIMASI

Di dalam pengujian hipotesis, kita mempunyai suatu nilai tertentu dalam


pikiran; kita membuat hipotesis bahwa nilai ini memberi ciri kepada populasi
observasi. Pertanyaan di sini yaitu tentang masuk akal atau tidaknya hipotesis
itu lewat diketahuinya bukti dari sampel. Di dalam estimasi, pada sisi lain,
tidak ada nilai populasi tertentu yang perlu dinyatakan. Apa yang lebih
menjadi pertanyaan yaitu berapakah nilai populasi tersebut?
Berapakah proporsi pemilih yang memenuhi syarat yang mendukung
pemberlakuan isu kerja sama? Berapa derajatkah korelasi di antara
pengetahuan matematika dasar dan pencapaian dalam perkuliahan pertama
statistika? Berapakah perbedaan dalam waktu respons rata-rata terhadap
cahaya merah dan hijau? Ini merupakan contoh-contoh masalah di dalam
estimasi. Pada tiap kasus, pengkajian karakteristik yang kita minati dalam
populasi keseluruhan adalah perkara yang tidak praktis. Di dalam estimasi,
suatu sampel diambil dan dikaji, dan dibuatlah suatu inferensi tentang
karakteristik populasi itu berdasarkan apa yang terungkap berkenaan dengan
sampel. Oleh karena variasi penyampelan (naik turunnya kesempatan dari
sampel ke sampel), kita tidak berharapan bahwa estimasi karakteristik
populasi itu benar-benar tepat. Bagaimanapun, kita memang berharap nilai
itu mendekati. Pertanyaan sesungguhnya dalam estimasi, bukanlah tentang
benar atau tidaknya estimasi kita, tetapi seberapa dekatkah estimasi itu
terhadap nilai sebenarnya?

B. PERSOALAN DASAR DALAM STATISTIKA INFERENSIAL

Di dalam inferensial, faktor mendasar yang perlu diperhatikan yaitu


bahwa nilai karakteristik yang sedang kita kaji akan beragam dari sampel ke
sampel. Misalkan CDC mengulangi eksperimen mereka beberapa kali. Pada
tiap pengulangan mereka akan memakai pilihan subyek-subyek yang berbeda
 MPDR5202/MODUL 5 5.3

dari dua populasi yang mereka pilih untuk dikaji. Bahkan jika AZT dan ddI
memiliki pengaruh sama pada para penderita AIDS, mean jumlah sel T-4
pada dua sampel yang dipakai CDC itu barangkali akan berbeda, dan
perbedaan tersebut tidak akan tepat sama dari pengulangan ke pengulangan
oleh karena faktor-faktor kebetulan dalam penyampelan.
Tugas statistika inferensial yaitu menarik kesimpulan tentang suatu
parameter (karakteristik suatu populasi) dari studi statistik-sampel
(karakteristik sebagian populasi itu). Oleh karena variasi penyampelan, kita
tidak mungkin (kecuali dalam beberapa kasus sederhana) untuk membuat
suatu inferensi seperti itu dan mengetahui pasti bahwa inferensi itu benar.
Kepastian hanya datang apabila setiap unsur di dalam populasi diketahui.
Tetapi situasi tersebut bukanlah tanpa harapan. Perhatikan kembali
pertanyaan Mustafa tentang keadilan koinnya. Dia ingin mengetahui apakah
dalam populasi semua tos yang mungkin gambar akan muncul 50% kejadian.
Dia men-tos koin itu 100 kali dan memperoleh 53 gambar serta 47 angka. Dia
tahu bahwa hasil sampel seperti demikian bisa saja terjadi disebabkan variasi
penyampelan. Tetapi seberapa mungkinkah? Jika dia mengetahui seberapa
sering sampel-sampel 100 tos akan memunculkan hasil yang menyimpang
sedemikian dari harapan 50 gambar dan 50 angka (hal itu dapat ditentukan
dengan memakai ekspansi binomial untuk P = Q = 1/2), dia akan berada
dalam posisi lebih baik untuk memutuskan apakah (a) hipotesis itu bisa
secara mudah saja benar (sebab 53 – 47 merupakan hasil penyampelan yang
akan sudah terjadi jika hipotesis itu memang benar), atau (b) hipotesis itu
mungkin salah (sebab 53 – 47 sedemikian menyimpang sehingga tidak
cenderung terjadi jika hipotesis itu memang benar).
Kunci pada sebarang masalah dalam statistika inferensial adalah
mengungkap berapakah nilai-nilai sampel yang akan muncul dalam
penyampelan berulang dan dengan peluang berapa. Sebuah sampel diambil
dan mean-nya kita hitung. Sebuah sampel kedua yang berukuran sama
menghasilkan suatu mean yang bernilai agak berbeda. Sebuah sampel ketiga
pun nilainya tidak sama demikian. Distribusi semacam apakah yang akan
terbentuk oleh mean-mean itu apabila penyampelan diulangi dari waktu ke
waktu? Distribusi semacam ini dikenal sebagai suatu distribusi penyampelan.
Kita harus bisa mendeskripsikannya secara lengkap jika kita hendak
mengatakan apa yang akan muncul apabila sampel-sampel ditarik.
Untuk mempelajari berapakah nilai-nilai sampel yang akan muncul dan
dengan peluang berapa, mestilah ada aturan-aturan yang diketahui yang
5.4 Statistika Pendidikan 

menghubungkan “perilaku” sampel-sampel yang diambil dari populasi


tersebut. Aturan-aturan itu bisa diketahui hanya jika suatu metode sistematis
penarikan sampel ditetapkan dan digunakan secara konsisten. Pada
kenyataannya, hanya terdapat satu metode dasar penyampelan yang
memungkinkan aturan-aturan itu diketahui. Metode dasar ini yaitu penarikan
sampel-sampel peluang yaitu sampel-sampel untuk mana peluang inklusi
dalam sampel tiap elemen populasinya diketahui. Salah satu jenis sampel
peluang adalah sampel acak; yaitu jenis yang kita kaji. Jika kita menarik
sebuah sampel acak, kita bisa mengetahui fakta-fakta yang perlu tentang
distribusi bagi statistik yang sedang kita kaji, memungkinkan inferensi
semacam yang dijelaskan pada bagian sebelumnya.

C. PENYAMPELAN ACAK

Kita sebelumnya sudah mengkaji pemilihan skor-skor secara acak.


Apakah suatu sampel acak itu?

Suatu sampel acak dari suatu populasi tertentu adalah sampel yang
ditarik sedemikian hingga masing-masing sampel yang mungkin yang
seukuran memiliki peluang sama untuk terpilih dari populasi.

Metode pemilihanlah, bukanlah hasil sampel tertentu, yang menentukan


suatu sampel acak. Jika kita diberi populasi dan sebuah sampel dari populasi
itu, kita tidak mungkin mengatakan acak-tidaknya sampel tadi tanpa
mengetahui metode pemilihannya. Meskipun karakteristik-karakteristik
sampel acak cenderung menyerupai karakteristik-karakateristik populasi,
mungkin saja suatu sampel acak tertentu tidak demikian. Jika kita menarik 13
kartu dari tumpukan 52 kartu, masing-masing dari empat kelompok kartu
(keriting, hati, wajik, sekop) biasanya akan terwakili. Agak jarang,
serangkum 13 kartu akan terdiri dari hanya tiga kelompok, dan bahkan lebih
jarang lagi, dari hanya dua kelompok. Mungkin saja serangkum terdiri dari
kartu-kartu yang sekelompok, tetapi ini sungguh hasil penyampelan acak
yang langka: peluangnya sekitar 0,000000000006 (6 peluang dalam 1 triliun).
Meskipun hanya terdapat satu cara untuk mendefinisikan sampel acak,
ada dua rencana penyampelan yang menghasilkan suatu sampel acak:
penyampelan dengan penempatan kembali (di mana suatu elemen mungkin
muncul lebih dari sekali dalam suatu sampel) dan penyampelan tanpa
penempatan kembali (di mana tidak ada elemen yang mungkin muncul lebih
daripada sekali).
 MPDR5202/MODUL 5 5.5

Untuk mendapatkan suatu sampel acak, setiap elemen dalam populasi


mesti memiliki peluang yang sama untuk termasukkan dalam sampel. (Catat
bahwa ini memenuhi asumsi dasar model peluang berkemungkinan sama).
Bagaimanapun, kebalikannya tidak benar; yaitu, memberikan peluang yang
sama bagi elemen-elemen populasi itu tidak senantiasa mengakibatkan
kesamaan peluang untuk sampel-sampel. Sebagai contoh, perhatikan populasi
skor berikut: 10, 11, 12, 13, 14, dan 15. Misalkan tugas kita yaitu menarik
sampel tiga skor berbeda secara acak. Boleh saja kita berpikiran untuk men-
tos sebuah koin, dan jika muncul gambar, kita akan ambil skor pertama,
ketiga, dan kelima. Jika muncul angka sampel kita akanlah skor kedua,
keempat, dan keenam. Dengan skema ini, hanya ada dua sampel saja yang
mungkin – 10, 12, dan 14 serta 11, 13, dan 15 – seperti ditunjukkan dalam
Gambar 5.1. Sekarang berapakah peluang munculnya 10 dalam sampel pada
metode penyampelan ini? Jelas saja, 1/2. Kemunculan 10? Juga 1/2 sebab
skor itu akan dimasukkan jika koin memunculkan gambar. Begitu juga
halnya untuk 11 dan 13 dan untuk tiap elemen dalam populasi ini. Metode
penyampelan ini dengan demikian memenuhi syarat kesamaan peluang untuk
elemen-elemen. Tetapi, metode ini tidak memenuhi syarat bahwa tiap sampel
berukuran 3 yang bisa terbentuk akan mempunyai kesempatan sama terpilih;
hanya dua sampel saja yang mungkin. Sampel 10, 11, 12, misalnya, tidak
punya kesempatan seleksi. Pada penyampelan acak yang sebenarnya, mean-
mean sampel akan berkisar dari 11,0 (untuk sebuah sampel terdiri dari tiga
skor terkecil) hingga 14,0. Tetapi dalam kasus kita, variabilitas mean-mean
akan menjadi kurang karena hanya mean 12,0 dan 13,0 saja yang mungkin.

Gambar 5.1
Dua Sampel yang Mungkin Muncul dari Skema Penyampelan Sistematis

Di dalam data dunia nyata, seringkali sukar atau mahal (dan terkadang
mustahil!) bagi kita untuk menarik suatu sampel acak sederhana dari populasi
yang sungguh kita hendak pelajari. Untuk mengerjakannya secara benar, kita
akan harus mengenali setiap elemen populasi kemudian mengatur untuk
mengikuti implikasi-implikasi dari definisi secara acak.
5.6 Statistika Pendidikan 

Kadang-kadang kita tergoda memakai jalan pintas untuk mengurangi


banyak kerja. Salah satu jalan pintas yang populer yaitu menarik kasus-kasus
dengan apa yang disebut sebagai penyampelan sistematis (misal, menyeleksi
setiap nama kesepuluh dari suatu daftar yang menurut abjad.) Ini bisa
mendekati penyampelan acak dalam banyak kasus, tetapi jika terdapat
kecenderungan siklus dalam data yang kebetulan bertepatan dengan
periodisitas keterpilihan kasus-kasus, kita dalam masalah. Sebagai contoh,
jika anda sedang menyampel setiap lantai kelima di blok gedung-gedung lima
tingkat tanpa lift, terus menerus anda akan mewawancarai orang-orang dari
lantai yang sama. Para penyewa mungkin beragam bersama lantainya (lantai
paling atas mungkin paling murah oleh karena tidak adanya lift), jadi rencana
penyampelan ini akan menghasilkan sampel yang tidak mewakili para
penyewa di blok itu.
Salah satu jalan pintas lain yaitu berupaya memilih secara disengaja
suatu sampel orang-orang yang cocok dengan populasi dalam karakteristik-
karakteristik demografis (misal, usia, jenis kelamin, ras) sedekat mungkin.
Tetapi jika ini dilakukan dengan berhasil, mean-mean sampel akan menjadi
kurang beragam daripada dalam penyampelan acak. Sebarang sampel,
sebagaimana pun menyimpang dari yang diharapkan, mempunyai suatu
peluang untuk muncul. Seberapa lebih kecil? Inilah masalahnya; kita tidak
bisa katakan lebih lanjut. Kita dengan demikian tidak pada posisi yang
memungkinkan terbentuknya konklusi-konklusi inferensial yang akurat.
Metode yang ketiga yaitu memilih apa yang boleh disebut suatu sampel
sederhana begitu saja. Esensi dari metode ini yaitu di mana peneliti mencoba
bertindak sebagai pengacak manusia [human randomizer]. Dia mencoba
memilih “secara acak” dari subyek-subyek yang tersedia, tetapi metode ini
akan lebih cenderung gagal daripada berhasil. Misalkan seorang peneliti
berjenis kelamin pria hendak memastikan pandangan masyarakat tentang
kecukupan kompensasi para wanita yang bekerja. Tetapi misalkan juga
bahwa dia lebih suka berbicara pada para wanita daripada pada para pria dan
para wanita muda yang cantik daripada para wanita tua. Apakah anda akan
mempercayai kecukupan prosedur penyampelannya, betapa pun tekunnya
dia? Bagaimana tentang pemanfaatan tikus-tikus kiriman baru bagi dua
kondisi suatu eksperimen? Asisten penelitian kita menghampiri paket kiriman
via kapal laut itu untuk memilih hewan-hewan yang akan diberi Perlakuan A.
Apakah menurut Anda tikus-tikus yang lincah dan yang malas akan memiliki
peluang yang sama untuk terpilih? Bagaimana dengan tikus-tikus yang
 MPDR5202/MODUL 5 5.7

menggigit jari-jari tangan dan yang tidak? Dari Hukum Statistika Minium
yang ke-3: “Human beings are rotten randomizers.” [Manusia adalah
pengacak yang buruk].
Sebagai suatu pilihan lain, kita bisa menuliskan nomor tiap tikus pada
sebuah kartu, menempatkan kartu-kartu itu dalam sebuah wadah,
menggoyang-goyangkan wadah itu dengan benar-benar, dan melakukan
pilihan acak sebarang subyek-subyek untuk dua grup tadi. Bagaimanapun,
suatu metode yang lebih baik yaitu memakai tabel nomor acak untuk memilih
sampel (atau gunakan program komputer yang menyelesaikan hal tersebut).
Untuk penggunaan tabel nomor acak, akan dijelaskan pada bagian
berikutnya.

D. MENGGUNAKAN TABEL NOMOR ACAK

Oleh karena pertimbangan manusia tidak bisa diandalkan untuk


menyeleksi secara acak, bagaimana kita lakukan itu seharusnya? Jika tiap
elemen populasi bisa diidentifikasi dan diberi nomor yang berlainan, suatu
prosedur yang memudahkan dan bisa dipercaya yaitu memakai sebuah tabel
nomor acak. Tabel-tabel seperti demikian biasanya disusun oleh komputer,
menurut suatu program yang menjamin tiap angka dari 0 sampai 9
mempunyai peluang kemunculan yang sama.
Sebuah tabel nomor acak boleh ditulis sebagai serangkaian angka-angka
tunggal berurutan, nomor-nomor dua angka berurutan, nomor-nomor tiga
angka, dan seterusnya. Nomor-nomor itu boleh juga ditulis vertikal (dalam
arah atas atau pun bawah) atau secara horizontal (dalam arah kiri atau kanan).
Sebagai contoh, dalam Tabel Nomor Acak, jika kita mulai di kiri atas pada
halaman pertama dan membaca ke bawah, urutan acak nomor-nomor satu
angka akanlah 1, 9, 0, 7, 3, . . . . Jika kita membaca nomor dua angka, nomor-
nomor itu adalah 11, 96, 07, 71, 32, . . . . Untuk menggunakan tabel itu secara
tepat, kita terlebih dahulu harus menetapkan suatu skema, termasuk
bagaimana memasuki tabel itu serta bagaimana melanjutkan apabila akhir
sebuah kolom atau baris sudah tercapai.
Sebagai contoh, mari kita misalkan bahwa 40 skor akan diseleksi secara
acak dari populasi sebesar 800. Untuk memulai, berikan tiap elemen populasi
sebuah nomor identifikasi. Urutan yang Anda pakai untuk menomori elemen-
elemen tidak menjadi masalah sebab penyampelan acak setelahnya akan
menghilangkan bias. Tiap elemen boleh diberi sebuah nomor identifikasi tiga
5.8 Statistika Pendidikan 

angka, dari 000 hingga 799 atau dari 001 hingga 800, jika anda lebih suka
demikian. Agar sederhana, misalkan bahwa skema kita memintakan seleksi
dimulai pada kiri atas halaman pertama tabel dan membaca ke bawah. (Kita
bisa mulai di sebarang tempat lain). Nomor acak pertama adalah 113, dan
elemen pertama yang akan dimasukkan dalam sampel adalah yang bernomor
identifikasi 113. Angka acak selanjutnya adalah 969; kita melewatinya sebab
tidak ada elemen populasi yang bernomor itu. Nomor selanjutnya adalah 077,
yang mengidentifikasi skor kedua yang akan dimasukkan dalam sampel. Kita
lanjutkan hingga terpilih 30 elemen.
Jika penyampelan kita dengan penempatan kembali dan elemen yang
sama terpilih kembali, kita mesti memasukkannya kembali. Jika
penyampelan kita tanpa penempatan kembali dan suatu nomor identifikasi
muncul lagi, kita melewatinya.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!
1) Seorang Kepala Sekolah mencatat bahwa skor rata-rata tes matematika
untuk kelas Bu Supardi pada tahun ini adalah 75, sedangkan pada tahun
yang lalu 80. Apakah ada pertanyaan sebelum kita menganjurkan kepala
sekolah tadi untuk berdiskusi dengan Bu Supardi tentang peningkatan
prestasi?
2) Dari sebuah populasi diambil secara acak sebuah sampel berukuran 100,
dan ternyata rata-rata (mean) dari sampel tersebut adalah 75. Dari
keterangan tersebut, apakah kesimpulan berikut benar atau salah, dan
beri alasan: “Jadi, rata-rata dari populasi tadi adalah 75”.
3) Sebuah populasi terdiri atas 900 skor-skor. Dari populasi tersebut akan
diambil sebuah sampel secara acak berukuran 30 dengan menggunakan
Tabel Nomor Acak. Tulislah langkah-langkah untuk memperoleh ke-30
skor dengan cara memakai Tabel Nomor Acak tersebut.

Petunjuk Jawaban Latihan

1) Apakah perbedaan itu perubahan yang sebenarnya, ataukah itu hanya


muncul dari faktor-faktor kesempatan yang naik-turun dalam proses
yang menentukan siswa-siswa manakah yang masuk ke dalam kelasnya?
 MPDR5202/MODUL 5 5.9

2) Salah, karena yang benar adalah bahwa rata-rata dari populasi tersebut
adalah sekitar 75.
3) Langkah-langkahnya adalah (1) memberi nomor dengan 3 digit untuk
tiap anggota populasi, (2) dengan memakai Tabel Nomor Acak, pilihlah
(yang mana saja) sebuah nomor dengan 3 digit dan lanjutkan nomor
berikutnya dengan memilih arah horizontal atau boleh juga vertikal
sebagai nomor awal; (3) dan sebagainya.

R A NG KU M AN

Sasaran dasar dari statistika inferensial yaitu menarik kesimpulan-


kesimpulan tentang suatu karakteristik populasi dari sebuah sampel yang
diambil dari populasi itu. Nilai karakteristik populasi tersebut
(dinamakan parameter) adalah tetap, meskipun tidak diketahui, tetapi
nilai karakteristik tadi saat diamati dalam sebuah sampel (disebut
statistik) atau beragam dari sampel ke sampel.
Ada dua jenis prosedur inferensial: pengujian hipotesis dan estimasi.
Dengan pengujian hipotesis, suatu pertanyaan statistik diterjemahkan ke
dalam hipotesis tentang sebuah parameter. Hipotesis itu diserahkan pada
tes dan, tergantung pada hasil tes itu, dipertahankan atau ditolak. Di
dalam estimasi, suatu inferensi dibuat tentang nilai parameter yang
sedang dikaji. Oleh karena sampel kita hanyalah salah satu dari banyak
sampel yang bisa saja diambil dari populasi tertentu, kunci bagi masalah
inferensi adalah mengungkap berapakah nilai-nilai sampel yang akan
terjadi di dalam penyampelan berulang.

TES F OR M AT IF 1

Selesaikan semua soal berikut!

1) Dua kelompok siswa masing-masing melakukan percobaan men-tos


sebuah mata uang logam 150 kali, dan mereka mencatat banyaknya
“gambar” yang muncul dari mata uang logam tersebut, dan ternyata hasil
percobaan kelompok A memperoleh 78 gambar, sedangkan kelompok B
memperoleh 120 gambar. Apa yang dapat Anda simpulkan tentang hasil-
hasil yang diperoleh kelompok A dibandingkan dengan hasil-hasil yang
diperoleh kelompok B?
5.10 Statistika Pendidikan 

2) Seorang peneliti ingin mengambil sampel acak berukuran 70 dengan


penempatan kembali dari sebuah populasi yang berukuran 1000. (a)
Berapa kalikah pengambilan anggota populasi untuk memperoleh sampel
yang berukuran 70 tersebut? Berapakah besar peluang sebuah anggota
populasi dapat terambil untuk menjadi anggota sampel?
3) Sebuah populasi terdistribusi normal dengan rata-rata 40 dan simpangan
bakunya 10. Jika dari populasi itu diambil sampel berukuran 25 secara
acak, dapatkah sampel acak itu memiliki rata-rata 70? Mengapa?

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang


terdapat di bagian akhir modul ini Masing-masing nomor soal mempunyai
skor 23 kecuali nomor soal 3 dengan skor 34. Hitunglah jawaban yang benar.
Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan
Anda terhadap materi Kegiatan Belajar 1.

Jumlah Jawaban yang Benar


Tingkat penguasaan = ×100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang
belum dikuasai.
 MPDR5202/MODUL 5 5.11

Kegiatan Belajar 2

Distribusi Mean Penyampelan Acak

A. PENGANTAR

Meski seseorang bisa membuat inferensi-inferensi tentang sebarang


parameter dari sejumlah parameter populasi, kita akan berfokus pada
inferensi-inferensi tentang mean terlebih dahulu. Misalkan ada sebuah
populasi yang sangat besar dari skor-skor (X) dengan mean, X, sama dengan
80. Misalkan, kita sekarang menarik dari populasi ini suatu sampel acak 30
kasus; meannya, X 1 , ternyata 78,5. Kita sekarang menempatkan kembali 30
kasus tadi dalam populasi, “mengaduknya dengan baik,” dan memilih sampel
kedua sebesar 30 kasus secara acak. Mean sampel ini, X 2 , adalah 81,6. Kita
bisa mengulang prosedur penyampelan ini sampai tidak terbatas, dan untuk
tiap sampel kita menghitung dan mencatat meannya. Gambar 5.2
mengilustrasikan situasi tersebut.

POPULASI
 = 80

Sampel Sampel Sampel dst.


1 2 3

X 1 = 78,5 X2 = 81,6 X3 = 83,2 dst.

Gambar 5.2
Mean-Mean untuk Sampel-Sampel Acak Berurutan

Jika kita meneruskan percobaan-percobaan penyampelan ini sampai


tidak terhingga kali, dan jika kita kemudian menempatkan semua mean
sampel ini ke dalam distribusi frekuensi relatif, kita akan mempunyai
jawaban untuk pertanyaan kunci yang diajukan dalam bagian 2 dalam
5.12 Statistika Pendidikan 

Kegiatan Belajar 1: “Berapakah nilai-nilai sampel yang akan muncul dalam


penyampelan berulang, dan dengan peluang berapa (frekuensi relatif)?
Distribusi mean-mean sampel yang dibangkitkan demikian dikenal sebagai
distribusi mean penyampelan acak. Distribusi mean penyampelan acak
adalah distribusi frekuensi relatif X yang diperoleh dari semua kemungkinan
sampel-sampel acak berukuran tertentu yang bisa ditarik dari suatu populasi
tertentu.
Perhatikan bahwa distribusi mean penyampelan acak, seperti distribusi
binomial, merupakan suatu distribusi peluang. Bedanya, distribusi binomial
menunjukkan semua hasil-hasil yang mungkin bagi observasi-observasi
dikotomis (seperti tos sebuah koin) dan peluang masing-masingnya,
sedangkan distribusi mean penyampelan menunjukkan semua nilai yang
mungkin untuk mean sampel (untuk sampel-sampel ukuran tertentu) serta
peluang masing-masingnya.
Jika populasi itu berukuran berhingga, banyaknya sampel yang mungkin
akan pula berhingga. Ini memungkinkan kita membangkitkan distribusi
penyampelan keseluruhan dan menggali sifat-sifatnya dalam cara yang tidak
terbuka untuk kita, apabila distribusi itu ditetapkan sebagai hasil serangkaian
percobaan penyampelan terus menerus. Tetapi untuk melakukan ini kita akan
harus menjaga segala hal tetap sederhana.
Perhatikan populasi empat buah skor – 2, 4, 6, dan 8 – dari mana sampel-
sampel berukuran dua akan dipilih. Apa sajakah sampel-sampel yang
mungkin? Apabila penyampelan dilakukan dengan penempatan kembali
(yaitu, tiap skor ditarik, dicatat, dan dikembalikan ke populasi sebelum skor
selanjutnya dipilih), ada empat cara terpilihnya skor pertama dan juga empat
cara terpilihnya skor kedua. Oleh karena itu, terdapat 4 × 4 = 16 sampel yang
mungkin. Ini ditunjukkan pada kolom pertama Tabel 5.1.
 MPDR5202/MODUL 5 5.13

Tabel 5.1
Sampel-Sampel yang Mungkin dan Mean-Mean Sampel untuk Sampel-Sampel
Berukuran Dua (Penyampelan dengan Penempatan Kembali)

POPULASI :2,4,6,8
Sampel Peluang Kemunculan Mean
2,2 1/16 2,0
2,4 1/16 3,0
2,6 1/16 4,0
2,8 1/16 5,0
4,2 1/16 3,0
4,4 1/16 4,0
4,6 1/16 5,0
4,8 1/16 6,0
6,2 1/16 4,0
6,4 1/16 5,0
6,6 1/16 6,0
6,8 1/16 7,0
8,2 1/16 5,0
8,4 1/16 6,0
8,6 1/16 7,0
8,8 1/16 8,0

Berapakah peluang munculnya sampel (2,2), yaitu sampel yang


anggotanya 2 dan 2? Apabila tiap skor diberi peluang terpilih yang sama,
peluang bahwa elemen pertama akan 2 adalah 1/4, dan apabila skor itu
ditempatkan kembali sebelum memilih elemen ke-dua, peluang bahwa skor
ke-dua akan 2 adalah juga 1/4. Seleksi elemen ke-dua sama sekali tidak
bergantung pada hasil elemen pertama, jadi dua kejadian itu independen.
Dengan demikian, peluang sampel (2,2) adalah hasil kali dua peluang tadi,
(1/4) (1/4) = 1/16, berdasarkan aturan perkalian untuk kejadian-kejadian
independen. Dengan penalaran yang serupa, peluang sebarang sampel-sampel
lain adalah juga 1/16. Jika sampel-sampel dipilih dalam cara ini, masing-
masing dari 16 sampel yang mungkin memiliki peluang yang sama untuk
muncul, serta syarat dasar penyampelan acak terpenuhi.
5.14 Statistika Pendidikan 

Perhatian kita yang mendasar yaitu mean-mean dari sampel-sampel itu,


bukannya sampel-sampel itu sendiri. Mean masing-masing sampel diberikan
dalam kolom ke-tiga Tabel 5.1. Catat bahwa, meskipun terdapat 16 sampel
berbeda, masing-masing berkemungkinan sama. Sebagai contoh, hanya ada
satu sampel (2,2) yang menghasilkan mean 2,0, tetapi terdapat dua sampel
yang mempunyai mean 3,0 : (2,4) dan (4,2).1 Peluang memperoleh sebuah
sampel dengan mean 2,0 adalah 1/16, sedangkan peluang memperoleh
sampel dengan mean 3,0 adalah 1/8, dua kali lebih besar. Ini
mengilustrasikan sebuah pikiran mendasar : penyampelan acak memunculkan
peluang yang sama bagi semua sampel yang mungkin, bukannya
menimbulkan peluang yang sama bagi semua mean sampel yang mungkin.
Kita dapat meletakkan 16 mean pada Tabel 5.1 dalam distribusi
frekuensi relatif, seperti yang ditunjukkan dalam Tabel 5.2 berikut.

Tabel 5.2
Distribusi Mean Penyampelan (Data dari Tabel 5.1)

MEAN SAMPEL FREKUENSI RELATIF


2,0 1/16
3,0 2/16
4,0 3/16
5,0 4/16
6,0 3/16
7,0 2/16
8,0 1/16

Distribusi frekuensi relatif ini, tentu saja, merupakan distribusi


penyampelan acak X untuk sampel-sampel berukuran dua yang ditarik
dengan penempatan kembali dari populasi berukuran empat yang anggotanya
2, 4, 6, dan 8. Distribusi ini ditunjukkan secara grafis dalam Gambar 5.3.

1
Sampel (2,4) mesti dianggap berbeda dari sampel (4,2). Masing-masingnya
mungkin, dan masing-masing menghasilkan sebuah mean sampel yang mesti
diperhitungkan, seperti gambar–angka dari angka–gambar.
 MPDR5202/MODUL 5 5.15

Gambar 5.3
Distribusi Mean untuk 16 Sampel yang Mungkin dengan Ukuran Dua
yang Bisa Diperoleh dari Sebuah Populasi Empat Skor
Data dari Tabel 5.2. Populasi: 2, 4, 6, dan 8

Untuk tujuan-tujuan perbandingan telah ditambahkan dua sifat. Pertama,


distribusi populasi skor-skor diperlihatkan pada gambar yang sama. Kedua,
kurva normal telah dicocokkan pada distribusi mean penyampelan. Sifat
apakah yang muncul dalam distribusi penyampelan ini?

B. KARAKTERISTIK-KARAKTERISTIK DISTRIBUSI MEAN


PENYAMPELAN ACAK

Pada sebagian besar contoh-contoh dunia nyata, mustahil dihasilkan


distribusi frekuensi relatif sebenarnya untuk X dari sampel-sampel yang
ditarik dari populasi sebab hal ini menuntutkan suatu rangkaian sampel-
sampel yang panjangnya tidak terhingga. Bagaimanapun, para
matematikawan sudah mampu menangkap karakteristik-karakteristiknya dan
dengan begitu bisa memberi tahu kita apa yang akan terjadi jika serangkaian
percobaan sampai tidak terhingga dilakukan. Pada kenyataannya, sampel-
sampel yang dipilih secara acaklah yang memungkinkan hal ini.
5.16 Statistika Pendidikan 

Suatu distribusi sepenuhnya ditentukan oleh mean, simpangan baku, dan


bangun distribusi itu. Pertama, mean suatu distribusi penyampelan acak X ,
disebut nilai harapan mean sampel, adalah sama dengan mean populasi skor.
Ini benar demikian, tanpa memperhatikan n,, dan bangun populasi itu.
Secara simbolis, hal ini adalah:

1. Mean Untuk Distribusi Penyampelan Mean ( X )

X  X (Rumus 1)
Menggunakan Gambar 5.3 sebagai contoh, X  X  5,0.
Kedua, simpangan baku ditribusi mean penyampelan acak, disebut
standar error mean, bergantung pada simpangan baku populasi, X, dan
ukuran sampel, n. Secara simbolis:

2. Standar Error Mean


X
X  (Rumus 2)
n
Untuk distribusi penyampelan dalam Gambar 5.3, kita melihat bahwa
 X  2, 236 2  1,581 , yang adalah lebih kecil daripada simpangan baku
populasi skor dari mana sampel-sampel diambil. Standar error mean
merupakan simpangan baku distribusi penyampelan X yang didasarkan
pada sampel-sampel yang ukurannya telah ditetapkan. Istilah standar error
adalah peninggalan dari masa saat kurva normal disebut sebagai “normal law
of error”. Teori memandu kita pada nilainya, lebih daripada sekedar
perhitungan sebenarnya dari mean-mean sampel dalam distribusi.
Bagaimanapun, nilainya adalah sama saja seperti sudah jadi demikian, dan
karena itu nilai tersebut merupakan simpangan baku.
Pelajari Rumus-2 secara teliti. Rumus itu memperlihatkan (a) bahwa
mean-mean sampel lebih tidak beragam daripada skor-skor (apabila ukuran
sampel sedikitnya 2),(b) bahwa mean-mean sampel lebih tidak beragam saat
skor-skor dalam populasi lebih tidak beragam, dan (c) bahwa mean-mean
sampel lebih tidak beragam saat ukuran sampel lebih besar.
Catat bahwa huruf-huruf Yunani dipakai untuk memberi spesifikasi
mean dan simpangan baku distribusi penyampelan (  X ,  X ). Huruf-huruf
itu mengingatkan kita bahwa distribusi penyampelan merupakan nilai-nilai
 MPDR5202/MODUL 5 5.17

populasi, bukannya sebuah sampel nilai-nilai tersebut. Distribusi ini


mewakili semua mean yang mungkin dari sampel-sampel berukuran tertentu
dan karena itu merupakan populasi mean-mean tersebut – bukan sekedar
beberapa di antaranya juga.
Berkenaan dengan bangun distribusi, jika populasi skor terdistribusi
normal, distribusi mean penyampelan akan pula terdistribusi normal, berapa
pun ukuran sampelnya. Sebagai contoh, tidak masalah saat kita mengambil
sampel-sampel berukuran 2 yang berjumlah tidak terhingga atau sampel-
sampel berukuran 200 yang berjumlah tidak terhingga. Pada kedua kasus
tersebut, distribusi penyampelan X akan juga terdistribusi normal.
Tiga sifat distribusi mean penyampelan ini diilustrasikan dalam
Gambar5.4, yang menunjukkan dua distribusi penyampelan berbeda (untuk
sampel-sampel berukuran 3 dan 9) bersama dengan populasi skor
terdistribusi normal dari mana sampel-sampel itu diperoleh. Catatlah
terutama bagaimana distribusi penyampelan berubah bersama perubahan
dalam ukuran sampel. Gambar ini mengingatkan kita bahwa bukan hanya ada
satu distribusi penyampelan acak saja yang berkorespondensi pada suatu
populasi tertentu, tetapi se-famili distribusi-distribusi seperti demikian, satu
untuk tiap ukuran sampel yang mungkin.

Gambar5.4
Distribusi skor yang terdistribusi normal dan
distribusi sampling mean acak untuk n = 3 dan n = 9

Sekarang tidak ada masalah jika populasi terdistribusi normal, tetapi


bagaimana jika tidak? Untunglah, ada penggalan penting teori statistik yang
datang membantu: teorema limit sentral. Teorema ini memberi tahu kita
bahwa
5.18 Statistika Pendidikan 

distribusi mean penyampelan acak cenderung ke arah suatu distribusi


yang normal tanpa memperhatikan bangun populasi dari observasi-
observasi yang dijadikan sampel; aproksimasi menuju distribusi normal
semakin baik saat ukuran sampel meningkat.

Pada beberapa populasi, distribusi skor cukup mirip distribusi normal


sehingga sedikit saja bantuan dari teorema limit sentral yang dibutuhkan.
Tetapi bahkan apabila distribusi populasi skor berbeda secara substansial dari
distribusi yang normal, distribusi penyampelan X boleh diperlakukan seolah
distribusi itu terdistribusi normal apabila ukuran sampel cukup besar.
Seberapa besarkah cukup besar itu? Tergantung pada masalah, 25 hingga 30
kasus biasanya sangat cukup besar.
Gambar 5.5 memberikan suatu gagasan kecenderungan distribusi
penyampelan X untuk menyerupai kurva normal seiring peningkatan ukuran
sampel.

Gambar5.5
Efek dari Teorema Limit Sentral

Gambar5.5a menunjukkan dua populasi skor, satu berbangun persegi


panjang, satu lainnya miring. Gambar 5.5b memperlihatkan distribusi
penyampelan X untuk sampel-sampel berdasarkan n = 2. Catat bahwa
 MPDR5202/MODUL 5 5.19

bangun distribusi-distribusi ini berbeda dari bangun-bangun distribusi


populasi skor induknya serta bahwa perbedaan itu ke arah kurva normal.
Gambar 5.5c menunjukkan distribusi penyampelan X untuk sampel-sampel
menurut n = 25. Pada kedua kasus, tingkat kemiripan dengan distribusi
normal layak diperhatikan, meski pun kemiripan itu lebih mendekati bagi
mean-mean sampel yang diambil dari distribusi berbangun persegi panjang.
Ketelitian teorema limit sentral diilustrasikan dengan baik pada Gambar 5.3.
Lihatlah distribusi populasi skor di bagian bawah gambar tersebut. Ini jelas
bukan distribusi yang normal; jika saja distribusi ini hendak diberi nama, kita
boleh menyebutnya “distribusi gigi labu Halloween.” Tetapi lihat distribusi
mean penyampelan acaknya. Distribusi tersebut tampak sangat mendekati
suatu distribusi normal. Bandingkan tinggi persegi-persegi panjang itu
dengan noktah-noktah yang menunjukkan penaikan distribusi normal pada
lokasi-lokasi yang serupa.
Manfaat teorema limit sentral untuk inferensi tentang mean-mean hampir
tidak bisa terlalu dibesar-besarkan. Teorema ini memungkinkan pemanfaatan
kurva normal sebagai sebuah model statistik untuk distribusi penyampelan
X dalam ragam luas situasi-situasi praktis. Jika ini tidak demikian, banyak
masalah dalam inferensi akan jadi sangat rancu untuk dipecahkan, demikian
setidaknya.

C. MEMANFAATKAN DISTRIBUSI MEAN PENYAMPELAN

Dalam cara yang sama di mana distribusi frekuensi boleh dianggap


sebagai distribusi peluang, distribusi mean penyampelan acak boleh
diinterpretasi untuk memberi tahu seberapa peluang mean-mean sampel akan
jatuh di antara batas-batas tertentu. Banyak pertanyaan yang bisa dijawab
apabila kita mempunyai suatu distribusi normal yang diketahui mean serta
simpangan bakunya. Prosedur-prosedur itu diterapkan di dalam bagian ini
untuk menjawab empat jenis pertanyaan-pertanyaan yang umum yang
muncul dalam inferensial.

Diketahui Suatu populasi terdistribusi normal, dengan  = 70 dan  = 20.


Asumsikan ukuran sampel anda adalah 25.
Contoh 5.1 Berapakah peluang diperolehnya sebuah sampel acak dengan
mean 80 atau lebih?
5.20 Statistika Pendidikan 

Gambar5.6 mengilustrasikan distribusi penyampelan X untuk sampel-


sampel berjumlah tidak terhingga dengan n = 25 yang ditarik dari populasi
terdistribusi normal dengan X = 70 dan X = 20. Distribusi penyampelan ini
juga terdistribusi normal dan mempunyai mean (nilai harapan) sebesar 70.

Solusi Langkah 1: Hintunglah simpangan baku distribusi penyampelan,


yaitu,standar error mean (Rumus-2).
Langkah 2:Ubahlah mean sampel 80 itu menjadi skor Z. Rumus
umum untuk skor Z adalah (skor mean)/(simpanganbaku). Pada
suatu distribusi penyampelan X , mean sampel adalah skor, mean
distribusi penyampelan (yang sama dengan mean populasi itu)
adalah mean,dan standar error mean adalah simpangan baku.

Gambar 5.6
Mencari Proporsi Mean-mean Sampel yang Melebihi
Suatu Nilai Tertentu

X  X 80  70
Maka itu, Z = = = + 2,50
X 4

Langkah 3: Bawa skor Z itu ke tabel daerah-daerah di bawah kurva


normal, dan tentukan daerah yang sebanding di seberang Z. Ini
adalah 0,0062. Sekarang sebab proporsi daerah di bawah kurva
berkorespondensi pada proporsi skor-skor dalam distribusi, Anda
bisa melihat bahwa di dalam penyampelan acak, mean-mean sebesar
80 atau lebih akan muncul dengan frekuensi relatif 0,0062 untuk
sampel-sampel berukuran 25. Dengan begitu peluang memperoleh
mean sebesar itu atau lebih dalam penyampelan acak dari populasi
tertentu yang diketahui adalah 0,0062.
 MPDR5202/MODUL 5 5.21

Contoh 5.2 Berapakah peluang memperoleh sebuah sampel dengan mean


yang berbeda dari mean populasi sebesar 10 poin atau lebih?
Solusi Pada Contoh 5.1, mean 80 berada 10 poin di atas nilai harapan, yaitu
mean (70) distribusi penyampelan. Oleh karena kurva normal adalah
simetris, luas daerah yang sama berada di bawah mean 60 (10 poin
di bawah 70) seperti yang berada di atas mean 80 (10 poin di atas
70). Skor-skor Z untuk keduanya akan memiliki besar yang sama;
kita mesti menduakalikan luas daerah yang berkorespondensi untuk
mencari peluang yang diminta. Peluang memperoleh mean sampel
yang berbeda dari mean populasi sebesar 10 poin atau lebih maka
itu adalah (2) (0,0062) = 0,0124. Masalah ini diilustrasikan dalam
Gambar 5.7.

Gambar 5.7
Mencari Proporsi Mean-mean Sampel yang Berbeda dari Mean Populasi
Sebesar Lebih dari Suatu Nilai Tertentu

Contoh 5.3 Berapakah nilai mean jika peluang munculnya nilai sebesar mean
itu atau lebih di dalam penyampelan acak adalah 0,05? Masalah ini
diilustrasikan pada Gambar5.8.

Gambar 5.8
Mencari Nilai di Atas Mana Proporsi Tertentu Mean-
Mean Sampel akan Berada
5.22 Statistika Pendidikan 

Solusi Langkah 1: Dari kolom 3 dalam Kurva Normal, carilah skor Z di


atas mana 0,05 daerah di bawah kurva normal berada; ini berada di
antara Z = 1,64 dan Z = 1,65, atau sekitar + 1,645.

Langkah 2: Nilai Z tersebut memberi tahu kita bahwa nilai yang


dikehendaki itu1,645 simpangan baku di atas mean distribusi. Oleh
karena itu(dengan mengingat bahwa perhatian kita berkenaan
dengan distribusi penyampelan X dan bahwa simpangan bakunya
 X , bukan  X ):
X   X  Z X
 70  1, 645  400 
 70  6,56
 76,58
Jadi, sampel acak berukuran 25 yang memiliki peluang 0,05 untuk
terambil dari populasi tersebut adalah sampel acak yang rata-ratanya
76,58 atau lebih.

Contoh 5.4 Dari populasi yang diketahui di atas tadi, tentukanlah batas
bawah dan batas atas dari mean (rata-rata) sampel tadi, apabila mean
dari sampel-sampel tersebut berada 95% di tengah distribusi?
Solusi Jika 0,95 nilai-nilai berada di tengah, sisa 0,05 mestilah dibagi rata
di antara dua ekor distribusi itu. Dengan demikian, kita mesti
mencari nilai Z di luar mana 0,025 mean-mean sampel berada.
Metode ini sama seperti untuk Soal 3, dan garis besar solusinya
adalah sebagai berikut:

BATAS BAWAH (BB) BATAS ATAS (BA)

ZBB = 1,96 ZBA = +1,96


X BB = X + ZBB  X X BA = X + ZBA  X
= 70 + (–1,96) (4,00) = 70 + (+ 1,96) (4,00)
= 70 – 7,84 = 70 + 7,84
= 62,16 = 77,84
 MPDR5202/MODUL 5 5.23

Untuk contoh ini 95% mean-mean sampel berada di antara 62,16 dan 77,84.
Di dalam penyampelan acak, peluang untuk memperoleh sebuah mean di
dalam batas-batas ini adalah 0,95, dan peluang untuk memperoleh mean di
luar batas-batas tersebut adalah 0,05. Masalah ini diilustrasikan dalam
Gambar 5.9.

Gambar 5.9
Mencari Batas-batas Skor Tengah di antara Mana Proporsi tertentu Mean-
mean Sampel akan Berada

Soal-soal seperti empat soal tadi lebih daripada sekedar latihan


matematis. Prosedur-prosedur seperti ini dipakai untuk menjawab
pertanyaan-pertanyaan penelitian yang sebenarnya. Misalnya, seperti
deskripsi singkat atas studi yang berkesimpulan bahwa obat AZT menambah
harapan hidup para penderita AIDS dengan memperlambat pengrusakan sel-
sel penolong yaitu T-4 (suatu sel darah putih yang merupakan bagian penting
sistem kekebalan tubuh). Bagaimanakah para peneliti mampu mencapai
kesimpulan demikian? Pertama, hipotesis penelitian (bahwa AZT bekerja)
diterjemahkan ke dalam sebuah hipotesis statistik: mean jumlah sel T-4
semua penderita AIDS yang menerima AZT sama dengan mean semua yang
menerima plasebo (AZT  plasebo  0). Para peneliti kemudian
mengkonstruksi distribusi penyampelan teoritis untuk perbedaan di antara
dua sampel mean  X Y  yang akan muncul untuk sampel-sampel dalam
jumlah tidak terhingga jika hipotesis statistik itu memang benar. Dari
distribusi penyampelan ini mereka selanjutnya menghitung peluang untuk
statistik sampel  X Y  dan, sebab menemukannya sebagai sangat tidak
mungkin, menolak hipotesis statistik serta menyimpulkan bahwa dua mean
populasi itu berbeda.
5.24 Statistika Pendidikan 

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!

1) Perhatikan kembali Tabel 5.2 yang terdapat pada Kegiatan Belajar 2!


Pada penyampelan acak tersebut, berapakah peluang untuk memperoleh
sampel acak berukuran 2 tadi dengan rata-rata (mean): (a) 3,0 atau lebih;
(b) 3,0 atau 4,0 atau 5,0; (c) lebih dari 7,0; (d) 5,0 atau kurang?
2) Dari populasi mini yang terdiri atas 5 skor yaitu 3, 5, 7, 9, dan 11,
diambil sampel acak berukuran 2 dengan penempatan kembali.
a. Berapakah banyaknya sampel acak berukuran 2 yang mungkin akan
terambil? Tulislah semua sampel acak yang mungkin itu dengan
menuliskan anggota-anggota dari sampel tersebut!
b. Tulislah tabel distribusi frekuensi relatif yang menggambarkan
sebaran dari mean-mean sampel-sampel acak berukuran 2 tersebut,
kemudian gambarlah histogram dan kurva dari distribusi tersebut?
c. Jika  x dan  x masing-masing merupakan mean dan simpangan
baku dari distribusi mean sampel-sampel acak berukuran 2 tadi,
tentukanlah nilai-nilai dari  x dan  x !
d. Jika  x dan  x masing-masing merupakan mean dan simpangan
baku dari populasi mini tadi, periksalah apakah  x   x dan
x
x benar?
2
3) Diketahui suatu populasi berdistribusi normal dengan  x  150 dan
 x  28 . Jika dari populasi tersebut diambil secara acak sampel
berukuran 49 secara acak, jawablah pertanyaan-pertanyaan berikut:
a. Berapakah peluang diperolehnya sampel acak tersebut memiliki
rata-rata 153 atau lebih?
b. Berapakah peluang terambilnya sampel acak tersebut yang rata-
ratanya berbeda 7 poin atau lebih dari 150?
 MPDR5202/MODUL 5 5.25

Petunjuk Jawaban Latihan

15 9 1 10
1) (a) (b) (c) (d)
16 16 16 16
2) (a) 25 sampel, di mana sampel-sampel tersebut adalah:
(3,3), (3,5), (3,7), (3,9), (3,11), (5,3), (5,5), (5,7), (5,9), (5,11), (7,3),
(7,5), (7,7), (7,9), (7,11), (9,3), (9,5), (9,7), (9,9), (9,11), (11,3),
(11,5), (11,7), (11,9), dan (11,11).
(b) Mean sampel Frekuensi relatif
1
3
25
2
4
25
3
5
25
4
6
25
5
7
25
4
8
25
1
9
25
2
10
25
1
11
25
(c)  x  7 dan  x  2 .
(d) Karena x = 7, dan x = 2,828, sehingga x = x, dan
2,828 
x   2 yang berarti bahwa  x  x .
2 2
x
Jadi, benar bahwa x = x dan  x  .
2
3) (a) 0,2266 atau 22,66%.
(b) 0,2174 atau 21,74%.
5.26 Statistika Pendidikan 

R A NG KU M AN

Distribusi penyampelan bagi sebuah statistik adalah distribusi


peluang. Distribusi ini menunjukkan nilai-nilai sebuah statistik untuk
sampel-sampel berjumlah tidak terhingga dengan ukuran tertentu yang
diambil dari populasi tertentu. Beberapa nilai mempunyai kemungkinan
lebih tinggi daripada nilai-nilai lainnya. Untuk mengkonstruksi distribusi
penyampelan, suatu metode pengambilan sampel mestilah ditetapkan
dan digunakan secara konsisten. Penyampelan acak adalah metode
fundamental yang memungkinkan terungkapnya sifat-sifat distribusi
penyampelan. Untuk distribusi penyampelan acak X , meannya,  X ,
disebut nilai harapan, adalah sama dengan X, mean populasi observasi-
observasi dari mana sampel-sampel diambil. Simpangan bakunya,  X ,
disebut standar errormean, adalah sama dengan x n.
Dengan demikian, saat ukuran sampel meningkat, standar error
mean menjadi lebih kecil (yaitu, kumpulan mean-mean sampel semakin
mendekati mean populasi sebenarnya). Jika populasi observasi-observasi
adalah terdistribusi normal, begitu juga distribusi penyampelan X . Jika
tidak, teorema limit sentral memberi tahun kita bahwa distribusi normal
masih akan sering jadi aproksimasi yang dekat dan maka itu bisa dipakai
jika ukuran sampel tidak terlalu kecil. Dengan mengetahui tiga
karakteristik ini, kita dapat menentukan peluang diperolehnya sebuah
mean sampel (diambil dari populasi tertentu) yang seekstrim atau lebih
ekstrim daripada yang diamati.

TES F OR M AT IF 2

Pilihlah satu jawaban yang paling tepat!


1) Dari populasi mini yang terdiri atas 4 skor, yaitu 1, 5, 7, dan 11, diambil
secara acak sampel berukuran 2 dengan penempatan kembali.
a. Berapa buah sampel yang akan terjadi? Kemudian tulislah semua
sampel yang terjadi tersebut?
b. Tulislah tabel distribusi frekuensi relatif untuk mean (rata-rata) dari
sampel-sampel yang terbentuk.
c. Gambarlah histogram dan poligon frekuensi relatif (kurva) untuk
tabel yang diperoleh pada jawaban b. Apakah kurva itu simetris?
Apakah kurva yang diperoleh mendekati kurva normal?
 MPDR5202/MODUL 5 5.27

d. Jika  x dan  x masing-masing merupakan rata-rata dan simpangan


baku dari populasi, sedangkan  x dan  x masing-masing
merupakan rata-rata dan simpangan baku dari distribusi mean
x
sampel-sampel acak tadi, apakah  x   x dan  x  ?
2
2) Diketahui sebuah populasi terdistribusi normal dengan  x  120 dan
 x  10 . Jika dari populasi tersebut ditarik sampel-sampel berukuran 25
secara acak, berapakah peluang diperolehnya: (a) sebuah sampel yang
rata-ratanya 118,50 atau kurang; (b) sebuah sampel yang rata-ratanya
berbeda 2 poin atau lebih dari 120?
3) Diketahui sebuah populasi terdistribusi normal dengan  x  120 dan
 x  10 . Jika dari populasi itu ditarik sampel-sampel berukuran 25
secara acak, maka tentukanlah:
a. nilai rata-rata terbesar dari sebuah sampel acak tadi, apabila peluang
terambilnya sampel tersebut adalah 0,02!
b. nilai rata-rata terkecil dari sebuah sampel acak tadi, apabila peluang
terambilnya sampel tersebut adalah 0,01!
c. batas bawah dan batas atas dari rata-rata sampel acak tadi, apabila
rata-rata dari sampel-sampel tersebut berada 95% di tengah-tengah
distribusi?

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 23 kecuali nomor soal 3 dengan skor 34. Hitunglah jawaban yang benar.
Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan
Anda terhadap materi Kegiatan Belajar 2.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang
5.28 Statistika Pendidikan 

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 2, terutama bagian yang
belum dikuasai.
 MPDR5202/MODUL 5 5.29

Kunci Jawaban Tes Formatif

Tes Formatif 1
1) Karena frekuensi harapan munculnya gambar pada percobaan men-tos
1
sekeping uang logam adalah 150  = 75 kali, maka kelompok A
2
hasilnya lebih realistis dari percobaan yang dilakukan oleh kelompok B.
1
2) (a) 70 kali. (b) .
1000
3) Hampir pasti tidak dapat terjadi, karena mean (rata-rata) cenderung stabil
dari sampel ke sampel.

Tes Formatif 2
1) a. 16 buah sampel, yaitu dimulai dari (1,1), (1,5), ... , dan seterusnya
sampai dengan (11,11).
b. Mean Frekuensi Relatif
1 1/16
3 2/16
4 2/16
5 1/16
6 4/16
7 1/16
8 2/16
9 2/16
11 1/16
5.30 Statistika Pendidikan 

c.

Kurvanya simetris, tapi tidak normal.

d.  x  6 ,  x  3,606 ,  x  6 , dan  x  2,549 benar, karena


x
 x   x  6 , dan  x  2,549 .
2
2) a. 0,2266 = 22,66%.
b. 0,3174 = 31,74%.
3) a. 115,9.
b. 124,66.
c. batas bawahnya 116,08, dan batas atasnya 123,92.
 MPDR5202/MODUL 5 5.31

Daftar Pustaka

Dowdy et al. 1991. Statistics for Research. Second edition. New York: John
Wiley & Sons.

Bannach. 2007. Study Guide for the Essential of Statistics. Singapore:


Thomson-Wadsworth.

Minium. et al. 1993. Statistical Reasoningin Psychology and Education.


New York: John Wiley & Sons.
Modul 6

Uji Hipotesis tentang Mean-mean


Tunggal dan Dobel Mean (z dan t)
Prof. Dr. Wahyudin.

PEN D AH U LU A N

P ak Hassan, seorang Kepala Dinas Pendidikan di Provinsi A, membaca di


dalam buku pedoman tes bahwa norma nasional untuk para siswa kelas
enam pada suatu tes pencapaian matematika adalah 85. Dia ingin mengetahui
apakah para siswa di provinsinya mencapai tingkat yang sama demikian. Dia
memilih secara acak 100 siswa dari semua siswa kelas enam di provinsi itu
dan berencana untuk menyelenggarakan tes yang sama untuk mereka.
Populasi yang menarik perhatian Pak Hassan yaitu skor-skor tes semua
siswa kelas enam yang sekarang ini belajar di provinsinya. Dari pengkajian
sampel, dia hendak menarik inferensi mengenai apakah X, mean
populasinya, adalah 85. Kita ketahui, bahwa sampel skor 100 siswa yang dia
ambil hanyalah satu dari banyak sekali sampel-sampel acak yang bisa ditarik
dari populasi. Oleh karena adanya variasi penyampelan, maka kita tidak
memperkirakan bahwa mean untuk semua sampel adalah sama.
Bagaimanakah, kemudian, Pak Hassan bisa menarik inferensi mean populasi
padahal mean sampelnya hanyalah satu dari banyak kemungkinan mean-
mean sampel yang berlainan?
Di dalam modul ini, Anda akan belajar menguji hipotesis tentang mean
tunggal dan dobel mean. Pada modul ini kita akan membahas logika dasar
proses inferensi dan langkah-langkah prosedural untuk mencapainya. Saat
Anda mempelajari modul ini, Anda barangkali akan sering bertanya-tanya
tentang ―mengapa?‖ Aspek-aspek inferensi yang akan kita bahas tidak
terbatas pada masalah-masalah tentang mean-mean saja. Dari statistik-
statistik sampel, kita bisa membuat inferensi-inferensi mengenai mean
populasi, simpangan baku, atau parameter lainnya.
6.2 Statistika Pendidikan 

Setelah menyelesaikan modul ini, diharapkan Anda dapat:


1. melakukan uji hipotesis mean-mean tunggal dengan memakai statistik Z
dan statistik t.
2. melakukan uji hipotesis dobel mean (kasus dua sampel) dengan memakai
statistik Z dan statistik t.
 MPDR5202/MODUL 6 6.3

Kegiatan Belajar 1

Uji Hipotesis tentang Mean Tunggal

U ntuk menjawab pertanyaan Pak Hassan yang dikemukakan pada bagian


Pendahuluan, Pak Hassan terlebih dahulu menerjemahkan
pertanyaannya ke dalam hipotesis statistik: X = 85 (mean populasi skor-skor
pencapaian matematika kelas enam di provinsinya adalah 85.) Dia kemudian
menyerahkan hipotesisnya pada pengujian, serta, pada akhirnya,
mempertahankan atau menolak hipotesis itu.
Untuk memeriksa validitas hipotesis itu, Pak Hassan mempertanyakan
berapakah mean-mean sampel yang akan terjadi jika banyak sampel
berukuran sama diambil secara acak dari populasinya, yaitu, jika hipotesis
bahwa mean populasinya 85 adalah benar. Distribusi penyampelan acak
pada X yang sesuai untuk masalah Pak Hassan di atas memberikan
keterangan ini. Dia menghendaki distribusi penyampelan acak teoritis pada
X untuk sampel-sampel berukuran 100 dalam jumlah tidak terhingga yang
diambil dari suatu populasi dengan mean 85, kemudian dia membandingkan
mean sampelnya dengan mean-mean sampel di dalam distribusi penyampelan
ini.
Misalkan di antara mean sampelnya dan mean-mean distribusi
penyampelan acak pada X tampak seperti apa yang digambarkan di sebelah
kiri pada Gambar 6.1. Jika demikian, sampel mean-nya adalah mean yang
dapat masuk akal terjadi jika hipotesis tadi benar, serta dia akan
mempertahankan hipotesis itu sebagai kemungkinan yang masuk akal
[plasusible]. Jika hubungan yang ada ialah seperti yang tergambar di sebelah
kanan, di pihak lain, mean sampelnya amatlah menyimpang sehingga akanlah
sangat tidak lazim kita memperoleh nilai seperti itu jika hipotesis di atas
benar. Dalam kejadian ini, dia akan menolak hipotesis tadi dan
menyimpulkan bahwa lebih mungkin mean populasinya bukan 85.
6.4 Statistika Pendidikan 

Distribusi Distribusi
mean-mean mean-mean
sampel sampel

 X  85   X  X  85   X

X hitung X hitung

Gambar 6.1
Kemungkinan Lokasi-lokasi Mean Sampel yang Diperoleh Relatif terhadap
Distribusi Mean-meanSampel Harapan Apabila Hipotesis itu Benar

A. KAPAN KITA MENERIMA DAN KAPAN KITA MENOLAK


HIPOTESIS?

Hipotesis yang peneliti hadapkan pada pengujian disebut hipotesis nol,


dilambangkan H0. Ini adalah hipotesis yang akan diputuskan oleh Pak Hassan
untuk diterima atau ditolak. Dalam masalah Pak Hassan, H0 : X = 85. Bagi
setiap hipotesis nol, terdapat juga suatu hipotesis alternatif, dilambangkan
HA. Oleh karena Pak Hassan berminat dalam menemukan perbedaan (jika
ada) tanpa memperhatikan arahnya [irrespective of direction], hipotesis
alternatifnya diungkapkan sebagai HA : X 85. Perhatikan bahwa hipotesis
alternatif adalah benar jika mean skor pencapaian matematika semua siswa
kelas enam di provinsi Pak Hassan adalah baik lebih besar atau pun lebih
kecil daripada 85. Jika Pak Hassan berkepentingan mengetahui hanya apakah
skor-skor pencapaian matematika di provinsinya adalah lebih jelek daripada
norma nasional, maka hipotesis alternatif akanlah diungkapkan sebagai HA :
X  85; atau, jika lebih baik daripada norma nasional, sebagai HA : X  85.
Dalam dua kejadian di atas, yang mana saja, jika hasil yang diperoleh dalam
sampelnya berlawanan terhadap H0 dan cukup kuat menunjuk pada validitas
HA, dia akan menolak H0; jika tidak demikian, dia akan mempertahankannya.
Kriterion apa yang harus digunakan Pak Hassan untuk memutuskan
kapan menolak hipotesis nol? Jika sampel mean amatlah berbeda dari apa
yang diharapkan apabila H0 benar sehingga kemunculannya tampak tidak
mungkin, H0 seharusnyalah ditolak. Tetapi berapakah tingkat jarangnya
kejadian [degree of rarity of occurance] yang amat besar sehingga
tampaknya kita lebih baik menolak hipotesis nol daripada
 MPDR5202/MODUL 6 6.5

mempertahankannya? Keputusan ini agak mana-suka, tetapi praktek


penelitian yang lazim yaitu menolak H0 jika mean sampel-sampel amat
menyimpang sehingga peluang kejadiannya dalam penyampelan acak adalah
0,5 atau lebih kecil. Kriterion semacam ini disebut tingkat signifikansi dan
dilambangkan oleh huruf Yunani  (alpha). Pada beberapa kasus, peneliti
mungkin ingin lebih besar daripada 0,05.

B. GENERALITAS PROSEDUR UNTUK PENGUJIAN HIPOTESIS

Logika dan prosedur umum untuk menguji semua hipotesis statistik, baik
mengenai mean, frekuensi, atau pun karakteristik-karakteristik populasi
lainnya, adalah pada dasarnya apa yang dideskripsikan dalam bagian-bagian
sebelumnya.
Langkah 1 : Suatu hipotesis spesifik, disebut hipotesis nol, dirumuskan
berkenaan dengan suatu parameter dari populasi (misal,
tentang mean populasi) bersama dengan suatu hipotesis
alternatif.
Langkah 2 : Suatu sampel acak diambil dari populasi observasi-observasi,
dan nilai statistik sampel (misal, nilai mean sampel) diperoleh.
Langkah 3 : Karakteristik-karakteristik distribusi penyampelan acak dari
statistik yang sedang dipertimbangkan diperiksa untuk
mempelajari berapakah hasil-hasil sampel yang akan terjadi
(serta dengan berapakah frekuensi-frekuensi relatifnya) jika
hipotesis nol adalah benar.
Langkah 4 : Hipotesis nol dipertahankan jika hasil sampel tertentu adalah
sejalan dengan hasil-hasil yang diharapkan jika hipotesis itu
benar; jika tidak begitu, hipotesis tadi ditolak dan hipotesis
alternatif diterima.

C. MASALAH PAK HASSAN: KONKLUSI

Di dalam masalah Pak Hassan, H0 : X = 85. Mari kita asumsikan bahwa


Pak Hassan ingin mengambil tingkat signifikansi 0,05. Dia dengan demikian
akan menolak H0 hanya jika mean sampel yang dia dapatkan amat
menyimpang sehingga jatuh dalam wilayah 2,5% atas dan 2,5% bawah dari
semua mean sampel yang mungkin terjadi apabila H0 benar (0,025 + 0,025 =
0,05). Jika X -nya jatuh dalam 95% tengah nilai-nilai X yang mungkin
6.6 Statistika Pendidikan 

terjadi apabila H0 adalah benar, dia akan mempertahankan hipotesis nol.


Bagian-bagian dari distribusi penyampelan yang meliputi nilai-nilai X yang
mengarah pada penolakan hipotesis nol (dalam contoh, dua ekor ekstrim)
disebut daerah-daerah penolakan. Bagian yang membawa pada pemertahanan
hipotesis nol (dalam contoh, 95% tengah distribusi penyampelan) disebut
daerah pemertahanan [retention].
Berapakah mean-mean sampel yang akan terjadi jika H0 adalah benar?
Jika hipotesis nol itu benar, distribusi penyampelan acak atas X akan
berpusat pada hyp, atau 85, seperti ditunjukkan dalam Gambar 6.2. Jika Pak
Hassan dapat secara beralasan mengasumsi bahwa distribusi penyampelan
acak atas X mendekati suatu kurva normal (dan dengan n = 100 dia bisa,
tanpa peduli bentuk populasi skor-skor, menuntut teorema limit sentral),
maka dia dapat menggunakan tabel kurva normal untuk menghitung nilai-
nilai z yang memisahkan 2,5 % atas dan 2,5 % bawah mean-mean sampel
dari yang lainnya. Inilah apa yang disebut sebagai nilai-nilai kritis. Dari
Tabel Kurva Normal, nilai-nilai itu ditemukan sebagai : z =  1,96.

Distribusi
penyampelan X

Area = 0,025 Area = 0,025

 hyp  85

Daerah penolakan H0 Daerah pemertahanan H0 Daerah penolakan H 0

z crit = -1,96 z crit = +1,96

Gambar 6.2
Masalah Pak Hassan : Distribusi penyampelan acak atas X untuk sampel
n = 100 diambil secara acak dari populasi dengan X = 85;  = 0,05
 MPDR5202/MODUL 6 6.7

Tabel 6.1
Rumus-Rumus untuk Menghitung z

Pada umumnya : (skor)  (mean skor  skor)


z
simpangan baku skor  skor
Mencari suatu skor mentah di dalam X X
suatu sampel: z
SX
Mencari letak suatu skor mentah di X  X
z
dalam suatu populasi: X
Mencari letak suatu mean sampel di X  X
z
dalam suatu distribusi penyampelan X

Misalkan mean sampel yang didapatkan Pak Hassan adalah 90. Bahkan
jika mean populasi sungguh adalah 85, kita hendak mengharapkan bahwa
mean suatu sampel yang diambil secara acak dari populasi itu adalah tepat 85
(meskipun mungkin saja). Dengan demikian, yang menjadi pertanyaan
penting adalah, berapakah posisi relatif mean sampel yang diperoleh di antara
semua mean yang mungkin diperoleh secara kebetulan jika hipotesis itu
benar? Untuk menentukan posisi X yang diperoleh, posisi itu haruslah
diungkapkan sebagai skor z:
X  hyp X  hyp
z 
X X / n
Nilai z ini muncul dari berapa banyak standar error dari mean, mean
sampel yang kita peroleh menyimpang dari mean populasi yang kita sudah
hipotesiskan. Untuk mengkonversi X -nya ke dalam z, Pak Hassan
mengetahui X. Mari kita asumsikan X itu adalah 20. Sehingga,
90  85 5
z   2,5
20 / 100 2
Dengan demikian, mean sampel Pak Hassan adalah 2,5 standar error dari
mean lebih besar daripada yang diharapkan jika hipotesis nol adalah benar.
Letak z yang diperoleh ini dalam distribusi penyampelan ditunjukkan dalam
Gambar 6.3. Sebagaimana Anda bisa lihat, nilai itu jatuh dalam daerah
penolakan atas, sehingga Pak Hassan menolak H0 dan mempertahankan HA.
Ringkasnya, dia menyimpulkan bahwa tidaklah masuk akal meyakini bahwa
6.8 Statistika Pendidikan 

mean populasi dari mana sampel itu muncul adalah 85. Pada keadaan-
keadaan itu, tampaklah masuk akal dia melangkah lebih jauh dan mengatakan
bahwa mean populasinya amat mungkin lebih besar daripada 85.

Distribusi
 X  2,0
penyampelan X
Area = 0,025
Area = 0,025
X = 90,0
z hitung = 2,50

-1,96 hyp  85 1,96 2,50

Daerah penolakan H 0 Daerah pemertahanan H 0 Daerah penolakan H 0

z crit = -1,96 z crit = +1,96

Gambar 6.3
Masalah Pak Hassan : Distribusi penyampelan X untuk sampel-sampel yang
diambil secara acak dari populasi denganX = 85 dan X = 20;  = 0,05.
Mean sampel Pak Hassan jatuh dalam daerah penolakan

Apakah Pak Hassan sudah mutlak membuktikan bahwa mean populasi


itu adalah lebih besar daripada 85? Misalkan dia telah menggunakan  = 0,01
sebagai kriterion keputusannya, bukannya 0,05. Mean sampel, juga nilai z-
nya akan masih sama, tetapi nilai-nilai kritis z yang memisahkan daerah-
daerah penolakan dari daerah pemertahanan akan jadi berbeda, z =  2,58,
seperti tampak dalam Gambar 6.4. Saat kriterion keputusan ini dipergunakan,
mean sampel jatuh dalam daerah pemertahanan, dan maka itu keputusannya
akanlah mempertahankan H0. Dengan demikian keputusan akhir kita
mungkin bergantung pada kriterion keputusan yang kita pilih.
Apakah artinya apabila mean sampel kita tidak jatuh dalam daerah
penolakan dan kita mempertahankan H0? Keputusan untuk
“mempertahankan” H0 tidak berarti bahwa H0 mungkin benar tetapi hanya
bahwa H0 dapat saja benar. Maka itu, dikatakan ―mempertahankan‖
hipotesis nol daripada kita katakan ―menerima‖-nya.
 MPDR5202/MODUL 6 6.9

Distribusi
penyampelan X  X  2,00
X = 90,0
z hitung = 2,50

Area = 0,005 Area = 0,005

-2,58 2,50 2,58

Daerah penolakan Daerah pemertahanan Daerah penolakan

z crit = -2,58 z crit = +2,58

Gambar 6.4
Masalah Pak Hassan : Distribusi Penyampelan Atas X untuk Sampel-sampel
yang Diambil Secara Acak dari Populasi denganX = 85 dan X = 20;  = 0,01.
Mean sampel Pak Hassan Jatuh dalam Daerah Pemertahanan

Perhatikan rumus untuk uji z dan perhatikan pengaruh perubahan ukuran


besarnya sampel. Misalkan bahwa mean populasi yang sesungguhnya
berbeda dari mean yang dijadikan hipotesis. Jika Pak Hassan sudah
mengambil suatu sampel acak 25 siswa bukannya 100 orang, dia tidak akan
90  85
menolak hipotesis nol, sebab z = = +1,25, dan +1,25 jatuh dalam
20 25
daerah pemertahanan apabila  = 0,05.
Secara umum, jika sampel yang diambil untuk menguji hipotesis nol
adalah kecil, variasi penyampelan akan besar dan mungkin menyembunyikan
perbedaan diantara hyp dan nyata. Dengan kata lain, hipotesis nol tidak
ditolak padahal semestinya ditolak. Sampel-sampel yang besar meningkatkan
ketelitian dengan mengurangi variasi penyampelan. Bagaimanapun, bagi
suatu studi tertentu terdapat batasan untuk menuju ketelitian yang
dibutuhkan.
6.10 Statistika Pendidikan 

D. TINJAUAN KEMBALI ASUMSI-ASUMSI DALAM INFERENSI


TENTANG SUATU MEAN TUNGGAL

Agar model kurva normal inferensi statistik tentang mean-mean tunggal


menjadi tepat benar, mestilah berlaku beberapa kondisi:
1. Suatu sampel acak diambil dari populasi.
2. Sampel itu diambil lewat rencana penyampelan ―dengan penempatan
kembali.‖
3. Distribusi penyampelan atas X mengikuti kurva normal.
4. Simpangan baku populasi skor-skor diketahui.

Dalam praktek, suatu sampel yang benar-benar acak sering kali sukar
dicapai. Pelanggaran asumsi ini bisa mempengaruhi mean dan simpangan
baku distribusi penyampelan dalam cara-cara yang tidak bisa terduga.
Agar model inferensi tentang mean-mean tunggal yang dijabarkan dalam
bagian ini benar secara ketat, diasumsikan bahwa penyampelan adalah
dengan penempatan kembali. Bagaimanapun, mengambil sampel tanpa
penempatan kembali adalah praktek yang biasa. Error sebab ini di dalam
inferensi amatlah kecil asalkan ukuran besarnya sampel adalah suatu pecahan
kecil dari besarnya populasi, katakan, 0,05 atau lebih kecil.
Asumsi ketiga yaitu bahwa kita boleh memperlakukan distribusi
penyampelan atas X sebagai suatu kurva normal. Apabila skor-skor dalam
populasi tidak terdistribusi normal, teorema limit sentral menjadi penolong
apabila besarnya sampel adalah 25 atau lebih besar. Pada situasi ini,
mengasumsi bahwa distribusi penyampelan mengikuti kurva normal
membawakan error yang minimal.
Asumsi ke-empat yaitu kita mengetahui X, simpangan baku populasi
dari mana sampel kita diambil. Memang, X muncul di dalam rumus untuk
uji z (yaitu pembilang pada standar error mean). Tetapi dalam praktek
sesungguhnya, kita akan harus mengestimasi X dari data sampel.

E. MENGESTIMASI STANDAR ERROR MEAN APABILA 


TIDAK DIKETAHUI

Untuk menguji hipotesis-hipotesis tentang mean-mean, kita harus


menghitung standar error mean itu  X  . Dalam soal Pak Hassan, nilainya
 MPDR5202/MODUL 6 6.11

telah ditetapkan. Bagaimanapun, standar error mean itu memerlukan


diketahuinya , simpangan baku populasi, yang pada praktek sebenarnya kita
hampir selalu mesti mengestimasinya dari sampel:

X  X X  X X  X
z  
X X n ? n

Intuisi mengisyaratkan bahwa mensubstitusi sX, simpangan baku sampel,


sebagai suatu estimasi untuk X, tetapi seperti ternyata kemudian, ini
menimbulkan masalah selanjutnya.
Persoalan dasarnya yaitu varians sampel, sX2 , adalah suatu estimator
berbias untuk varians populasi,  X2 . Yang kita butuhkan adalah suatu
estimator yang tanpa bias. Dengan estimator tanpa bias, mean estimasi-
estimasi yang dibuat dari semua sampel yang mungkin menyamai nilai dari
parameter yang diestimasi. Sebagai contoh, mean sampel yang merupakan
estimator tanpa bias atas mean populasi sebab rerata nilai-nilai X yang
dihitung dari semua sampel yang mungkin tepat sama dengan X. Hubungan
yang sama demikian tidak berlaku di antara sX2 dan  X2 ; nilai mean sX2 yang
dihitung dari semua sampel yang mungkin adalah sedikit lebih kecil daripada
 X2 .
Ingat kembali bahwa rumus untuk varians sampel adalah:

s X2 
 ( X  X )2
n
Telah ditunjukkan bahwa kecenderungan ke arah terlalu rendahnya estimasi
akan diperbaiki jika  (X – X )2 dibagi oleh n – 1 menggantikan oleh n.
Rumus di bawah ini memasukkan koreksi tersebut.

ESTIMASI TANPA BIAS ATAS


VARIANS POPULASI

s X2 
(X  X ) 2


SS X
(Rumus-1)
n n 1
6.12 Statistika Pendidikan 

Penggunaan huruf kecil dalam s X2 memperbedakan rumus ini dari rumus


untuk S X2 . Dengan mengakar kuadratkan rumus itu, kita memperoleh
estimasi yang lebih baik untuk simpangan baku populasi :

sX 
(X  X ) 2

n 1
Di dalam Tabel 6.2 berikut ditunjukkan suatu demonstrasi, dimana tabel ini
menghadirkan 16 sampel yang mungkin yang muncul apabila sampel
berukuran besarnya dua diambil dari suatu populasi empat observasi.
(X  X )
2
Perhitungan varians keempat skor dengan rumus S 2  atau
n
SS X
menghasilkan  X2  5,0. Sekarang mari kita hitung sX2 dengan
n
menggunakan Rumus-1 dari masing-masing keenam belas sampel yang
mungkin tersebut. Keenam belas sampel dan 16 estimasi varians itu
ditampilkan, berurutan, dalam kolom pertama dan terakhir pada tabel itu.
Kita melihat bahwa mean dari estimasi-estimasi ini adalah 5,0, yang
adalah juga nilai sesungguhnya dari  X2 , kuantitas yang kita estimasi. Ini
memperlihatkan bahwa s2 merupakan estimator tanpa bias untuk  2 karena
mean keseluruhan estimasi-estimasi itu sama dengan kuantitas yang
diestimasi. Jelaslah, jika keenam belas estimas itu dibuat dengan membagi
oleh n = 2 bukannya n – 1 = 1, mean dari estimasi-estimasi ini akanlah lebih
kecil daripada 5,0. Meskipun koreksi yang dikedepankan untuk mengestimasi
standar error mean menjadikan estimasi yang lebih baik pada yang rata-
rata [secara umum],
 MPDR5202/MODUL 6 6.13

Tabel 6.2
Sampel-Sampel yang Mungkin, Bersama dengan Estimasi-Estimasi
Varians Populasi yang Dihitung untuk Masing-Masingnya

POPULASI : 2, 4, 6, 8

VARIANS POPULASI :  X2 
 ( X   X )2 = 5,0
N
Estimasi Varians
Populasi

Sampel X  (X  X )
2
s X2 
(X  X ) 2

n 1
2,2 2 0 0
2,4 3 2 2
2,6 4 8 8
2,8 5 18 18
4,2 3 2 2
4,4 4 0 0
4,6 5 2 2
4,8 6 8 8
6,2 4 8 8
6,4 5 2 2
6,6 6 0 0
6,8 7 2 2
8,2 5 18 18
8,4 6 8 8
8,6 7 2 2
8,8 8 0 0
Nilai mean s X2 : 5,0

cermatilah bahwa sampel tertentu mungkin akan menghasilkan estimasi yang


terlalu besar atau terlalu kecil.
Apabila kita mensubstitusi sX untuk X hasilnya disebut estimasi standar
error mean [estimated standard error of the mean], dilambangkan s X :
sX  sX n
6.14 Statistika Pendidikan 

Catat bahwa huruf s kecil menandakan suatu estimasi simpangan baku dalam
kedua simbol itu. Saat kita menyubstitusi s X untuk X dalam rumus untuk z,
hasilnya adalah suatu statistik yang baru (aproksimasi z) disebut t. Tidak
seperti z, bagaimanapun, t tidaklah terdistribusi normal.

Distribusi t
Jika asumsi-asumsi pada bagian D di atas terpenuhi, z sebenarnya yang
berkorespondensi pada mean sampel merupakan suatu variabel yang
terdistribusi normal. Kenapa? Nilai-nilai dari X akan beragam saat kita
berpindah sampel acak demi sampel acak, tetapi nilai-nilai X dan  X
akanlah tetap. Sebagai akibatnya, nilai-nilai z terbentuk sebagai berikut :
 variabel terdistribusi normal    konstanta 
z
 kostanta 
di mana : X = variabel yang terdistribusi normal
X = suatu konstanta
 X = suatu konstanta

Mensubstitusi suatu konstanta dari masing-masing skor dalam suatu


distribusi yang normal tidak mengubah bentuk distribusi itu, demikian pula
halnya membagi oleh suatu konstanta. Dengan begitu, z akan terdistribusi
normal apabila X terdistribusi normal, dan distribusi normal merupakan
distribusi yang benar untuk dievaluasi z.
Mengkaji persoalan yang sama, tetapi kali ini asumsikan  tidak
diketahui dan harus diestimasi dari sampel. Untuk mengevaluasi kedudukan
mean sampel, kita menghitung statistik t:

RUMUS DEFINISIONAL UNTUK t YANG DIBUTUHKAN UNTUK


MENGUJI HIPOTESIS-HIPOTESIS TENTANG MEAN-MEAN TUNGGAL

X  X
t (Rumus-2)
sX
 MPDR5202/MODUL 6 6.15

Statistik ini berbeda dari z dalam hal bahwa penyebut dari ekspresi ini adalah
suatu variabel. Saat kita berpindah sampel acak demi sampel acak, tidak saja
nilai-nilai X akan beragam, tetapi masing-masing sampel akan mungkin
menghasilkan suatu estimasi  s X   X yang berbeda-beda.1 Statistik hasilnya
itu terbentuk sebagai berikut:
(variabel yang terdistribusi normal)  (konstanta)
t
(variabel)

Jika misalnya saja kita hendak mengambil sampel-sampel sebanyak


tidak terhingga yang ukuran besarnya sama-sama n dari suatu populasi,
menghitung X , sX, dan sX untuk masing-masing sampel, dan kemudian
cari t untuk tiap sampel, kita akan memperoleh distribusi penyampelan t.
Oleh karena kehadiran variabel dalam penyebut, statistik ini tidak mengikuti
distribusi normal. Distribusi apakah yang muncul? Tidak lama setelah
peralihan abad ini, seorang matematikawan bangsa Inggris William S.
Gosset, menulis dengan nama samaran ―Student,‖ memecahkan masalah ini
dan menghadirkan distribusi yang tepat untuk hal di atas. Sejak saat itu,
statistik tersebut dinamakan ―t,‖ dan ditribusinya dikenal sebagai distribusi
student atau distribusi t student.
Suatu kekeliruan yang biasa di sini yaitu berpikiran bahwa distribusi
penyampelan X -lah yang menjadi non-normal saat  X perlu diestimasi
dari sampel. Tetapi jika asumsi-asumsi bagian D di atas terpenuhi, X akan
terdistribusi normal berapa pun besar sampelnya. Bagaimanapun, posisi X
tidak dievaluasi secara langsung; namun di sini yang demikian adalah nilai
statistik t = ( X – X)/ sX . Meski X terdistribusi normal, nilai t yang
dihasilkan tidak demikian, sebagaimana sebab alasan yang dikemukakan tadi.
Betapapun, X harus terdistribusi normal agar distribusi student bisa
diterapkan secara tepat.

1
Distribusi penyampelan atas s X cenderung miring positif.
6.16 Statistika Pendidikan 

1. Karakteristik-karakteristik Distribusi t Student


Apa sajakah karakteristik-karakteristik distribusi penyampelan t Student?
apabila sampelnya besar, nilai-nilai s X akan dekat pada nilai-nilai  X ,
serta t akan mirip z. Sebagai akibatnya, distribusinya amat hampir normal.
Pada kenyataannya, jika sampel-sampel cukup besar dan kita bersikeras
memakai model kurva normal, hal ini tidaklah berbahaya (dengan suatu
sampel yang besar tidak terhingga, t = z). Di sisi lain, apabila besarnya
sampel kecil, nilai-nilai sX akan secara substansiil beragam di sekitar  X .
Distribusi t kemudian akan amat jauh dari z yang terdistribusi normal.
Kini menjadi jelas bahwa distribusi t Student bukanlah suatu distribusi
tunggal tetapi lebih merupakan sekeluarga distribusi-distribusi. Anggota-
anggota keluarga itu berbeda-beda dalam tingkat kedekatan [aproksimasi]-
nya menuju kurva normal. Bentuk pasti suatu anggota tertentu dari keluarga
itu bergantung pada besarnya sampel, atau, lebih akuratnya, pada banyaknya
derajat kebebasan (df), suatu kuantitas yang amat berkaitan dengan ukuran
besarnya sampel. Untuk masalah-masalah inferensi tentang mean-mean
tunggal, df = n – 1. Kami akan menjelaskan konsep derajat-derajat kebebasan
secara lebih rinci dalam bagian selanjutnya.
Apabila banyaknya derajat kebebasan adalah kurang daripada tidak
terhingga, distribusi t teoritis dan distribusi normal z adalah mirip dalam
beberapa segi serta berbeda dalam beberapa segi lainnya. Kemiripan itu
adalah bahwa kedua distribusi.
a. Memiliki mean sebesar nol
b. Adalah simetris
c. Adalah unimodal

Dua distribusi itu berlainan di mana bahwa distribusi t


a. Adalah lebih leptokurik daripada distribusi normal (yaitu, lebih sempit di
puncak dan memiliki konsentrasi yang lebih pada ekor-ekornya daripada
suatu kurva normal).
b. Memiliki simpangan baku yang lebih besar (ingat bahwa z = 1).
c. Bergantung pada banyaknya derajat kebebasan.

Gambar 6.5 mengilustrasikan perkara terakhir di atas. Gambar itu


menunjukkan distribusi z yang normal, dan, sebagai bandingannya, distribusi
t Student untuk df = 4, df = 12, df = x.
 MPDR5202/MODUL 6 6.17

Cara-cara bagaimana t Student berbeda dari z yang normal memiliki


suatu konsekuensi penting dalam inferensi statistik. Misalnya, jika kita
menguji suatu hipotesis nol pada  = 0,05, nilai kritis z adalah  1,96. Ekor-
ekor distribusi t menukik ke bawah menuju sumbu horizontal tidak setajam
distribusi normal. Maka itu, dalam distribusi t, kita akanlah perlu bergerak
menuju suatu lokasi yang lebih ekstrim untuk menemukan titik yang menjadi
batas beradanya 0,025 daerah (dalam satu ekor), sebagaimana Gambar 6.5
tunjukkan.

(Identik dengan z yang


terdistribusi normal

df  ¥
df = 12
df = 4

Gambar 6.5
Distribusi t Student untuk Tiga Tingkat Derajat Kebebasan

Seberapa t mesti lebih besar daripada z agar berkorespondensi pada


kejarangan kejadian yang sama bergantung pada besarnya sampel (atau, lebih
akuratnya, pada banyaknya tingkat kebebasan). Tabel 6.3 berikut
mengilustrasikan hal ini.

Tabel 6.3
Nilai-Nilai Kritis untuk Distribusi t Student untuk  = 0,05 dan Beberapa
Derajat Kebebasan yang Dipilih

df 5 10 25 50 100 500 ¥
t0,05  2,571  2,228  2,060  2,008  1,984  1,965  1,960
6.18 Statistika Pendidikan 

Tabel tersebut menunjukkan, untuk nilai-nilai df yang dipilih, nilai kritis


t yang berkorespondensi pada suatu uji dua-ekor yang dilakukan berdasarkan
kriterion keputusan  = 0,05. Catat bahwa:
a. Untuk tingkat kebebasan yang banyaknya tidak terhingga, besar nilai
kritis t adalah sama seperti nilai kritis z: + 1,96.
b. Semakin kecil jumlah tingkat kebebasan, semakin besar nilai kritis t.
c. Perilaku t amat mirip pada perilaku z hingga banyak tingkat kebebasan
kurang daripada 100.
d. Saat banyaknya tingkat kebebasan mengalami penurunan, perubahan
dalam distribusi t Student, pada awalnya tipis saja, terus berlanjut dalam
kecepatan yang terus bertambah.

Pastikan Anda membedakan antara nilai-nilai t yang dikalkulasi dari


himpunan-himpunan data dan distribusi t teoritis. Seperti saja nilai-nilai z
yang terkalkulasi mengikuti distribusi normal hanya dalam syarat-syarat
tertentu, demikian pula nilai-nilai t kalkulasi itu mengikuti distribusi t
Student hanya apabila asumsi-asumsi tertentu terpenuhi. Syarat-syarat yang
perlu itu tepat sama seperti untuk model kurva normal, kecuali bahwa
simpangan baku populasi tidak perlu diketahui.

2. Derajat Kebebasan dan Distribusi t Student


Secara umum, derajat kebebasan berhubungan dengan suatu kuantitas
seperti s, estimasi simpangan baku suatu populasi, berkorespondensi pada
banyaknya observasi yang sepenuhnya bebas untuk beragam. Seseorang
mungkin pada awalnya menganggap bahwa ini akan sama seperti banyaknya
skor dalam sampel, tetapi sering kali terdapat syarat-syarat yang menentukan
pembatasan-pembatasan sedemikian hingga banyaknya derajat kebebasan
adalah lebih kecil. Konsep derajat kebebasan sehubungan dengan
perhitungan s akan diilustrasikan berikut.
Misalkan suatu sampel terdiri atas tiga skor: X1, X2, dan X3. Jika kita
menghitung sX oleh rumus skor simpangan, sX  ( X  X )2 (n 1) ,
nilai sX akan ditentukan oleh nilai-nilai ketiga skor simpangan: X 1 
–X ,

X 2 
– X , dan X 3 
– X . Sekarang hanya dua (dua mana saja) dari skor-
skor simpangan itu yang ―bebas untuk beragam‖. Kita bisa, jika kita ingin,
  
secara mana suka memberikan X1 – X nilai +3, dan X 2 – X nilai –7. 
 MPDR5202/MODUL 6 6.19

Tetapi segera setelah dua dari tiga skor simpangan itu sudah diberi nilai
numerik, yang ketiga tidak lagi bebas untuk beragam. Apakah Anda ingat
bahwa hasil jumlah simpangan-simpangan yang diambil di sekitar mean
adalah selalu nol? Dalam kata lain, ( X  X )  0 . Jadi segera setelah dua
simpangan pertama ditentukan, yang ke-tiga mestilah suatu nilai sedemikian
hingga hasil jumlah ketiga simpangan itu adalah nol. Dalam contoh numerik
 
tadi, nilai X 3  X mestilah +4.
Untuk suatu estimasi varians yang dibuat dari suatu mean tunggal,
akanlah ada n simpangan. Semua kecuali satu dari simpangan-simpangan itu
akanlah ―bebas untuk beragam,‖ tetapi yang terakhir akan tertentukan oleh
batasan bahwa ( X  X ) = 0. Banyaknya derajat kebebasan dalam suatu
persoalan yang melibatkan perhitungan s maka itu adalah n – 1. (Untuk
masalah-masalah jenis lainnya, df mungkin saja berbeda.)

3. Memanfaatkan Distribusi t Student


Distribusi t tampak di dalam Tabel Distribusi t Student. Saat memakai
tabel ini, ingatlah bahwa luas daerah pada suatu distribusi t ditetapkan
sebagai 1,00, seperti dalam tabel kurva-normal. Tabel ini tidak membedakan
antara nilai t positif dan negatif sebab luas daerah yang berada di atas suatu
nilai t positif tertentu adalah sama luas daerah yang berada di bawah nilai
negatif yang sama.
Saat menguji hipotesis-hipotesis tentang mean, nilai t kritis ditemukan
dalam Tabel t Student pada perpotongan baris sehubungan derajat kebebasan
yang sesuai (diberikan di sebelah kiri tabel) dan kolom sehubungan tingkat
signifikansi yang sesuai untuk masing-masing ekor (diberikan di puncak
tabel). Berikut ini akan diberikan dua contoh:
Contoh 6.1 Apabila df = 20 dan  = 0,05, berapakah nilai-nilai t yang
membedakan daerah-daerah penolakan dari daerah
pemertahanan? Asumsikan bahwa kita hendak mengungkap
suatu perbedaan (jika ada) tanpa memperhatikan arahnya.
Pemecahan Kita harus mengidentifikasi nilai-nilai t sedemikian hingga
95% sentral nilai-nilai yang diperoleh akan termasukkan di
dalam batas-batas ini. Nilai-nilai t akan berada serta (z) nilai t
di atas mana 2,5% nilai-nilai t akan berada. Besarnya t yang
diisyaratkan ditemukan di bawah kepala Area dalam satu ekor
6.20 Statistika Pendidikan 

= 0,025. Untuk df = 20 nilai itu adalah t =  2,086. Persoalan


ini diilutrasikan pada Gambar 4.6.
Mestilah jelas bahwa distribusi t boleh ditafsirkan sebagai
suatu distribusi peluang, seperti boleh dilakukan terhadap
distribusi normal. Misalnya, apabila df = 20 dan penyampelan
itu adalah acak, peluang untuk memperoleh nilai t yang
melebihi batas-batas  2,086 adalah 0,05.

Daerah penolakan H0 Daerah pemertahanan H0 Daerah penolakan H0

df = 20

Area = 0,025 95% dari nilai-nilai t Area = 0,025


berada di antara batas-
batas ini

t: -2,086 0 +2,086
Gambar 6.6
Distribusi Student :Nilai-nilai t untuk df = 20di antara mana 95% Sentral
Nilai-nilai t akan Berada

Contoh 6.2 Mengsumsikan penyampelan acak, apabila df = 20, berapakah


nilai t yang amat tinggi sehingga peluang memperoleh nilai itu
sebagai tinggi atau lebih tinggi adalah 0,05?
Pemecahan Buka Tabel t Student dan identifikasi baris sehubungan df = 20.
Kemudian cari kolom sehubungan pada Area dalam suatu ekor
= 0,05. Pada perpotongan baris dan kolom ini, Bacalah entri t =
1,725. Oleh karena, sebenarnya, kita sedang mencari titik
persentil ke-95 pada distribusi t itu, nilainya adalah positif: t =
+ 1,725. Ini diilustrasikan pada Gambar 6.7.
 MPDR5202/MODUL 6 6.21

df = 20

Area = 0,05

t: 0 + 1,725

Gambar 6.7
Nilai t untuk df = 20yang Berkorespondensi pada Daerah Dalam Ekor-Atas
Distribusi Student = 0,05

Contoh 6.3 Pertanyaan Profesor Arman


Profesor Arman, Direktur Kesehatan di universitas setempat, meyakini
bahwa para mahasiswa di kampusnya adalah amat sadar akan kesehatan dan
oleh karena itu mengkonsumsi lebih sedikit gula daripada sebagian besar
penduduk di negaranya. Dia mengetahui bahwa rata-rata orang di negaranya
mengkonsumsi 50 kg gula setahun, sebagian besar dalam ujud minuman
ringan, gula-gula, dan kue kering.
Untuk menguji keyakinannya, Profesor Arman memutuskan untuk
mengambil sampel acak 25 siswa yang sekarang berkuliah di universitas itu
dan menentukan kuantitas gula yang dikonsumsi oleh masing-masing siswa
selama jangka waktu dua minggu. Konsumsi gula per tahun akan dihitung
dengan mengalikan total selama dua minggu oleh 26. Pertanyaan
penelitiannya memunculkan suatu hipotesis statistik untuk diuji, dia
menetapkan, pada tingkat signifikansi 0,05:
H0 : X = 50

Meskipun Profesor Arman meyakini bahwa para siswa di kampusnya


mengkonsumsi lebih sedikit gula daripada normal, dia akan pula ingin
mengetahui apakah mereka ternyata mengkonsumsi lebih banyak gula. Maka
itu, hipotesis alternatifnya diekspresikan sebagai:
HA : X 50
6.22 Statistika Pendidikan 

Konsumsi gula rata-rata per tahun oleh sampel 36 siswanya adalah 46


kg. Apakah mengambil suatu sampel dengan mean ini atau mean yang lebih
ekstrim adalah mungkin jika hipotesis nol benar?
Solusi: Untuk menjawab pertanyaan ini, dia harus mengestimasi standar
error mean itu dari data sampelnya serta mengkonversi X menjadi nilai t.
Mari kita asumsikan bahwa sX ternyata 10. Maka itu,
sX 10
sX    1, 7
n 36
dan
X   X 46  50
t   –2, 40
sX 1,7
Apakah makna nilai thitung –2,40? Ini berarti bahwa mean sampel
Profesor Arman adalah 2,40 unit estimasi standar error mean [estimated
standard error of the mean units] lebih kecil daripada nilai yang dinyatakan
dalam H0. Banyaknya derajat kebebasan adalah n – 1 = 24. Untuk  = 0,05,
nilai kritis t adalah nilai yang dalam masing-masing ekor distribusi
membatasi 2,5% bagian luar area dari bagian-bagian lainnya. Dari Tabel t
Student, kita melihat bahwa nilai kritis itu adalah -2,064. Dalam kata lain,
jika hipotesis nol benar (bahwa X = 100), hanya 5% semua mean sampel
yang mungkin akan berbeda sebesar 2,064 estimasi standar error mean.
Gambar 6.8 menunjukkan distribusi penyampelan X (untuk apabila H0
benar), daerah penolakan, serta kedudukan nilai t yang dikalkulasi.

Daerah penolakan H0 Daerah pemertahanan H 0 Daerah penolakan H0

df = 24

Area = 0,025 Area = 0,025

t: - 2,064 0 +2,064
t obt = -2,40

Gambar 4.8
Menguji Suatu Hipotesis tentang X terhadap Suatu Hipotesis Alternatif
Nondireksional;  = 0,05.
 MPDR5202/MODUL 6 6.23

Data sampel Profesor Arman membawanya agar menolak hipotesis nol


dan menerima hipotesis alternatif. Bagaimanapun, ini hanyalah suatu
keputusan statistik. Berdasarkan hal ini, Profesor Arman bisa mencapai suatu
konklusi penelitian. Misalnya, dia boleh menyimpulkan bahwa perhatian
yang ditingkatkan terhadap isu-isu yang berkenaan dengan kesehatan sudah
membawa pada penurunan dalam konsumsi gula di kampusnya.
Profesor Arman tidak dapat yakin bahwa para siswa di kampusnya
mengkonsumsi lebih sedikit gula daripada warga lainnya. Dia akan harus
mensurvey keseluruhan populasi siswa di kampusnya supaya 100% yakin.
Statisika inferensial, anda ingat kembali, hanya mengurusi peluang-peluang.
Apa yang statistika inferensial katakan di sini adalah bahwa mean sampel 46
tidak mungkin terjadi dalam penyampelan acak dari suatu populasi dengan
mean 50.
Bagaimanapun, bahkan jika konklusi statistik Profesor Arman adalah
benar (mari kita asumsikan bahwa rata-rata konsumsi gula di kampusnya
benar-benar lebih kecil daripada rata-rata nasional), itu tidak berarti bahwa
konklusi penelitiannya adalah benar. Daripada amat sadar akan kesehatan,
para siswa di kampusnya mungkin saja mengkonsumsi lebih sedikit gula
sebab mereka tidak dapat mengupayakan minuman ringan, gula-gula, dan
kue kering daripada sebagian besar penduduk lainnya.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!

1) Untuk pertanyaan yang dihadapi oleh Pak Hassan, jika simpangan baku
populasi pada tes pemahaman matematika untuk para siswa kelas enam
adalah 10, apakah yang Pak Hassan akan simpulkan jika dia memakai uji
dua-ekor pada tingkat signifikansi 0,05 dan memperoleh mean sebesar
87,5 untuk sampelnya yang terdiri atas 100 siswa?
2) Untuk Soal 1, hitunglah nilai-nilai kritis X dalam bentuk skor mentah.
3) Jika  = 0,10, berapakah nilai-nilai zkritis untuk suatu uji dua-ekor?
4) Anda diberi data berikut: X  63 ,  X  12 , n = 100, H0 : X = 60, dan
HA : X  60.
6.24 Statistika Pendidikan 

(a) uji hipotesis nol pada tingkat signifikasi 0,05 dan kemukakan
konklusi-konklusi Anda.
(b) Uji hipotesis nol pada tingkat signifikansi 0,01 dan kemukakan
konklusi-konklusi Anda.
5) Norma nasional bagi kelas delapan untuk ujian ilmu sosial adalah skor
123. Ahli peneliti sekolah di suatu provinsi ingin mengetahui bagaimana
skor-skor para siswa di provinsinya dibandingkan dengan standar ini.
Dia memilih suatu sampel acak 81 siswa dan menemukan bahwa
X  117. Asumsikan  X  10 .
(a) Buatlah hipotesis nol dan hipotesis alternatif yang paling sesuai
untuk sifat inkuirinya.
(b) Uji hipotesis nol itu pada tingkat signifikansi 0,05 dan nyatakan
konklusi-konklusi Anda.
(c) Uji hipotesis nol itu pada tingkat signifikansi 0,01 dan nyatakan
konklusi-konklusi Anda.
6) Kita mengambil  = 0,05 dan menguji hipotesis H0 : X = 50. Konklusi
apakah yang seharusnya kita ambil jika (a) n = 10; tcalc = +2,10, dan HA :
X  50? (b) n = 20, tcalc = +2,10, dan HA : X  50? (c) n = 10, tcalc =
+2,10, dan HA : X  50? Tunjukkan nilai kritis t untuk masing-masing
bagian.
7) Kepala Sekolah sebuah SMA ―favorit‖ mengkhawatirkan bahwa para
siswa yang lulus dari sekolah itu, secara pukul rata, pada tes-tes
pemahaman matematika tidak memperoleh skor sebaik para siswa dari
sekolah-sekolah lain di kabupaten itu. Untuk mengatasi keprihatinan
mereka, kepala sekolah SMA favorit tersebut memilih 15 siswa secara
acak dari alumninya dan menyelenggarakan tes pemahaman matematika
yang baku dipakai di kabupaten itu. Skor rata-rata untuk para siswa yang
lulus di kabupaten itu adalah 98. Skor-skor 15 alumni dari SMA favorit
itu adalah sebagai berikut:
105 98 101 110 96 103 104 101
98 105 112 95 105 100 108
(a) Nyatakan secara formal hipotesis-hipotesis yang diperlukan untuk
mengadakan suatu uji non-direksional.
(b) Selesaikan uji tersebut pada tingkat signifikansi 0,05 dan nyatakan
konklusi Anda.
 MPDR5202/MODUL 6 6.25

Petunjuk Jawaban Latihan

1) Langkah 1. Menghitung Nilai Z


87,5  85
Z hitung   2,5
10 100
Langkah 2. Mencari nilai Zkritis dari Tabel Kurva Normal untuk  =
0,05 dan uji dua-ekor (karena HA : X < 85), maka
diperoleh Zkritis = 1,96.
Langkah 3. Menentukan letak Zhitung = 2,5 berdasarkan pada Zkritis =
1,96 dengan memperhatikan gambar berikut:

0,025
0,025
Z hitung

-1,96 0 1,96 2,50

Dari gambar di atas tampak bahwa nilai Zkritis = 2,5


terletak di daerah penolakan H0, maka HA diterima. Ini
kesimpulan statistik.
Langkah 4. Berdasarkan keterangan pada Langkah 3, yaitu HA
diterima, maka disimpulkan bahwa terdapat perbedaan
yang signifikan antara kemampuan pemahaman
matematis para siswa kelas 6 di provinsi Pak Hassan
dengan norma nasional. Ini berarti pula bahwa
kemampuan pemahaman matematis siswa kelas 6 di
provinsi Pak Hassan lebih tinggi (baik) dari kemampuan
pemahaman matematis siswa nasional.
2) Nilai-nilai kritis X adalah 83,04 dan 86,96.
3) Zkritis  1,645 .
63  60
4) Z hitung   2,5
12 100
6.26 Statistika Pendidikan 

a. Untuk  = 0,05 dan uji dua-ekor (karena HA : X 60), maka


diperoleh Zkritis = 1,96. Karena Zhitung= 2,5 terletak di daerah
penolakan H0, maka HA diterima.
b. Untuk  = 0,01 dan uji dua-ekor, maka Zkritis= 2,57. Karena Zhitung=
2,5 terletak di daerah penerimaan H0, maka HA ditolak.
5) a. Hipotesis Nol (H0) dan hipotesis alternatifnya (HA) sebagai berikut:
H0 : X = 123
HA : X 123
117  123
b. Z hitung   5, 4
10 81
Untuk  = 0,05 dan uji dua-ekor, maka diperoleh Zkritis =  1,96.
Karena Zhitung = -5,4 terletak di daerah penolakan H0, maka HA
diterima.
Jadi, skor ujian Ilmu Sosial siswa di distriknya berbeda secara
signifikan dengan skor nasional, dan skor di distriknya lebih jelek
dari skor nasional.
c. Untuk  = 0,01 dan uji 2 ekor, maka diperoleh Zkritis =  2,57, dan
karena Zkritis = -5,4 terletak di daerah penolakan H0, maka HA
ditolak. Kesimpulannya samadengan jawaban b!
6) a. n = 10, thitung = 2,10; H0 : X = 50; HA : X 50.
Untuk  = 0,05; df = 10 – 1 = 9, dan uji 2 ekor (HA : X = 50), maka
diperoleh tkritis =  2,262.
Karena thitung = 2,1 terletak di daerah penerimaan H0, maka HA ditolak.

thitung
0,025 0,025

-2,262 0 2,1 2,262

b. Untuk  = 0,05, df = 20 – 1, 19, dan uji 2 ekor, maka diperoleh tkritis


=  2,093. Karena thitung = 2,1 terletak di daerah penolakan H0, maka
HA diterima.
c. Untuk  = 0,05, df = 10 – 1, 9, dan uji 1 ekor ke kanan (karena HA
= X 50), maka diperoleh tkritis = 1,833. Karena thitung = 2,1 terletak
di daerah penolakan H0, maka HA diterima.
 MPDR5202/MODUL 6 6.27

Karena thitung = 2,1 terletak di daerah penolakan H0, maka HA diterima.

0,05

thitung

0 1,833 2,1

7) Dari soal yang diberikan, dapat diketahui bahwa X = 98, n = 15, X =


102,7; SX = 4,97; dan  = 0,05, sehingga
102, 7  98
Z hitung   3, 66
4,97 / 15
a. H0 : X = 98; HA : X  98
b. Untuk  = 0,05, df = 15 – 1 = 14, dan uji 2 ekor (karena HA = X
98), maka diperoleh tkritis =  2,145.
Karena thitung = 3,66 terletak di daerah penolakan H0, maka HA diterima.
Kesimpulan
Berdasarkan hasil ini, kekhawatiran Kepala Sekolah tentang kemampuan
pemahaman matematis para siswanya tidak perlu lagi, dan bahwa
kemampuan pemahaman matematis para siswa yang merupakan alumni
di sekolahnya secara signifikan lebih baik dari para siswa di distriknya.

R A NG KU M AN

Untuk menguji suatu hipotesis tentang mean populasi tunggal


menggunakan model kurva normal:
Langkah 1 : Tetapkan populasi target
Langkah 2 : Tentukan hipotesis nol, hipotesis statistik yang hendak
diuji  H 0  . Ini adalah selalu hipotesis tentang populasi
(misal, H0 : X = 100) dan dipilih menurut pertanyaan
penelitian yang akan dipelajari. Peneliti biasanya
berharap menolak H 0 .
6.28 Statistika Pendidikan 

Langkah 3 : Tentukan hipotesis alternatif  H A  . Kita mesti memilih


di antara alternatif yang direksional dan non-direksional,
bergantung pada rasional inkuiri penelitian.
Langkah 4 : Tentukan tingkat signifikansi () untuk dipakai sebagai
kriterion untuk keputusan serta tentukan nilai skor-z atau
nilai-nilai yang membedakan daerah-daerah penolakan
dari daerah pemertahanan dalam distribusi penyampelan
X.
Langkah 5 : Tentukan n dan ambil suatu sampel acak berukuran
demikian dari populasi yang ditetapkan.
Langkah 6 : Hitunglah X dan  X .
Langkah 7 : Hitunglah sehubungan skor-z posisi X dalam distribusi
penyampelan mean yang akan dihasilkan saat menyampel
dari suatu populasi tentang mana H 0 adalah benar.
Langkah 8 : Tolaklah H 0 jika X berada di dalam daerah penolakan;
jika tidak pertahankan H 0 .

Untuk menguji hipotesis-hipotesis tentang mean populasi dengan


memakai z, kita harus mengetahui simpangan baku populasi,  X , untuk
menghitung standar error mean,  X . Pada keadaan sebenarnya, kita
jarang mengetahui nilai  X . Tanpa  X , kita lakukan hal terbaik ke-dua
dan mengestimasinya dari data sampel kita. Bagaimanapun, simpangan
baku sampel itu berbias; simpangan baku sampel cenderung
mengestimasi terlalu kecil parameter populasi. Kita bisa memperoleh
estimasi yang lebih baik untuk  X dengan membagi hasil jumlah


kuadrat-kuadrat sampel,  X  X  oleh n  1 menggantikan n. Ini

memberi kita sX . Apabila sX kemudian dibagi oleh n , hasilnya


adalah estimasi standar error mean, sX .
Apabila kita menyubstitusi sX untuk  X di dalam rumus untuk z,
hasil-hasilnya bukan z lagi melainkan suatu variabel baru yang disebut t.
Meskipun X terdistribusi normal apabila syarat-syarat tertentu
terpenuhi (terutama penyampelan acak), t tidak demikian. Terdapat
sekeluarga utuh distribusi-distribusi t, dengan bentuk masing-masingnya
bergantung pada banyaknya derajat kebebasan. Untuk hipotesis-hipotesis
tentang mean tunggal, df = n – 1. Perbedaan terpenting di antara z dan t
 MPDR5202/MODUL 6 6.29

yaitu bahwa ada konsentrasi area yang lebih besar dalam ekor-ekor
distribusi t. Maka itu, untuk menolak H0 memakai t akanlah mengambil
simpangan yang lebih besar dari harapan  X    . Bagaimanapun,
hyp

seiring meningkatnya ukuran sampel, distribusi-distribusi t akan makin


menyerupai distribusi z.
Menolak atau mempertahankan hipotesis nol adalah konklusi
statistik. Suatu hipotesis nol yang ditolak umumnya disebut-sebut
sebagai suatu hasil yang signifikan. Di dalam statistika, menyebut suatu
hasil signifikan berarti hanya bahwa hasil itu membawa peneliti untuk
menolak hipotesis nol karena hipotesis itu mempunyai peluang yang
rendah untuk terjadi secara kebetulan; yaitu, nilai sampel tidak berada di
dalam batas-batas variasi penyampelan yang diharapkan menurut
hipotesis nol. Apakah suatu hasil yang secara statistik ―signifikan‖ itu
adalah juga hasil yang penting, hal ini, merupakan perkara lain.
Saat berpindah dari konklusi statistik ke konklusi penelitian, atas
alasan-alasan statistik (matematik) kita sebenarnya hanya bisa membuat
konklusi-konklusi tentang populasi khusus dari mana kita kita sudah
mengambil sampel acak kita. Jika kita menghendaki generalisasi yang
lebih luas, kita mesti mengulangi studi itu dalam populasi yang lebih
luas atau secara masuk akal mempertunjukkan bahwa tidak ada
perbedaan yang relevan di antara populasi yang di sampel dan populasi
yang lebih luas yang hendak kita tarik konklusi-konklusinya.

TES F OR M AT IF 1

Selesaikan soal-soal berikut dengan singkat dan jelas!

1) Anda diberi data berikut: X = 75, X = 11, n = 121, H0 : X = 77, HA :


X < 77.
a. Ujilah hipotesis nol pada tingkat signifikansi 0,05 dan kemukakan
konklusi Anda!
b. Ujilah hipotesis nol pada tingkat signifikansi 0,01 dan kemukakan
konklusi Anda!
2) Seorang peneliti ingin mengetahui ―Apakah terdapat perbedaan yang
signifikan antara IPK mahasiswa atlet dengan IPK para mahasiswa pada
umumnya di sebuah universitas?‖ Untuk menjawab pertanyaan tersebut,
gunakan data berikut: Mean (rata-rata) IPK seluruh mahasiswa di
universitas tersebut adalah 3,1 dan simpangan bakunya adalah 2,3, serta
Mean (rata-rata) IPK dari 350 mahasiswa-atletnya adalah 2,9.
6.30 Statistika Pendidikan 

a.
Tulislah hipotesis penelitiannya!
b.
Tulislah secara formal hipotesis nol (H0) dan hipotesis penelitiannya
(H1), kemudian ujilah hipotesis nol tersebut pada  = 0,05, dan
kemukakan konklusi statistiknya!
c. Kesimpulan apakah yang sebaiknya dikemukakan oleh peneliti tadi!
3) Kita mengambil  = 0,01 dan akan menguji H0 : X = 70. Konklusi
apakah yang seharusnya kita ambil, jika:
a. n = 25, thitung = 2,75, dan HA : X 70.
b. n = 30, thitung = –1,50, dan HA : X< 70.
4) Diperoleh informasi bahwa pada 30 tahun yang lalu rata-rata tinggi
badan mahasiswa S-1 tingkat I di suatu negara adalah 170 cm. Seorang
peneliti yang tertarik terhadap tinggi badan mahasiswa S-1 menyatakan
bahwa karena perbaikan gizi secara ilmiah pada saat ini, maka peneliti
tersebut mengklaim bahwa tinggi badan mahasiswa S-1 tingkat I pasti
tidak lagi seperti badan mahasiswa S-1 pada 30 tahun yang lalu. Untuk
membuktikan klaimnya, peneliti tersebut mengobservasi 20 mahasiswa
S-1, dan ternyata tinggi badannya adalah sebagai berikut:
160 175 180 180 160 180 175 165 179 175
170 175 172 180 169 176 182 165 160 170

a. Tulislah rumusan masalah dari penelitian tersebut!


b. Tulislah hipotesis penelitian yang berkaitan dengan permasalahan
tadi!
c. Tulislah secara formal hipotesis statistik (H0) dan hipotesis
penelitian (H1) yang berkaitan dengan soal no (a) dan (b), kemudian
ujilah pada  = 0,01 dan tulislah kesimpulan statistik yang diperoleh
peneliti itu!
d. Tulislah kesimpulan penelitiannya!

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 25. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut
untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan
Belajar 1.
 MPDR5202/MODUL 6 6.31

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang
belum dikuasai.
6.32 Statistika Pendidikan 

Kegiatan Belajar 2

Uji Hipotesis Dobel Mean


(Kasus Dua-Sampel)

L ogika dibalik uji hipotesis dua-sampel (dobel mean) sangat serupa


dengan uji satu-sampel (mean tunggal), tetapi bukan lagi menguji
perbedaan di antara sampel Anda dan sisa populasi, kali ini Anda menguji
perbedaan di antara dua populasi. Khususnya, Anda menggunakan dua
sampel acak bebas(independent random samples) dari dua populasi yang
berbeda (misalnya, laki-laki, perempuan, rumah tangga berpendapatan tinggi,
rumah tangga berpendapatan rendah, dan sebagainya). Jadi, Anda
menggunakan dua sampel bebas untuk mengestimasi dua populasi yang
berbeda secara mencolok.
Ini adalah sebuah perbedaan yang sangat penting. Ingatlah: kita sedang
menggunakan sampel-sampel dari dua populasi, tetapi membuat hipotesis-
hipotesis tentang populasi-populasi tersebut. Barangkali ini terdengar lucu
dan aneh, tetapi cobalah memandang kedua grup itu, baik mereka laki-laki
dan perempuan, atau Muslim dan non-Muslim, sebagai duapopulasi yang
berbeda (atau, dalam istilah lain: terpisah, tersendiri), yang sedang kita
hipotesiskan (dalam pernyataan hipotesis penelitian) sebagai berbeda satu
sama lain pada suatu variabel.
Ada tiga jenis uji hipotesis dua-sampel: mean-mean dua sampel untuk
sampel-sampel besar (distribusi-Z); mean-mean dua sampel untuk sampel-
sampel kecil (distribusi-t); dan, proporsi-proporsi dua-sampel untuk sampel-
sampel besar (distribusi-Z). Perbedaan utama dalam uji-uji tersebut adalah
apakah Anda memiliki mean-mean (data interval-rasio) atau proporsi-
proporsi (data nominal), dan apakah sampel-sampel Anda berukuran besar
(total gabungan lebih dari 100) atau kecil (total gabungan kurang dari 100).
Jika Anda tahu semua jawaban untuk tiap pokok persoalan di atas, Anda
dapat dengan mudah menemukan uji mana yang hendaknya digunakan.
Jika Anda memiliki mean-mean untuk dua sampel ukuran sampel
gabungannya lebih dari 100, maka Anda menggunakan uji mean-meandua-
sampel untuk sampel-sampel besar (distribusi-Z). Jika Anda memiliki mean-
mean untuk dua sampel dan ukuran sampel gabungannya kurang dari 100,
maka Anda menggunakan uji mean-meandua-sampel untuk sampel-sampel
 MPDR5202/MODUL 6 6.33

kecil (distribusi-t). Jika Anda memiliki data nominal (proporsi-proporsi),


maka Anda menggunakan uji proporsi-proporsi dua-sampel untuk sampel-
sampel besar (distribusi-Z) atau untuk sampel-sampel kecil (distribusi-t).
Perlu diketahui, materi kita saat ini tidak membahas uji proporsi-proporsi
dua-sampel untuk sampel-sampel kecil.
Di dalam pernyataan hipotesis nol untuk uji mean-meandua-sampel,
Anda menyebutkan bahwa tidak terdapat perbedaan di antara dua populasi
itu:
H0 :  1   2
Di dalam hipotesis penelitiannya, Anda menyebutkan bahwa dua populasi
itu berbeda satu sama lain:
 H1 :  1   2 
atau bahwa salah satu populasi lebih besar atau lebih kecil daripada satu
populasi lainnya:

H1 :  1   2 
H 1 : 1   2 
Perhatikan bahwa dalam semua pernyataan di atas kita menyebutkan bahwa
populasi-populasi itu—bukan sampel-sampelnya—yang adalah serupa atau
berbeda.
Lima langkah untuk mengadakan uji hipotesis dua-sampel sangat mirip
dengan langkah-langkah untuk uji hipotesis satu sampel. Pada Langkah 1
Anda menyebutkan asumsi-asumsi Anda dan memenuhi syarat-syarat uji
(sampel-sampel acak bebas, tingkat pengukuran interval-rasio, distribusi
penyampelan normal, dan varians-varians populasi yang sama saat menguji
sampel-sampel kecil). Pada Langkah 2 Anda mendefinisikan hipotesis nol
dan hipotesis penelitian (seperti di atas). Selanjutnya, dalam Langkah 3,
Anda memilih distribusi penyampelan dan menentukan daerah kritis.
Hitunglah statistik uji dalam Langkah 4. Akhirnya, buatlah suatu keputusan
menolak hipotesis nol (tidak ada evidensi perbedaan signifikan di antara dua
populasi tersebut) atau, jika tidak demikian, gagal menolak hipotesis nol
(terdapat evidensi perbedaan yang signifikan di antara dua populasi) dan
kemudian interpretasikan hasil-hasilnya dalam Langkah 5.
Namun demikian, bahkan sebelum kita dapat mengadakan uji mean-
meandua-sampel, kita harus terlebih dulu menghitung estimasi gabungan
(pooledestimate), yang mengestimasi galat baku (standarderror) dengan
6.34 Statistika Pendidikan 

menggabungkan keterangan tentang sebaran dari dua sampel itu (atau


populasi-populasi). Dua formula untuk estimasi gabungan membedakan uji
sampel besar dan uji sampel kecil:
s12 s2
(besar)  x1 x 2   2 atau
N1  1 N 2  1
N1 s12  N 2 s22 N1  N 2
(kecil)  x1 x 2 
N1  N 2  2 N1 N 2
Di dalam sains sosial, kita sering mendengar tentang perbedaan-
perbedaan gaji di antara para pekerja laki-laki dan perempuan. Jika kita
tertarik untuk menguji apakah perbedaan ini memang ada di dalam populasi,
kita dapat menggunakan sebuah sampel populasi pekerja yang bersifat
umum, membagi sampel ini ke dalam grup laki-laki dan grup perempuan, dan
kemudian membandingkan pendapatan rata-rata untuk kedua grup. Dua
sampel bebas ini (grup laki-laki dan grup perempuan) dapat dipandang
sebagai wakil-wakil untuk populasi-populasi keseluruhan yang mereka wakili
(populasi seluruh laki-laki, populasi seluruh perempuan). Dengan
menggunakan uji Z sampel-sampel bebas, kita dapat menentukan apakah
perbedaan yang ditemukan di antara sampel-sampel kita cenderung atau
mungkin terjadi dalam populasi. Oleh karena itu, kita menggunakan dua
sampel untuk membandingkan perbedaan-perbedaan di antara populasi-
populasi.
Kemungkinan untuk penolakan hipotesis nol dipengaruhi oleh empat
faktor: (1) besarnya perbedaan-perbedaan yang teramati; (2) tingkat alpha
(α), (3) penggunaan uji satu-pihak atau uji dua-pihak, dan (4) besarnya
sampel (Healey, 2007). Besarnya perbedaan yang teramati adalah satu-
satunya dari empat faktor tersebut yang tidak dikendalikan oleh peneliti.
Tingkat alpha adalah seberapa nyaman kita dengan suatu tingkat
kemungkinan kesalahan—tingkat alpha yang lebih tinggi mengurangi
peluang bahwa kita salah (galat-galat Type I) tetapi juga mengurangi
kemungkinan penolakan hipotesis nol. Kemungkinan penolakan juga
meningkat jika arah hubungan dihipotesiskan (artinya, menggunakan uji satu-
pihak, bukan uji dua-pihak). Terakhir, peningkatan besarnya sampel
meningkatkan kemungkinan penolakan hipotesis nol karena semakin besar
ukuran sampel maka semakin representatif sampel itu bagi populasi yang
diwakilinya.
 MPDR5202/MODUL 6 6.35

Agar keterangan di atas dapat dipahami, pelajarilah contoh-contoh


berikut dengan teliti.

Contoh 6.4
Seorang peneliti memiliki permasalah sebagai berikut: ―Apakah terdapat
perbedaan yang signifikan dalam kemampuan berpikir kritis antara siswa pria
dan wanita kelas 8 SMP?
Untuk menjawab pertanyaan penelitian (rumusan masalah) tersebut, gunakan
model hipotesis lima langkah, jika memungkinkan; gunakan data hasil
observasi tentang kemampuan berpikir kritis berikut, serta gunakan  = 0,05.
Asumsikan bahwa semua asumsi dan persyaratan uji dipenuhi.
Pria Wanita
X 1  80 X 2  84
N1  60 N 2  63
S1  10 S2  9

Jawab
Dari soal di atas, kita harus melakukan uji hipotesis dua sampel (dobel mean)
dua ekor (dua pihak) dari mean-mean sampel besar, karena N1 + N2 = 123 
100. Dengan menggunakan model lima langkah untuk pengujian hipotesis,
maka:

Langkah 1 : Buatlah asumsi-asumsi dan penuhi syarat-syarat uji.


Di dalam soal sudah diketahui bahwa semua asumsi atau
syarat uji telah dipenuhi (penyampelannya acak bebas,
tingkat pengukurannya interval, kedua sampel berdistribusi
normal, dan varians-varians populasi yang sama).
Langkah 2 : Tulislah hipotesis statistik (H0) dan hipotesis penelitiannya
(H1)!
H0 : 1 = 2
H1 : 12
Langkah 3 : Pilihlah distribusi penyampelan dan tentukanlah daerah
kritisnya.
Karena N1 + N2 = 163  100, maka kita menggunakan
statistik Z menguji hipotesisnya.
Untuk  = 0,05 dan uji 2 ekor, maka diperoleh Zkritis =  1,96.
6.36 Statistika Pendidikan 

X1  X 2
Langkah 4 : Menghitung Z, memakai rumus Z = , dengan lebih
 x x
1 2

dulu menghitung nilai  x1  x2 memakai rumus  x1  x2 =

S12 S2
 2 .
N1  1 N 2  1
10 2 92
 x x =  = –2,309.
1 2
60  1 63  1

Langkah 5 : Buatlah sebuah keputusan dan interpretasikan hasil-hasil tes.


Karena Zhitung  –2,309 berada di daerah penolakan H0,
maka H1 diterima, dan menyimpulkan bahwa terdapat
perbedaan yang signifikan antara kemampuan berpikir kritis
siswa pria dan wanita. (Karena rata-rata kemampuan berpikir
kritis siswa wanita lebih besar dari siswa pria, maka kita
dapat katakan pula bahwa kemampuan berpikir kritis siswa
wanita lebih tinggi dari siswa pria)

Contoh 6.5
Seorang peneliti ingin mengetahui ―Apakah kemampuan berpikir kreatif
siswa yang belajar dengan model A lebih baik dari siswa yang belajar dengan
model B? Untuk memperoleh jawaban atas permasalahan tersebut, peneliti
itu melakukan eksperimen, dan diperoleh data tentang kemampuan berpikir
kreatif sebagai berikut:

Model A 7 7 7 7 8 8 8 9 9 9 10 -
Model B 5 6 7 7 7 8 8 8 9 9 9 10

a. Tulislah hipotesis penelitian yang harus dikemukakan oleh peneliti


tersebut!
b. Tulislah secara formal hipotesis statistik (H0) dan hipotesis penelitiannya
(H1), kemudian ujilah hipotesis statistik (H0) itu pada  = 0,05, dan
tulislah kesimpulan statistiknya.
c. Tulislah kesimpulan yang diperoleh dalam penelitian tersebut!
 MPDR5202/MODUL 6 6.37

Jawab
a. Kemampuan berpikir kreatif siswa yang belajar dengan model A lebih
baik dari siswa yang belajar dengan model B.
b. (i) H0 : 1 = 2 dan H1 : 1  2.
(ii) Untuk  = 0,05, df = 11 + 12 – 2 = 21, dan uji satu ekor (ke kanan),
maka diperoleh tkritis = 1,721.
(Catatan: digunakan statistik t, karena N1 + N2 = 11 + 12 < 100).
Karena X 1 = 8,09, S1 = 0,99, N1 = 11, X 1 = 7,75, S2 = 1,36, danN2
= 12, maka dengan memakai rumus  x1  x2 =

N1  S12  N 2  S2 2 N1  N 2 X1  X 2
 , dan t = , maka
N1  N 2  2 N1  N 2  x1  x2
diperoleh  x1  x2 = 0,532 dan thitung = 0,65.
Karena thitung = 0,65 terletak di daerah penerimaan H0, maka H1
ditolak.
b. Kesimpulan
Tidak ada evidensi untuk menerima bahwa kemampuan berpikir kreatif
siswa yang belajar dengan model A lebih baik dari siswa yang belajar
dengan model B.

R A NG KU M AN

1. Secara formal hipotesis statistik (H0) dan hipotesis penelitian (H1)


untuk uji mean-mean dua sampel (dobel mean) adalah
H0 : 1 = 2 b. H0 : 1 = 2 c. H0 : 1 = 2
H1 : 1  2 H0 : 1  2 H0 : 1  2
2. Untuk menguji H0, digunakan distribusi Z atau uji dengan statistik Z,
apabila jumlah ukuran kedua sampel lebih dari 100 atau N1 + N2
 100, dengan formula untuk Z dan  x1  x2 (estimasi gabungan
simpangan bakunya) berturut-turut
X1  X 2 S12 S2
Z= , dan  x1  x2 =  2
 x x 1 2
N1  1 N 2  1
3. Untuk menguji H0, digunakan distribusi t atau uji dengan statistik t,
apabila jumlah ukuran kedua sampel kurang dari 100 atau
N1 + N2  100, dengan formula untuk t dan  x1  x2 adalah
6.38 Statistika Pendidikan 

X1  X 2 N1  S12  N 2  S2 2 N1  N 2
t= , dan  x1  x2   ,
 x x
1 2
N1  N 2  2 N1  N 2
Dengan derajat kebebasannya (df) adalah N1 + N2 – 2.

TES F OR M AT IF 2

Selesaikan soal-soal berikut dengan singkat dan jelas!

1) Tentukanlah nilai kritis untuk suatu uji 2 ekor (2 pihak) dua sampel
dengan tingkat  = 0,01, di mana N1 = 20 dan N2 = 26.
2) Seorang peneliti memiliki permasalahan sebagai berikut: ―Apakah
kecerdasan sosial siswa yang mengikuti ekstrakurikuler lebih tinggi dari
siswa yang tidak mengikuti ekstrakurikuler?‖
a. Tulislah hipotesis penelitian untuk permasalahan tersebut!
b. Tulislah secara formal hipotesis statistik (H0) dan hipotesis
penelitian (H1) yang sesuai dengan permasalahan itu.
c. Ujilah hipotesis nol pada (b) untuk tingkat  = 0,04, apabila
diketahui data tentang kecerdasan sosial dari kedua kelompok siswa
sebagai berikut:
Mengikuti Tidak mengikuti
ekstrakurikuler ekstrakurikuler
X1 = 80 X 1 = 84
N1 = 60 N2 = 63
S1 = 10 S2 = 9

d. Kesimpulan apa yang seharusnya dikemukakan peneliti tersebut?


3) Seorang peneliti tentang pembelajaran menulis dalam bahasa Inggris
mengemukakan rumusan masalah penelitiannya sebagai berikut:
―Apakah terdapat perbedaan kemampuan menulis antara siswa yang
belajar dengan Learning Cycle Approach dan siswa yang belajar dengan
Communication Approach?‖
Dari hasil perlakuan dua pembelajaran yang berbeda di dua kelas yang
berbeda juga, diperoleh skor-skor kemampuan dari para siswa tersebut
sebagai berikut:
 MPDR5202/MODUL 6 6.39

Mengikuti
6 6 7 7 8 9 9 9 9 10 10 -
ekstrakurikuler
Tidak mengikuti
5 5 6 7 7 7 8 8 8 8 9 9
ekstrakurikuler

a. Tulislah hipotesis penelitiannya.


b. Tulislah secara formal H0 dan H1, kemudian ujilah H0 pada tingkat
 = 0,05, dan kemudian konklusi statistiknya!
c. Kesimpulan apa yang seharusnya dikemukakan oleh peneliti tadi!

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 33 kecuali soal nomor 3 dengan skor 34. Hitunglah jawaban yang benar.
Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan
Anda terhadap materi Kegiatan Belajar 2.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 2, terutama bagian yang
belum dikuasai.
6.40 Statistika Pendidikan 

Kunci Jawaban Tes Formatif

Tes Formatif 1
1) (a) Untuk  = 0,05 dan uji 1 ekor (ke kiri, karena HA : X < 77, maka
diperoleh Zkritis = –1,645.
75  77
Zhitung = = –2.
11/ 121
Karena Zhitung = –2 terletak di daerah penolakan H0, maka dapat
disimpulkan bahwa HA diterima atau tidak cukup fakta (evidence)
untuk menolak HA.
(b) Untuk  = 0,01 dan uji 1 ekor (ke kiri, karena HA : X < 77) maka
diperoleh nilai Zkritis = –2,33.
Karena Zhitung = –2 terletak di daerah penerimaan H0, maka dapat
disimpulkan bahwa HA ditolak atau tidak cukup fakta untuk
menerima HA.
2) (a) Terdapat perbedaan yang signifikan antara IPK mahasiswa-atlet
dengan IPK para mahasiswa di universitas tersebut.
(b) H0 : X = 3,1 dan HA : X  3,1.
2,9  3,1
Zhitung = = –1,63.
2,3 / 350
Untuk  = 0,05 dan uji 2 ekor (karena HA : X  3,1), maka
diperoleh Zktitis =  1,96.
Karena Zhitung = –1,63 terletak di daerah penerimaan H0, maka HA
ditolak.
(c) Tidak terdapat perbedaan yang signifikan antara IPK para
mahasiswa-atlet dengan IPK para mahasiswa di universitas tersebut!
3) (a) Untuk  = 0,01, df = 25 – 1 = 24, dan uji satu ekor (ke kanan, karena
HA : X  70), maka diperoleh tkritis = 2,492.
Karena thitung = 2,75 terletak di daerah penolakan H0, maka HA
diterima.
(b) Untuk  = 0,01, df = 30 – 1 = 29, dan uji satu ekor (ke kiri, karena
HA : X < 70), maka diperoleh tkritis = –2,462.
Karena thitung = –1,50 terletak di daerah penerimaan H0, maka HA
ditolak.
4) (a) Apakah tinggi badan mahasiswa S-1 sekarang tidak lagi sama
dengan tinggi badan mahasiswa S-1 pada 30 tahun yang lalu?
 MPDR5202/MODUL 6 6.41

Atau
Apakah terdapat perbedaan tinggi badan mahasiswa S-1 sekarang
dengan tinggi badan mahasiswa S-1 pada 30 tahun yang lalu?
(b) Tinggi badan mahasiswa S-1 sekarang tidak lagi sama dengan tinggi
badan mahasiswa S-1 pada tiga puluh tahun yang lalu.
Atau
Terdapat perbedaan tinggi badan mahasiswa S-1 sekarang dengan
tinggi badan mahasiswa pada 30 tahun yang lalu.
(c) H0 : X = 170 dan HA : X 170.
Untuk  = 0,01, df = 20 – 1 = 19, dan uji 2 ekor, maka diperoleh
tkritis =  2,861.
172, 4  170
Karena X  172, 4 dan SX = 7,1, maka thitung   1, 48,
7,1/ 19
nilai thitung ini terletak di daerah penerimaan H0, maka HA ditolak.
(d) Kesimpulan: Tinggi badan mahasiswa sekarang tidak berbeda secara
signifikan dengan mahasiswa pada 30 tahun yang lalu.

Tes Formatif 2
1) tkritis =  2,690.
2) a. Kecerdasan sosial siswa yang mengikuti ekstrakurikuler lebih tinggi
dari siswa yang tidak mengikuti ekstrakurikuler.
b. H0 : 1 = 2; dan H1 : 1  2.
X1  X 2
c. Dengan memakai formula Z = , dan  x1  x2 =
 x x
1 2

S12 S2
 2 , maka diperoleh Zhitung = 3,84.
N1  1 N 2  1
Untuk  = 0,04 dan uji 1 ekor (ke kanan, karena H1 : 12), maka
diperoleh Zkritis = 1,75.
Karena Zhitung = 3,84 terletak di daerah penolakanH0, maka H1
diterima.
d. Diperoleh evidensi bahwa kecerdasan sosial siswa yang mengikuti
ekstrakurikuler lebih tinggi dari kecerdasan sosial siswa yang tidak
mengikuti ekstrakurikuler.
5) a. Terdapat perbedaan kemampuan menulis antara siswa yang belajar
dengan learning cycle Approach dan siswa yang belajar dengan
communication approach.
6.42 Statistika Pendidikan 

b. H0 : 1 = 2; dan H1 : 1  2.


Untuk  = 0,05, df = 11 + 12 – 2 = 21, dan uji 2 ekor, maka
diperoleh tkritis =  2,080.
X1  X 2
Dengan memakai formula , dan  x1  x2 =
 x x
1 2

N S  N 2 S2
2 2
N1  N 2
1 1
 , maka diperoleh thitung = 1,612.
N1  N 2  2 N1 N 2
Karena thitung = 1,612 terletak di daerah penerimaan H0, maka H1
ditolak.
c. Tidak terdapat perbedaan kemampuan menulis yang signifikan
antara siswa yang belajar melalui learning cycle approach dan siswa
yang belajar melalui communication approach.
 MPDR5202/MODUL 6 6.43

Daftar Pustaka

Bannach. 2007. Study Guide for theEssential of Statistics. Singapore:


Thomson-Wadsworth.

Dowdy. et al. 1991. Statistics for Research, Second Edition. New York: John
Wiley & Sons.

Minium, et. al., 1993, Statistical Reasoning in Psychology and Education,


New York: John Wiley & Sons.
Modul 7

Analisis Varians dan Kovarians


Dr. Jarnawi Afgani Dahlan

PEN D AH U LU A N

D alam penelitian, para peneliti sering kali dihadapkan pada pengujian


komparatif bagi beberapa kelompok yang lebih dari 2. Misalkan peneliti
ingin membandingkan hasil belajar yang menggunakan model pembelajaran
berbasis masalah, model pembelajaran penemuan, dan model pembelajaran
konvensional sebagai pengontrol. Uji perbandingan dua kelompok memang
bisa digunakan dengan cara memasang-masangkan kelompok-kelompok
yang diujinya. Dengan cara tersebut, maka peneliti akan melakukan tiga kali
proses pengujian. Hal tersebut memunculkan ketidakefesienan dalam proses
pengujiannya, kita harus melakukan 3 kali pengujian. Di samping itu, dengan
banyak melakukan pengujian, maka sangat mungkin kita “terjerumus” pada
kesalahan type 1, yakni memperoleh keputusan yang berbeda secara berarti,
tetapi pada kenyataannya tidak berbeda. Kemudian yang ketiga adalah tidak
adanya suatu standar dalam pengambilan keputusan yang secara utuh
mengenai perbedaan-perbedaan pengaruh dari faktor atau perlakuan-
perlakuan yang dibandingkan.
Pengujian pada ANOVA atau analysis of varians dilakukan dengan
membandingkan variasi-variasi yang muncul dalam kelompok dan antar
kelompok. Melalui variasi-variasi tersebut akan dapat diketahui ada
perbedaan dari kelompok-kelompok yang diuji. Setelah itu, apabila hipotesis
nol pada analisis varians ditolak, maka peneliti masuk dalam tahap uji
perbandingan antar kelompok.
Dalam kasus lain, mungkin peneliti juga tidak hanya ingin mengetahui
pengaruh dari satu faktor saja, misal model pembelajaran, tetapi peneliti
melihat bahwa faktor tingkat ekonomi keluarga juga turut berperan dalam
keberhasilan belajar siswa. Untuk kepentingan tersebut, dia membagi
ekonomi keluarga siswa menjadi tiga kelompok, misalnya rendah, sedang,
dan tinggi. Pertanyaan yang ingin di jawab oleh peneliti adalah “apakah jenis
model pembelajaran berpengaruh terhadap hasil belajar siswa?”, “apakah
7.2 Statistika Pendidikan 

tingkat ekonomi keluarga berpengaruh terhadap hasil belajar siswa?”, dan


“apakah jenis model pembelajaran dan tingkat ekonomi keluarga secara
bersama berpengaruh terhadap hasil belajar siswa?”.

A. DESKRIPSI SINGKAT

Analisis varians memuat materi tentang analisis varians satu arah (one
way ANOVA), analisis varians dua arah dengan dan tanpa interaksi (Two
way ANOVA), analisis lanjutan pada ANOVA, serta pada akhir pembahasan
akan disajikan uji-uji asumsi pada ANOVA, terutama untuk pengujian
kehomogenan varians. Bahasan berikutnya adalah analisis kovarians atau
disingkat dengan ANAKOVA atau ANCOVA. Analisis ini berkaitan dengan
dua atau lebih variabel terukur dengan variabel bebasnya tidak ditentukan
lebih dulu nilainya. Analisis isi memanfaatkan sekaligus konsep analisis
varians dan regresi. Pada akhir setiap kegiatan pembelajaran disajikan contoh
perhitungan secara manual dan melalui bantuan program komputer, SPSS.

B. RELEVANSI

Materi ini sangat perlu dipelajari oleh mahasiswa program pascasarjana.


Banyak penelitian-penelitian kuantitatif yang dilakukan pada tesis ataupun
lainnya yang melibatkan lebih dari dua kelompok dan memandang dari
berbagai faktor. Seperti yang dijelaskan di atas, peneliti mengkaji hasil
belajar dari sudut beberapa model pembelajaran dan juga dari sudut tingkat
ekonomi keluarga siswa. Analisis varians dan analisis kovarians sangat
banyak manfaatnya dalam penelitian. Penelitian dapat secara bersama
melakukan pengujian perbandingan rata-rata atas k > 2 kelompok, kemudian
setelahnya dapat dilakukan pengujian multipelnya. Dalam analisis kovarians
mempunyai kegunaan di antaranya dapat mengendalikan error dan akibatnya
dapat meningkatkan ketepatan, menyesuaikan atau mengoreksi rata-rata
perlakuan dari variabel bebas, membantu menafsirkan data, dan menguraikan
varians total atau jumlah hasil kali menjadi bagian komponen-komponennya.
 MPDR5202/MODUL 7 7.3

C. TUJUAN INSTRUKSIONAL KHUSUS

Setelah mempelajari materi pada kegiatan belajar modul ini diharapkan


mahasiswa dapat:
1. Merumuskan hipotesis untuk pengujian perbandingan k > 2 kelompok
baik yang saling bebas maupun berpasangan.
2. Menjelaskan logika pengujian ANOVA
3. Menghitung jumlah kuadrat total (SSt) dari data k kelompok
4. Menghitung jumlah kuadrat antar kelompok (SSb) dari data k kelompok
5. Menghitung jumlah kuadrat dalam kelompok (SSw) dari data k
kelompok
6. Menentukan derajat bebas bagi SSt, SSb, dan SSw dari k kelompok
7. Menentukan F hitung
8. Menyusun tabel anova satu jalur
9. Menetapkan hasil keputusan pada pengujian anova satu jalur
10. Memilih dengan tepat uji lanjutan ANOVA (Post hoc), serta
menggunakannya.
11. Melakukan uji lanjutan pada anova.
12. Menetapkan hasil keputusan pada pengujian anova dua jalur dengan dan
tanpa interaksi.
13. Melakukan pengujian perbandingan melalui analisis kovarins.
14. Melakukan pengujian kehomogenan varians sebagai syarat dalam
pemilihan uji lanjutan anova.
7.4 Statistika Pendidikan 

Kegiatan Belajar 1

Analisis Varians Satu Jalur

P ada penelitian eksperimen, selain membandingkan dua kelompok


mungkin juga peneliti menggunakan lebih dari dua kelompok. Jika
asumsi-asumsi yang digunakan untuk penggunaan statistik parametrik
dipenuhi, maka untuk menguji perbedaan mean ( ) secara sekaligus dan satu
arah digunakan uji analisis varians atau analisis ragam yang populer dengan
ANOVA atau ANAVA. Selain itu, jika ada variabel bawaan dari setiap
subjek penelitian akan diperhatikan, misalnya dalam penelitian pendidikan,
kita akan memperhatikan faktor usia siswa, maka statistik uji yang digunakan
adalah analisis kovarian atau analisis peragam yang lebih dikenal dengan
istilah ANACOVA.
Pada analisis varians, hipotesis yang diuji adalah:
H0 : 1 = 2 = 3 = … = k
H1 : sekurang-kurangnya ada dua mean tidak sama.

Hipotesis nol pada ANOVA sering kali disebut dengan hipotesis


omnibus, maksudnya adalah hipotesis yang sekaligus melibatkan banyak
situasi. ANOVA itu sendiri merupakan tes yang omnibus.
Sebagaimana kita ketahui bahwa dalam pengujian dua rata-rata, kita
menyusun hipotesis alternatif dengan kemungkinan dua jenis, yakni terarah
(directional) dan tidak berarah (non-directional). Hal ini tidak berarti apabila
banyaknya rata-rata lebih dari dua. Pada ANOVA bisa saja hipotesis nol kita
tolak, tetapi tidak semua kelompok-kelompok yang diuji berbeda. Selain itu,
dalam ANOVA ini bisa saja terdapat dua kelompok yang dibandingkan, dan
kekuatan uji ANOVA dalam uji dua kelompok lebih tinggi dibandingkan
dengan uji-t.
Misalkan diketahui k populasi yang masing-masing diambil sampel
berukuran n. Misalkan pula bahwa k populasi tersebut bebas dan menyebar
normal dengan rata-rata 1, 2, ..., k dan variannya sama σ2. Ingin diperoleh
cara bagi pengujian:
H0 : 1= 2 = ... = k
H1 : minimal ada dua mean yang tidak sama.
 MPDR5202/MODUL 7 7.5

Secara grafik dapat dituliskan kondisinya sebagai berikut:

1 2 … k

Gambar 7.1
Gambaran Pengujian K > 2 Kelompok
dalam Kasus Varians Homogen ( 1   2    k )

1. Memahami Kelogisan dari Analisis Varians: Variasi Dalam dan


Antar Kelompok
Pertama kita kembangkan analisis varians satu arah bagi kelompok yang
saling bebas. Misalkan kita telah memilih 10 pengamatan dari 3 sampel
secara acak yang menggunakan perlakuan berbeda. Jika tidak terdapat
perbedaan efek atau pengaruh dari perlakuan, maka hipotesis nol yang di
kembang A  B  C adalah benar, dan distribusi skor untuk ketiga
sampel dapat terlihat seperti Gambar 7.2(a). Jika terdapat perbedaan akibat
pengaruh perlakuan, maka hipotesis nol (Ho) adalah salah, dan sebaran atau
distribusi skor ketiga kelompok sampel akan terlihat sebagaimana
Gambar 7.2(b) di mana nilai dari A , B dan C terlihat berbeda. Selanjutnya
kita akan membahas dua tipe variasi yang terjadi.
7.6 Statistika Pendidikan 

A
B
C

A: X XX XXXX X X X

XA
B: X XX X X X X XXX

XB

C: X X X XXX X XX X

XC
(a)

A: X XX XXXX X X X

XA
B: X XX X X X X XXX

XB

C: X X X XXX X XX X

XC
(b)

Gambar 7.2
Variasi Antar dan Dalam Kelompok

a. Variasi dalam kelompok (Within-groupsvariation). Dalam setiap sampel,


skor-skor individu bervariasi terhadap mean sampelnya. Kejadian ini kita
sebut dengan variasi dalam kelompok. Variasi ini menunjukkan bahwa
kita telah memperoleh tentang pengaruh dari variasi sampel acak; hal ini
secara langsung sebagai gambaran dari variasi yang melekat
(inherentvariation) antar individu-individu dalam perlakuan yang sama.
Variasi ini terjadi tidak merefleksikan perbedaan yang disebabkan oleh
perbedaan perlakuan yang diberikan. Mengapa demikian, karena
individu-individu dalam setiap kelompok memperoleh perlakuan yang
 MPDR5202/MODUL 7 7.7

sama, sehingga perbedaan antar skor-skor dalam kelompok tidak dapat


dihubungkan dengan perbedaan perlakuan. Dengan kata lain, variasi di
dalam kelompok-kelompok hanya merefleksikan variasi yang inheren,
dan tidak merefleksikan perbedaan-perbedaan yang disebabkan oleh
karena adanya perbedaan perlakuan.
b. Variasi antar kelompok (between-groupsvariation). Rata-rata atau mean
dari sampel-sampel mungkin berlainan, misalkan X A , X B dan X C .
Tentu saja tidak diduga bahwa nilainya sama sekalipun A  B  C
sebagaimana yang telah dipelajari dalam bahasan distribusi sampling.
Sangat penting kita menyadari bahwa variasi antar kelompok-kelompok
adalah juga merefleksikan variasi inheren antar individu-individu. Jika
misalkan A  B  C , tetapi tidak terdapat variasi yang inheren, maka
semua individu-individu dari ketiga populasinya akan memperoleh skor
yang sama. Akibatnya rata-rata dari ketiga kelompok sampel tersebut
tidak mungkin berbeda satu dengan yang lain. Pada sisi lain, semakin
besar variasi inheren antar individu-individu, maka semakin besar
peluang untuk menghasilkan rata-rata sampel yang berbeda satu sama
lain.

2. Kelogisan pada ANOVA


Sangat mungkin Anda mempertanyakan apa kaitan antara skor-skor di
dalam dan antar kelompok dengan penyajian hipotesis tentang rata-rata.
Jawaban pertanyaan tersebut memberi landasan adanya dua jenis variasi
dalam pengujian Ho dalam ANOVA.
Pertama kita perhatikan variasi di dalam kelompok-kelompok dari skor
individual rata-rata sampelnya. Jika diasumsikan variannya homogen dan
dihitung varians (s2) untuk masing-masing sampel, maka masing-masing
merupakan estimator dari varians populasinya. Untuk memperoleh estimasi
yang lebih baik, maka kita bisa menggabungkan beberapa (k) estimasi
sampel-sampel dan mengambil rata-ratanya. Pertama kita misalkan bahwa
semua sampel berukuran sama, yakni n (n1 = n2 = ... = nk)

s 2

estimator  2
k
Dengan demikian kita mempunyai satu estimator dari varians populasi.
Perlu dicatat bahwa estimator ini tidak bergantung pada benar atau salahnya
H 0.
7.8 Statistika Pendidikan 

Misalkan H0 benar, maka k sampel berasal dari populasi-populasi yang


identik, yang ekuivalen dengan mengatakan bahwa sampel-sampel itu berasal
dari populasi yang sama. Ingat kembali bahasan tentang distribusi sampling
rata-rata yang telah dibahas pada modul sebelumnya, bahwa varians dari
distribusi sampling rata-rata adalah

2
 X2 
n

Adapun estimator terbaik dari  X2 adalah S X2 , dan untuk itulah kita


memperoleh hubungan sebagai berikut.

nS X2 estimator  2

Hasil di atas memberi kita dua estimator bagi varians populasi. Jika
hipotesis nol benar, maka keduanya merefleksikan variasi inheren, dan kita
menduganya berukuran hampir sama. Bagaimanapun jika hipotesis nol salah,
estimator antar kelompok-kelompok akan lebih cenderung besar, dan
estimator itu akan merefleksikan pengaruh perbedaan perlakuan bukan
sekedar variasi inheren. Jika estimator antar grup begitu lebih besar daripada
estimator di dalam kelompok-kelompok sehingga variasi sampling tidak
dapat secara masuk akal menjadi alasan hal tersebut. Untuk itulah kita
menolak hipotesis nol.
Sebagaimana namanya, yakni analisis varians, maka varians menjadi
ukuran dasar bagi variasi. Ingat kembali bagian sebelumnya bahwa
pembilang dari varians adalah hasil dari jumlah simpangan-simpangan data
terhadap rata-rata yang dikuadratkan, atau sering disebut dengan jumlah
kuadrat (JK) atau sum of square (SS). Dengan begitu, ANOVA melibatkan
perhitungan hasil-hasil jumlah dari bilangan-bilangan kuadrat, untuk
berikutnya kita akan membahas prosedur ANOVA dengan menggunakan
varians-varians, namun perlu dipahami bahwa ANOVA merupakan suatu uji
tentang hipotesis nol yang berkaitan dengan perbedaan antar rata-rata
kelompok-kelompok.

3. Prosedur pada ANOVA


Misalkan  i adalah mean populasi pada kelompok ke-i, dengan
i  1, 2,3,..., k , serta adalah mean secara keseluruhan (grandmean), maka
setiap pengamatan dapat dituliskan dalam bentuk
 MPDR5202/MODUL 7 7.9

xij  i   ij .................................... 1)
dengan ijsimpangan nilai pengamatan xij dari i.
Masing-masing dari idapat ditulis dalam bentuk
i    i .................................... 2)
dengan i adalah pengaruh baris ke-i. Jika persamaan 2) disubstitusikan ke
persamaan 1), maka diperoleh persamaan berikut.
xij    i   ij .................................... 3)
Dengan demikian adanya perbedaan antar kelompok dapat dilihat pada ,
sehingga hipotesis di atas menjadi:
H’0 : 1 = 2 = ... = k = 0
H’1 : sekurang-kurangnya ada satu i tidak sama dengan nol
Untuk memudahkan dalam menurutkan pengujian hipotesisnya,
misalkan kita pandang bahwa pada semua kelompok diambil sampel yang
sama  n1  n2  ...  nk  n  .
Secara matematis diketahui bahwa
xij  xij (sifat refleksi)
xij  xij  x  x  xi.  xi.
xij  x   xi.  x    xij  xi. 
Jika keduanya dikuadratkan, maka diperoleh
x  x    xi.  x    xij  xi.  
2 2
ij

x  x    xi.  x   2  xi.  x   xij  xi.     xij  xi. 


2 2 2
ij

Dan jika dikenakan jumlah pada masing-masing kelompok, diperoleh hasil

  x  x     xi.  x    x. j  xi.  


k n k n 2
2
ij
i 1 j 1 i 1 j 1

   xi.  x     xij  xi.   2  xi.  x   xij  xi. 


k n k n k n
2 2

i 1 j 1 i 1 j 1 i 1 j 1

Suku pertama dari persamaan sebelah kanan konstan terhadap j, dan suku
terakhir dapat ditunjukkan sama dengan nol, sehingga diperoleh identitas
sebagai berikut

Identitas jumlah kuadrat klasifikasi satu arah


2 2

  x  x   n  xi.  x     xij  xi. 


k n k k n
2
ij
i 1 j 1 i 1 i 1 j 1
7.10 Statistika Pendidikan 

Atau secara ringkas dapat dituliskan sebagai


JKTotal = JKkolom + JKgalat atau SSTotal = SSBetween + SSWithin
Dalam perhitungan secara manual, penggunaan notasi sigma sering kali
menyulitkan, maka untuk memudahkannya jumlah kuadrat pada masing-
masing identitas di atas dapat disederhanakan dengan identitas berikut.

k n
T..2
SSTotal   xij2 
i 1 j 1 nk
k

T i
2
T..2
SSbetween  i 1

n nk
SS within  JKTotal  JK Kolom

Langkah berikutnya kita akan membahas tentang derajat bebas bagi


masing-masing jumlah kuadrat di atas. Seperti diketahui bahwa pengujian
hipotesis nol dalam analisis varian melibatkan pembandingan dua estimastor
terpisah atas varians untuk populasi sasaran: 1) didasarkan pada variasi antar
skor-skor individual dalam kelompok-kelompok sekitar rata-rata kelompok-
kelompok, dan 2) didasarkan pada variasi antara rata-rata sampel. Ingat
bahwa untuk menghitung estimator yang tidak bias untuk varians populasi
dilakukan dengan membagi jumlah kuadrat-kuadrat oleh derajat bebas yang
berkaitan dengan jumlah kuadrat-kuadrat itu. Hubungan yang umum ini
diringkas dengan persamaan
SS JK
S2  atau S 2 
df df

Ingat kembali bahwa derajat bebas untuk estimator varians yang


didasarkan pada satu sampel saja adalah (n – 1), dan bahwa derajat bebas
untuk estimasi gabungan atas varians yang digunakan dalam uji-t untuk beda
dua rata-rata yang saling bebas adalah  n1 –1   n2 –1 .
Derajat bebas bagi SStotal adalah sebagaimana yang kita perkirakan dari
apa yang dibahas sebelumnya, yakni ntotal – 1. Oleh karena terdapat (n – 1)
derajat bebas yang berkaitan dengan simpangan-simpangan yang ada di
sekitar rata-rata, maka derajat bebas untuk SSwithin adalah
 n1 –1   n2 –1   nk –1  n1  n2  nk – k ,
 MPDR5202/MODUL 7 7.11

atau dfwithin  ntotal – k . Dimana ntotal adalah total banyaknya kasus (yang
diteliti) dan k adalah banyak kelompok yang dibandingkan.
Bagi SSbetween terdapat simpangan dari rata-rata sebanyak rata-rata
sampel (atau jumlah kelompok). Oleh karena itu, derajat bebasnya adalah
dfbetween  k –1
untuk sebarang analisis varians, maka hubungan antara derajat bebas dari
SStotal , SSwithin , dan SSbetween adalah sebagai berikut
dftotal  df within  dfbetween
Jika kita membagi masing-masing jumlah kuadrat dengan derajat
bebasnya masing-masing, maka diperoleh dua estimator varians yang
diperlukan untuk menguji hipotesis nol, yaitu estimator varians dalam
kelompok-kelompok  swithin
2
 dan estimator varians antar kelompok-
kelompok s2
between . Estimator-estimator tersebut sebagaimana yang
diestimasinya.
SS
sb2(between )  b 
estimator
  2 (variasi inheren)
dfb
SS w estimator
sw2 ( witihin )     2  pengaruh perlakuan
df w

Dalam statistika simbol dari sw2 sering disebut dengan mean square error
(MSe) atau mean square within (MSw), dan sb2 sering disebut dengan mean
square between (MSb).
Jika hipotesis nol benar (tidak ada perbedaan antara kelompok-
kelompok), maka rata-rata dari kelompok-kelompok akan cenderung dekat
dengan X (rata-rata keseluruhan), dan sb2 akan menjadi estimator tak bias
untuk varians inheren ( 2 ) . Estimator ini akan menaksir kuantitas yang
sama seperti yang ditaksir oleh sw2 . Dan keduanya haruslah sama di dalam
batas-batas variasi sampling. Di sisi lain, jika hipotesis nol salah (minimal
ada dua kelompok yang berbeda), hasil jumlah kuadrat simpangan rata-rata
tiap kelompok X  sekitar X akan cenderung lebih besar, dan sb2 akan
lebih besar daripada sw2 sehingga melampaui batas-batas variasi sampling.
Untuk melengkapi pengujian melalui analisis varians ini diperlukan
suatu metode untuk membandingkan sb2 dengan sw2 , dan kita menggunakan
7.12 Statistika Pendidikan 

rasio F, yang merupakan statistik yang dibentuk oleh rasio dua estimator
varians independen, dengan F adalah
s2
F  b2
sw

Jika hipotesis nol benar, sb2 dan sw2 keduanya akan menjadi estimator
varians inheren saja, dan rasio ini mestilah sekitar 1,0. Semakin besar
pengaruh perbedaan perlakuan, maka F akan makin cenderung melampaui
satuan tadi. Atau dengan kata lain nilai F yang diperoleh akan berada pada
daerah ujung sebelah kanan dari kurva distribusi F.
Secara ringkas perhitungan analisis varians yang dijelaskan di atas dapat
dirangkum dalam tabel anova sebagai berikut.

Tabel 7.1
Tabel ANOVA dengan n Tiap Kelompok Sama

Sumber Jumlah Derajat Kuadrat


F hitung
Keragaman Kuadrat Bebas Rata-Rata (MS)
Antar Kolom SSbetween k –1 SSbetween sb2
sb2  F 
(between) k 1 sw2
Dalam kelompok SSwithin k  n  1 SS within
sw2 
(within) k (n  1)
Total SSTotal nk –1

Hipotesis nol, Ho, ditolak pada taraf nyata  bila :

Fh  fa  k  1, k  n – 1  .

Jika setiap kelompoknya diambil n yang berbeda (ni, i = 1, 2, 3, ..k), maka


k ni
T2
SSTotal   xij2  ..
i 1 i 1 N
k
Ti.2 T..2
SSbetween   
i 1 ni N
SSWithin  SSTotal  SSbetween
k
Dengan N   ni
i 1
 MPDR5202/MODUL 7 7.13

Dengan tabel ANOVA sebagai berikut:

Tabel 7.2
Tabel ANOVA untuk n Tiap Kelompok Berbeda

Sumber Jumlah Derajat Kuadrat


F hitung
Keragaman Kuadrat Bebas Rata-Rata (MS)
Antar kelompok SSbetween k –1 JKK sb2
(between) s12  F 
k 1 sw2
Dalam kelompok SSwithin N –k SSwithin
(within) sw2 
N k
Total SSTotal N –1

Keputusan sama dengan di atas, yakni Ho ditolak pada taraf nyata  bila:

Fh  F  k  1, N  k .

Contoh 7.1
Misalkan diketahui hasil ulangan siswa yang belajar dengan 5 model
pembelajaran yang berbeda A, B, C, D, dan E sebagai berikut:

A B C D E
5 9 3 2 7
4 7 5 3 6
8 8 2 4 9
6 6 3 1 4
3 9 7 4 7
Ujilah dengan taraf nyata 0,05 bahwa rata-rata hasil ulangan melalui kelima
model pembelajaran tersebut tidak berbeda!

Jawab:
1. Hipotesis yang diuji:
H0 : 1 =2 = 3 =4 = 5 = 0
H1 : sekurang-kurangnya ada i tidak sama dengan nol
2. Taraf signifikansi yang diambil 0,05.
3. Dengan df = (4,20) dan  = 0,05, wilayah kritiknya F >2,87
7.14 Statistika Pendidikan 

4. Perhitungan :
Perhatikan tabel berikut:
A B C D E
5 9 3 2 7
4 7 5 3 6
8 8 2 4 9
6 6 3 1 4
3 9 7 4 7
Jumlah 26 39 20 14 33 132
Jumlah kuadrat 150 311 96 46 231 834

1322
SStotal  52  42  ...  42  7 2   834  696,960  137, 040
25
262  392  202  142  332 1322
SSbetween    776, 400  696,960  79, 440
5 25
SSwithin  137, 040  79, 440  57, 600

Dari hasil di atas dapat dituliskan dalam tabel anova berikut:


Jumlah Derajat Kuadrat
Sumber Keragaman F Hitung
Kuadrat Bebas tengah
Antar kelompok 79,440 4 19,860 6,90
Dalam kelompok 57,600 20 2,880
Total 137,040 24

5. Keputusan:
Karena F = 6,90 > 2,87, maka Ho ditolak, artinya minimal ada dua rata-
rata hasil ulangan yang berbeda dari kelima model pembelajaran
tersebut.

Contoh 7.2
Dalam sebuah percobaan biologi 4 konsentrasi bahan kimia digunakan
untuk merangsang pertumbuhan sejenis tanaman tertentu selama periode
waktu tertentu. Data pertumbuhan berikut, dalam sentimeter, dicatat dari
tanaman yang hidup.
 MPDR5202/MODUL 7 7.15

Konsentrasi
1 2 3 4
8,2 7,7 6,9 6,8
8,7 8,4 5,8 7,3
9,4 8,6 7,2 6,3
9,2 8,1 6,8 6,9
8,0 7,4 7,1
6,1

Apakah ada beda pertumbuhan rata-rata yang nyata yang disebabkan


oleh keempat konsentrasi bahan kimia tersebut? Gunakan taraf nyata 0,01?

Jawab:
Hipotesis yang diuji :
H0 : 1 =2 = 3 =4 = 0
H’1 : sekurang-kurangnya ada i tidak sama dengan nol
Taraf signifikansi yang diambil 0,05 dan dengan
dk   k –1, N – k    4, 20 – 4    3,16  maka wilayah kritisnya adalah
F > 5,29
Perhitungan:
Perhatikan tabel berikut:
Konsentrasi
1 2 3 4
8,2 7,7 6,9 6,8
8,7 8,4 5,8 7,3
9,4 8,6 7,2 6,3
9,2 8,1 6,8 6,9
8,0 7,4 7,1
6,1
Jumlah 35,5 40,8 40,2 34,4 150,9
Jumlah
Kuadrat 315,93 333,42 271,3 237,24 1157,89
2

 
SSTotal  8, 22  8, 7 2   6,92  7,12 
150,9
20
 19,3495

 35,52 40,82 40, 22 34, 42  150,92


SSbetween        15, 462
 4 5 6 5  20
SSwithin  19,3495  15, 462  3,8875
7.16 Statistika Pendidikan 

Dari hasil di atas kita susun tabel anova sebagai berikut

Tabel Anova
Sumber Keragaman Jumlah Kuadrat df MS F
Antar Kelompok 15,46 3 5,15
21,21
Dalam Kelompok 3,89 16 0,21
Total 19,35

Karena F = 21,21 lebih besar dari 5,29, maka hipotesis nol ditolak. Artinya
minimal terdapat dua jenis pertumbuhan yang disebabkan oleh empat
konsentrat.

4. Asumsi-asumsi yang Berkaitan dengan Anova


Sebelumnya perlu diketahui bahwa ANOVA selain digunakan untuk
menguji perbandingan lebih dari dua kelompok, namun kita juga dapat
menggunakannya untuk pengujian perbandingan dua kelompok saling bebas
sebagaimana uji-t. Dalam kenyataannya, dengan dua sampel, F = t2. Untuk
membuktikannya, cobalah pengujian hipotesis dua rata-rata kelompok saling
bebas yang telah dibahas pada modul sebelumnya, dianalisis menggunakan
ANOVA. Kemudian bandingkan hasilnya.
Sebagaimana disebutkan di atas bahwa F = t2, dengan demikian asumsi-
asumsi yang mendasari analisis varians (ANOVA) sama dengan asumsi-
asumsi pada uji-t untuk sampel yang independen. Asumsi-asumsi tersebut
adalah sebagai berikut.
a. Populasi-populasi berdistribusi normal.
b. Varians-varians dari populasi homogen.
c. Pemilihan anggota-anggota dari suatu sampel adalah independen dari
pemilihan anggota-anggota sampel lainnya.
d. Sampel-sampel diambil secara acak dengan pengembalian.

Seperti juga dalam uji-t pada pengujian rata-rata kelompok saling bebas,
sedikit terpenuhinya syarat distribusi normal tidaklah mengganggu hasil
pengujian, secara khusus dapat benar untuk sampel yang semakin besar.
Tetapi, dengan populasi-populasi dengan kurva distribusinya yang miring,
ANOVA menghasilkan kesimpulan yang tidak akurat. Apabila ukuran
sampel-sampelnya kecil bahkan sangat kecil dan ada pertanyaan serius
tentang asumsi normalitas, maka salah satu alternatif yang dapat dilakukan
adalah menggunakan uji nonparametrik, yakni Uji Krukal-Wallis.
 MPDR5202/MODUL 7 7.17

Untuk asumsi kedua, yakni kehomogenan varians juga dapat diabaikan


apabila ukuran-ukuran sampel tiap kelompoknya sama. Keragaman atau
heterogenitas varians biasanya menjadi masalah hanya ketika
 terbesar
2
 10 terkecil
2
atau apabila ukuran-ukuran sampelnya berbeda. Untuk
itulah disarankan agar memilih ukuran-ukuran sampel yang sama pada
masing-masing kelompok atau perlakuan.
Asumsi ketiga, yakni sampel-sampel yang saling bebas, Anova yang
dibahas dalam modul ini tidak dapat dilakukan untuk eksperimen dengan
desain pengulangan (repeated) atas subjek-subjek yang sama dan tidak juga
bagi subjek-subjek yang dipasangkan yang ditempatkan pada kelompok-
kelompok perlakuan. Untuk analisis percobaan pengulangan, Anda dapat
mempelajarinya pada buku-buku tentang analisis desain percobaan.
Asumsi yang terakhir adalah masalah sampling, masalah ini cukup
merepotkan apalagi jika kita melakukan eksperimen atau percobaan dalam
bidang pendidikan. Sampling acak yang merupakan asumsi keempat ini
merupakan suatu premis daripada suatu persyaratan, cara ini memungkinkan
kita memperluas kesimpulan-kesimpulan terhadap populasi.

5. Uji Lanjutan ANOVA (Post Hoc)


Apabila hipotesis nol pada anova ditolak, maka paling sedikit terdapat
dua rata-rata yang berbeda atau ada pengaruh antar treatment. Misalkan kita
ingin mengetahui antar kelompok-kelompok mana saja yang rata-ratanya
berbeda. Untuk itulah kita perlu melakukan uji lanjutan ANOVA.
Hipotesis yang diuji pada uji lanjutan ANOVA hakikatnya sama dengan
uji perbandingan dua kelompok, yakni:

Ho : i   j  0 VS H a : i   j  0

Jika kelompok yang dibandingkan pada ANOVA ada 3, maka


banyaknya pasangan hipotesis yang diuji ada 3 buah. Secara umum
banyaknya hipotesis yang diuji dalam uji lanjutan ANOVA adalah C2k ,
dengan k menyatakan banyaknya kelompok pada ANOVA.
Ada beberapa cara yang biasa digunakan dalam menguji hipotesis
tersebut. Dalam modul ini hanya dibahas tiga metode (uji yang lainnya
silakan Anda mencarinya), yakni:
a. Fisher’s Least Significant Difference (LSD)
7.18 Statistika Pendidikan 

b. Tukey’s Honestly Significant Difference (HSD)


c. Scheffe’s Method

Dari kelima prosedur di atas, metode yang kelima, menurut Dowdy &
Wearden (1985), uji Tukey HSD merupakan uji yang moderat, sedangkan
Scheffe merupakan metode yang paling konservatif.
Pertama hitung xi  x j untuk i, j  1,2,3,, k dengan i  j dan
susunlah dalam tabel, kemudian lakukan pengujian sesuai dengan statitsitik
uji berikut ini.

a. Fisher’s Least Significant Difference


Prosedur perbandingan multiple R.A Fisher atau sering juga dikenal
dengan atau least significant difference (LSD) atau sering juga disebut dan
beda nyata kecil (BNT). Pada dasarnya uji ini berbasis pada uji-t. Jika
kelompok-kelompok perlakuan mempunyai ukuran yang sama, misalkan n,
dan misalkan rata-rata dua sampel yang dibandingkan adalah X1 dan X 2 ,
maka uji statistik yang digunakan adalah

X1  X 2 X1  X 2
t 
2 2
s s 2 s 2p

p p

n n n

Dengan s 2p merupakan varians sampel gabungan (pooled). Uji Fisher untuk


selisih X i  X j adalah
Tolak hipotesis nol jika:
2 MSe
xi  x j  t(  , k ( n 1))
,
n 2

Jika n (banyak subjek tiap kelompoknya) berbeda, maka aturannya sedikit


berbeda, yakni
MSe MSe
xi  x j  t(  ,( N  k )) 
2
ni nj

Perlu diketahui bahwa uji Fisher ini memiliki kekurangan, yakni


manakala hipotesis nol dalam uji ANOVA ditolak, tetapi uji Fisher gagal
 MPDR5202/MODUL 7 7.19

mendeteksi perbedaan-perbedaan yang terjadi secara multiple-nya. Dalam hal


ini menurut Dowdy & Wearden (1991) kita tidak dapat menggunakan uji
Fisher.

b. Tukey’s Honestly Significant Difference


Model Tukey HSD menurut Dowdy & Wearden (1991) lebih
konservatif. Prosesnya menggunakan perbedaan kritis secara tunggal.
Tolak hipotesis nol jika

MSe
xi  x j  q( , r , k ( n 1))
n

atau dalam buku Minium, dkk (1993) ditulis dengan

MSe
HSD  q ,
n

q dapat dilihat pada tabel F dengan dfw , k, dan .


Untuk kasus banyak subjek pada tiap kelompoknya berbeda, maka n
menggunakan rata-rata harmonik dari ni, dengan i = 1, 2, 3, ..., k, yakni
k
n
1 1 1
  
n1 n2 nk

Dengan titik kritis, tolak Ho, jika

MSe
xi  x j  q( , r , N  k ))
n

Dengan r menyatakan rentangan pada setiap nilai mutlak selisih rata-ratanya,


dan q dapat dilihat dari tabel Newman-Keuls’.

c. Scheffe’sMethode
Untuk membandingkan dua rata-rata menurut metode ini adalah sebagai
berikut.
Tolak hipotesis nol jika:

2MSe
xi  x j  (k  1) F( ;( k 1, k ( n 1)
n
7.20 Statistika Pendidikan 

atau jika ukuran sampel kedua kelompok berbeda, digunakan

MSe MSe
xi  x j  (k  1) F( ;( k 1, N  k ) 
ni nj

Metode lebih konservatif, artinya memerlukan perbedaan yang cukup besar


untuk dapat menolak hipotesis nol. Untuk lebih jelasnya kita perhatikan
Contoh 7.1 di atas.

Contoh 7.3
Pada contoh 7.1 sudah dibahas bahwa hipotesis nol pada uji ANOVA ditolak,
dengan demikian minimal ada dua mean dari kelima kelompok tersebut
berbeda. Untuk itu kita akan melakukan pengujian lebih lanjut, perbandingan
mean antar kelompok mana saja yang berbeda.
Langkah pertama dalam melakukan uji posthoc adalah sama dengan uji
hipotesis lainnya, yakni menyusun hipotesis yang diujinya. Karena ada lima
kelompok yang dibandingkan maka uji lanjutannya ada kombinasi 2 dari 5,
yakni
 5 5! 5  4  3  2 1 
 C2    10 
  5  2 ! 2! (3  2 1)  (2 1) 
Jadi ada 10 buah hipotesis yang diuji. Hipotesis-hipotesis tersebut adalah

H0 : a  b VS H1 : a  b
H0 : a  c VS H1 : a  c
H0 : a  d VS H1 : a  d
H0 : a  e VS H1 : a  e
H0 : b  c VS H1 : b  c
H0 : b  d VS H1 : b  d
H0 : b  e VS H1 : b  e
H0 : c  d VS H1 : c  d
H0 : c  e VS H1 : c  e
H0 : d  e VS H1 : d  e
 MPDR5202/MODUL 7 7.21

Langkah berikutnya adalah menyusun tabel X i  X j dengan terlebih dahulu


mengurutkan rata-rata kelompok-kelompok secara terurut dari yang terkecil
ke yang terbesar.
X D  2,8 X C  4,0 X A  5, 2 X E  6,6 X B  7,8

XD XC XA XE XB
XD 1,2 2,4 3,8 5,0
XC 1,2 2,6 3,8
XA 1,4 2,6
XE 1,2

1) Least Significant Difference (LSD)


Dari tabel ANOVA Contoh 7.1 diketahui bahwa MSe = 2,88, dan
dengan memisalkan  = 0,05, maka diperoleh

2 MSe 2(2,88)
t(  , k ( n 1))  t0,025(20)  2, 24
2
n 5
Dengan demikian, kita menolak Ho apabila X i  X j  2, 24 . Dari tabel
selisih mutlak di atas, maka diperoleh hasilnya adalah sebagai berikut.

XD XC XA XE XB
XD 1,2 2,4* 3,8* 5,0*
XC 1,2 2,6* 3,8*
XA 1,4 2,6*
XE 1,2
*) menunjukkan ada perbedaan yang berarti pada taraf nyata 0,05.
Dari tabel di atas, maka kelompok-kelompok yang berbeda adalah
 D dengan A
 D dengan E
 D dengan B
 C dengan E
 C dengan B
 A dengan B
7.22 Statistika Pendidikan 

Jadi dari 10 hipotesis yang diuji, sebanyak 6 hipotesis ditolak dan 4


hipotesis diterima.
2) Tukey HSD
Kita masih menggunakan tabel selisih nilai mutlak di atas. Dengan
 = 0,05 dan dfw = 20, k = 5, dari tabel Studentized Range Statistic
diperoleh q = 4,23. Dan selanjutnya dapat kita hitung
MSe 2,88
HSD  q  4, 23  3, 21
n 5
Dengan demikian, tolak hipotesis nol apabila X i  X j  3, 21 . Dan
hasilnya pengujian dapat dilihat pada tabel berikut.

XD XC XA XE XB
XD 1,2 2,4 3,8* 5,0*
XC 1,2 2,6 3,8*
XA 1,4 2,6
XE 1,2
*) berbeda secara berarti pada taraf nyata 0,05

Jadi menurut hasil uji Tukey HSD, kelompok-kelompok yang berbeda


adalah:
 D dengan E
 D dengan B
 C dengan B

Hasil ini memperlihatkan bahwa Tukey HSD lebih kuat dibandingkan


dengan LSD.

3) Scheffe Method
Dengan mengambil  = 0,05, dengan dk = ((5 -1),5(5-1)) = (4,20), dari
tabel Fisher (F) diperoleh F0,05; (4,20) = 3,098

2MSe 2(2,88)
(k  1) F( ;( k 1, k ( n 1)  4(3, 098   3,52 1, 07   3, 78
n 5
 MPDR5202/MODUL 7 7.23

Jadi tolak Ho jika X i  X j  3, 78 . Dan hasilnya pengujian dapat dilihat


pada tabel berikut.
XD XC XA XE XB
XD 1,2 2,4 3,8* 5,0*
XC 1,2 2,6 3,8*
XA 1,4 2,6
XE 1,2
*) berbeda secara berarti pada taraf nyata 0,05

Jadi hasil uji Scheffe Method sama dengan Tukey HSD, kelompok-
kelompok yang berbeda adalah :
 D dengan E
 D dengan B
 C dengan B

6. Perhitungan ANOVA dengan Program SPSS


Kita kembali pada Contoh 7.1 di atas. Input data tersebut dalam data
editor, misalkan kita beri judul hasil ulangan siswa dengan ”HASIL”, dan
Model Pembelajaran dengan ”MODEL”, seperti berikut.
7.24 Statistika Pendidikan 

Kemudian lakukan langkah-langkah


a. Pilih Analyze > Comparemean > anova one way, seperti berikut

b. Klik variabel HASIL, kemudian pindahkan ke Dependent List dengan


klik tanda panah.
c. Klik variabel MODEL, kemudian pindahlah ke Faktor.
 MPDR5202/MODUL 7 7.25

d. Jika ingin sekaligus melakukan analisis lanjutan anova klik POST HOC,
maka akan muncul pilihan sebagai berikut

1) Untuk keseragaman pilih LSD dan Scheffe


2) Klik kontinu, kemudian klik OK, hasilnya dapat dilihat pada layar
output sebagai berikut.
7.26 Statistika Pendidikan 

Tabel Anova
ANOVA HASIL

Sum of Mean
Df F Sig.
Squares Square
Between Groups 79.440 4 19.860 6.896 .001
Within Groups 57.600 20 2.880
Total 137.040 24

Cobalah bandingkan hasil tersebut dengan hasil yang diselesaikan secara


manual pada Contoh 7.1. Hasilnya sama, dan ada tambahan satu kolom,
dengan judul kolom sig. Keputusan untuk hasil di atas dapat dilakukan
dengan cara:
1) Membandingkan F hitung = 6,896 dengan F tabel (tentu dengan
memilih taraf signifikansi tertentu).
2) Membandingkan antara nilai pada kolom Sig. dengan taraf
signifikansi. Nilai Sig. merupakan luas daerah sebelah kanan dari
kurva distribusi atau merupakan nilai peluang menolak hipotesis
nol, jika hipotesis nol benar. Keputusan yang diambil:
(a) Tolak hipotesis nol jika nilai probabilitas < .
(b) Terima hipotesis nol jika nilai probabilitas > .
Karena nilai probabilitas dari F hitung = 6,896 adalah 0,001 <
0,005, maka hipotesis nol ditolak pada taraf nyata 0,05. Artinya
minimal ada dua mean yang berbeda di antara 5 kelompok
tersebut.
e. Langkah berikutnya adalah analisis untuk lanjutan ANOVA. Karena
hipotesis nol ditolak, sebagaimana di atas, maka jika ingin diketahui 2
kelompok mana saja yang berbeda dapat dilihat pada hasil sebagai
berikut.
f. Dari hasil perhitungan LSD, hasilnya adalah sebagai berikut
 MPDR5202/MODUL 7 7.27

MultipleComparisons
LSD
(I) (J) MeanDifference Std. 95% Confidence Interval
Sig.
MODEL MODEL (I-J) Error LowerBound UpperBound
Model A Model B -2.60000* 1.07331 .025 -4.8389 -.3611
Model C 1.20000 1.07331 .277 -1.0389 3.4389
Model D 2.40000* 1.07331 .037 .1611 4.6389
Model E -1.40000 1.07331 .207 -3.6389 .8389
Model B Model A 2.60000* 1.07331 .025 .3611 4.8389
Model C 3.80000* 1.07331 .002 1.5611 6.0389
Model D 5.00000* 1.07331 .000 2.7611 7.2389
Model E 1.20000 1.07331 .277 -1.0389 3.4389
Model C Model A -1.20000 1.07331 .277 -3.4389 1.0389
Model B -3.80000* 1.07331 .002 -6.0389 -1.5611
Model D 1.20000 1.07331 .277 -1.0389 3.4389
Model E -2.60000* 1.07331 .025 -4.8389 -.3611
Model D Model A -2.40000* 1.07331 .037 -4.6389 -.1611
Model B -5.00000* 1.07331 .000 -7.2389 -2.7611
Model C -1.20000 1.07331 .277 -3.4389 1.0389
Model E -3.80000* 1.07331 .002 -6.0389 -1.5611
Model E Model A 1.40000 1.07331 .207 -.8389 3.6389
Model B -1.20000 1.07331 .277 -3.4389 1.0389
Model C 2.60000* 1.07331 .025 .3611 4.8389
Model D 3.80000* 1.07331 .002 1.5611 6.0389
*. The meandifferenceissignificantatthe 0.05 level.

Kita cukup melihat tanda bintang yang ada pada kolom mean – diffrenece (I – J) atau
kolom Sig. Keputusannya sama dengan di atas, yakni :
- Tolak Ho jika probabilitas <
- Terima Ho jika probabilitas >.
Dari tabel di atas terlihat kelompok-kelompok yang berbeda adalah:
A dengan B
A dengan D
B dengan C
B dengan D
C dengan E
D dengan E
hasilnya sama dengan perhitungan di atas. Nah cobalah Anda lihat bagaimana jika
kita memilih metode Scheffe atau Tukey HSD.
7.28 Statistika Pendidikan 

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!

1) Empat laboratorium digunakan untuk mengerjakan analisis kimia.


Contoh dari bahan yang sama dikirim ke keempat laboratorium tersebut
untuk menentukan apakah secara rata-rata keempatnya memberikan hasil
yang sama. Hasil analisis dari keempat laboratorium tersebut adalah
sebagai berikut:

Laboratorium
A B C D
58,7 62,7 55,9 60,7
61,4 64,5 56,1 60,3
60,9 63,1 57,3 60,9
59,1 59,2 55,2 61,4
58,2 60,3 58,1 62,3

Uji, apakah keempat laboratorium tersebut menghasilkan kesimpulan


yang tidak berbeda, gunakan taraf nyata 0,05.

2) Tiga kelas Statistika Dasar diberikan oleh tiga dosen. Nilai akhirnya
tercatat sebagai berikut:

A 73 89 82 43 80 73 66 60 45 93 36 77
Dosen B 88 78 48 91 51 85 74 77 31 78 62 76 96 80 56
C 68 79 56 91 71 71 87 41 59 68 53 79 15

Uji, apakah ada selisih yang nyata di antara nilai rata-rata yang diberikan
oleh ketiga dosen tersebut! Gunakan taraf nyata 0,05!

3) Dalam edisi karya tulis yang sama dari tiga penulis fiksi detektif, jumlah
kalimat per halaman secara acak pada halaman-halaman yang terpilih
dari masing-masing karya adalah sebagai berikut:
 MPDR5202/MODUL 7 7.29

Pengarang Banyak Kalimat

C.E. Vulliamy 13 27 26 22 26

Ellery Queen 43 35 47 32 31 37

Helen McCloy 37 37 26 26 33 33 54

Gunakan analisis varian untuk menentukan apakah beralasan untuk


menduga ada perbedaan dalam rata-rata panjang kalimat antara
pengarang-pengarang tersebut. Jika ada gunakan uji lanjutan untuk
menganalisis perbedaan antar pengarang!

Petunjuk Jawaban Latihan

1) Hipotesis yang diuji adalah:


H0 : 1  2  3  4
H1 : Minimal ada dua rata-rata yang berbeda
Hasil perhitungan dapat dilihat pada tabel ANOVA berikut

Tabel Anova
Sum of Square Mean
Sumber dk F
(SS) Square (MS)
Antar kelompok 85,925 3 28,642 13,330
Dalam Kelompok 34,380 16 2,149
Total 120,305 19

Dari tabel Fisher dengan taraf signifikansi 0,05 dan derajat bebas (3, 16)
diperoleh Ftabel = 3,24 yang lebih kecil daripada 13,330. Hasil ini
memperlihatkan bahwa hipotesis nol ditolak. Artinya minimal ada dua
rata-rata yang berbeda dari keempat rata-rata hasil pengujian ke empat
kelompok tersebut.
2) Hipotesis yang diuji adalah:
H0 : 1  2  3
H1 : Minimal ada dua rata-rata yang berbeda
Hasil perhitungan dapat dilihat pada tabel ANOVA berikut
7.30 Statistika Pendidikan 

Tabel Anova
Sum of Square Mean
Sumber dk F
(SS) Square (MS)
Antar kelompok 335,353 2 167,676 0,465
Dalam Kelompok 13349,747 37 360,804
Total 13685,100 39

Dari tabel Fisher dengan taraf signifikansi 0,05 dan derajat bebas (2, 37)
diperoleh Ftabel = 3,255 yang lebih besar daripada 0,465. Hasil ini
memperlihatkan bahwa hipotesis nol diterima. Artinya tidak ada
perbedaan nilai mahasiswa yang berarti dari ketiga dosen tersebut.
3) Hipotesis yang diuji adalah
H0 :  1   2   3
H1 : Minimal ada dua rata-rata yang berbeda
Hasil perhitungan dapat dilihat pada tabel ANOVA berikut

Tabel Anova
Sum of Square Mean
Sumber dk F
(SS) Square (MS)
Antar kelompok 669,343 2 334,671 5,749
Dalam Kelompok 873,157 15 58,749
Total 1542,500 17

Dari tabel Fisher dengan taraf signifikansi 0,05 dan derajat bebas (2, 15)
diperoleh Ftabel = 3,68 yang lebih kecil daripada 5,749. Hasil ini
memperlihatkan bahwa hipotesis nol ditolak. Artinya minimal ada dua
pengarang yang hasil karyanya menuliskan banyak kalimat yang berbeda
pada setiap halamannya.

R A NG KU M AN

1. Meski namanya analisis varians, tetapi uji ini benar-benar menguji


perbandingan rata-rata.
2. Analisis varians dapat dipandang sebagai perluasan dari uji
perbandingan dua kelompok, khususnya uji-t.
3. Analisis varians memanfaatkan jumlah kuadrat sebagai satuan
pengukuran, yakni SStotal, SSbetween, dan SSwithin.
 MPDR5202/MODUL 7 7.31

4. SSbetween merupakan ukuran variasi rata-rata sampel-sampel antar


kelompok-kelompok, sedangkan SSwithin merupakan ukuran variasi
di dalam skor-skor individual dari kelompok-kelompok.
5. Analisi varians memeriksa perbandingan antara mean square
between dengan mean square within. Dan perbandingan ini
mengikuti sebaran distribusi F.
6. Daerah penolakan dari pengujian hipotesisnya adalah tolak Ho jika
F hitung lebih besar dari F tabel pada taraf nyata yang dipilih.
7. Ketika hipotesis nol ditolak, maka dapat dilanjutkan dengan uji Post
Hoc. Uji ini digunakan untuk mengetahui lebih lanjut kelompok-
kelompok mana saja yang berbeda. Terdapat banyak uji yang
digunakan. Dalam memilihnya, kita perhatikan dulu kehomogenan
variannya. Berulah kita memilih salah satu uji dalam kedua
kelompok tersebut.

TES F OR M AT IF 1

Selesaikan soal-soal berikut!

1) Dalam penulisan hipotesis alternatif pada uji ANOVA bentuknya tidak


bisa dituliskan sebagai  1   2   k . Mengapa? Berikan ilustrasi
seperlunya!
2) Dalam analisis varians melalui uji F, mengapa kita hanya menggunakan
daerah pada ekor sebelah kanan dari distribusi F?
3) Sebuah penelitian dilakukan untuk menentukan penyebab berkurangnya
hasil dalam suatu proses kimia. Telah diketahui bahwa berkurangnya
hasil itu terjadi dalam cairan biangnya; artinya, bahan yang terbuang
ketika penyaringan. Diduga campuran yang berbeda tetapi dari bahan
asal yang sama dapat memperkecil proses kehilangan tadi. Data berikut
merupakan persentase kehilangan untuk 4 campuran yang ditentukan
lebih dulu.
Campuran
1 2 3 4
25,6 25,2 20,8 31,6
24,3 28,6 26,7 29,8
27,9 24,7 22,2 34,3

a. Tentukan SSBetween, SSWinthin dan SSTotal. Apakah SSTotal = SSBetween +


SSWinthin ?
7.32 Statistika Pendidikan 

b.
Tentukanlah dkbet, dkwithin, dan dktotal!
Tentukanlah S2b , S2W
c.
Ujilah hipotesis nol bahwa 1 = 2 = 3 = 4 pada  = 0,05! Berikan
d.
Kesimpulan!
4) Kita bekerja dengan analisis anova satu jalur terhadap skor performance
dari lima kelompok yang terdiri dari masing-masing delapan kasus dan
hasilnya menunjukkan signifikansi. Dalam analisis ini sW2  18, 2 dan
rata-rata masing-masing kelompoknya adalah X1  14,5; X 2  11,5;
X 3  19,0; X 4  18,1dan X 5  5 . Gunakanlah uji LSD, Tukey HSD, dan
Scheffe dengan menggunakan  = 0,05 untuk menguji perbandingan
antar kelompoknya! Berikan kesimpulan!
5) Suatu analisis varians dilakukan untuk membandingkan berbagai media
pembelajaran dengan tabel ANOVA sebagai berikut

Sumber Dk SS MS
Antar Kelompok …………….. …………. 598
Dalam Kelompok 20 3600 ………

Dan rata-rata skor masing-masing kelompok adalah sebagai berikut.


Kelompok C A D B E
Rata-rata 60 80 82 85 93

a. Lengkapi tabel ANOVA di atas!


b. Apakah uji Tukey HSD dapat digunakan untuk pengujian rata-rata
antar kelompok? Jika ya, lakukan pengujian, dan jika tidak berikan
alasan!

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 20. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut
untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan
Belajar 1.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal
 MPDR5202/MODUL 7 7.33

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang
belum dikuasai.
7.34 Statistika Pendidikan 

Kegiatan Belajar 2

Anova Dua Arah

P ara peneliti sering tertarik dalam mengkombinasikan dua jenis atau tipe
perlakuan. Sebagai contoh, sebuah peneliti tentang penurunan berat
badan melalui berbagai kombinasi diet dengan berbagai jenis olah raga
jogging pada setiap hari yang dilakukan oleh peserta diet. Misalkan
kombinasi dari kedua jenis tersebut adalah sebagai berikut.

Diet
Protein Lemak Karbohidrat
Normal
tinggi tinggi tinggi
Jogging

0 mil
1 mil
2 mil

Desain penelitian di atas dibedakan melalui pengelompokan melalui dua


perlakuan, yakni diet dan jogging yang dipandang sebagai pengaruh luar
(extraneous). Subjeknya dipilih secara acak pada masing-masing 12
kombinasinya. Dan kita dapat melihat pengaruh kombinasi dari diet dan
jogging secara terpisah dan bersama-sama.
Set dari perlakuan yang diuji disebut faktors atau main effects, dan
perbedaan pada tiap treatment disebut levels. Untuk kasus di atas, maka
faktornya adalah Diet dan jogging. Pada diet terdapat 4 level, dan pada
jogging terdapat 3 level. Sebagai catatan, level tidak perlu kuantitatif; diet
sebagaimana contoh di atas adalah makanan yang mempunyai kalori sama
(tetapi berbeda proporsinya sesuai kelompoknya). Desain yang demikian
disebut desai dua faktor, atau lebih tepatnya desain faktorial a  b . Untuk
contoh di atas, desainnya adalah desain faktorial 4  3 .
Dalam desain faktorial, faktor-faktor mungkin perlakuan juga berbentuk
klasifikasi keberadaan populasi atau menginginkan analisis yang lebih teliti.
Terdapat berbagai kemungkinan dari faktor-faktor pada desain faktorial,
mungkin kuantitatif atau kualitatif, mungkin juga berbentuk perlakuan dan
klasifikasi. Untuk lebih jelasnya perhatikan contoh-contoh berikut:
 MPDR5202/MODUL 7 7.35

1. Dalam jogging, contoh di atas, kedua faktor adalah perlakuan, faktor diet
berbentuk kualitatif, sedangkan faktor jogging merupakan perlakuan
kuantitatif.
2. Dalam perubahan tingkat gula darah yang diukur melalui berbagai dosis
dari vitamin C yang dikombinasikan dengan berbagai dosis aspirin,
kedua faktornya (vitamin C dan aspirin) merupakan perlakuan yang
kuantitatif.
3. Jika penjualan produk tertentu dicatat dalam berbagai Standard
Metropolitan Statistical Area dan pada berbagai tipe rangkaian
penyimpanan, maka faktornya adalah area dan rangkaian. Keduanya
klasifikasi, artinya kedua faktornya adalah klasifikasi kualitatif.
4. Jika masa pakai ban yang ditentukan oleh perusahaan produsennya dan
diukur berdasarkan permukaan jalan yang berbeda, maka faktor
perusahaan merupakan klasifikasi kualitatif, sedangkan permukaan jalan
merupakan perlakuan kualitatif.

Hal penting yang perlu diperhatikan dalam desain ini adalah randomisasi
(randomization). Dalam contoh di atas, jogging dan vit C-aspirin, sampel
harus diambil secara acak pada masing-masing kombinasi level. Dalam
contoh penjualan, penyimpanan harus dipilih secara acak dari rangkaian
penyimpanan dalam area. Dan dalam contoh kasus pengujian ban di atas, ban
dari perusahaan harus dipilih secara acak untuk berbagai tipe jenis jalan.
Interaksi merupakan pengaruh tambahan yang memperlihatkan pengaruh
kombinasi dari level-level yang ada. Sebagai contoh, kombinasi dari level
diet dan level jogging mungkin menghasilkan penurunan berat badan sebagai
pengaruh dari kedua level tersebut secara bersamaan. Dalam hal ini, analisis
data harus dilakukan untuk interaksi-interaksi yang mungkin, penelitian harus
mengamati lebih dari subjek pada setiap kombinasinya.
Secara geometrik, tidak adanya interaksi diperlihatkan dengan garis-
garis yang paralel ketika rata-rata dari variabel respons digambar untuk
berbagai level kombinasi faktor-faktornya. Adanya interaksi ditandai dengan
adanya deviasi atau penyimpangan dari kesejajaran garis-garisnya. Untuk
mengilustrasikan ada atau tidak adanya interaksi dapat dilihat pada gambar
berikut.
7.36 Statistika Pendidikan 

Gambar 7.3
Pola Perbedaan dan Interaksi Antara 2 Faktor
 MPDR5202/MODUL 7 7.37

A. PROSEDUR PENGOLAHAN DATA

Misalkan segugus pengamatan dapat diklasifikasikan menurut kriteria


dalam bentuk baris dan kolom. Misalkan susunan tersebut terdiri dari r baris
dan c kolom, dan n pengamatan pada setiap selnya, seperti yang terlihat pada
tabel berikut:
Tabel 7.3
Penyajian Data untuk ANOVA Dua Jalur

Kolom Nilai
Baris Total
1 2 … C Tengah
x111 x121 … x1c1
x112 x122 … x1c2
1 . . . T1.. x1..
. . .
. . .
x11n x12n … x1cn
x211 x221 … x2c1
x212 x222 x2c2
2 . . . T2.. x2..
. . .
. . .
x21n x22n x2cn
. . . . . . .
. . . . . . .
. . . . . . .
xr11 xr21 … xrc1
xr12 xr22 xrc2
r . . . Tr.. xr..
. . .
. . .
xr1n xr2n Xrcn
Total T.1. T.2. … T.c. T…
Mean x.1. x.2. x.c. x...

Setiap pengamatan dapat ditulis dalam bentuk xijk  ij   ijk , k  1, 2, ... n;
j  1, 2, ..., c; dan i  1, 2, ..., r . Dengan cara yang sama sebagaimana
anova 2 jalur tanpa interaksi, model di atas dapat ditulis dalam bentuk
7.38 Statistika Pendidikan 

xijk     i  i   ij   ijk

i  1, 2, , a
j  1, 2, , b
k  1, 2, , n

Dengan :
 : mean keseluruhan dalam percobaan
i : pengaruh dari level ke-i dari faktor A; level-levelnya mungkin
ditetapkan secara acak.
j : pengaruh dari level ke-j dari faktor B;level-level mungkin
ditetapkan secara acak.
 ij : pengaruh interaksi antar level ke-i dari faktor A dan level ke-j
dari faktor B. perlu diketahui bahwa   satu simbol, bukan
perkalian antara  dengan .
 ijk : pengaruh acak dari sampling dan  ijk : IND (0,2).

Dengan demikian hipotesis yang diuji untuk model di atas adalah


sebagai berikut:
1. H 0 : α1 = α2 = α3 = … = αr = 0
H1 : sekurang-kurangnya satu αi tidak sama dengan nol
2. H 0 : 1 = 2 = 3 = … = c = 0
H1 : sekurang-kurangnya satu  j tidak sama dengan nol
3. H 0 : ()11 = (α )12 = (α )13 = … = (α )rc = 0
H1 : sekurang-kurangnya satu (α )ij tidak sama dengan nol

Pandang bahwa

xijk  x...  ( xi..  x... )  ( x. j.  x... )  ( xij .  xi..  x. j .  x... )  ( xijk  xij . )

Analog pada kasus anova satu jalur, maka diperoleh persamaan Identitas
sebagai berikut:
 MPDR5202/MODUL 7 7.39

  x  x...   cn  xi..  x...   rn  x. j.  x...  


r c n r c
2 2 2
ijk
i 1 j  i k 1 i 1 j 1

n  xij .  xi..  x. j .  x...     xijk  xij . 


r c r c n
2 2

i 1 j 1 i 1 j 1 k 1

JKT = JKB + JKK + JK(BK) + JKG


JKT : Jumlah Kuadrat Total
JKB : Jumlah Kuadrat Bagi Mean Baris
JKK : Jumlah Kuadrat Bagi Mean Kolom
JKG : Jumlah Kuadrat Galat
JKT    xijk  x ...
r c n
2

i 1 j 1 k 1
r
JKB  cn  xi..  x... 
2

i 1

JKK  rn  x. j .  x... 


c
2

j 1

JK ( BK )  n  xij .  xi..  x. j .  x... 


r c
2

i 1 j 1

JKG    xijk  xij . 


r c n
2

r 1 j 1 k 1

Atau

r c n T2
JKT     xijk 2  ...
i  1 j  1 k 1 rcn
r

T 2
i ..
T...2
JKB  i 1

cn rcn
c

T
j 1
2
. j.
T...2
JKK  
rn rcn
r c r c

 T
i 1 j 1
2
ij .  Ti..2 T
j 1
2
. j.
T...2
JK ( BK )   i 1
 
n cn rn rcn
JKG  JKT  JKB  JKK  JK ( BK )
7.40 Statistika Pendidikan 

Banyaknya derajat bebas yang diuraikan menurut identitas


rcn  1   r  1   c  1   r  1 c  1  rc  n  1
Dengan membagi setiap jumlah kuadrat pada masing-masing ruas kanan dari
identitas jumlah kuadrat di atas dengan derajat bebasnya masing-masing,
maka diperoleh empat nilai dugaan berikut.
SS SS SSrows  Columns SSWithin
SR2  rows , sC2  columns , sR2C  , s2 
r 1 c 1  r  1 c  1 W rc  n  1
Bagi  2 yang semuanya merupakan penduga tak bias bila hipotesisnya
benar.
Untuk menguji hipotesis H 0 bahwa pengaruh baris semuanya sama, maka
dihitung rasio
S R2
fR 
SW2
yang merupakan nilai bagi variabel acak FR yang mempunyai sebaran F
dengan derajat bebas  r  1 dan rc  n –1 bila H 0 benar. Hipotesis nol
akan ditolak pada taraf nyata  bila FR  F , r 1, rc ( n 1) .
Begitu pula untuk menguji hipotesis H 0 pengaruh kolom semuanya
sama, dihitung rasio
S C2
fC 
SW2
yang merupakan nilai bagi variabel acak FR yang mempunyai sebaran F
dengan derajat bebas  c  1 dan rc  n –1 bila H 0 benar. Hipotesis nol
akan ditolak pada taraf nyata  bila FR  F , c 1, rc ( n 1) .
Terakhir untuk menguji hipotesis H0 bahwa pengaruh interaksi
semuanya sama, kita menghitung rasio
S R2C
f R C 
SW2
yang merupakan nilai bagi variabel acak FRC yang mempunyai sebaran F
dengan derajat bebas  r  1 c  1 dan rc  n –1 bila H0 benar. Hipotesis
nol akan ditolak pada taraf nyata  bila FR  F , r 1 c 1, rc ( n 1) . Adanya suatu
interaksi dalam suatu percobaan dapat membunyikan atau menutupi beda
yang nyata antar pengaruh baris atau pengaruh kolom. Karena alasan inilah
 MPDR5202/MODUL 7 7.41

maka setiap uji yang menghasilkan penerimaan hipotesis tersebut dianggap


tidak sah bila interaksi nyata.
Untuk memudahkan perhitungan, jumlah kuadrat-jumlah kuadrat di atas
disusun dalam tabel anova sebagai berikut.

Tabel 7.4
Tabel ANOVA Dua Jalur

Sumber Jumlah Kuadrat Derajat Kuadrat F hitung


Keragaman Bebas Tengah
Baris (rows) SSRows r–1 SSRows S R2
SR2  FR 
r 1 SW2
Kolom (columns) SSClomuns c–1 SSColumns SC2
SC2  FC 
c 1 SW2
Interaksi SSRows × Columns (r-1)(c-1) SS Rosw  Columns S R2C
(Rows×Columns) S R2C  FRC 
c 1 SW2
Dalam Sel SSWithin rc(n-1) SSWithin
(WithinCells) sW2 
rc(n  1)
Total JKT rcn– 1

Contoh 7.4
Data berikut adalah nilai akhir yang dicapai 5 siswa dalam penyelesaian
pemecahan masalah yang diberikan dalam proses bimbingan individual yang
dilakukan melalui 4 model berbeda pada tiga kelompok siswa berdasarkan
kelas, yakni kelas IV, V, dan VI.

Model Pembinaan
Kelas
A B C D
IV 2 4 3 1
1 2 1 1
4 3 6 6
V
5 3 7 5
6 8 7 5
VI
4 8 8 6

Gunakan taraf nyata 0,05 untuk menguji hipotesis berdasarkan model, kelas,
dan interaksi antara model dan kelas!
7.42 Statistika Pendidikan 

Jawab:
Hipotesis yang diuji dari soal di atas adalah:
1. H0: Tidak ada perbedaan kemampuan pemecahan masalah siswa
berdasarkan kelas.
2. H0: Tidak ada perbedaan kemampuan pemecahan masalah siswa dalam
model pembinaan
3. H0: Tidak ada interaksi antara kelas dan model pembinaan terhadap
kemampuan pemecahan masalah siswa.

Dari data yang ada dapat dihitung hasil sebagai berikut:

Model Pembinaan
Kelas Total
A B C D
2 4 3 1
IV 15
1 2 1 1
4 3 6 6
V 39
5 3 7 5
6 8 7 5
VI 52
4 8 8 6
Total (KOLOM) 22 16 15 24 106

Dari tabel di atas, maka diperoleh:


SSTotal  127,83
SS Rows  88, 08
SSColumn  9,83
SS Rowscolumns  20,92
SS within  9

Silahkan Anda periksa kembali!


Dari jumlah kuadrat di atas, maka diperoleh tabel Anova berikut.
Sumber SS df S2 F F (0,05)
Kelas 88.08 2 44.04 58.72 5.14
Model 9.83 3 3.28 4.37 3.49
Model × Kelas 20.92 6 3.49 4.65 3.00
Within (error) 9.00 12 0.75
Total 127.83 23
 MPDR5202/MODUL 7 7.43

Dari hasil di atas, maka


1. Hipotesis nol yang menyatakan “Tidak ada perbedaan kemampuan
pemecahan masalah siswa berdasarkan kelas” ditolak. Dengan demikian,
minimal ada dua kelompok kelas dari ketiga kelas tersebut berbeda.
2. Hipotesis nol yang menyatakan “Tidak ada perbedaan kemampuan
pemecahan masalah siswa dalam model pembinaan” ditolak. Dengan
demikian minimal ada dua kelompok pembinaan yang berbeda.
3. Hipotesis yang menyatakan “Tidak ada interaksi antara kelas dan model
pembinaan terhadap kemampuan pemecahan masalah siswa” ditolak.
Dengan demikian ada interaksi antara kelas dan model pembinaan
terhadap kemampuan pemecahan masalah.

Untuk mengetahui kelas mana yang berbeda, model pembinaan mana


yang berbeda Anda dapat melakukan uji lanjutan pasca anova, seperti yang
dijelaskan pada Kegiatan Belajar 1, silakan Anda untuk mencobanya!

Untuk selanjutnya, kita hitung kembali contoh di atas dengan


menggunakan SPSS. Ikuti langkah-langkah berikut.
1. Input data seperti pada anova dengan judul kolom pemecahan, model,
dan kelas. Untuk model pilih nominal dengan kategori 1 : model
pembinaan A, 2 : model pembinaan B, 3 : model pembinaan C, dan 4 :
model pembinaan 4. Begitu juga dengan kelas, 1 : kelas IV, 2 kelas V,
dan 3 : kelas VI.
7.44 Statistika Pendidikan 

2. Kemudian ikuti langkah-langkah berikut:


a. Analyze > General Linear Model > Univariate.
b. Pindahkan Pemecahan ke dalam Dependent Box
c. Pindahkan Model dan Kelas ke kotak Fixed Faktor(s), seperti yang
terlihat pada gambar berikut.

d. Klik dan pindahkan kelas ke Horizontal dan model ke Separate


Lines, dan klik juga Add. Kemudian klik kontinu
 MPDR5202/MODUL 7 7.45

e. Pilih Options dan Cheklis Descriptive Statistics, Esimates of


effectsize, dan Homogenity Tests, dan Klik Continu.

f. Klik OK, dan lihat pada monitor ouput

3. Hasil outputnya terlihat seperti berikut (tidak semua ditampilkan)

Tests of Between-Subjects Effects


Descriptive Statistics
Dependent Variabel: Pemecahan Masalah
Kelas Model Pembinaan Mean Std. Deviation N
Kelas IV Model Pembinaan A 1.5000 .70711 2
Model Pembinaan B 3.0000 1.41421 2
Model Pembinaan C 2.0000 1.41421 2
Model Pembinaan D 1.0000 .00000 2
Total 1.8750 1.12599 8
Kelas V Model Pembinaan A 4.5000 .70711 2
Model Pembinaan B 3.0000 .00000 2
Model Pembinaan C 6.5000 .70711 2
Model Pembinaan D 5.5000 .70711 2
Total 4.8750 1.45774 8
Kelas VI Model Pembinaan A 5.0000 1.41421 2
Model Pembinaan B 8.0000 .00000 2
Model Pembinaan C 7.5000 .70711 2
Model Pembinaan D 5.5000 .70711 2
Total 6.5000 1.51186 8
7.46 Statistika Pendidikan 

Total Model Pembinaan A 3.6667 1.86190 6


Model Pembinaan B 4.6667 2.65832 6
Model Pembinaan C 5.3333 2.73252 6
Model Pembinaan D 4.0000 2.36643 6
Total 4.4167 2.35753 24
Nilai-nilai pada kolom Mean adalah rata-rata untuk setiap sel, sesuai
kombinasinya.

Levene's Test of Equality of Error


Variancesa Tidak dapat dihitung karena ada
Dependent Variabel:Pemecahan Masalah sel yang variannya homogen,
yakni kelas IV pembinaan D,
F df1 df2 Sig. Kelas V pembinaan B, dan kelas
VI pembinaan B.
. 11 12 .
(ini hanya contoh)
Tests the null hypothesis that the error
variance of the dependent variabel is equal
across groups.
a. Design: Intercept + Kelas + Model +
Kelas * Model
Fokuskan pada tiga
nilai F, Kelas, Model,
dan kelas * Model.
Tabel anovanya adalah sebagai berikut

Tests of Between-SubjectsEffects
Dependent Variabel: Pemecahan Masalah
Type III
Mean Partial Eta
Source Sum of df F Sig.
Square Squared
Squares
Corrected 118.833a 11 10.803 14.404 .000 .930
Model
Intercept 468.167 1 468.167 624.222 .000 .981
Kelas 88.083 2 44.042 58.722 .000 .907
Model 9.833 3 3.278 4.370 .027 .522
Kelas * Model 20.917 6 3.486 4.648 .011 .699
Error 9.000 12 .750
Total 596.000 24
Corrected 127.833 23
Total
a. R Squared = .930 (Adjusted R Squared = .865)

Eta Squared menunjukkan 52,2%


varians pemecahan masalah diprediksi
oleh Model
 MPDR5202/MODUL 7 7.47

4) Interpretasi.
Untuk interpretasi, kita hanya perlu memperhatikan kolom sig, dan
bandingkan hasilnya dengan taraf nyata yang dipilih, atau dapat juga
membandingkan seperti dalam perhitungan manual, yakni
membandingkan F hitung yang dilingkari dengan F tabel.
5) Uji perbandingan menggunakan Plot profil

Dari gambar di atas, secara deskriptif dapat dijelaskan sebagai berikut:


1. Dilihat berdasarkan kelasnya: Model Pembinaan B paling baik di kelas
IV, Model Pembinaan C paling baik di kelas V, dan juga Model
Pembinaan B paling baik di kelas VI.
2. Pada model pembinaan A: siswa pada IV lebih rendah dibandingkan
dengan kelas V dan VI, tetapi kelas V dan VI perbedaannya tidak terlalu
besar. Hal yang sama terjadi dengan model pembinaan D.
3. Pada model pembinaan B: Hasil di kelas IV hampir sama dengan di
kelas V, tetapi sangat baik di kelas VI.
4. Pada model pembinaan C: semakin tinggi kelas, semakin baik hasilnya.
7.48 Statistika Pendidikan 

Catatan: Anda juga dapat memberikan interpretasi dari gambar di atas. Perlu
juga diketahui bahwa hasil plot bersifat deskriptif, artinya hanya berlaku pada
sampel. Apakah perbedaan-perbedaan tersebut berarti, Anda dipersilakan
untuk melakukan uji lanjutannya.

LAT IH A N

Jawablah semua soal berikut! (untuk membantunya Anda dapat


menggunakan perhitungan melalui SPSS atau softwar pengolah data lainnya)

1) The Council of Graduate Schools merupakan suatu organisasi yang


membawahi sekitar 700 institusi (perguruan tinggi) dengan berbagai
program studi di Amerika. Salah satu perguruan tinggi dari anggota
Graduate Schools telah menggunakan suatu penelitian yang berkaitan
dengan skor ujian antara siswa laki-laki dan perempuan dalam program
studi matematika di Amerika. 12 perguruan tinggi dan 6 siswa dari
masing-masing jenis kelamin dijadikan sampel dalam penelitiannya.
a. Lengkapi tabel Anova di bawah ini.
Sumber df SS MS F
Institusi (I) ............ 132,250 ............ ............
Jenis Kelamin (G) ............ 52,900 ............ ............
I×G ............ 26,450 ............ ............
Error ............ 13,225 ............ ............
Total ............ ............ ............ ............
b. Tuliskan kesimpulan yang Anda peroleh!
2) Tiga galur tikus di bawah 2 kondisi lingkungan yang berbeda dengan
mengukur unjuk-kerjanya dalam suatu tes lorong-lorong yang rumit.
Skor kesalahan bagi 48 tikus yang dicobakan adalah sebagai berikut:
Galur
Lingkungan
Cerdik Campuran Dungu
28 12 33 83 101 94
22 23 36 14 33 56
Bebas
25 10 41 76 122 83
36 86 22 58 35 23
72 32 60 89 136 120
48 93 35 126 38 153
Terbatas
25 31 83 110 64 128
91 19 99 118 87 140
 MPDR5202/MODUL 7 7.49

Gunakan taraf nyata 0,01 untuk menguji:


a. Tidak ada beda skor kesalahan yang diakibatkan berbedanya
lingkungan
b. Tidak ada beda skor kesalahan untuk ketiga galur
c. Lingkungan dan galur tikus tidak berinteraksi
3) Dalam penelitian percobaan pembelajaran, kita ingin mengetahui apakah
terdapat perbedaan dalam performans antara tiga jenis motivasi dan juga
apakah ada perbedaan dari dua kondisi praktek pembelajaran. Tabel di
bawah menunjukkan skor 12 siswa yang diperoleh dalam penelitian.
Jenis Motivasi
C1 C2 C3
Praktek
L1 4,4 2,3 8,6
Pembelajaran
L2 6,8 5,4 10,13
a. Lakukan pengujian dengan anova dua jalur
b. Gambarkan grafik dari rata-rata untuk tiap selnya

Petunjuk Jawaban Latihan

1) Tabel Anovanya sebagai berikut.


Sumber df SS MS F
Kolom (Metode Pemb.) 3 54,0 18,0 1,5
Baris (Tipe siswa) 2 72,0 36,0 3,0
Kolom X Baris 6 180,0 30,0 2,5
Antar sel (error) 48 576,0 12,0
Total 59 882,0

Dengan menggunakan  = 0,05 dan df masing-masing diperoleh Ftabel


untuk masing-masingnya adalah Fmetode = 2,80, Fsiswa = 3,19, dan Finteraksi
= 2,30. Dengan demikian dapat disimpulkan bahwa minimal ada
perbedaan di antara tipe siswa, serta ada interaksi antara metode dengan
tipe siswa.

2) Hasil perhitungannya terangkum dalam tabel berikut.


7.50 Statistika Pendidikan 

Sumber df SS MS F
Kolom (Galur) 2 18654,167 9327,083 9,225
Baris (Lingkungan) 1 15229,688 15229,688 15,113
Kolom X Baris 2 1098,500 549,250 0,545
Antar sel (error) 42 42325,125 1007,741
Total 47 77307,479

Dengan menggunakan  = 0,05 dan df masing-masing, maka diperoleh


nilai F tabel untuk masing-masing pengujiannya adalah FGalur = 3,22;
FLing = 4,08, dan Finteraksi = 3,22. Dengan demikian diperoleh kesimpulan
a. Minimal ada dua jenis galur yang memiliki skor kesalahan berbeda.
b. Ada perbedaan skor antara lingkungan bebas dan terbatas.
c. Tidak ada perbedaan skor kesalahan berdasarkan interaksi antara
lingkungan dengan jenis galur.

3) Hasil perhitungannya dapat dilihat pada tabel ANOVA berikut.


Sumber df SS MS F
Kolom (Motivasi) 2 68,17 34,09 21,58
Baris (Pemb.) 1 30,09 30,09 19,04
Kolom X Baris 2 3,16 1,58 1,00
Antar sel (error) 6 9,50 1,58
Total 11 110,92

Dengan  0,05 dan df masing-masing diperoleh F tabel berturut-turut


FMotivasi = 5,14; FPemb. = 5,99; dan Finteraksi = 5,14. Dengan demikian dapat
disimpulkan bahwa.
a. Minimal ada dua kelompok yang berbeda performance jika dilihat
dari jenis motivasinya
b. Ada perbedaan performance antara kedua jenis pembelajaran.
c. Tidak ada interaksi antara jenis motivasi dan jenis pembelajaran
terhadap performance siswa.
 MPDR5202/MODUL 7 7.51

Grafik rata-ratanya adalah sebagai berikut

L2

L1

R A NG KU M AN

Dalam penelitian, terutama eksperimen dengan rancangan acak


lengkap layak dipakai ketika tidak ada sumber keragaman selain
pengaruh perlakuan yang diketahui atau diantisipasi. Namun dalam
berbagai keadaan sering diketahui bahwa satuan percobaan tertentu, bila
diperlakukan sama sering memberikan respons yang berbeda. Untuk
itulah, peneliti perlu mengantisipasinya, sehingga satuan-satuan dapat
diklasifikasikan seperlunya sedemikian hingga bagian keragaman yang
bersumber pada sumber yang tidak dikenali itu dapat diukur dan
dikeluarkan dari galat percobaan. Analisis tentang hal tersebut
dinamakan analisis varians dua jalur atau two way anova.
Dalam analisis varians dua jalur terlibat dua atau lebih klasifikasi.
Dalam analisis ini kita dapat perbandingan antar kelompok pada masing-
masing kalsifikasi, juga melihat apakah ada interaksi antar kedua
klasifikasi tersebut.
Secara deskriptif, ada atau tidak adanya interaksi dapat terlihat dari
grafik rata-rata. Umumnya jika grafik rata-rata antar kelompoknya
sejajar, maka tidak ada interaksi. Jika grafik rata-ratanya tidak sejajar
atau bahkan berpotongan, maka ada peluang terjadinya interaksi di
antara kedua klasifikasi.
Secara algoritma, pengujian anova dua jalur ini mirip dengan anova
satu jalur, yakni melalui jumlah kuadrat variasi-variasi yang terjadi.
7.52 Statistika Pendidikan 

TES F OR M AT IF 2

Jawablah pertanyaan berikut dengan ringkas dan jelas!

1) Perhatikan gambar dari rata-rata di bawah ini.

R2

2) Data berikut merupakan hasil empat kali formatif yang diperoleh 5 siswa
untuk mata pelajaran matematika, bahasa Indonesia, IPA, dan IPS:

Siswa Mat B. Indo IPA IPS


88 63 51 58 73 81 87 81
1
79 80 72 65 77 77 92 76
79 96 85 95 82 36 80 93
2
56 68 67 88 80 68 62 67
67 66 74 47 91 95 77 70
3
51 89 59 82 59 92 84 73
35 60 76 49 43 52 55 49
4
64 70 26 76 42 32 53 56
99 77 84 94 95 81 83 76
5
87 95 83 76 98 96 87 80
Gunakan taraf nyata 0,05 untuk menguji hipotesis bahwa:
 MPDR5202/MODUL 7 7.53

a. Keempat mata pelajaran itu mempunyai tingkat kesulitan yang


sama.
b. Kelima siswa mempunyai kemampuan yang sama.
c. Siswa dan mata pelajaran tidak berinteraksi.
3) Tiga jenis varietas kentang akan dibandingkan hasilnya. Untuk itu
dilakukan percobaan dengan menggunakan 9 petak yang seragam di
masing-masing 4 lokasi yang berbeda. Pada setiap lokasi diujicobakan 3
petak yang ditentukan secara acak. Hasilnya (dalam kuintal) per petak
adalah sebagai berikut.
Varietas
Lokasi
A B C
15 20 22
1 19 24 17
12 18 14
17 24 26
2 10 18 19
13 22 21
9 12 10
3 12 15 5
6 10 8
14 21 19
4 8 16 12
11 14 12
Gunakan taraf nyata 0,05 untuk menguji hipotesis bahwa:
a. Tidak ada perbedaan kemampuan daya hasil di antara 3 varitas.
b. Lokasi yang berbeda tidak berpengaruh pada hasil.
c. Lokasi dan varietas kentang tidak berinteraksi.
7.54 Statistika Pendidikan 

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 33 kecuali untuk soal nomor 3 mempunya skor 34. Hitunglah jawaban
yang benar. Kemudian, gunakan rumus berikut untuk mengetahui tingkat
penguasaan Anda terhadap materi Kegiatan Belajar 2.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan Kegiatan Belajar 3. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 2, terutama bagian yang
belum dikuasai.
 MPDR5202/MODUL 7 7.55

Kegiatan Belajar 3

Analisis Kovarians

U ji statistik analisis kovarian adalah penggabungan antara regresi dan


anova. Regresi menguji seberapa jauh sebuah variabel independen
mampu memprediksi besarnya variabel dependen (PREDIKSI). Anova
menguji perbandingan rerata (KOMPARASI). Jadi, dengan menggunakan
analisis kovarian, peranan variabel independen terhadap variabel dependen
baik melalui prediksi maupun melalui perbedaan dapat diidentifikasi secara
bersamaan (simultan). Dalam penelitian eksperimen, masing-masing jenis
peranan ini memiliki arti sendiri-sendiri.

A. PENGGUNAAN ANALISIS KOVARIAN DALAM EKSPERIMEN

Dalam penelitian eksperimen, peneliti menguji efektivitas perlakuan


yang diberikan. Kelompok perlakuan diharapkan memiliki perubahan terkait
perlakuan yang diberikan dibanding dengan kelompok yang tidak
mendapatkan perlakuan (kelompok kontrol). Peneliti menekankan pada
perbandingan antar rerata kedua kelompok tersebut setelah perlakuan
diberikan. Dengan demikian yang diutamakan dalam pengujian adalah uji
komparasi. Uji prediksi dipakai sebagai bagian dari bentuk kontrol terhadap
variabel-variabel ekstra yang turut mempengaruhi keluaran perlakuan yang
diberikan. Upaya kontrol yang dilakukan adalah kontrol secara statistik.
Pengujian dengan menggunakan analisis kovarian dalam penelitian
eksperimen biasanya menempatkan kondisi setelah perlakuan (e.g. skor pasca
perlakuan) sebagai variabel dependennya, kondisi sebelum perlakuan (e.g.
skor pra perlakuan) sebagai variabel yang dikendalikan secara statistik, dan
jenis perlakuan (e.g. kelompok perlakuan vs kontrol) sebagai variabel
independennya. Dengan demikian identifikasi hasil uji statistika difokuskan
pada komparasi kondisi pasca perlakuan antar kelompok Anakova dilakukan
berdasarkan pertimbangan bahwa dalam kenyataannya ada variabel tertentu
yang tidak dapat dikendalikan, tetapi sangat mempengaruhi atau sangat
berkorelasi dengan variabel respons yang diamati.
Menurut Steel dan Torie (1993 : 480) anakova mempunyai beberapa
kegunaan, yaitu:
7.56 Statistika Pendidikan 

1. Mengendalikan galat dan meningkatkan ketepatan.


2. Untuk menyesuaikan atau mengoreksi rata-rata perlakuan dari variabel
tak bebas.
3. Untuk membantu menafsirkan data, khususnya yang berhubungan
dengan pengaruh perlakuan secara alamiah.
4. Untuk menguraikan kovariansi total atau jumlah hasil kali menjadi
bagian-bagian komponennya.

B. SEKILAS ANAKOVA

Pengertian gamblangnya analisis kovarian (anakova) adalah


penggabungan antara uji komparatif dan korelasional. Lantas apa bedanya
anakova dengan anova? Kalau anova hanya menguji perbandingan saja akan
tetapi kalau anakova kita menguji perbandingan sekaligus hubungan. Istilah
kova dalam anakova berasal dari kata kovarian (covariance) yang
menunjukkan adanya variabel yang dihubungkan. Ingat co dalam Bahasa
Inggris artinya bersama, yang menunjukkan adanya hubungan. Kita
membandingkan variabel tergantung (Y) ditinjau dari variabel bebas (X1)
sekaligus menghubungkan variabel tergantung tersebut dengan variabel
bebas lainnya (X2). Variabel X2 yang dipakai memprediksi inilah yang
dinamakan dengan kovarian.

C. FUNGSI UMUM ANAKOVA

Untuk memudahkan pemahaman awam, dapat dikatakan bahwa anakova


adalah penggabungan antara teknik anova dan regresi. Anova Dipakai untuk
menguji perbandingan variabel tergantung (Y) ditinjau dari variabel bebas
(X1)
Regresi Dipakai untuk memprediksi variabel tergantung (Y) melalui
variabel bebas (X2). Biasanya karakteristik variabel pengujian anakova
adalah sebagai berikut:
Variabel Tergantung (Y) : Kontinum
Variabel Bebas (X1) : Kategorikal
Variabel Bebas (X2) : Kontinum

Kontinum Variabel yang memiliki nilai kuantitatif yang bergerak dalam


kontinum dari rendah hingga tinggi (interval atau rasio). Hasil pengukuran
 MPDR5202/MODUL 7 7.57

melalui skala psikologi termasuk dalam kelompok ini misalnya: harga diri,
motivasi belajar, IQ, Hasil Tes Matematika. Kategorikal Variabel hasil
pengkodean terhadap kategori (nominal). Misalnya: jenis kelamin, kelas,
lokasi tempat tinggal, bidang pekerjaan. Kesimpulannya dalam anakova,
variabel tergantungnya berbentuk kontinum dan harus ada dua jenis variabel
dalam variabel bebas, yaitu kategorikal dan kontinum.

D. ANAKOVA DAN VARIABEL KONTROL

Untuk memahami tentang analisis kovarians, perhatikanlah tabel berikut.

Tabel 7.5
Contoh Masalah Anakova

Variabel Bebas &


Variabel Terikat (Y) Hipotesis
Variabel Kontrol (X)
Bidang kerja (X1) Kepuasan Kerja (Y) Ada perbedaan kepuasan
Kompensasi (X2) kerja ditinjau dari bidang
kerja karyawan dengan
mengendalikan insentif yang
diterima
Jenis Kelamin (X1) Depresi (Y) Depresi pada wanita lebih
Pola Pikir (X2) tinggi dibandingkan pada pria
dengan mengendalikan pola
pikir

Dengan menggunakan anakova maka peranan variabel bebas terhadap


variabel tergantung, baik melalui komparasi maupun prediksi dapat
dilakukan secara bersamaan (simultan). Beberapa penelitian yang
menggunakan variabel kontrol meletakkan variabel kontrol sebagai kovarian.
Pada Tabel 7.5 di atas disajikan desain analisis yang menggunakan anakova
yang meletakkan variabel kontrol sebagai kovarian. Fokus penelitian adalah
menguji perbedaan, misalnya menguji perbedaan kepuasan kerja ditinjau dari
jenis bidang kerja dan menguji perbedaan depresi ditinjau dari jenis kelamin.
Pengujian seperti ini dapat menggunakan analisis varians (ANOVA) atau
uji-t. Namun karena ada variabel kontrol yang dilibatkan, maka analisis
dilakukan dengan menggunakan analisis kovarian.
Pada Tabel 7.5, mungkin kita bertanya: Mengapa peneliti menetapkan
kompensasi atau pola pikir sebagai variabel kontrol? Tidak sekalian variabel
bebas saja? Bisa jadi fokus penelitian hanya pada satu variabel bebas saja
7.58 Statistika Pendidikan 

sehingga variabel di luar itu dilihat sebagai variabel pelengkap sehingga


statusnya diturunkan menjadi variabel kontrol. Hal ini tidak masalah selama
sesuai dengan tujuan penelitian dan memiliki dukungan teori.
Sebagai tambahan, jika semua variabel bebas adalah variabel kontinum,
maka desain analisis yang tepat adalah menggunakan korelasi parsial. Jadi
dalam kasus ini hipotesis utama bukan lagi “ada perbedaan...”, akan tetapi
“ada hubungan..”. Misalnya “ada hubungan antara kecerdasan dengan
prestasi belajar dengan mengendalikan motivasi belajar”. Dalam hal ini baik
variabel bebas (kecerdasan) dan variabel kontrol (motivasi belajar)
merupakan variabel yang berbentuk kontinum.

E. APLIKASI ANAKOVA DALAM EKSPERIMEN

Dua bagian anakova di atas (perbandingan dan prediksi) sekarang kita


terapkan pada penelitian eksperimen. Dalam penelitian eksperimen, peneliti
menguji efektivitas perlakuan yang diberikan. Perlakuan dikatakan efektif
jika terdapat perubahan skor antara kelompok perlakukan dan kontrol. Nah,
inilah fokus analisis kita, membandingkan skor antara kelompok perlakukan
dan kontrol. Dari dua bagian anakova, yaitu perbandingan dan prediksi, kita
sudah mengetahui apa yang dibandingkan, lantas apa yang kita masukkan
dalam bagian prediksi? Yang kita masukkan adalah variabel kontrol dalam
penelitian kita. Misalnya motivasi, kecerdasan, tingkat pemahaman instruksi
atau keterbukaan.

Contoh Desain Penelitian


Seorang peneliti menguji efektivitas Program Pelatihan Aku Bisa! terhadap
peningkatan kepercayaan diri pada anak dengan mengendalikan motivasi
belajar anak.
Variabel Tergantung (Y) : Kepercayaan Diri
Variabel Bebas (X1) : “Pelatihan Aku Bisa!”
Variabel Kontrol (X2) : Motivasi Belajar

Desain penelitian yang dipakai adalah desain pra and paska uji (pretest-
posttest design). Peneliti membagi kelompok penelitian menjadi dua secara
acak (randomized design), yaitu kelompok perlakuan (KP) dan kelompok
kontrol (KK). Kelompok perlakuan akan mendapatkan pelatihan sedangkan
kelompok kontrol mendapatkan program pelatihan lain sebagai placebo.
 MPDR5202/MODUL 7 7.59

Dalam hal ini yang dijadikan kovarian adalah motivasi belajar. Sebelum
perlakuan diberikan, pengukuran kepercayaan diri dan motivasi belajar
dilakukan. Setelah perlakukan diberikan pengukuran hanya dilakukan pada
kepercayaan diri.

F. PROSEDUR ANALISIS SATU JALUR DARI KOVARIANS

Pada umumnya sering kali ditemui bahwa gambaran hasil suatu


pengamatan terhadap percobaan tidaklah benar-benar bersifat bebas, tetapi
satu sama lain sering terlihat berhubungan secara fungsional. Pada kondisi
demikian, analisis kovarian secara simultan dapat digunakan untuk menguji
varians-varians dan kovarian-kovarian pada variabel-variabel tertentu,
sehingga pengujian pengaruh-pengaruh perlakuan terhadap ciri objek akan
lebih akurat.
Dalam analisis kovarian, di samping memerlukan hasil pengamatan
terhadap ciri utama (variate) objek seperti halnya dalam anova, juga
memerlukan hasil-hasil pengamatan terhadap 1 atau lebih peragam pengiring.
Selain itu, analisis kovarian atau anakova, juga memerlukan adanya
hubungan fungsional tertentu antara ragam utama dan ragam pengiring.
Sebagai contoh pada pengujian varietas padi, pengaruh gulma yang timbul
secara insidentil dapat digunakan sebagai peragam pengiring. Dengan asumsi
adanya hubungan fungsional antara pengaruh insidentil dari gulma dan
produksi padi. Contoh lainnya dalam bidang pendidikan, misalnya penelitian
survei terhadap pendapatan atau salari guru-guru pada tiga jenis sekolah
berbeda sangat mungkin dipengaruhi oleh variabel tingkat pendidikan dari
masing-masing guru. Misalkan diberikan suatu treatment tiga buah (a = 3)
dengan banyak sampel yang diukur adalah 4, atau n1  n2  n3  4 yang
tertulis pada tabel berikut.

Tabel 7.6
Penyajian Data

I II III
X Y X Y X Y
X11 Y11 X21 Y21 X31 Y31
X12 Y12 X22 Y22 X31 Y32
X13 Y13 X23 Y33 X32 Y33
X14 Y14 X24 Y34 X34 Y34
T1.(X) T1.(Y) T2.(X) T2.(Y) T3.(X) T3.(Y) T..(x) T..(Y)
7.60 Statistika Pendidikan 

Hipotesis yang diuji adalah:


H0 : 1  2   a melawan H1 : paling sedikit ada satu ketaksamaan
Untuk membantu perhitungan digunakan simbol-simbol jumlah kuadrat dan
hasil kali sebagai berikut.

Tabel 7.7
Jumlah Kuadrat dan Hasil Kali Tidak Terkoreksi

X XY Y
T( X )   X ij2 T( XY )   X ij Yij T(Y )   Yij2
i j i j i j
2
T Ti.( X )Ti.(Y ) Ti.(2Y )
A( X )   A( XY )   A(Y )  
i .( X )

i ni i ni i ni
2 2
T T..( X )T..(Y ) T
CF( X )  CF( XY )  CF(Y ) 
..( X ) ..(Y )

N N N

Adapun tabel Jumlah hasil Kuadrat dan hasil kali terkoreksinya adalah

Tabel 7.8
Jumlah Kuadrat dan Hasil Kali Tidak Terkoreksi
Sumber Df SS(X) SP SS(Y)
Perlakuan a – 1 SSa ( X )  A( X )  CF( X ) SPa  A( XY )  CF( XY ) SSa (Y )  A(Y )  CF(Y )
Galat N – a SSe( X )  T( X )  A( X ) SPe( XY )  T( XY )  A( XY ) SSe(Y )  T(Y )  A(Y )
Total N – 1 SSt ( X )  T( X )  CF( X ) SPt ( XY )  T( XY )  CF( XY ) SSt (Y )  T(Y )  CF(Y )
Dan tabel jumlah kuadrat termurnikannya (adjusted) adalah

Tabel 7.9
Jumlah Kuadrat yang Termurnikannya
Sumber Df SS’(Y) MS’(Y) F
Perlakuan a–1 SS 'a (Y )  SS 't (Y )  SS 'e(Y ) SS 'a (Y ) MS 'a (Y )
MS 'a (Y )  F
a 1 MS 'e(Y )
N – a – 1 SS '
e (Y )  SSe (Y )  SPe SSe ( X )
Galat 2
SS 'e (Y )
MS 'e (Y ) 
N  a 1
Total N–2 SS 't (Y )  SSt (Y )  SPt 2 SSt ( X )
Tolak H0 jika F > F(a-1, N-a-1)
 MPDR5202/MODUL 7 7.61

Contoh 7.5 (diambil dari Dowdy & Wearden (1985)


Misalkan suatu eksperimen yang menguji pengaruh tiga jenis media yang
digunakan untuk iklan; masing-masing digunakan untuk 5 restoran cepat saji.
Ke-15 restoran tersebut berada pada lokasi yang berbeda tetapi kotanya
sebanding dan secara acak menggunakan tiga jenis iklan media: radio, surat
kabar, dan televisi. Semua iklan menggunakan periode waktu yang sama.
Keuntungan (Y) dalam ribuan dolar telah dicatat selama periode yang sama.
Walaupun restoran-restoran mempunyai ukuran yang sama, tetapi mereka
mempunya jumlah pekerja yang berbeda. Karena itu jumlah pekerja yang
berbeda (X) harus menjadi faktor yang harus ikut diperhatikan untuk menguji
perbedaan keuntungan dari hasil ketiga iklan tersebut. Misalkan data yang
dicatat adalah sebagai berikut.

Jenis Media
RADIO Surat Kabar Televisi
X Y X Y X Y
10 30 21 24 34 17
14 18 26 20 39 11
19 13 31 7 43 3
25 6 36 4 47 -6
27 3 41 -5 52 -10

Dari data tersebut ujilah apakah ada perbedaan keuntungan yang diperoleh
berdasarkan jenis media yang digunakan untuk beriklan dengan
memperhatikan faktor banyaknya pekerja dalam masing-masing restoran?

Dari tabel di atas kita ketahui dan peroleh:


1. a  3, n1  n2  n3  5 dan N  15.
2. T..( x )  465, T..( y )  135, x 2
ij  16505, x
ij yij  2544, y
2
ij  3059

Dari hasil di atas, maka hitung jumlah kuadrat dan jumlah hasil kali dari
masing-masing sebagaimana dalam tabel berikut.
7.62 Statistika Pendidikan 

X XY Y
T( X )   X ij  16505 T( XY )   X ij Yij  2544
2
T(Y )   Yij2  3059
i j i j i j

Ti.(2 X ) Ti.( X )Ti.(Y ) Ti.(2Y )


A( X )    15855 A( XY )    3525 A(Y )    1525
i ni i ni i ni

T..(2 X ) T..( X )T..(Y ) T..(2Y )


CF( X )   14415 CF( XY )   4185 CF(Y )   1215
N N N

Langkah berikutnya kita hitung SS dan SP terkoreksinya sebagaimana tabel


berikut.
Sumber Df SSx SP SSy
Perlakuan 3 – 1 = 2 15855 – 14415 3524 – 4185 = –660 1525 – 1215 =
=1440 310
Galat 15 – 3 = 12 16505 – 15885 2544 – 3525 = –981 3059 – 1525 =
= 650 1534
Total 14 2090 -1641 1844

Dan tabel adjusted SS


Sumber Df SS’(y) MS’(y) F
Perlakuan 2 555,54 – 53,44 = 502,10 251,050 51,68
Galat 11 1534 – (–981)2/650 = 4,858
53,44
Total 13 1844 – (–1641)2/2090 =
555,54

Dari tabel F (Fisher) dengan  = 0,05 dan dk = (2, 11) diketahui


Ftabel = 3,982. Karena F = 51,68 > 3,98, maka hipotesis nol ditolak. Artinya
ada perbedaan yang berarti dari perbedaan antara pengaruh media pada rata-
rata keuntungan dengan memperhatikan jumlah pekerja pada tiap perusahaan.
Jika perhitungan di atas hanya menghitung perbandingan keuntungan
(y), tanpa memperhatikan jumlah pekerja pada setiap perusahaan (x), maka
hasil pengujiannya adalah sebagai berikut.
 MPDR5202/MODUL 7 7.63

Sumber Df SS(y) MS’(y) F


Perlakuan 2 310 155,00 1,21
Galat 12 1534 127,83
Total 13 1844

Hasilnya adalah kita menerima hipotesis nol, yakni tidak ada perbedaan
yang berarti antara keuntungan-keuntungan yang diperoleh ketiga perusahaan
tersebut.

G. PENGUJIAN ASUMSI UNTUK ANALISIS KOVARIAN


Agar analisis kovarian yang dilakukan itu valid, diperlukan beberapa
asumsi yang perlu diuji terlebih dahulu. Asumsi-asumsi tersebut adalah
sebagai berikut.
1. Semua kelompok perlakuan mempunyai varians yang sama dari garis-
garis regresinya, atau secara matematika dapat ditulis sebagai
12   22    a2 .
2. Semua garis regresinya mempunyai kemiringan yang sama, atau
1  2   a   .
3. Kemiringan bersama, , tidak sama dengan 0, maksudnya, garis
regresinya tidak horizontal.

Langkah yang pertama kita hitung adalah jumlah kuadrat dan hasil kali
silang masing-masing kelompok S(XX)i, S(XY)i, S(YY)i, dan koefisien regresi
masing-masing kelompok bi dan ai dengan i = 1, 2, 3, …, a. Masing-masing
dari jumlah kuadrat dan hasil kali silangnya dihitung dengan
S( XX )i   X ij2  Ti.(2 X ) / ni
j

S( XY )i   X ij Yij  Ti.( X )Ti .(Y ) ni


j

S(YY )i   Yij2  Ti.(2Y ) ni


j

Dan kemiringan serta konstanta dari masing-masing regresinya dapat


dihitung dengan
S( XY )i
bi  dan ai  Yi  bi X i .
S( XX )i
7.64 Statistika Pendidikan 

Adapun kesamaan varians dari garis regresinya dapat menggunakan uji-


Barlett, dengan variabilitas dari masing-masing garisnya dapat dihitung

 Y 
2
 Yˆij
ij
S(YY )i  S(2XY )i S( XX )i
dengan si2  
j
, kemudian hitunglah nilai
ni  2 ni  2
si2 (terbesar )
Fmax, dengan Fmax  . Bandingkan nilai Fmax hasil perhitungan
si2 (terkecil )
tersebut dengan Fmax (tabel) pada taraf signifikansi  dan dk = (a, n – 2).
JikaFmax ≥ daripada Fmax(tabel) maka kita tolak hipotesis nol.
Untuk pengujian keseragaman kemiringan garis-garis regresinya atau
1  2   a   dapat dilakukan dengan analisis varians. Langkah
pertama yang harus dihitung adalah menentukan nilai b gabungan. Nilai
dapat dihitung dengan menggunakan rumus sebagai berikut.
SPe
b
SS e ( X )
Kemudian hitung jumlah kuadrat deviasi yang diperoleh dari taksiran
untuk kemiringan gabungan b, yakni G, dengan
G  SS 'e(Y )
Dan jumlah kuadrat deviasi individualnya dari bi misalkan H dan
dihitung dengan
H    SYY (i )  S XY
2

( i ) S XX ( i )  .
i

Hipotesis yang diuji adalah H0: 1  2   a . Untuk membantu


perhitungan, gunakanlah tabel anova sebagai berikut.
Sumber Df SS MS F
About regression lines using N–a–1 G
one b
About regression lines using N – 2a H H MS1
MS1  F
all (a) bi N  2a MS 2
Difference a–1 G–H GH
MS2 
a 1

Tolak hipotesis nol, jika F  Ftabel pada taraf signifikansi  dan


dk   a  1, N – 2a 
 MPDR5202/MODUL 7 7.65

Terakhir, untuk pengujian asumsi kemiringan bersama  sama dengan


nol, kita hitung nilai
SPe2 SSe ( X )
F
MSe' (Y )
Bandingkan hasilnya dengan Ftabel pada taraf signifikansi  dan
dk  1, N – a –1 . Tolak hipotesis nol, jika F  Ftabel .
Sebagai contoh, kita uji asumsi untuk contoh analisis kovarians di atas.
Kita mulai dengan menghitung jumlah kuadrat, rata-rata, dan garis regresinya
untuk masing-masing kelompok.
Untuk i = 1
T1..(2 x ) 952
S xx   x1 j 
2
 2011   206
j n1 5
T1.( x )T1.( y ) (95)(70)
S xy   x1 j y1 j   1030   300
j n1 5
2
T 702
S yy   x12j   1438   458
1..( y )

j n1 5
Dan selanjutnya hingga i = 3.
Kemudian kita hitung koefisien regresi pada masing-masing kelompoknya
adalah sebagai berikut.
S xy (1) 300
b1    1, 46
S xx (1) 206
a1  y1  b1 x1  14  (1, 46)(19)  41,74
Lakukan seterusnya untuk i = 2 dan 3.
Secara keseluruhan, hasilnya dapat dilihat pada tabel berikut.
I II II
X Y X Y X Y
Sxx 206 250 194
Sxy –300 –370 –311
Syy 458 566 510
Mean (x) 19 31 43
Mean (y) 14 10 3
B –1.46 –1.48 –1.6
A 41.74 55.88 71.6
7.66 Statistika Pendidikan 

Kemudian kita hitung variabilitas dari masing-masing garisnya dengan rumus


 y  yij 
2
i
s yy (i )  sxy2 (i ) sxx (i )
si2  
j

ni  2 ni  2
Hasilnya dapat dilihat pada tabel berikut.
media df s yy (i )  sxy2 (i ) sxx (i ) si2
I 3 21.11 7.04
II 3 18.4 6.13
III 3 11.44 3.81
50.95

Dari tabel di atas kita dapatkan


largest si2 7, 04
Fmax    1,85
smallest si2 3,81
Dan dengan taraf nyata 0,05 dari tabel F (Fisher) kita dapatkan
Fmax( ,( a, n 2) )  Fmax(0,05,(3,3))  27,8
Karena Fmax = 1,85 lebih kecil dari 27,8 maka kita menerima hipotesis nol.
Artinya varians distribusi data keuntungan ketiga kelompok homogen, dan
hasil ini memberi rekomendasi untuk melanjutkan untuk melakukan uji
anakova.
Selanjutnya akan diuji dari koefisien kemiringan persamaan regresinya
dengan hipotesis nol 1 = 2 = 3 dengan membandingkan jumlah kuadrat
  y  yij  ketika garis-garis diperoleh dengan
2
dari selisih-selisihnya, ij ij

dua cara berbeda. pertama menggunakan kemiringan masing-masing, yakni


b1  1,46; b2  1,48; dan b3  1,60
dan kedua menggunakan estimator kemiringan bersama, yakni b dengan
SPe 981
b   1,51
SSe ( x ) 650

Jika estimator bersama b1, b2 , dan b3 semuanya mengestimasi parameter


yang sama, maka perbedaan antara jumlah kuadrat dari selisihnya tidak akan
berarti.
Jumlah kuadrat dari selisih dengan garis regresi menggunakan estimator
b adalah
 MPDR5202/MODUL 7 7.67

G  SSe( y )  53, 44

Dan jumlah kuadrat dari selisih dengan menggunakan estimator masing-


masing bi adalah
 SS xy2 (i ) 
H    SS yy (i )    50,95
i 
 SS xx (i ) 

Hipotesis yang diuji untuk yang pertama adalah


H0 :  1   2   3 melawan H1 : paling sedikit ada satu tanda tidak sama
dengan.
Kemudian kita gunakan tabel pembantu sebagai berikut
Sumber df SS MS F
Garis regresi N – a – 1= 11 G = 53,44
menggunakan satu b
Garis regresi N – 2a = 9 H = 50,95 5,661 1, 245
 0, 220
menggunakan ketiga 5, 661
bi
Selisish a–1=2 G – H = 2,49 1,245

Dengan memilih  = 0,05, dari tabel F (Fisher) diketahui F0,05 (2,9) = 4,256
nilainya lebih besar dibandingkan dengan Fhitung = 0,220. Dengan demikian
kita terima H0 yakni koefisien-koefisien kemiringan garis regresi ketiganya
sama.
Untuk mengetahui apakah analisis kovarian layak digunakan untuk
pengujian perbedaan keuntungan ketiga perusahaan dengan memperhatikan
banyaknya pekerja, digunakan hipotesis sebagai berikut
H0 :  = 0 melawan H1:  0
Yang diuji melalui nilai F, dengan

 981
2
SPe2 SSe ( x ) 650
F   304, 777
MSe( y ) 4,858

Dengan derajat bebas 1, N – a –1  1,11 dan jika diambil  = 0,05 dari
tabel F diperoleh F0,05(1, 11) = 4,844 yang jauh lebih kecil dari 304,777.
Dengan demikian kita tolak hipotesis nol. Dan hal tersebut menunjukkan
bahwa kita layak menggunakan analisis kovarians.
7.68 Statistika Pendidikan 

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!

Sampel dari tiga varietas gandum A, B, dan C yang diperoleh dalam tiap
meter persegi (y) dengan curah hujan masing-masing dalam inci adalah
sebagai berikut.
A B C
x y x y x y
1 2 2 3 3 2
2 6 3 7 4 6
4 10 5 11 6 10
5 10 6 11 7 10

1) Gambar diagram pencar untuk masing-masing varietas secara bersama-


sama dalam satu koordinat kartesius (sumbu horizontal untuk x dan
sumbu vertikal untuk y) dengan menggunakan warna yang berbeda!
2) Tentukan koordinat rata-rata pada setiap kelompoknya  xi , yi  dan
tambahkan pada grafik!
3) Gambar garis vertikal di x  x.. , x... : rata-rata gabungan
4) Estimasi persamaan regresi untuk setiap varietasnya dan gambarkan
grafik regresinya (catatan: kemiringan garis dari keduanya sama)
5) Hitung yi untuk setiap varietas dari persamaan regersinya. Kemudian
tempatkan rata-rata adjusted pada grafik.
6) Apakah analisis kovarians meningkatkan atau menurunkan rata-rata dan
garis regreasi untuk kelompok-kelompok eksperimen? Apakah layak
analisis kovarians digunakan untuk menguji perbandingan hasil panen
bagi ketiga jenis gandum?

Petunjuk Jawaban Latihan

1) Silahkan gambar sendiri


2) (3, 7), (4, 8), dan (5, 7)
x..  4
3)
4) y1 j  1  2x1 j ; y2 j  2x2 j ; yˆ3 j  3  2x3 j
 MPDR5202/MODUL 7 7.69

5) (4, 9), (4, 8), dan (4, 5)


6) Menaikkan. Sangat layak.

R A NG KU M AN

Analisis kovarians berkaitan dengan dua atau lebih variabel terukur


dengan variabel bebasnya tidak ditentukan dulu nilainya seperti dalam
percobaan faktorial. Analisis ini memanfaatkan sekaligus analisis varians
dan regresi.
Ada beberapa kegunaan dalam analisis kovarians, di antaranya:
1. Mengendalikan galat dan meningkatkan ketepatan
2. Untuk menyesuaikan atau mengoreksi rata-rata perlakuan dari
variabel terikat.
3. Untuk membantu menafsirkan data, khususnya sehubungan dengan
alamiah pengaruh perlakuannya.
4. Untuk menguraikan kovarian total atau jumlah hasil kali menjadi
bagian-bagian komponennya.
5. Menduga pengamatan yang hilang.

Asumsi dalam analisis kovarians adalah:


1. Variabel X bersifat tetap, diukur tanpa kesalahan, dan bebas dari
pelakuan.
2. Regresi Y terhadap X setelah pengeluaran pengaruh perlakuan dan
kelompok adalah linear dan bebas dari perlakuan dan kelompok.
3. Sisa atau error menyebar normal dan saling bebas dengan rata-rata
nol dan variansnya homogen.

TES F OR M AT IF 3

Selesaikan soal-soal berikut!

1) Jelaskan tiga kondisi penelitian yang menyebabkan anakova menjadi


penting dan perlu digunakan!
2) Matrone, dkk. membandingkan pengaruh tiga faktor, masing-masing
pada dua taraf, terhadap pertambahan bobot anak domba. Ketiga faktor
tersebut adalah jerami kedele A, dari petak-petak yang diberi pupuk
salah satu dari KCa atau PKCa, atau suplemen ure B, dan suplemen
dikalsium C. Hasilnya sebagai berikut.
7.70 Statistika Pendidikan 

Kelompok anak Kelompok anak


Domba Jenis 1 Domba Jenis 2
Ransum
Intake Pertambahan Intake Pertambahan
(x) Bobot (y) (x) Bobot (y)
000 209,3 11,2 286,9 27,2
100 252,4 26,1 302,1 30,6
010 241,5 13,2 246,8 15,4
001 259,1 24,4 273,2 24,0
110 201,1 18,8 274,6 20,1
101 287,5 31,0 276,3 24,4
011 286,6 27,9 270,7 29,9
111 255,7 20,8 253,0 20,8
a.
Analisis apakah terdapat perbedaan peningkatan kedua kelompok
anak domba tersebut dengan memperhatikan bobot awalnya.
b. Lakukan juga analisis perbedaan peningkatan bobot kedua
kelompok anak domba tanpa memperhatikan bobot awalnya,
bandingkan hasilnya dengan a)
3) Seperti diketahui dalam teori belajar bahwa salah satu faktor yang
berperan dalam keberhasilan anak dalam mempelajari materi tertentu
dipengaruhi oleh kemampuan awalnya. Andaikan peneliti ingin
membandingkan hasil belajar antara dua model pembelajaran, sebut A
dan B dengan mempertimbangkan kemampuan awal siswa. Datanya
sebagai berikut.
Kelas Pembelajaran A Kelas Pembelajaran B
KMA Skor Tes KAM Skor Tes
35 70 35 40
40 85 40 60
45 75 40 65
35 80 30 70
40 76 35 65
45 85 40 80
50 90 45 85
20 52 40 80
40 65 35 75
50 75 45 60
35 65 30 65
35 70 35 75
25 55 35 75
 MPDR5202/MODUL 7 7.71

a. Lakukan juga analisis perbedaan hasil belajar apabila tidak


memperhatikan kemampuan awal siswa!
b. Analisis apakah terdapat perbedaan hasil belajar antara kedua
kelompok dengan memperhatikan kemampuan awal siswa.
Bandingkan hasilnya dengan a) dan berikan komentar!

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 3 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 33 kecuali untuk soal nomor 3 mempunya skor 34. Hitunglah jawaban
yang benar. Kemudian, gunakan rumus berikut untuk mengetahui tingkat
penguasaan Anda terhadap materi Kegiatan Belajar 3.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 3, terutama bagian yang
belum dikuasai.
7.72 Statistika Pendidikan 

Kunci Jawaban Tes Formatif

Tes Formatif 1
1) Karena penolakan hipotesis nol sudah cukup apabila minimal ada dua
kelompok yang berbeda.
2) Karena perhitungan dalam analisis varians menggunakan jumlah
kuadrat, sehingga nilai F hitung (rasio antara rata-rata antar kelompok
dengan rata-rata dalam kelompok) tidak akan pernah negatif.
3) Dari hasil perhitungan diperoleh:
Hipotesis uang diuji adalah:
H0 : 1 = 2 = 3 = 4
H1 : minimal ada dua mean yang berbeda.
Dari data yang ada diperoleh
SSbetween = 119,65; SSwithin = 44,92; dan SStotal = 164,57;
dkbetween = 3; dkwithin = 8; dan dktotal= 11.
S b2  39,88;, S W2  5,62.
Secara ringkas dapat dilihat pada table berikut
ANOVA
Persentase
Sum of Squares df Mean Square F Sig.
BetweenGroups 119.649 3 39.883 7.103 .012
WithinGroups 44.920 8 5.615
Total 164.569 11
Dari tabel di atas, terlihat bahwa nilai Fhitung = 7,103 yang memberikan
nilai penolakan hipotesis nol sebesar 0,012. Karena telah dipilih
  0, 05, maka kita menolak hipotesis nol.
4) Pertama kita susun dulu tabel nilai mutlak selisih rata-rata antar
kelompoknya.
X5  5 X 2  11,5 X1  14,5 X 4  18 X 3  19
X5  5 6,5 9,5 13 14
X 2  11,5 3 6,5 7,5
X1  14,5 3,5 4,5
X 4  18 1
 MPDR5202/MODUL 7 7.73

Dengan LSD:
2 sw2 2 18, 2 
Nilai dari t  t0,025;35
2, k  n 1
 2, 030 4,55  4,33 .
n 8
Dengan demikian selisih mutlak antar rata-rata yang lebih besar dari 4,33
adalah sebagai berikut.
X5  5 X 2  11,5 X1  14,5 X 4  18 X 3  19
X5  5 6,5* 9,5* 13* 14*
X 2  11,5 3 6,5* 7,5*
X1  14,5 3,5 4,5*
X 4  18 1
Keterangan *: signifikan dalam taraf nyata 0,05

Dengan Tukey HSD:


sw2 18, 2
Kita hitung HSD  q  3,82  5, 76 . Dengan demikian,
n 8
selisih mutlak antar rata-rata yang lebih besar dari 5,76 adalah sebagai
berikut:
X 5  5 X 2  11,5 X1  14,5 X 4  18 X 3  19
X5  5 6,5* 9,5* 13* 14*
X 2  11,5 3 6,5* 7,5*
X1  14,5 3,5 4,5
X 4  18 1
Keterangan *: signifikan dalam taraf nyata 0,05

Dengan Scheffemethod:
2 sw2 2 18, 2 
Kita hitung  4  F0,05;4,28 
 k  1 F ; k 1, k  n 1  7, 022
n 8
Dengan demikian, selisih mutlak antar rata-rata yang lebih besar dari
7,022 adalah sebagai berikut:
7.74 Statistika Pendidikan 

X5  5 X 2  11,5 X1  14,5 X 4  18 X 3  19
X5  5 6,5 9,5* 13* 14*
X 2  11,5 3 6,5 7,5*
X1  14,5 3,5 4,5
X 4  18 1
Keterangan *: signifikan dalam taraf nyata 0,05

5) Tabel lengkap ANOVA sebagai berikut


Sumber Dk SS MS  s 2 
Antar Kelompok 4 2392 598
Dalam Kelompok 20 3600 180

Tabel selisih mutlak rata-ratanya adalah sebagai berikut:


Kelompok C A D B E

C 20 22 23 33
A 2 5 13
D 3 11
B 8
sw2 180
Kita hitung HSD  q  3,96  23, 76 . Dari hasil ini dapat
n 5
diketahui bahwa yang berbeda hanyalah kelompok C dengan F.

Tes Formatif 2
1) Dari gambar dapat disimpulkan:
Secara keseluruhan grafik (a, b dan c) ada perbedaan dalam main effect
R (R1 selalu lebih tinggi dari R2), tetapi bagi main effect C tidak dapat
disimpulkan.
2) Hasil perhitungan dengan SPSS diperoleh tabel ANOVA adalah sebagai
berikut:
 MPDR5202/MODUL 7 7.75

Dependent Variable: SKOR


Type III Sum
Source df Mean Square F Sig.
of Squares
a
Corrected Model 13466.637 19 708.770 4.342 .000
Intercept 421515.613 1 421515.613 2582.091 .000
MAPEL 157.937 3 52.646 .322 .809
SISWA 10040.950 4 2510.238 15.377 .000
MAPEL * 3267.750 12 272.313 1.668 .097
SISWA
Error 9794.750 60 163.246
Total 444777.000 80
Corrected Total 23261.387 79
a. R Squared = .579 (Adjusted R Squared = .446)

Dari tabel di atas dapat disimpulkan bahwa:


a. Keempat mata pelajaran mempunyai kesulitan yang sama. Informasi
ini diperoleh dari nilai sig bagi MAPEL 0,809 yang lebih besar dari
0,05.
b. Berdasarkan siswa diperoleh informasi minimal ada dua siswa yang
berbeda diantara kelima siswa. Ini terlihat dari nilai sig. bagi siswa
sebesar 0,000 yang lebih kecil dari 0,05
c. Tidak ada interaksi antara MAPEL dengan siswa, ini terlihat dari
sig. bagi MAPEL*SISWA sebesar 0,097 yang lebih besar dari 0,05.

3) Dari hasil perhitungan diperoleh tabel ANOVA sebagai berikut:


Tests of Between-Subjects Effects
Dependent Variable:HASIL
Type III Sum
Source df Mean Square F Sig.
of Squares
a
Corrected Model 744.972 11 67.725 6.126 .000
Intercept 8250.694 1 8250.694 746.294 .000
VARITAS 194.056 2 97.028 8.776 .001
LOKASI 473.639 3 157.880 14.281 .000
VARITAS * 77.278 6 12.880 1.165 .357
LOKASI
Error 265.333 24 11.056
Total 9261.000 36
Corrected Total 1010.306 35
a. R Squared = .737 (Adjusted R Squared = .617)
7.76 Statistika Pendidikan 

Dari tabel di atas dapat diperoleh informasi bahwa


a. Minimal ada dua varietas yang memberikan hasil berbeda
b. Minimal ada dua lokasi yang memberikan hasil berbeda
c. Tidak ada interaksi antara lokasi dan jenis varietas terhadap daya
hasil

Test Formatif 3
1) Kondisi penelitian yang menyebabkan anakova menjadi penting dan
perlu digunakan adalah:
a. Peneliti ingin mengendalikan galat dan meningkatkan ketepatan
analisis.
b. Menyesuaikan atau mengoreksi rata-rata perlakuan dari variabel tak
bebas.
c. Membantu menafsirkan data, khususnya yang berkaitan dengan
pengaruh alamiah perlakuannya.
d. Menguraikan kovariat total atau jumlah hasil kali menjadi bagian-
bagiannya.
e. Menduga nilai yang hilang.
2) Hasil perhitungan dengan memperhatikan berat awal anak domba.
Sumber df SS MS F
Perlakuan 1 15,509 15,509 1,038
Galat 13 194,234 14,941

Karena F0,05 (1,13) = 4,67 lebih besar dari 1,038, maka hipotesis nol
diterima. Artinya dengan memperhatikan berat awal, pertambahan berat
badan kedua kelompok tidak menunjukkan perbedaan.
Apabila pengujian tanpa memperhatikan berat awalnya hasilnya adalah
sebagai berikut.

Sumber df SS MS F
Perlakuan 1 22,563 22,563 0,594
Galat 14 531,455 37,961

Karena F0,05 (1, 14) = 4,60, maka hipotesis nol juga diterima. Dari kedua
tabel tersebut, kesimpulan yang diperoleh adalah sama yakni menerima
hipotesis nol. Tetapi ada perbedaan dalam besar probabilitas penolakan
hipotesis nol (Anda hitung dengan SPSS), terlihat bahwa besar
 MPDR5202/MODUL 7 7.77

penolakan hipotesis nolnya jauh lebih besar dari perhitungan dengan


melibatkan berat awalnya.

3) Jika perhitungannya menggunakan SPSS, maka diperoleh hasil sebagai


berikut.
a. Dengan memperhatikan KMA sebagai kovariat

Tests of Between-Subjects Effects


Dependent Variable: Skor Tes
Type III Sum of
Source df Mean Square F Sig.
Squares
a
Corrected Model 1105.294 2 552.647 5.798 .009
Intercept 1073.273 1 1073.273 11.260 .003
KMA 1016.678 1 1016.678 10.667 .003
Model 57.792 1 57.792 .606 .444
Error 2192.245 23 95.315
Total 133230.000 26
Corrected Total 3297.538 25
a. R Squared = .335 (Adjusted R Squared = .277)

Dari tabel di atas terlihat bahwa besar penolakan hipotesis nolnya


adalah 0,444 yang jauh lebih besar dibandingkan dengan 0,05.
Dengan demikian dapat disimpulkan bahwa dengan memperhatikan
kemampuan awalnya, tidak ada perbedaan skor antara siswa pada
model A dengan siswa pada model B.
b. Jika tidak memperhatikan KMA

ANOVA
Skor Tes
Sum of Mean
df F Sig.
Squares Square
Between Groups 22.154 1 22.154 .327 .572
Within Groups 1623.846 24 67.660
Total 1646.000 25
Dari tabel di atas, besar signifikansi penolakan hipotesis nolnya
adalah 0,572. Artinya tidak ada perbedaan skor antara siswa pada
model A dengan Model B.
7.78 Statistika Pendidikan 

Daftar Pustaka

Dowdy, S. & Wearden, S. 1991. Statistcs for Research (second edition).


New York: John Wiley & Son.

Kerlinger, F. N. 2006. Asas-asas Penelitian Behavioral (terjemahan).


Jogjakarta: Gadjah Mada University Press.

Hogg, R. V. & Craigh, A. T. 1978. Introduction to Mathematical statistics


(fourth edition). New York: Mcmillan Publishing Co. Inc.

Minium, E. W., King, B. M. & Bear, G. 1993. Statistical Reasoning in


Psychology and Education. New York: Joh Wiley & Sons, Inc.

Purcell, E. J. & Vareberg, D. 1995. Kalkulus dan Geometri Integral. Alih


bahasa: I Nyoman Susila, Bana Kartasasmita & Rawuh. Jakarta:
Erlangga.

Spiegel, M. R. 1992. Statistik (Versi Metrik). Alih bahasa : I Nyoman Susila.


Jakarta: Erlangga.

Steel, R. G. D. & Torrie, J. H., 1995. Prinsip dan Prosedur Statistika. Suatu
Pendekatan Biometrik. Alih Bahasa: Bambang Sumantri. Jakarta:
Gramedia Pustaka Utama.

Sudjana, 1989. Metoda Statistika. Bandung: Tarsito.

Sugiyono, 2008. Statistika untuk Penelitian. Bandung: Alfabeta.

Walpole, R. E., 1995. Pengantar Statistika (edisi ke-3). Alih bahasa:


Bambang Sumantri. Jakarta : Gramedia Pustaka Utama.
Modul 8

Analisis Korelasi dan Regresi


Dr. Jarnawi Afgani Dahlan

PEN D AH U LU A N

P ada Modul 3 kita telah membahas tentang statistik deskriptif dari dua
distribusi, yakni korelasi dan regresi. Sebagaimana telah Anda ketahui
bahwa bahasan kedua dalam analisis statistika adalah inferensial. Pada
Modul 8 ini kita akan mempelajari lebih lanjut tentang korelasi dan regresi
secara inferensial. Sebagaimana analisis inferensial pada statistik lainnya,
analisis inferensial pada korelasi juga berkaitan dengan penaksiran dan
pengujian hipotesis. Dalam modul ini kita akan membahas keduanya, yakni
penaksiran dan pengujian hipotesis bagi korelasi.
Selain membahas korelasi Pearson, penyajian dalam modul ini
dilengkapi juga dengan analisis korelasi bagi data dengan skala pengukuran
nominal dan ordinal. Hal ini penting untuk dipahami, mengingat tidak semua
data dalam penelitian pendidikan mempunyai skala pengukuran interval atau
rasio. Ada beberapa korelasi lain yang digunakan untuk perhitungan pada
skala pengukuran nominal kategorial dan ordinal. Dalam modul ini hanya
dibahas 2 buah saja, yakni Kontingensi C dan Rank Spearman. Untuk
melengkapinya Anda dapat membaca referensi lain, sebagaimana yang ada
dalam daftar pustaka.
Penyajian berikutnya adalah regresi. Regresi membahas tentang
hubungan antara variabel-variabel dapat berupa hubungan yang memiliki
sebab dan akibat (kausalitas). Variabel yang menjadi sebab adalah “variabel
bebas” atau prediktor. Sedangkan variabel yang menjadi akibat adalah
“variabel terikat” atau respons. Langkah awal dalam analisis regresi adalah
menaksir atau menentukan persamaan regresi. Masalah tersebut sudah
dibahas juga dalam Modul 3. Dalam modul ini kita akan membahas lebih
mendalam, yakni pengujian apakah persamaan regresi tersebut fit (cocok)
dengan data, mengkaji besar pengaruh variabel bebas dalam model terhadap
variabel terikatnya (R2), serta uji asumsi-asumsi yang harus dilakukan dalam
analisis regresi.
8.2 Statistika Pendidikan 

Akhir dari pembahasan modul ini adalah korelasi parsial dan korelasi
ganda. Korelasi ini disimpan di akhir pembahasan bertujuan agar Mahasiswa
lebih mudah dalam memahaminya. Kedua korelasi tersebut sangat berkaitan
dengan regresi, dengan demikian lebih mudah dipahami jika keduanya
(korelasi dan regresi) telah dibahas.

A. DESKRIPSI SINGKAT

Modul ini terdiri dari dua kegiatan belajar. Kegiatan belajar pertama
merupakan kelanjutan dari Modul 3, yakni membahas pengujian inferensi
untuk analisis korelasi Pearson. Selain itu untuk melengkapi penyajian,
korelasi rank Spearman, dan kontingensi C. Pada Kegiatan Belajar 2
disajikan analisis lanjutan bagi regresi sederhana, yakni membahas koefisien
determinasi, pengujian untuk model regresi. Selain regresi sederhana, dibahas
juga regresi jamak (multiple). Pada penyajiannya dibahas penaksiran untuk
model persamaan regresi, koefisien determinasi, pengujian secara
keseluruhan, dan pengujian secara parsial (individual). Untuk melengkapi
pembahasan, pada akhir kegiatan disajikan tentang pengujian asumsi bagi
regresi, yakni normalitas residual, autokorelasi, dan homoskedastisitas.
Untuk melengkapi pembahasan, materi pada modul ini disajikan tentang
korelasi parsial dan pengujiannya, serta korelasi ganda.

B. RELEVANSI

Permasalahan dalam penelitian pendidikan sering melibatkan pengujian


hubungan 2 variabel atau lebih serta pengujian kausalitas. Peneliti perlu
mengetahui secara tepat uji asosiasi apa yang tepat digunakan sesuai dengan
skala pengukuran datanya. Pada umumnya, pasca pengujian asosiasi, apabila
dua atau lebih variabel mempunyai hubungan yang fungsional, maka peneliti
melakukan analisis regresi. Analisis regresi setidak-tidaknya memiliki 3
kegunaan, yaitu untuk tujuan deskripsi dari fenomena data atau kasus yang
sedang diteliti, untuk tujuan kontrol, serta untuk tujuan prediksi. Regresi
mampu mendeskripsikan fenomena data melalui terbentuknya suatu model
hubungan yang bersifat numerik. Regresi juga dapat digunakan untuk
melakukan pengendalian terhadap suatu kasus atau hal-hal yang sedang
diamati. Selain itu, model regresi juga dapat dimanfaatkan untuk melakukan
prediksi terhadap variabel terikat. Namun yang perlu diingat, prediksi di
 MPDR5202/MODUL 8 8.3

dalam konsep regresi mempunyai keterbatasan. Dan hal itu perlu dipahami
oleh peneliti.

C. TUJUAN INSTRUKSIONAL KHUSUS

Setelah mempelajari modul ini, mahasiswa diharapkan dapat:


1. Melakukan pengujian bagi korelasi Pearson
2. Menghitung korelasi parsial
3. Menghitung derajat korelasi bagi data ordinal melalui korelasi
Spearman, serta melakukan pengujian keberartiannya.
4. Menghitung derajat korelasi bagi data nominal melalui Kontingesi C dan
melakukan pengujiannya.
5. Menghitung koefisien regresi sederhana dan jamak melalui penaksir
Kuadrat Terkecil.
6. Menguji keberartian model regresi melalui uji keseluruhan (overall) dan
pengujian individual.
7. Menghitung koefisien determinasi.
8. Menghitung korelasi parsial dan ganda serta menginterpretasikannya.
8.4 Statistika Pendidikan 

Kegiatan Belajar 1

Analisis Korelasi

A. KORELASI PEARSON

Seperti dijelaskan di atas bahwa derajat hubungan antara dua variabel


dinyatakan dengan koefisien korelasi. Galton pertama kali menggunakan
simbolr untuk menyatakan koefisien korelasi sampel, dia sering
menuliskannya dalam bentuk rXY untuk menyatakan korelasi antara variabel
X dan Variabel Y. Ketika terdapat hubungan linear yang sempurna antara 2
variabel, maka nilainya adalah 1,0. Dan ketika tidak ada hubungan yang
linear, nilainya 0,0. Segera kita akan mengetahui bahwa besar koefisien
korelasi akan berada di antara 0,0 dan 1,0.
Tanda plus dan minus menyatakan arah dari korelasi (+) untuk
menyatakan korelasi positif, adanya hubungan searah dan () menyatakan
korelasi negatif; menyatakan hubungan yang berkebalikan, tanda (+ atau )
bukanlah derajat yang memberi makna bahwa korelasi positif lebih baik
dibandingkan dengan korelasi negatif. Dengan demikian koefisien korelasi
0,5 mempunyai indikasi yang sama artinya dengan +0,5.
Perlu diketahui bahwa walaupun nilai mutlak dari r menyatakan derajat
korelasi yang linear antara dua variabel, misalnya X dan Y, hal ini tidak
mengandung makna bahwa variasi dalam X menyebabkan variasi dalam Y
atau sebaliknya. Lebih jauh koefisien korelasi 0,50 tidak mengandung arti
asosiasinya 50%, korelasi bukanlah persentase, dan juga tidak berlaku
hubungan bahwa korelasi 0,50 mempunyai kekuatan dua kali lipat
dibandingkan korelasi 0,25. Jadi apa makna sebenarnya dari koefisien
korelasi?
Minium (1993) menjelaskannya melalui contoh korelasi antara skor SAT
dan Skor GPA mahasiswa baru yang besarnya +0,35. Makna korelasi dapat
dibandingkan dengan persentase kasus-kasus skor yang di atas median pada
variabel pertama dengan persentase skor di atas median pada variabel kedua.
Dalam kasus korelasi yang sempurna (perfect), semua kasus (data) di atas
median pada variabel pertama terjadi juga pada variabel kedua
(pasangannya). Manakala korelasinya nol (tidak ada asosiasi), hanya 50%
kasus di atas median pada variabel pertama juga pada variabel pasangannya.
 MPDR5202/MODUL 8 8.5

Hal ini mengindikasikan bahwa setengah skor yang di atas median pada
variabel pertama akan di bawah median pada variabel kedua.
Dalam kasus korelasi antara Skor SAT dan GPA mahasiswa baru di atas
yang besarnya +0,35 tabel di bawah menyatakan bahwa skor yang di atas
median pada SAT harapannya 61,2% juga akan terjadi pada skor GPA, dan
sisanya 38,8% akan mempunyai skor GPA di bawah median.
Untuk membantu Anda memaknai nilai korelasi sebagaimana dijelaskan
di atas, berikut disajikan tabel diambil dari Minium, dkk. (1993) yang Anda
telah pelajari pada Modul 3.

Tabel 8.1
Pemaknaan dari Korelasi Sejati

Kejadian-Kejadian yang Diharapkan


Korelasi Sejati pada Variabel yang Kedua (%)
Di atas median Di bawah median
0,00 50,0 50,0
0,10 53,1 46,9
0,20 56,2 43,8
0,30 59,5 40,5
0,35 61,2 38,8
0,40 63,0 37,0
0,50 66,5 33,5
0,60 70,5 29,7
0,70 74,3 25,5
0,80 79,3 20,7
0,90 85,3 14,7
1,00 100,0 0,0

1. Perhitungan Nilai Korelasi antara Dua Variabel


Untuk mengingatkan kembali perhitungan nilai dari koefisien korelasi
antara dua variabel dalam berbagai bentuk adalah sebagai berikut.
Perhitungan dari angka baku.

r
 Z x Zy
n 1
Dengan n adalah banyaknya pasangan skor X dan Y, dan Z adalah angka
baku.
Catatan : di beberapa buku, pembaginya adalah (n).
8.6 Statistika Pendidikan 

Perhitungan dengan simpangan

r
 xy
x y 2 2

Dengan
 X Y
 xy   XY  n
 X   Y 
2 2

x  X
2 2

n
dan  y   Y
2 2

n

Perhitungan dengan angka kasar


n XY   X  Y
r
 
n X 2    X  n Y 2    Y 
2 2

Sebagaimana telah dijelaskan di atas bahwa korelasi tidak menyatakan
“variasi dalam X menyebabkan variasi dalam Y”. Fakta bahwa X dan Y
harus mempunyai variasi yang sama tidaklah menjadi syarat cukup untuk
menyimpulkan bahwa terjadi hubungan sebab akibat (cause – and – effect).
Minium, dkk. (1993) memberi contoh kasus pada penelitian Sandra Scarr.
Scarr ingin mengetahui apakah teknik yang digunakan oleh seorang ibu untuk
mendisiplinkan anak-anaknya berkaitan dengan penyesuaian sosial di masa
yang akan datang anak-anaknya, intelegensia, dan keterampilan dalam
berkomunikasi. Melalui interview dan pengamatan pada ibu-ibu, dia
membedakan urutan pengukuran dari negatif (termasuk di dalamnya
hukuman fisik) hingga ke yang sangat positif (termasuk penjelasan sesuatu
terhadap anak). Teknik pendisiplinan yang baik berkorelasi positif dengan
semua variabel yang diuji di atas. Anak-anak yang tumbuh dengan ibu yang
menggunakan teknik disiplin yang baik lebih mampu menyesuaikan diri,
lebih pandai, dan lebih komunikatif. Jelaslah kesimpulannya adalah teknik
disiplin yang baik berpengaruh terhadap tingginya IQ anak-anak, serta lebih
terampil secara sosial.
Apakah korelasi positif yang ditemukan oleh Scarr merupakan hubungan
sebab – akibat? Tidak, terdapat banyak variabel lain yang mempengaruhi
penggunaan disiplin oleh ibu dan skor yang dicapai oleh anak-anak.
Faktanya, ketika Scarr mengukur IQ para ibu, dia menemukan bahwa
 MPDR5202/MODUL 8 8.7

keduanya berkorelasi positif (dengan jenis teknik disiplin dan IQ siswa).


Ketika faktor IQ ibu tidak diikutsertakan dalam perhitungan, ternyata tidak
ditemukan korelasi positif antara teknik disiplin dengan IQ anak-anak dan
keterampilan perilakunya. Ibu-ibu dengan IQ yang tinggi cenderung
menggunakan teknik disiplin yang baik dan mempunyai anak-anak yang IQ-
nya tinggi dan keterampilannya juga baik.

Contoh 8.1
Perhatikan kembali data tentang hasil pengukuran tingginya tekanan (Stress)
dan tingkat Kesulitan Makan (Eating Difficulty) yang diperoleh dari hasil
penelitian Bear (Minium, dkk., 1993).

Tabel 8.2
Data Stress dan Kesulitan Makan

Stress Kesulitan Makan


Siswa X2 Y2 XY
(X) (Y)
A 17 9 289 81 153
B 8 13 64 169 104
C 8 7 64 49 56
D 20 18 400 324 360
E 14 11 196 121 154
F 7 2 49 4 14
G 21 5 441 25 105
H 22 15 484 225 330
I 19 26 361 676 494
J 30 28 900 784 840
Jumlah 166 134 3248 2458 2610

Dari tabel di atas dapat dihitung


 X 
2
1662
x  X
2 2

n
 3248 
10
 492, 4

Y 
2
1342
 y2  Y 2  n
 2458 
10
 662, 4

  X   Y   2610  (166)(134)  385, 6


 xy   XY  n 10
8.8 Statistika Pendidikan 

Maka koefisien korelasinya adalah:

r
 xy 
385, 6
 0, 675
x y
2 2
(492, 4)(662, 4)

Dengan demikian ada hubungan positif (searah) antara Tingkat Stres (X) dan
Tingkat Kesulitan Makan (Y).
Cobalah Anda hitung dengan menggunakan dua rumus korelasinya lainnya!

2. Inferensi bagi Koefisien Korelasi


Pada bahasan di atas dan juga pada Modul 3, kita telah membahas
tentang nilai korelasi dari sampel, atau yang menjadi pembicaraan adalah
korelasi sebagai ukuran statistika deskriptif. Sebagaimana dalam statistika,
pasca dilakukan perhitungan statistika deskriptif dari korelasi (ukuran dalam
sampel), kita juga berkepentingan untuk mengetahui statistika inferensial
dalam korelasi ini. Dalam bahasan ini akan dibahas dua statistika inferensial
bagi koefisien korelasi, yakni penaksiran interval dan pengujian hipotesis.
Seperti ukuran-ukuran statistik lainnya, koefisien korelasi beragam dari
satu sampel ke sampel lainnya. Dalam penelitian, biasanya kita mengambil
sampel hanya “satu” di antara kemungkinan sampel-sampel lainnya. Jadi
nilai koefisien korelasi yang dihitung dari sampel dan kita ingin mengetahui
korelasi sebenarnya dalam populasi. Untuk itulah kita akan mengkajinya
dengan menggunakan teknik penaksiran dan pengujian hipotesis. Namun
sebelumnya kita bahas terlebih dahulu distribusi sampling dari r.
Seperti telah dikemukakan pada Modul 3 bahwa korelasi Pearson dari
variabel acak X dan Y dilambangkan dengan  XY . Apabila kita
menghitungnya dari sampel, maka koefisien korelasinya adalah rXY . Jika kita
mengambil sampel berukuran n, kemudian menghitung koefisien korelasinya,
r, kemudian mengembalikan lagi sampel ke populasinya, dan mengulanginya
secara terus sampai dengan tak hingga, maka nilai-nilai r yang diperoleh akan
membentuk suatu distribusi sampling dari r dengan rata-ratanya kurang lebih
 dan simpangan bakunya adalah
1  2
r 
n 1

Dari persamaan di atas dapat dilihat bahwa semakin besar ukuran sampel (n
besar), maka nilai simpangan baku dan distribusi sampling r akan makin
 MPDR5202/MODUL 8 8.9

kecil, artinya apabila kita mengambil sampel acak dengan jumlah yang besar.
Dan ketika nilai  meningkat besar, maka simpangan baku akan menjadi
kecil, artinya nilai r akan lebih tidak beragam dari sampel ke sampel apabila
korelasi sebenarnya cukup besar (kuat).
Secara teoritis distribusi sampling dari r tidak membentuk distribusi
normal. Apabila  = 0, maka kita peroleh distribusi yang simetris dan dapat
dikatakan akan mendekati normal. Namun ketika nilainya tidak nol, maka
distribusi sampling ini akan miring disebabkan nilainya tidak akan lebih kecil
dari -1 dan tidak akan lebih besar dari +1. Semakin besar nilai mutlak dari 
(mendekati 1), maka semakin miring bentuk kurvanya. Oleh karena itu,
dibutuhkan pendekatan lain untuk melakukan inferensi dari korelasi populasi.
Untuk beberapa masalah menurut Minium, dkk. (2003) kita dapat
menggunakan distribusi t-student sebagai model yang sesuai, dan bagi yang
lainnya transformasi r pada suatu variabel Z’ akan menawarkan solusi
terbaik.
Pendapat Minium di atas diperkuat jika oleh Steel dan Torrie (1995)
yang mengatakan bahwa nilai r sangat bervariasi untuk sampel-sampel kecil,
khususnya untuk  di atau dekat dengan nol. Sepasang nilai pengamatan
dapat mengubah nilai r besar sekali. Hal ini menyebabkan sulitnya
mendeteksi nilai  yang kecil bila sampelnya berukuran kecil. Untungnya
nilai  yang kecil mempunyai kegunaan praktis yang kecil pula.
Inferensi yang akan dibahas pertama dalam modul ini adalah penaksiran
interval bagi . Menurut Steel & Torrie (1995), cara yang mudah untuk
membuat selang kepercayaan bagi  adalah menggunakan tabel grafik yang
dibuat oleh David yang terlihat pada gambar berikut.
8.10 Statistika Pendidikan 

Sumber : Steel & Torrie (1995)

Gambar 8.1
Selang Kepercayaan bagi Koefisien Korelasi : P = 0,95

Untuk membuat selang kepercayaan  , tarik sebuah garis vertikal


melalui r pada “skala r”. Pada perpotongan garis ini dengan kedua kurva
pada gambar tersebut, sesuai dengan ukuran sampelnya. Kemudian tariklah
garis tegak lurus yang memotong “skala ”. Akhirnya kita peroleh interval
kepercayaan yang dimaksud. Sebagai contoh untuk kasus di atas, maka
dengan r = +0,675 dan n = 10, dengan derajat kepercayaan 95%, maka
diyakini bahwa selang kepercayaan bagi  adalah 0,08    0,90. Ini
sifatnya perkiraan, namun menurut Steel & Torrie (1995) grafik di atas sudah
dipandang memadai untuk kemudahan kita dalam menaksir selang
kepercayaan bagi . Walaupun dengan menggunakan tabel tersebut sudah
 MPDR5202/MODUL 8 8.11

dianggap cukup memadai, tetapi dapat memunculkan beberapa kekeliruan,


terutama bagi sampel yang ukurannya tidak ada pada grafik tersebut. Cara
lain dapat dilakukan secara analitik yang didasarkan pada Fisher dengan
menghitung nilai transformasi sebagai berikut
 1 r  1
Z   0,5ln    ln 1  r   ln 1  r  
 1 r  2
yang hampir menyebar normal dengan rata-rata dan simpangan bakunya kira-
1   1
kira 0,5ln   dan , tidak peduli berapa pun nilai . Nilai Z’
 1   n3
untuk berbagai nilai r diberikan dalam tabel transformasi Z yang ada dalam
lampiran. Untuk membuat selang kepercayaan bagi , pertama-tama buat
selang kepercayaan bagi rata-rata Z’, dan kemudian selang ini dikonversikan
bagi . Rumus konversinya adalah
 e2 Z   1 
r   2Z  
 e 1
Namun lebih mudah bila kita menggunakan tabel transformasi.
Sebagai ilustrasi kita kembali pada contoh kasus di atas dengan
r = + 0,675 dan n = 10. Dari data pada tabel tersebut kita peroleh
1 1
 Z    0,378
n3 10  3
1 r   1  0, 675   1, 675 
Z   0,5ln    0,5ln    0,5ln    0, 748
 1 r   1  0, 675   0,325 
Selang kepercayaan bagi Z’ adalah CI   Z    Z   Z 1   Z  . (CI: Confidence
2

Inteval) Dengan demikian, selang kepercayaan bagi nilai korelasi di atas, jika
dipilih  = 0,05 adalah CI  Z    Z   Z 1   Z   0, 748  1,96  0,378  
2

0, 748  0, 741 atau dapat juga ditulis sebagai CI  Z     0,007 ; 1, 49  .


Kemudian dari tabel transformasi dan dengan menggunakan interpolasi,
maka menghasilkan selang kepercayaan 95% bagi  adalah (0,0097 ; 0,904).
Statistika inferensial berikutnya adalah pengujian hipotesis bagi korelasi.
Untuk menguji hipotesis nol bahwa  sama dengan suatu nilai tertentu yang
berbeda dari nol, langkah pertama adalah melakukan transformasi agar
menghampiri kenormalan seperti di atas. Kemudian barulah dilakukan
pengujian berdasarkan sebaran normal. Rata-rata yang dihipotesiskan juga
harus ditransformasi. Tetapi apabila hipotesis nolnya adalah  = 0 (dan ini
8.12 Statistika Pendidikan 

merupakan pengujian yang banyak dilakukan), pengujiannya cukup


sederhana, yakni tinggal menghitung
n2
tr
1 r2
Dengan derajat bebasnya adalah (n – 2). Pengujian keberartian juga
dapat dilakukan dengan secara langsung membandingkan nilai r hitung
dengan r pada tabel kritis bagi r (ada pada lampiran) sesuai dengan derajat
bebas dan tingkat signifikansi yang dipilih. Keputusan yang diambil adalah
jika r hitung lebih besar daripada r tabel dengan dk, maka kita tolak hipotesis
nol.
Misalkan kita akan menguji hipotesis bahwa Stress (X) dan Kesulitan
Makan (Y) berkorelasi positif. Rumusan hipotesisnya adalah sebagai berikut.
H0 :  = 0 melawan H1 :  > 0. (ingat kembali bagaimana merumuskan
hipotesis).
Daerah penolakan H0 adalah t  t ( n2) . Dengan demikian, daerah
penolakannya adalah t  t0,05(6) atau t  1,943.
Kemudian kita hitung bahwa
82 6
t  0,75  0,675  (0,675)(3,320)  2, 24
1  0,6752
0,544

Karena thitung= 2,24 > 1,943, maka kita tolak H0. Dengan demikian, Stres dan
Kesulitan berkorelasi positif secara berarti pada taraf signifikansi 0,05. Dan
apabila kita gunakan tabel kritis bagi r, dengan  = 0,05 dan dk = 8,
diperoleh rtabel = 0,549. Karena rhitung= 0,675lebih besar dari0,549, maka kita
dapat menolak H0 pada taraf nyata 0,05. Kesimpulan yang diperoleh sama
dengan pengujian melalui statistik t.
Selain pengujian hipotesis secara tunggal terhadap nilai korelasi, kita
juga dapat melakukan pengujian perbandingan antara dua korelasi dari dua
kelompok yang saling bebas. Misalkan, Anda telah menghitung nilai korelasi
antara motivasi dan hasil belajar terhadap siswa perempuan sebesar +0,50,
dan terhadap siswa laki-laki +0,35 dengan masing-masing banyaknya siswa
perempuan yang diukur adalah 20 orang dan siswa laki-laki sebanyak 25
orang. Apakah ada perbedaan korelasi di antara kedua kelompok tersebut?
Sebagaimana pada uji beda dua rata-rata terhadap dua kelompok yang
saling bebas, maka kita harus menyusun hipotesis nol dan alternatifnya.
Penyusunan hipotesis alternatifnya mirip dengan uji beda rata-rata, dapat
 MPDR5202/MODUL 8 8.13

berarah (directional) ataupun tidak berarah (nondirectional). Hal ini sesuai


dengan kajian teori yang dilakukan oleh peneliti. Dengan demikian hipotesis
yang diuji adalah sebagai berikut.
H 0 : 1   2  0
H1 : 1   2  0 ( atau  )
Untuk mengujinya digunakan statistik z, dengan
 z  z   0
z 1 2
 z  z
1 2

Dengan nilai z’ menggunakan rumus


1   1
z   0,5ln    ln 1  r   ln 1  r 
 1   2
atau menggunakan tabel transformasi yang ada pada lampiran. Untuk
simpangan bakunya dihitung dengan
1 1
 z  z   .
1 2
n1  3 n2  3
Titik kritis untuk penolakan hipotesisnya dapat menggunakan tabel normal
baku dengan keputusan disesuaikan dengan hipotesis yang diujinya.
Sebagai contoh untuk kasus di atas, misalkan hipotesis yang diuji adalah
sebagai berikut
H 0 : 1   2  0
H1 : 1   2  0

Misalkan r1 = +0,50 dan r2 = +0,35, serta n1 = 20 dan n2 = 25. Maka


diperoleh
z1  ln 1  0,50   ln 1  0,50    0, 405   0, 693   0,549
1 1
2 2
z2  ln 1  0,35   ln 1  0,35    0,300   0, 431   0,366
1 1
2 2
Dan
1 1
 z  z    0,322
1 2
20  3 25  3
Dengan demikian kita peroleh
 z  z   0  0,549  0,366   0
z 1 2   0,568
 z1  z2 0,322
8.14 Statistika Pendidikan 

Jika kita pilih taraf signifikansi 0,05, maka titik kritisnya adalah
z  1,96 atau z  1,96 . Karena z-hitung berada di antara -1,96 dan 1,96,
maka kita terima Ho. Artinya tidak ada perbedaan korelasi di antara kedua
kelompok tersebut.
Menurut Minium, dkk. (1993) prosedur di atas hanya pada situasi
dimana kedua kelompok saling bebas (independent). Tidak ada kejelasan
bagaimana jika korelasinya diukur pada dua kelompok yang dipasangkan
(matched).

3. Pengukuran Korelasi Lainnya


Ukuran derajat hubungan yang telah dibahas di atas digunakan ketika
kedua variabel acaknya minimal mempunyai skala pengukuran interval
dengan asumsi normalitas distribusinya dipenuhi. Adapun jika skala
pengukuran salah satu variabelnya bukan interval atau rasio, maka aturan
korelasi Pearson tidak dapat diterapkan. Dengan demikian, kita perlu cara
lain agar tetap dapat menghitung derajat hubungan di antara dua variabel.
Tersedia ukuran-ukuran kordinasi nonparametrik baik untuk data
nominal maupun ordinal. Uji-uji ini tidak membuat anggapan apapun
mengenai bentuk populasi yang merupakan induk skor-skor tersebut. Selain
itu, untuk ukuran sampel-sampel kecil, perhitungan ukuran-ukuran korelasi
nonparametrik dan uji signifikansinya lebih mudah dibandingkan dengan
perhitungan r Pearson. Dalam kegiatan belajar ini hanya akan dibahas dua
jenis pengukuran korelasi melalui metode nonparamterik, yakni Kontingensi
C dan korelasi rank Spearman, sebagai wakil pengukuran bagi data kategorial
dan ordinal. Untuk uji-uji lainnya Anda disarankan membaca referensi yang
tercantum dalam daftar pustaka modul ini, seperti Siegel (1986).

4. Kontingensi C
Koefisien kontingensi C adalah ukuran kadar asosiasi atau relasi antara
dua himpunan atribut. Ukuran ini berguna khususnya apabila hanya
mempunyai informasi kategorial (nominal) mengenai satu di antara
himpunan-himpunan atribut. Misalkan, kita ingin mengetahui hubungan
antara jenis kelamin mahasiswa dengan pemilihan program studi pada
fakultas ilmu kependidikan. Kita ketahui bahwa jenis kelamin mempunyai
skala pengukuran nominal, begitu juga program studi pada fakultas ilmu
kependidikan. Contoh lain, misalkan level hasil belajar siswa kita kategori
menjadi sangat baik, baik, cukup, kurang, dan sangat kurang. Pihak lain kita
 MPDR5202/MODUL 8 8.15

dapat menggunakan pembelajaran melalui media kongkrit, media dengan


TIK (teknologi informatika dan komputer), atau tanpa media. Misalkan akan
diuji apakah ada hubungan antara jenis media dengan tingkat kemampuan
siswa dalam belajar matematika di sekolah dasar?
Untuk menggunakan uji kontigensi C tidak diperlukan anggapan
kontinuitas berbagai kategori yang digunakan untuk mengukur salah satu
atau kedua himpunan atribut. Pada kenyataannya kita tidak perlu menata
kategori-kategori itu dalam suatu cara atau urutan tertentu. Koefisien
kontingensi akan menghasilkan nilai yang sama bagaimanapun kategori-
kategori itu tersusun dalam baris-baris dan kolom-kolomnya.
Misalkan kita mempunyai dua kelompok kategori yang akan dihitung
derajat asosiasinya, sebut saja A1, A2, … , Ak dan B1, B2, … , Br. Kita susun
frekuensi-frekuensinya dalam suatu tabel kontingensi sebagai berikut.

Tabel 8.3
Bentuk Tabel Kontingensi untuk Menghitung C

A1 A2 … Ak Total
B1 (A1B1) (A1B2) … (AkB1)
B2 (A1B2) (A2B2) … (AkB2)

Br (A1Br) (A2Bk) … (AkBr)
Total N

Dalam tabel di atas (AiBj) menyatakan frekuensi teramati yang masuk


dalam kategori AiBj. Untuk memudahkannya, dalam beberapa buku ditulis
dengan Oij. Dari tabel dengan data hasil pengamatan, kita dapat memasukkan
frekuensi yang diharapkan untuk tiap selnya, misalkan Eij. Semakin besar
perbedaan antara harga-harga yang diharapkan (Eij) dengan harga-harga sel
yang teramati (Oij), maka akan semakin tinggi harga C, dan dengan demikian
makin besar pula tingkat asosiasi antara kedua variabel itu.
Tingkat asosiasi antara dua himpunan kategori (boleh terurut ataupun
tidak), dan tidak terpengaruh sifat dan hakikat variabelnya (dapat kontinu
atau diskrit) atau tidak terpengaruh oleh distribusi yang mendasari atribut itu
(populasinya berdistribusi normal atau tidak) dapat diketahui dari suatu tabel
kontingensi frekuensi, yakni
8.16 Statistika Pendidikan 

2
C
N  2

O  Eij 
2
r k
Dengan    2 ij

i 1 j 1 Eij
Artinya untuk menghitung C kita terlebih dahulu harus menghitung2 (chi-
square). Untuk lebih memahaminya perhatikanlah contoh berikut.

Contoh 8.2 (diambil dari Minium, dkk., 2003)


Misalkan diberikan data tentang Skor Kemampuan Mekanik dengan
keterampilan para pekerja di perusahaan-perusahaan otomotif seperti yang
terlihat pada tabel di bawah.

Tabel 8.4
Frekuensi Pengamatan antara Kemampuan
dan Keterampilan Mekanik Sumber

Skor Kemampuan Mekanik


30 - 49 50 - 69 Di atas 70
Keteram

Tidak terampil 20 30 10
pilan

Cukup terampil 10 40 30
Terampil 5 10 20
Hitunglah kaitan antara skor dalam kemampuan mekanik dengan
keterampilan dari para pekerja otomotif tersebut!
Langkah pertama kita lengkapi tabel di atas dengan sel yang memuat
frekuensi pengamatan (Oij) dengan frekuensi harapannya (Eij). Hasilnya
adalah sebagai berikut.

Tabel8.5
Tabel Kontingensi Frekuensi Pengamatan dan harapan dari
Kemampuan dan Keterampilan Pekerja

Skor Kemampuan Mekanik


Jumlah
30 - 49 50 - 69 Di atas 70
O E O E O E
Keteram

Tidak terampil 20 12 30 27.43 10 20.57 60


pilan

Cukup terampil 10 14.97 40 36.57 30 27.43 80


Terampil 5 7 10 16 20 12 35
Jumlah 35 80 60 175
 MPDR5202/MODUL 8 8.17

Untuk menghitung frekuensi harapan, misalkan Eij dilakukan sebagai berikut.


35  60
E11   12
175
80  60
E12   27, 43
175
Dan seterusnya.
Kemudian kita hitung harga 2 sebagai berikut.
O  Eij 
2
3 3
  
2 ij

i 1 j1 Eij
 20  12   30  27, 43 10  20,57  10  14,97   40  36,57 
2 2 2 2 2

     
12 27, 43 20,57 14,97 36,57
 30  27, 43 5  7 10  16   20  12 
2 2 2 2

  
27, 43 7 16 12
 5,333  0, 2411  5, 4325  1, 6518  0,3214  0, 2411  0,5714  2, 250  5,333
 21,376

Dari harga 2 di atas, maka koefisien korelasinya adalah sebagai berikut.


2 21,376
C   0,323 .
N 2
175  21,376

Jadi besar korelasi antara kemampuan dalam mekanik dengan kualitas


keterampilan pekerja di perusahaan tersebut adalah 0,323.
Langkah berikutnya adalah pengujian nilai korelasi yang diperoleh
melalui perhitungan di atas. Misalkan kita mengambil sampel secara random
dari suatu populasi, kita akan menentukan apakah asosiasi yang terdapat
antara dua himpunan skor yang berasal dari sampel itu memberi petunjuk
bahwa terdapat asosiasi dalam populasinya. Untuk menjawabnya, kita akan
menguji signifikansi dari asosiasi yang diperoleh dari sampel. Dalam menguji
signifikansinya, kita harus menyusun hipotesis nol bahwa tidak terdapat
korelasi dalam populasi itu, yakni harga observasi ukuran asosiasi dalam
sampel mungkin telah terjadi secara kebetulan dalam sampel yang dipilih
secara random dari populasi di mana kedua variabel tersebut tidak
berkorelasi.
8.18 Statistika Pendidikan 

Untuk menguji hipotesis nol yang telah disusun, sebagaimana lazimnya


dalam statistika, kita menentukan distribusi sampling statistiknya di bawah
hipotesis nol. Kemudian kita gunakan suatu tes statistik yang sesuai untuk
menetapkan apakah harga-harga observasi tes statistik itu secara beralasan
dapat dianggap telah terjadi di bawah hipotesis nol, dengan mengingat
tingkat signifikansi () yang telah dipilih. Jika kemungkinan yang berkaitan
dengan harga statistik yang diobservasi (p) sama dengan atau kurang dari
tingkat signifikansi yang dipilih, p <, maka kita putuskan menolak hipotesis
nol dan menyimpulkan bahwa asosiasi yang diobservasi dalam sampel bukan
hanya hasil kebetulan melainkan mewakili hubungan yang sungguh-sungguh
terdapat dalam populasinya. Tetapi sebaliknya, jika tes statistik menunjukkan
adanya kemungkinan bahwa harga yang diobservasi nilainya lebih besar atau
sama dengan tingkat siginifikansi, p , maka kita putuskan bahwa tidak ada
suatu hubungan antara variabel-variabel dalam populasi yang merupakan asal
sampelnya.
Ada sifat kekhususan dalam asosiasi dari kontingensi C ini, biasanya
distribusi sampling sebagaimana yang dijelaskan di atas, menggunakan
distribusi dari statistiknya. Misalnya r-Pearson, ketika kita melakukan
pengujian hipotesisnya, maka kita mengambil distribusi sampling dari r.
Namun dalam pengujian asosiasi dengan kontingensi C, pengujian tidak
menggunakan distribusi sampling C. Siegel (1986) memberikan alasan
bahwa terdapat kerumitan-kerumitan matematik yang cukup banyak. Namun
alasan yang lebih baik menurutnya adalah dalam kerja kita menghitung C,
kita menghitung suatu statistik yang sudah dengan sendirinya mengandung
petunjuk yang sederhana dan memadai mengenai signifikansi C. Tentu saja
statistik yang menjadi petunjuk itu adalah 2. Kita dapat menguji apakah
suatu C observasi berbeda secara signifikan sebagai akibat kebetulan, hanya
dengan menentukan apakah 2 untuk data itu signifikan atau tidak. Dengan
demikian, pengujian signifikansi dari C, dapat terpenuhi melalui pengujian
nilai 2 yang bersesuaian.
Untuk sebarang tabel kontingesi r  k kita dapat menentukan
signifikansi dari derajat asosiasinya dengan menetapkan kemungkinan yang
berkaitan dengan terjadinya, di bawah H0, harga-harga sebesar nilai 2,
dengan derajat bebas, dk   k  1 r  1 . Jika kemungkinan (p) yang
diperoleh sama atau kurang dari tingkat signifikansi yang dipilih ( ), maka
kita dapat menolak H0 pada tingkat signifikansi tersebut. Itu artinya asosiasi
antara kedua variabel dalam populasinya tidaklah nol.
 MPDR5202/MODUL 8 8.19

Misalkan kita akan menguji besar korelasi dari kemampuan dan


keterampilan pekerja dari contoh di atas dengan nilai C  0,323 dan
c2  21,376. Misalkan kita anggap bahwa para pekerja tersebut merupakan
sampel acak dari populasi para pekerja otomotif. Kita dapat menguji apakah
kemampuan pekerja dalam bidang otomotif berhubungan atau berkaitan
dengan level keterampilan di dalam populasi itu. Pengujian dilakukan
terhadap harga dari  2  21,376. Misalkan kita pilih  = 0,05. Dari tabel
Chi-Square (lihat lampiran) dengan dk   3 –1   3 –1  4, diperoleh 2
tabel = 9,49. Karena harga 2 = 21,376 jauh lebih besar dari 2 tabel = 9,49,
maka kita dapat menolak hipotesis nol. Dengan demikian dapat disimpulkan
bahwa ada kaitan yang berarti antara kemampuan dalam mekanika dengan
level keterampilan pekerja dalam perusahaan otomotif.
Beberapa hal perlu dipertimbangkan dalam penerapan kontingensi C ini.
Menurut Siegel (1986) ada beberapa keterbatasan dan kekurangan dari
statistik ini. Pertama, koefisien ini secara teoritis tidak mencapai batas-batas
sebagaimana koefisien korelasi r-Pearson. Koefisien C memiliki sifat yang
sama dengan korelasi lainnya, yakni akan bernilai nol ketika tidak ada
asosiasi antara dua variabelnya, tetapi tidak dapat mencapai satu.
Batas atas koefisien kontingensi adalah fungsi dari banyak kategori. Jika
k = r batas-batas untuk C, yakni jika korelasinya sempurna, nilai maksimum
k 1
dari C adalah . Misalnya harga maksimum bagi C untuk tabel
k
k 1 1
kontingensi 2 × 2 adalah   0, 707 . Untuk tabel 3 × 3, maka
k 2
k 1 2
harga maksimum bagi C adalah   0,816 . Kenyataan bahwa
k 3
batas-batas C bergantung dari ukuran k dan r menciptakan keterbatasan C
yang kedua, yakni dua koefisien kontingensi tidak dapat dibandingkan jika
keduanya tidak dihasilkan dari tabel-tabel kontingensi yang berukuran sama.
Keterbatasan yang ketiga dari C adalah datanya harus sesuai untuk
kemungkinan perhitungan 2 sebelum digunakan untuk menghitung C
dengan tepat. Ingat bahwa dalam perhitungan 2 mempunyai syarat sel-
selnya yang mempunyai frekuensi harapan (Eij) kurang dari 5 tidak lebih dari
20%, serta tidak satu pun sel-selnya mempunyai frekuensi harapan kurang
dari 1.
8.20 Statistika Pendidikan 

Keterbatasan keempat dari kontingensi C ini adalah ukuran dari C tidak


dapat dibandingkan secara langsung dengan ukuran korelasi manapun,
misalnya r Pearson, r Spearman, atau r Kendall.
Dari keterbatasan-keterbatasan di atas, maka kita tidak usah
mengharapkan korelasi kontingensi ini akan sangat kuat dalam melacak
hubungan di dalam populasi. Namun menurut Siegel (1986), karena
perhitungannya yang mudah serta bebasnya sama sekali dari asumsi-asumsi
yang mengikat, maka menyarankan pada kita untuk menggunakannya
manakala ukuran-ukuran korelasi yang lain tidak dapat diterapkan.

5. Koefisien Korelasi Rank Spearman (rs)


Korelasi Rank Spearman atau disingkat dengan Korelasi Spearman
merupakan korelasi yang secara matematik ada kaitannya dengan r Pearson.
Dan menurut Siegel (1986), perhitungan korelasi atas ranking (urutan) ini
merupakan paling awal dikembangkan dan mungkin paling dikenal dengan
baik.
Statistik ini dikenal juga dengan nama rho yang mengukur derajat
asosiasi antara dua variabel yang diukur dengan sekurang-kurangnya
mempunyai skala ordinal, sehingga objek-objek dapat diurutkan sesuai
dengan skor yang diperolehnya. Misalkan kita telah mengambil data dari N
objek (individu), kemudian kita rangking berdasarkan skor-skornya. Sebut
saja untuk rangking variabel pertama adalah X1 , X 2 ,, X N dan rangking
untuk variabel kedua adalah Y1 , Y2 ,, YN . Secara intuisi, kita akan
memahami bahwa korelasi antara kedua variabel tersebut akan sempurna
apabila Xi = Yi untuk semua i. Oleh karena itu, masuk akal apabila kita
menggunakan selisih-selisih di  X i  Yi sebagai alat untuk melihat
perbedaan kedua himpunan rangking tersebut.
Selanjutnya, dalam menghitung suatu koefisien korelasi akan
“canggung” jika menggunakan harga-harga di secara langsung. Satu kesulitan
adalah bahwa di negatif akan menghapuskan di yang positif ketika kita
berusaha menentukan jumlah perbedaannya. Untuk itulah, kita menggunakan
nilai kuadrat dari di, yakni di2 , dalam perhitungan korelasi dan hal ini
sekaligus mengatasi masalah harga-harga di. Jelaslah bahwa makin besar
harga-harga di2 , maka makin besar pula  di2 .
Penjabaran rumus perhitungan koefisien korelasi Spearman ini cukup
sederhana. Dalam korelasi Pearson kita telah mendefinisikan bahwa
 MPDR5202/MODUL 8 8.21

x  X  X dan y  Y  Y
Dan rumus korelasinya adalah

r
 xy
x y 2 2

Sekarang misalkan X dan Y adalah harga-harga rangking r = rs dan


sebagaimana kita ketahui bahwa jumlah N bilangan asli pertama(1 + 2 + 3 +
… + N) adalah
N  N  1
X  2
Dan jumlah N kuadrat dari bilangan asli pertama (1 2 + 22 + … + N2)
N  N  1 2 N  1
adalah  X 2 
6
Dan oleh karena berlaku identitas
 X 
2

 x   X  X    X
2
2 2
 , maka
N
N  N  1 2 N  1 N  N  1
2
N3  N
 x2  6

4

12
.

Kemudian, karena
d  x y
d 2   x  y   x 2  2 xy  x 2 , dengan kelinearan notasi sigma, maka
d 2
  x   y  2 xy
2 2

Dan karena

r
 xy  rs
x y 2 2

Jika observasi-observasi itu diurutkan (rangking). Oleh karena itu, diperoleh


d 2
  x2   y 2  rs x  y 2 2
. Dengan demikian kita peroleh

 x   y d
2 2 2
N3  N
rs  , jika kita substitusikan x 2
   y2
2 x y 2 2 12

ke persamaan di atas,maka diperoleh


8.22 Statistika Pendidikan 

N3  N N3  N
 d2
rs  12 12
 N3  N  N3  N 
2   
 12   12 
 N3  N 
 d
2
2
  
12
 N3  N 
2 
 12 
6 d 2
 1
N3  N
Dengan demikian, harga dari koefisien korelasi rank Spearman (rs) adalah
N
6 d i2
rs  1  i 1

N3  N
Untuk memberikan pemahaman dalam perhitungannya, perhatikan
kembali contoh tentang korelasi antara Stress (X) dengan Kesulitan Makan
(Y) yang telah dihitung menggunakan r-Pearson dengan datanya adalah
sebagai berikut.
Tabel 8.6
Skor Stress (X) dan Kesulitan Makan (Y)

STERSS Kesulitan Makan


Siswa
(X) (Y)
A 17 9
B 8 13
C 8 7
D 20 18
E 14 11
F 7 2
G 21 5
H 22 15
I 19 26
J 30 28
Jumlah 166 134
 MPDR5202/MODUL 8 8.23

Langkah pertama kita susun tabel rangking dan selisih kuadrat


rangkingnya sebagai berikut.

Tabel 8.7
Tabel Bantuan Perhitungan Korelasi Rank Spearman

Rangking
Siswa Stress Kesulitan Makan di di2
(X) (Y)
A 5 4 1 1
B 2.5 6 -3.5 12.25
C 2.5 3 -0.5 0.25
D 7 8 -1 1
E 4 5 -1 1
F 1 1 0 0
G 8 2 6 36
H 9 7 2 4
I 6 9 -3 9
J 10 10 0 0
Jumlah 64.5

Dari tabel di atas, maka kita peroleh harga rs sebagai berikut


6 d 2 6  64,5  387
rs  1  3  1 3  1  1  0,391  0, 609
N N 10  10 990
Jadi dengan menggunakan r-Spearman, nilai korelasinya adalah 0,609.
Sebagaimana dalam korelasi Pearson, langkah berikutnya adalah
pengujian harga korelasi dari rs. Misalkan kita menghitung rs dari subjek-
subjek yang diambil secara acak. Kita akan menguji hipotesis nol bahwa
kedua variabel yang dianalisis tidak berkorelasi dalam populasinya. Teknik
pengujiannya dapat menggunakan tabel harga-harga kritis r untuk N dari 4
hingga 30. Selain itu, untuk N  10, kita dapat menggunakan statistik
t-student dengan
N 2
t  rs dengan derajat bebas dk = N – 2
1  rs2
Untuk tabel harga-harga kritis (dapat dilihat pada lampiran), merupakan
tabel satu sisi, artinya kemungkinan-kemungkinan yang dinyatakan itu
berlaku jika harga observasi rs ada dalam arah yang diramalkan, boleh positif
8.24 Statistika Pendidikan 

atau negatif. Keputusannya adalah jika harga nilai mutlak observasi rs sama
dengan atau lebih besar dari harga tabel yang bersesuaian dengan N dan taraf
signifikansi yang dipilih, maka kita menolak hipotesis nol, dan sebaliknya
jika harga nilai mutlak obeservasi rs kurang dari harga tabel, maka kita
terima hipotesis nol. Adapun pengujian menggunakan statistik t-student,
pengambilan keputusan seperti yang telah dipelajari dalam r-Pearson.
Sebagai contoh untuk kasus di atas, misalkan kita akan menguji bahwa
ada kaitan yang positif antara Stress (X) dan Kesulitan Makan (Y), dan kita
telah menghitungnya rs = 0,609. Jika kita pilih  = 0,05, maka dari tabel
harga-harga kritis rs diperoleh r-tabel = 0,564, nilainya lebih kecil dari harga
rs. Dengan demikian, kita dapat menolak hipotesis nol. Artinya terdapat
kaitan yang positif antara Stress (X) dengan kesulitan makan (Y).
Selanjutnya, misalkan kita lakukan pengujian dengan statistik t-student
dengan hipotesis nol yang diujinya sama. Kita hitung nilai statistiknya
sebagai berikut
N 2 10  2
t  rs  0, 609  0, 609(3,566)  2,172
1  rs 1   0, 609 
2 2

Dengan memilih  = 0,05, dari tabel t-student diperoleh


t ,dk  t(0,05)(8)  1,860 . Karena t-hitung = 2,172 lebih besar dari harga t-tabel
pada  = 0,05, maka kita dapat menolak H0. Artinya ada korelasi yang positif
antara Stress (X) dengan Kesulitan Makan (Y). Kesimpulan hasil pengujian
ini sama dengan kesimpulan yang diperoleh dari tabel harga-harga kritis rs.

B. PERHITUNGAN KORELASI PEARSON DAN SPEARMAN


DENGAN SPSS

Terakhir dari pembahasan Kegiatan Belajar 1 ini adalah perhitungan


korelasi dengan SPSS. Perhitungan korelasi secara parametric dan
nonparametric dapat dilakukan sekaligus. Misalkan kita akan menghitung
kembali contoh di atas dengan r Pearson dengan r Spearman melalui SPSS.
Langkah pertama, input data seperti yang terlihat dalam gambar berikut.
 MPDR5202/MODUL 8 8.25

Gambar 8.2
Penyajian Data dalam SPSS untuk Perhitungan Korelasi

Kemudian, untuk analisis korelasinya KLIK Analyzed > Correlate >


Bivariate, maka akan muncul kota dialog sebagai berikut.

Gambar 8.3
Kotak Dialog Perhitungan Korelasi Bivariat
8.26 Statistika Pendidikan 

Masukkan variabel X dan Y ke dalam kotak variables, kemudian pilih


statistik ujinya, Kita pilih Pearson dan Spearman sebagaimana yang akan
dilakukan. Pilih juga Test of Signifinace sesuai dengan hipotesis yang diuji.
Sesuai dengan kasus di atas, kita pilih One-tailed dengan cara KLIK. Untuk
option dan lainnya kita abaikan, dan KLIK OK. Hasilnya adalah sebagai
berikut.
Tabel 8.8
Hasil Perhitungan Korelasi Pearson

Correlations
X Y
X Pearson Correlation 1 .675*
Sig. (1-tailed) .016
N 10 10
Y Pearson Correlation .675* 1
Sig. (1-tailed) .016
N 10 10
*. Correlationissignificantatthe 0.05 level (1-tailed).

Koefisien korelasi r Pearson untuk data di atas adalah 0,675 (sesuai dengan
apa yang telah kita hitung) dengan probabilitas penolakan hipotesis nolnya
adalah 0,016. Jika kita memilih  = 0,05, harga sig. (1-tailed) = 0,016 lebih
kecil dari . Dengan demikian dapat disimpulkan bahwa ada hubungan yang
positif antara Stress dengan Kesulitan Makan.
Jika kita analisis dengan nonparametric, dalam hal ini r Spearman,
hasilnya adalah sebagai berikut.

Tabel 8.9
Hasil Perhitungan Korelasi Spearman

Correlations
X Y
Spearman'srho X Correlation Coefficient 1.000 .608*
Sig. (1-tailed) . .031
N 10 10
Y Correlation Coefficient .608* 1.000
Sig. (1-tailed) .031 .
N 10 10
*. Correlationissignificantatthe 0.05 level (1-tailed).
 MPDR5202/MODUL 8 8.27

Hasil dari perhitungan pada tabel di atas adalah rs = 0,608, dengan peluang
penolakan hipotesis nolnya adalah 0,031. Jadi jika kita memilih  = 0,05,
maka kita menolak H0. Kesimpulan ini sama dengan pengujian melalui
Pearson, yakni ada hubungan yang positif antara Stress dengan Kesulitan
Makan.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!

1) Untuk pasangan-pasangan variabel berikut, tentukan harapan hubungan


keduanya, positif, negatif atau nol.
a. Tinggi dan berat badan anak sekolah dasar kelas VI.
b. Tinggi badan dan intelegensia orang dewasa
c. Usia pasangan suami dan istri
2) Misalkan diketahui dua skor kuis yang diikuti oleh 7 siswa dengan skor
kuis pertama (X) dan skor kuis kedua (Y).

Siswa A B C D E F G
SKOR X 3 9 7 8 4 6 7
SKOR Y 2 7 8 6 6 5 7

a. Gambarlah diagram pencar, bagaimana kemungkinan arah


hubungan kedua skor tersebut?
b. Hitung nilai korelasinya, r, dalam dua tempat desimal menggunakan
rumus penyimpangan!
c. Hitung nilai korelasinya, r, dalam dua tempat desimal dengan
menggunakan rumus angka kasar!
d. Apakah hasil yang diperoleh dari b) dan c) secara eksak sama?
Jelaskan ! manakah yang menurut Anda cara yang paling mudah?
3) Untuk r = +0.25, tentukanlah selang kepercayaan 95% bagi  ketika:
a) n = 10, b) n = 20,c) n = 40, dan d) n = 80.
4) Misalkan koefisien korelasi antara skor verbal SAT (scholastics aptitude
test) dan IQ adalah +0,50. Tentukanlah z skor pada tes verbal SAT agar
diperoleh z skor bagi IQ
8.28 Statistika Pendidikan 

a. +3,00
b. –2,00
c. 0,00
d. –1,00
e. +1,00
f. –0,500
4) Dari 10 mahasiswi (perempuan) yang mengikuti kuliah statistika,
diketahui korelasi antara kemampuan matematika dan skor hasil
ujiannya adalah 0,5. Sedangkan untuk 10 mahasiswa (laki-laki) besar
korelasinya 0,3. Seseorang beranggapan bahwa korelasi antara kedua
variabel (kemampuan matematika dan hasil ujian statistika) untuk
mahasiswi lebih kuat dibandingkan dibandingkan dengan mahasiswa,
berikan alasan!
5) Seorang guru ingin mengetahui apakah ada kaitan antara pengukuran
sikap yang diperoleh siswa dengan jenis kelamin siswanya di
sekolahnya. Dia menghitung modus dari masing-masing sikap anak
berdasarkan jenis kelaminnya terhadap sebagian siswa di sekolahnya,
hasilnya adalah sebagai berikut.

Sikap
Jenis Kelamin Sangat Sangat
Baik Kurang
Baik Kurang
Laki-Laki 7 23 19 12
Perempuan 3 14 18 10

Catatan:
a. data rekayasa.
b. Frekuensi pengamatan menunjukkan banyaknya siswa yang
mempunyai modus tertentu berdasarkan jenis kelamin. Misalkan
pada O11 = 7, artinya ada 7 siswa laki-laki yang mempunyai modus
dengan sikap sangat baik.
1) Tetapkan hipotesis yang ingin diuji oleh guru tersebut!
2) Apakah ada kaitan antara jenis kelamin dengan sikap siswa di
sekolah tersebut?
 MPDR5202/MODUL 8 8.29

Petunjuk Jawaban Latihan

1) a) Positif, b) nol, c) positif


2) a) Grafiknya adalah sebagai berikut

b) Tabel pembantu perhitungan


No X Y XY X^2 Y^2 x^2 y^2 xy
1 3 2 6 9 4 10,82 14,90 12,66
2 9 7 63 81 49 7,34 1,30 3,10
3 7 8 56 49 64 0,50 4,58 1,54
4 8 6 48 64 36 2,92 0,02 0,24
5 4 6 24 16 36 5,24 0,02 –0,32
6 6 5 30 36 25 0,08 0,74 0,24
7 7 7 49 49 49 0,50 1,30 0,82
Jumlah 44 41 276 304 263 27,43 22,86 18,29
Rata-Rata 6,29 5,86
Dari tabel di atas, maka dapat dihitung
7(276)  (44)(41)
Dengan Angka Kasar: rXY   0, 730
 7((304)  442  7(263)  412 
18, 29
Dengan Simpangan : rXY   0, 730
 27, 43 22,86
3) Gunakan grafik gambar 1 modul 8, selang perkiraannya adalah
a. untuk n = 10, maka selang kepercayaannya: –0,42 ≤  ≤ +0,70
b. untuk n = 20, maka selang kepercayaannya: –0,21 ≤  ≤ +0,61
8.30 Statistika Pendidikan 

c. untuk n = 50, maka selang kepercayaannya: –0,03 ≤  ≤ +0,43


d. untuk n = 100, maka selang kepercayaannya: +0,05 ≤  ≤ +0,42
Dengan derajat kepercayaan yang sama, makin besar ukuran sampel
maka makin kecil interval bagi penaksir untuk .
  rZ SAT , maka prediksi bagi z skor IQ adalah:
4) Misalkan Z IQ
a) +1,5;
b) –1,0;
c) 0,00;
d) –0,5;
e) +0,5;
f) –0,25
5) Hipotesis yang diuji adalah:
H0 : Tidak ada kaitan antara Jenis kelamin dengan Sikap seseorang
H1 : Ada kaitan antara jenis kelamin dengan sikap seseorang
Karena datanya nominal kategorial, maka pengujian dilakukan dengan
kontinegasi C.
Tabel untuk membantu perhitungannya sebagai berikut.
Sikap
Jenis
Jumlah
Kelamin Sangat
Sangat Baik Baik Kurang
Kurang
Laki-Laki 7.00 5.75 23.00 21.29 19.00 21.29 12.00 12.66 61.00
Perempuan 3.00 4.25 14.00 15.71 18.00 15.71 10.00 9.34 45.00
Jumlah 10.00 37.00 37.00 22.00 106.00

Dari tabel di atas dapat dihitung bahwa  2  1,62 dan dengan demikian
2 1,62
besar asosiasinya adalah C    0,123 .
N 2
106  1,62
Besar korelasi di atas sangat kecil, dan berdasarkan nilai chi-square
hitungnya dengan dk = 3 diperoleh besar signifikansi penolakan
hipotesis nolnya adalah 0,345 yang jauh lebih besar dari 0,05. Dengan
demikian tidak ada kaitan antara jenis kelamin dengan jenis sikap yang
diberikan.
 MPDR5202/MODUL 8 8.31

R A NG KU M AN

Sebagaimana dalam statistika, bahwa koefisien korelasi yang


diperoleh dari sampel perlu diuji keberartiannya. Hal ini membawa kita
pada statistika inferensial, yakni penaksir interval bagi  dan pengujian
hipotesisnya. Penaksir interval bagi dapat menggunakan dua cara,
yakni pertama menggunakan tabel/gambar yang dibuat oleh David, dan
yang kedua menggunakan cara analitik, yakni menghitung z’ sebagai
transformasi bagi r. Dari z’ itulah kita dapat menentukan taksiran
interval bagi .
Untuk pengujian hipotesis bagi . Langkah pertama perlu dipastikan
hipotesis yang diuji apakah berarah atau tidak berarah. Karena susunan
hipotesis ini akan berpengaruh terhadap daerah kritis penolakan hipotesis
nol. Sedangkan statistik uji yang digunakan adalah statistik t-student
dengan dk = n – 2.
Untuk pengujian perbandingan korelasi antara dua kelompok,
pengujiannya hanya dilakukan untuk dua kelompok yang saling bebas
(independent). Pengujian dilakukan mirip dengan uji beda rata-rata dua
kelompok saling bebas. Adapun statistik ujinya adalah statistik z.
Untuk skala pengukuran nominal katagorial, derajat asosiasi antara
dua variabelnya menggunakan kontingensi C. Statistik ini cukup mudah
dalam proses perhitungannya, namun perlu kehati-hatian karena ada
beberapa keterbatasan. Selain itu, kita tidak boleh membandingkan nilai
korelasi kontingensi C dengan yang lainnya ketika tabel kontingensinya
berukuran berbeda. Pengujian hipotesis dalam uji kontingensiC
menggunakan uji chi-square.
Untuk data minimal skala ordinal, pengukuran asosiasi dapat
menggunakan korelasi Spearman atau Kendal . Korelasi Spearman
dikembangkan dari Korelasi Pearson, dengan menggunakan selisih
kuadrat rangking  d i2  sebagai alat dalam perhitungannya. Pengujian
hipotesis ini sama dengan korelasi Pearson, yakni dapat menggunakan
tabel nilai kritis atau menggunakan statistik t-student.
8.32 Statistika Pendidikan 

TES F OR M AT IF 1

Pilihlah satu jawaban yang paling tepat!

1) Sebuah sampel acak berukuran n = 24 menghasilkan r = –0,37.


a. Tentukan interval kepercayaan 95% bagi ! Bagaimana jika derajat
kepercayaannya 99%
b. Uji hipotesis H0 :  = 0 melawan H1 :  < 0!
sangat berarti pada taraf signifikansi 0,05.
2) Berikut disajikan data skor matematika dan IPA dari dua kelompok
siswa laki-laki dan perempuan yang diambil secara sampling dari siswa
kelas IV.
Mat 55 56 78 80 87 45 78 76 90 87
Laki Laki
IPA 65 60 70 82 88 57 65 80 85 90
MAt 65 67 70 75 80 90 50 44 50 55
Perempuan
IPA 70 75 75 74 85 95 60 50 55 60
a.
Hitunglah korelasi Pearson pada masing-masing kelompoknya!
b.
Lakukan pengujian bahwa ada korelasi yang positif antara skor
Matematika dengan IPA pada masing-masing kelompoknya !
c. Lakukan pengujian, apakah ada perbedaan korelasi di antara kedua
kelompok!
3) Dalam suatu penelitian dilaporkan bahwa r = + 0,75 yang diperoleh dari
6 kasus (responden). Apakah nilai korelasi tersebut berarti? Berikan
komentar. Dalam suatu penelitian lainnya dilaporkan bahwa nilai
korelasinya adalah +0,12 yang didasarkan atas 500 responden. Apakah
korelasi tersebut signifikan berbeda dari nol? Berikan komentar!
4) Seorang guru ingin mengetahui apakah ada kaitan antara sikap dan
kemampuan kognitif siswa dalam model pembelajaran tematik yang
telah dikembangkannya? Dia mengembangkan angket untuk mengukur
sikap siswa dan tes hasil belajar untuk mengukur kemampuan kognitif
siswa, hasilnya adalah sebagai berikut.
Siswa A B C D E F G H I J K L M N O
Sikap 100 112 120 108 120 90 95 100 105 115 90 98 85 90 100
Kognitif 75 80 80 78 80 84 75 78 70 90 60 65 55 75 70
Gunakan uji statistik yang paling tepat untuk mengujinya!
 MPDR5202/MODUL 8 8.33

5) Baru-baru ini untuk meningkatkan disiplin siswa, pimpinan sekolah


mengeluarkan aturan baru. Sebelum ditetapkan, pihak sekolah
menyosialisasikan dan meminta respons orang tua siswa terhadap aturan
tersebut. Untuk itu, pihak sekolah mengambil sampel secara acak strata
terhadap orang tua siswa kelas I sampai dengan kelas VI secara
proporsional. Tanggapan orang tua siswa tersebut adalah sebagai berikut.
Respons Orang Tua
Setuju Tidak Setuju Tidak Peduli
I 20 9 5
II 15 10 8
Kelas

III 14 12 10
IV 16 10 8
V 16 8 12
VI 8 10 6
Catatan : data rekayasa
Uji apakah ada kaitan antara orang tua siswa berdasarkan kelas
menentukan pendapat peraturan baru tersebut!

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 20. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut
untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan
Belajar 1.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang
belum dikuasai.
8.34 Statistika Pendidikan 

Kegiatan Belajar 2

Analisis Regresi

A. REGRESI LINEAR SEDERHANA

Dalam banyak penelitian, kita sering menyelidiki bagaimana perubahan-


perubahan pada suatu variabel mempengaruhi variabel lainnya. Adakalanya,
dua variabel dikaitkan dengan suatu garis lurus yang pasti. Misalnya, jika
tahanan R suatu rangkaian listrik sederhana dibuat tetap, kuat arus I akan
V
berubah-ubah mengikuti tegangan V, sebab menurut hukum Ohm I  .
R
Jika kita tidak menyadari adanya hukum Ohm, kita tidak mungkin akan
memperoleh hubungan ini secara empiris dengan cara mengubah-ubah V dan
mengamati I, sementara R dibuat tetap dan kemudian menemukan plot atau
tebaran I terhadap V mendekati suatu garis lurus yang melalui titik asal. Kita
katakan “mendekati” karena meskipun hubungan ini sesungguhnya pasti,
pengukuran kita mungkin mengandung kesalahan-kesalahan sehingga plot
titik-titik tidak jatuh tepat pada garis itu namun berpencar secara acak di
sekitarnya. Akan tetapi, untuk tujuan peramalan I untuk nilai V tertentu
(dengan R tetap), kita harus menggunakan garis lurus melalui titik-titik asal.
Adakalanya, suatu hubungan garis lurus tidak bersifat pasti (akibat adanya
galat atau error), namun begitu hubungan itu bisa sangat bermanfaat.
Misalnya tinggi dan berat badan laki-laki dewasa pada suatu populasi
tertentu.
Contoh lainnya dalam bidang pendidikan adalah skor motivasi dan hasil
belajar, jika skor motivasi berkorelasi positif dengan hasil belajar siswa,
maka jika seseorang skor motivasinya di atas rata-rata, maka punya
kesempatan bahwa hasil belajarnya akan di atas rata-rata juga. Secara umum,
dua variabel yang berkorelasi, mungkin dapat menjadi prediksi, kedudukan
yang satu dapat diprediksi dengan baik kedudukan yang lainnya. Masalah
prediksi ini dalam statistika diistilahkan dengan regresi.
Jika kita cukup mempunyai alasan bahwa kedua variabel mempunyai
hubungan yang linear (dapat dilihat dari diagram pencarnya), maka kita dapat
mengembangkan prediksi dari skor satu variabel dari skor variabel lainnya.
Variabel prediktor atau variabel bebas (independent) biasanya dilambangkan
 MPDR5202/MODUL 8 8.35

dengan X dan variabel responsnya atau variabel terikat (dependent) biasanya


dilambangkan dengan Y.
Dari diagram pencar kita dapat memprediksi hubungan antara kedua
variabel, linear atau tidak linear. Langkah berikutnya adalah mencari
persamaan kurva yang dianggap paling cocok (fit) untuk menggambarkan
hubungan kedua variabel tersebut.
Kita mengetahui bahwa statistika bermaksud menyimpulkan populasi
yang pada umumnya diperoleh dari analisis data sampel. Hal yang sama juga
pada regresi linear, kita berusaha menentukan hubungan fungsional yang
diharapkan berlaku untuk populasi berdasarkan data sampel yang diambil
dari populasinya. Secara umum hubungan fungsional atau persamaan regresi
untuk populasi ditulis dalam bentuk
Y . X , X
1 2, Xk  f ( X1 , X 2 , , X k 1 , 2 , , m )

Dengan 1 ,2 , ,m parameter-parameter yang ada dalam regresi. Untuk


regresi sederhana (simple regression), dalam kasus hanya memuat satu
variabel bebas dan satu variabel terikat, persamaan regresi linearnya adalah
Y . X  1  2 X
atau beberapa buku menulisnya dengan
Y . X  0  1 X .

Masalah pertama adalah bagaimana menentukan menaksir parameter-


parameter regresi dengan tepat dari data sampel. Misalkan penaksir dari
0 dan 1 adalah a dan b, maka regresi berdasarkan data sampelnya adalah
Ŷ  a  bX dengan Yˆ melambangkan taksiran bagi Y.
Karl Pearson mengembangkan pendekatan kuadrat terkecil (leastsquare)
untuk menentukan nilai a dan b yang merupakan penaksir terbaik bagi
0 dan 1 . Perhatikan diagram pencar dari soal pada contoh tentang Stress
dan Kesulitan Makan di bawah ini.
8.36 Statistika Pendidikan 

en

e2 ei

e1

Gambar 8.4
Diagram Pencar Data Stres dan Kesulitan Makan

Misalkan ei  Yi  Yˆi (selisih skor Y sebenarnya/pengamatan dengan skor Y


yang ditaksir oleh garis regresi). Kriteria dari pendekatan kuadrat terkecil
adalah garis regresi yang paling baik akan diperoleh dengan meminimumkan
jumlah kuadrat dari ei   ei2  . Mengapa harus diminimumkan jumlah
kuadratnya   e  bukan
2
i jumlah selisih mutlaknya  e  ?
i Ada dua
alasan, (1) sukar mengembangkan hubungan matematis melalui selisih
mutlaknya, mengingat selisih kuadrat mempunyai landasan matematis, yakni
melalui turunan (turunan parsial). (2) lokasi dari garis regresi dan nilai dari
koefisien korelasi akan berubah lebih minimal sebagai akibat dari
pengambilan sampel secara acak daripada kejadian apabila menggunakan
kriteria lain.
Melalui penaksir kuadrat terkecil tersebut, diperoleh koefisien-koefisien
a dan b, yakni
 MPDR5202/MODUL 8 8.37

a
  Y    X     X   X Y 
i i
2
i i i

n X    X  2 2
i i

n X Y    X   Y 
b
i i i i

n X    X  2 2
i i

Jika b lebih dahulu dihitung, maka a dapat dihitung dengan

a  Y  bX

Sebuah notasi yang memudahkan untuk perhitungan berikutnya dalam


regresi adalah
S XY    X i  X Yi  Y 
  X iYi  X  Yi Y  X i  nXY
  X iYi  nXY

  X iYi 
 X Y i i

n
Dengan cara yang sama, Anda dapatkan juga bahwa
S XX    X i  X 
2

 X 
2

X 
2 i
i
n
Dan
SYY   Yi  Y 
2

Y 
2

  Yi 
2 i

n
Dan dari rumus

b
n X iYi    X i   Yi 

 X Y    X   Y 
i i i i n

  X  X Y  Y 
i i

n X    X i   X   X  n  X  X 
2 2 2 2 2
i i i i

Akibatnya
S XY
b
S XX
8.38 Statistika Pendidikan 

Merupakan rumus yang mudah untuk diingat. Sedangkan konstantanya dapat


dihitung dengan
a  Y  bX

Jika nilai konstanta disubstitusikan ke persamaan regresi


Ŷ  a  bX
Maka diperoleh
Ŷ  a  bX  Y  bX  bX  Y  b  X  X  atau
Yi  Yˆ  Yi  Y  b  X  X 

Y  Yˆ   Y  Y   b X


i i i i X0, mengapa? Coba Anda
tunjukkan sendiri!
Dengan demikian jumlah dari residual atau sisaan sama dengan nol. Di dalam
prakteknya, sering ditemukan oleh kita jumlah residual tidak persis sama
dengan nol. Hal itu terjadi karena proses pembulatan yang dilakukan oleh
kita dalam perhitungan. Untuk lebih memahaminya perhatikan contoh
berikut.

Contoh 8.3
Misalkan Skor Stres (X) dan Skor Kesulitan Makan (Y) dengan data yang
diukur 10 orang siswa adalah sebagai berikut.

Tabel 8.10
Skor Stres (X) dan Skor Kesulitan Makan (Y)

Stress Kesulitan Makan


Siswa X2 Y2 XY
(X) (Y)
A 17 9 289 81 153
B 8 13 64 169 104
C 8 7 64 49 56
D 20 18 400 324 360
E 14 11 196 121 154
F 7 2 49 4 14
G 21 5 441 25 105
H 22 15 484 225 330
I 19 26 361 676 494
J 30 28 900 784 840
Jumlah 166 134 3248 2458 2610
 MPDR5202/MODUL 8 8.39

Kita hitung dengan penaksir bagi persamaan regresinya sebagai berikut

S XY   X iYi 
 X i  Yi  2610  166 134   385, 6
n 10
Dan
 X  166
2 2

S XX   X   3248   492, 4
2 i
i
n 10
Dengan demikian diperoleh
S XY 385, 6
b   0, 783 dan a  Y  bX  13, 4  (0,783)(16,6)  0, 4005 .
S XX 492, 4
Jadi persamaan regresinya adalah Yˆ  0, 4005  0,783 X .

1. Persamaan Regresi dari Angka Baku


Cara lain untuk menentukan persamaan regresi linear sederhana dari X
dan Y dapat menggunakan pendekatan angka baku. Persamaan regresi dari Y
dalam X melalui angka baku adalah

ZˆY  rZ x

Di mana :
ZY : prediksi angka baku dari Y
r : koefisien korelasi antara X dan Y
Z X : angka baku dari X

Walaupun persamaan regresi dari bentuk baku ini jarang digunakan,


tetapi penting untuk diketahui dengan berbagai alasan. Pertama, misalkan
kita akan memprediksi Y dari rata-rata X. Karena rata-rata dari sekumpulan
skor yang dinyatakan dalam bentuk baku selalu nol, prediksi skor standar Y
juga akan nol, karena ZY  r  0  0 berapa pun nilai korelasi keduanya.
Artinya, untuk semua nilai r, persamaan regresi memprediksi bahwa sebuah
kasus pada rata-rata dari X akan mempunyai skor rata-rata dari Y. Jika dilihat
pada grafiknya, garis regresi akan selalu melalui titik yang didefinisikan
sebagai rata-rata dari X dan rata-rata dari Y.
8.40 Statistika Pendidikan 

Y
Y pada X

X
X
Gambar 8.5
Hubungan antara rata-rata X dan Y dengan Garis Regresi dengan r  0

Kedua, jika r = 0, maka diprediksi nilai angka baku dari Y akan selalu 0,
karena ZY  0  Zx  0 . Dengan demikian, jika korelasinya nol (r = 0), maka
nilai prediksi bagi Y adalah rata-rata dari Y berapa pun nilai dari X yang
digunakan untuk memprediksinya. Hal ini sebagaimana terlihat pada gambar
berikut.
Y

Y Y pada X

X
X

Gambar 8.6
Hubungan antara rata-rata X dan Y dengan Garis Regresi dengan r = 0
 MPDR5202/MODUL 8 8.41

Untuk menentukan persamaan regresi dari angka baku langkah pertama


yang dilakukan adalah mensubstitusikan angka baku ke persamaan ZY  rZ x ,
yakni
Yˆ  Y X X
r
SY SX
S 
Yˆ  Y  r  Y  X  X 
 SX 
S  S 
Yˆ  r  Y  X  r Y  X Y
 SX   SX 
Jadi Regresi dari Y dalam X melalui angka kasarnya adalah
S  S 
Yˆ  r  Y  X  r  Y  X  Y
 SX   SX 

Contoh 8.4
Perhatikan kembali contoh data stress dan kesulitan makan di atas.
Korelasinya telah dihitung pada kegiatan belajar 1, yakni +0,675. Dari data
pada Tabel 8.9 dapat kita hitung rata-rata dan simpangan bakunya berturut-
turut
X  16,6 ; Y  13, 4 ; sX  7,397 dan sY  8,580
Dengan demikian persamaan regresinya adalah
S  S   8,580   8,580 
Yˆ  r  Y  X  r  Y  X  Y  0,675   X  0,675  16,6  13, 4
 SX   SX   7,397   7,397 

Yˆ  0,783 X  0, 4005 hasilnya sama dengan perhitungan pada contoh 8.3 di


atas.

Contoh 8.5
Misalkan dari 19 mahasiswa yang mengikuti ujian Statistika Terapan
mempunyai rata-rata tinggi badan 165 cm dan simpangan bakunya 9,5 cm.
Sedangkan rata-rata berat badannya adalah 65 kg dengan simpangan baku 3,3
cm. Jika korelasi antara keduanya +0,83,
a. Tentukan persamaan garis regresi dari berat badan (Y) dalam tinggi
badan (X)!
b. Prediksilah berat badan mahasiswa yang tingginya 160cm!
8.42 Statistika Pendidikan 

Jawab:
Karena diketahui
X  165 cm, S X  9,5 cm, Y  65 cm, SY  3,3 cm, dan r  0,83 , maka
 3,3   3,3 
Yˆ  0,83   X  0,83  165  65
 9,5   9,5 
 0, 288 X  17, 42

Jadi persamaan regresinya adalah Yˆ  0,882 X  17, 42 .


Untuk tinggi badan 160 cm, maka berat badanya diprediksi
Yˆ  0, 288 X  17, 42
 0, 288(160)  17, 42
 63,55

Jadi berat badan orang yang tingginya 160 cm diperkirakan 63,55 kg.
Catatan: penggunaan regresi untuk prediksi ini hanya digunakan sebagai
interpolasi, bukan ekstrapolasi. Artinya nilai Y yang ditaksir haruslah
menggunakan nilai X yang berada pada rentang X terkecil dan X terbesar.

2. Berbagai Varians pada Regresi Linear Sederhana


Untuk analisis selanjutnya tentang regresi linear sederhana, beberapa
asumsi harus diambil. Pertama, mengingat hasil pengamatan variabel terikat
Y belum tentu sama besarnya dengan harga yang diharapkan (ditaksir), yakni
Yˆ , maka seperti yang dikatakan di atas akan terjadi kekeliruan atau
perbedaan, e  Y  Yˆ yang disebut dengan kekeliruan prediksi atau galat
prediksi. Dalam populasi, galat prediksi ini dimisalkan berbentuk variabel
acak yang mengikuti distribusi normal dengan rata-rata nol dan varians  e2 .
Tentu saja sudah jelas bahwa kita juga memisalkan tidak terjadi kekeliruan
atas pengamatan variabel bebasnya (X).
Asumsi kedua adalah bahwa untuk setiap harga X yang diberikan,
variabel terikat Y independen dan berdistribusi normal dengan rata-rata
(1  2 X ) dan varians  Y2. X . Varians  Y2. X dimisalkan sama untuk setiap X
dan karenanya dapat dinyatakan dengan  e2 yang biasa pula dinamakan
varians kekeliruan taksiran, sedangkan  Y . X dinamakan dengan kekeliruan
baku taksiran.
 MPDR5202/MODUL 8 8.43

Berdasarkan kedua asumsi di atas, maka  e2 ditaksir oleh rata-rata


kuadrat penyimpangan sekitar regresi atau disebut juga rata-rata kuadrat
residu, yang dinyatakan dengan Se2 dengan

 Y  Yˆ 
2
i i
SY2. X  Se2 
 n  2
Aturan atau rumus di atas dapat juga ditulis sebagai
 n 1  2
SY2. X  Se2  
 n  2
 SY  b S X

2 2
 
Atau jika kita akan memanfaat nilai korelasi antar variabelnya, maka
SY . X  SY 1  r 2

Setelah kita dapat menentukan Se2 , maka varians-varians lainnya untuk


regresi linear sederhana dapat ditentukan, yakni varians untuk koefisien
regresi b.
SY2. X SY2. X
Sb2  
 Xi  X   x
2 2

Dan varians kostanta a adalah


1 
 X2 
S a2  SY2. X   2 
 n   X i  X  
Varians ramalan rata-rata Y untuk X0 yang diketahui
1  X 0  X  
2

ˆ 
SY  SY . X  
2 2
2 
 n   X 0  X  
Jika kita asumsikan bahwa keragaman amatan di sekitar garis regresi bersifat
normal, artinya galat ei semuanya berasal dari sebaran normal yang sama
N (0, s 2 ), dapat ditunjukkan bahwa selang kepercayaan bagi 1 adalah
SY . X
b  t  
atau b  t  
Sb
 ,( n  2) 
X X  ,( n  2) 
2
2  2 
i

Sedangkan, selang kepercayaan bagi 0 adalah


a  t  S
 a
 ,( n  2) 
2 
8.44 Statistika Pendidikan 

Contoh 8.6
Kembali pada contoh tentang stres dan kesulitan makan, misalkan terdapat
hubungan yang linear antara stres dengan tingkat kesulitan makan, dimana
tingkat stres dapat menyebabkan kesulitan makan. Kita dapat telah
menghitung persamaan regresnya, yakni Yˆ  0, 400  0,783 X . Kedudukan
garis regresi terhadap titik-titik datanya dapat dilihat pada gambar berikut.

Gambar 8.7
Grafik Diagram Pencar dan Garis Regresi Linearnya

Dari gambar di atas terlihat bahwa hanya ada satu titik yang hampir dilalui
oleh garis regresi, yakni untuk X = 8. Dan jika kita memprediksi tingkat
(skor) kesulitan makan untuk skor stres X = 12 adalah sebagai berikut:

Yˆ  0, 400  0,783(12)  9,80

Artinya jika skor tingkat stres seseorang 12, maka diprediksi skor kesulitan
makannya adalah 9,80.
Dari persamaan regresi di atas kita juga dapat menghitung besar variasi
yang ditimbulkan oleh garis regresi. perhatikan tabel berikut.
 MPDR5202/MODUL 8 8.45

Tabel 8.11
Bantuan dalam Perhitungan

Stres Kesulitan
Siswa (Yi  Y )2 (Yˆi  Y )2 (Yi  Yˆi ) 2
(X) Makan (Y)
A 17 9 19.36 0.10 22.20
B 8 13 0.16 45.37 40.14
C 8 7 40.96 45.37 0.11
D 20 18 21.16 7.08 3.76
E 14 11 5.76 4.15 0.13
F 7 2 129.96 56.53 15.07
G 21 5 70.56 11.86 140.27
H 22 15 2.56 17.86 6.90
I 19 26 158.76 3.53 114.97
J 30 28 213.16 110.05 16.89
Jumlah 166 134 662.40 301.89 360.44

Dengan demikian dapat dihitung


 Y  Yˆ 
2
360, 44
S2
   45, 06
n2
Y .X
8
Dari hasil tersebut, maka diperoleh
SY2. X 45, 06
Sb2    0, 092 atau Sb  0,303
  X  X  492, 4
2

1   1 16, 62 
 X2 
Dan Sa2  SY2. X   2 
 45, 06     29, 72
 n  X  X   10 492, 4 
 i 
Atau Sa  5, 45.

Dari hasil tersebut kita dapat menghitung taksiran bagi  dan . Pertama
kita hitung taksiran interval bagi . Misalkan kita mengambil derajat
kepercayaan 95%. Dari tabel t-student diperoleh t ( n  2)  t(0,025)(8)  2,31 ,
2

sehingga dapat kita hitung t  


Sa   2,31 5, 45  12,59 . Dengan
 ,( n  2) 
2 

demikian selang kepercayaan bagi  adalah 0,400  12,59 atau (-12,19 ;


8.46 Statistika Pendidikan 

12,99). Selanjutnya kita hitung selang kepercayaan bagi . Dari data di atas
kita hitung t  S   2,31 0,303  0,700 . Jadi selang kepercayaan
 b
 ,( n  2) 
2 

bagi  adalah 0,783  0,700 atau (0,083 ; 1,483).


Jika kita asumsikan bahwa skor dari Y menyebar normal, maka kita
dapat mengaitkannya dengan skor taksiran dari Y. Karena Yˆ merupakan
rata-rata dan galat baku estimasinya adalah SYX, maka diperoleh:
68% dari skor aktual Y akan jatuh dalam Yˆ  1, 00SYX
95% dari skor aktual Y akan jatuh dalam Yˆ  1,96S YX

99% dari skor aktual Y akan jatuh dalam Yˆ  2,58SYX


Dari data di atas, silakan Anda ambil contoh menghitung taksiran
interval bagi salah satu skor aktual Y.

3. Analisis Ketepatan Garis Regresi


Sekarang kita akan melakukan pengujian untuk mengetahui apakah garis
regresi merupakan dugaan yang tepat? Kita mulai dari identitas matematika
sebagai berikut.

Yi  Yi (sifat reflektif)

  
Yi  Y  Yˆi  Y  Yi  Yˆi (kedua ruas dikuadratkan dan dijumlahkan dari i  1, 2, 3, ,n)

 Y  Y    Yˆ  Y    Y  Yˆ  
 2 Yˆi  Y Y  Yˆ 
2 2 2
i i i i i i

Anda dapat menunjukkan bahwa   


2 Yˆi  Y Yi  Yˆi  0 , sehingga
diperoleh
 Y  Y    Yˆ  Y    Y  Yˆ 
2 2 2
i i i i ……………………….1)

Dengan menggunakan Ŷ  a  bX dan a  Y  bX , maka kita dapat


menuliskan
 Yˆ  Y   b2  X  X   
2 2
i i

 b2   X i  X 
2

 b 2 S XX
 bS XY
 MPDR5202/MODUL 8 8.47

Perhatikan kembali persamaan (1). Besaran dari Yi  Y  adalah simpangan


antara pengamatan ke-I dengan rata-rata Y, sehingga ruas kiri persamaan
tersebut merupakan jumlah kuadrat simpanga-simpangan tersebut dan untuk
memudahkannya kita sebut dengan JK di sekitar rata-rata yang sekaligus
 
juga jumlah kuadrat terkoreksi. Besaran Yˆ  Y merupakan simpangan
i

antara nilai ramalan ke-I dengan rata-rata pengamatan, dan Yi  Yˆi adalah  
simpangan antara pengamatan ke-I dengan nilai ramalannya
(residu/sisaan/galat ke-i). menurut Draper (1992) identitas (1) di atas dapat
ditulis dengan kata-kata sebagai berikut.

Jumlah Kuadrat Jumlah Kuadrat Jumlah Kuadrat


= +
Sekitar Rata-Rata Karena Regresi Sekitar Regresi

Atau dengan secara ringkas sering ditulis dengan

JKTotal = JKReg + JKRes

Kesamaan di atas menunjukkan keragaman Y di sekitar rata-ratanya,


sebagian keragaman berasal dari garis regresi dan sebagian lainnya,
 
 Y  Yˆ merupakan akibat dari pengamatan-pengamatan yang tidak
2
i i

terletak pada garis regresi (seandainya seluruh pengamatannya berada pada


garis regresi, maka jumlah kuadrat tersebut akan sama dengan nol). Dari sini
kita ketahui bahwa menilai ketepatan garis regresi sebagai peramal adalah
menghitung berapa banyak JK sekitar rata-rata terurai menjadi JK karena
regresi dan JK sekitar regresi. Akan sangat baik apabila JK karena regresi
jauh lebih besar daripada JK sekitar regresi (dalam beberapa buku disebut
juga dengan JKTotal (Jumlah Kuadrat Total)), atau dengan kata lain
JK karena Regresi JK Re g
 tidak jauh dari satu. Dan rasio tersebut dalam
JK sekitar rata-rata JKTotal
regresi dinamakan dengan koefisien determinasi yang dilambangkan dengan
R2. Jadi kita peroleh
  
2
JK Reg Yˆi  Y
R 
2

 Yi  Y 
2
JK Totsl
8.48 Statistika Pendidikan 

R2 disebut juga koefisien korelasi. Karena 0  JKReg  JKTotal , maka tentunya


0  R 2  1 . Anda dapat membuktikan bahwa akar dari R2 adalah r person.
Uraian variasi-variasi di atas menurut unsur-unsurnya dapat digambarkan
sebagai berikut.

Y
Yi

ei  Yˆi  Yi
Yi  Yˆ
Yˆ  Y
Y Y
Y
Yi  Yˆ
Yˆ  a  bX

X X
Xi
Gambar 8.8
Variasi Menurut Unsurnya
(Sembiring, 1995)

Setiap jumlah pada identitas (1) di atas mempunyai derajat bebas (degree
of freedom). Bilangan ini menunjukkan berapa banyak informasi yang bebas
di antaran pengamatan Y1, Y2, … , Yn yang dibutuhkan untuk mendapatkan
jumlah kuadrat itu. Misalnya JKTotal membutuhkan (n – 1) informasi yang
bebas, sebab di antara bilangan-bilangan Y1  Y , Y2  Y , , Yn  Y , hanya (n –
1) di antaranya yang bebas karena jumlah semua n bilangan itu sama dengan
nol. JKReg dihitung dari suatu fungsi Y1, Y2, … , Yn yaitu b karena
 
 Yˆ  Y   b2  X  X  , sehingga jumlah kuadrat ini memiliki satu
2 2
i i

derajat bebas. Melalui pengurangan antara derajat bebas dari JK Total dengan
derajat bebas JKReg, maka derajat bebas bagi JKRes (residu) adalah (n – 2).
 MPDR5202/MODUL 8 8.49

Sebagaimana dalam analisis varians (ANAVA), hasil bagi antara JK Reg


dengan derajat bebasnya dan JKRes (residu) dengan derajat bebasnya
diperoleh Rata-Rata Kuadrat (RK) atau Mean Square (MS) bagi keduanya
Sama juga dengan ANAVA kita dapat menyusun tabel sebagai berikut.

Tabel 8.12
Anova Regresi Linear Sederhana

Sumber Derejat Jumlah Kuadrat Rata-Rata Kuadrat


Keragaman Bebas (JK) (RK)

 Yˆ  Y 
2
Karena Regresi 1 RKreg
i

n–2
 Y  Yˆ 
2
Sekita Regresi JK res
i i RK res 
(residu) n2
n–1
 Y  Y 
2
Total (sekitar rata-
i
rata)

Karena Yi merupakan variabel acak, maka setiap fungsi yang dibentuk


dari Yi juga merupakan variabel acak. Ada dua fungsi yang penting bagi kita
dalam melakukan pengujian keberartian regresi, yakni RKReg dan s2 yang ada
dalam tabel di atas. Kedua fungsi tersebut memiliki sebaran, rata-rata,
varians, dan momennya sendiri. Dapat diperlihatkan bahwa rata-rata masing-
masing fungsi adalah sebagai berikut.

E  RK Re g    2   2   X i  X  dan
2

E  s2    2

Ingat bahwa jika X merupakan variabel acak, maka rata-ratanya adalah


E(X).
Dari segi teori, rasio antara RKReg dengan RKRes mempunyai distribusi F
dengan derajat bebas 1 dan (n – 2). Yang pertama merupakan derajat bebas
(dk) pembilang, dan yang kedua merupakan dk penyebut. Dengan demikian,
kita dapat mendefinisikan suatu uji statistik
  
2
RK reg Yˆi  Y 1
F 
 
 Yi  Yˆi  n  2
2
RK res
8.50 Statistika Pendidikan 

Nilai F di atas sering disebut dengan nilai F-hitung. Kemudian hasilnya


dibandingkan dengan nilai F-tabel (lihat dalam lampiran) dengan
dk  1,  n – 2   untuk menguji hipotesis nol dan lawannya:

H0 :  = 0
H1 :  0

Bila F-hitung lebih besar dari F-tabel pada taraf nyata () yang dipilih,
maka hipotesis nol ditolak dan bila sebaliknya, maka hipotesis nol diterima.
Jika hipotesis nol ditolak, maka model regresi sangat baik dalam
mencerminkan pencaran datanya.
Untuk contoh pengujiannya, perhatikan kembali contoh persamaan
regresi dari Stress (X) dengan Kesulitan Makan (Y). Pada tabel sebelumnya

JK   Yˆ  Y  301,89 
2
telah dihitung bahwa reg i dan


JK res   Yi  Yˆi 
2
 360, 44 . Dengan demikian dari keduanya diperoleh

JKTotak   Yi  Y   662, 40 . Dari data tersebut kita susun tabel ANOVA
2

sebagai berikut.

Tabel8.13
Analisis Varians untuk Regresi Yˆ  0, 400  0,783 X

Sumber dk JK RK F hitung
Regresi 1 301,89 301,89 6,70
Residu 8 360,44 45,06
Total 9 662,40

Dari tabel F (Fisher) dengan dk = (1,8) dan memilih  = 0,05 diperoleh


F-tabel = 5,32 yang nilainya lebih kecil dari F-hitung. Dengan demikian kita
tolak Hipotesis nol, artinya garis regresi linear yang diperoleh cocok dengan
data. Kita juga dapat menggunakan tabel t-student, dengan kesamaan bahwa
tn2 2  F1, n  2
Jadi F tabelnya jika menggunakan tabel…. (t-student) nilainya adalah
tn2 2  2,3532  5,54
 MPDR5202/MODUL 8 8.51

Karena hipotesis nol ditolak, maka dapat disimpulkan bahwa Stres (X)
mempengaruhi secara linear terhadap kesulitan makan (Y) seseorang. dan
jika kita hitung berapa besar pengaruh dari Stres (X) terhadap kesulitan
makan (Y), dapat dihitung dari besar koefisien determinasinya, yakni
  
2
Yˆi  Y 301,89
R 
2
  0, 46
 i 
2
Y  Y 662, 40
Dan nilai R2 = 0,46 merupakan akar kuadrat dari nilai korelasi yang sudah
dihitung di atas. R2 = 0,46 artinya 46% Kesulitan makan (Y) dipengaruhi
oleh Stress (X), dan sisanya oleh faktor lain.
Pasca pengujian keseluruhan model dengan ANOVA adalah uji masing-
masing koefisien atau pengujian individual. Dalam regresi linear sederhana,
karena koefisien yang diuji hanya satu, yakni , maka hasil pengujian ini
sama dengan pengujian keseluruhan model.
Hipotesis yang diuji dalam pengujian individual ini adalah
H0 :  = 0 melawan
H1 :   0 atau H1 :  > 0 atau H1 :  < 0
Dengan asumsi-asumsi yang dipenuhi (akan dibahas pada bagian akhir modul
ini), maka pengujiannya menggunakan statistik
b  0
t
Sb
Dan jika  0 = 0, maka statistik ujinya adalah
b
t
Sb
Dengan dk untuk distribusi t adalah (n – 2). Kriteria pengujian seperti yang
telah kita ketahui ditentukan oleh Hipotesis Alternatifnya (H 1). Jika H1 :
0, misalnya, maka tolak H0 jika thitung  t 1  , dk atau thitung  t 1  , dk .
2 2

Contoh 8.7
Jika untuk regresi di atas, Yˆ  0, 400  0,783 X , kita uji apakah kesulitan
makan (Y) independen dengan Stress (X), maka hipotesis yang diuji adalah
H0 :  = 0 melawan H1 :   0
Dari data di atas, kita ketahui bahwa b = 0,783 dan Sb = 0,303. Jadi
0, 783
t  2,584
0,303
8.52 Statistika Pendidikan 

Dari tabel t-student dengan dk  n – 2  10 – 2  8, dan jika dipilih  = 0,05,


maka nilai t-tabel = 2,31. Karena t-hitung = 2,584 lebih besar dari nilai t-
tabel, maka hipotesis nol ditolak. Dengan demikian jelas bahwa kesulitan
makan sangat bergantung pada tingkat stress. Hasil ini sejalan dengan
pengujian melalui analisis varians di atas.
Jika kita akan menguji konstantanya, maka hipotesis yang diujinya
adalah sebagai berikut.
H0 :  = 0 melawan
H1 :   0 atau H1 :  > 0 atau H1 :  < 0
Dengan statistik ujinya adalah
a  0
t
Sa
Dengan dk untuk distribusi t adalah  n – 2  . Kriteria pengujian seperti yang
telah kita ketahui ditentukan oleh Hipotesis Alternatifnya (H1). Jika H1 :
 > 0, misalnya, maka tolak H0 jika thitung  t , dk . Sebagai contoh, silakan
Anda uji untuk regresi Yˆ  0, 400  0,783 X di atas.
Selanjutnya, kita bandingkan hasil perhitungan yang telah dilakukan
dengan perhitungan melalui SPSS seperti di bawah ini.
Langkah 1.Input data sebagaimana terlihat pada gambar berikut

Gambar 8.9
Contoh Input Data Untuk Regresi Linear Sederhana
 MPDR5202/MODUL 8 8.53

Langkah 2. Lakukan perhitungan dengan Analiyze > Regression > Linear.


Pindahkan variabel Y ke kotak dependen variabel dan variabel X ke kotak
independen variabel, seperti yang terlihat pada gambar berikut.

Gambar 8.10
Contoh Kotak Dialog dalam Perhitungan Regresi Linear

Pilih method Enter, kemudian klik OK.


Langkah 3. Baca output. Hasil perhitungan adalah sebagai berikut.
Output yang paling dulu muncul adalah model summary yang berisi nilai R,
R2, adjusted R dan standar error dari penaksiran, sebagaimana tabel berikut.

Tabel 8.14
Contoh Model Summary Hasil Perhitungan

Model Summary
Std. Error of the
Model R R Square Adjusted R Square
Estimate
1 .675a .456 .388 6.71226
a. Predictors: (Constant), Stress
8.54 Statistika Pendidikan 

Nilai R dalam regresi linear sederhana akan sama dengan koefisien korelasi
anatar X dan Y, sedangkan R square merupakan koefisien determinasi yang
menunjukkan besar pengaruh dari variabel bebas (X) terhadap perubah
terikatnya (Y). Hasil perhitungan di atas menujukan R square sebesar 0,456.
Artinya 45,6% variabel Y dalam hal ini kesulitan makan dipengaruhi oleh X
(stress), sedangkan sisanya 54,4% dipengaruhi oleh faktor lain. R2 Adjusted
atau sering disebut dengan R2 yang disesuaikan. Nilai ini menurut Draper &
Smith (1992) dihitung dengan rumus sebagai berikut
 n 1 
Ra2  1  1  R 2   
n p
Peran dari R2 yang disesuaikan ini akan terlihat dalam regresi ganda dalam
pencarian regresi terbaik.
Ouput berikutnya adalah tabel anova untuk menguji ketepatan garis
regresi sebagaimana yang terlihat pada tabel berikut.

Tabel 8.15
Contoh Tabel Anova bagi Regresi Linear
ANOVAb
Sum of
Model df Mean Square F Sig.
Squares
1 Regression 301.965 1 301.965 6.702 .032a
Residual 360.435 8 45.054
Total 662.400 9
a. Predictors: (Constant), Stress
b. Dependent Variabel: Kesulitan Makan

Hasil dari perhitungan pada tabel di atas sama seperti yang telah dihitung
oleh kita secara manual. Hanya ada tambahan, yakni kolom sig. Nilai dari
sig. merupakan nilai peluang penolakan hipotesis nol ketika hipotesis nol
bernilai benar. Jadi untuk memudahkan dalam pengambilan kesimpulan kita
cukup membandingkan nilai sig. yang diperoleh dengan taraf signifikansi
yang dipilih oleh kita. Jika kita memilih  = 0,05, maka nilainya sig. = 0,032
lebih kecil daripada, maka kita simpulkan bahwa hipotesis nol ditolak.
Dengan demikian model regresi dapat dipakai untuk memprediksi
kesulitan makan.
Hasil output berikutnya adalah tabel koefisien regresi beserta
pengujiannya. Hasil perhitungannya adalah sebagai berikut.
 MPDR5202/MODUL 8 8.55

Tabel 8.16
Contoh Hasil Perhitungan Koefisien Regresi Linear Sederhana

Coefficientsa
Unstandardized Standardized
Model Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) .400 5.452 .073 .943
Stress .783 .302 .675 2.589 .032
a. Dependent Variabel: Kesulitan Makan

Pada kolom pertama berisi informasi nama konstanta dan variabel bebas
dalam model regresi, yakni stress. Pada kolom kedua berisi koefisien dari
variabel bebas (stress) dan konstanta dengan standar error bagi konstanta
dan variabel bebas (Sa dan Sb). Hasil perhitungan ini sama dengan yang telah
dilakukan sehingga tafsirannya sama dengan di atas. Pada kolom keempat
berisi beta, yakni koefisien bagi variabel bebas ketika kita menghitung
regresi menggunakan angka baku. Nilai dari beta akan sama dengan korelasi
antara variabel bebas dan terikat sebagaimana yang telah dijelaskan di atas.
Dan dua kolom terakhir dari tabel di atas adalah pengujian terhadap koefisien
variabel bebas dan konstanta. Hasilnya sama dengan yang dihitung bahwa
kita menolak hipotesis nol pada pengujian koefisien , dan menerima
hipotesis nol pada pengujian konstantanya. Silakan Anda menafsirkan hasil
perhitungan-perhitungan yang telah diperoleh melalui software SPSS di atas!

B. REGRESI JAMAK (MULTIPLE)

Pada bagian A di atas kita telah membahas tentang regresi linear


sederhana, yakni analisis regresi linear yang hanya melibatkan satu variabel
bebas dan satu variabel terikat. Dalam penelitian sering kali kita menemukan
data pengamatan suatu variabel yang terjadi sebagai akibat lebih dari dua
variabel. Misalnya dalam bidang pendidikan, keberhasilan belajar siswa tidak
ditentukan oleh IQ saja, tetapi waktu belajar di rumah, motivasi belajar siswa,
ekonomi orang tua, lingkungan di rumah, dan bahkan mungkin masih banyak
variabel lainnya. Secara umum, data hasil pengamatan terhadap variabel Y
dapat terjadi yang diakibatkan oleh variabel-variabel bebas X1, X2, …, Xk.
Akan ditentukan hubungan antara Y dengan X1, X2, …, Xk. Hubungan antara
variabel terikat Y dengan sekelompok variabel bebas dinyatakan dalam
model matematika. Jika hubungan variabel terikat dan bebasnya linear, maka
8.56 Statistika Pendidikan 

persamaan regresinya berbentuk regresi linear jamak atau regresi linear


ganda dengan

Yˆ  b0  b1 X1  b2 X 2   bk X k

Dengan b0 , b1 , b2 ,, bk merupakan koefisien-koefisien yang harus ditentukan


berdasarkan hasil pengamatan.
Sebagaimana dalam regresi linear sederhana, untuk menentukan
koefisien-koefisien b0 , b1 , b2 ,, bk juga menggunakan penaksiran kuadrat
terkecil (least square). Dalam proses perhitungannya, apabila variabel
bebasnya cukup banyak, maka diperlukan pendekatan matematika yang
dipandang dapat mempermudah prosesnya. Untuk mempermudah dalam
memahaminya kita mulai dengan penaksiran koefisien-koefisien bagi
persamaan regresi linear ganda dengan banyak variabel bebasnya 2 buah.
Persamaan regresi linear ganda dengan 2 variabel bebas adalah sebagai
berikut

Ŷ  b0  b1 X1  b2 X 2

Dalam persamaan tersebut terdapat 3 buah koefisien, yakni b0, b1, dan b2.
Untuk itu diperlukan 3 persamaan dalam bentuk ketiga koefisien tersebut,
sehingga kita dapat menentukan nilai-nilai koefisiennya. Melalui pendekatan
kuadrat terkecil, koefisien-koefisien b0, b1, dan b2 dapat diperoleh dengan
menyelesaikan sistem persamaan linear berikut
nb0  b1  X 1i  b2  X 2i   Yi
b0  X 1i  b1  X 12i  b2  X 1i X 2i   Yi X 1i
b0  X 2i  b2  X 1i X 2i  b2  X 22i   Yi X 2i

Perlu dijelaskan kembali yang dicari oleh kita adalah b0 , b1 , dan b2.
Dalam matematika penyelesaian persamaan di atas dapat dilakukan
dengan berbagai cara, di antaranya eliminasi-substitusi (coba Anda ingat
kembali pelajaran matematikas SMP atau SMA tentang Sistem Persamaan
Linear tiga variabel) atau dapat juga dengan menggunakan matriks. Jika
disusun dalam matriks, maka sistem persamaan linear di atas dapat ditulis
sebagai

X Xb  X Y
 MPDR5202/MODUL 8 8.57

Dengan
 Y1 
Y  1 X 11 X 21 
1 X b0 
 2 X 22 
Y  Y3  , X  
12
, b   b1  .
   
    b2 
Yn  1 X 1n X 2n 

Matriks koefisien dapat diperoleh dengan menyelesaikan persamaan berikut


b   X X  X Y
1

Dengan syarat X’X tak singular atau diskriminannya tidak sama dengan nol.
Untuk memudahkan perhitungan operasi matriks di atas, Anda dapat
memanfaatkan program Excel.
Untuk memudahkannya perhatikan contoh berikut.
Misalkan
2 2  3
A  , B  4
 1 4   
Kita akan menghitung
- AB
- A-1
Bukalah program Excel, dan tuliskan matriks A dan B pada sel-sel dalam
Excel, misalkan sebagai berikut.

Pertama kita harus mengetahui, bahwa ordo hasil perkalian matriks


A B  C , maka drag 2 baris 1 kolom.
2 2 21 21
Tempat untuk
hasil operasi
8.58 Statistika Pendidikan 

Kemudian, untuk menghitung hasilnya klik AUTOSUM > MORE


FUNCTION > MATH & TRG, kemudian klik MMULT dan klik OK,
seperti terlihat pada gambar berikut.

Gambar 8.11
Kotak Dialog untuk Perkalian Dua Buah Matriks

Kemudian masukan data pada Array1 untuk matriks A dan Array2 untuk
matriks B (hati-hati jangan tertukar).
 MPDR5202/MODUL 8 8.59

Gambar 8.12
Kotak Dialog untuk Input Matriks yang Dioperasikan (perkalian)

Kemudian, tekan F2dan tekan Shift + CTRL + ENTER secara bersamaan,


sehingga diperoleh matriks hasil perkaliannya secara lengkap berikut:

Hasilnya adalah
 2 2   3   10 
AB       
1 4   4   11
Sekarang cobalah Anda lakukan untuk menghitung A-1!
Penggunaan perhitungan melalui matriks ini dapat digunakan untuk
menghitung persamaan regresi secara umum, yakni menaksir persamaan
Yˆ  b0  b1 X1  b2 X 2   bk X k
8.60 Statistika Pendidikan 

Untuk lebih memahami dalam menghitung persamaan regresi ganda,


perhatikanlah contoh berikut.

Contoh 8.8
Misalkan diketahui bahwa hasil belajar siswa dipengaruhi oleh beberapa
variabel antara lain kompetensi dan motivasi belajar.
Misalkan
X1 : kompetensi awal,
X2 : motivasi belajar, dan
Y : hasil belajar.
Jika dari hasil pengambilan data terhadap 15 siswa di suatu sekolah diperoleh
data sebagai berikut:

Tabel 8.17
Data Kompetensi Awal, Motivasi dan Hasil Belajar

Res X1 X2 Y
1. 30 45 56
2. 40 64 47
3. 43 70 66
4. 45 62 68
5. 43 52 76
6. 23 56 70
7. 45 78 45
8. 56 76 56
9. 54 51 76
10. 54 45 78
11. 56 34 76
12. 60 45 56
13. 67 56 80
14. 75 74 87
15 78 89 89
Sumber : rekayasa

Kita akan menaksir persamaan regresi Ŷ  b0  b1 X1  b2 X 2 .


Untuk memudahkan perhitungan, kita akan menggunakan bantuan matriks
dengan bantuan excel.
 MPDR5202/MODUL 8 8.61

Matriks X dan Y dari data di atas adalah


1 30 45  56 
1 40 64   47 
   
1 43 70   66 
   
1 45 62   68 
1 43 52   76 
   
1 23 56   70 
1 45 78   45 
   
X  1 56 76  , Y   56  dan
   
1 54 51  76 
1 54 45  78 
   
1 56 34   76 
1 60 45  56 
   
1 67 56  80 
1 75 74  87 
   
1 78 89  89 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
X  30 40 43 45 43 23 45 56 54 54 56 60 67 75 78 

 45 64 70 62 52 56 78 76 51 45 34 45 56 74 89 

Dengan menggunakan bantuan excel


 15 769 897   1,515 0, 011 0, 0148
  
X X  769 42679 47032  dan  X X    0, 011 0, 00034 0, 0001
1

897 47032 56905   0, 0148 0, 0001 0, 00034 

Dan
 1026 
X Y  54256 
 61331
8.62 Statistika Pendidikan 

Dengan demikian, diperoleh


b0   1,515 0, 011 0, 0148  1026  50,54 
  
b   b1    0, 011 0, 00034 0, 0001 54256    0,57 
b2   0, 0148 0, 0001 0, 00034   61331  0,19 
Dari hasil perhitungan di atas diperoleh persamaan regresinya adalah
Yˆ  50,54  0,57 X1  0,19 X 2
Tabel analisis varians untuk regresi ganda tidak jauh berbeda dengan regresi
linear sederhana. Hipotesis yang diuji adalah
H0 :  1 =  2 = … =  k = 0
H1 : minimal ada satu i 0. i = 1, 2, …, k
Adapun tabel variansnya adalah sebagai berikut.

Tabel 8.18
Anova Regresi Ganda

Sumber Derejat Jumlah Kuadrat Rata-Rata


Keragaman Bebas (JK) Kuadrat (KT)

 Yˆ  Y 
2 JK reg
Karena Regresi k i
2
sreg 
k

 Y  Yˆ 
Sekitar Regresi 2 JK res
n – (k – 1)
2
sres 
(residu) i i
n  (k  1)

 Y  Y 
Total (sekitar rata- 2
n–1 i
rata)

Dengan k menyatakan banyaknya variabel bebas dan n menyatakan


banyaknya sampel.
Pasca pengujian keseluruhan model dengan ANOVA adalah uji masing-
masing koefisien atau pengujian individual. Dalam regresi linear sederhana,
karena koefisien yang diuji hanya satu, yakni , maka hasil pengujian ini
sama dengan pengujian keseluruhan model.
Hipotesis yang diuji dalam pengujian individual ini adalah
H0 : i = i0 melawan
H1 : i  i0 atau H1 : i > i0 atau H1 : i < i0
Dengan i = 1, 2, 3, …, k
 MPDR5202/MODUL 8 8.63

Dengan asumsi-asumsi yang dipenuhi (akan dibahas pada bagian akhir


modul ini), maka pengujiannya menggunakan statistik
bi  i 0
t
Sbi

Dan jika  i0 = 0, maka statistik ujinya adalah


bi
t
Sbi

Dengan dk untuk distribusi t adalah (n – 2). Kriteria pengujian seperti yang


telah kita ketahui ditentukan oleh Hipotesis Alternatifnya (H 1). Jika
H1 :    0, misalnya, maka tolak H0 jika thitung  t  , dk atau thitung  t  , dk Proses
1 1
2 2
.
perhitungan di atas jika dilakukan secara manual tentu tidak mudah. Untuk
itu kita perlu memanfaatkan software pengolah data. Berikut kita lakukan
analisis terhadap data di atas.
Langkah pertama data diinput seperti yang terlihat pada gambar berikut.

Gambar 8.13
Contoh Input Data Regresi Linear Jamak
8.64 Statistika Pendidikan 

Kemudian lakukan perhitungan dengan langkah Analyze > Regression >


Linear dan akan kemudian pindahkan variabel hasil belajar ke kotak
Dependent, variabel Kompetensi Awal dan Motivasi ke kotak Independent.
Pilih method dengan Backward (untuk pemilihan regresi terbaik, jika tidak
pilih enter) dan klik OK seperti yang terlihat pada gambar berikut.

Gambar 8.14
Kota Dialog Perhitungan Regresi Linear Jamak

Output dari hasil perhitungan di atas sebagai berikut.


Dalam tabel pertama kita peroleh tabel variabel yang masuk dan yang
dikeluarkan. Hal ini terjadi karena kita memilih metode backward. Jika kita
pilih metode enter, maka tabel ini hanya memuat entered saja, yakni
keseluruhan variabel bebas yang dianalisis dalam regresi.
 MPDR5202/MODUL 8 8.65

Tabel 8.19
Variabel yang Masuk dan Dikeluarkan dengan Metode Backward

Variabels Entered/Removedb
Variabels Variabels
Model Method
Entered Removed
1 Motivasi, . Enter
Kompetensi
Awal
2 . Motivasi Backward (criterion:
Probability of F-to-remove >
= .100).
a. All requested variabels entered.
b. Dependent Variabel: Hasil Belajar

Dari tabel di atas, variabel motivasi dan kompetensi awal masuk secara
bersama dalam perhitungan analisis regresi, tetapi pada langkah berikutnya
variabel motivasi dikeluarkan dari persamaan regresi. Hal ini disebabkan
variabel motivasi tidak berpengaruh secara individual terhadap hasil belajar.
Proses iteratif dalam perhitungan ini sampai diperoleh regresi terbaik adalah
2 tahap, yakni sampai dengan model 2. Untuk lebih jelasnya dapat dilihat
pada hasil perhitungan berikutnya.
Hasil perhitungan berikutnya adalah model summary. Seperti yang telah
dijelaskan di atas, bahwa model ini berisi R2 , R2 yang disesuaikan dan
kesalahan baku dari penaksiran.

Tabel 8.20
Model Summary untuk Regresi Linear Jamak

Model Summary
Adjusted R Std. Error of the
Model R R Square
Square Estimate
1 .599a .359 .252 11.89227
2 .564b .319 .266 11.77571
a. Predictors: (Constant), Motivasi, Kompetensi Awal
b. Predictors: (Constant), Kompetensi Awal
8.66 Statistika Pendidikan 

Seperti yang dijelaskan di atas bahwa ada 2 tahapan analisis, dimana


pada tahap kedua ada variabel yang dikeluarkan dan model regresi. Pada
tabel di atas, model 1 mempunyai nilai R2adjusted (yang disesuaikan) adalah
0,252. Perlu diketahui bahwa untuk regresi dengan lebih dari dua variabel
bebas digunakan Adjusted R2 sebagai koefisien determinasi (Santoso, 2001).
Kemudian pada model 2, variabel motivasi dikeluarkan dan nilai R2 yang
disesuaikannya meningkat menjadi 0,266.
Hasil analisis kecocokan modelnya dapat dilihat pada tabel berikut.

Tabel 8.21
Anova untuk Pengujian Keberartian Model Regresi Jamak

ANOVAc
Sum of Mean
Model df F Sig.
Squares Square
1 Regression 948.488 2 474.244 3.353 .070a
Residual 1697.112 12 141.426
Total 2645.600 14
2 Regression 842.924 1 842.924 6.079 .028b
Residual 1802.676 13 138.667
Total 2645.600 14
a. Predictors: (Constant), Motivasi, Kompetensi Awal
b. Predictors: (Constant), Kompetensi Awal
c. Dependent Variabel: Hasil Belajar

Analisis varians pertama dilakukan pada model regresi yang memuat dua
variabel bebas, yakni kemampuan awal dan motivasi. Hasil analisis
menunjukkan bahwa hipotesis nol ditolak pada taraf signifikansi 0,070.
Untuk model kedua yang hanya memuat variabel bebas kemampuan awal,
analisis varians menunjukkan bahwa model yang sesuai dalam menaksir hasil
belajar dengan model regresinya adalah Yˆ  42,311  0,509 X1 seperti yang
terlihat pada tabel di bawah ini.
 MPDR5202/MODUL 8 8.67

Tabel 8.22
Hasil Perhitungan dan Pengujian Koefisien Regresi Secara Individual

Coefficientsa
Unstandardized Standardized
Model Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) 50.537 14.639 3.452 .005
Kompetensi .570 .220 .632 2.589 .024
Awal
Motivasi -.190 .220 -.211 -.864 .405
2 (Constant) 42.311 11.010 3.843 .002
Kompetensi .509 .206 .564 2.466 .028
Awal
a. Dependent Variabel: Hasil Belajar

Pada tabel di atas diketahui alasan mengapa motivasi dikeluarkan dalam


model regresi. Dari hasil pengujian secara individual untuk motivasi, nilai t
hitungnya adalah -0,864 dengan peluang penolakan hipotesis nol sebesar
0,405 yang jauh lebih besar daripada 0,05. Dengan demikian, pada pengujian
ini hipotesis nolnya diterima. Arti dari hasil pengujian ini adalah
sebagaimana yang telah dijelaskan di atas bahwa motivasi tidak memberi
pengaruh secara signifikan terhadap hasil belajar. Setelah variabel motivasi
dikeluarkan, maka variabel bebas dalam regresi tinggal satu, yakni
Kompetensi Awal. Hasil pengujian terhadap koefisien variabel menunjukkan
adanya keberartian, yakni nilai signifikansi penolakan hipotesis nolnya 0,028
yang jauh lebih kecil dari 0,05. Dengan demikian, variabel bebas kompetensi
awal memberi pengaruh yang berarti terhadap hasil belajar siswa.
Perlu dijelaskan di sini bahwa hasil-hasil perhitungan ini hanyalah
contoh dengan data rekayasa. Dengan demikian, generalisasi yang berkaitan
dengan hubungan-hubungan variabel dalam contoh tersebut tidak
dapat/bukan merupakan suatu dalil yang dapat dipertanggungjawabkan
secara ilmiah.
8.68 Statistika Pendidikan 

C. PENGUJIAN ASUMSI

Pada pembahasan di atas telah sedikit disinggung tentang beberapa


asumsi yang harus dipenuhi dalam analisis regresi, misalannya error atau i
akan menyebar normal dengan rata-rata nol, dan varians 2. Secara
keseluruhan ada beberapa asumsi yang harus diperhatikan dalam analisis
regresi linear. Menurut Kurniawan (2008) asumsi-asumsi tersebut adalah
sebagai berikut.
1. Model dispesifikasikan dengan benar
Asumsi ini adalah asumsi pertama yang harus dipenuhi oleh peneliti
bersifat konseptual atau teoritis. Maksud dari “model dispesifikasikan
dengan benar” adalah bahwa model regresi tersebut dirancang dengan
benar oleh peneliti sesuai dengan analisis teori yang dilakukannya.
Dalam bahasa penelitian dinamakan dengan kerangka teori. Untuk itu,
asumsi ini tidak ada uji statistikanya. Hal ini disebabkan model regresi
yang dirancang berhubungan dengan konsep teoritis dari kasus yang
sedang diteliti.

2. Error menyebar normal dengan rata-rata nol dan suatu ragam (variance)
tertentu.
Penulisan matematis dari asumsi kedua ini adalah

 i  N  0,  2 

i merupakan lambang untuk error ke-i. Sedangkan ~ adalah lambang


matematis untuk kalimat “menyebar mengikuti distribusi” dan notasi
N(0,2) menyatakan distribusi normal dengan rata-rata nol dan ragam
2.Ilustrasi dari asumsi ini dapat dilihat seperti pada gambar berikut.
 MPDR5202/MODUL 8 8.69

Gambar 8.15
Asumsi Sebaran Pengamatan dari Distribusi Normal dan Varians yang Sama

Terdapat beberapa statistik uji yang dapat digunakan untuk menguji


asumsi kenormalan error dengan menggunakan data residual, di
antaranya adalah Kolmogorov-Smirnov normality test, Shaphiro-Wilks
test, dan lain-lain. Kolmogorov-Smirnov test bekerja dengan cara
membandingkan 2 buah distribusi data, yaitu distribusi yang
dihipotesiskan dan distribusi yang teramati. Distribusi yang
dihipotesiskan dalam kasus ini adalah distribusi normal. Sedangkan
distribusi yang teramati adalah distribusi yang dimiliki oleh data yang
sedang kita uji. Apabila distribusi yang teramati mirip dengan distribusi
yang dihipotesiskan (distribusi normal), maka kita bisa menyimpulkan
bahwa data yang kita amati memiliki distribusi/sebaran normal.
Hipotesis dalam uji normalitas adalah:
H0 : Data menyebar normal (dalam hal ini error menyebar normal)
H1 : Data tidak menyebar normal (error tidak menyebar normal)
Selain dengan statistik uji, pemeriksaan kenormalan residual dapat pula
dilakukan dengan cara deskriptif melalui grafik QQ-Plot. Contoh grafik
QQ-Plotdimana data yang diplotkan menyebar normal adalah sebagai
berikut:
Ciri-ciri dari data yang menyebar normal bila diplotkan dengan QQ-Plot
adalah bahwa titik-titik data tersebut tersebar di sekitar garis lurus.
Pembaca sebaiknya tidak perlu terkejut bila suatu saat menemukan
8.70 Statistika Pendidikan 

bahwa ujung-ujung dari titik-titik data tersebut agak menjauh dari garis
lurus. Hal ini adalah hal yang wajar dan tidak perlu dianggap serius.
Fokus perhatian kita sebenarnya adalah pada daerah tengah dari
kumpulan titik data tersebut. Bila dapat didekati atau digambarkan
dengan garis lurus, maka data tersebut dapat dikatakan menyebar
normal.

3. Varians dari error bersifat homogen (homoskedastic).


Maksud dari ragam bersifat homogen adalah bahwa error memiliki nilai
varians yang sama antara error ke-i dan error ke-j. Secara matematis
ditulis  21   22   2 di mana i, j = 1, ...., n; dan n = banyaknya
pengamatan. Bagaimanapun juga, error sebenarnya berupa data. Hanya
saja, sangat sulit atau bahkan tidak mungkin untuk mengetahui nilainya
secara pasti. Oleh karena itu, diperlukan suatu penduga dari data error.
Data penduga yang paling tepat adalah data residual. Setiap nilai dari
data residual diharapkan memiliki nilai varians yang mirip. Apabila
error memiliki varians yang homogen, demikian juga seharusnya dengan
residualnya. Dengan demikian, apabila kita temukan bahwa residual
memiliki varians yang homogen, maka kita dapat mengatakan bahwa
error juga memiliki varians yang homogen. Statistik uji yang sering
digunakan adalah Breusch-Pagantest.
Hipotesis yang berlaku dalam uji homoskedatisitas varians error adalah:
H 0 :  21   22    2 melawan H1 : Setidak-tidaknya ada satu pasang
ragam error yang tidak sama
Atau kita juga dapat menggunakan kalimat biasa dalam menyusun
hipotesis:
H0 : Ragam error bersifat homoskedastik
H0 : Ragam error bersifat heteroskedastik.

4. Errortidak mengalami autokorelasi


Adanya autokorelasi pada error mengindikasikan bahwa ada satu atau
beberapa faktor (variabel) penting yang mempengaruhi variabel terikat Y
yang tidak dimasukkan ke dalam model regresi. Autokorelasi sering pula
muncul pada kasus dimana data yang digunakan memasukkan unsur
waktu (data time-series). Statistik uji yang sering dipakai adalah Durbin-
 MPDR5202/MODUL 8 8.71

Watson statistics. (DW-statistics). Hipotesis untuk uji asumsi


autokorelasi yang sering dipakai adalah:
H0 :  = 0
H1 :  ≠ 0
Pada beberapa paket software statistika, output untuk uji asumsi
autokorelasi pada error dengan Durbin-Watson statistics tidak
menyertakan p-value sebagai alat pengambilan keputusan, sehingga
pengguna masih harus menggunakan tabel Durbin-Watson bounds. Di
bawah ini adalah kriteria uji bagi DW-statistics untuk kasus uji 2-arah:
a. jika DW < dL, maka tolak H0 , atau
b. jika DW > 4 – dL, maka tolak H0 , atau
c. jika du < DW < 4 – dU, maka terima H0 , namun
d. jika dL ≤ DW ≤ du atau 4−dU ≤ DW ≤ 4−dL, maka tidak dapat
disimpulkan apakah terjadi autokorelasi atau tidak. Jika demikian,
sebaiknya menggunakan statistik uji yang lain, misal uji
autokorelasi sebagaimana yang diajukan oleh Theil dan Nagar.

Keterangan:
DW = nilai statistik uji Durbin-Watson hasil perhitungan
dL = batas bawah tabel Durbin-Watson bounds pada suatu n dan k
tertentu
du = batas atas tabel Durbin-Watson bounds pada suatu n dan k
tertentu
n = banyaknya pengamatan
k = banyaknya variabel bebas dalam model regresi

5. Tidak terjadi multikolinieritas antar variabel bebas.


Asumsi ini hanya tepat untuk kasus regresi linier berganda.
Multikolinieritas berarti bahwa terjadi korelasi linier yang erat antar
variabel bebas. Tentu saja, cara mengujinya bukan dengan menghitung
korelasi antar variabel bebas yang satu dengan variabel bebas yang lain,
walaupun cara ini mungkin saja dilakukan, namun dirasa kurang
“powerful”. Hal ini disebabkan walaupun terdapat variabel yang
mengalami multikolinieritas, kadang-kadang teknik korelasi tersebut
tidak dapat mendeteksinya. Statistik uji yang tepat adalah dengan
Variance Inflation Factor (VIF). Nilai VIF yang lebih besar dari 10
mengindikasikan adanya multikolinieritas yang serius.
8.72 Statistika Pendidikan 

Untuk lebih memahami pengujian-pengujian asumsi tersebut, silakan


Anda mempelajarinya dengan menggunakan referensi yang ada pada
akhir modul ini.

D. KORELASI PARSIAL DAN BERGANDA

Jika misalkan kita mengukur hubungan antara banyaknya


perbendaharaan kata dengan tinggi badan siswa Sekolah Dasar dengan
usianya yang berbeda. Korelasi yang dihitung antara kedua variabel tersebut
mungkin tidak mencerminkan hubungan langsung yang sungguh-sungguh
terdapat antara kedua variabel itu, tetapi mungkin lebih merupakan akibat
dari kenyataan bahwa baik banyaknya perbendaharaan kata, maupun tinggi
badan siswa berasosiasi dengan variabel ketiga, yakni usia. Masalah yang
munculnya adalah bagaimana jika kita ingin mengetahui hubungan yang
sungguh-sungguh kedua variabel tersebut (banyak perbendaharaan kata
dengan tinggi badan)?
Dalam statistika, masalah ini dapat diatasi dengan metode korelasi
parsial. Dalam korelasi parsial, akibat-akibat variasi yang disebabkan oleh
suatu variabel ketiga terhadap hubungan antara dua variabel, misal X dan Y,
dapat dihilangkan. Dengan kata lain, korelasi antara X dan Y ditemukan
dengan variabel ketiga, Z, yang dijaga agar konstan. Simbol untuk parsial
yang menyatakan korelasi X dan Y dengan mengontrol Z dilambangkan
dengan rXY .Z .
Menurut Wahyudin (2011) ada tiga yang mungkin muncul dalam
korelasi parsial ini. Pertama,jika korelasi berderajat nol  rXY  adalah hampir
sama dengan korelasi parsial rXY .Z , maka disimpulkan bahwa variabel kontrol
(Z) memiliki pengaruh kecil atau bahkan tidak memiliki efek sama sekali
pada hubungan bivariat X dan Y. Istilah ini disebut sebagai hubungan
langsung.
Pola kedua yang mungkin muncul apabila korelasi berderajat nol lebih
besar dari korelasi parsial  rXY  rXY .Z  , maka kita sebut pola seperti ini
spurious (palsu) atau hubungan intervening (pembaur). Artinya hubungan
antara X dan Y menurun saat dikontrol oleh Z. Keputusan apakah hubungan
itu bersifat palsu atau pembaur hendaknya didasarkan pada kajian teori
peneliti sendiri, bagaimana kelogisannya. Jika Z adalah sebab dari X maupun
Y (Z secara logis terjadi sebelum X dan Y), maka kita peroleh suatu
 MPDR5202/MODUL 8 8.73

hubungan palsu. Bila Z secara kausal mengaitkan X dan Y (Z secara logis


terjadi di antara X dan Y), maka kita peroleh suatu hubungan pembaur.
Pola ketiga adalah adanya interaksi, yakni apabila hubungan X dan Y
berubah-ubah untuk nilai Z yang berbeda. Pola ini sulit dideteksi dengan
korelasi parsial. Wahyudin (2011) memberi contoh, misalkan X adalah status
pernikahan dan Y pendapatan, dengan variabel kontrolnya adalah jenis
kelamin (Z). Misalkan kita menemukan bahwa korelasi di antara status
pernikahan dan pendapatan adalah negatif untuk wanita (yang berarti para
wanita yang menikah memiliki pendapatan lebih kecil dibandingkan dengan
para wanita yang tidak menikah). Tetapi sebaliknya, korelasinya positif
untuk laki-laki (yang berarti laki-laki yang menikah memiliki pendapatan
lebih besar dibandingkan dengan laki-laki yang tidak menikah). Dalam
contoh tersebut, jenis kelamin dan pernikahan berinteraksi dalam
pengaruhnya terhadap pendapatan.
Untuk menghitung korelasi parsial, pertama-tama definisikan matriks R
sebagai korelasi sederhana antara k variabel X1 , X 2 ,  , X k , dengan tidak
ada yang dipandang sebagai variabel tak-bebas (dependent). Jadi
1 r12 r1k 
r 1 r2 k 
R   21
 
 
 rk1 rk 2 1

Invers dari matriks R, misalkan sebagai berikut (kembali baca materi di atas
dalam mencari invers matriks)
 C11 C12 C1k 
C C22 C2 k 
R 1  C   21
 
 
Ck1 Ck 2 Ckk 

Koefisien korelasi parsial antara Xi dengan Xj dapat dihitung melalui rumus


Cij
rij .1 i 1,i 1, j 1, j 1 k  (Steel &Torrie, 1995)
Cii C jj

Secara khusus, jika ada 3 variabel, sebut X1 , X 2 , dan Y , maka matriks


korelasinya adalah
8.74 Statistika Pendidikan 

1 r12 r1 y 
R   1 r2 y 
 1 
Matriks inversnya adalah (Anda pelajari cara mencari invers matriks dengan
kofaktor)
 1  rY22 r12  r1Y rY 2 r1Y  r12 r2Y 
1  
R  C   r21  rY 1r2Y 1  rY21 r2Y  r21r1Y 
 rY 1  r21rY 2 rY 2  r12 rY 1 1  r122 

Jadi jika kita hitung:
C12   r12  r1Y rY 2  r12  r1Y rY 2
r12.Y   
C11C22  
1  rY 2 1  rY 1
2 2
 
1  rY22 1  rY21  
Dengan cara yang sama, kita dapat menghitung
CY 1 rY 1  r21rY 2
rY 1.2  
CYY C11 1  r122 1  rY22 
Dan
CY 2 rY 2  r12 rY 1
rY 2.1  
CYY C11 1  r 1  r 
2
12
2
Y2

Sebagai contoh, misalkan diketahui korelasi antara variabel X 1, X2 dan


Y dengan banyak observasi 30 responden adalah sebagai berikut
X1 X2 Y
X1 1,000 0,209 -0,718
X2 1,000 -0,499
Y 1,00

Pertama kita dapat menghitungnya secara langsung dari korelasi antar


variabel di atas, misalkan
rY 1  r21rY 2  0, 718   0, 209  0, 499  0, 614
rY 1.2     0, 724

1  r122 1  rY22  1  0, 2092  1   0, 499 2 0,847 
Coba Anda hitung berapa harga dari r12.Y dan rY 2.1 !
Jika perhitungannya menggunakan entry dari R-1, maka terlebih dahulu
kita hitung R-1 , hasilnya adalah
 MPDR5202/MODUL 8 8.75

 0, 750 0,149 0, 613 


1  
R  0, 485 0,349 
 0,956 

Dari mariks tersebut, maka dapat kita hitung
CY 1 0, 613
rY 1.2    0, 724
CYY C11  0,956  0, 750 
CY 2 0,349
rY 2.1    0,513
CYY C22  0,956 0, 485
Untuk menguji korelasi parsial dengan H0 : ij.1 i 1,i 1, j 1, j 1 k 0
menurut Steel & Torrie (1995) dapat dilakukan dengan statistik t, yakni
nk
tr
1 r2
Dengan derajat bebas, dk = n – k
Misalkan kita uji korelasi parsial di atas dengan hipotesis H 0 : Y 2.1  0
melawan H1 : Y 2.1  0 , maka nilai t hitungnya adalah
n3 30  3
t  rY 2.1  0,513  3,11
1  rY22.1 1   0,513
2

Dari tabel t-student dengan mengambil  = 0,05 untuk dk = 27 adalah 2,052.


Karena t – hitung = -3,11 lebih kecil dari - t0,025 (27) = -2,052, maka hipotesis
nol ditolak.
Berikutnya kita bahas koefisien korelasi ganda, RY2.1.2...k , yang
sebenarnya sudah dibahas dalam materi regresi di atas. Korelasi ini
mengukur kedekatan titik-titik pengamatan dengan persamaan regresi.
Melalui korelasi ini kita memungkinkan untuk mengkaji pengaruh atau efek
bersama dari semua variabel bebas terhadap variabel terikatnya. Perhitungan
untuk harga R2 telah dibahas sebelumnya, yakni
JK regresi
R2 
JK total
Jika kita telah menghitung, misalnya diperoleh harga R2 = 0,35, maka dapat
disimpulkan bahwa 35% variabel bebas dalam model regresi secara bersama
berpengaruh terhadap variabel terikat. Dalam kata lain, Wahyudin (2011)
menuliskannya sebagai 35% variasi dalam variabel terikat dijelaskan oleh
variabel-variabel bebasnya.
8.76 Statistika Pendidikan 

Akhir dari pembahasan kedua korelasi ini (parsial dan ganda), Sudjana
(1989) mengemukakan hubungan antara korelasi parsial dan korelasi ganda.
Jika misalkan diketahui variabel X1, X2 dan Y, didapat hubungan bahwa

1  R   1  r 1  r 
2
Y .12
2
Y1
2
Y 2.1

Dan jika terdapat variabel X1, X2, X3 dan Y, hubungannya adalah

1  R   1  r 1  r 1  r 
2
Y .123
2
Y1
2
Y 2.1
2
Y 3.12

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!
1) Dalam kelas statistika, seorang dosen memberikan tes kemampuan
matematika dasar (X) pada hari pertama kuliah. Pada akhir perkuliahan,
mahasiswa diberi ujian (Y), masing-masing skor keduanya adalah
sebagai berikut:
Mahasiswa X Y Mahasiswa X Y
1 29 56 31 6 29
2 9 26 32 18 56
3 14 43 33 16 52
4 28 38 34 6 20
5 21 53 35 22 49
6 10 36 36 32 38
7 16 33 37 27 53
8 11 38 38 21 34
9 18 48 39 7 28
10 27 42 40 29 45
11 23 42 41 29 45
12 11 37 42 27 46
13 12 37 43 15 36
14 16 34 44 31 57
15 23 49 45 18 29
16 14 37 46 9 32
17 21 41 47 27 53
18 14 25 48 19 22
19 22 44 49 14 35
20 16 24 50 34 41
21 19 42 51 15 51
 MPDR5202/MODUL 8 8.77

Mahasiswa X Y Mahasiswa X Y
22 12 39 52 14 28
23 9 36 53 21 42
24 10 33 54 21 53
25 19 36 55 20 23
26 34 42 56 35 44
27 23 34 57 27 53
28 34 56 58 39 48
29 19 38 59 21 52
30 18 44 60 24 40

a. Gambarlah diagram pencar dari data tersebut dengan cara:


(1) Pasangan koordinat dari kedua skor
(2) Menggunakan interval kelas dengan interval yang pertama bagi
X adalah 6 – 8, dan interval pertama bagi Y adalah 20 – 22.
b. Gunakan kalkulator menentukan korelasi antara X dan Y pada data
30 yang pertama.
c. Gunakan kalkulator untuk menentukan korelasi antara X dan Y dari
data 30 yang kedua (31 – 60), apakah hasil jawaban b) dan c) sama?
Apakah hasil tersebut mengungkapkan tentang pengaruh dari variasi
sampling?
2) Identifikasi dua keuntungan penggunaan kriteria kuadrat terkecil
(leastsquare) sebagai pendekatan untuk memperoleh pencocokan kurva
terbaik!
3) Jika r = 1,00, berapakah nilai dari  ey2 ?
4) Jika r = –1,00, berapakah nilai dari e 2
y ?
5) Dalam penelitian tentang kreativitas, sejumlah anak diuji dengan tes
kreativitas dan korelasi dengan IQ diperoleh +0,20. Hal ini memberi
kesimpulan bahwa kreativitas jelas berbeda dari intelegensia, apakah
anggapan itu benar? Jelaskan pendapat Anda!
8.78 Statistika Pendidikan 

Petunjuk Jawaban Latihan

1) Diagram pencar dengan menggunakan skor mentah

2) regresi untuk data 30 pertama adalah y  26,988  0, 6764 x dan regresi


untuk data 30 kedua adalah yˆ  26,57  0,6784x . Perbedaan karena
sampling. Sebagaimana rata-rata, regresi juga berubah dari sampel ke
sampel.
3) Untuk r  1 ,  ey2  0 ,
4) Begitu juga untuk r  1 , e 2
y 0.
Ingat bahwa kedua nilai korelasi tersebut hakikatnya sama, yakni
mempunyai hubungan yang sempurna. Perbedaan hanya pada sifat
hubungannya, serah dan berkebalikan.
5) Nilai korelasi antara kreativitas dan intelejensia sebesar +0,2
menunjukkan arti bahwa kedua variabel mempunyai kecenderungan
positif atau searah. Namun karena nilainya sangat kecil dapat diduga
bahwa kedua variabel saling independen. Artinya Intelegensia tidak
ditentukan oleh IQ, juga sebaliknya.
 MPDR5202/MODUL 8 8.79

R A NG K U M AN

1. Dua variabel yang berkorelasi, mungkin dapat menjadi prediksi,


kedudukan yang satu dapat diprediksi dengan baik kedudukan yang
lainnya. Masalah prediksi ini dalam statistika diistilahkan dengan
regresi.
2. Jika kita cukup mempunyai alasan bahwa kedua variabel
mempunyai hubungan yang linear (dapat dilihat dari diagram
pencarnya), maka kita dapat mengembangkan prediksi dari skor satu
variabel dari skor variabel lainnya. Variabel prediktor atau variabel
bebas (independent) biasanya dilambangkan dengan X dan variabel
responsnya atau variabel terikat (dependent) biasanya dilambangkan
dengan Y.
3. Penaksiran model regresi dilakukan dengan penaksir kuadrat
terkecil, dan persamaannya diperoleh melalui penyelesaian matriks
b   X  X  X  Y . Secara khusus untuk persamaan regresi linear
1

sederhana persamaan regresinya diperoleh dengan


n XY    X   Y 
b
 
n  X 2    X  n  Y 2  Y 
2 2

Dan a  Y  bX
4. Besar pengaruh variabel bebas alam model terhadap variabel
terikatnya dinyatakan dengan koefisien determinasi yang
disimbolkan dengan R2. Harga dari R2merupakan rasio antara
jumlah kuadrat regersi dengan jumlah kuadrat total. Untuk itu, harga
dari koefisien determinasi ini paling kecil 0 dan paling besar 1. Nilai
paling besar dicapai ketika jumlah kuadrat residunya sama dengan
nol, dengan kata lain semua titik-titik data berada pada garis
regresinya. Hal ini secara empirik sulit terjadi.
5. Pengujian keberartian model regresi dilakukan secara dua tahap,
pertama pengujian keseluruhan. Artinya kita menguji semua
koefisien variabel bebas dalam model secara sekaligus.
Pengujiannya menggunakan Anova. Pengujian berikutnya adalah uji
individual, yakni pengujian terhadap masing-masing koefisien
variabel bebasnya. Uji statistik yang digunakan adalah uji t-student.
6. Statistika inferensi lain yang lazim dibahas dalam regresi adalah
interval kepercayaan bagi koefisien regresi. interval kepercayaan
dihitung dengan statistik t-student.
8.80 Statistika Pendidikan 

7. Ada beberapa asumsi yang mesti perhatikan oleh kita dalam


melakukan analisis regresi, yang pertama dan menjadi dasar analisis
adalah penjelasan teoritis antar variabel. Kemudian asumsi
berikutnya berkaitan data, yakni sisaan atau eror yang sebarannya
harus mengikuti sebaran normal dengan rata-rata nol dan varians 2,
varians dari error bersifat homogen (homoskedastic), error tidak
mengalami autokorelasi, dan tidak terjadi multikolinieritas antar
variabel bebas.

TES F OR M AT IF 2

Pilihlah satu jawaban yang paling tepat!

1) Misalkan dari persamaan regresi untuk suatu masalah tertentu diketahui,


jika X  81, maka Yˆ  317, jika X  84, maka Yˆ  317, dan
jika X  92, maka Yˆ  317
a. Berapakah nilai dari r? mengapa?
b. Berapakah Y ? Mengapa?
c. Dapatkah nilai dari X diramalkan (inferensi)? Jelaskan!
2) Dari persamaan regresi Yˆ  2 X  5 .
a. Apakah skor X dan Y dari persamaan tersebut berasalah dari skor
baku atau angka kasar? Jelaskan!
b. Tafsirkan besar r dari persamaan regreasi tersebut!
3) Misalkan diberikan pasangan skor X dan Y sebagai berikut
X Y X Y X Y X Y
2 2 4 4 4 3 9 9
2 1 5 7 3 3 10 6
1 1 5 6 6 6 9 6
1 1 7 7 6 6 4 9
3 5 6 8 8 10 4 10

Tentukanlah :
a. Rata-rata, jumlah kuadrat dan jumlah hasil kali silang
  x 2 ,  y 2 ,  xy  simpangan baku, dan korelasi antara X dan Y!
b. Persamaan regresi dari Y dalam X
 MPDR5202/MODUL 8 8.81

c. Jumlah Kuadrat Total (SStotal), Jumlah Kuadrat Regresi (SSreg), dan


Jumlah Kuadrat Residu (SSres)
d. Nilai F hitung dan koefisien determinasi.
e. Varians dan simpangan baku taksiran (S2Y.X dan SY.X).
f. Simpangan baku koefisien Regresi (Sb)
g. Nilai t-hitung, apakah t2 sama dengan nilai F-hitung pada (d)?
h. Gambar diagram pencar dan garis regresinya.
i. Kesimpulan dari hasil perhitungan-perhitungan!

4) Berikut disajikan data dari tiga variabel X1, X2, dan Y.

X1 X2 Y X1 X2 Y
2 5 2 4 3 3
2 4 1 3 6 3
1 5 1 6 9 6
1 3 1 6 8 6
3 6 5 8 9 10
4 4 4 9 6 9
5 6 7 10 4 6
5 4 6 9 5 6
7 3 7 4 8 9
6 3 8 4 9 10
Hitunglah
a. Jumlah, rata-rata, simpangan baku, jumlah kuadrat dan jumlah hasil
kali silang, dan korelasi antar dua variabelnya!
b. Regresi Y dalam X1 dan X2!
c. SSreg, SSres, R2y.12, F, dan S2Y.12!
d. Harga t untuk masing-masing koefisien!
 
e.  Y  Yˆ dan  Y  Yˆ  
2

f. ry2.1 dan ry1.2!


g. Kesimpulan dari hasil-hasil yang diperoleh
8.82 Statistika Pendidikan 

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 25. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut
untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan
Belajar 2.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 3, terutama bagian yang
belum dikuasai.
 MPDR5202/MODUL 8 8.83

Kunci Jawaban Tes Formatif

Test Formatif 1
1) Diketahui sebuah sampel acak berukuran n = 24 menghasilkan r = –0,37.
Untuk menentukan interval kepercayaan bagi , kita hitung terlebih
dahulu !
1 1 1
 Z     0, 218
n3 24  3 4,582
1 r   1  0,37   0, 63 
Z   0,5ln    0,5ln    0,5ln    0,388
 1  r   1  0,37   1,37 
Selang kepercayaan bagi Z’ adalah CI   Z    Z   Z 1   Z  . (CI:
2

Confidence Inteval) Dengan demikian, selang kepercayaan bagi nilai


korelasi di atas, jika dipilih  = 0,05 adalah
CI   Z    Z   Z 1   Z   0,388  1,96  0, 218   0,388  0, 427 atau
2

dapat juga ditulis sebagai CI  Z     0,815 ; 0,039  . Kemudian dari


tabel transformasi dan dengan menggunakan interpolasi, maka
menghasilkan selang kepercayaan 95% bagi  adalah (–0,67 ; 0,03).
Hipotesis yang diuji adalah H0 :  = 0 melawan H1 : < 0.
Misalkan diambil taraf signifikansi 0,05. Dari data yang diketahui, kita
dapat menghitung nilai statistik t-student sebagai berikut
n2 22
tr  0,37  1,868
1 r2 0,8631
Dari tabel t-student dengan dk = 22 dan  = 0,05 diperoleh t0,5(22) =
1,717. Karena t-hitung = -1,868 < -1,717, maka kita tolak Hipotesis
nolnya. Artinya hipotesis tersebut sangat berarti pada taraf signifikansi
0,05.
2) Berikut disajikan data skor matematika dan IPA dari dua kelompok
siswa laki-laki dan perempuan yang diambil secara sampling dari siswa
kelas IV.
Mat 55 56 78 80 87 45 78 76 90 87
Laki Laki
IPA 65 60 70 82 88 57 65 80 85 90
MAt 65 67 70 75 80 90 50 44 50 55
Perempuan
IPA 70 75 75 74 85 95 60 50 55 60
8.84 Statistika Pendidikan 

a. Nilai korelasi pada masing masing kelompoknya adalah r l = 0,873


dan rp= 0,983!
b. Hipotesis yang diuji bagi keduanya merupakan hipotesis berarah
(positif).
Untuk kelompok laki-laki
n2 8
tr  0,873  0,873 33,613  5,061
1 r 2
0, 238
Dengan mengambil  = 0,05, maka dari t-student diperoleh t(0,05)(8) =
1,860 yang lebih kecil dari t-hitung. Dengan demikian hipotesis
nolnya ditolak. Artinya ada kaitan yang positif antara skor
Matematika dan IPA pada kelompok laki-laki.
Untuk kelompok perempuan
n2 8
tr  0,983  0,983 235, 29  15,08
1 r 2
0,034
Dengan mengambil  = 0,05, maka dari t-student diperoleh t(0,05)(8) =
1,860 yang lebih kecil dari t-hitung. Dengan demikian hipotesis
nolnya ditolak. Artinya ada kaitan yang positif antara skor
Matematika dan IPA pada kelompok perempuan.
c. Terakhir kita uji perbandingan kedua korelasinya dengan hipotesis
yang diuji adalah
H0 : l = p melawan H0 : l  p.
z1  ln 1  0,873  ln 1  0,873    0, 628   2, 064    1,346
1 1
2 2
z2  ln 1  0,983  ln 1  0,983   0, 684   4, 074    2,379
1 1
2 2
Dan
1 1
 z  z    0,535
1 2
10  3 10  3
Dengan demikian kita peroleh
 z  z  1,346  2,379
z 1 2   1,931
 z1  z2 0,535
Jika kita pilih taraf signifikansi 0,05, maka titik kritinya adalah
z  1,96 atau z  1,96 . Karena z-hitung berada di antara –1,96 dan
1,96, maka kita terima Ho. Artinya tidak ada perbedaan korelasi di
antara kedua kelompok tersebut.
 MPDR5202/MODUL 8 8.85

3) Untuk membandingkannya tentu harus dilakukan pengujian. Tapi secara


intuitif kita dapat membuat kesimpulan awal bahwa dengan r = + 0,75
yang diperoleh dari 6 kasus (responden), sangat mungkin korelasinya
tidak berarti, sebaliknya dengan korelasi +0,12 yang didasarkan atas 500
responden, kemungkinan korelasinya berarti. Secara analitik kita
buktikan untuk keduanya.
Hipotesis yang diuji adalah Ho :  = 0 melawan H1 :   0 (dipilih sesuai
dengan soalnya).
Untuk kasus pertama.
n2 4
tr  0,75  2, 267
1 r 2
0, 4375
Dari tabel t-student dengan mengambil  = 0,05 diperoleh t0,025(4)=2,776.
Karena t-hitung = 2,267 berada di antara –2,776 dan 2,776, maka
hipotesis nolnya diterima. Artinya korelasi tersebut tidak berarti.
Untuk kasus kedua
n2 498
tr  0,12  2,697
1 r 2
0,9856
Dari tabel t-student dengan mengambil  = 0,05 diperoleh
t0,025(498)=1,965. Karena t-hitung = 2,697 lebih besar dari 1,965, maka
hipotesis nolnya ditolak. Artinya korelasi tersebut sangat berarti.
4) Karena salah satu skala pengukuran variabelnya ordinal, maka kita dapat
menggunakan korelasi Spearman. Kecuali kita melakukan transformasi
data. Harga rs = 0,609 dengan peluang penolakan hipotesis nol untuk tes
dua sisinya adalah 0,016. Jadi jika kita memilih  = 0,05, maka kita
dapat menolak hipotesis nol. Artinya korelasi antara sikap dan hasil
kognitif dari data di atas sangat berarti.
5) Perhitungan dapat menggunakan korelasi kontingensi C. Tabel frekuensi
pengamatan dan harapannya adalah sebagai berikut.
8.86 Statistika Pendidikan 

Respons Orang Tua


Juml
Setuju Tidak Setuju Tidak Peduli
ah
E O E O E O
I 20 15.360 9 10.18 5 8.46 34
II 15 14.909 10 9.88 8 8.21 33
Kelas

III 14 16.264 12 10.78 10 8.95 36


IV 16 15.360 10 10.18 8 8.46 34
V 16 16.264 8 10.78 12 8.95 36
VI 8 10.843 10 7.19 6 5.97 24
Jumlah 89 59 49 197

 20  15,360 9  10,18  6  5,97 


2 2 2

2    
 7,19
15,36 10,18 5,97
Dan dari hasil tersebut kita dapat menghitung nilai C sebagai berikut
2 7,19
C   0,196
 n
2
7,19  179
Jadi besar asosiasi antara kelas dengan respons yang diberikan adalah
0,196. Selanjutnya kita uji keberartiannya.
Dari tabel chi-square dengan dk   6  1 3  1  10 dan  = 0,05
diperoleh (0,05)(10)
2
 18,31 . Karena nilai 2 hitung = 0,196 lebih kecil
dari 2 tabel, maka kita menerima hipotesis nol. Artinya tidak ada kaitan
subjek dalam kelas (orang tua siswa) dengan respons yang diberikannya.

Test Formatif 2
1) a. Nilai korelasinya 0, karena untuk setiap nilai X harga taksirannya
konstan.
b. Rata-rata Y sama dengan nilai taksiran dari Y, jadi Y  Yˆ  317 .
c. Dapat, dengan menggunakan persamaan regresi dari angka baku.
Yˆ  Y X X  X X 
 r   0  0 
SY  SX   SX 
2) a. Persamaan regresi Yˆ  2 X  5 diperoleh dari angka kasar, karena
koefisien dari X adalah 2 yang lebih besar dari 1. Jika diperoleh dari
angka baku, koefisien dari X merupakan korelasi antara X dan Y.
Selain itu, persamaan regresinya memuat konstanta. Regresi dalam
angka baku tidak memuat konstanta
 MPDR5202/MODUL 8 8.87

b. Harga korelasinya tidak dapat ditentukan, tetapi arah korelasi dari X


dan Y dapat ditentukan, yakni positif. Hal ini terlihat dari koefisien
X yang bertanda positif, maka garis regresi akan condong ke sebelah
kanan.
3. Dari data pada tabel dapat kita hitung
X  4,95; Y  5,50;  x 2  134,95;  y 2  165,00;  xy  100,50
a)
sX  2,665; sY  2,946; rXY  0,6735
b) Yˆ  1,814  0,745 X
c) SSreg  74,844; SSres  90,156
d) F = 14,94 dengan dk = (1, 18)
e) sb = 0,193
f) t = 3,87 dengan dk = 18; t2 =19,94 = F
g)

h) Dari hasil perhitungan menunjukkan bahwa X dan Y berkorelasi


positif. Terdapat hubungan linear yang berarti antara X dengan Y.
4) Dari data pada tabel diperoleh:
a)
X 1  4,95; X 2  5,50; Y  5,50;  x 2  134,95;  x22  85, 00
y 2
 165, 00;  x1 x2  15,50;  x1 y  100,5; x2 y  63, 00
s X1  2, 665; s X 2  2,115; sY  2,946; r12  0,1447; rY 1  0, 6735; rY 2  0,5320
8.88 Statistika Pendidikan 

b) Yˆ  1, 236  0,674 X1  0,618 X 2


c) SSreg =106,661; SSres= 58,339; R2Y.12 = 0,646; F = 15,54 ;
dk = (2,17); s2Y.12 = 3,431
d) Untuk b1 : t = 4,18; dk = 17. Untuk b2 = 3,04; dk = 17.
   
e)  Y  Yˆ  0 dan  Y  Yˆ  58,339
2

f) ry2.1 dan ry1.2!


Kesimpulan dari hasil-hasil yang diperoleh
 MPDR5202/MODUL 8 8.89

Daftar Pustaka

Dowdy, S. & Wearden, S. 1991. Statistcs for Research (second edition).


New York: John Wiley & Son.

Draper, N. & Smith, H. 1992. Analisis Regresi Terapan. Alih Bahasa:


Bambang Sumantri. Jakarta: Gramedia.

Hogg, R. V. & Craigh, A. T. 1978. Introduction to Mathematical Statistics


(fourth edition). New York: Mcmillan Publishing Co. Inc.

Kurniawan, D. 2008. Regresi Linier. R: A language and environment for


statistical computing. R Foundation for Statistical Computing, Vienna,
Austria. ISBN 3-900051-07-0, URL http://www.R-project.org.

Leech, N.L., Barret, K.C. & Morgan, G.A. 2005. SPSS for Intermediate
Statistics (Use and Interpretation). London: Lawrence Erlbaum
Associate Publishers.

Minium, E. W., King, B. M. & Bear, G. (1993). Statistical Reasoning in


Psychology and Education. New York : Joh Wiley & Sons, Inc.

Muijs, D. 2004. Doing Quantitative Research in Education With SPSS.


London : Sage Publications.

Pedhazur, E. J. 1982. Multiple Regression in Behavioral Research


(explanation and prediction). New York: Holt, Rinehart & Winston.

Sembiring. 1995. Analisis Regresi. Bandung: ITB.

Siegel, S. 1986. Statistik Nonparametric untuk Ilmu-ilmu Sosial. Alhi


bahasa: Zanzawi Suyuti dan Landung Simatupang. Jakarta: Gramedia.

Spiegel, M. R. 1992. Statistik (Versi Metrik). Alih bahasa : I Nyoman Susila.


Jakarta: Erlangga.
8.90 Statistika Pendidikan 

Sprent, P. 1991. Metode Statistic Nonparametric Terapan. Alih bahasa:


Erwin R. Osman. Jakarta: UI Press.

Steel, R.G.D. & Torrie, J. H. 1995. Prinsip Dan Prosedur Statistika. Suatu
Pendekatan Biometrik. Alih Bahasa: Bambang Sumantri. Jakarta:
Gramedia Pustaka Utama.

Sudjana. 1989. Metoda Statistika. Bandung: Tarsito.

Sugiyono. 2008. Statistika untuk Penelitian. Bandung: Alfabeta.

Wahyudin. 2011. Aplikasi Statistika Terapan. Sekolah Pascasarjana UPI:


Bandung.

Walpole, Ronald E. 1995. Pengantar Statistika (edisi ke-3). Alih bahasa:


Bambang Sumantri. Jakarta: Gramedia Pustaka Utama.
Modul 9

Analisis Jalur dan


Model Persamaan Struktural
Dr. Jarnawi Afgani Dahlan

PEN D AH U LU A N

A. DESKRIPSI SINGKAT

Modul kesembilan ini menyajikan tentang analisis jalur (path analysis)


dan pengembangan model struktural atau sering dikenal dengan Structural
Equation Model dan disingkat dengan SEM. Pada awal penyajian mahasiswa
diharapkan mampu memahami tentang istilah “model” sebagai konstruksi
kerangka pemikiran atau konstruksi kerangka teoritis yang digambarkan
dalam bentuk diagram dan/atau persamaan-persamaan matematika.
Berikutnya dibahas tentang analisis faktor konfirmatori, pengembangan
model persamaan struktural, pengujian-pengujian asumsi yang harus
dipenuhi dalam analisis SEM, perhitungan persamaan struktural dan
pengembangan SEM, dan diakhiri dengan interpretasi hasil yang diperoleh
dari perhitungan. Untuk perhitungan akan digunakan dua jenis software,
yakni lisrel dan SPSS.

B. RELEVANSI

Dalam penelitian kuantitatif, terutama pada penelitian kuantitatif bidang


sosial, sering kali peneliti dihadapkan pada pengembangan model dari
hubungan-hubungan antar variabel. Analisis SEM ini sebenarnya masuk
dalam metode statistika multivariate dependensi (kesalingbergantungan)
tingkat lanjut. Aplikasi lain dalam penelitian, analisis SEM sering digunakan
dalam pengembangan instrumen. Biasanya dalam pengembangan instrumen,
peneliti menguji validitas item instrumen menggunakan beberapa aturan atau
rumus, yakni split-half Spearman-Brown, product moment Pearson, Kuder
Richardson baik yang 20 maupun 21, atau lain-lainnya. Analisis validitas
melalui proses tersebut dilakukan secara parsial, yakni menghitung korelasi
antara skor item dengan skor total. Setelah memenuhi syarat reliabilitas dan
9.2 Statistika Pendidikan 

validitas, kemudian dilakukan analisis untuk menguji hipotesis, dan


kemungkinan timbulnya kekeliruan pengukuran dianggap tidak ada atau
error free. Pada hal menurut beberapa pakar diyakini bahwa “all construct
have some measurement error, even with the best indicator variables” (Hair,
dkk. dalam Kusnendi, 2005). Dengan demikian, jika semua konstruk (dalam
beberapa buku, istilah ini dinamakan juga dengan variabel) tidak dapat bebas
dari kekeliruan pengukuran meskipun dengan indikator terbaik, maka
persoalannya sekarang adalah diperlukan suatu metode dalam analisis yang
powerfull dapat menguji kesesuaian model konstruk atau model pengukuran
yang diajukan. Dan untuk itulah diperlukan analisis yang disebut dengan
CFA (confirmatory factor analysis).

C. TUJUAN INSTRUKSIONAL KHUSUS

Setelah membaca Modul 9 ini diharapkan mahasiswa dapat:


1. Menjelaskan dasar teori dari analisis jalur.
2. Menjelaskan variabel eksogen dan endogen dalam diagram struktural
3. Menghitung koefisien jalur.
4. Menguji koefisien jalur dan melakukan perbaikan jalur (trimming
theory), jika diperlukan.
5. Menghitung pengaruh langsung, tak langsung, dan pengaruh total dari
satu variabel eksogen ke variabel endogen.
6. Menjelaskan pentingnya CFA dalam analisis reliabilitas dan validitas
instrumen.
7. Menggunakan pengolah data (lisrel) dalam melakukan perhitungan CFA
8. Membaca dan menafsirkan keluaran dari hasil perhitungan melalui
pengolah data.
 MPDR5202/MODUL 9 9.3

Kegiatan Belajar 1

Analisis Jalur (Path Analysis)

A. PENGERTIAN ANALISIS JALUR

Telaah statistika menyatakan bahwa untuk tujuan peramalan nilai Y atas


dasar nilai-nilai X1 , X 2 , , X k , pola hubungan yang sesuai adalah pola
hubungan yang mengikuti Model Regresi, sedangkan untuk menganalisis
pola hubungan kausal antar variabel dengan tujuan untuk mengetahui
pengaruh langsung dan tidak langsung, secara serempak atau mandiri
beberapa variabel penyebab terhadap sebuah variabel akibat, maka pola yang
tepat adalah Model Analisis Jalur (Path Analysis) dikembangkan oleh Sewall
Wright sekitar tahun 1934 (Kusendi, 2004).
Path analysis digunakan apabila secara teori kita yakin berhadapan
dengan masalah yang berhubungan sebab akibat (causalitas). Tujuannya
adalah menerangkan akibat langsung dan tidak langsung seperangkat
variabel, sebagai variabel penyebab, terhadap variabel lainnya yang
merupakan variabel akibat. Sebelum melakukan analisis, hendaknya
diperhatikan beberapa asumsi sebagai berikut: (1) hubungan antar variabel
haruslah linier dan aditif, (2) semua variabel residu tak punya korelasi satu
sama lain, (3) pola hubungan antar variabel adalah rekursif atau hubungan
yang tidak melibatkan arah pengaruh yang timbal balik, (4) tingkat
pengukuran semua variabel sekurang-kurangnya adalah interval (Al Rasyid,
2005).
Terdapat beberapa istilah dan definisi yang perlu dipahami sebelum kita
membahas Path Analysis, yakni: (1) Seperti dalam regresi, dalam Path
Analysis, kita menggunakan sebuah lambang untuk variabel, misalnya X.
Untuk memudahkan biasanya digunakan hanya satu variabel, misal X. Untuk
membedakan X yang satu dengan X yang lainnya, kita menggunakan
subscript(indeks). Contoh: X1 , X 2 , X 3 X k . (2) Kita membedakan dua
jenis variabel, yaitu variabel yang menjadi pengaruh (exogenous variable),
dan variabel yang dipengaruhi (endogenous variable). (3) Lambang
hubungan langsung dari eksogen ke endogen adalah panah bermata satu,
yang bersifat recursive atau arah hubungan yang tidak berbalik/satu arah. (4)
Diagram jalur merupakan diagram atau gambar yang mensyaratkan hubungan
terstruktur antar variabel (Al Rasyid, 2005).
9.4 Statistika Pendidikan 

Secara matematik analisis jalur mengikuti pola Model Struktural yang


ditentukan dengan seperangkat persamaan:

Y1  f1  Xa, , Xq ; Ap1 ,  , A1k 


Y2  f 2  Xa, , Xq ; Ap 2 ,  , A2 k 

Yp  f p  Xa, , Xq ; Ap1 ,  , Apk 

yang mengisyaratkan hubungan kausal dari X1 , X 2 , , Xq ke

Y1 , Y2 , , Yp.

Apabila setiap variabel Y secara unik keadaanya ditentukan atau


disebabkan oleh seperangkat variabel X, maka persamaan di atas dinamakan
persamaan struktural, dan modelnya disebut model struktural.

B. JENIS MODEL ANALISIS JALUR

Pada saat akan melakukan analisis jalur, disarankan untuk terlebih


dahulu menggambarkan secara diagramatik struktur hubungan kausal antara
variabel penyebab dengan variabel akibat. Diagram ini disebut Diagram Jalur
(Path Diagram), dan bentuknya ditentukan oleh proposisi teoritik yang
berasal dari kerangka pikir tertentu.
Schumacker dan Lomax dalam Kusnendi (2005) membagi model
analisis jalur menjadi tiga jenis, yaitu correlated, mediated dan independent
path model. Secara diagram ketiganya dapat dilihat dalam gambar berikut.
 MPDR5202/MODUL 9 9.5

Gambar 9.1
Jenis Model Diagram Jalur

C. PERSAMAAN STRUKTURAL DAN DIAGRAM JALUR

Seperti dijelaskan di atas, dari model struktur dapat disusun persamaan


matematika dan ini menjadi langkah awal dalam analisis jalur. Misalkan
model strukturalnya (hubungan teoritis) adalah sebagai berikut.

Gambar 9.2
Contoh Diagram Jalur yang Menyatakan Hubungan Kausal
dari X1, X2, X3 ke X4

Gambar 9.2 menunjukkan bahwa diagram jalur tersebut terdapat tiga


buah variabel eksogenus, yaitu X1, X2, X3 dan X4,variabel endogenus X4dan X5
serta dua buah variabel residu 1 dan 2. Pada diagram di atas juga
9.6 Statistika Pendidikan 

mengisyaratkan bahwa hubungan antara X1 dengan X4, X1 dengan X5, X2


dengan X4, X3dengan X4,X3 dengan X5, dan X4 dengan X5 adalah hubungan
kausal, sedangkan hubungan antara X1 dengan X2 , X2 dengan X3 dan X1
dengan X3 masing-masing adalah hubungan korelasional. Perhatikan panah
dua arah, panah tersebut menyatakan hubungan korelasional.
Secara lengkap diagram tersebut dapat dituliskan termasuk koefisien
jalurnya adalah sebagai berikut.

1 2
X1
51
e1 e2
r12 41

r13 X2 X4 54
42 X5

r32 43
53
X3

Gambar 9.3
Hubungan kausal dari X1, X2,X3 ke X4 dan
dari X1, X3 dan X4ke X5

Bentuk persamaan strukturalnya adalah :


X 4  p41 X 1  p42 X 2  p43 X 3  1
X 5  p51 X 1  p53 X 3  p54 X 4   2

Dari diagram hubungan kausal di atas, maka proses analisisnya


dilakukan secara bertahap melalui substruktur-substruktur. Substruktur 1
menjelaskan hubungan kausal antara variabelX1, X2 dan X3ke variabelX4, serta
substuktur 2 menjelaskan hubungan kausal antara variabelX1, X3 dan X4 ke
variabelX5. Dari kedua substruktur tersebut terlihat bahwa X4 mempunyai dua
peran. Dalam substruktur pertama menjadi variabel endogen, sedangkan
dalam substruktur kedua menjadi variabel eksogen. Diagram dari masing-
masing substrukturnya adalah sebagai berikut.
Substruktur 1:
 MPDR5202/MODUL 9 9.7

X1 1
e1
r12 41
r13 X2 42 X4

r32 43
X3

Gambar 9.4
Substruktur 1
Substruktur 2:

X1
2
51 e2
41
r13 54
X4 X5
43
53
X3

Gambar 9.5
Substruktur 2

D. MENGHITUNG KOEFISIEN JALUR

Setelah persamaan struktural berhasil dirumuskan, dan dipetakan dalam


bentuk diagram, langkah berikutnya adalah menghitung koefisien jalur.
Menghitung koefisien jalur dapat didasarkan pada koefisien regresi, korelasi,
atau koefisien determinasi berganda.
Koefisien jalur menunjukkan besarnya pengaruh langsung dari suatu
variabel eksogenus terhadap variabel endogenus tertentu. Misalkan kita
perhatikan sebuah diagram struktural sebagai berikut.
9.8 Statistika Pendidikan 

Gambar 9.6
Hubungan kausal dari X1, X2 ke X3

Hubungan antara X1dan X2adalah hubungan korelasional. Intensitas keeratan


hubungan tersebut dinyatakan oleh besarnya koefisien korelasi r atau secara
lengkap ditulis r12 atau rX 1X 2 . Catatan bahwa r12  r21. Hubungan X1 dan X2
ke X3 adalah hubungan kausal. Besarnya pengaruh langsung dari X 1 ke X3,
dan dari X2 ke X3, masing-masing dinyatakan oleh besarnya nilai numerik
koefisien jalur px3 x1 atau cukup dengan p31 . Koefisien jalur px3e atau p3e
menggambarkan besarnya pengaruh langsung variabel residu (implicit
exogenous variable) terhadap X3.
Langkah kerja yang dilakukan untuk menghitung koefisien jalur dengan
memanfaatkan koefisien korelasi adalah sebagai berikut:
1. Gambarkan dengan jelas diagram jalur yang mencerminkan proposisi
hipotetik yang diajukan, lengkap dengan persamaan strukturalnya. Di
sini kita harus bisa menerjemahkan hipotesis penelitian yang kita ajukan
ke dalam diagram jalur, sehingga bisa tampak jelas variabel apa saja
yang merupakan variabel eksogen dan apa yang menjadi variabel
endogenusnya.
2. Menghitung matriks korelasi antar variabel.
Misalkan keseluruhan variabel (eksogen dan endogen) yang ada dalam
model strukturnya adalah p variabel. Matriks korelasi antar variabel yang
dianalisis dapat dituliskan sebagai berikut.
1 r12 r13 r1 p 
 1 r23 r1 p 

R 1 r3 p 
 
 
 1 
 MPDR5202/MODUL 9 9.9

Untuk menghitung koefisen korelasi yang dicari dapat menggunakan


korelasi Pearson yang telah dibahas pada modul 3. Alasan penggunaan
teknik koefisien korelasi dari Karl Pearson ini adalah karena variabel-
variabel yang hendak dicari korelasinya memiliki skala pengukuran
interval.
Untuk mengingatkan kembali rumus korelasi Pearson tersebut adalah
sebagai berikut.

rXY 
 xy ,
 x2  y2
Dengan:
  X   Y 
 xy   XY  n
 X 
2

x  X 2

n
Y 
2

 y  Y 2

n
atau dapat juga menggunakan perhitungan melalui angka kasar yakni
n XY   X  Y
rXY 
 n X 2    X 
2

n Y 2    Y  
2

3. Identifikasikan substruktur dan persamaan yang akan dihitung koefisien


jalurnya. Misalkan saja dalam substruktur yang telah kita identifikasi
terdapat k buah variabel eksogen, dan sebuah (selalu hanya sebuah)
variabel endogen Xu.
X u  pu1 X1  pu 2 X 2  pu3 X 3   puk X k  1
Maka matriks korelasi antar variabel eksogennya untuk persamaan
substruktur tersebut adalah
1 r12 r13 r1k 
 1 r r 
 23 2k 

R 1 r3k 
 
 
 1 
9.10 Statistika Pendidikan 

Misalkan sebagai contoh persamaan dinyatakan oleh persamaan


substruktur 1 pada diagram struktur 1:
X 4  p41 X1  p42 X 2  p43 X 3  1
Perhatikan bahwa pada persamaan substruktur tersebut terdiri dari 3
variabel eksogen, jadi k = 3 dan Xu = X4. Kemudian hitung matriks
korelasi antar variabel eksogen yang menyusun substruktur tersebut.
1 r12 r13 
R1   1 r23 
 1 

R1 menunjukkan matriks korelasi substrukur ke-1


4. Menghitung matriks invers korelasi variabel eksogen, dengan rumus:
C11 C12 C1k 
 C22 C2 k 
R11  
 
 
 Ckk 
5. Menghitung semua koefisien jalur pui , dimana i = 1,2, … k; melalui
perkalian matriks R11 dengan vektor kolom korelasi antara variabel
eksogen dan endogen dalam substruktur.
 pu1  C11 C12 C1k   ru1 
p   C22 C2 k   ru 2 
 u2   
    
    
 puk   Ckk   ruk 
Catatan :
Contoh perhitungan di atas merupakan model analisis jalur kompleks
yang melibatkan lebih dari 1 variabel eksogen, sehingga langkah-
langkah perhitungan untuk mencari koefisien jalurnya dapat mengikuti
pola di atas. Sementara besarnya koefisien jalur untuk model analisis
jalur sederhana, yang terdiri dari satu variabel eksogen dan satu variabel
endogen, maka besarnya koefisien jalur sama dengan korelasi antara
kedua variabel tersebut.
 MPDR5202/MODUL 9 9.11

Cara perhitungan koefisien jalur di atas adalah dengan memanfaatkan


koefisien korelasi. Cara lain dapat digunakan untuk menghitung koefisien
jalur, yakni melalui regresi. Menurut Li (1975), Land (1969) dan Schumacker
& Lomax (1996) dalam Kusnendi (2005), koefisien jalur dapat dihitung
dengan menggunakan aturan:
si
p yxi   bi 
sk
p yxi : koefisien jalur dari variabel eksogen Xi ke variabel endogen Y dalam
substruktur yang dianalisis.
si : simpangan baku variabel eksogen ke-i
sy : simpangan baku variabel endogen
bi : koefisien regresi variabel independen (eksogen) Xi yang terdapat
dalam persamaan regresi

Koefisien jalur yang diperoleh dengan regresi di atas sering disebut


dengan standardized path coefficient. Mengapa disebut demikian, karena
pada dasarnya koefisien jalur adalah koefisien regresi yang distandarkan,
yaitu koefisien regresi yang dihitung dari data yang telah ditransformasi ke
dalam angka baku atau Z-skor (yang sudah dibahas dalam modul 3).Untuk
lebih jelasnya Anda dapat membaca referensi dari Johnson & Wichern
(1992). Melalui angka baku tersebut kita akan memperoleh persamaan regresi
dalam substruktur sebagai berikut:
Zu  pu1Z1  pu 2 Z2   puk Zk  i
Dengan :
Zu : variabel endogen yang distandarkan
Zi : variabel eksogen yang distandarkan i = 1, 2, …, k
pui : koefisien jalur

Selain harus mencari koefisien-koefisien jalur, kita juga harus mencari


koefisien dari variabel yang tidak ada pada model, yakni koefisien residual,
yakni koefisien bagi e atau ditulis pue . Koefisien ini dapat dihitung dengan
terlebih dahulu menghitung koefisien determinasi model regresinya.
Koefisien determinasi dapat dihitung dengan rumus.
9.12 Statistika Pendidikan 

 ru1 
r  k
Rx2u ( x1   pu1 pu 2 puk   u 2     pui  rui  , dengan pui  pxu xi dan
k )
  i 1
 
 ruk 
rui  rxu xi

Dan pue  1  Rx2u ( x1...k )

E. PENGUJIAN KOEFISIEN JALUR

Menguji kebermaknaan (test of significance) setiap koefisien jalur yang


telah dihitung, baik secara sendiri-sendiri maupun secara bersama-sama, serta
menguji perbedaan besarnya pengaruh masing-masing variabel eksogenus
terhadap variabel endogenus. Pengujian koefisein jalur diawali dengan
pengujian secara keseluruhan, kemudian dilanjutkan dengan pengujian secara
individual untuk setiap koefisien jalur yang diperoleh. Langkah-langkahnya
dapat dilakukan sebagai berikut:

1. Pengujian secara Keseluruhan


Hipotesis yang diuji dalam pengujian overall ini adalah sebagai berikut.
H0 : u1  u 2   uk  0 :( X1 , X 2 ,, X k secara bersama tidak
berpengaruh terhadap Xu).
H1 : Minimal ada u1  0:( Minimal ada satu X1 , X 2 , , X k yang
berpengaruh terhadap Xu).
Pengujian hipotesis di atas menggunakan uji F, yakni
k
 n  k  1  px x rx x
u i u i  n  k  1 Rx2 ( x
F i 1
 u 1... k )
,
 k

k 1   pxu xi rxu xi 
k 1 R  2
xu ( x1... k ) 
 i 1 
dengan i  1, 2,3, , k
Dengan keputusan, tolak H0, jika Fhitung  Fa ( k , n – k – 1) .
Apabila H0 ditolak, maka kita lanjutkan dengan pengujian secara
individual. Dan jika H0 diterima, maka koefisien-koefisien pada substruktur
tersebut tidak berarti atau dengan kata lain secara bersama X 1, X2, …, Xk
tidak berpengaruh terhadap Xu.
 MPDR5202/MODUL 9 9.13

2. Pengujian secara Individual


Seperti dijelaskan di atas, uji secara individual dilakukan ketika H0 pada
uji overall ditolak. Pada uji ini kita mencari koefisien-koefisien jalur yang
berarti, artinya kita mencari variabel-variabel eksogen yang memberikan
pengaruh berarti terhadap variabel endogen. Dalam teori regresi, proses ini
dinamakan mencari regresi terbaik.
Menurut Kusnendi (2005), karena dalam analisis jalur hubungan antara
variabel eksogen dan endogen sifatnya kausalitas, maka pengujian koefisien
jalur selalu bersifat satu arah atau direksional. Dengan demikian, hipotesis
yang diuji dapat dirumuskan sebagai berikut.
H0 : pui = 0 : Xi tidak berpengaruh terhadap Xu
H1 : pui> 0 : Xi berpengaruh positif terhadap Xu
atau
H0 : pui = 0 : Xi tidak berpengaruh terhadap Xu
H1 : pui< 0 : Xi berpengaruh negatif terhadap Xu

Pemilihan rumusan hipotesis sangat bergantung pada hipotesis yang


diajukan oleh peneliti.
Statistik uji yang digunakan untuk pengujian hipotesis di atas adalah
p
ti  ui ; dk  n  k  1
sepi
Atau dapat juga kita gunakan koefisien determinasi, yakni
pYXi
ti  , i  1, 2, , k
1  RUX2 1 Xk  Cii
 n  k  1
Kriteria pengujiannya adalah tolak H0 jika thitung > t(n – k - 1)
Ketika koefisien jalur yang diuji ada yang tidak signifikan, maka kita
perlu memperbaiki model substruktur yang telah diajukan. Proses ini dikenal
dengan istilah Triming. Triming adalah metode yang digunakan untuk
memperbaiki dengan cara mengeluarkan variabel eksogen dari model regresi
yang koefisien jalurnya tidak signifikan.
Apabila terjadi trimming, maka kita perlu menghitung kembali koefisien-
koefisien jalur dari model yang sudah diperbaiki, atau dengan tidak
menyertakan variabel eksogen yang telah dibuang. Proses ini berlanjut,
sampai dengan seluruh koefisien-koefisien jalur yang ada dalam model
struktural merupakan koefisien-koefisien jalur yang signifikan. Jadi sifat dari
9.14 Statistika Pendidikan 

trimming ini iterative. Jika variabel-variabel eksogen dalam model


strukturalnya banyak, maka secara manual hal tersebut cukup merepotkan.
Untuk mengatasinya kita dapat menggunakan program pengolah data,
misalnya SPSS, dan menggunakan metode backward elimination atau dengan
menggunakan lisrel.

F. PENGARUH VARIABEL EKSOGEN TERHADAP VARIABEL


ENDOGEN

Apabila proses pengujian keseluruhan koefisien jalur telah selesai, dan


kita memperoleh koefisien-koefisien jalur yang signifikan, maka langkah
berikutnya adalah menghitung besar pengaruh variabel eksogen terhadap
endogen. Dalam analisis jalur dikenal tiga macam pengaruh atau effect, yakni
pengaruh langsung atau Direct Effect (DE), pengaruh tidak langsung atau
Indirect Effect (IE), dan pengaruh total atau Total Effect (TE).
Pengaruh langsung (DE) adalah pengaruh satu variabel eksogen terhadap
variabel endogen tanpa melalui variabel endogen lain, pengaruh tidak
langsung (IE) adalah pengaruh satu variabel eksogen terhadap variabel
endogen yang melalui variabel endogen lain yang terdapat dalam satu model
kausalitas yang sedang dianalisis. Perlu ditegaskan bahwa dekomposisi
pengaruh variabel menjadi pengaruh langsung atau tidak langsung adalah
antar variabel dalam kerangka hubungan kausalitas. Dengan demikian, dalam
analisis jalur hubungan yang sifatnya non-kausalitas; seperti korelasional,
yang terjadi antar variabel eksogen, tidak dimasukkan dalam perhitungan
dekomposisi antar variabel.
Adapun pengaruh total (TE) adalah jumlah pengaruh dari satu variabel
(eksogen) terhadap variabel lain (endogen) baik secara langsung maupun
tidak langsung (TE = DE + IE). Untuk memudahkan dalam memahami besar
pengaruh-pengaruh tersebut diberikan contoh diagram yang diambil dari
Kusnendi (2005) berikut.
 MPDR5202/MODUL 9 9.15

Gambar 9.7
Contoh Diagram Dekomposisi Kausalitas dalam Analisis Jalur

Misalkan a, b, , j menunjukkan koefisien jalur yang signifikan.


Dekomposisi pengaruh kausalitas antar variabelnya dapat dilihat pada tabel
berikut.
Tabel 9.1
Contoh Perhitungan DE, IE, dan TE

Pengaruh
Pengaruh IE Total
Variabel DE Melalui
Melalui (x3) Melalui (x4) DE + IE
(x3 dan X4)
X1 thd X3 (a) - - - (a)
X1 thd X4 (c) (a)(f) - - (c)+ (a)(f)
(h)+(a)(g)+(c)(j)+
X1 thd Y (h) (a)(g) (c)(j) (a)(e)(j) (a)(e)(j)
X2 thd X3 (b) - - - (b)
X2 thd X4 (d) (b)(e) - - (d)+(b)(e)
(i)+(b)(g)+(d)(j)+
X2 thd Y (i) (b)(g) (d)(j) (b)(e)(j) (b)(e)(j)
X3 thd X4 (e) - - - (e)
X3 thd Y (g) - (e)(j) - (g)+(e)(j)
X4 thd Y (j) - - - (j)

Namun demikian, terdapat beberapa pendapat yang memasukkan


hubungan korelatif antar variabel eksogen menjadi bagian dalam perhitungan
dekomposisi kausalitas. Menurut Kusnendi (2005) alasannya adalah sebagai
berikut.
9.16 Statistika Pendidikan 

Berdasarkan pemahaman DE dan IE dapat diestimasi koefisien korelasi


antar satu variabel eksogen dengan satu variabel endogen yang terdapat
dalam suatu model struktural. Karena yang akan diestimasi adalah koefisien
korelasi, maka menurut Duncan (Duncan’s Rule), konsep IE diperluas tidak
hanya dipahami dalam kerangka hubungan kausalitas, yaitu sebagai pengaruh
satu variabel eksogen terhadap endogen yang terjadi melalui variabel
endogen lain (variabel intervening), tetapi juga dipahami sebagai pengaruh
non-kausalitas. Artinya pengaruh tidak langsung tersebut dipandang dapat
terjadi melalui hubungan korelatif dengan variabel eksogen lain yang
terdapat dalam model struktural yang sedang dianalisis. Sebagai contoh
dalam Gambar 9.7 di atas, dari X1 memiliki pengaruh tidak langsung ke X4
dan ke Y. pengaruh tidak langsung tersebut terjadi tidak saja melalui variabel
endogen X3 (kausalitas), melainkan juga terjadi melalui hubungan korelatif
(non-kausalitas) dengan variabel eksogen X2.
Dengan perluasan IE tersebut, maka kita dapat mengestimasi koefisien
korelasi antara X1 dengan X3, X4 dengan Y, juga antara X2 dengan X3, dan
lainnya. Untuk mengestimasinya koefisien korelasi tersebut digunakan
rumus.
rux  DE   IE
Sebagai contoh, dari gambar di atas, maka kita dapat menghitung
1. r13  (a)  (c)(r12 
2. r14  (d )  (a)( f )   c  f  r12    e  r12 
3. r1 y  (i )  (a)( j )   d  g    a  f  g    h  r12    d  g  r12    c  f  r12 

Dan silakan Anda coba estimasi nilai dari r23 , r24 , r2 y dan r34 dari
diagram struktural di atas. Perlu diketahui bahwa korelasi yang diperoleh
melalui perhitungan di atas disebut dengan expected correlation atau
reproduced correlation.

G. UJI KESESUAIAN MODEL

Langkah ini digunakan untuk melihat kesesuaian antara model yang


diusulkan dari hasil perhitungan dengan data. Suatu model yang diusulkan
dikatakansesuai (fit) apabila matriks korelasi sampel tidak jauh berbeda
dengan matriks korelasi yang diestimasi. Pedhazur (1982) mengistilahkannya
 MPDR5202/MODUL 9 9.17

dengan testing overidentified models, sedangkan Kusnendi (2005) memberi


istilah dengan Pengujian kesesuaian model: Koefisien Q. Koefisien Q
ditambahkan, karena dalam proses pengujiannya digunakan statistik Q.
Sebagaimana dijelaskan bahwa uji ini dilakukan untuk melihat
kesesuaian matriks korelasi antara model yang diusulkan dengan data,
dengan demikian hipotesis yang diujinya adalah sebagai berikut.
H0 : R = R() (matriks korelasi sampel tidak berbeda dengan matriks
estimasi)
H1 : R  R() (matriks korelasi sampel berbeda dengan matriks estimasi)

Untuk mengujinya digunakan statistik uji-Q, dengan


1  Rm2
Q
1 M
Dengan
1. Rm2  1  1  R12 1  R22  1  R p2  ,
2. M  Rm2 setelah dilakukan trimming.

Catatan: perlu kehati-hatian membedakan antara M dengan Rm2 . M akan


sama dengan Rm2 ketika dalam pengujian substruktur tidak ada trimming.
Keputusan dari hasil perhitungan terhadap Q adalah:
1. Jika Q = 1, maka terindikasi model seusai (fit) dengan sempurna.
2. Jika Q < 1, untuk menentukan kesesuaiannya dilakukan pengujian
dengan statistik W, dengan
W    n  d  ln Q
Dengan n menunjukkan ukuran sampel dan d menunjukkan banyaknya
koefisien jalur yang sama dengan nol atau yang tidak berarti.
Kriteria pengujiannya adalah terima hipotesis nol (model dikatakan
sesuai), jika W  (2 , dk ) dengan dk = d.

Contoh 9.1 (masalah Studi Jencks dengan n = 628 yang diambil dari Buku
Kusnendi, 2005)
Misalkan hubungan antara variabel-variabel diketahui sebagai berikut:
X1 (pendidikan orang tua), X 2 (pendapatan orang tua), X0 (kecerdasan anak
sebelum sekolah), D (pendidikan anak), Q (kecerdasan anak setelah dewasa).
9.18 Statistika Pendidikan 

Dengan permasalahan yang diajukan adalah sebagai berikut:


1. Apakah tingkat kecerdasan anak sebelum sekolah (X0) dipengaruhi
tingkat pendidikan (X1)dan pendapatan orang tuanya (X2)?
2. Apakah tingkat pendidikan anak (D) dipengaruhi tingkat kecerdasan
sebelum sekolah (X0), tingkat pendidikan (X1)dan pendapatan orang
tuanya (X2)?
3. Apakah tingkat kecerdasan anak setelah dewasa (Q) dipengaruhi tingkat
pendidikan anak (D) dan tingkat kecerdasan sebelum sekolah (X0)?
Dengan koralasi antar variabelnya adalah sebagai berikut.
1, 000  X1
 0,509 1, 000 X
  2
R   0,300 0,300 1, 000  X0
 
 0,382 0, 420 0,550 1, 000  D
 0,305 0,314 0,830 0, 630 1, 000  Q

Jawab.
1. Langkah pertama adalah menyusun diagram atau model struktural untuk
menjawab pertanyaan di atas. Sesuai dengan pertanyaan di atas, kita
susun diagram struktur sebagai berikut

X1 H1 X0

H2 H6

H5 Q

H3
H7

X2 H4 D

2. Langkah kedua adalah mengindentifikasi model atau sub struktur yang


akan diestimasi koefisien jalurnya dan rumuskan persamaan
strukturalnya sehingga jelas variabel apa yang diberlakukan sebagai
variabel penyebab dan variabel apa yang diberlakukan sebagai variabel
 MPDR5202/MODUL 9 9.19

akibat. Full path diagram Studi Jencks dapat diidentifikasi 3 model atau
3 sub struktur yang akan diestimasi koefisien jalurnya.

Dari model di atas, diketahui memuat tiga buah substruktur, yakni:

Substruktur 1
Model X0:
X1 01 X0 X0 = 01X1 + 02X2 + e1
 Variabel eksogen X1 dan X2
r12
02 dan endogennya X0
e1
X2

Substruktur 2

 Model D:
X1 X0
D = D1X1 + D2X2 + D0X0 + e2
 Variabel eksogen :
r12 D0 X1, X2 dan X0, dan
D1 variabel endogen D

X2 D2 D e2

Substruktur 3
X0
 Model Q:
Q0 Q = Q0X0 + QDD + e3
 Variabel penyebab:
Q e3
X0 dan D, dan
QD variabel endogen Q
D

3. Langkah ketiga adalah identifikasi matriks korelasi antarvariabel


penyebab yang sesuai dengan sub struktur atau model yang akan diuji.
Dari matriks korelasi
9.20 Statistika Pendidikan 

1, 000  X1
 0,509 1, 000 X
  2
R   0,300 0,300 1, 000  X0
 
 0,382 0, 420 0,550 1, 000  D
 0,305 0,314 0,830 0, 630 1, 000  Q

Maka kita dapatkan matriks korelasi untuk masing-masing


substrukturnya, yakni:
Substruktur 1:
1, 000 0,509  X 1
R1   
 0,509 1, 000  X 2

Sub struktur 2
1, 000 0,509 0,300  X 1
R2   0,509 1, 000 0,300  X 2
 0,300 0,300 1, 000  X 0

Substruktur 3
1, 000 0,550  X 0
R3   
 0,550 1, 000  D

4. Langkah berikutnya menghitung matriks invers korelasi antarvariabel


penyebab untuk masing-masing substruktur atau model yang akan diuji.
Untuk Substruktur 1
Matriksnya adalah
1, 000 0,509  X 1
R1   
 0,509 1, 000  X 2

Invers dari matriks korelasi


C C12   1,3497 0, 6870 
R11   11  
C21 C22   0, 6870 1,3497 
Untuk perhitungan invers matriks Anda dapat menggunakan bantuan
excel yang akan dijelaskan pada akhir kegiatan belajar 1.
Kemudian kita hitung koefisien jalur pada substruktur 1, yakni
 MPDR5202/MODUL 9 9.21

C C12   r01 
  11  
C21 C22   r02 
 01   1,3497 0, 6870  0,300
ij  ( Ri1 )(rY X )  

i
 02   0, 6870
j
1,3497  0,300 
(1,3497)(0,300)  (0,6870)(0,300)  0,1988
  
(0,6870)(0,300)  (1,3497)(0,300)  0,1988

Dengan demikian diperoleh p01  0,300 dan p02  0,300 . Dari hasil di
atas, kita dapat menghitung koefisien determinasinya sebagai berikut.
Ri2   ( ij )(rYiXj )  R12  01  r01   02  r02 
R12  0,1988  0,300   0,1988  0,300   0,1193

Dan akhirnya kita dapat menghitung koefisien dari p0e1 sebagai berikut
e  1  Ri2  e1  1  0,1193  0,9385
i

Sebelum maju ke substruktur 2, kita uji dahulu kebermaknaan koefisien


jalur pada substrukur 1. Langkah pertama kita uji kebermaknaan
koefisien determinasi ditentukan statistik uji F.
Hipotesis statistik:
H0 : 01 = 02 = 0 : X1 dan X2 tidak mempengaruhi X0.
H1 : Sekurang-kurangnya satu di antara X1 dan X2 mempengaruhi X0.

(n  k  1) R0.12
2
(628  2  1)0,1193
F   42,331
k (1  R0.12 )
2
2(1  0,1193)

Dari tabel distribusi Fisher (F) dengan dk   k , n – k –1   2,625 dan


memilih  = 0,05 , maka diperoleh F0,05 (2, 625)= 3,01 yang jauh lebih kecil
dari 42,331, sehingga hipotesis nol ditolak. Artinya, di antara variabel X1
dan X2 ada yang mempengaruhi X0. Variabel apa yang mempengaruhi
X0? Ditentukan hasil uji kebermaknaan masing-masing koefisien jalur
p01 dan p02.
Kebermaknaan koefisien jalur ditentukan statistik uji t atau Cr.
Hipotesis statistik:
9.22 Statistika Pendidikan 

H0 : 01 dan 02 =0: Secara individual X1 dan X2 tidak berpengaruh


terhadap X0
H1 : 01 dan 02> 0: Secara individual X1 dan X2 berpengaruh positif
terhadap X0.

Pengujian:
01 0,1988
t1  Cr1    4,5586
(1  R )C11
1
2
(1  0,1193)1,3497
n  k 1 628  2  1

Dan
02 0,1988
t2  cr2    4,5586
(1  R )C22
1
2
(1  0,1193)1,3497
n  k 1 628  2  1

Dengan  = 0,05 dan dk = 625, diperoleh t0,05(625) = 1,647 yang jauh lebih
kecil dari t1 dan t2 di atas. Dengan demikian, kedua koefisien jalur
tersebut sangat berarti. Untuk itu, tidak perlu dilakukan trimming.
Artinya semua jalur-jalur tersebut tetap ada.
Hasil di atas diperoleh diagram jalurnya adalah sebagai berikut

X1  X0

0,509 

e1
X2

Untuk itu kita dapat melanjutkan pada perhitungan koefisien jalur untuk
substruktur pertama.

Koefisien jalur yang akan dihitung adalah D1, D2 dan D0
 MPDR5202/MODUL 9 9.23

  D1   C11 C12 C13   rD1 


ij  ( R )(rYi X j )    D 2   C21 C22
i
1
C23   rD 2 
  D 0  C31 C32 C33   rD 0 
  D1   1,3946 0, 6421 0, 2257  0,382   0,1389 
     0, 6421 1,3946 0, 2257  0, 420    0, 2163
 D2      
  D 0   0, 2257 0, 2257 1,1354  0,550  0, 4434 

Koefisien determinasi ( R22 ) :


Ri2   ( ij )(rYiXj )  R22   D1  rD1    D 2  rD 2    D 0  rD 0 
R22  0,1389  0,382   0, 2163  0, 420   0, 4434  0,550   0,3878

Koefisien jalur residual (e2):


e  1  Ri2
i

e 2  1  0,3878  0,7824

Dengan cara yang sama kita lakukan pengujian baik secara Uji overall
maupun secara individual
Hipotesis yang diuji untuk overall adalah
H0 : D1 = D2 = D0 = 0 : X1, X2 dan X0 tidak mempengaruhi D.
H1 : Sekurang-kurangnya satu di antara X1, X2 dan X0 mempengaruhi D.
(n  k  1) RD2 .120 (628  3  1)0,3878
F   131, 758
k (1  RD2 .120 ) 3(1  0,3878)

Dengan dk = (3, 624) dan memilih  = 0,05 maka F0,05 (3, 624) = 2,619 yang
jauh lebih kecil daripada F hitung. Artinya, di antara variabel X1, X2 dan X0
ada yang mempengaruhi D. Variabel apa yang mempengaruhi D? Dijelaskan
hasil uji individual kebermaknaan masing-masing koefisien jalur D1 ,D2,
dan D0.
Hipotesis yang diuji secara individual adalah:
H0 : Di = 0: Secara individual X1 (X2 dan X0) tidak berpengaruh terhadap D.
H1 : Di> 0: Secara individual X1 (X2 dan X0) berpengaruh positif terhadap D.
9.24 Statistika Pendidikan 

 D1 0,1389
t3  cr3    3,7551
(1  R )C11
2
2
(1  0,3878)1,3946
n  k 1 628  3  1
D2 0, 2163
t4  cr4    5,8475
(1  R )C22
2
2
(1  0,3878)1,3946
n  k 1 628  3  1
D0 0, 4434
t5  cr5    13,2834
(1  R )C33
2
2
(1  0,3878)1,1354
n  k 1 628  3  1

Dengan cara yang sama kita lihat pada tabel bahwa t0,05(624) = 1,647 yang
lebih kecil dari semua nilai t (t3, t4, dan t5) di atas. Dengan demikian semua
H0ditolak. Artinya, dengan tingkat kepercayaan 5% model D yang diusulkan
seutuhnya dapat diterima, dengan modelnya sebagai berikut.

X1 X0


e2



X2  D

Terakhir pengujian model substruktur 3


Koefisien jalur Q0 dan QD:
 Q 0   C11 C12   rQ 0   1, 4337 0, 7885 0,830 
 
ij   R i 1  rYi X j       
 QD  C21 C22   rQD   0, 7885 1, 4337  0, 630 

Hasilnya adalah
Q 0  1, 4337  0,830    0, 7885  0, 630   0, 6932
QD   0, 7885  0,830   1, 4337  0, 630   0, 2488
 MPDR5202/MODUL 9 9.25

Koefisien determinasi untuk substruktur 3 adalah


Ri2   ( ij )(rYiXj )
R32  Q 0  rQ 0   QD  rQD   0,6932(0,830)  0, 2488(0,630)  0,7321

dan koefisien jalur residualnya adalah


e  1  Ri2  e3  1  0,7321  0,5176
i

Pengujian keseluruhan (overall) hipotesis yang diuji:


H0 : Q0 = QD = 0 : X0 dan D tidak mempengaruhi Q.
H1 : Sekurang-kurangnya satu di antara X0 dan D mempengaruhi D.

Kemudian kita hitung nilai statistik ujinya


(n  k  1) R32 (628  2  1)0, 7321
F   853,98
k (1  R32 ) 2(1  0, 7321)

Dengan dk = (2, 625) dan memilih taraf nyata 0,05 diperoleh F 0,05(2,625) = 3,01
yang jauh lebih kecil dari F hitung. Dengan demikian kita tolak Ho yang
artinya ada minimal satu di antara X0 dan D mempengaruhi D.
Langkah berikutnya adalah pengujian secara parsial (individual) bagi
kedua variabel eksogen.
Hipotesis yang diuji :
H0 :Q0 (QD) = 0: Secara individual X0 dan D tidak berpengaruh terhadap Q.
H1 : Q0 (QD)> 0: Secara individual X0 dan D berpengaruh positif terhadap Q.
Q 0 0, 6932
t6  cr6    27,9629
(1  R3 )C11
2
(1  0, 7321)1, 4337
n  k 1 628  3  1
QD 0, 2488
t7  cr7    10, 0363
(1  R )C22
2
3
(1  0, 7321)1, 4337
n  k 1 628  3  1

Dari tabel t-student diperoleh t0,05(623) = 1,647 (pendekatan) yang jauh


lebih kecil dibandingkan dengan nilai t6 dan t7. Dengan demikian kedua
hipotesis nol yang diuji ditolak dan kita simpulkan bahwa kedua koefisien
9.26 Statistika Pendidikan 

jalur tersebut signifikan atau secara individual X0 dan D berpengaruh positif


terhadap Q.
Hasil ini sama dengan uji substruktur sebelumnya, yakni tidak ada
perbaikan (trimming) pada jalur-jalurnya. Diagram lengkap substrukturnya
adalah sebagai berikut

e3
X0





Dari keseluruhan pengujian di atas, maka kita peroleh ringkasan hasil


perhitungannya sebagai berikut.

X1 0,1988 X0 0,7824 e2 e3

0,5176
0,1988 0,6932

0,509 Q
0,4434
0,1389
0,2488

X2 0,2163 D 0,9385 e1

Sebelum dilakukan penafsiran hasil, kita uji dulu apakah model fit atau
tidak.
 MPDR5202/MODUL 9 9.27

Model pada diagram di atas merupakan model yang telah diuji baik
secara overall maupun secara individual, dengan koefisien determinasi pada
masing-masing substrukturnya adalah 0,1193; 0,3878; dan 0,7321. Dengan
nilai-nilai ini, maka kita dapat menghitung.

Rm2  M  1  1  R12 1  R 22  1  R 


2
p

R 2m  M  1  1  R 20.12 1  R 2D.1201  R   1  1  0,11941  0,38781  0,7321


2
Q.0 D

 0,8556
1  0,8556
Q 1
1  0,8556

Perlu diketahui bahwa secara matematis, jika dalam proses pengujian


substruktur tidak terjadi trimming, maka nilai Q pastilah sama dengan 1,
karena M  Rm2 .
Kemudian untuk memudahkan dalam penafsiran, kita susun dalam
bentuk tabel berikut.

Model Koefisien Jalur t (cr) P-value R2


Model X0
X0 X1 0,1988 4,5586 ***
0,1193
X0 X2 0,1988 4,5586 ***
Model D
D  X1 0,1389 3,7551 ***
D  X2 0,2163 5,8475 *** 0,3878
D  X0 0,4434 13,2834 ***
Model Q
Q  X0 0,6932 27,9629 ***
0,7321
QD 0,2488 10,0363 ***
9.28 Statistika Pendidikan 

Dan tabel pengaruh langsung tidak langsungnya sebagai berikut


Pengaruh Pengaruh
Antara Tidak Langsung Melalui
Langsung Total
variabel D X0 D dan X0
XOX1 0,1988 - - - 0,1988
XOX2 0,1988 - - - 0,1988
DX1 0,1389 - 0,0881 - 0,2270
DX2 0,2163 - 0,0881 - 0,3044
DX0 0,4434 - - - 0,4434
QX1 - 0,0346 0,1378 0,0219 0,1943
QX2 - 0,0538 0,1378 0,0219 0,2135
QX0 0,6932 0,1103 - - 0,8035
QD 0,2488 - - - 0,2488

Dari tabel di atas, maka diperoleh informasi bahwa:


1. Tinggi rendahnya X0 dipengaruhi positif X1 dan X2. Besarnya pengaruh
X1 dan X2 terhadap X0 masing-masing sebesar 0,1988 atau sebesar
(0,1988)2 = 3,95%. Secara bersama sebesar 11,93% variasi yang terjadi
pada X0 dapat dijelaskan oleh X1 dan X2.Sisanya sebesar (1  11,93%) =
88,07% merupakan pengaruh variabel lain yang tidak terjelaskan model.
2. Tinggi rendahnya D dipengaruhi positif X1, X2,dan X0. Besarnya
pengaruh X1, X2,dan X0 terhadap D masing-masing sebesar 0,1389
(1,93%); 0,2163 (4,68%); dan 0,4434 (19,66%). Secara bersama sebesar
38,78% tinggi rendahnya D dipengaruhi X 1, X2,dan X0. Sisanya sebesar
61,22% merupakan pengaruh variabel lain yang tidak terjelaskan model.
3. X1 dan X2 selain berpengaruh langsung juga berpengaruh tidak langsung
terhadap D. Pengaruh tidak langsung tersebut disalurkan melalui X0.
Besarnya pengaruh tidak langsung X1 dan X2 terhadap D masing-masing
sebesar 0,2270 dan 0,3044.
4. Tinggi rendahnya Q dipengaruhi positif oleh X0 dan D. Besarnya
pengaruh X0 dan D terhadap Q masing-masing sebesar 0,6932 (48,05%)
dan 0,2488 (6,19%). Secara bersama sebesar 73,21% tinggi rendahnya Q
dipengaruhi X0 dan D. Sisanya sebesar 26,79% merupakan pengaruh
variabel lain di luar X0 dan D yang tidak terjelaskan model.
5. X0 di samping berpengaruh langsung juga berpengaruh tidak langsung
terhadap Q, yaitu dimediasi atau disalurkan melalui D. Besarnya
pengaruh tidak langsung tersebut adalah (0,4434)(0,2488) = 0,1103 atau
sebesar (0,44342)(0,24882) = (0,1966)(0,0619) = 0,0122 = 1,22%.
 MPDR5202/MODUL 9 9.29

Dengan demikian besarnya pengaruh total X0terhadap Q adalah 0,6932 +


0,1103 = 0,8035 atau 48,05% + 1,22% = 49,27%.
6. Seperti dijelaskan Tabel C, Q dipengaruhi secara tidak langsung oleh X 1
dan X2. Pengaruh tidak langsung tersebut di mediasi atau disalurkan
melalui X0, melalui D, dan atau melalui X0 dan D. Besarnya pengaruh
tidak langsung X1 dan X2 terhadap Q adalah:
a. Melalui X0 masing-masing sebesar:
(0,1988)(0,6932) = 0,1378 atau (0,1988 2)(0,69322) = 1,90%.
b. Melalui D masing-masing sebesar:
X1 = (0,1389)(0,2488) = 0,0346 atau (0,1389 2)(0,24882) = 0,12%.
X2 = (0,2163)(0,2488) = 0,0538 atau (0,2163 2)(0,24882) = 0,29%.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!
1) Jelaskan perbedaan antara variabel eksogen dan endogen!
2) Apa yang dimaksud dengan model rekursif, berikan contohnya!
3) Apa perbedaan antara koefisien jalur dengan koefisien regresi?
4) Apa yang dimaksud dengan trimming?
5) Berikut merupakan model struktural dari authoritarianism yang diukur
dengan F scale, mental ability, dan years of education

Mental
Ability
(1)

Years of F Scale
Education (3)
(2)

Misalkan korelasi antar variabel di atas adalah sebagai berikut: r12 = 0,6;
r13 = -0,5 dan r23 = -0,6.
a. Hitunglah koefisien dari diagram jalur di atas!
9.30 Statistika Pendidikan 

b. Berapakah pengaruh langsung dai mental ability terhadap years of


education?
c. Berapakah pengaruh langsung dari mental ablity terhadap
authoritarianism?
d. Berapakah pengaruh langsung dari years of education terhadap
authoritarianisme?
e. Berapakah pengaruh tidak langsung dari mental ability terhadap
authoritarianisme?
f. Tuliskan dekomposisi dari r13 dan r23 !
g. Hitung koefisien residual untuk masing-masing variabel endogen!

Petunjuk Jawaban Latihan

1) Variabel eksogen dalam regresi disebut variabel bebas adalah variabel


yang mempengaruhi variabel lain. Sedangkan variabel endogen adalah
variabel yang dipengaruhi. Dalam analisis jalur, suatu variabel mungkin
memiliki dua peran, sebagai variabel endogen, juga eksogen. Perhatikan
contoh berikut.

X1

X3

X2

Variabel X2 memiliki peran ganda, yakni menjadi variabel endogen bagi


substruktur 1, dan menjadi variabel eksogen bagi substruktur kedua
dengan variabel endogenya X3.
2) Model struktural adalah model teoritis yang mencerminkan hubungan
antar variabel. Model ini dibangun atas kerangka berpikir penelitian
sehingga peneliti memperoleh hipotesis berkaitan hubungan antar
variabelnya. Substruktur adalah bagian-bagian dari model struktural
yang memiliki satu persamaan matematis.
 MPDR5202/MODUL 9 9.31

3) Perbedaan di antara keduanya antara lain adalah:

NO REGRESI PATH ANALYSIS


1 Memprediksi sebuah variabel Menganalisis pola hubungan kausal antar
dependen Y atas dasar nilai variabel dengan tujuan untuk mengetahui
tertentu satu atau beberapa pengaruh langsung, tidak langsung,
variabel independen maupun serempak beberapa variabel
penyebab terhadap sebuah variabel akibat
2 Variabel dependen (Prediktan) Variabel penyebab (eksogen) dan
dan variabel independen variabel akibat (endogen)
(Prediktor)
3 Apakah tinggi rendahnya variabel Apakah variabel eksogen berpengaruh
dependen dapat diprediksi oleh terhadap variabel endogen
variabel-variabel independen
4 Berapa besar variasi perubahan Berapa besar pengaruh langsung, tidak
variabel dependen Y, secara langsung, maupun serempak variabel
serempak maupun parsial eksogen terhadap endogen
dijelaskan oleh variabel
independen
5 Skala pengukuran interval-rasio, Minimal interval atau mendekati interval,
skor data mentah data dinyatakan dalam angka baku (z-
score)
6 Persamaan (model) matematika Persamaan (model) matematikanya bisa
bersifat tunggal tunggal, tapi kebanyakan bersifat multiple

4) Trimming dalam analisis jalur adalah perhitungan ulang koefisien jalur,


apabila ada satu atau beberapa jalur yang dibuang dalam suatu
substruktur.
5) Dari diagram strukturalnya, terdapat dua buah substruktur.
Substruktur 1.

X1

P21

E1 P2e1 X2

Koefesien jalur p21 = r12 = + 0,25. Sedangkan


p2e1  1  R21
2
 1  0,25 2  0,968 .
9.32 Statistika Pendidikan 

Substruktur 2.

E2

P3e2
X1
P31

X3

P32
X2

1,06667  0,26667 
Karena R  1,00 0,25 , maka C  R 1  
0,25 1,00   0,26667 1,06667 
   

 p   1,06667  0,26667 0,40 0,32


p3 j   31     
 p32   0,26667 1,06667  0,40 0,32
Dari hasil di atas dapat dihitung R22  0,40,32  0,40,32  0,256 .
Dan juga p3e 2  1  0,256 2  0,967 .
Pengaruh langsung X1 X2 adalah 0,25 atau sebesar 6,25%.
Pengaruh langsung X1 X3 adalah 0,32 atau sebesar 10,24% dan
pengaruh tidak langsungnya 0,08.
Pengaruh langsung X2 X3 adalah 0,32 atau sebesar 10,24%.
Pengaruh bersama X1 dan X3 terhadap X3 adalah 0,256 atau 25,6%.

R A NG KU M AN

Tujuan dari analisis jalur adalah melakukan analisis hubungan antar


variabel sehingga diperoleh informasi tentang hubungan kausal baik
secara langsung, tidak langsung, maupun bersama dari seperangkat
variabel eksogen terhadap variabel endogen.
Variabel eksogen adalah variabel penyebab dan variabel endogen
adalah variabel akibat dalam suatu model sutruktural. Dalam suatu
model struktural, suatu variabel bisa menjadi variabel eksogen dan juga
endogen.
 MPDR5202/MODUL 9 9.33

Model struktural adalah model yang menggambarkan hubungan


antara variabel yang dibangun dari kerangka teori. Suatu model
struktural mungkin terdiri dari beberapa substruktur.
Koefisien jalur menyatakan pengaruh langsung variabel eksogen
terhadap variabel endogen.
Pengujian dalam analisis jalur dilakukan dua tahap, tahap pertama
pengujian overall, dan tahap kedua dilakukan pengujian secara
individual. Pengujian individual dilakukan apabila hipotesis nol pada
pengujian overall ditolak.
Pengaruh dari suatu variabel eksogen terhadap variabel endogen
dihitung dari pengaruh langsung dan pengaruh tidak langsung (jika ada).
Sebelum ditafsirkan, dari model struktural yang dibangun oleh jalur-
jalur yang berarti kita terlebih dahulu perlu melakukan pengujian
kecocokan/ kesesuaian. Pengujian dilakukan dengan statistik Q.

TES F OR M AT IF 1

Pilihlah satu jawaban yang paling tepat!

1) Misalkan korelasi antar empat variabel (IQ, SES, n Ach, dan GPA)
dengan SES: Sosioeconomic status, IQ : Intelgence, n Ach : need
achievement, dan GPA : Grade-point Average dihipotesiskan bahwa :
Hipotesis yang diajukan adalah sebagai berikut!
a. Sosio ekonomi berpengaruh terhadap need achievement dan juga
GPA.
b. IQ berpengaruh terhadap terhadap need achievement dan GPA.
c. Need achievement berpengaruh terhadap GPA.
d. Sosio ekonomi berkorelasi dengan IQ.
Dari hasil pengumpulan data melalui sampel berukuran 100
diperoleh matriks korelasi sebagai berikut.
1 2 3 Y
SES IQ n Ach GPA
1 1,00 0,30 0,41 0,33
2 1,00 0,16 0,57
3 1,00 0,50
Y 1,00
e. Hipotesis di atas, susunlah model strukturalnya!
9.34 Statistika Pendidikan 

f.
Dengan menggunakan data yang diketahui hitunglah besar pengaruh
langsung, tidak langsung, dan pengaruh total dari:
 SES terhadap n ach
 SES terhadap GPA
 IQ terhadap n Ach
 IQ terhadap GPA
 n ach terhadap GPA
2) Misalkan tabel berikut menyatakan tentang korelasi antara variabel-
variabel dan diagram juga strukturnya (n = 300)

1 2 3 4 5 6
Race IQ School Self Level of Verbal
Quality Concept Aspiration Achievment
1 1,00 0,30 0,25 0,30 0,30 0,25
2 1,00 0,20 0,20 0,30 0,60
3 1,00 0,20 0,30 0,30
4 1,00 0,40 0,30
5 1,00 0,40
6 1,00
 MPDR5202/MODUL 9 9.35

Dan diagram strukturnya adalah sebagai berikut.

Race
(1)

Self
Conc
ept
(4)
Verbal
IQ Achieve
(2) ment
(6)
Level
of
Aspirat
ion
(5)

Scho
ol
Qual
ity
(3)

a. Tentukan substruktur-substruktur dari model struktural di atas!


b. Tentukan masing-masing matriks variabel eksogen untuk masing-
masing substrukturnya, juga invers matriksnya (gunakan excel)!
c. Hitung koefisien pada masing-masing substruktur!
d. Lakukan pengujian keberartian baik secara keseluruhan maupun
individual, jika diperlukan gunakan teori trimming untuk
memperoleh koefisien-koefisien yang berarti!
e. Susun model struktural akhir yang semua koefisien jalurnya berarti!
f. Susun table DE, IE, dan TE untuk keseluruhan variabel!
g. Hitunglah pengaruh langsung dari masing-masing variabel terhadap
variabel lainnya!
9.36 Statistika Pendidikan 

3) Misalkan dalam suatu penelitian akan dilakukan analisis hubungan


antara pengaruh Kepemimpinan Kepala Sekolah (X1), Profesionalisme
Guru (X2), Kerajinan Belajar Siswa (X3), dan Prestasi Belajar Siswa
(X4). Masalah yang akan diteliti adalah sebagai berikut.
a. Berapa besar pengaruh kepemimpinan kepala sekolah terhadap
profesionalisme guru?
b. Berapa besar pengaruh kepemimpinan kepala sekolah terhadap
kerajinan siswa dalam belajar?
c. Berapa besar pengaruh profesionalisme guru terhadap kerajinan
siswa?
d. Berapa besar pengaruh kepemimpinan kepala sekolah terhadap
presetasi belajar siswa?
e. Berapa besar pengaruh profesionalisme guru terhadap prestasi
belajar siswa?
e. Berapa besar kerajinan siswa dalam belajar berpengaruh terhadap
prestasi belajar.
Misalkan penelitian dilakukan terhadap siswa SMP dengan banyak
sampelnya 258. Perlu diketahui karena subjek dalam penelitian ini
adalah siswa, maka kepemimpinan kepala sekolah dan profesionalisme
guru dinilai berdasarkan pendapat siswa.

Secara teori, hubungan di antara keempat variabel tersebut dapat


digambarkan dalam diagram berikut.

X1

X3 X4

X2
 MPDR5202/MODUL 9 9.37

Secara deskriptif, korelasi antar variabel keempatnya adalah sebagai


berikut.
X1 X1 X1 X1
X1 1,00 0,25 0,38 0,30
X1 1,00 0,20 0,62
X1 1,00 0,56
X1 1,00

Dengan data tersebut, jawablah rumusan masalah di atas!


4) Soal ini dihitung dengan SPSS.
Misalkan seorang peneliti merumuskan hubungan antara 3 buah variabel
adalah sebagai berikut.

X1

X3 Y

X2

Dari hasil empirik diperoleh data sebagai berikut.


No res X1 X2 X3 Y
1 80 27 93 42
2 80 27 93 37
3 75 25 90 37
4 70 24 89 36
5 62 22 90 37
6 62 23 89 39
7 62 24 89 24
8 62 24 89 26
9 62 23 93 28
10 58 18 84 29
11 58 18 80 20
12 58 17 82 18
9.38 Statistika Pendidikan 

No res X1 X2 X3 Y
13 58 19 84 19
14 58 18 84 12
15 58 18 82 16
16 56 19 79 15
17 50 19 76 14
18 50 20 72 14
19 50 20 79 13
20 50 20 71 12

a. Susunlah hipotesis yang mungkin dari diagram model struktural di


atas!
b. Lakukan analisis dengan data di atas untuk membuktikan hipotesis
yang telah Anda susun!

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 25. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut
untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan
Belajar 1.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang
belum dikuasai.
 MPDR5202/MODUL 9 9.39

Kegiatan Belajar 2

Struktural Equation Model

T eori dan model dalam ilmu sosial dan perilaku umumnya diformulasikan
dengan menggunakan konsep teoritis atau istilah lainnya konstruk
(construct) yang tidak dapat diamati atau diobservasi secara langsung.
Meskipun demikian para peneliti dapat menggunakan indikator atau gejala
yang dapat diukur untuk digunakan dalam mempelajari konsep-konsep
teoritisnya (Wijayanto, 2008). Namun demikian, ada dua dampak
permasalahan yang ditimbulkan dalam memperoleh kesimpulan ilmiahnya.
Menurut Joreskog dan Sorborn (Wijayanto, 2008), kedua permasalahan
tersebut adalah Masalah Pengukuran dan Masalah Hubungan Kausal antar
Variabel.
1. Masalah Pengukuran berkaitan dengan “apa sebenarnya yang diukur
oleh suatu pengukuran? Dengan cara apa dan seberapa baik seseorang
dapat mengukur sesuatu yang perlu diukur? Dan bagaimana validitas dan
reliabilitas dari sebuah pengukuran?
2. Masalah hubungan kausal antar variabel berkaitan dengan pertanyaan-
pertanyaan:Bagaimana cara menyimpulkan kausal antar variabel-
variabel yang kompleks dan tidak teramati secara langsung, melainkan
melalui indikator-indikator? Bagaimana cara menilai kekuatan hubungan
antara variabel-variabel tersebut dengan indikator-indikatornya?

Untuk menjawab permasalahan tersebut banyak usaha yang dilakukan


oleh para statistikawan maupun para ilmuwan berbagai bidang. Menurut
Hagglund usaha mulai dilakukan oleh Francis Galton (1822 – 1911) yang
meletakkan dasar atau dapat dipandang sebagai pionir dalam analisis faktor.
Kemudian murid dari Galton, yakni Karl Pearson (1857 -1936); sudah
dibahas juga pada Modul 1, memperkenalkan metode lain, yakni analisis
komponen utama atau principal components. Demikian juga murid lainnya
dari Galton, yakni Charles Spearman (1863 – 1945) yang meletakkan dasar
psikometri sebagai cabang dari ilmu kuantitatif. Konsep One Factor Model
yang diusulkannya menyebabkan ia memperoleh julukan “The Father of
Factor Analysis”.
Banyak ilmuwan lain yang memberi kontribusi besar dalam usaha
menjawab permasalahan di atas, seperti Harold Hotelling (1895 – 1973) yang
9.40 Statistika Pendidikan 

menyempurnakan principal component analysis dari Pearson. Ia juga yang


berperan dalam pengembangan konsep korelasi kanonis (canonical analysis)
pada tahun 1936. Kemudian juga Louis Leon Thurstone (1887 – 1955) yang
memperluas one–factor model dari Spearman menjadi multiple factor model,
juga Louis Guttman (1916 – 1987) yang terkenal dengan Guttman scalling,
banyak berperan memberikan kontribusi pada analisis faktor yang berkaitan
dengan communality estimation. Akhirnya, Karl Joreskog berhasil melakukan
terobosan dalam hal estimasi dan analisis faktor. Beberapa kontribusi yang
diberikan olehnya adalah Maximum Likelihood Estimationsebagai sebuah
metode praktis yang dapat digunakan untuk penaksiran, Confimatory Factor
Analysis (CFA) dan LISREL.
Model dari Joreskog ini dikombinasikan dengan model dari Keesling
(1973) dan Wiley (1973) menghasilkan suatu model persamaan struktural
yang akan dipelajari oleh Anda dalam Modul ini. Prinsipnya adalah sebagai
berikut.
1. Bagian pertama adalah model variabel latent (latent variable model).
Model ini mengadaptasi persamaan simultan pada ekonometri. Jika pada
ekonometri semua variabelnya merupakan variabel-variabel terukur atau
teramati, maka pada model ini variabel-variabelnya merupakan variabel
latent yang tidak terukur secara langsung.
2. Bagian kedua adalah model pengukuran (measurement model). Model
ini menggambarkan indikator-indikator atau variabel-variabel terukur
sebagai efek atau refleksi dari variabel latennya, seperti analisis faktor
pada psikometri dan sosiometri. Konsep dasar dari model ini adalah CFA
(confirmatory analysis factor).

Dampak dari semakin berkembangnya penggunaan komputer memberi


peran yang besar dalam perkembangan Struktural Equation Model (SEM).
Perangkat LISREL dari Joreskog dan Sorbon menjadi dorongan SEM
menyebar perkembangan dan penggunaannya dalam berbagai bidang
penelitian, terutama dalam bidang ilmu sosial dan perilaku. Banyak juga
software lain muncul dalam upaya mempermudah analisis dalam SEM,
seperti EQS (equations) yang dikembangkan oleh Bentler (1985), LISCOMP
(linear structuralequations with comprehensive measurement model) dari
Muthen (1987), AMOS (analysis of moment structures) yang dikembangkan
oleh Aruckle (1988), serta banyak lagi software lainnya. Pada Modul ini
Anda akan disajikan analisis perhitungan menggunakan LISREL dan SPSS.
 MPDR5202/MODUL 9 9.41

Untuk itulah Anda harus berupaya untuk memiliki kedua software tersebut,
sehingga dapat memudahkan dalam mempelajari bagian modul ini.

A. KONSEP STRUCTURAL EQUATION MODEL (SEM)

Sewal Wright mengembangkan konsep ini pada tahun 1934, pada


awalnya teknik ini dikenal dengan analisa jalur dan kemudian dipersempit
dalam bentuk analisis Structural Equation Model. Menurut Pedhazur (1982),
SEM merupakan langkah pertama dari LISREL. Menurutnya LISREL
memuatdua subdivisi utama, yakni 1) the structural equation model (SEM),
dan 2) the measurement model. Lebih lanjut, Pedhazur menjelaskan bahwa
analisis jalur (path analysis, causal modeling), dan SEM telah digunakan
oleh beberapa penulis dari berbagai disiplin yang berbeda. Namun demikian,
beberapa tahun terakhir, banyak penulis yang lebih menyukai menggunakan
SEM sebagai istilah umum untuk berbagai pendekatan dalam melakukan
analisis sebab-akibat (causalitas). Satu pendekatan yang paling menonjol dan
mungkin juga paling populer dalam ilmu sosial adalah LISREL.
SEM (Structural Equation Model) adalah suatu teknik statistika yang
mampu menganalisis pola hubungan antara konstruk laten dan indikatornya,
konstruk laten yang satu dengan lainnya, serta kesalahan pengukuran secara
langsung. SEM memungkinkan dilakukannya analisis di antara beberapa
variabel dependen dan independen secara langsung.
Teknik analisis data menggunakan Structural Equation Modeling
(SEM), dilakukan untuk menjelaskan secara menyeluruh hubungan antar
variabel yang ada dalam penelitian. SEM digunakan bukan untuk merancang
suatu teori, tetapi lebih ditujukan untuk memeriksa dan membenarkan suatu
model. Oleh karena itu, syarat utama menggunakan SEM adalah membangun
suatu model hipotesis yang terdiri dari model struktural dan model
pengukuran dalam bentuk diagram jalur yang didasarkan pada justifikasi
teori. SEM merupakan sekumpulan teknik-teknik statistika yang
memungkinkan pengujian sebuah rangkaian hubungan secara simultan.
Hubungan itu dibangun antara satu atau beberapa variabel independen.
SEM menjadi suatu teknik analisis yang lebih kuat karena
mempertimbangkan pemodelan interaksi, nonlinearitas, variabel-variabel
bebas yang berkorelasi (correlated independent), kesalahan pengukuran,
gangguan kesalahan-kesalahan yang berkorelasi (correlated error terms),
beberapa variabel bebas laten (multiple latent independent) dimana masing-
9.42 Statistika Pendidikan 

masing diukur dengan menggunakan banyak indikator, dan satu atau dua
variabel tergantung laten yang juga masing-masing diukur dengan beberapa
indikator. Dengan demikian menurut definisi ini SEM dapat digunakan
sebagai alternatif lain yang lebih kuat dibandingkan dengan menggunakan
regresi berganda, analisis jalur, analisis faktor, analisis time series, dan
analisis kovarian
Yamin (2009) mengemukakan bahwa di dalam SEM peneliti dapat
melakukan tiga kegiatan sekaligus, yaitu pemeriksaan validitas dan
reliabilitas instrumen (setara dengan analisis faktor konfirmatori), pengujian
model hubungan antar variabel laten (setara dengan analisis jalur), dan
mendapatkan model yang bermanfaat untuk prediksi (setara dengan model
struktural atau analisis regresi). Dua alasan yang mendasari digunakannya
SEM adalah (1) SEM mempunyai kemampuan untuk mengestimasi
hubungan antar variabel yang bersifat multiple relationship. Hubungan ini
dibentuk dalam model struktural (hubungan antara konstruk dependen dan
independen). (2) SEM mempunyai kemampuan untuk menggambarkan pola
hubungan antara konstruk laten dan variabel manifes atau variabel indikator.
Untuk memahami SEM, kita mulai dengan pemahaman terhadap
komponen-komponen dalam SEM.
1. Ada 2 jenis variabel, yakni variabel laten (latent variable) dan variabel
teramati (observed atau manifest atau measured variable)
2. Ada dua jenis model, yakni model struktural (structural model) dan
model pengukuran (measurement model)
3. Ada 2 jenis kesalahan, yakni kesalahan struktural (structural error) dan
kesalahan pengukuran (measurement error).

Dalam pengembangan model strukturalnya, model SEM hampir sama


dengan model struktural dalam analisis jalur (path analysis). Dan model
tersebut diperoleh dari teori yang telah dianalisis oleh peneliti. Untuk itu, kita
kembali akan menggunakan simbol-simbol dalam analisis jalur.

1. Variabel Laten
Dalam SEM variabel kunci yang menjadi perhatian adalah variabel laten
(VL). Dalam beberapa buku sering juga diistilahkan dengan variabel
konstruk. Variabel laten merupakan konsep abstrak yang menandai suatu
kategori tertentu. Misalnya perilaku orang, sikap, motivasi berprestasi,
prestasi belajar, kecemasan belajar, kemandirian belajar. Variabel laten hanya
 MPDR5202/MODUL 9 9.43

dapat diamati secara tidak langsung dan tidak sempurna melalui efeknya pada
variabel teramati.
Dalam SEM dikenal dua jenis variabel laten, yakni variabel eksogen dan
variabel endogen. Variabel eksogen mempunyai sifat yang mirip dengan
variabel bebas, yakni variabel penyebab atau variabel yang mempengaruhi.
Adapun variabel endogen adalah variabel akibat, variabel terikat yang
termuat pada paling sedikit satu persamaan dalam model. Dalam SEM
variabel eksogen dilambangkan dengan””, dibaca ”ksi”, dan variabel
endogen dilambangkan dengan ”” dibaca ”eta”.
Dalam gambar diagram jalur atau lintasan, variabel laten disimbolkan
lingkaran (atau dapat juga ellips) dan hubungan kausalnya dinyatakan dengan
anak panah. Simbol untuk variabel eksogen ditandai dengan lingkaran yang
memuat semua anak panahnya menuju keluar. Adapun variabel endogen
ditandai dengan lingkaran yang anak panahnya paling sedikit ada yang
menuju atau masuk ke lingkarannya, walaupun terdapat anak panah lain
menuju keluar lingkaran. Untuk lebih jelasnya perhatikan gambar di bawah.


Variabel Eksogen Variabel Endogen

Gambar 9.8
Simbol untuk Variabel Eksogen dan Endogen dalam SEM

2. Variabel Teramati
Variabel teramati atau observed variable biasanya disimbolkan dengan
MV adalah variabel yang dapat diukur secara empiris. Variabel teramati
merupakan efek atau ukuran dari variabel laten. Secara mudahnya, variabel
ini dinamakan dengan indikator. Sebagai contoh, untuk mengukur Kualitas
orang tua digunakan indikator pendidikan, pekerjaan, dan penghasilan. Untuk
mengukur kualitas sekolah digunakan indikator layanan administrasi, layanan
guru, iklim atau lingkungan belajar, partisipasi siswa, hasil ujian nasional,
dan mungkin masih banyak lagi indikator yang digunakan. Dari contoh
tersebut, variabel kualitas orang tua merupakan variabel laten, sedangkan
9.44 Statistika Pendidikan 

pendidikan, pekerjaan, dan penghasilan merupakan variabel teramati atau


manifes. Kualitas sekolah merupakan variabel laten, sedangkan layanan
administrasi, layanan guru, lingkungan belajar, partisipasi siswa, dan hasil
ujian nasional merupakan variabel teramati.
Untuk memudahkan dan membedakan dengan variabel laten, simbol atau
notasi yang digunakan untuk variabel teramati dari variabel eksogen diberi
notasi dengan X. Untuk variabel teramati dari variabel endogen dinotasikan
dengan Y. Adapun dalam model strukturnya, simbol atau gambar dari
variabel teramati digambarkan dengan persegi atau persegi panjang.

X Y

Gambar 9.9
Simbol Variabel Teramati

3. Model-Model dalam Structural Equation Model


Sebagaimana dijelaskan di atas bahwa ada dua jenis model dalam SEM,
yakni model struktural dan model pengukuran. Model struktural
menggambarkan hubungan-hubungan yang terjadi antara variabel laten,
eksogen dan endogen. Secara umum dalam kajian modul ini hubungan-
hubungan dalam model sifatnya linear (untuk lebih lanjut hubungan-
hubungan antar variabelnya dapat menyertakan hubungan non linear).
Hubungan yang terjadi antar variabel laten sama dengan apa yang terjadi
dalam regresi linear. Dalam suatu model sangat mungkin memuat beberapa
persamaan linear, dalam matematika kumpulan dari persamaan-persamaan
regresi linear tersebut membentuk suatu persamaan simultan.
Parameter yang menunjukkan regresi variabel laten endogen pada
variabel laten eksogen diberi simbol dengan  (gamma) sedangkan untuk
regresi variabel endogen pada variabel endogen di lambangkan dengan 
(beta). Dalam teorinya, ada tiga macam atau jenis model struktural dapat
dilihat pada diagram berikut.
 MPDR5202/MODUL 9 9.45

GAMMA 11 BETA 21
(11) (21)
KSI 1 ETA 1 ETA 2
(1) (1) (2)

21
 
BETA 31
2 GAMMA 12
 21 (31)
(12)

KSI 2 ETA 3
(2) (3)
GAMMA 32
(32)

Gambar 9.10
Contoh Model Struktural

Notasi matematika untuk model struktural di atas adalah sebagai berikut:


1   111   12 2
2   211
3   32 2  311

Atau dapat juga ditulis dalam bentuk


ETA1 = GAMMA 11 × KSI 1 + GAMMA 12 × KSI 2
ETA2 = BETA 21 × ETA 1
ETA3 = GAMMA 32 × KSI 2 + BETA 31 × ETA 1

Model yang kedua adalah model pengukuran. Sebagaimana diketahui


sebelumnya bahwa dalam SEM setiap variabel laten biasanya mempunyai
ukuran atau variabel teramati atau familiernya diistilahkan dengan indikator.
Dalam model ini, setiap variabel laten dimodelkan sebagai sebuah faktor
yang mendasari variabel-variabel teramati yang terkait. Factor loading yang
menghubungkan variabel-variabel laten dengan variabel-variabel teramati
diberi label dengan simbol (lambda). Dalam SEM dipunyai dua matriks
lambda yang berbeda, yaitu satu matriks pada sisi X dan matriks lainnya
9.46 Statistika Pendidikan 

adalah Y. Notasi  pada sisi X dilambangkan dengan X (lambda X) dan pada


sisi Y dilambangkan dengan Y (lambda Y).
Model pengukuran yang paling lazim dalam SEM adalah congeneric
measurement model, yakni setiap ukuran yang teramati hanya berhubungan
dengan satu variabel laten, dan semua kovariansi di antara variabel-variabel
teramati adalah sebagai akibat dari hubungan antara variabel teramati dan
variabel laten. Untuk lebih jelasnya Anda dapat memperhatikan gambar
berikut.
X1
LAMBDA X11 (X11)

LAMBDA X21 (X21)


X2 KSI 1 (1)

X3 LAMBDA X31 (X31)

Gambar 9.11
Contoh Model Pengukuran

Persamaan matematika dari model pengukuran di atas adalah sebagai


berikut.
X 1   X11 1
X 2   X 21 1
X 3   X 31 1

Atau dalam bentuk lain ditulis sebagai berikut


X1 = LAMBDA X11× KSI 1
X2 = LAMBDA X21× KSI 1
X3 = LAMBDA X31× KSI 1

4. Kesalahan-Kesalahan dalam SEM


Karena dalam SEM ada dua model, yakni struktural dan pengukuran,
maka masing-masing model memunculkan kesalahan. Dengan demikian
dikenal 2 macam kesalahan, yakni kesalahan struktural dan kesalahan
pengukuran. Sebagaimana dalam regresi, bahwa variabel bebas tidak akan
 MPDR5202/MODUL 9 9.47

secara sempurna memprediksi variabel terikat. Begitu juga dalam SEM,


variabel eksogen tidak akan secara sempurna memprediksi variabel endogen.
Artinya ada kesalahan yang ditimbulkan dalam prediksi. Untuk itulah dalam
model struktural ditambahkan komponen kesalahan yang diberi simbol
dengan  (zeta). Untuk memperoleh estimasi parameter yang konsisten,
kesalahan struktural ini diasumsikan tidak berkorelasi dengan variabel-
variabel eksogen dari modelnya. Meskipun demikian, kesalahan struktural
bisa dimodelkan berkorelasi dengan kesalahan struktural yang lain.
Perhatikan kembali Gambar 9.10 dari contoh model struktural di atas.
Kesalahan struktural tinggal ditambahkan pada masing-masing variabel
endogen. Jadi setiap variabel endogen memuat satu kesalahan.

ZETA 1 ZETA 2
(1) (2)

GAMMA 11 BETA 21
(11) (21)
KSI 1 ETA 1 ETA 2
(1) (1) (2)

21 BETA 31
 
2
 21
GAMMA 12
(12)
(31)

KSI 2 ETA 3
(2) (3)
GAMMA 32
(32)

ZETA 3
Gambar 9.12 (3)
Diagram Lintasan Kesalahan dalam Model Struktural
9.48 Statistika Pendidikan 

Untuk itu, persamaan matematikanya pun mengalami perubahan, yakni


sebagai berikut.
1   111   12 2   1
2   211   2
3   32 2  311   3

Atau dapat juga ditulis dalam bentuk


ETA1 = GAMMA 11 × KSI 1+ GAMMA 12 × KSI 2 + ZETA 1
ETA2 = BETA 21 × ETA 1 + ZETA 2
ETA3 = GAMMA 32 x KSI 2 + BETA 31 × ETA 1 + ZETA 3

Kesalahan pengukuran terjadi ketika indikator-indikator tidak secara


sempurna mengukur variabel laten terkait. Untuk memodelkan
ketidaksempurnaan tersebut, maka dilakukan penambahan komponen yang
mewakili kesalahan. Komponen kesalahan pengukuran yang teramati yang
berkaitan dengan variabel X dilambangkan dengan  (delta), dan komponen
kesalahan yang berkaitan dengan Y dilambangkan dengan  (epsilon).
Kesalahan pengukuran  boleh berkovari satu sama lain, meskipun demikian
secara otomatis tidak akan berkovari antara satu dengan lainnya. Matriks
kovarian dari  diberi simbol dengan (theta delta) dan secara otomatis akan
berbentuk matriks diagonal (untuk mengetahui apa itu matriks diagonal,
Anda diharapkan membaca buku tentang matriks). Hal yang sama berlaku
juga bagi kesalahan pengukuran , matriks kovariannya dilambangkan
dengan  (theta epsilon) dan merupakan matriks diagonal.
Secara konseptual, hampir semua pengukuran mempunyai komponen
kesalahan yang terkait. Meskipun demikian, ketika sebuah variabel laten
hanya direfleksikan oleh sebuah variabel teramati tunggal, maka estimasi
nilai kesalahan pengukuran terkait sukar bahkan tidak mungkin dilakukan.
Dalam kasus ini, kesalahan pengukuran harus dispesifikasikan terlebih
dahulu sebelum melakukan estimasi parameter atau kesalahan pengukuran
dapat dianggap sebagai tidak ada atau nol. Contoh diagram dari kesalahan
pengukuran dalam model pengukuran adalah sebagai berikut.
 MPDR5202/MODUL 9 9.49

DELTA 1
(1) X1
LAMBDA X11 (X11)

LAMBDA X21 (X21)


DELTA 2 KSI 1 (1)
X2
(2)

DELTA 3 LAMBDA X31 (X31)


X3
(3)

ETA 1 1
(1) Y1 0

Gambar 9.13
Diagram Lintasan Kesalahan dalam Model Pengukuran

Dari gambar di atas, maka persamaan matematikanya adalah sebagai


berikut
X 1  X11 1  1
X 2  X 21 1   2
X 3  X 31 1   3
Y1  1  0
Atau dalam bentuk lain ditulis sebagai berikut
X1 = LAMBDA X11 × KSI 1 + DELTA 1
X2 = LAMBDA X21 × KSI 1 + DELTA 2
X3 = LAMBDA X31 × KSI 1 + DELTA 3
Y1 = 1x ETA 1 + 0

Kedua model struktural dan model pengukuran serta masing-masing


kesalahannya dapat digabungkan menjadi diagram/gambar yang lengkap.
9.50 Statistika Pendidikan 

Model gabungan keduanya disebut dengan bentuk umum SEM atau


diistilahkan dengan Full Model atau Hybrid Model. Contoh bentuk umum
atau full model/hybrid model dari gabungan kedua model di atas adalah
sebagai berikut. 1 2 3 4 5 6 7
1 2 3

X1 X2 X3 Y1 Y2 Y3 Y4 Y5 Y6 Y7

(11) (21)
KSI 1 ETA ETA
(1) 1 (1) 2 (2)

ZETA
2
(2)
21
 
2
 21 ZETA
1
(31)

(12) (1)

KSI 2 ETA
(2) 3 (3)

(32)
ZET
A3
(3)
X4 X5 Y8 Y9 Y10

4 5
8 9 10
Gambar 9.14
Contoh Model Hybrid (Diambil dari Wijayanto, 2008)
 MPDR5202/MODUL 9 9.51

Dari diagram hybrid di atas, maka kita dapat menurunkan beberapa


persamaan matematika untuk model struktural, model pengukuran,
persamaan matriks model struktural, persamaan matriks untuk model
pengukuran.

a. Persamaan matematika untuk model struktural adalah sebagai berikut


1   111   12 2   1
2   211   2
3   32 2  311   3

b. Model persamaan matematika untuk model pengukurannya adalah


1) Untuk variabel pengukuran X
X 1  X11 1  1
X 5  X 42  2   4
X 2  X 21 1   2
X 2  X 522   5
X 3  X 31 1   3
2) Untuk variabel pengukuran Y
Y1  Y111  1
Y2  Y211   2
Y3  Y311   3 Y8  Y1833   8
Y4  Y42 2   4 Y9  Y933   9
Y5  Y522   5 Y10  Y1033  10
Y6  Y632   6
Y7  Y732   7

c. Matriks model strukturalnya adalah sebagai berikut


1) Matriks kovarians untuk model struktural
1   0 0 0  1   11  12   1 
          0   1     
 2   21 0 0  2  0     2 
3    31 0 0  3   0  32   2   3 
 21 0 0 
 21 0   
 2 2 
;    0  2
2
0 

  3  2 
  0 0  2 3 

9.52 Statistika Pendidikan 

2) Matriks kovarians untuk model pengukuran


Untuk peubah eksogen
 X 1   X 11 0   1   21 
 X       
 2   X 21 0   2    2
2

 
 X 3    X 31 0   1    3       23 
     2     
X4   0 X 42   4    4
2

 X 5   0 X 52   5    2 
 5 

Atau dapat ditulis dalam bentuk notasi X   X    .


Matriks untuk variabel endogen
 Y1   Y 11 0 0 
 Y   0 0 
 2   Y 21
 Y3   Y 31 0 0 
   
 Y4   0 Y 42 0 
 
 Y5   0 Y 52 0  1
    
 Y6   0 Y 62 0  2
 
Y   0 72 0  3
 7  
 Y8   0 0 Y 83 
  
 Y9   0 0 93 
Y10   0 0 103 
 21 0 0 0 0 0 0 0 0 0 
 
 0  1 0
2
0 0 0 0 0 0 0 
 0 0  22 0 0 0 0 0 0 0 
 
 0 0 0  24 0 0 0 0 0 0 
 0 0 0 0  25 0 0 0 0 0 
   
 0 0 0 0 0  6 0
2
0 0 0 
 0 0 0 0 0 0  27 0 0 0 

 0 0 0 0 0 0 0  28 0 0 
 
 0 0 0 0 0 0 0 0 9
2
0 
 0 0  210 
 0 0 0 0 0 0 0
Secara ringkas dapat ditulis sebagai Y  Y  
 MPDR5202/MODUL 9 9.53

Dari hasil di atas, maka notasi matematika dari model full hybrid ini
dapat ditulis sebagai berikut.
Struktural model
        atau secara umum dapat ditulis sebagai
        
 m1  m m   m1  m n   n1  m1

 Model pengukuran untuk X


X   X    atau secara umum dapat ditulis X   X   
( q1) ( qn ) ( n1) ( q1)

 Model Pengukuran untuk Y


Y  Y   atau secara umum dapat ditulis Y  Y   
 p1  pm  m1  p1

Dengan asumsi-asumsi yang harus dipenuhi oleh masing-masing


distribusinya adalah :
1)  tidak berkorelasi dengan 
2)  tidak berkorelasi dengan
3)  tidak berkorelasi dengan 
4) , , dan tidak saling berkorelasi (mutually uncorrelated)
5) -  matriks non singular (determinannya tidak nol).

Perlu juga diketahui bahwa dalam diagram di atas, ada simbol variabel,
koefisien (bilangan Riil), dan matriks. Adapun rinciannya adalah sebagai
berikut.

Variabel:
  dibaca eta adalah variabel laten endogen
  dibaca ksi adalah variabel laten eksogen
  dibaca zeta adalah kesalahan laten dalam persamaan
 X adalah indikator yang diamati dari 
 Y adalah indikator yang teramati dari 
  dibaca epsilon adalah kesalahan pengukuran dari Y
  dibaca delta adalah kesalahan pengukuran dari X
9.54 Statistika Pendidikan 

Matriks koefisien:
 B (beta) berordo m × m adalah matriks koefisien untuk variabel laten
endogen
  (gamma) berordo m × n adalah matriks koefisien untuk variabel laten
eksogen.
 X (lambda X) berordo q × n adalah matriks koefisien yang mengaitkan
Y ke .
 Y(lambda Y) berordo p × m adalah matriks koefisien yang mengaitkan
X dengan .

Matriks kovarians:
  (phi) berorodo n × n adalah matriks kovarians dari .
  (psi) berordo m × m adalah matriks kovarians dari .
  (theta – epsilon) berordo p × p adalah matriks kovarians dari .
  (theta – delta) berordo q × q adalah matriks kovarians dari .

B. PATH MODEL

Bentuk umum dari SEM yang telah dipelajari di atas memuat variabel
latent dan variabel teramati. Dalam penelitian banyak ditemukan model yang
semuanya variabel teramati dan tidak memuat variabel laten. Model semacam
ini dinamakan dengan path model, seperti yang terlihat pada diagram berikut.
1

11 4
X1 Y1 2
21

22 31 42


X2 Y2 Y4

23
33
X3 Y3

3
Gambar 9.15
Contoh Path Model
 MPDR5202/MODUL 9 9.55

Persamaan matematika dari model di atas adalah

Y1   11 X 1   1
Y2   21Y1   23Y2   22 X 2   2
Y3  31Y1   33 X 3   3
Y4   42Y2   4

Atau jika dituliskan dalam bentuk matriks adalah sebagai berikut

Y1   0 0 0 0   Y1   11 0 0  1 
Y     23 0 0  Y2   0  22   X 1   
 2    21 
0 X    2 
Y3   31 0 0 0  Y3   0 0  33   2   3 
        X3   
Y4   0 0 0  43  Y4   0 0 0     4 

C. CONFIRMATORY FACTOR ANALYSIS (CFA)

Model pengukuran yang telah dibahas sebelumnya memperlihatkan


bahwa sebuah variabel laten diukur oleh satu atau lebih variabel teramati.
Bentuk model pengukuran yang telah dikembangkan tersebut diistilahkan
dengan CFA atau confirmatory factor analysis.
Dalam penelitian ilmu sosial ada sedikit perbedaan dengan penelitian
ilmu eksakta. Dalam penelitian ilmu eksakta, variabel yang diteliti umumnya
bersifat unidimensional dan dapat diobservasi langsung (seperti dalam path
model), sedangkan dalam ilmu sosial, variabel-variabel yang diteliti
umumnya multidimensional dan tidak dapat diobservasi secara langsung.
Karena sifat tersebut, maka pengukuran terhadap variabel yang diteliti
menggunakan indikator (variabel manifes). CFA mendasarkan pada hal
tersebut, yakni variabel-variabel teramati adalah indikator-indikator tidak
sempurna dari variabel laten atau konstruk tertentu yang mendasarinya.
CFA merupakan salah satu dari dua pendekatan utama dalam analisis
faktor, yang lainnya adalah exploratory factor analysis (EFA). Perbedaan
CFA dengan EFA adalah pada EFA
1. model rinci yang menunjukkan hubungan antar variabel laten dengan
variabel teramati tidak dispesifikasikan terlebih dahulu;
2. jumlah variabel laten tidak ditentukan sebelum analisis dilakukan;
9.56 Statistika Pendidikan 

3. semua variabel laten diasumsikan mempengaruhi variabel teramati;


4. kesalahan pengukuran tidak boleh berkorelasi.

Sebaliknya pada CFA,


1. model dibentuk lebih dahulu;
2. jumlah variabel laten ditentukan oleh analisis;
3. pengaruh suatu variabel laten terhadap variabel teramati dapat ditetapkan
sama dengan nol atau suatu konstanta;
4. kesalahan pengukuran boleh berkorelasi;
5. kovarian variabel laten dapat diestimasi atau ditetapkan pada nilai
tertentu;
6. identifikasi parameter diperlukan.

CFA menurut Bachrudin dan Tobing (Kusnendi, 2005) bertujuan untuk


mengevaluasi pola-pola hubungan antara beberapa konstruk. Setiap konstruk
dibangun oleh indikator-indikator. Model analisis ini biasanya tidak
diasumsikan arah hubungan antara konstruk, tetapi hanya adanya hubungan
korelatif antar konstruk. Kusnendi (2005) memberi contoh model CFA
dengan Kepuasan kerja (KK) sebagai variabel manifes, dan berturut-turut X1
variasi pekerjaan, X2 sistem kompensasi yang memadai, X3 tugas yang pasti,
X4 kesempatan aktualisasi diri, X5 pengambilan keputusan atasan, X6
otonomi, X7 kesempatan untuk mengabdi, dan X8 pratek kebijakan pimpinan.
Adapun model yang menghubungkan variabel laten dan teramatinya dapat
dilihat pada diagram berikut.
 MPDR5202/MODUL 9 9.57

X1 1

X2 2

X3 3

X4 4

KK
X5 5

X6 6

X7 7

X8 8

Gambar 9.16
Contoh Diagram CFA

Persamaan matematikanya adalah sebagai berikut.


X 1   1 KK  1
X 2   2 KK   2
X 3   3 KK   3
X 4   4 KK   4
X 5   5 KK   5
X 6   6 KK   6
X 7   7 KK   7
X 8   8 KK   8
9.58 Statistika Pendidikan 

D. PROSEDUR SEM

Penerapan SEM pada analisis data hasil penelitian memerlukan orientasi


yang berbeda dengan penerapan statitiska yang umumnya didasarkan pada
pengamatan secara individual, misalnya uji beda mean dua kelompok melalui
uji-t atau uji-z, ANOVA untuk k > 2, ataupun pada regresi. Proses analisis
dalam SEM lebih menekankan pada penggunaan kovarian dibandingkan
dengan kasus-kasus individual. Jika dalam analisis statistika biasa, fungsi
yang diminimumkan adalah perbedaan antara nilai-nilai yang diamati dengan
yang diprediksi (seperti penerapan least square pada regresi), maka pada
SEM yang diminimumkan adalah perbedaan antara kovarian sampel dengan
kovarian yang diprediksi oleh model. Dengan demikian yang dimaksud
residual dalam SEM adalah perbedaan antara kovarian yang diprediksi
dengan kovarian yang diamati (banyak yang mengatakan bahwa SEM dengan
istilah Analysis of Covariance Structure).
Secara umum proses pencocokan dapat diikhtisarkan seperti pada
gambar berikut.

Sumber : Wijayanto, 2008

Gambar 9.17
Pencocokan Model terhadap Data
 MPDR5202/MODUL 9 9.59

Garis panah dua arah antara teori dengan realitas menggambarkan


interaksi antara teori dengan realitas yang memiliki arti bahwa teori
digunakan untuk menjelaskan realitas. Untuk menguji teori atau dapat pula
memperbaikinya diperlukan informasi dari realitas. Untuk itulah maka ada
hubungan timbal balik antara teori dengan realitas. Kerangka pikir ini sama
dengan apa yang dilakukan dalam penelitian (terutama penelitian kuantitatif),
kita perlu sebuah teori untuk memperoleh hubungan antar variabelnya,
kemudian dibuktikan secara empirik dan hasilnya kembali dijastifikasi oleh
teori. Dengan demikian, teori akan menentukan spesifikasi model, sedangkan
arah sebaliknya adalah model memberikan informasi tentang validitas teori.
Berdasarkan model yang telah dispesifikasi akan muncul instrumen
sebagai alat pengumpulan data (disajikan dalam garis putus-putus). Setelah
data diperoleh hasilnya dicocokkan dengan model penelitian yang telah
dispesifikasi. Hasil pencocokan ini digunakan untuk mevalidasi teori. Proses
pencocokan tersebut dapat dituliskan dalam bentuk persamaan sederhana
sebagai berikut.
Data = Model + Residual

Data mewakili hasil pengukuran yang berkaitan dengan variabel-variabel


teramati dan membentuk sampel penelitian. Adapun Model mewakili yang
dihipotesiskan oleh peneliti, serta residual merupakan perbedaan antara
model yang dihipotesiskan dengan data yang diamati.
Agar diperoleh kecocokan data dengan model, maka diperlukan usaha
untuk meminimalkan residual atau harapannya residual mendekati nol (0).
Langkah berikutnya yang perlu dipahami oleh kita dalam analisis SEM
adalah pengembangan atau penyusunan hipotesis. Hal ini merupakan sesuatu
yang lumrah dalam statistika inferensial. Sebagaimana dijelaskan di atas,
bahwa dalam SEM analisis dilakukan untuk menguji kovarians populasi.
Dengan demikian hippotesis fundamental dalam SEM adalah matriks
kovarian dari populasi, yang dilambangkan dengan  (sigma besar), sama
dengan matriks kovarians yang diturunkan dari model, (). Jika model yang
dispesifikasikan benar dan jika parameter () dapat diestimasi nilainya, maka
matriks kovarians populasi () dapat dihasilkan kembali dengan tepat. Secara
operasional hipotesis yang diuji dalam SEM adalah sebagai berikut.
H0 :  = ()
9.60 Statistika Pendidikan 

Karena kita menginginkan residualnya mendekati nol atau dengan kata


lain  = (), maka diusahakan agar pada uji hipotesis terhadap hipotesis
fundemantal menghasilkan Ho tidak ditolak atau Ho diterima. Hal ini
berbeda dengan uji hipotesis yang biasa dilakukan yang mengharapkan Ho
ditolak. Dengan diterimanya Ho :  = (), maka dapat disimpulkan bahwa
data mendukung model yang dispesifikasikan.

1. Tahapan dalam Proses Analisis SEM


Dalam beberapa literatur tahapan analisis SEM tidak tunggal, ada yang
menuliskan 7 tahapan seperti Hair, et. al. dalam Hartono (2006), sedangkan
Wijayanto (2008) menuliskannya ada 5 tahapan. Namun demikian kedua
pendapat tersebut hakikatnya sama, yakni tahapan SEM dimulai dari
pengembangan model teoritis, sampai dengan pengambilan keputusan.
Dalam modul ini akan dijelaskan tahapan menurut Wijayanto (2008) dengan
contoh-contoh yang diambil di dalamnya.
a. Pengembangan model teoritis atau spesifikasi model
Dalam langkah pengembangan model teoritis, hal yang harus dilakukan
adalah melakukan serangkaian eksplorasi ilmiah melalui telaah pustaka guna
mendapatkan justifikasi atas model teoritis yang akan dikembangkan. SEM
digunakan bukan untuk menghasilkan sebuah model, tetapi digunakan untuk
mengonfirmasi model teoritis tersebut melalui data empirik.

b. Identifikasi
Tahap ini berkaitan dengan pengkajian tentang kemungkinan
diperolehnya nilai yang unik untuk setiap parameter yang ada di dalam model
dan kemungkinan persamaan simultan tidak ada solusinya.

c. Estimasi
Tahap ini berkaitan dengan estimasi terhadap model untuk menghasilkan
nilai-nilai parameter dengan menggunakan salah satu metode estimasi yang
tersedia. Pemilihan metode estimasi yang digunakan ditentukan berdasarkan
karakteristik dari variabel-variabel yang dianalisis.

d. Uji kecocokan
Tahap ini berkaitan dengan pengujian kecocokan antara model dengan
data. Beberapa kriteria ukuran kecocokan atau diistilahkan dengan
goodnessof fit (GOF) dapat digunakan untuk melaksanakan langkah ini.
 MPDR5202/MODUL 9 9.61

e. Respesifikasi
Tahap ini berkaitan dengan respesifikasi model berdasarkan atas hasil uji
kecocokan tahap sebelumnya.

2. Spesifikasi Model
Prosedur dalam SEM dimulai dari mengembangkan spesifikasi model
penelitian yang akan diuji atau disestimasi. Spesifikasi model mencerminkan
permasalahan yang diteliti dan informasinya diperoleh dari kajian baik secara
teori maupun hasil penelitian-penelitian sebelumnya. Hubungan-hubungan
tersebut akan diperoleh dengan berbagai tahapan, yakni:
a. Spesifikasi model pengukuran
1) Definisikan seluruh variabel-variabel yang ada dalam penelitian.
2) Definisikan variabel-variabel yang teramati.
3) Definisikan hubungan-hubungan antara setiap variabel laten dan
variabel teramati yang terkait.

b. Spesifikasi model struktural


Definisikan hubungan kausal di antara variabel-variabel laten yang ada
dalam penelitian.

c. Gambarkan diagram jalur (path diagram) hybrid dari model


pengukuran dan model strukturnya.

3. Identifikasi
Tahap identifikasi digunakan untuk pengkajian solusi persamaan
simultan yang diperoleh dari model hybrid. Identifikasi ini berkaitan dengan
jumlah data dan jumlah parameter dalam persamaan simultan. Mungkin Anda
pernah belajar persamaan simultan atau sistem persamaan linier. Solusi
persamaan simultan salah satunya ditentukan oleh jumlah persamaan dan
jumlah variabel dalam persamaan simultannya. Terkait jumlah persamaan
dan jumlah variabel, ada tiga kemungkinan, yakni pertama jumlah variabel
lebih banyak dari jumlah persamaan, kedua jumlah variabel sama dengan
jumlah persamaan, dan yang ketiga jumlah variabel lebih sedikit daripada
jumlah persamaan. Nah, demikian juga dalam SEM, persamaan simultan dari
model hybrid memunculkan tiga kemungkinan, tiga kemungkinan tersebut
dikatagori dala tiga jenis, yakni under identified, just identified, dan over
identified. Under identified adalah model degan jumlah parameter yang
9.62 Statistika Pendidikan 

diestimasi lebih besar dari jumlah data yang diketahui (data varian dan
kovarian dari variabel teramati). Just identified adalah model dengan jumlah
parameter yang diestimasi sama dengan data yang diketahui, serta over
identified adalah model dengan jumlah parameter yang diestimasi lebih kecil
dari jumlah data yang diketahui.
Selain informasi perbandingan jumlah variabel dan jumlah data, dalam
identifikasi ini juga kita akan memperoleh informasi dalam menentukan
derajat bebas (degree of freedom). Tentu Anda sudah mengetahui
sebelumnya apa yang dimaksud dengan derajat bebas dalam suatu uji
statistika. Derajat bebas dihitung dengan mengurangkan jumlah data yang
diketahui dengan jumlah persamaan dalam persamaan simultan. Dengan
demikian, dari kategori di atas, maka untuk kategori under identified, derajat
bebasnya akan negatif. Untuk just identified derajat bebasnya sama dengan
nol, dan untuk over identified derajat bebasnya bernilai positif.
Dalam SEM kita mengusahakan agar model hasil identifikasinya
berkategori over identified dan menghindari under identified. Meskipun
demikian menurut Wijayanto (2008) jika ada indikasi permasalahan berkaitan
dengan identifikasi, maka diperlukan melihat sumber-sumber kesalahan yang
sering terjadi. Hair, et. al. (Wijayanto, 2008) menemukan sumber-sumber
kesalahannya adalah 1) banyaknya parameter yang diestimasi relatif terhadap
varian kovarian matriks sampel yang menandakan derajat bebas yang kecil,
2) penggunaan reciprocal effect, 3) kegagalan dalam menetapkan skala dari
konstruk.
Sedangkan Muller (Wijayanto, 2008) menyarankan salah satu usaha
yang dapat dilakukan untuk memperoleh model yang over identified, yakni
memilih satu dari 2 pilihan sebagai berikut: 1) menetapkan salah satu muatan
faktor dari setiap variabel laten yang ada dalam model dengan nilai 1,0.
Atau 2) variabel laten yang distandarisasikan ke unit varians dengan cara
menetapkan nilai 1 pada komponen diagonal dari matriks .
Saran lain yang dikemukakan oleh Wijayanto (2008) adalah ketika
sebuah variabel laten hanya mempunyai satu variabel teramati tunggal, maka
lazimnya kita menetapkan nilai  sama dengan 0 dan nilai error variens sama
dengan 0  2 atau  2  . Hal ini menunjukkan bahwa kita mengasumsikan
variabel teramati 100% merefleksikan variabel laten. Meskipun demikian,
jika kita menganggap bahwa variabel teramati tidak seratus persen
merefleksikan variabel laten, tetapi misalnya hanya 90% (atau R2 = 0,90),
 MPDR5202/MODUL 9 9.63

maka kita hanya perlu menetapkan nilai error variannya  2


 atau  2 
sebesar {(1– 0,90) × nilai varians dari variabel teramati yang bersangkutan}.
Jika usaha di atas belum bisa mengatasi masalah identifikasi, maka
menurut Hair, et. al. (Wijayanto, 2008) satu-satunya solusi adalah
menentukan pembatasan-pembatasan terhadap model lebih banyak lagi, yaitu
dengan menghilangkan atau membuang beberapa koefisien atau muatan
faktor yang ada dalam model, sampai masalah identifikasi dapat diatasi.

4. Estimasi
Tahap ini dilakukan setelah tahap identifikasi memperoleh persamaan
simultan dengan kategori just identified atau over identified. Tahap estimasi
ini dilakukan untuk memperoleh nilai-nilai dari parameter-parameter yang
ada dalam model. Parameter-parameter yang harus diperoleh nilainya
adalah, , , , x, y, , dan , sedemikian hingga matriks kovarian
yang diturunkan model () sedekat mungkin dengan matriks kovarian
populasi dari variabel teramati, .
Sebagaimana lazimnya dalam analisis statistika, pengolahan data
dilakukan melalui data sampel, untuk itulah dalam perhitungan atau
pengolahannya kita menggunakan estimator (yang tentu saja terbaik) bagi ,
yakni S (matriks kovarian sampel dari variabel-variabel teramati). Estimator
bagi () dapat diturunkan dengan menyelesaikan persamaan S = (), yakni
sebagai berikut.

 Cov Y , Y  Cov Y , X  
 
Cov  X , Y  Cov  X , X 
 1  
  y  I      '    I     y    y  I     x 
1 1

 
 1  
  x   I     y  x x   
  

Persamaan dari matriks di atas berbentuk persamaan simultan, maka


syaratnya adalah just identified, dan over identified. Penyelesaian dari
persamaan di atas dilakukan dengan proses yang iteratif.
Untuk memperoleh hasil terbaik; model estimator dari  atau ̂ sedekat
mungkin dengan S, maka diperlukan suatu fungsi dari S dan () yang
diminimalkan, fungsi tersebut dinamakan dengan fungsi kecocokan atau
9.64 Statistika Pendidikan 

fitting function, yakni F(S, ()). Minimisasi dilakukan secara iteratif dan
jika hasil estimasi dari ˆ disubstitusikan ke () maka diperoleh ̂ dan
fungsi hasil minimisasi untuk ˆ adalah F(S, ̂ ).
Terdapat banyak pendekatan yang digunakan untuk meminimalkan dari
F, di antaranya Instrumen Variabel (TF), Two Stage Least Square (TSLS),
Unweighted Least Square (ULS), Generalized Least Square (GLS),
Maximum Likelihood (ML), Weighted Least Square (WLS), Diagonally
Weighted Least Square (DWLS). Untuk memilih mana pendekatan yang
digunakan diserahkan pada peneliti masing-masing. Untuk pengolahan data
lebih lanjut, dalam modul ini kita akan menggunakan WLS. Dalam LISREL
estimasi ini di adaptasi dari ADF (Asymptotically Distributrion Free) yang
dikembangkan oleh Browne.
Umumnya yang digunakan dalam SEM adalah pendekatan ML dan
WLS. WLS memiliki kelebihan dibandingkan dengan ML, tetapi ukuran
sampel yang diperlukan untuk melakukan estimasi dengan WLS lebih besar
ketika menggunakan ML. Ada beberapa persyaratan dalam penggunaan
pendekatan ini, yakni paling rendah rasio 5 responden per variabel teramati
akan mencukupi untuk distribusi normal ketika sebuah variabel laten
mempunyai beberapa indikator (variabel teramati), dan rasio 10 responden
per variabel teramati akan mencukupi untuk distribusi yang lain (Bentler dan
Chou dalam Wijayanto, 2008). Untuk itulah, ukuran sampel yang diperlukan
apabila kita menggunakan ML adalah minimal 5 responden untuk setiap
variabel teramati yang ada dalam model, sedangkan apabila kita
menggunakan WLS memerlukan minimal 10 responden untuk setiap variabel
teramati. Misalkan kita mempunyai model 20 variabel teramati, maka apabila
kita menggunakan ML akan diperlukan 100 responden, dan apabila kita
menggunakan WLS diperlukan 200 responden.
Hasil perhitungan dari estimasi ini memuat beberapa kemungkinan, dan
hal itulah yang perlu diperhatikan oleh kita. Kemungkinannya adalah adanya
nilai-nilai estimasi yang melebihi batas yang data diterima atau diistilahkan
dengan offending estimates. Beberapa jenis dari hasil ini adalah 1) negative
error variances atau nonsignificant error variances untuk konstruk-konstruk
yang ada. 2) standardized coefficients yang melebihi atau dekat dengan 1.
Dan 3) standard errors yang berhubungan dengan koefisien-koefisien yang
diestimasi mempunyai nilai sangat besar.
Ketika terjadi negative errors atau Heywoods cases, maka salah satu cara
untuk memperbaikinya adalah dengan menetapkan error variances tersebut
 MPDR5202/MODUL 9 9.65

ke nilai positif yang sangat kecil misalnya 0,005 atau 0,01. Jika korelasi
dalam solusi standar melebihi nilai 1 atau dua estimasi berkorelasi tinggi,
maka kita perlu mempertimbangkan untuk mengeliminasi salah satu. Dalam
banyak hal, keadaan di atas sebagai akibat dari model yang dibentuk tanpa
justifikasi teori yang mencukupi atau modifikasi dilakukan hanya
berdasarkan pertimbangan empirik.

5. Uji Kecocokan Model


Tahap ini mirip dengan proses pengujian dalam analisis regresi
berganda. Ada tiga uji kecocokan yang harus dilakukan oleh kita, yakni
a. uji kecocokan keseluruhan (overall model fit)
b. uji kecocokan model pengukuran (measurement model fit)
c. uji kecocokan model struktural (structural model fit)

Ketiganya dilakukan secara bertahap, mulai dari uji keseluruhan, uji


model pengukuran, dan uji model struktural. Untuk itu, kita akan
membahasnya tahapan-tahapan tersebut.

6. Uji Kecocokan Keseluruhan


Uji kecocokan keseluruhan model dilakukan untuk mengevaluasi derajat
kecocokan secara umum atau diistilahkan dengan Goodness Of Fit (GOF)
antara data dengan model. Namun dalam SEM, pengujian sedikit berbeda
dengan yang dilakukan dalam regresi berganda ataupun MANOVA, karena
mengevaluasi kecocokan model keseluruhan secara langsung dalam SEM
tidak dapat dilakukan. Sebagai gantinya kita dapat menggunakan uji
Goodness Of Fit Indicates (GOFI) yang dapat digunakan. Dan sampai
sekarang hal ini masih menjadi bahan perdebatan. Namun demikian, ada
beberapa konsensus yang dapat kita pegang dalam melakukan pengujian
model overall ini, yakni
Secara ringkas, keseluruhan uji kecocokan dalam SEM dapat dilihat
pada tabel berikut Wijayanto (Wijayanto, 2008)
9.66 Statistika Pendidikan 

Tabel 9.3
Perbandingan Ukuran-Ukuran GOF

UKURAN GOF Tingkat Kecocokan yang Bisa Diterima


ABSOLUTE- FIT MEASURE
Statistic Chi-Square (2) Mengikuti uji statistik yang berkaitan dengan
persayaratan signifikan. Semakin kecil semakin baik.
Non-Centrality parameter Dinyatakan dalam bentuk spesifikasi ulang dari Chi-
(NCP) Square. Penilaian didasarkan atas perbandingan dengan
model lain. Semakin kecil makin baik
Scale NCP (SNCP) NCP yang dinyatakan dalam bentuk rata-rata
perbedaan setiap observasi dalam rangka perbandingan
antar model. Semakin kecil makin baik
Goodness-of-Fit Index Nilai berkisar antara 0 – 1, dengan nilai lebih tinggi
(GFI) adalah lebih baik. GFI  0,90 adalah good-fit,
sedangkan 0,8  GFI < 0,90 adalah marginal fit.
Root Mean Square Residual rata-rata antara matriks (korelasi atau
Residual (RMR) kovarian) teramati dan hasil estimasi. Standardized
RMR  0,05 adalah good fit
Root Mean Square Error of Rata-rata perbedaan per degree of freedom yang
Aproximation (RMSEA) diharapkan terjadi dalam populasi dan bukan dalam
sampel. RMSEA  0,08 adalah good fit, sedang
RMSEA < 0,05 adalah closed fit
Expected Cross- Validation Digunakan untuk perbandingan antar model. Semakin
Index (ECVI) kecil makin baik. Pada model tunggal, nilai ECVI dari
model yang mendekati nilai saturated ECVI
menunjukkan good fit

INCREMENTAL FIT MEASURES


Tucjer-Lewis Index atau Nilai berkisar antara 0 – 1, dengan nilai lebih tinggi
Non-Normed Fit Index adalah lebih baik. TLI  0,90 adalah good-fit, sedang
(TLI atau NNFI) 0,80  TLI < 0,90 adalah marginal fit
Normed Fit Index (NFI) Nilai berkisar antara 0 – 1, dengan nilai lebih tinggi
adalah lebih baik. NFI  0,90 adalah good-fit, sedang
0,80  NFI < 0,90 adalah marginal fit
Adjusted Goodness of Fit Nilai berkisar antara 0 – 1, dengan nilai lebih tinggi
Index (AGFI) adalah lebih baik. AGFI  0,90 adalah good-fit, sedang
0,80  AGFI < 0,90 adalah marginal fit
Relatif Fit Index (RFI) Nilai berkisar antara 0 – 1, dengan nilai lebih tinggi
adalah lebih baik. RFI  0,90 adalah good-fit, sedang
0,80  RFI < 0,90 adalah marginal fit
Incremental Fit Index (IFI) Nilai berkisar antara 0 – 1, dengan nilai lebih tinggi
adalah lebih baik. IFI  0,90 adalah good fit, sedang
0,80  IFI < 0,90 adalah marginal fit
 MPDR5202/MODUL 9 9.67

Comparative Fit Index Nilai berkisar antara 0 – 1, dengan nilai lebih tinggi
(CFI) adalah lebih baik. CFI  0,90 adalah good fit, sedang
0,80  CFI < 0,90 adalah marginal fit
PARSIMONIOUS FIT MEASURES
Parsiomiuous Goodness of Spesifikasi ulang dari GFI, dimana nilai yang lebih
Fit (PGFI) tinggi menunjukkan parsimoni yang lebih besar.
Ukuran ini digunakan untuk perbandingan di antara
model-model
Normed Chi-Square Rasio antara Chi-Square dengan degree of freedom.
Nilai yang disarankan: batas bawah: 1,0, batas atas: 2,0
atau 3,0 dan yang lebih longgar 5,0
Parsimonious Normed Fit Nilai tinggi menunjukkan kecocokan lebih baik, hanya
Index (PNFI) digunakan untuk perbandingan antar model alternatif
Akaike Information Nilai positif lebih kecil menunjukkan parsimoni lebih
Criterion (AIC) baik. Digunakan untuk perbandingan antar model.
Pada model tunggal, AIC dari model yang mendekati
nilai saturated AIC menunjukkan good fit
Consistent Akaike Nilai positif lebih kecil menunjukkan parsimoni lebih
Information Criterion baik. Digunakan untuk perbandingan antar model.
(CAIC) Pada model tunggal, NAIC dari model yang mendekati
nilai saturated NAIC menunjukkan good fit
OTHER GOFI
Critical ”N” (CN) CN  200 menunjukkan ukuran sampel mencukupi
untuk digunakan mengestimasi model. Kecocokan
yang memuaskan atau baik

E. ASUMSI DALAM SEM

Sebagaimana dalam uji statistika lainnya, sebelum kita melakukan


analisis data dengan SEM diperlukan asumsi-asumsi. Asumsi-asumsi
tersebut menurut Kusnendi (2005) di antaranya adalah:

1. Skala Pengukuran Data Minimal Interval


Sebaiknya skala pengukuran dari data yang dianalisis dalam SEM
minimal interval. Sekalipun demikian, tidak seperti pada analisis jalur,
kesalahan model-model SEM yang eksplisit muncul karena penggunaan data
ordinal. Variabel-variabel eksogen berupa variabel-variabel dikotomi atau
dummy dan variabel dummy kategorial tidak boleh digunakan dalam
variabel-variabel endogen. Penggunaan data dengan skala nominal atau
ordinal akan mengecilkan koefisien matriks korelasi yang digunakan dalam
SEM.
9.68 Statistika Pendidikan 

2. Distribusi Data harus Menyebar Normal


Sebaran data dari variabel-variabel yang diuji harus mengikuti sebaran
normal. Uji normalitas yang dilakukan pada SEM mempunyai dua tahapan.
Pertama menguji normalitas untuk setiap variabel, sedangkan tahap kedua
adalah pengujian normalitas semua variabel secara bersama-sama yang
disebut dengan multivariate normality. Hal ini disebabkan jika setiap variabel
normal secara individu, tidak berarti jika diuji secara bersama (multivariat)
juga pasti berdistribusi normal.

3. Ukuran Sampel (n-size)


Pada umumnya dikatakan penggunaan SEM membutuhkan jumlah
sampel yang besar. Ada yang berpendapat bahwa ukuran sampel untuk
pengujian model dengan menggunakan SEM adalah antara 100-200 sampel
atau tergantung pada jumlah parameter yang digunakan dalam seluruh
variabel laten, yaitu jumlah parameter dikalikan 5 sampai 10. Satu survei
terhadap penelitian yang menggunakan SEM didapatkan median ukuran
sampel sebanyak 198. Untuk itu jumlah sampel sebanyak 200 data pada
umumnya dapat diterima sebagai sampel yang representatif pada analisis
SEM.

a. Multicolinnearity dan Singularity


Suatu model dapat secara teoritis diidentififikasi tetapi tidak dapat
diselesaikan karena masalah-masalah empiris. Untuk itu dalam SEM
dianjurkan tidak ada multikolinearitas sempurna di antara variabel eksogen.
1) Semua variabel mempunyai hubungan yang linear.
2) Tidak ada pencilan atau outlier, yakni data yang memiliki nilai ekstrim
bidal dibandingkan dengan nilai yang lainnya.

Contoh 9.2
Contoh yang disajikan diambil dari Schumacker dan Lomax yang diambil
dalam Kusnedi (2004). Schumacker dan Lomax meneliti hubungan antara
home bacground (HOME), ability, (ABILITY), aspirations (ASPIRATION)
dan achivement (ACHIEVE) dengan hubungan teoritisnya adalah sebagai
berikut.
 MPDR5202/MODUL 9 9.69

1
Farminc EdAsp

ASPIRA
FaEd HOME TION

OccAsp

MoEd

VerbAch
VerbAb

ABILI ACHI
TY EVE
Quant Quant
Ab Ach

2

Misalkan hasil pengumpulan data dari sampel 200 responden diperoleh


infromasi awal matriks kovarian sebagai berikut.

EdAsp OccAsp VerbAch QuantAch Faminc FaEd MoEd VerbAb QuantAb


EdAsp 1,024
OccAsp 0,792 1,077
VerbAch 1,027 0,919 1,844
QuantAch 0,756 0,697 1,244 1,286
Faminc 0,567 0,537 0,876 0,636 0,852
FaEd 0,445 0,424 0,677 0,526 0,518 0,670
MoEd 0,434 0,389 0,635 0,498 0,475 0,545 0,716
VerbAb 0,580 0,564 0,893 0,716 0,546 0,422 0,373 0,851
QuantAb 0,491 0,499 0,888 0,646 0,508 0,389 0,339 0,629 0,871
9.70 Statistika Pendidikan 

Analisis data dimulai dengan membuka program LISREL. Klik FILE >
New, kemudian pilih Syntax only, klik OK. Layar monitor akan menunjukkan
sebagai berikut.

Gambar 9.18
Tampilan Awal Layar Kerja

Berdasarkan model yang telah dirumuskan dana data yang diperoleh kita
susun sintax di dalam kotak syntax sesuai dengan rumusan masalahnya.

Gambar 9.19
Input Program Kerja
 MPDR5202/MODUL 9 9.71

Save Syntax dengan cara Klik gambar, sehingga dimonitor tampil kota
dialog File Save As.Dalam kota File name isikan nama file dalam bentuk
ekstension SPL. Misalkan beri nama LATIHAN 1.SPL.
Kemudian Klikyang menunjukkan Run Lisrel untuk mengeksekusi
Syntax, maka hasilnya diperoleh output program SIMPLIS dalam bentuk
OUT dan PATH sebagai berikut.

a. Output rumusan sintaks yang dilakukan oleh kita adalah sebagai berikut

DATE: 3/ 7/2015
TIME: 21:17

L I S R E L 9.10 (STUDENT)

BY

Karl G. Jöreskog & Dag Sörbom

This program is published exclusively by


Scientific Software International, Inc.
http://www.ssicentral.com
Copyright by Scientific Software International, Inc., 1981-2012
Use of this program is subject to the terms specified in the
Universal Copyright Convention.

The following lines were read from file F:\UT\MODUL STATISTIKA\LATIHAN


1.SPL:

STUDI TENTANG HUBUNGAN ANTARA HOME BACKGROUND (HOME),ABILITY, ASPIRATION,


DAN ACHIEVEMENT (ACHIEVE).
OBSERVED VARIABEL EdAsp OccAsp VerbAch QuantAch Faminc FaEd MoEd VerbAb
QuantAb
Covariance matrix
1.024
.792 1.077
1.027 .919 1.844
.756 .697 1.244 1.286
.567 .537 .876 .636 .852
.445 .424 .677 .526 .518 .670
.434 .389 .635 .498 .475 .545 .716
.580 .564 .893 .716 .546 .422 .373 .851
.491 .499 .888 .646 .508 .389 .339 .629 .871
sample size 200
Latent variable ASPIRATION ACHIEVE HOME ABILITY
Equation
EdAsp OccAsp = ASPIRATION
VerbAch QuantAch = ACHIEVE
VerbAb QuantAb = ABILITY
Faminc FaEd MoEd = HOME
ASPIRATION = HOME ABILITY
ACHIEVE = ASPIRATION ABILITY
Path Diagram
End of Problem
9.72 Statistika Pendidikan 

Penjelasan:
Keluaran ini sesuai dengan apa yang kita tulis dalam syntax. Kita perlu
memeriksa apakah semuanya sintax sudah sesuai atau belum dengan yang
diinginkan.

b. Data input yang dianalisis.


Sample Size = 200

STUDI TENTANG HUBUNGAN ANTARA HOME BACKGROUND (HOME,ABILITY, ASPIRATION,


DAN A

Covariance Matrix

EdAsp OccAsp VerbAch QuantAch Faminc FaEd


----- ------ -------- -------- -------- -------
EdAsp 1.024
OccAsp 0.792 1.077
VerbAch 1.027 0.919 1.844
QuantAch 0.756 0.697 1.244 1.286
Faminc 0.567 0.537 0.876 0.636 0.852
FaEd 0.445 0.424 0.677 0.526 0.518 0.670
MoEd 0.434 0.389 0.635 0.498 0.475 0.545
VerbAb 0.580 0.564 0.893 0.716 0.546 0.422
QuantAb 0.491 0.499 0.888 0.646 0.508 0.389

Covariance Matrix

MoEd VerbAb QuantAb


-------- -------- --------
MoEd 0.716
VerbAb 0.373 0.851
QuantAb 0.339 0.629 0.871

Total Variance = 9.191 Generalized Variance = 0.673631D-03

Largest Eigenvalue = 6.250 Smallest Eigenvalue = 0.138

Condition Number = 6.735

Penjelasan.
Output pertama dari LISREL adalah matriks korelasi yang telah kita
masukkan. Pada akhir penulisan ada istilah Total Variance, generalize
varians, serta nilai eigen maksimum dan minimum. Hasil di atas merupakan
pencocokkan matriks kovarians dari variabel teramati dengan matriks
kovarian model. Matriks kovarians teramati dan ukuran sampel dituliskan
pada hasil output di atas. Total varians maksudnya adalah jumlah dari elemen
diagonal utama matriks kovarians, sedangkan generalized variance dihitung
dari nilai determinan matriks kovarians. Nilai eigen merupakan nilai
karakteristik dari matriks kovarins. Nilai eigen ini mempunyai peran penting
dalam statistika multivariate.
 MPDR5202/MODUL 9 9.73

c. Estimasi LISREL
STUDI TENTANG HUBUNGAN ANTARA HOME BACKGROUND (HOME),ABILITY, ASPIRATION,
DAN A

Number of Iterations = 11

LISREL Estimates (Maximum Likelihood)

Measurement Equations

EdAsp = 0.927*ASPIRATI, Errorvar.= 0.165 , R² = 0.839


Standerr (0.0407)
Z-values 4.067
P-values 0.000

OccAsp = 0.851*ASPIRATI, Errorvar.= 0.353 , R² = 0.673


Standerr (0.0591) (0.0473)
Z-values 14.409 7.451
P-values 0.000 0.000

VerbAch = 1.281*ACHIEVE, Errorvar.= 0.203 , R² = 0.890


Standerr (0.0513)
Z-values 3.966
P-values 0.000

QuantAch = 0.971*ACHIEVE, Errorvar.= 0.343 , R² = 0.733


Standerr (0.0535) (0.0437)
Z-values 18.154 7.849
P-values 0.000 0.000

Faminc = 0.729*HOME, Errorvar.= 0.321 , R² = 0.623


Standerr (0.0564) (0.0396)
Z-values 12.909 8.115
P-values 0.000 0.000

FaEd = 0.736*HOME, Errorvar.= 0.128 , R² = 0.808


Standerr (0.0469) (0.0246)
Z-values 15.698 5.225
P-values 0.000 0.000

MoEd = 0.703*HOME, Errorvar.= 0.222 , R² = 0.690


Standerr (0.0505) (0.0301)
Z-values 13.911 7.383
P-values 0.000 0.000

VerbAb = 0.806*ABILITY, Errorvar.= 0.201 , R² = 0.763


Standerr (0.0542) (0.0345)
Z-values 14.883 5.841
P-values 0.000 0.000

QuantAb = 0.771*ABILITY, Errorvar.= 0.277 , R² = 0.683


Standerr (0.0562) (0.0380)
Z-values 13.731 7.286
P-values 0.000 0.000
9.74 Statistika Pendidikan 

Structural Equations

ASPIRATI = 0.328*HOME + 0.509*ABILITY, Errorvar.= 0.384, R² = 0.616


Standerr (0.103) (0.106) (0.0668)
Z-values 3.186 4.811 5.754
P-values 0.001 0.000 0.000

ACHIEVE = 0.434*ASPIRATI + 0.561*ABILITY, Errorvar.= 0.129,R²=0.871


Standerr (0.0822) (0.0825) (0.0354)
Z-values 5.286 6.806 3.632
P-values 0.000 0.000 0.000

NOTE: R² for Structural Equations are Hayduk's (2006) Blocked-ErrorR²

Penjelasan
Bagian ini memuat informasi hasil estimasi dari berbagai parameter model,
yakni elemen dari matriks X, Y, , , , , , dan  yang disajikan
dalam bentuk persamaan. Estimasi LISREL memuat dua model, yakni model
pengukuran dan model struktural. Model pengukuran adalah persamaan yang
menghubungkan antara variabel laten dengan variabel manifestnya. Dalam
setiap persamaan dilengkapi dengan statistik uji untuk masing-masing
koefisien, serta koefisien determinasi.
Model Pengukuran (measurement equations)
Sebagai contoh untuk variabel laten ASPIRATION (ASPIRATI)

EdAsp= 0.927*ASPIRATI, Errorvar.= 0.165, R²= 0.839


Standerr (0.0407)
Z-values 4.067
P-values 0.000

Koefisien bobot faktornya variabel manifest EdAsp terhadap variabel laten


ASPIRATI adalah 0,927 dengan kesalahannya adalah 0,0407 nilai Z
hitungnya 4,067 dengan tingkat signifikansi penolakan H adalah 0,000.
Artinya koefisien tersebut sangat berarti atau variabel manifest EdAsp sangat
baik dalam menggambarkan variabel laten ASPIRATI. Koefisien determinasi
R2 = 0,839 menunjukkan bahwa 83,9% variabel manifest EdAsp
mencerminkan variabel laten ASPIRATI, angka ini juga sering digunakan
sebagai ukuran reliabilitas variabel manifest. Untuk Error variance,
komponen ini menunjukkan hasil estimasi varians dari kesalahan pengukuran
atau hasil estimasi dari parameter-parameter elemen matriks diagonal  dan
.
 MPDR5202/MODUL 9 9.75

Persamaan Model Struktural (structural equations)


Misalkan untuk variabel ASPIRATI merupakan variabel endogen dan HOME
serta ABILITY merupakan variabel eksogen. Hasil perhitungan diperoleh
persamaan berikut.

ASPIRATI = 0.328*HOME + 0.509*ABILITY, Errorvar.= 0.384 , R² = 0.616


Standerr (0.103) (0.106) (0.0668)
Z-values 3.186 4.811 5.754
P-values 0.001 0.000 0.000

Besarnya koefisien jalur dari HOME ke ASPIRATI adalah 0,328, dan dari
ABILITY ke ASPIRATI sebesar 0,509 dengan nilai kesalahan standar
masing-masingnya adalah 0,103 dan 0,106. Secara umum hasil pengujian
modelnya memberikan nilai Z = 5,754 dengan probabilitas penolakan
hipotesis nolnya 0,000 yang jauh lebih kecil dari 0,05. Dengan demikian
minimal ada satu variabel eksogen (HOME atau ABILITY) berpengaruh
terhadap variabel endogen ASPIRATI. Dari hasil pengujian terhadap
koefisien jalur secara individual diperoleh nilai Z masing-masing 3,186 dan
4,811 dengan probabilitas penolakan Ho bagi keduanya berturut-turut 0,001
dan 0,000. Jika kita pilih taraf nyata 0,05 maka keduanya jauh lebih kecil dari
0,05. Artinya Ho ditolak, atau dapat disimpulkan bahwa secara individual
kedua variabel eksogen berpengaruh terhadap variabel endogen. Nilai
koefisien determinasi R2 = 0,616 menurut Joreskog (Wijayanto, 2008) pada
persamaan struktural tidak mempunyai interpretasi yang jelas. Untuk
menginterpretasikan R2 seperti halnya pada persamaan regresi kita harus
mengambilnya dari reduce form equations. Dengan demikian, kita tidak
dapat mengiterpretasi R2 = 0,616 pada persamaan struktural di atas.

d. Reduced form Equation


Output ini merupakan bentuk yang lebih sederhana dari persamaan
struktural dimana pada sisi sebelah kanan persamaan hanya memuat variabel
laten eksogen. Persamaan yang terbentuk dalam reduced form equations
diturunkan dari persamaan struktural melalui substitusi.
Kita mulai dari persamaan strukturalnya sebagai berikut
9.76 Statistika Pendidikan 

Structural Equations

ASPIRATI = 0.328*HOME + 0.509*ABILITY, Errorvar.= 0.384 , R² = 0.616


Standerr (0.103) (0.106) (0.0668)
Z-values 3.186 4.811 5.754
P-values 0.001 0.000 0.000

ACHIEVE = 0.434*ASPIRATI + 0.561*ABILITY, Errorvar.= 0.129 , R² = 0.871


Standerr (0.0822) (0.0825) (0.0354)
Z-values 5.286 6.806 3.632
P-values 0.000 0.000 0.000

Kemudian substitusikan persamaan pertama ke persamaan kedua,


diperoleh

ACHIEVE = 0.434(0.328*HOME + 0.509*ABILITY) + 0.561*ABILITY,

Sehingga diperoleh persamaan baru, yakni

ACHIEVE = 0.142*HOME + 0.782*ABILITY

Akibatnya kita peroleh hasil sebagai berikut


Reduced Form Equations

ASPIRATI = 0.328*HOME + 0.509*ABILITY, Errorvar.= 0.384, R² = 0.616


Standerr (0.103) (0.106)
Z-values 3.186 4.811
P-values 0.001 0.000

ACHIEVE = 0.142*HOME + 0.782*ABILITY, Errorvar.= 0.201, R² = 0.799


Standerr (0.0559) (0.0773)
Z-values 2.546 10.119
P-values 0.011 0.000

Perhatikan ada perbedaan nilai koefisien determinasi dari persamaan dengan


variabel endogen Achive.

e. Matriks Korelasi antar variabel Laten Eksogen

Correlation Matrix of Independent Variables

HOME ABILITY
-------- --------
HOME 1.000

ABILITY 0.747 1.000


(0.042)
17.660
 MPDR5202/MODUL 9 9.77

Penjelasan
Matriks kovarians dari variabel independen adalah matriks kovarians dari
variabel eksogen (), yaitu matriks . Dalam contoh di atas ada dua variabel
eksogen yakni Home dan Ability.

f. Matriks Korelasi antar Variabel Laten

Covariance Matrix of Latent Variables

ASPIRATI ACHIEVE HOME ABILITY


-------- -------- -------- --------
ASPIRATI 1.000
ACHIEVE 0.857 1.000
HOME 0.708 0.727 1.000
ABILITY 0.754 0.889 0.747 1.000

Log-likelihood Values

Estimated Model Saturated Model


--------------- ---------------
Number of free parameters(t) 23 45
-2ln(L) 400.103 339.435
AIC (Akaike, 1974)* 446.103 429.435
BIC (Schwarz, 1978)* 521.964 577.859

*LISREL uses AIC= 2t - 2ln(L) and BIC = tln(N)- 2ln(L)

Penjelasan
Matriks yang diperoleh dari perhitungan di atas merupakan matrik dari
variabel laten ( dan ) yang ada dalam model. Dalam contoh ini ada 4
variabel latent, yakni ASPIRATI, ACHIEVE, HOME, dan ABILITY. Kita
lihat bahwa variabel HOME dan ABILITY mempunyai dua fungsi, sebagai
variabel eksogen dan variabel latent.

g. Uji Kesesuaian Model


Goodness of Fit Statistics

Degrees of Freedom for (C1)-(C2) 22


Maximum Likelihood Ratio Chi-Square (C1) 60.668 (P = 0.0000)
Browne's (1984) ADF Chi-Square (C2_NT) 61.987 (P = 0.0000)
Estimated Non-centrality Parameter (NCP) 38.668
90 Percent Confidence Interval for NCP 19.206 ; 65.781)

Minimum Fit Function Value 0.303


Population Discrepancy Function Value (F0) 0.193
90 Percent Confidence Interval for F0 (0.0960 ; 0.329)
Root Mean Square Error of Approximation (RMSEA) 0.0937
90 Percent Confidence Interval for RMSEA (0.0661 ; 0.122)
P-Value for Test of Close Fit (RMSEA < 0.05) 0.00629
9.78 Statistika Pendidikan 

Expected Cross-Validation Index (ECVI) 0.533


90 Percent Confidence Interval for ECVI (0.436 ; 0.669)
ECVI for Saturated Model 0.450
ECVI for Independence Model 13.723

Chi-Square for Independence Model (36 df) 2726.611

Normed Fit Index (NFI) 0.978


Non-Normed Fit Index (NNFI) 0.976
Parsimony Normed Fit Index (PNFI) 0.597
Comparative Fit Index (CFI) 0.986
Incremental Fit Index (IFI) 0.986
Relative Fit Index (RFI) 0.963

Critical N (CN) 133.155

Root Mean Square Residual (RMR) 0.0501


Standardized RMR 0.0506
Goodness of Fit Index (GFI) 0.936
Adjusted Goodness of Fit Index (AGFI) 0.868
Parsimony Goodness of Fit Index (PGFI) 0.457

Penjelasan:
Bagian ini merupakan ukuran Goodness of Fit (GOFI) yang dapat digunakan
untuk menguji kecocokan keseluruhan model (overall). Dalam perhitungan di
atas, terdapat beberapa kelompok pengujian kecocokan, yaitu:
Kelompok 1 : Chi-Square
Kelompok 2 : RMSEA
Kelompok 3 : ECVI
Kelompok 4 : NFI, NNFI, PNFI, CFI, IFI, dan RFI
Kelompok 5 : Critical N (CN)
Kelompok 6 : RMR, Standardized RMR, GFI, AGFI, dan PGFI.

Kelompok 1

Degrees of Freedom for (C1)-(C2) 22


Maximum Likelihood Ratio Chi-Square (C1) 60.668 (P = 0.0000)
Browne's (1984) ADF Chi-Square (C2_NT) 61.987 (P = 0.0000)
Estimated Non-centrality Parameter (NCP) 38.668
90 Percent Confidence Interval for NCP (19.206 ; 65.781)

Nilai Chi-Square hasil pengujian kecocokan adalah 60,668 yang cukup besar
sehingga penolakan hipotesis nolnya, p-value = 0,000 < 0,05, maka
kecocokannya kurang baik (yang diinginkan adalah p-value > 0,05, sehingga
hipotesis nol diterima).
Kemudian nilai NCP = 38,668 yang cukup besar dengan p-value = 0,000
dan 90% tingkat kepercayaan dari NCP = (19,206 ; 65,781) yang cukup
 MPDR5202/MODUL 9 9.79

lebar, sehingga kecocokan modle keseluruhannya kurang baik. Hasil uji ini
sesuai dengan uji Ch-Square di atas.

Kelompok 2

Minimum Fit Function Value 0.303


Population Discrepancy Function Value (F0) 0.193
90 Percent Confidence Interval for F0 (0.0960 ; 0.329)
Root Mean Square Error of Approximation (RMSEA) 0.0937
90 Percent Confidence Interval for RMSEA (0.0661 ; 0.122)
P-Value for Test of Close Fit (RMSEA < 0.05) 0.00629

Nilai RMSEA dari model yang diuji adalah 0,0937 yang lebih besar dari
0,08, sehingga kecocokan keseluruhan model kurang baik. (catatan RMSA 
0,05 adalah close fit dan 0,05 < RMSE  0,08 adalah good fit).
Hasil di atas didukung nilai P-value RMSEA adalah 0,00629 < 0,05
yang menunjukkan model keseluruhan kurang baik (p-value RMSEA yang
diinginkan adalah lebih besar dari 0,05).

Kelompok 3

Expected Cross-Validation Index (ECVI) 0.533


90 Percent Confidence Interval for ECVI (0.436 ; 0.669)
ECVI for Saturated Model 0.450
ECVI for Independence Model 13.723

Pengujian ECVI digunakan untuk perbandingan model. Kita bisa


membandingkan antara ECVI model = 0,533 dengan ECVI saturated model
= 0,450 dan ECVI independent model = 13,723. Dari perbandingan ketiga
nilai di atas terlihat bahwa ECVI model lebih dekat ke ECVI saturated
model, dengan demikian dapat disimpulkan bahwa dari pengujian ECVI,
kecocokan keseluruhan model adalah baik. (catatan : ECVI saturated model
mewakili best fit dan ECVI Independence model mewakili worst fit. Untuk
itu kita menginginkan ECVI Model lebih dekat ke ECVI saturated model).

Kelompok 4

Normed Fit Index (NFI) 0.978


Non-Normed Fit Index (NNFI) 0.976
Parsimony Normed Fit Index (PNFI) 0.597
Comparative Fit Index (CFI) 0.986
Incremental Fit Index (IFI) 0.986
Relative Fit Index (RFI) 0.963
9.80 Statistika Pendidikan 

Pengujian kelompok 4 ini menggunakan batas 0,90 atau dikenal dengan


“magic 0,90” (kecuali PNFI). Artinya jika nilai stastitik ujinya lebih besar
atau sama dengan 0,90, maka keseluruhan model adalah baik. Nilai NFI
(Normed Fit Index) hasil pengujian adalah 0,978  0,90 artinya kecocokan
keseluruhan model adalah baik. Kedua NNFI = 0,976  0,90 menyimpulkan
kecocokan keseluruhan model baik, ketiga CFI = 0,986  0,90
menyimpulkan kecocokan keseluruhan model baik, keempat IFI = 0,986 
0,90 menyimpulkan kecocokan keseluruhan baik, dan RFI = 0,963  0,90
juga menyimpulkan kecocokan keseluruhan model baik. Adapun PNFI
digunakan untuk perbandingan model-model alternatif.

Kelompok 5

Critical N (CN) 133.155

Nilai CN = 133,155  200 menunjukkan bahwa sebuah model kurang baik


dalam merepresentasikan data sampel. Atau ukuran sampel dalam
pengolahan data ini kurang mencukupi untuk menghasilkan model fit
menggunakan Chi-Square. Hoelter (Wijayanto, 2008) mengusulkan nilai CN
 200 merupakan indikasi bahwa sebuah kecocokan yang baik atau
memuaskan dicapai.

Kelompok 6

Root Mean Square Residual (RMR) 0.0501


Standardized RMR 0.0506
Goodness of Fit Index (GFI) 0.936
Adjusted Goodness of Fit Index (AGFI) 0.868
Parsimony Goodness of Fit Index (PGFI) 0.457

Kelompok pengujian ini ada 4, yakni RMR, GFI, AGFI dan PGFI. Nilai
dari standaridized RMR = 0,0506  0,05, artinya kecocokan keseluruhan
model cukup baik (catatan model kococokan keseluruhan model adalah baik,
jika nilai standardizednya  0,05). Dalam kasus nilainya hampir sama, jadi
dapat dikatakan cukup baik. Nilai GFI = 0,936  0,90 artinya kecocokan
keseluruhan model adalah baik. AGFI = 0,868  0,90 kecocokan keseluruhan
model kurang baik. Dan PGFI = 0,457 digunakan untuk perbandingan model.
Hasil dari uji kecocokan di atas dapat dirangkum sebagai berikut.
 MPDR5202/MODUL 9 9.81

Tabel 9.4
Hasil Uji Kecocokan Keseluruhan Model

Target Tingkat Tingkat


No Ukuran GOF Hasil Estimasi
Kecocokan Kecocokan
1 Chi-Square Nilai yang kecil 2 = 60,668 Kurang baik
P-value P > 0,05 p = 0,00
2 NCP Nilai yang kecil 38,668 Kurang baik
p = 0,00
3 RMSEA Nilai  0,08 0,0937 > 0,08 Kurang baik
P = 0,00629 <
0,05
4 ECVI Nilai yang kecil M = 0,533 Baik
dan dekat dengan S = 0,450
ECVI saturated I = 13,723
5 NFI NFI  0,90 0,978  0,90 Baik
6 NNFI NNFI  0,90 0,976  0,90 Baik
7 CFI CFI  0,90 0,986  0,90 Baik
8 IFI IFI  0,90 0,986  0,90 Baik
9 RFI RNFI  0,90 0,963  0,90 Baik
10 CN CN  200 133,155  200 Kurang Baik
11 RMR Standardized  Cukup Baik
0,05 0,0506
12 GFI GFI  0,90 0,936  0,90 Baik
13 AGFI AGFI  0,90 0,868 < 0,90 Kurang Baik

Dari tabel di atas terlihat bahwa terdapat 6 ukuran GOF yang


menunjukkan kecocokan kurang baik, dan 7 ukuran GOF menunjukkan
kecocokan yang baik. Dengan demikian dapat disimpulkan hasil kecocokan
keseluruhan model dapat dikatakan baik, walaupun perlu ditingkatkan.

h. Indikasi Modifikasi

The Modification Indices Suggest to Add the


Path to from Decrease in Chi-Square New Estimate
Faminc ABILITY 35.9 0.53
MoEd ABILITY 9.5 -0.25

The Modification Indices Suggest to Add an Error Covariance


Between and Decrease in Chi-Square New Estimate
FaEd Faminc 8.2 -0.09
MoEd Faminc 10.1 -0.10
MoEd FaEd 39.9 0.21
VerbAb VerbAch 8.9 -0.09

Time used 0.094 seconds


9.82 Statistika Pendidikan 

Penjelasan
Modification indices(indeksmodifikasi) merupakan informasi yang
disarankan oleh lisrel terhadap hasil perhitungan di atas agar diperoleh model
yang lebih baik. Dalam implementasinya, peneliti perlu mempertimbangkan
aspek teori yang mengaitkan variabel-variabel yang disarankan. Untuk kasus
di atas misalnya, 1) peneliti perlunya pengukuran error variance variabel
laten MoEd dikorelasikan dengan FaEd, sehingga dapat menurunkan chi-
square sebesar 39,9. Atau 2) dibuat jalur antara variabel manifes Faminc
dengan variabel laten ABILITY (variabel Faminc dijadikan sebagai indikator
dari variabel ABILITY), sehingga dapat menurunkan Chi-Square sebesar
35,9. Upaya ini perlu dijastifikasi secara teori oleh peneliti.
Analisis terakhir dari hasil pengolahan data melalui lisrel adalah
membaca grafik. Keluaran grafik ada berbagai jenis. Untuk keluaran bentuk
PTH ada tiga jenis yakni Estimates, Standard Solution, dan T-Values.
Jika pada kotak paling kanan kita pilih Estimates, maka bentuk keluaran
garfiknya adalah sebagai berikut.

Gambar 9.20
Diagram Lengkap Estimates dari Pengaruh HOME dan ABILITY terhadap
ASPIRATION dan ACHIEVEMENT

Jika pada kotak sebelah kanan kita pilih STANDARDIZED maka


keluarannya adalah sebagai berikut.
 MPDR5202/MODUL 9 9.83

Gambar 9.21
Diagram Lengkap Standardized
dari Pengaruh HOME dan ABILITY terhadap
ASPIRATION dan ACHIEVEMENT

Dan jika kita pilih T-Values, maka garifknya akan terlihat di bawah ini.

Gambar 9.22
Diagram Lengkap T-Values
dari Pengaruh HOME dan ABILITY terhadap
ASPIRATION dan ACHIEVEMENT
9.84 Statistika Pendidikan 

Pada diagram T-values, panah dari ASPIRATI ke EdAsp dan dari


ACHIEVE ke VerbAch tidak ada, hal ini disebabkan jalur tersebut tidak
berarti. Untuk lebih jelasnya kita kembali pada kedua persamaan pengukuran
di atas.

EdAsp = 0.927*ASPIRATI, Errorvar.= 0.165 , R² = 0.839


Standerr (0.0407)
Z-values 4.067
P-values 0.000

VerbAch = 1.281*ACHIEVE, Errorvar.= 0.203 , R² = 0.890


Standerr (0.0513)
Z-values 3.966
P-values 0.000

Dari kedua persamaan di atas terlihat bahwa nilai z dan p-value bagi
koefisien ASPIRATI dan ACHIEVE tidak ada. Dengan demikian, EdAsp
bukan indikator yang baik bagi ASPIRATION dan VerbAch juga bukan
indikator yang baik bagi ACHIEVEMENT.
Jika kita menginginkan grafik yang terpisah antara variabel laten
eksogen (X-Model) dan endogen (Y-Model) maupun model strukturalnya,
maka kita Klik Show Models pada Kota yang di tengah (BASIC MODEL),
kemudian pilih grafik yang kita inginkan.
Jika kita pilih X-MODEL, maka hasilnya adalah sebagai berikut.
 MPDR5202/MODUL 9 9.85

Gambar 9.23
Diagram Jalur Model Pengukuran Laten Eksogen

Dan jika kita pilih Y-MODEL, maka hasilnya adalah sebagai berikut

Gambar 9.24
Diagram Jalur Model Pengukuran Laten Endogen
9.86 Statistika Pendidikan 

Sedangkan apabila kita pilih STRUCTURAL MODEL, maka hasilnya


adalah sebagai berikut.

Gambar 9.25
Diagram Jalur Model Struktural

Untuk membacanya, silakan Anda lakukan sebagai latihan.

LAT IH A N

Untuk memperdalam pemahaman Anda mengenai materi di atas,


kerjakanlah latihan berikut!
1) Jelaskan apa yang dimaksud dengan variabel laten dan variabel teramati?
Kemudian berikan contohnya dalam penelitian pendidikan!
2) Jelaskan apa yang dimaksud dengan model struktural dan model
pengukuran? Berikan contohnya!
3) Perhatikan model rekursif yang dikembangkan oleh Mels (Wijayanto,
2008) berikut.
 MPDR5202/MODUL 9 9.87

Self1

Self2

Depresi SELFEST Self3


1
Depresi Self4
2
DEPRESS
Depresi Self5
3
Depresi
4 Implus
1
IMPULS Impuls
2
Impuls
3

Dimisalkan matriks korelasinya adalah sebagai berikut.


D1 D2 D3 D4 S1 S2 S3 S4 S5 I1 I2 I3
D1 1,00
D2 0,35 1,00
D3 0,45 0,64 1,00
D4 0,42 0,43 0,34 1,00
S1 -0,35 0,32 0,26 0,10 1,00
S2 0,25 0,10 0,12 0,19 0,47 1,00
S3 0,37 0,32 0,13 0,15 0,32 0,48 1,00
S4 0,28 0,25 0,25 0,22 0,30 0,29 0,39 1,00
S5 0,45 0,11 0,34 0,11 0,38 0,37 0,25 0,46 1,00
I1 0,48 0,21 0,23 0,19 0,20 0,10 0,28 0,48 0,26 1,00
I2 0,56 0,23 0,32 0,12 0,19 0,18 0,18 0,35 0,45 0,28 1,00
I3 -0,27 0,31 0,17 0,15 0,17 0,12 0,10 0,29 0,32 0,34 0,45 1,00

Catatan : data rekayasa


Lakukan analisis dengan menggunakan LISREL jika dimisalkan N= 250
9.88 Statistika Pendidikan 

Petunjuk Jawaban Latihan

1) Variabel laten adalah konsep abstrak yang menunjukkan suatu kategori


tertentu. Misalnya sikap, motivasi, self concept. Variabel teramati adalah
variabel yang dapat diukur secara empirik atau lebih mudahnya
indikator.
2) Model struktural menggambarkan hubungan-hubungan yang terjadi antar
variabel laten, eksogen dna endogen. Model pengukuran
menggambarkan indikator-indikator atau variabel-variabel terukur
sebagai efek atau refleksi dari variabel latennya.
3) Kita gunakan LISREL untuk perhitungan, hasilnya adalah sebagai
berikut.

Studi Hubungan antara DEPRESS, IMPULS, SELFEST


Number of Iterations = 15
LISREL Estimates (Maximum Likelihood)
Measurement Equations

I1 = 0.60*IMPULS, Errorvar.= 1.64 , R² = 0.18


(0.17)
9.68

I2 = 0.70*IMPULS, Errorvar.= 1.51 , R² = 0.25


(0.19) (0.18)
3.77 8.44

I3 = 0.66*IMPULS, Errorvar.= 1.57 , R² = 0.22


(0.18) (0.17)
3.73 9.00

S1 = 0.69*SELFEST, Errorvar.= 1.52 , R² = 0.24


(0.16)
9.75

S2 = 0.67*SELFEST, Errorvar.= 1.55 , R² = 0.23


(0.14) (0.16)
4.72 9.92

S3 = 0.56*SELFEST, Errorvar.= 1.69 , R² = 0.16


(0.13) (0.16)
4.27 10.78

S4 = 0.62*SELFEST, Errorvar.= 1.61 , R² = 0.19


(0.14) (0.16)
4.55 10.32

S5 = 0.46*SELFEST, Errorvar.= 1.78 , R² = 0.11


(0.12) (0.16)
3.78 11.28
 MPDR5202/MODUL 9 9.89

D1 = 0.64*DEPRESS, Errorvar.= 1.59 , R² = 0.21


(0.11) (0.16)
6.08 9.96

D2 = 0.72*DEPRESS, Errorvar.= 1.48 , R² = 0.26


(0.11) (0.16)
6.74 9.16

D3 = 0.76*DEPRESS, Errorvar.= 1.42 , R² = 0.29


(0.11) (0.16)
7.07 8.66

D4 = 0.53*DEPRESS, Errorvar.= 1.72 , R² = 0.14


(0.11) (0.16)
5.06 10.80

Structural Equations

IMPULS = 0.38*DEPRESS, Errorvar.= 0.85 , R² = 0.15


(0.13) (0.34)
2.88 2.49

SELFEST = 0.44*IMPULS + 0.43*DEPRESS, Errorvar.= 0.48 , R² = 0.52


(0.17) (0.13) (0.19)
2.66 3.24 2.48

Reduced Form Equations

IMPULS = 0.38*DEPRESS, Errorvar.= 0.85, R² = 0.15


(0.13)
2.88

SELFEST = 0.60*DEPRESS, Errorvar.= 0.64, R² = 0.36


(0.13)
4.70

Correlation Matrix of Independent Variables

DEPRESS
--------
1.00

Covariance Matrix of Latent Variables

IMPULS SELFEST DEPRESS


-------- -------- --------
IMPULS 1.00
SELFEST 0.61 1.00
DEPRESS 0.38 0.60 1.00

Goodness of Fit Statistics

Degrees of Freedom = 51
Minimum Fit Function Chi-Square = 129.99 (P = 0.00)
Normal Theory Weighted Least Squares Chi-Square = 111.89 (P = 0.00)
Estimated Non-centrality Parameter (NCP) = 60.89
90 Percent Confidence Interval for NCP = (34.11 ; 95.42)
9.90 Statistika Pendidikan 

Minimum Fit Function Value = 0.43


Population Discrepancy Function Value (F0) = 0.20
90 Percent Confidence Interval for F0 = (0.11 ; 0.32)
Root Mean Square Error of Approximation (RMSEA) = 0.063
90 Percent Confidence Interval for RMSEA = (0.047 ; 0.079)
P-Value for Test of Close Fit (RMSEA < 0.05) = 0.083

Expected Cross-Validation Index (ECVI) = 0.55


90 Percent Confidence Interval for ECVI = (0.47 ; 0.67)
ECVI for Saturated Model = 0.52
ECVI for Independence Model = 1.71

Chi-Square for Independence Model with 66 Degrees of Freedom = 485.94


Independence AIC = 509.94
Model AIC = 165.89
Saturated AIC = 156.00
Independence CAIC = 566.39
Model CAIC = 292.90
Saturated CAIC = 522.90

Normed Fit Index (NFI) = 0.73


Non-Normed Fit Index (NNFI) = 0.76
Parsimony Normed Fit Index (PNFI) = 0.57
Comparative Fit Index (CFI) = 0.81
Incremental Fit Index (IFI) = 0.82
Relative Fit Index (RFI) = 0.65

Critical N (CN) = 179.02

Root Mean Square Residual (RMR) = 0.12


Standardized RMR = 0.058
Goodness of Fit Index (GFI) = 0.94
Adjusted Goodness of Fit Index (AGFI) = 0.91
Parsimony Goodness of Fit Index (PGFI) = 0.62

The Modification Indices Suggest to Add an Error Covariance


Between and Decrease in Chi-Square New Estimate
D1 I1 33.9 -0.62
D1 S4 10.3 0.34
D1 S5 24.6 -0.53

Time used: 0.016 Seconds


 MPDR5202/MODUL 9 9.91

Diagram dari estimated model

Diagram dari t-value


9.92 Statistika Pendidikan 

R A NG KU M AN

Variabel dalam SEM terdiri dari variabel Laten (latent) dan Variabel
Teramati (observed/manifest/measured). Variabel laten merupakan
konstruk atau konsep abstrak. Variabel teramati adalah variabel yang
dapat diamati atau dapat diukur secara empiris dan sering disebut dengan
indikator.
Ada dua model struktural dan model pengukuran dan dua model
inilah yang diestimasi. Model struktural adalah model yang
menghubungkan variabel-variabel laten, dan umumnya bersifat linear.
Model pengukuran merupakan model yang menghubungkan antara
variabel teramati dengan variabel laten, di mana satu variabel teramati
hanya berhubungan dengan satu variabel laten.
Dua jenis kesalahan dalam SEM adalah kesalahan struktural dan
kesalahan pengukuran.
Bentuk SEM terdiri dari Hybrid Model, Path Model, dan CFA.
SEM merupakan salah satu teknik analisis data multivariate tingkat
lanjut dengan prosedur komputasinya dilakukan secara iterative.
Pengujian pada SEM dilakukan terhadap kecocokan keseluruhan
model, kecocokan model pengukuran dan kecocokan model struktural.
Pengujian keseluruhan model diistilahkan dengan GOF (Goodness Of
Fit). GOF terdiri dari beberapa statistik uji, di antaranya Chi-Square,
NCP, SNCP, GFI, RMR, RMSEA, dan ECVI.
Karena proses perhitungan dalam SEM cukup kompleks, maka
diperlukan pengolah data, di antaranya lisrel.

TES F OR M AT IF 2

Pilihlah satu jawaban yang paling tepat!

1) Dalam lisrel, apa yang dimaksud dengan:


a. 
b. 
c. 
d. 
2) Misalkan seorang peneliti mempunyai model kausalitas dari Status
ekonomi (SES), Locus of control (LOC), dan Aspiration (ASP)
sebagaimana terlihat pada grafik di bawah. Dan sebagai tambahan, LOC
dihipotesikan berpengaruh terhadap ASP.
 MPDR5202/MODUL 9 9.93

X2 X2 2
1

4 3

SES
1

2

1 2 3
Y2

2

SAS

2 LOC P
1 2

6
5 1

Y2 2 Y2 4
1 Y2

Korelasi antar variabelnya adalah sebagai berikut.


Y1 Y2 Y3 Y4 X1 X2
Y1 1,00
Y2 0,70 1,00
Y3 0,60 0,60 1,00
Y4 0,58 0,52 0,80 1,00
X1 0,30 0,32 0,20 0,25 1,00
X2 0,37 0,30 0,30 0,30 0,50 1,00

Dengan simpangan baku masing-masing variabelnya adalah:


sY1  3,67 ; sY2  2,16 ; sY3  1,32 ; sY4  1,73 sX1  2,62 ; sX 2  2,13
Gunakanlah Lisrel untuk menganalisisnya (N = 300)

3) Misalkan pada studi keunggulan bersaing berkelanjutan seorang peneliti


menetapkan 4 variabel dengan kaitan sebagai berikut.
9.94 Statistika Pendidikan 

Derajat
Orientasi
Pasar

Kinerja Keunggulan
Pemasaran bersaing
berkelanjutan

Strategi
Promosi

Dengan operasional variabel sebagaimana terlihat pada tabel berikut.


Konstruk/laten variabel Indikator (Variabel teramati)
Derajat Orientasi Informasi pelanggan (X1)
Informasi pesaing (X2)
Koordinasi Lintas fungsi (X3)
Strategi Promosi Jumlah tayangan iklan (X4)
Kinerja Pemasaran Volume Penjualan (Y1)
Pertumbuhan pelanggan (Y2)
Pertumbuhan sale (Y3)
Keunggulan bersaing Durabilitas (Y4)
berkelanjutan Imitabilitas (Y5)
Kemudahan menyamai (Y6)

Dan korelasi antar variabelnya adalah sebagai berikut.

X1 X2 X3 X4 Y1 Y2 Y3 Y4 Y5 Y6
X1 1,000
X2 0,149 1,000
X3 0,154 0,699 1,000
X4 0,194 0,658 0,664 1,000
Y1 0,226 0,072 0,040 0,163 1,000
Y2 0,460 0,258 0,263 0,160 0,377 1,000
Y3 0,357 0,153 0,232 0,055 0,385 0,473 1,000
Y4 0,353 0,094 0,131 0,029 0,305 0,368 0,479 1,000
Y5 0,309 0,067 0,114 0,032 0,114 0,262 0,399 0,759 1,000
Y6 0,406 0,114 0,128 0,101 0,348 0,330 0,416 0,815 0,778 1,000
 MPDR5202/MODUL 9 9.95

a. Dilihat dari indikator-indikatornya, bagaimanakah karakteristik dari


derajat orientasi pasar, strategi promosi, kinerja pemasaran, dan
keunggulan bersaing berkelanjutan?
b. Apakah kinerja pemasaran dipengaruhi oleh derajat orientasi pasar
dan strategi pemasaran?
c. Apakah keunggulan bersaing berkelanjutan dipengaruhi oleh
konerja pemasaran?

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang


terdapat di bagian akhir modul ini. Masing-masing nomor soal mempunyai
skor 23 kecuali nomor soal 3 dengan skor 34. Hitunglah jawaban yang benar.
Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan
Anda terhadap materi Kegiatan Belajar 2.

Jumlah Jawaban yang Benar


Tingkat penguasaan =  100%
Jumlah Soal

Arti tingkat penguasaan: 90 - 100% = baik sekali


80 - 89% = baik
70 - 79% = cukup
< 70% = kurang

Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat


meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 3, terutama bagian yang
belum dikuasai.
9.96 Statistika Pendidikan 

Kunci Jawaban Tes Formatif

Test Formatif 1

1) Berdasarkan hipotesis
a. Sosio ekonomi berpengaruh terhadap need achievement dan juga
GPA.
b. IQ berpengaruh terhadap terhadap need achievement dan GPA.
c. Need achievement berpengaruh terhadap GPA.
d. Sosio ekonomi berkorelasi dengan IQ.
Maka diagram jalurnya adalah sebagai berikut
SES N Ach

IQ GPA

1 2 3 Y
SES IQ n Ach GPA
1 1,00 0,30 0,41 0,33
2 1,00 0,16 0,57
3 1,00 0,50
Y 1,00
Dari diagram di atas, terlihat ada dua variabel endogen, yakni N ach dan
GPA. Dengan demikian, model struktur tersebut memuat dua sub
struktur. Keduanya adalah sebagai berikut.

SES N SES N
Ach Ach

IQ IQ GPA

Sub Struktur 1 Substruktur 2


 MPDR5202/MODUL 9 9.97

Kita mulai perhitungan dari substruktur 1 dengan model

NAch  p N 1 SES  p N 2 IQ .

Matriks korelasinya adalah sebagai berikut.


1 2
SES IQ
1 1,00 0,30
2 1,00

Atau R   1,00 0,30  dan dapat dihitung inversnya adalah sebagai


1  0,30 1,00 
 
berikut.
 1,099 0,33  . Dari kedua matriks tersebut kita dapat
R11   
  0,33 1,099 
menghitung koefisien pada substruktur pertama, yakni
    1, 099 0,33   0, 41   0,398 
ij  ( Ri1 )(rYi X j )   01      
  02   0,33 1, 099   0,16   0, 041 

Kemudian sisaannya adalah

R12   0,398 0, 41   0,041 0,16   0,170 dan demikian

1  R12  1  0,170  0,830 .

Artinya pe1  0,830  0,911

Dengan demikian model untuk substruktur pertama adalah

NAch  0,398SES  0,041IQ  0,911e1

Langkah berikutnya adalah pengujian untuk masing-masing koefisien


jalur dan keseluruhan model.
Pertama kita uji keseluruhan model dengan uji F.
9.98 Statistika Pendidikan 

Nilai F hitungnya adalah

 n  k  1 R12 100  2  1 0,170  16, 49


F    9,34
k 1  R12  2  0,830  1, 66

Dari tabel F (Fisher) dengan dk = (2,97) dan  = 0,05 diperoleh Ftabel =


3,03. Karena nilai Fhitung jauh lebih besar dari Ftabel, maka hipotesis nol
ditolak. Artinya secara keseluruhan model tersebut berarti.
Hipotesis yang diuji adalah sebagai berikut.
Ho :  Ni  0
H1 :  Ni  0
Dengan i= 1, 2
Untuk mengujinya digunakan statistic t-student

 N1 0,398 0,398
t1     4,19
1  R  C
1
2
11
1  0,17 1, 099  0, 095
n  k 1 97
N 2 0, 041 0, 041
t1     0, 431
1  R  C
1
2
22
1  0,17 1, 099 0, 095
n  k 1 97

Besar penolakan untuk nilai t1 = 4,19 dengan dk = 97 adalah 0,000031,


sedangkan untuk t2 = 0,431 dengan dk = 97 cukup besar, yakni 0,333.
Hasil ini menunjukkan bahwa jalur dari IQ ke N Ach tidak berarti,
sedangkan dari SES ke N ach sangat berarti.
Hasil menunjukkan bahwa dalam substruktur pertama terjadi trimming,
yakni proses perhitungan ulang koefisien jalur dengan tidak menyertakan
jalur dari IQ ke NAch. Karena hanya ada satu variabel, maka koefisien
jalurnya adalah nilai korelasi antara keduanya, yakni 0,30. Dan besar
koefisien dari errornya adalah
 Ne1  1  0,30 2  0,95
Dengan persamaan model strukturalnya adalah

NAch  0,30SES  0,95e1


 MPDR5202/MODUL 9 9.99

Langkah berikutnya adalah pengujian keberartiannya. Karena ada satu


variabel (jalur), maka pengujian overall dengan individual hasilnya akan
sama.
 n  k  1 R12 100  1  1 0, 09 
F   9, 69
k 1  R12  1 0,91
Nilai probabilitas penolakan hipotesis nolnya adalah 0,002 yang jauh
lebih kecil dari 0,05. Artinya hipotesis nolnya ditolak dan memberikan
kesimpulan bahwa model tersebut signifikan.
Langkah kedua adalah analisis untuk substruktur yang kedua, yakni

SES N Ach

IQ GPA

Dengan persamaan strukturalnya adalah


GPA  pGS SES  pGI IQ  pGN NAch  pGe 2 e2

1 2 3 Y
SES IQ n Ach GPA
1 1,00 0,30 0,41 0,33
2 1,00 0,16 0,57
3 1,00 0,50
Y 1,00

Misalkan matrik korelasi variabel eksogennya adalah R2, dengan


1, 00 0,30 0, 41
 
R2   1, 00 0,16 
 1, 00 

Dan kita dapat menghitung inversnya sebagai berikut
9.100 Statistika Pendidikan 

 1,29  0,31  0,48 


1
 
R 2    0,31 1,10  0,05 
  0,48  0,05 1,20 
 
Dari matriks invers tersebut, maka kita dapat menghitung koefisien
jalurnya sebagai berikut.

 pGs   1, 29 0,31 0, 48  0,33   0, 009 


      
 pGI    0,31 1,10 0, 05  0,57    0,501 
 p   0, 48 0, 05 1, 20  0,50   0, 416 
 GN      

Kemudian kita hitung nilai dari PGe2, yakni

R22   0,009  0,33   0,501 0,57    0, 416  0,50   0, 496

Jadi pGe 2  1  0,496 2  0,75 .


Jadi persamaan untuk substruktur kedua adalah sebagai berikut

GPA  0,009SES  0,501IQ  0,416 NAch  0,75e2 .


Seperti pada substruktur pertama, kita lakukan juga pengujian untuk
substruktur kedua baik secara overall maupun individual

Pengujian keseluruhan:

 n  k  1 R22 100  3  1 0, 496 


F   21, 05
k 1  R22  3 1  0, 4962 

Nilai F diatas memberikan peluang dalam penolakan hipotesis nolnya


sebesar 0,014. Karena nilai 0,014 lebih kecil dari 0,05, maka hipotesis
nol ditolak.

Berikutnya adalah pengujian secara individual dengan uji t.


pGS 0, 009 0,398
t1     4,19

1 R C
2
1  11
2

1  0, 496 1, 29  0, 095
n  k 1 97
 MPDR5202/MODUL 9 9.101

2) Diagram struktural adalah sebagai berikut:

SES

NA GPA

IQ

Dengan LISREL diperoleh hasil sebagai berikut:

Dari diagram di atas, maka diperoleh informasi:


a. Pertama Chi-square sebesar 0,00 dengan p-value 1,000 > 0,05,
RMSEA = 0,000 lebih kecil dari 0,08. Dapat disimpulkan bahwa
model dalam studi ini fit dengan data.
b. Pengaruh langsung dari SES dan IQ masing-masing terhadap Nach
(NA) adalah 16%, dan 0,36%. Sedangkan pengaruh bersama
keduanya adalah 17% dan sisanya 83% dipengaruhi oleh variabel
lain.
c. Pengaruh langsung dari SES, IQ, dan NA terhadap GPA masing-
masing sebesar adalah 0,36%, 26,01% dan 9%. Dan pengaruh
bersama dari ketiganya adalah 43%, sisanya 57% dipengaruhi oleh
variabel lain.
9.102 Statistika Pendidikan 

3) Lakukan perhitungan dengan LISREL.


a. Ada tiga buah substruktur dengan variabel endogen Self concept (4),
Level of Aspirations (5), dan Verbal Achievement (6).

1,00 0,30 0,25 0,30


1,00 0,30 0,25  0,20 ,
R1   1,00 0,20 R2  
b. , 1,00 0,20
 1,00 0,20
 1,00   
 1,00 
1,00 0,30 0,25 0,30 0,30 
 1,00 0,20 0,20 0,30 
c. 
R3   1,00 0,20 0,30 
 
 1,00 0,40
 1,00 

1,146  0,298  0,227


R11    0,149 
,
1,119
 1,086 

1,211  0,270  0,194  0,270


 1,131  0,135  0,118 
R21 
 1,103  0,135 
 
 1,132 

1,229  0,244  0,167  0,224  0,156 


 1,171  0,094  0,050  0,230

R31  1,145  0,064  0,240
 
 1249  0,400
 1,347 

d. Koefisien Jalur Pada Substruktur


P41 = 0.80; p42 = 0,104; p43 = 0,119
P51 = 0,116; p52 = 0,171; p53 = 0,178; p54 = 0,296
P61 = -0,019; p62 = 0,506; p63 = 0,130; p64 = 0,110; p65 = 0,171
 MPDR5202/MODUL 9 9.103

4) Soal ini dihitung dengan SPSS.


Model struktural terdiri dari 2 substruktur

Substruktur 1
Variables Entered/Removedb
Model Variables Entered Variables Removed Method
1 X2, X1a . Enter
2 . X2 Backward (criterion:
Probability of F-to-
remove >= ,100).
a. All requested variables entered.
b. Dependent Variable: X3

Dalam substruktur ini terjadi trimming, yakni membuang jalur dari X2


ke X3. Halini terlihat dari tabel di atas, dimana X2 statusnya removed.
Untuk lebih jelasnya dapat dilihat dalam dua tabel berikut berikut.

ANOVAc
Sum of
Model Squares df Mean Square F Sig.
1 Regression 603,600 2 301,800 19,794 ,000a
Residual 259,200 17 15,247
Total 862,800 19
2 Regression 598,487 1 598,487 40,758 ,000b
Residual 264,313 18 14,684
Total 862,800 19
a. Predictors: (Constant), X2, X1
b. Predictors: (Constant), X1
c. Dependent Variable: X3

Secara keseluruhan model sangat berrati, ini terlihat dari besar F =


19,794 yang memberikan signifikansi penolakan hipotesis nol 0,000.
Namun dalam tabel di bawah, pengujian parsial, nilai thitung bagi X2
hanya 0,579. Nilai ini hanya memberikan signifikansi 0,570 yang lebih
besar dari 0,05. Dengan demikian jalur dari X2 ke X3 dibuang. Setelah
9.104 Statistika Pendidikan 

dilakukan triming diperoleh koefisien jalur baru dari X1 ke X3 sebesar


0,833. Jalur tersebut signifikan, sehingga dipertahankan.

Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 45,590 6,387 7,138 ,000
X1 ,539 ,168 ,727 3,212 ,005
X2 ,279 ,482 ,131 ,579 ,570
2 (Constant) 46,732 5,962 7,838 ,000
X1 ,618 ,097 ,833 6,384 ,000
a. Dependent Variable: X3

Substruktur 2
Dalam perhitungan substruktur juga, X2 removed dari model. Akhirnya
dalam substruktur 2 tidak ada jalur dari X2 ke Y. Sedangkan jalur
lainnya X1 ke Y dan X3 ke Y dipertahankan.
Coefficientsa
Unstandardized Standardized
Model Coefficients Coefficients
B Std. Error Beta t Sig.
1 (Constant) -65,957 17,209 -3,833 ,001
X1 ,379 ,287 ,330 1,322 ,205
X2 ,788 ,657 ,239 1,201 ,247
X3 ,598 ,327 ,386 1,830 ,086
2 (Constant) -65,286 17,422 -3,747 ,002
X1 ,567 ,243 ,493 2,333 ,032
X3 ,653 ,328 ,421 1,991 ,063
 MPDR5202/MODUL 9 9.105

a. Dependent Variable: Y
Model Summary
Adjusted R Std. Error of the
Model R R Square Square Estimate
1 ,887a ,786 ,746 5,26231
2 ,876b ,767 ,740 5,33016
a. Predictors: (Constant), X3, X2, X1
b. Predictors: (Constant), X3, X1
Hasil akhirnya adalah sebagai berikut.
E2

X1 0,483
0,493
0,833

X3 Y
0,421

0,553
X2
E2

Test Formati 2
1)  adalah vektor dari variabel latent endogen
 adalah vektor dari variabel eksogen
adalah matriks koefisien dari pengaruh variabel endogen terhadap
variabel endogen
adalah matriks koefisien dari pengaruh variabel eksogen terhadap
variabel endogen
2) Hasil perhitungannya adalah sebagai berikut dan silahkan Anda silahkan
Anda analisis!
9.106 Statistika Pendidikan 

Studi Hubungan antara SOSEK(SES), LOCUS CONTROL(LOC), DAN ASPIRATION(ASP)

Number of Iterations = 8

LISREL Estimates (Maximum Likelihood)

Measurement Equations

Y1 = 0.85*LOC, Errorvar.= 0.28 , R² = 0.72


(0.044)
6.29

Y2 = 0.82*LOC, Errorvar.= 0.32 , R² = 0.68


(0.058) (0.044)
14.17 7.33

Y3 = 0.93*ASP, Errorvar.= 0.14 , R² = 0.86


(0.039)
3.52

Y4 = 0.86*ASP, Errorvar.= 0.26 , R² = 0.74


(0.051) (0.039)
17.06 6.61

X1 = 0.68*SES, Errorvar.= 0.54 , R² = 0.46


(0.074) (0.085)
9.18 6.36

X2 = 0.74*SES, Errorvar.= 0.46 , R² = 0.54


(0.076) (0.094)
9.66 4.85

Structural Equations

LOC = 0.53*SES, Errorvar.= 0.72 , R² = 0.28


(0.075) (0.10)
6.98 7.05

ASP = 0.77*LOC + 0.0068*SES, Errorvar.= 0.41 , R² = 0.59


(0.077) (0.073) (0.061)
9.99 0.093 6.64

Reduced Form Equations


 MPDR5202/MODUL 9 9.107

LOC = 0.53*SES, Errorvar.= 0.72, R² = 0.28


(0.075)
6.98

ASP = 0.41*SES, Errorvar.= 0.83, R² = 0.17


(0.072)
5.67

Correlation Matrix of Independent Variables

SES
--------
1.00

Covariance Matrix of Latent Variables

LOC ASP SES


-------- -------- --------
LOC 1.00
ASP 0.77 1.00
SES 0.53 0.41 1.00

Goodness of Fit Statistics

Degrees of Freedom = 6
Minimum Fit Function Chi-Square = 13.98 (P = 0.030)
Normal Theory Weighted Least Squares Chi-Square = 13.31 (P = 0.038)
Estimated Non-centrality Parameter (NCP) = 7.31
90 Percent Confidence Interval for NCP = (0.35 ; 21.93)

Minimum Fit Function Value = 0.047


Population Discrepancy Function Value (F0) = 0.024
90 Percent Confidence Interval for F0 = (0.0012 ; 0.073)
Root Mean Square Error of Approximation (RMSEA) = 0.064
90 Percent Confidence Interval for RMSEA = (0.014 ; 0.11)
P-Value for Test of Close Fit (RMSEA < 0.05) = 0.26

Expected Cross-Validation Index (ECVI) = 0.14


90 Percent Confidence Interval for ECVI = (0.12 ; 0.19)
ECVI for Saturated Model = 0.14
ECVI for Independence Model = 3.42
9.108 Statistika Pendidikan 

Chi-Square for Independence Model with 15 Degrees of Freedom = 1010.80


Independence AIC = 1022.80
Model AIC = 43.31
Saturated AIC = 42.00
Independence CAIC = 1051.02
Model CAIC = 113.86
Saturated CAIC = 140.78

Normed Fit Index (NFI) = 0.99


Non-Normed Fit Index (NNFI) = 0.98
Parsimony Normed Fit Index (PNFI) = 0.39
Comparative Fit Index (CFI) = 0.99
Incremental Fit Index (IFI) = 0.99
Relative Fit Index (RFI) = 0.97

Critical N (CN) = 360.69

Root Mean Square Residual (RMR) = 0.019


Standardized RMR = 0.019
Goodness of Fit Index (GFI) = 0.99
Adjusted Goodness of Fit Index (AGFI) = 0.95
Parsimony Goodness of Fit Index (PGFI) = 0.28

Time used: 0.016 Seconds


Diagram model dari estimasi model

Diagram dari t-value adalah sebagai berikut.


 MPDR5202/MODUL 9 9.109
9.110 Statistika Pendidikan 

Glosarium

Analisis jalur (path analysis) digunakan untuk menggambarkan dan


menguji model hubungan antar variabel yang berbentuk sebab akibat.
Angka Baku. Suatu pengamatan x dari suatu populasi yang mempunyai rata-
rata  dan simpangan baku  mempunyai angka baku z, dengan
x
z . Nilai z mengukur berapa simpangan baku sebuah

pengamatan terletak di atas atau di bawah rata-ratanya. Rata-rata dan
simpangan baku dari angka baku berturut-turut 0 dan 1.
Anova singkatan dari analysis of varians adalah uji komparasi parametrik
bagi k (k > 2) kelompok baik kelompok-kelompok saling bebas atau
berpasangan.
Asosiasi antara dua variabel adalah derajat kekuatan hubungan antara kedua
variabel tersebut. Ukuran derajat yang digunakan adalah koefisien
korelasi.
Bilangan acak adalah bilangan-bilangan yang muncul tanpa pola. Kumpulan
bilangan acak disusun pada tabel bilangan acak
Dalil limit pusat. Bila sampel acak berukuran n ditarik dari suatu populasi
yang besar atau tak hingga dengan rata-rata  dan varians 2, maka rata-
rata sampel X akan menyebar menghampiri distribusi normal dengan
rata-rata  X   dan simpangan baku  X   n .
Distribusi normal adalah distribusi variabel acak kontinyu dengan rata-rata
dan varians 2 yang mempunyai persamaan
1  x 
2

1   
N  x;  ,    e 2  
, untuk -  x   .
2
Distribusi normal baku adalah distribusi variabel acak normal dengan rata-
rata nol dan simpangan baku 1.
Distribusi sampling rata-rata adalah distribusi dengan peubah acaknya
rata-rata  X  dari keseluruhan sampel yang mungkin dari suatu
populasi.
Kuartil adalah nilai-nilai yang membagi segugus pengamatan menjadi 4
bagian yang sama.
Kurva normal adalah suatu kurva yang merupakan refresentasi dari fungsi
peubah acak normal (X) dengan rata-rata  dan varians 2.
 MPDR5202/MODUL 9 9.111

Hipotesis statistik adalah pernyataan atau dugaan mengenai satu atau lebih
populasi.
Hipotesis nol adalah hipotesis yang dirumuskan dengan harapan akan
ditolak.
Hipotesis asosiatif adalah suatu pernyataan yang menunjukkan dugaan
hubungan antara dua variabel atau lebih
Hipotesis komparatif adalah pernyataan yang menunjukkan dugaan nilai
dalam satu variabel atau lebih yang berbeda.
Level signifikansi atau taraf nyata adalah peluang kesalahan atau eror atau
galat jenis I yakni peluang penolakan hipotesis nol yang benar.
Model struktural adalah hubungan antar variabel yang diperoleh dari
kerangka berpikir atau analisis teori.
Parameter adalah sebarang nilai yang menjelaskan ciri suatu populasi.
Penduga tak bias. Jika statistik  adalah penduga suatu parameter , maka
 
E   .
Penduga paling efisien adalah penduga dari semua kemungkinan penduga
tak bias bagi parameter  yang mempunyai varians terkecil.
Pengaruh langsung adalah pengaruh dari satu variabel eksogen terhadap
satu variabel endogen.
Pengaruh tidak langsung adalah pengaruh dari satu variabel eksogen
terhadap variabel endogen melalui variabel endogen lain.
Pengaruh total adalah jumlah pengaruh dari satu variabel eksogen terhadap
endogen yang diperoleh dari keseluruhan jumlah pengaruh langsung dan
pengaruh tidak langsung.
Peubah acak atau variabel acak adalah suatu fungsi dengan nilainya
berupa bilangan nyata/riil yang ditentukan oleh setiap unsur dalam ruang
sampel.
Populasi adalah keseluruhan pengamatan yang menjadi perhatian kita
(peneliti).
Regresi adalah persamaan/model matematika yang menghubungkan secara
fungsional antara beberapa variabel bebas (1 atau lebih) dengan satu
variabel terikat.
Regresi linear sederhana adalah model regresi dengan model matematikanya
berbentuk persamaan linear dari satu variabel bebas dengan satu variabel
terikat.
9.112 Statistika Pendidikan 

Regresi linear jamak/ganda adalah model regresi dengan model


matematikanya berbentuk persamaan linear dari dua atau lebih variabel
bebas dengan satu variabel terikat.
Sampel adalah suatu himpunan bagian dari populasi.
Sampel acak sederhana adalah pengambilan sampel sebanyak n
pengamatan dari populasi sedemikian rupa setiap anggota populasi
mempunyai peluang yang sama untuk terpilih.
Statistik adalah sebarang nilai yang menjelaskan ciri suatu sampel.
Statistika adalah pengetahuan yang berhubungan dengan cara-cara
pengumpulan data, pengolahan atau penganalisisannya dan penarikan
kesimpulan berdasarkan kumpulan data dan penganalisisan yang
dilakukan.
Statistika Deskriptif adalah metode-metode yang berkaitan dengan
pengumpulan dan penyajian suatu gugus data sehingga memberikan
informasi.
Statistika Inferensial mencakup semua metode yang berhubungan dengan
analisis sebagian data yang diolah sehingga sampai pada peramalan atau
penarikan kesimpulan mengenai keseluruhan gugus data induknya
(populasi).
Trimming adalah proses iteratif yang dilakukan dalam analisis jalur untuk
memperoleh jalur-jalur yang signifikan dalam suatu substruktur.
Ukuran gejala pemusatan (central tendency) adalah ukuran yang berkaitan
dengan kecenderungan pemusatan distribusi data. Ukuran ini di
antaranya adalah rata-rata, modus dan median.
Ukuran penyebaran (dispersi) adalah ukuran yang berkaitan dengan
keragaman distribusi data. Ukuran yang digunakan di antaranya rentang,
rentang antar kuartil, varians dan simpangan baku.
Variabel bebas/independen disebut juga variabel stimulus, prediktor,
antesenden adalah variabel yang mempengaruhi atau menjadi sebab
perubahannya atau timbulnya variabel lain (variabel terikat).
Variabel terikat/dependen disebut juga variabel output, kriteria, konsekuen
adalah variabel yang dipengaruhi atau yang menjadi akibat.
 MPDR5202/MODUL 9 9.113

Daftar Pustaka

Dowdy, S. & Wearden, S. 1991. Statistcs for Research(second edition). New


York: John Wiley & Son.

Draper, N. & Smith, H. 1992. Analisis Regresi Terapan. Alih Bahasa:


Bambang Sumantri. Jakarta: Gramedia.

Johnson, R. A. & Wichern, D. W., 1992. Applied multivariate statistical


analysis. New Jersey : Prentice Hall.

Kusnendi. 2004. Konsep dan Aplikasi Model Persamaan Struktural (SEM)


dengan Program Lisrel8. Bandung: Jurusan Pendidikan Ekonomi UPI.

Minium, E. W., King, B. M. & Bear, G. 1993. Statistical Reasoning in


Psychology and Education. New York : Joh Wiley & Sons, Inc.

Pedhazur, E. J. 1982. Multiple Regression in Behavioral Research


(explanation and prediction). New York: Holt, Rinehart & Winston.

Sembiring. 1995. Analisis Regresi. Bandung: ITB.

Steel, R.G.D. & Torrie, J. H. 1995. Prinsip dan Prosedur Statistika (Suatu
Pendekatan Biometrik). Alih Bahasa: Bambang Sumantri. Jakarta:
Gramedia Pustaka Utama.

Sudjana, 1989. Metoda Statistika. Bandung: Tarsito.

Sugiyono, 2008. Statistika untuk Penelitian. Bandung: Alfabeta.

Wijayanto, S. H. 2008. Structural Equation Modeling dengan Lisrel 8.8.


(Konsep dan Tutorial). Yogyakarta: Graha Ilmu.

Anda mungkin juga menyukai