Anda di halaman 1dari 87

BAHAN AJAR

STATISTIKA

Oleh:
Dr. Samsudi, M.Pd

JURUSAN TEKNIK MESIN - FAKULTAS TEKNIK


UNIVERSITAS NEGERI SEMARANG 2008

Samsudi - STATISTIKA 1
KATA PENGANTAR

Puji dan syukur penulis panjatkan kehadirat Alloh SWT , yang telah melimpahkan
petunjuk, bimbingan dan kekuatan lahir-batin sehingga dapat menyusun bahan ajar ini.
Sasaran yang akan dicapai dengan buku Statistika ini adalah: (1) memberikan dasar-
dasar pemahanan dan pengertian beberapa istilah statistika serta mafaatnya, (2)
menggunakan statistika sebagai alat bantu dalam penyusunan laporan penelitian, (3)
menggunakan rumus-rumus dan teknik analisis Statistika dan (4) memiliki sikap teliti
dan cermat dalam menerima dan menggunakan sesuatu.
Bahan ini terdiri atas 9 (sembilan) bab, yaitu: (1) Konsep dan Pengertian Statistika, (2)
Distribusi Frekuensi, (3) Ukuran Statistika, (4) Deviasi Rata-rata dan Standar Deviasi,
(5) Uji Hipotesis, (6) Teknik Analisis Korelasional, (7) Teknik Analisis Komparasional,
(8) Teknik Analisis Variansi, (9) Analisis Regresi. Setiap bab terdiri atas beberapa sub
bab serta dilengkapi dengan soal-soal untuk latihan.
Penulis menyampaikan terima kasih sebanyak- banyaknya kepada fihak-fihak yang
telah membantu penyusunan buku ini. Kritik dan saran yang bersifat konstruktif sangat
penulis harapkan untuk kesempurnaan buku ini.

Semarang, Oktober 2008

Dr. Samsudi, M.Pd

Samsudi - STATISTIKA 2
DAFTAR ISI
KATA PENGANTAR ………………………………………………… ii
DAFTAR ISI …………………………………………………………… iii

BAB I KONSEP DAN PENGERTIAN STATISTIKA …………. 1


1.1. Pengertian Statistika ................................................... 2
1.2. Statistika dalam Pelelitian ............................................ 2
BAB II DISTRIBUSI FREKUENSI ................................................ 3
2.1. Distribusi Frekuensi .................................................... 4
2.2. Grafik dan Tabel Distribusi Frekuensi ........................ 7
BAB III UKURAN STATISTIKA ................................................... 11
3.1. Pengukuran Tendensi Sentral ..................................... 12
3.2. Mean .......................................................................... 12
3.3. Median ……………………………………………… 13
3.4. Mode ……………………………………………….. 14
BAB IV DEVIASI RATA-RATA DAN STANDAR DEVIASI ...... 18
4.1. Pengukuran Variabilitas ............................................. 19
4.2. Deviasi Rata-rata (Mean Deviation) ........................... 19
4.3. Standard Deviasi …………………………………… 20
BAB V UJI HIPOTESIS .................................................................. 25
5.1. Pengertian Hipotesis ………………………………… 26
5.2. Menyatakan Hipotesis ……………………………….. 26
5.3. Menguji Hipotesis-Perbedaan Antara Dua Mean …… 26
5.4. Standar Kesalahan Perbedaan Mean ……………….. 27
BAB VI TEKNIK ANALISIS KORELASIONAL ………………… 30
6.1. Arah Hubungan …………………………………….. 31
6.2. Koefisien Korelasi ....................................................... 31
6.3. Korelasi setujuduct Moment dan Cara Menghitungnya 31
6.4. Uji Taraf Signifikansi ………………………………. 34
BAB VII TEKNIK ANALISIS KOMPARASIONAL .......................... 37
7.1. Chi Kuadrad ............................................................... 37
7.2. t-Score ........................................................................ 41
BAB VIII ANALISIS VARIANSI ....................................................... 48
8.1. Konsep Mean Kuadrat .................................................. 49
8.2. F – Ratio …………………………………………….. 50
8.3. Anava pada Distribusi Tunggal …………………….. 57
8.4. Analisis Variansi (ANAVA) Klasifikasi Ganda ......... 61
BAB IX ANALISIS REGRESI ………………………………….. 67
9.1 Analisis Regresi Linear Satu Prediktor ……………… 69
9.2. Analisis Varians Garis Regresi …………………….. 76
9.3. Analisis Regresi: Dua Prediktor ……………………. 79
9.4. Analisis Regresi : m – Prediktor …………………… 86
DAFTAR PUSTAKA ............................................................................. 88

Samsudi - STATISTIKA 3
BAB I

KONSEP DAN PENGERTIAN STATISTIKA

Tujuan

Mahasiswa memiliki pemahaman tentang konsep statistika dalam konteks penelitian,


pengolahan data dan penarikan kesimpulan, serta memahami statistika dalam kaitannya
dengan kegiatan penelitian

Samsudi - STATISTIKA 4
1.1. Pengertian Statistika

Istilah STATISTIKA memiliki pengertian berbeda dengan STATISTIK.


Statistik merupakan kumpulan data, bilangan atau non bilangan yang disusun/disajikan
sedemikian rupa (biasanya dalam bentuk tabel atau grafik) yang menggambarkan suatu
persoalan atau keadaan. Sedangkan Statistika adalah pengetahuan yang berhubungan
dengan cara-cara pengumpulan, penyajian, pengolahan dan analisis data, serta teknik-
teknik analisis data.
Statistika digunakan sebagai cara-cara ilmiah untuk mengumpulkan, menyusun,
meringkas dan menyajikan data penelitian. Lebih lanjut statistika merupakan cara untuk
mengolah data tersebut dan menarik kesimpulan-kesimpulan yang teliti dan keputusan-
keputusan yang logik dari pengolahan data tersebut. Sedangkan statistik lebih banyak
digunakan untuk menggambarkan keadaan atau permasalahan seperti pencataan
banyaknya penduduk, penarikan pajak, dan semacamnya.

1.2. Statistika dalam Pelelitian

Dalam rangka kegiatan penelitian, seperti yang telah disinggung di depan, fungsi
dan peranan statistika dijelaskan sebagai berikut:
1. Statistika memungkinkan pencatatan secara eksak data penelitian.
2. Statistika memandu peneliti menganut tata fikir dan tata kerja yang definit dan
eksak.
3. Statistika menyediakan cara-cara meringkas data ke dalam bentuk yang lebih
banyak artinya dan lebih gampang mengerjakannya.
4. Statistika memberi dasar-dasar untuk menarik kongklusi-kongklusi melalui proses-
proses yang mengikuti tata cara yang dapat diterima oleh ilmu pengetahuan.
5. Statistika memberi landasan untuk meramalkan secara ilmiah tentang sebagaimana
sesuatu gelaja akan terjadi dalam kondisi-kondisi yang telah di ketahui.
6. Statistika memungkinkan peneliti menganalisis, menguraikan sebab-akibat yang
kompleks dan rumit, yang tanpa statistika akan merupakan peristiwa yang
membingungkan, kejadian yang tak teruraikan.

Soal Latihan

1. Berikan definisi pengertian Statistika. Bagaimanakah pengertian tersebut dapat


dibagi?
2. Manfaat apakah yang dapat dipetik mahasiswa selaku calon sarjana, dengan
mempelajari Statistika Pendidikan? Jelaskan jawaban saudara!
3. Syarat apakah yang harus dipenuhi sekumpulan angka atau bilangan, sehingga ia
dapat disebut data Statistika?
4. Sebutkan tiga prinsip yang harus dipegang dalam rangka pengumpulan data
Statistika!
5. Jelaskan mengenai cara yang akan ditempuh dan alat yang dapat dipergunakan,
dalam rangka menghimpun data Statistik!

Samsudi - STATISTIKA 5
BAB II

DISTRIBUSI FREKUENSI

Tujuan

Mahasiswa memiliki pemahaman tentang distribusi frekuensi dan tabel/grafik distribusi


frekuensi

Samsudi - STATISTIKA 6
2.1. Distribusi Frekuensi

2.1.1. Variabel Penelitian


Seorang peneliti akan mengadakan penelitian tentang kecerdasan murid-murid
dalam berhitung; seorang ahli beton mengadakan penelitian tentang campuran-
campuran beton, seorang ahli pertanian meneliti benih-benih baru. Kecerdasan,
berhitung, campuran beton dan benih-benih baru, itu semuanya merupakan obyek
penelitian. Obyek yang diteliti itu disebut variabel penelitian.

2.1.3. Variabel Kontinu dan Diskrit


Kalau seorang guru menyelenggarakan penelitian tentang angka rata-rata murid-
muridnya dalam berhitung, maka guru tersebut melihat nilai-nilai ujian mereka atau
nilai-nilai dalam buku nilai. Nilai dalam berhitung itu disebut nilai variabel.
Ada dua macam nilai variabel, yaitu nilai yang bersambung atau kontinu dan nilai
yang terpisah atau diskrit. Nilai tinggi orang misalnya, adalah nilai yang kontinu, sebab
jika kita sebutkan tinggi si A 165 cm, pada hakekatnya tinggi si A itu tidak mutlak
tepat 165 cm, melainkan misalnya 165, 30 cm pada umumnya angka 165 cm, itu
ditetapkan untuk mewakili tinggi orang dari 164,50 cm, sampai 165,49 cm. Mereka
yang tingginya 165,50 cm sampai dengan 165,49 cm, dicatat 166 cm. Dengan kata lain,
angka 0,50 ke atas dibulatkan atas, sedang angka di bawah 0,50 dihilangkan.

2.1.4. Distribusi Frekuensi Tunggal


Dalam suatu penelitian tentang kecakapan berhitung, pada Mata Pelajaran
Matematikan, siswa kelas 4, 5 dan 6 suatu sekolah yang berjumlah 70 orang, diperoleh
nilai rapor sebagai berikut:
Nilai-nilai
7 6 6 6 5 7 6 5 4 6 7 7 6 7 5 6 6
6 6 6 6 6 5 6 6 6 7 7 5 7 7 8 5 6 5
7 7 5 6 7 7 7 7 6 6 6 6 5 5 7 7 5
5 6 5 6 7 6 7 8 5 6 5 7 5 6 7 8 8 6

Melihat angka-angka di atas kita belum dapat memperoleh gambaran apa-apa. Untuk
mendapatkan gambaran dan kesimpulan, kita perlu mengatur angka-angka itu menjadi
suatu tabel sebagai berikut :

TABEL 2.1
TABEL NILAI-NILAI BERHITUNG 70 ORANG SISWA
NILAI Jari-jari Frekuensi
8 //// 4
7 //// //// //// //// / 21
6 //// //// //// //// //// /// 28
5 //// //// //// / 16
4 / 1
+
N = 70

Samsudi - STATISTIKA 7
+ N adalah singkatan dari kata Number, yang berarti jumlah frekuensi variabel

Tabel di atas disebut Tabel Distribusi Frekuensi Tunggal. Istilah “Distribusi” digunakan
dalam statistika untuk menunjuk adanya (seolah-olah) “Penyebaran” nilai-nilai dengan
jumlah orang yang mendapat nilai itu, sedang istilah ”Tunggal” menunjukkan tidak
adanya pengelompokan nilai-nilai variabel dalam kolom pertama.

2.1.5. Distribusi Frekuensi Bergolong


Hasil-hasil Psikotest dari sebagian calon-calon mahasiswa suatu Fakultas adalah
sebagai berikut :

18 13 16 4 10 10 15 17 16 16
21 22 20 7 (23) 10 18 (3) 10 8
10 11 10 10 6 11 23 19 19 20
21 12 10 17 7 12 5 9 12 15
12 12 16 20 14 15 14 15 16 15
17 16 16 14 14 15 19 13 15 14
21 8 19 19 19 13 13 19 14 13
20

Nilai yang tertinggi dari hasil ujian masuk itu adalah 23, sedang nilai terendah adalah
tiga. Jika susun tabel distribusi tunggal, maka kita harus membuatnya sepanjang 21
baris (dari 23-3 plus 1). Dengan demikian kita akan menjumpai tabel sebagai berikut :

TABEL 2.2
TABEL HASIL PSIKOTEST DARI CALON-CALON MAHASISWA
Kelompok Frekuensi
Nilai (f)
21-23 6
18-20 13
15-17 17
12-14 16
9-11 11
6-8 5
3-5 3
Jumlah 71

2.1.6. Beberapa Istilah dalam Distribusi Bergolong


Interval Kelas. Tiap-tiap kelompok nilai variabel disebut interval kelas. Dalam
Tabel 3.2 di atas kita jumpai ada tujuh interval kelas dengan masing-masing berisi tiga
nilai variabel. Interval Kelas biasa disingkat dengan sebutan kelas atau interval saja.
Batas Kelas. Batas kelas adalah nilai-nilai yang membatasi kelas yang satu dari
kelas yang lain. Nilai-nilai 21 dan 23 pada kelas yang teratas dari Tabel 3.2 itu adalah
nilai-nilai yang membatasi kelas itu dari kelas lainnya yang berdekatan.
Batas Atas dan Batas Bawah dan batas atas. Kita lihat dalam kolom nilai
variabel dalam Tabel 3.2 itu ada dua deret angka-angka batas kelas, deret sebelah kiri
dan deret sebelah kanan. Angka-angka batas di deret sebelah kiri ialah angka-angka
Samsudi - STATISTIKA 8
21,18,15,21,9,6 dan 3. Angka-angka itu semuanya menjadi batas bawah dari masing-
masing kelasnya. Sebab itu angka-angka itu di sebut “Batas bawah” (Lower Limits).
Angka-angka dideret sebelah kanan ialah angka-angka 23, 20, 17, 14, 11, 8 dan 5.
Angka-angka ini masing-masing menjadi batas kelas, deret sebelah kiri dan deret
sebelah kanan. Angka-angka batas di deret sebelah kiri ialah angka-angka 21, 18, 15,
12, 9, 6 dan 3. Angka-angka itu disebut “Batas Atas” (Upper Limits).
Batas Semu dan Batas Nyata. Kalau kita letakkan pada garis mendatar kelas-
kelas dalam Tabel 3.2 itu akan kelihatan sebagai berikut :

3 5 6 8 9 11 12 14 15 17 18 20 21 23
Nampak kepada kita dari pemeriksaan lukisan di atas bahwa angka 5 dan angka 6
misalnya, bukanlah batas yang nyata antara kelas yang terendah dengan kelas di
atasnya. Demikian juga angka-angka 20 dan 21.
Lebar Kelas. Kita periksa kembali tabel 3.2 Interval kelas yang tertinggi di
tandai dengan angka 21 dan 23. Kedua angka itu sebenarnya hanyalah batas kelas saja
(batas semu). Antara keduanya masih ada satu angka lagi, yaitu angka 22. Demikian
juga kelas yang keempat dari atas, sebenarnya mengandung angka-angka 3,4, dan 5.
Jadi tiap-tiap kelas itu sebenarnya mengandung atau terdiri atas tiga angka. Inilah yang
disebut lebar kelas dapat didefinisikan sebagai batas lebar atas nyata dikurangi batas
bawah nyata dari kelas-kelas yang bersangkutan. Lebar kelas biasa diberi simbul “i”.
Jika orang mengatakan “i” sama dengan tiga, ini berarti bahwa distribusi frekuensi
disusun dalam tabel atau grafik yang menggunakan interval kelas dengan isi tiga angka
atau nilai dalam tiap-tiap intervalnya.
Titik Tengah. Yang dimaksud dengan “Titik Tengah” adalah angka atau nilai
variabel yang terdapat ditengah-tengah interval kelas. Jika interval kelas memuat angka-
angka 13, 14 dan 15, yang menjadi titik tengahnya adalah angka 14. Jika luas kelasnya
genap, seperti 20, 21, 22 dan 23 titik tengahnya adalah separo dari jumlah angka-angka
tengah, yaitu 21,5 (dari ½ x ( 21 ditmbah 22).
Jumlah Interval . Yang disebut jumlah interval ialah banyaknya interval yang
digunakan dalam penyusunan distribusi. Dalam tabel 3.2 diatas jumlah intervalnya ada
tujuh.
Jarak Pengukuran. Kalau kita mengukur tinggi sejumlah orang, dan kita
menjumpai angka pengukuran yang tertinggi 180 cm. Dan angka pengukuran yang
terendah, 145 cm, kita mempunyai jarak pengukuran 35 cm. (dari 180 cm, dikurangi
145 cm).

2.1.7. Menetapkan Jumlah Interval


Salah satu masalah yang kita hadapi bila kita hendak menyusun tabel dengan
interval-interval adalah menetapkan jumlah interval. Penetapan ini dipengaruhi oleh
beberapa faktor, antara lain adalah faktor-faktor jumlah frekuwensi (N), jarak
pengukuran (R), lebar interval yang hendak digunakan (i), dan tujuan penyusunan
distribusi itu. Pada prinsipnya jumlah interval kelas janganlah terlalu sedikit, sehingga
pola-pola kelompok menjadi kabur.
Akan tetapi jumlah interval itu juga jangan terlalu besar, sehingga kita tidak
dapat mendapat gambaran tentang pola kelompok. Petunjuk yang mutlak tidak ada
dalam hal ini. Tetapi dalam psikologi dan pendidikan dapat kita anut kebiasaan

Samsudi - STATISTIKA 9
mennggunakan 5 sampai 15 interval. Kalau R besar sekali, biasanya orang
menggunakan 10 smapai 20 interval. Akan tetapi hal ini tidak boleh diikuti secara
membabi buta.

2.1.8. Menentukan Lebar Interval


Jika R sudah diketahui dan jumlah interval kelas sudah ditentukan, pada
dasarnya i sudah diketemukan. Rumus dari i adalah sebagai berikut :

JarakPengukuran( R )
i=
JumlahInterval

Jadi kalau misalnya hasil pengukuran kita tentang tinggi orang yang tertinggi adalah
180 cm dan yang terendah adalah 145 cm, dan kita telah menetapkan jumlah intervalnya
sebanyak 9 buah, maka

180,50 − 144,50 36
i= = =4
9 9

2.1.9. Pengertian Distribusi Frekuensi


Distribusi Frekuensi adalah penyusunan bahan-bahan atas dasar nilai variabel
dan frekuensi tiap-tiap nilai variabel itu. Tabel untuk distribusi frekuensi, disebut tabel
distribusi frekuensi atau tabel frekuensi saja. Distribusi tunggal adalah distribusi yang
tidak menggunakan penggolongan-golongan. Distribusi Bergolong menggunakan
interval-interval kelas dalam penyusunannya.

2.2. Grafik dan Tabel Distribusi Frekuensi


Terdapat beberapa macam grafik dan tabel distribusi frekuensi. Namun dalam sub
ini akan dibicarakan tiga macam yang pokok, yakni Histogram, Frekuensi Poligon, dan
Ogive.

2.2.1. Histogram
Grafik histogram biasa disebut juga Bar Diagram, yaitu suatu grafik yang
berbentuk segi empat.

TABEL 2.3
NILAI-NILAI BERHITUNG 72 ORANG MURID
Nilai Batas Nyata + Frekuensi
8 8,5
7 7,5 4
6 6,5 23
5 5,5 28
4 4,5 16
3,5 1

Samsudi - STATISTIKA 10
Jumlah : -- 72

Grafik 2.1. Histogram

2.2.2. Poligon

Dengan grafik polygon kita dengan mudah dapat membandingkan keadaan


distribusi, jika kedua distribusi itu dilukiskan dalam satu grafik. Hal ini dapat kita lihat
dengan jelas pada keadaan sebagai berikut:

Grafik 3.2. Poligon

Samsudi - STATISTIKA 11
2.2.3. Ogive
Ogive dapat dibuat baik dari distribusi tunggal maupun dari distribusi tergolong.
Di bawah ini diberikan contoh untuk membuat grafik ogive dari distribusi bergolong.

TABEL 2.4
TABEL DISTRIBUSI UNTUK CONTOH MEMBUAT GRAFIK OGIVE
Interval Batas Frekuensi Frekuensi Meningkat
Nilai Nyata ( f _) (ef)
38,5
2
36-38 35,5 100
3
33-35 32,5 98
2
30-32 29,5 95
6
27-29 26,5 93
5
24-26 23,5 87
5
21-23 20,5 82
5
18-20 17,5 77
14
15-17 14,5 72
10
12-14 11,5 58
17
9-11 8,5 48
15
6-8 5,5 31
14
3-5 2,5 16
2
0-2 0,5 2

Jumlah N = 100 --

Grafik 2.3. Ogive

Samsudi - STATISTIKA 12
Soal Latihan

1 . Jelaskan perbedaan diantara data kontinyu dan data diskrit.


2. Jelaskan pula tentang perbedaan antara data interval dan data ordinal.
3. Berikan contoh demikian rupa sehingga menjadi cukup jelas apa yang dimaksud
dengan data primer dan data sekunder.
4. a. Interval 40 – 49; tentukan Midpointnya!
b. Interval 37 – 40; berapakah Nilai Relatifnya?
c. Interval 59 – 78; berapakah Nilai nyatanya?
d. Interval 35 – 40; berapakah lower limitnya?
e. Interval 71 – 75; berapakah upper limitnya?
5. Jelaskan apa yang dimaksud frekuensi!
6. Jelaskan langkah yang sebaiknya ditempuh dalam membuat Tabel Distribusi
Frekuensi Data Tunggal!
7. Data di bawah ini: Nilai hasil ulangan harian dari sejumlah 60 orang siswa SMP
dalam bidang studi Bahasa Indonesia adalah sebagai berikut:

7 5 8 3 6 4 6 7 5 9
4 6 8 6 8 5 7 5 9 7
3 4 6 5 5 4 8 6 5 6
9 7 5 8 6 4 6 7 8 10
7 6 3 9 5 7 6 3 8 7
10 8 7 6 6 5 7 7 6 6

Soal : Aturlah (susunlah) dan kemudian sajikanlah data tersebut diatas dalam bentuk:
a. Tabel Distribusi Frekuensi, dengan mengindahkan persyaratan tertentu sehingga
dapat disebut Tabel distribusi frekuensi yang baik.
b. Tabel Persentase
c. Tabel Presentase Kumulatif

8. Lukislah data pada soal nomor 7 diatas dalam bentuk Histrogram Frekuensi!

Samsudi - STATISTIKA 13
BAB III

UKURAN STATISTIKA

Tujuan

Mahasiswa memiliki pemahaman tentang ukuran statistika yang meliputi tendensi


sentral, rerata, dan sebaran data.

Samsudi - STATISTIKA 14
3.1. Pengukuran Tendensi Sentral

Jika dilakukan penelitian terhadap motivasi, pada umumnya dapat diketahui


bahwa sebagian besar dari orang yang diteliti mempunyai motivasi yang “normal”.
Kemudian jika diambil angka 100 sebagai indeks (ukuran) normalitas, maka sebagian
besar orang yang kita selidiki akan mempunyai angka motivasi di sekitar 100. Hanya
sebagian kecil saja dari mereka yang angka motivasinya menyimpang jauh dari indeks
normalitas itu.
Salah satu tugas dari statistika adalah mencari suatu angka di sekitar mana nilai-
nilai dalam suatu distribusi memusat. Angka yang menjadi pusat suatu distribusi disebut
“tendensi sentral”. Ada tiga macam tendensi sentral yang sangat penting untuk dibahas,
yakni: Mean, Median, dan Mode. Ketiganya mempunyai cara-cara menghitung yang
berbeda-beda, dan mempunyai arti yang berbeda pula sebagai alat untuk mengadakan
deskripsi sesuatu distribusi.

3.2. Mean
Mean berarti “angka rata-rata”. Dari segi aritmetik Mean adalah “jumlah nilai-
nilai dibagi dengan jumlah individu”. Sebagai contoh, ada tiga orang berpenghasilan
10, 15 dan 20 rupiah tiap harinya. Rata-rata penghasilan mereka adalah 15 rupiah tiap
harinya. Ini dicari dengan cara sebagai berikut :
10 + 15 + 20 45
Penghasilan rata-rata = = = 15
3 3
Dari pernyataan itu dapat dikemukakan rumus Mean sebagai berikut :
X + X 2 + X 3 .... X n −1 + X n
Mean = 1
N
Rumus itu disingkat sebagai berikut :

M =
∑X
N
Simbul Σ adalah huruf Yunani yang disebut “Sigma” dan mempunyai arti jumlah.

a. Mean yang Ditimbang


Jika ada empat orang yang berpenghasilan 10 rupiah, seorang yang berpenghasilan
15 rupiah, dan seorang yang berpenghasilan 20 rupiah seharinya, maka Mean dari
penghasilan mereka tidak lagi 15 rupiah, melainkan 12,50 rupiah. Hal ini dapat dicari
dengan tabel sebagai berikut :

TABEL 3.1
TABEL CONTOH MENCARI MEAN YANG DITIMBANG
Penghasilan Frekuensi
fX
(X) (f)

Samsudi - STATISTIKA 15
20 1 20
15 1 15
10 4 40
N = 6 Σ fX = 75

Rumus Mean yang ditimbang adalah sebagai berikut :


M =
∑ fX
N
Diisi dengan bahan-bahan dari Tabel 12
75
M = = 12,50
6

b. Menghitung Mean dari Distribusi Bergolong


Sekali lagi perlu diingatkan disini bahwa X adalah mewakili “titik tengah” dari
interval kelas dalam distribusi.

TABEL 3.2
TABEL CONTOH MENCARI MEAN DARI DISTRIBUSI BERGOLONG
Penghasilan Titik Tengah
f fX
(X) (X)
145-149 147 1 147
140-144 142 3 426
135-139 137 5 685
130-134 132 8 1056
125-129 127 11 1397
120-124 122 17 2074
115-119 117 21 2457
110-114 112 22 2464
105-109 107 24 2568
100-104 102 20 2040
95-99 97 15 1455
90-94 92 12 1104
85-89 87 6 522
80-84 82 2 164
Jumlah -- N = 167 ΣfX =18559

M = ∑ fX
=
18559
= 111 ,13
N 167
3.3. Median
Median dapat dibatasi sebagai “suatu nilai yang membatasi 50 persen frekuensi
distribusi bagian bawah dengan 50 per sen frekuensi distribusi bagian atas.” Kita
misalkan ada distribusi penghasilan dari tujuh orang seperti tersebut dalam tabel
dibawah ini.

TABEL 3.3
TABEL CONTOH DISTRIBUSI PENGHASILAN UNTUK MENCARI MEDIAN
Individu Penghasilan (Rp)

Samsudi - STATISTIKA 16
1 10
2 12
3 13
4 14
5 16
6 16
7 20

a. Median pada Distribusi dengan Frekuensi Genap


Jika suatu distribusi mempunyai frekuensi genap, maka median dihitung secara
kom setujumi, yaitu dengan membagi dua nilai-nilai variabel yang ada ditengah-tengah
distribusi. Misalkan ada empat orang yang masing-masing mempunyai tinggi badan
162, 162, 164 dan 166 cm, ditambah 164 cm, kemudian dibagi dua. Pemecahan
semacam ini sama sekali tidak bertentangan dengan definisi median, sebab angka 163
cm, itu sebagai batas antara tinggi 162 dan 164 cm, membatasi 50 persen frekuensi
variabel di bagian atas, yaitu dua orang, dan 50 per sen frekuensi variabel di bagian
bawah distribusi, yaitu dua orang.

b. Mencari Median dari Distribusi Bergolong

Rumus untuk mencari median dari distribusi bergolong adalah sebagai berikut :
⎡1 / 2 N − cfb ⎤
Median = Bb + ⎢ ⎥i (7)
⎣ fd ⎦
Dalam mana :
Bb Adalah batas bawah (nyata) dari interval yang mengandung median
Cfb Frekuensi kumulatif (frekuensi meningkat) di bawah interval yang
mengandung median,
fd Frekuensi dalam interval yang mengandung median
i Lebar interval, dan
N Jumlah frekuensi dalam distribusi
Penggunaan rumus itu dapat kita lihat dari pekerjaan di bawah ini :

TABEL 3.4
TABEL CONTOH MENGHITUNG MEDIAN DARI DISTRIBUSI BERGOLONG
Interval Nilai f cf
100-104 1 55
95-99 3 54
90-94 5 51
85-89 fd 9 46
80-84 (13) 37
75-79 10 (24)
70-74 6 14
65-69 4 8
60-64 3 4
55-59 1 1
55
Jumlah --

Samsudi - STATISTIKA 17
Dalam contoh diatas, jumlah frekuensinya (atau N ) ada 55. Kalau ini kita bagi
dua hasilnya sama dengan 27,5 itu. Setelah ½ N ini kita ketemukan maka langkah
selanjutnya adalah menemukan interval kelas yang mengandung frekuensi kumulatif
27,5 itu, interval kelas yang kita maksudkan adalah 80-84, sebab cf 27,5 terkandung
dalam cf 37.
Batas bawah (nyata) atau Bb dari interval yang mengandung median itu adalah
79,50. Separo dari jumlah frekuensinya, atau ½ N adalah 55/2, sama dengan 27,50.
Frekuensi kumulatif di bawah interval yang mengandung median adalah 24 (24 adalah
cf di bawah 37, sedang cf 37 adalah cf yang mengandung median). Frekuensi dalam
interval adalah 13, sedang lebar interval atau i-nya ada lima. Diisikan dalam rumus kita
jumpai perhitungan sebagai berikut :

⎡1 / 2 N − cfb ⎤ ⎡ 27,50 − 24 ⎤
Mdn = Bb + ⎢ ⎥i = 79,50 + ⎢ ⎥5
⎣ fd ⎦ ⎣ 13 ⎦
⎡ 3,50 × 5 ⎤
= 79,50 + ⎢ ⎥ = 79,50 + 1,346 = 80,846
⎣ 13 ⎦
atau 80,85

Jadi, median dari distribusi tersebut 80,5.

3.4. Mode

a) Dalam Distribusi Tunggal : Nilai variabel yang mempunyai frekuensi


tertingi dalam distribusi;
b) Dalam Distribusi Bergolong : Titik tengah interval kelas yang
mempunyai frekuensi tertinggi dalam distribusi

a. Mode dalam Distribusi Tunggal


Jika ada serangkaian nilai-nilai 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, nilai yang timbul
paling banyak adalah 8. Nilai 8 itu disebut Mode dari distribusi nilai-nilai itu. Kalau
suatu distribusi sudah disusun dalam tabel, maka untuk mencari Mode-nya kita melihat
pertama kolom frekuensi.
TABEL 3.5
MENGHITUNG MEDIAN DARI DISTRIBUSI BERGOLONG
Nilai Frekuensi
10 1
9 0
8 15
7 18
6 4
5 3
4 1
3 1

Samsudi - STATISTIKA 18
Frekuensi yang tertinggi dari distribusi tersebut adalah 18. Nilai yang mempunyai
frekuensi tertinggi itu adalah nilai 7. Jadi yang menjadi modenya adalah nilai 7.

b. Tempat Kedudukan Mean, Median, dan Mode dalam Distribusi

Tempat kedudukan Mean, Median dan Mode dalam satu distribusi sangat
tergantung kepada bentuk distribusinya. Kita ingat kembali ada distribusi yang simetri
dan ada yang juling.
Jika dari suatu distribusi simetri normal kita hitung mean, median, dan modenya,
maka akan kita jumpai sifat yang khas, yaitu bahwa ketiga tendensi sentral itu bersekutu
satu sama lain. Hal ini mudak kita mengerti, sebab pada distribusi normal, mean
membagi dua sama banyak frekuensi variabel di atas dan dibawahnya. Dengan
demikian mean ini mempunyai fungsi seperti median. Karena yang menjadi mode
dalam distribusi normal adalah nilai yang ada pada mean, maka dengan sendirinya
mode itu bersekutu dengan mean. Jadi pada distribusi normal mean, median, dan mode
ketiga-tiganya berimpit. Untuk ilustrasi periksalah grafik 4.1.

frekuensi

N i l a i
Mean Median
Mode
Grafik 3.1 Ilustrasi mean, median dan mode

Soal Latihan

1. Jelaskan tentang segi segi kebaikan dan kelemahan yang dimiliki oleh:
a. Mean; b. Median; c. Modus.
2. Dalam kedaan yang bagaimana seharusnya kita mencari (menghitung);
a. Mean; b. Median; c. Modus.
3. Jelaskan adanya saling hubungan antara Mean, Median dan Modus dengan
mengemukakan contohnya!
4. Jelaskan bahwa Percentile sangat berguna untuk dipergunakan sebagai alat atau
ukuran untuk:
a. Mengubah raw score menjadi Nilai Standart Sebelas (Stanel).
b. Menetapkan Nilai Batas Lulus dalam suatu tes atau seleksi.

Samsudi - STATISTIKA 19
5. Dari sejumlah 266 orang lulusan SMK yang mengikuti Tes Seleksi Penerimaan
Calon Mahasiswa Baru pada sebuah Perguruan Tinggi, berhasil dicatat sekor hasil
ujian mereka dalam mata ujian Fisika sebagai berikut:

Sekor: frekuensi
90-94 4
85-89 10
80-84 14
75-79 19
70-74 30
65-69 33
60-64 40
55-59 32
50-54 25
45-49 21
40-44 18
35-39 10
30-34 6
25-29 3
20-24 1
266=N

Soal:
a. Berapakah Nilai Rata –rata hitung yang berhasil dicapai oleh 266 orang calon
yang mengikuti Tes Seleksi tersebut (dengan catatan bahwa perhitungan Nilai
Rata-rata Hitung itu hendaknya dilakukan dengan menggunakan Metode
Panjang dan Metode Singkat)?
b. Ubahlah hasil tes tersebut menjadi STANEL (Nilai Standart Sekala Sebelas),
dengan menggunakn ukuran Percentile!
c. Sekor berapa yang merupakan modus dari data tersebut diatas?
d. Jika dari jumlah 266 orang calon itu yang akan diluluskan (dinyatakan
diterima sebagai mahasiswa baru) hanya 45 orang, tetapkan Niali Batas
Lulusnya dengan menggunakan ukuran Percentile!
6. Dari kegiatan eksperimen yang dilakukan 6 kali, diperoleh sekor sebagai berikut:

Esperimen ke: Sekor:


1 26
2 13
3 20
4 18
5 10
6 15

Samsudi - STATISTIKA 20
Carilah Nilai Rata-rata Ukur dari sekor hasil eksperimen tersebut di atas tanpa
menggunakn daftar logarithma.

BAB IV

DEVIASI RATA-RATA DAN STANDAR DEVIASI

Tujuan

Mahasiswa memiliki pemahaman tentang deviasi rata-rata dan standar deviasi

Samsudi - STATISTIKA 21
4.1. Pengukuran Variabilitas
Ada dua orang atlet loncat tinggi yang sedang dilatih untuk menghadapi
kompetisi nasional atletik. Ahmad menunjukkan loncatan yang tidak dipastikan:
kadang-kadang dia meloncat setinggi 195, tetapi kadang-kadang dia hanya dapat
meloncat setinggi 165 cm. Mahmud, sebaliknya menunjukkan loncatan yang lebih
mantap sungguhpun dia tidak pernah meloncat setinggi 195 cm, tetapi dia juga tidak
pernah meloncat serendah 165 cm. Paling rendah loncatannya adalah 171 cm, sedang
paling tinggi 189 cm. Persoalannya adalah siapa yang akan dimajukan dalam
perlombaan kejuaran nasional itu apabila hanya seorang peloncat saja yang
diperkenankan untuk dimajukan. Loncatan Ahmad agak jauh dari mean loncatannya,
dibandingkan dengan loncatan Mahmud. Dengan istilah statistika dikatakan bahwa
loncatan Ahmad mempunyai variabilitas yang lebih besar dari pada loncatan Mahmud.
Yang dimaksud dengan variabilitas adalah derajat penyebarannilai-nilai variabel
dari suatu tendensi dalam suatu distribusi. Jika dua distribusi, katakana distribusi A dan
distribusi B dibandingkan, dan distribusi A menunjukkan penyebaran nilai-nilai
variabelnya yang lebih besar dari pada distribusi B, maka dikatakan bahwa distribusi A
mempunyai variabilitas yang lebih besar dari distribusi B. Variabilitas ini juga disebut
dispersi.
Untuk memutuskan apakah Ahmad ataukah Mahmud yang harus dimajukan dalam
perlombaan kejuaraan Nasional loncat tinggi, maka pelatih membutuhkan pengukuran
variabilitas loncatan kedua orang itu. Ada beberapa macam cara untuk mencari
variabilitas. Di sini yang akan dibicarakan hanyalah yang pokok-pokok saja, yaitu Mean
Deviation, dan Standard Deviation.

4.2. Deviasi Rata-rata (Mean Deviation)

Mean Deviation atau Average Deviation atau Deviasi Rata-rata adalah rata-rata
dari deviasi nilai-nilai dari Mean dalam suatu distribusi, diambil nilainya yang absolute.
Yang dimaksud dengan deviasi absolute adalah nilai-nilai yang negatif. Secara
aritmatika mean deviasi dapat didefinisikan sebagai mean dari harga mutlak dari deviasi
nilai-nilai individual.
Yang pertama dilakukan alada menghitung Mean, kemudian ditentukan berapa
besarnya penyimpangan tiap-tiap nilai dari mean itu. Misalnya, jika seorang mempunyai
IQ 110, sedang mean IQ dari grupnya = 100, maka deviasi IQ orang tesebut adalah 110
– 100 = +10. Jika orang lain dalam grup itu mempunyai IQ 85, maka deviasi orang itu
adalah 85 – 100 = - 15. Deviasi yang bertanda plus menunjukkan deviasi di atas mean,
sedang yang bertanda minus menunjukkan deviasi di bawah mean. Akan tetapi dalam
perhitungan mean deviasi tanda minus ditiadakan. Dalam statistika, deviasi diberi
simbul dengan huruf-huruf kecil seperti x, y, d, dan sebagainya. Rumusnya adalah x =
X – M atau y = Y – M. d = D – M, dan sebagainya.

Samsudi - STATISTIKA 22
Adapun rumus dari Mean deviasi adalah :

MD = ∑ x
N

Di mana : MD = Mean Deviasi


∑x = Jumlah deviasi dalam harga mutlaknya
N = Jumlah Individu / Kasus

Bagaimana menerapkan rumus itu untuk memperhitungkan mean deviasi dari


suatu distribusi dapat dilihat dari contoh sederhana di halaman berikut :

TABEL 4.1
TABEL CONTOH MENCARI MEAN DEVIATION
Deviasi dari Mean
Nilai Variabel
Dengan nilainya absolut
19 5
18 4
17 3
16 2
15 1
14 0
13 1
12 2
11 3
10 4
9 5
-- ∑ x = 30

Dengan N = 11 dan ∑ x = 30 maka


30
MD = = 2 , 73
11

4.3. Standard Deviasi

Secara matematik Standard Deviasi dibatasi sebagai “Akar dari Jumlah deviasi
kuadrad dibagi banyaknya individu” dalam distribusi. Untuk mencari standard deviasi
pertama-tama kita harus mencari mean ini dapat dicari dengan rumus yang sudah kita
ketahui :

M =
∑x
N
Dengan mengetahui mean ini kita dapat mencari deviasi nilai individual dari
mean. Ini dicantumkan dalam kolom kedua. Jumlah deviasi dari mean ini, yaitu Σ, x1 .
harus sama dengan NOL.
Samsudi - STATISTIKA 23
TABEL 4.2
TABEL CONTOH MENCARI STANDARD DEVIASI
Nilai Deviasi dari Deviasi dari
Variabel Mean Mean Kuadrat
(X) (X) (X2)
19 +5 25
18 +4 16
17 +3 9
16 +2 4
15 +1 1
14 0 0
13 -1 1
12 -2 44
11 -3 9
10 -4 16
9 -5 25
Total 7 80

Rumus stanadar deviasi sebagai berikut :

SD =
∑ X 2

N
Dalam mana :
SD = Standard Deviasi
2
∑x = Jumlah deviasi Kuadrat, dan
N = Jumlah individu / kejadian dalam distribusi
SD kadang-kadang diberi simbul ζ, disebut sigma (dari salah satu huruf Yunani), yang
diartikan Standart Devasi

4.3.1. Cara Lain Untuk Menghitung SD


Rumus untuk menghitung SD seperti yang telah dibicarakan dimuka adalah rumus
yang paling sederhana. Frekuensi dari tiap-tiap nilai tidak akan satu. Melainkan
berbeda-beda, bergerak dari bilangan 0 ke bilangan yang tak terhingga.
Rumus untuk menghitung SD dari distribusi yang tidak sama frekuensi tiap-tiap
nilai variabelnya adalah sebagai berikut :

SD =
∑ fx 2

Samsudi - STATISTIKA 24
Kedua rumus yang telah kita ketahui itu disebut rumus deviasi. Distribusi
demikian karena rumus itu menggunakan deviasi dari mean sebagai salah satu
komponennya. Di halaman berikut contoh mencari SD dengan rumus itu.

TABEL 4.3
TABEL UNTUK MENGHITUNG SD DENGAN RUMUS DEVIASI
X f fx x fx fx2
10 3 30 +3,60 10,80 38,88
9 9 81 +2,60 23,40 60,84
8 13 104 +1,60 20,80 33,28
7 23 161 +0,60 13,80 8,28
6 24 144 -0,40 9,60 3,84
5 13 65 -1,40 18,20 25,48
4 10 40 -2,40 24,00 57,60
3 5 15 -3,40 17,00 57,80
N = 100 ∑ fx = 640 ∑f2 = 286,00

M =
∑ fx SD =
∑ fx 2

N N
268,00
=
640 100
=
100 = 2,86
= 6,40 = 1,69

4.3.2. Rumus Angka Kasar


Rumusnya adalah sebagai berikut :

∑ ∑
2
f 2 ⎡ fx ⎤
SD = − ⎢ ⎥
N ⎣ N ⎦

Contoh menggunakan rumus tersebut:

TABEL 4.4
CONTOH MENGGUNAKAN RUMUS ANGKA KASAR UNTUK MENCARI SD
X f fx fx2
10 3 30 38,88
9 9 81 60,84
8 13 104 33,28
7 23 161 8,28
6 24 144 3,84
5 13 65 25,48
4 10 40 57,60

Samsudi - STATISTIKA 25
3 5 15 57,80

N = 100 ∑fX = 640 ∑fx2 = 4382

∑ ∑
2
f 2
⎡ fX ⎤
SD = − ⎢ ⎥
N ⎣ N ⎦
2
4382 ⎡ 640 ⎤
SD = − ⎢ ⎥
100 ⎣ 100 ⎦
= 43 , 82 − 40 , 96
= 2 , 86
= 1 , 69

4.3.3. Standar Kesalahan Mean


Rumus standard kesalahan mean sangatlah sederhana. Rumus itu berbunyi
sebagai berikut :
SD
SD M =
N −1
Jadi, apa yang harus kita kerjakan untuk memperoleh SDM adalah: pertama,
mencari SD dari angka kasar dari sampel kita; kedua, membagi SD itu dengan akar
dari jumlah subyek dalam sampel dikurangi satu.

TABEL 4.5
TABEL CONTOH MENCARI SDM
Nilai frekuensi
fx fx2
(X) (f)
8,0 1 8,00 64,00
7,5 0 0,00 00,00
7,0 11 77,00 539,00
6,5 21 136,50 887,25
6,0 24 144,00 864,00
5,5 9 49,50 272,25
5,0 5 25,00 125,00
4,5 1 4,50 20,25
Total : 72 444,50 2771,75
Simbul : N ∑fx ∑ fx2

M =
∑ fx = 444,50 = 6,17
N 72

SD =
∑ fx 2

− M 2

Samsudi - STATISTIKA 26
2771,75
= − 6,17 2
72
= 38,4965 − 38,0689
= 0,4276
= 0,654
SD 0,654 0,654
SDM = = = = 0,078
N −1 72 − 1 8,426

Soal Latihan

1. Berikan sebuah contoh sehingga menjadi cukup jelas, apa yang dimaksud dengan
deviasi!
2. Jelaskan hubungan antara deviasi Rata-rata (Average Deviation) dan deviasi Standart
(Standart deviation)!
3. Semakin kecil Deviasi Standart dari sekelompok data, maka data tersebut semakin
besifat homogen. Betulkah penyataan itu? Jelaskan denagn menggunakan sebuah
contoh!
4. Tunjukkan bahwa antara Deviasi Rata-rata dan Deviasi Standart terdapat saling
hubungan! Berikan contohnya!
5. Kemukakan beberapa keunggulan Deviasi Rata-rata dan Deviasi Standart.
6. Mean dan deviasi standart dapat dipergunakan sebagai alat bantu dalam rangka
Evaluasi Hasil Belajar Anak Didik. Jelaskan pernyataan tersebut!
7. Data yang tertera pada table berikut:

x f fx x x2 fx2
31 4 124
30 4 120
29 5 145
28 7 196
27 12 324
26 8 208
25 5 125
24 3 72
23 2 46
Total 50=N 1360=ΣfX

Soal:
a. Buatlah table distribusi frekuensinya;
b. Carilah Nilai Rata-rata Hitungnya;
c. Carilah Deviasi Rata-ratanya;
d. Carilah deviasi Standartnya dengan menggunakan cara mencari Deviasi Standart
untuk data tunggal yang sebagian atau seluruh sekornya berfrekuensi lebih dari
satu.

Samsudi - STATISTIKA 27
BAB V

uji hipotesisi perbedaan mean

Tujuan

Samsudi - STATISTIKA 28
Mahasiswa memiliki pemahaman tentang hipotesis, pengujian hipotesis perbedaan
antara dua mean dan standar kesalahan perbedaan dua mean

Beberapa ahli statistika menyarankan agar diadakan pembedaan antara statistika


inferensial yang bertugas mengadakan estimasi dengan statistik inferensial yang
bertugas mengadakan pengujian hipotesis. Statistik inferensial untuk estimasi terutama
mencurahkan perhatian pada kegiatan mengadakan estimasi tentang parameter dari
penelitian terhadap sampel yang baik. Dengan sampel yang baik dimaksudkan (a)
sampel yang diambil secara random; dan (b) sampel yang setujuposional jika populasi
terdiri dari sub-sub golongan.

5.1. Pengertian Hipotesis


Istilah hipotesis sebenarnya adalah kata majemuk, terdiri dari kata-kata hipo dan
tesis. Hipo berasal dari kata Junani hupo, yang berarti dibawah, kurang atau lemah.
Tesis berasal dari kata Junani thesis, yang berarti teori atau setujuporsi yang disajikan
sebagai bukti. Hipotesis adalah pernyataan yang masih lemah kebenarannya dan masih
perlu diuji kenyataannya. Jika suatu hipotesis telah diuji kebenarannya, namanya bukan
lagi hipotesis, melainkan suatu tesis.
Suatu hipotesis akan diterima kalau data-data dan bahan-bahan penelitian
membenarkan pernyataan itu. Dan akan ditolak jika kenyataan menyangkalnya. Pada
gilirannya suatu tesis dapat dipandang sebagai hipotesis kalau oleh suatu alasan suatu
penelitian masih menginginkan mengujinya kembali.

5.2. Menyatakan Hipotesis


Apabila akan diadakan penelitian komparatif tentang kecerdasan (atau variabel-
variabel lainnya) wanita dan pria, kita dapat menyatakan hipotesis dalam bentuk yang
bermacam-macam:
(1) Pria lebih cerdas dari pada wanita.
(2) Wanita lebih cerdas dari pada peria.
(3) Wanita dan pria sama cerdasnya.
(4) Tidak ada perbedaan kecerdasan antara pria dan wanita.
(5) Wanita lebih cerdas dalam bidang A, tetapi pria lebih cerdas dalam bidang B.
(6) Wanita dan pria sama cerdasnya dalam bidang A, tetapi wanita lebih cerdas dalam
bidang B.
Tiap-tiap hipotesis selalu dinyatakan dalam bentuk statemen atau pernyataan,
bukan dalam bentuk pertanyaan. Hipotesis yang paling sederhana, setidak-tidaknya dari
teoritik, adalah apa yang disebut hipotesis nihil atau null hypothesis. Istilah nihil di sini

Samsudi - STATISTIKA 29
menunjuk kepada tidak adanya perbedaan antara sampel yang satu dengan sampel
lainya dalam sesuatu hal yang diteliti.

5.3. Menguji Hipotesis-Perbedaan Antara Dua Mean


Tujuan suatu eksperimen adalah mencari pengaruh dari perlakuan yang
dibedakan. Jadi misalnya kalau kita mengadakan eksperimen tentang akibat
kepemimpinan yang demokratik dan kepemimpinan yang otokratik, kita
memperlakukan suatu kelompok dengan pemimpin yang demokratik dan kelompok lain
dengan pemimpin yang otokratik. Kemudian kita cari ada tidaknya perbedaan antara
tingkah laku kedua kelompok itu. Tiap-tiap eksperimen akhirnya harus membandingkan
sedikitnya dua kelompok dalam segi-segi yang dieksperimenkan.

5.4. Standar Kesalahan Perbedaan Mean


Apabila kita ambil sepasang sampel yang masing-masing terdiri dari anak-anak
laki-laki dan perempuan dan kita hitung mean-meannya, kita memperoleh perbedaan
mean antara kedua sampel dari kedua jenis kelamin itu. Demikian seterusnya, kita dapat
mengambil pasangan-pasangan sampel lain dari kedua jenis kelamin itu, kita akan
memperoleh distribusi perbedaan mean. Distribusi ini disebut distribusi sampling
distribution of the mean differences, atau distribusi sampling daripada perbedaan
mean. Statistik untuk ini disebut standard kesalahan perbedaan, yang tidak lain dan
tidak bukan adalah SD dari pada perbedaan-perbedaan. Standard kesalahan perbedaan
mean diberi simbul SD (M1 – M2) atau disingkat saja SDbM.
Rumus standard kesalahan perbedaan mean:

2 2
SD bM = SD + SD
M 1 M 2

Keterangan:
SDbM = Standard Kesalahan Perbedaan Mean.
2
SD = KUADRAT Standard kesalahan mean dari sampel I, Disebut juga
M1

varians mean sampel I.


2
SD = KUADRAT Standard kesalahan mean dari sampel II, Disebut juga
M2

varians mean sampel II.

Untuk mencari standard kesalahan mean rumusnya adalah:


− SD
SD M = atau jika dikuadradkan menjadi
N −1
SD 2
SD M =
2

N − 1

Contoh:
TABEL 5.1
TABEL DISTRIBUSI HASIL UJIAN SEMESTER SISWA LAKI-LAKI DAN PEREMPUAN

Samsudi - STATISTIKA 30
LAKI-LAKI PEREMPUAN
Interval 2
x f fx fx y f fy fy2
50-54 52 0 0 0 52 1 52 2.704
45-49 47 5 235 11.045 47 1 47 2.209
40-44 42 7 294 12.348 42 9 378 15.876
35-39 37 11 407 15.059 37 5 185 6.845
30-34 32 4 128 4.096 32 7 224 7.168
25-29 27 13 351 9.477 27 12 324 8.748
20-24 22 13 286 6.292 22 7 154 3.388
15-19 17 12 204 3.468 17 16 272 4.624
10-14 12 16 192 2.304 12 20 240 2.880
5-9 7 0 0 0 7 3 21 147
Total : - 81 2.097 64.089 - 81 1.897 54.589
Dengan kode x untuk laki-laki dan y untuk perempuan, maka statistiknya adalah
sebagai berikut :
Mx =
∑ fx
=
2 .007
= 25 ,89
N 81

SD 2
=
∑ fx
− M M2
M
N M
84 .089
= − 25,89
81
= 791, 22 − −670 , 29
= 120 ,93
SDM2 120,93 120,93
SD 2
= = = = 1,51
Mx
N X − 1 81 − 1 80

My =
∑ fy = 1.897 = 23,42
Ny 81
SD Y2 125 , 44
SD M2 = −1 =
SDy2 =
∑ fy 2

− M Y2
N y 81 − 1
Ny 125 , 44
= = 1, 57
80
54.589
= − 23,422
81
= 673,94 − 548,50
= 125,44
= 1 , 51 + 1 , 57
SDbM = SDM2 X + SDM2 y = 3 , 08
= 1 , 75499

Samsudi - STATISTIKA 31
Soal Laihan
1. Data tes kecerdasan siswa yang masuk pagi dan masuk siang:

Masuk pagi Masuk siang


Interval
x f fx fx2 y f fy fy2
50-54 50 0 52 1
45-49 42 5 47 1
40-44 41 7 42 9
35-39 37 11 35 5
30-34 32 4 32 7
25-29 25 13 25 12
20-24 22 13 22 7
15-19 17 12 17 16
10-14 12 16 12 20
5-9 7 0 7 3
Total : - 81 - 81

Hitunglah:
a. Mean masing-masing variabel
b. Standar deviasi
c. Standar deviasi perbedaan mean dari dua variabel

Samsudi - STATISTIKA 32
BAB VI

TEKNIK ANALISIS KORELASIONAL

Tujuan

Mahasiswa memiliki pemahaman tentang teknik-teknik korelasi dalam analisis


statistika yang meliputi: arah hubungan, koefisien korelasi, korelasi product,
moment dan uji taraf signifikansi

Samsudi - STATISTIKA 33
Salah satu teknik statistika yang sering digunakan untuk mencari hubungan
antara dua variabel adalah teknik korelasi. Dua variabel yang hendak diteliti
hubungannya itu biasa diberi kode varaibel X dan variabel Y. Jadi misalnya, kita ingin
menetapkan apakah ada hubungan atau tidak antara tinggi badan dan kecerdasan,
variabel tinggi badan kita beri kode X, sedang variabel kecerdasan kita sebut Y, atau
sebaliknya.

6.1. Arah Hubungan


Jika kenaikan nilai variabel X selalu disertai kenaikan nilai variabel Y, dan
sebaliknya turunnya nilai variabel x selalu diikuti oleh turunnya nilai varaibel y, maka
hubungan semacam itu disebut hubungan yang positif. Namun sebaliknya jika kenaikan
nilai variabel X yang tinggi selalu disertai oleh turunnya nilai variabel Y, atau jika
turunnya nilai variabel X selalu diikuti oleh naiknya nilai varaibel Y, hubungan antara
kedua variabel tersebut disebut bersifat negatif.
Perlu diketahui, ada juga kemungkinannya bahwa kedua variabel itu tidak
mempunyai hubungan, atau dalam istilah teknis statistika dikatakan mempunyai
hubungan yang nihil, jika kenaikan variabel yang satu kadang-kadang disertai turunnya
nilai variabel lainnya, dan kadang-kadang juga diikuti oleh kenaikan nilai variabel yang
lain tersebut.

6.2. Koefisien Korelasi


Pada umumnya besar-kecilnya hubungan dinyatakan dalam bilangan. Bilangan
yang menyatakan besar-kecilnya hubungan itu disebut koefisien hubungan atau
koefisien korelasi. Koefisien korelasi itu bergerak diantara 0,000 sampel +1,000 atau di
antara 0,000 sampai -1,000, tergantung kepada arah korelasi, nihil, positif, dan negatif.
Salah Satu sarat yang perlu diperhatikan dalam penggunaan teknik korelasi
adalah bahwa hubungan antara x dan y adalah hubungan yang linier. Artinya jika kita
buat scatter diagram (diagram pencaran) dari nilai-nilai variabel x dan nilai-nilai
varaibel y, maka dapat kita tarik garis lurus pada pencaran titik-titik kedua nilai
variabel itu.

6.3. Korelasi setujuduct Moment dan Cara Menghitungnya


Sebenarnya ada berbagai macam teknik statistik yang digunakan untuk mencari
korelasi. Tetapi satu diantaranya yang dikembangkan oleh KARL PEARSON dan

Samsudi - STATISTIKA 34
disebut teknik korelasi prouduct moment dari PEARSON. Rumus koefisien korelasi
product moment adalah:

rxy =
∑ xy
N.SDx SDy

Di mana :
rxy = Koefisien korelasi antara x dan y
xy = setujuduct dari x kali y
SDx = Standard deviasi dari varaibel x
SDy = Standard deviasi dari variabel y.
N = Jumlah subyek yang diselidiki

Contoh menghitung korelasi product moment:

TABEL 6.1
KOEFISIEN KORELASI
ANTARA VARAIBEL KEMAMPUAN BERBAHASA (X) DAN MATEMATIK (Y)
Subyek Kemamp. Matematik Subyek Kemamp. Matematik
No. Berbahasa (Y) No. Berbahasa (Y)
(X) (X)
1. 130 20 16. 178 35
2. 132 24 17. 172 30
3. 152 28 18. 165 28
4. 142 23 19. 160 27
5. 184 37 20. 148 25
6. 190 32 21. 180 24
7. 150 25 22. 149 25
8. 170 23 23. 188 36
9. 181 29 24. 167 29
10. 164 35 25. 162 27
11. 175 32 26. 145 23
12. 135 22 27. 150 29
13. 147 24 28. 160 30
14. 162 26 29. 172 31
15. 136 21 30. 154 30

Langkah-langkah menghitung koefisien korelasi dengan rumus di atas adalah :


1. Cari mean dari kedua variabel yang bersangkutan sebut kedua mean itu Mx dan My.
2. Cari SD dari kedua varaibel itu. Sebut kedua SD itu SDx dan SDy.
3. Cari deviasi-deviasi tiap-tiap nilai kedua variabel itu. Sebut –x untuk deviasi
variabel x dan y untuk variabel Y. Jangan lupa mengecek:

∑x=0 dan ∑ y = 0
4. Kalikan tiap-tiap x dengan tiap-tiap y yang sebaris, dan masukkan dalam kolom xy,
dan
Samsudi - STATISTIKA 35
5. Jumlahkan kolom xy untuk memperoleh ∑ xy .

TABEL 6.2
TABEL UNTUK MENGHITUNG KOEFISIEN KORELASI
PRODUCT MOMENT, BAHAN DIAMBIL DARI TABEL 6.1
Subyek x y x x2 y y2 xy
(1) (2) (3) (4) (5) (6) (7) (8)
1. 130 20 -30 900 -8 64 +240
2. 132 24 -28 784 -4 16 +112
3. 152 28 -8 64 0 0 0
4. 142 23 -18 324 -5 25 +90
5. 184 37 +24 576 +9 81 +216
6. 190 32 +30 900 +4 16 +120
7. 150 25 -10 100 -3 9 +30
8. 170 23 +10 100 -5 25 -50
9. 181 29 +21 441 +1 1 +21
10. 184 35 +4 16 +7 49 +28
11. 175 32 +15 225 +4 16 +60
12. 135 22 -25 625 -6 36 +150
13. 147 24 -13 169 -4 16 +52
14. 162 26 +2 4 -2 4 -4
15. 136 21 -24 576 -7 49 +168

16. 178 35 +18 324 +7 49 +126


17. 172 30 +12 144 +2 4 +24
18. 165 28 +5 25 0 0 0
19. 160 27 0 0 -1 1 0
20. 148 25 -12 144 -3 9 +36
21. 180 34 +20 400 +6 36 +120
22. 149 25 -11 121 -3 9 +33
23. 188 36 +28 784 +8 64 +224
24. 167 29 +7 49 +1 1 +7
25. 162 27 +2 4 -1 1 -2
26. 145 23 -15 225 -5 25 +75
27. 150 29 -10 100 +1 1 -10
28. 160 30 0 0 +2 4 0
29. 172 31 +12 144 +3 9 +36
30. 154 30 -6 36 +2 4 -12
Total : 4.800 840 0 8.304 0 624 +1890

Samsudi - STATISTIKA 36
Dengan tabel di atas dapat kita peroleh data sebagai berikut:

Variabel Kemampuan Berbahasa Variabel Matematik


1. N = 30

2. M x =
∑x 2. M Y =
∑Y
N N
4.800 840
= = 160 = = 28
30 30

3. SDx =
∑x 2

3. SDy =
∑y 2

N N
8.304 624
= = 16,64 = = 4,56
30 30
4. ∑ xy = 1.890
Besarnya koefisien korelasi:

rxy =
∑ xy = 1.890
= 0,830
N .SDx SDy (30)(16,64)(4,56)

6.4. Uji Taraf Signifikansi


Tabel korelasi itu mencantumkan batas-batas nilai r yang signifikan (berarti)
pada taraf-taraf signifikansi tertentu. Jika nilai r yang kita peroleh sama dengan atau
lebih besar dari pada nilai r dalam tabel r itu, maka nilai r yang kita peroleh itu
signifikan. Dengan nilai r yang signifikan kita akan menolak hipotesis yang
mengatakan bahwa korelasi antara x dan y dalam populasi adalah nul, atas dasar taraf
signifikansi yang kita gunakan (yaitu 5% atau 1%).
Nilai yang kita peroleh adalah 0,830. Dengan nilai f itu kita hendak menguji
apakah nilai itu signifikan ataukah tidak atas dasar taraf signifikan 5%. Jumlah subyek
atau N yang diselidiki ada 30. dengan melihat N = 30 dalam kolom N dan membacanya
kekanan dalam kolom taraf signifikansi 5% dakan tabel r maka kita ketemukan bilangan
0,361. Bilangan ini menunjukkan bilangan batas signifikansi. Oleh karena nilai r yang
kita peroleh, yaitu 0, 830 berada jauh di atas batas signifikansinya, yaitu 0,361, maka
nilai r yang kita peroleh itu kita katakan signifikan. Dengan demikian kita menolak
hipotesis nihil yang mengatakan bahwa nihil r dalam populasi adalah nul (tidak ada
korelasi antara x dan y, atau tegasnya tidak ada korelasi antara pengetahuan umum dan
matematik).

Soal Latihan

1. Berikan pengertian tentang kolerasi!


2. Apa yang dimaksud dengan kolersi positif dan kolerasi negatif!
Samsudi - STATISTIKA 37
3. Jelaskan difinisi tentang angka Indeks kolerasi!
4. Jelaskan tentang pengertian dan penggunaan dari teknik Kolerasi Product Moment
dan Pearson!
5. Data:
Subyek: Sekor pada Variabel:
X Y
A 8 5
B 4 5
C 6 7
D 5 6
E 7 6
F 4 5
G 9 6
H 6 7
I 5 6
J 6 7

Soal: Selidikilah dengan secara seksama, apakah memang terdapat korelasi positif
yang signifikan antara sekor variabel X dan sekor variabel Y, dengan cara:
a. Merumuskan hipotesis alternatifnya
b. Merumuskan hipotesa Nihilnya
c. Melakukan perhitungan untuk memperoleh angka Indeks Korelasi rxy, dengan
mencari SD-nya lebih dulu!
d. Memberikan interpretasi sederhana (secara kasar) terhadap rxy.
e. Memberikan interpretasi terhadap rxy dengan cara berkonsultasi pada Tabel
Nilai “r” Product moment.
f. Kesimpulan apa yang dapat saudara kemukakan?

6. Data:
Sekor Variabel X:
67 72 66 70 73 72 70 69 71 69
73 74 66 72 73 70 72 73 71 72
70 68 79 66 68 71 73 67 69 72
71 73 69 68 66 72 71 70 69 68
71 60 68 67 69 70 71 72 69 72
Sekor Variabel Y (Urutan sama dengan variabel Y):
59 64 58 62 65 64 62 61 63 61
65 66 58 64 65 62 64 65 63 64
62 60 60 58 60 63 65 59 61 64
63 65 61 60 58 64 63 62 61 60
65 60 62 60 59 64 66 63 59 60

Soal:
Coba selidiki dengan cara seksama, apa memang terdapat kolerasi positif yang
menyakinkan (signifikan) antara sekor variabel X dan sekor variabel Y, dengan cara:

Samsudi - STATISTIKA 38
a. Merumuskan Hipotesis alternative
b. Merumuskan Hipotesa Nihilnya!
c. Melakukan perhitungan untuk memperoleh Angka Indeks Kolerasi “r” Product
Moment, dengan Tabel Nilai “r”!
d. Memberikan interpretasi terhadap rxy denagn menggunakan Tabel nilai “r”!
e. Menarik Kesimpulan.

7. Dalam suatu kegiatan penelitian, diperoleh data sebagaimana tertera dalam table
berikut:
Sekolah Asal dan Prestasi Tes SIPENMARU dari 1760 Calon
Prestasi Tes
Sekolah Asal: Jumlah
SIPENMARU:
SLTA Negeri SLTA Swasta
Lulus 270 470 740
Tidak Lulus 180 840 1020
Jumlah 450 1310 1760

Soal:
a. Rumuskan hipotesis alternatif dan hipotesis nihilnya!
b. Cari / Hitunglah Angka Indeks Korelasinya, dengan menggunakan Teknik Korelasi
Koefisien Phi.
c. Berikan interpretasi terhadap Phi dan kemukakan kesimpulannya

Samsudi - STATISTIKA 39
BAB VII

TEKNIK ANALISIS KOMPARASIONAL

Tujuan

Mahasiswa mampu menerapkan teknik Chi-Kuadrat dan t-score sebagai alat uji
hipotesis dalam teknik analisis komparasional.

Samsudi - STATISTIKA 40
7.1. Chi Kuadrad

Teknik analisis Chi-Kuadrat digunakan jika peneliti lebih berminat meneliti


frekuensi individu-individu yang termasuk dalam sesuatu kategori sifat atau ciri gejala
dengan jalan penghitungan atau counting. Chi-Kuadrat (baca Kai Kuadrat) adalah suatu
teknik statistika yang memungkinkan peneliti menilai perbedaan frekuensi yang nyata
diobservasi, dengan frekuensi yang diharapkan dalam kategori-kategori tertentu
sebagai akibat dari kesalahan sampling. Sebagai bagian dari statistika inferensial chi
kuadrad dapat digunakan untuk mengadakan estimasi maupun untuk pengetesan
hipotesis. Di bawah ini secara berturut-turut akan dibicarakan lebih dahulu Chi Kuadrat
untuk estimasi, kemudian disambung dengan Chi Kuadrat untuk pengetesan hipotesis.

7.1.1. Chi-Kuadrat Sebagai Alat untuk Estimasi

Jika kita ingin mengetahui sikap rakyat terhadap koedukasi (sekolah campuran
murid-murid puteri dan putersa). Untuk ini kita mengambil suatu sampel yang terdiri
dari 200 orang dan mengajukan pertanyaan kepada mereka untuk memperoleh pendapat
mereka. Kita misalkan jawaban mereka adalah 115 orang mengatakan setuju dan 85
orang mengatakan tidak setuju.
Dalam contoh di atas, kalau tidak ada sumber-sumber lain yang memberi
ketentuan, kita mengajukan hipotesis bahasan dalam populasi frekuensi dari mereka
yang setuju dan tidak setuju koedukasi terbagi rata (50% lawan 50%). Kita
menanyakan, mengapa kita peroleh perbandingan 115 dengan 85 antara mereka yang
setuju dan yang tidak setuju dari suatu sampel yang kita ambil secara random? Apakah
perbedaan itu hanya semata-mata disebabkan oleh kesalahan sampling, ataukah
memang dalam populasi terdapat perbedaan semacam itu?
Kalau kita mengharapkan frekuensi dari mereka yang setuju dan yang tidak
setuju terbagi rata, maka frekuensi yang diharapkan adalah yang setuju 100 orang
dan yang tidak setuju 100 orang, dalam sampel yang jumlahnya 200 orang itu.
Frekuensi yang diperoleh (disingkat fo) dan frekuensi yang diharapkan (disingkat fh)
dari mereka yang setuju dan yang tidak setuju dapat ditunjukkan dalam tabel sebagai
berikut:

TABEL 7.1
Samsudi - STATISTIKA 41
FREKUENSI YANG DIPEROLEH DAN YANG DIHARAPKAN
frekuensi frekuensi
Sikap terhadap
Yang diperoleh Yang diharapkan
Ke-edukasi
(fo) (fh)
Setuju 115 100
Tidak setuju 85 100
Total : 200 200

Syarat yang perlu dipenuhi adalah jumlah fo harus sama dengan fh. Dalam tabel
di atas ketentuan ini telah kita indahkan, yaitu masing-masing fo = 200 dan fh = 200.

7.1.2. Rumus untuk Menghitung Chi-Kuadrat


Rumus umum Chi Kuadrat adalah sebagai berikut :
( fo − fh )
2
χ 2
= ∑ fh
Dimana :
χ2 = Chi Kuadrat
fo = frekuensi yang diperoleh (diobservasu dalam)sampel
fh = frekuensi yang diharapkan dalam sampel sebagai
pencerminan dari frekuensi yang diharapkan dalam
populasi.
Tabel kerja persiapan perhitungan Chi Kuadrat sebagai berikut:

TABEL 7.2
TABEL KERJA PERHITUNGAN CHI KUADRAT

Sikap fo fh fo-fh (fo-fh) 2 (f o − fh )


2

fh
Pro +15 225
115 100 2,25
tidak -15 225
85 100 2,25
setuju
Total : 200 200 0 - 4,50

Dari angka-angka dalam table di atas, didapat nilai Chi Kuadrat:


χ 2 = ∑
( f o − f h )2 = 4 , 50
fh

7.1.3. Derajat Kebebasan untuk Chi-Kuadrat


Derajat kebebasan atau d.b untuk nilai-nilai χ2 tidak tergantung kepada jumlah
individu dalam sampel. Derajad kebebasan itu diperoleh dari kenyataan berapa
banyaknya kebebasan yang kita miliki dalam menetapkan isi petak-petak yang
diharapkan dalam tabel kita. Untuk memahami hal ini dapat dilihat tabel berikut:

Samsudi - STATISTIKA 42
Kategori fO fh

- a b
I
II c d
Jumlah : (a+b) (m+n)

Derajad kebebasan untuk bentuk tabel di atas adalah 1. Dengan d.b = 1 maka
untuk taraf signifikansi 5%, berlaku ketentuan jika χ O2 ≥ χ B2 5%, nilai Chi Kuadrat
yang kita peroleh, atau χ2 itu kita katakan signifikan; dan sebagai konsekuensinya
hipotesis (nihil) akan kita tolak. Sebaliknya jika χ o2 < χ b2 5% nilai χ2 itu kita katakan
nonsignifikan, dan berbagai konsekwensinya hipotesis (nihil) akan kita terima.

Nilai χ 02 = 4,50 sedang taraf signifiknsi 5% dengan d.b. = 1, nilai χ h2 = 3,841 .


Dengan demikian χ 02 itu signifikansi, karena ia sudah melebihi χ h2 yang kita pandang
sebagai bilangan χ2 maksimal sebagai akibat dari kesalahan sampling atas dasar taraf
signifikansi 5%. Konsekwensinya, jika kita yakin bahwa sarat sampel random telah kita
penuhi, maka kita tolak hipotesis nihil yang mengatakan bahwa separo dari populasi
setuju koedukasi dan separo lagi tidak setuju.

7.1.4. Chi-Kuadrat Sebagai Alat untuk Pengujian Hipotesis


Chi-Kuadrat juga dapat digunakan untuk menguji hipotesis, yakni untuk
menguji apakah perbedaan frekuensi yang diperoleh dari dua sampel (atau lebih)
merupakan perbedaan frekuensi yang hanya disebabkan oleh kesalahan sampling,
ataukah merupakan perbedaan yang signifikan. Di bawah ini diberikan contoh-contoh
tentang bagaimana menguji hipotesis perbedaan frekuensi yang signifikan atau tidak.

Contoh
Suatu penelitian dilakukan dengan tujuan untuk mengetahui apakah ada
hubungan atau tidak antara kualifikasi pendidikan (S1 dan SLTA) dengan cara
mengikuti berita-berita di media masa. Untuk ini diberikan daftar pertanyaan atau
angket kepada dua sampel, yaitu sampel tamatan sekolah tinggi dan sampel tamatan
sekolah menengah. Kepada mereka ditanyakan, apakah mereka mengikuti berita-berita
dengan perantaraan radio ataukah surat kabar. Dari 200 orang tamatan sekolah tinggi
yang ditanyai, 130 orang menjawab melalui “radio” sedang dari 100 orang tamatan
SMA ada 55 orang yang menjawab melalui “radio”. Data tersebut dapat dihimpun
dalam tabel kerja sebagai berikut:

TABEL 7.3
TABEL FREKUENSI YANG DIPEROLEH DAN YANG DIHARAPKAN

Sumber berita
Sampel Total
Radio Surat Kabar
Samsudi - STATISTIKA 43
Tamatan S1 130 70 200
Tamatan SLTA 55 45 100
Total 185 115 300

Hipotesis nihil untuk masalah di atas adalah: “tidak ada perbedaan yang
signifikan antara frekuensi sampel I (tamatan S1) dengan frekuensi sampel II (tamatan
SLTA) dalam memilih sumber-sumber berita. Kita lihat dalam tabel itu bahwa ada 185
orang dari 300 orang yang memilih radio sebagai sumber berita (atau dinyatakan dalam
per se n ada 61,67 %), dan ada 115 orang dari 300 orang yang memilih surat kabar (atau
dinyatakan dalam per se nada 38,33%). Persentase-persentase itulah yang kita gunakan
sebagai dasar menetapkan frekuensi yang kita harapkan bagi sampel tamatan sekolah
menengah atas ada 61,67% dari 100 orang, ada 61,67 orang. Atas dasar data tersebut
dibuat table kerja sebagai berikut:
TABEL 7.4
TABEL KERJA UNTUK MENGETES PERBEDAAN FREKUENSI

Sampel
Sumber
fo fh fo-fh (fo-fh) 2 (f o− fh )
2

Berita
fh
Sekolah Radio 130 123,33 +6,67 44,49 0,36
Tinggi Surat Kabar 70 76,67 -6,67 44,49 0,58
Sekolah Radio 55 61,67 -6,67 44,49 0,72
Menengah Surat 45 38,33 +6,67 44,49 1,16
Atas Kabar
Total : 300 300,00 0,00 - 2,82

Jadi nilai Chi Kuadrat yang kita peroleh adalah :


( fO − fh )
2

χ =
2
∑ fh
= 2 ,82

Dari Tabel di atas 2x2 (dengan 2 baris dan 2 kolom semacam itu derajad
kebebasan diperoleh dari rumus d.b. = (b-1) (k-1) dalam mana d.b. = derajad kebebasan,
b = baris, dan k = kolom. Atau riilnya, untuk tiap-tiap tabel 2x2 d.b. nya = satu,
diperoleh dari (2-1) (2-1). Berdasarkan hasil Chi Kuadrat = 2,82 menunjukkan bahwa
baik atas dasar taraf signifikansi 5% maupun 1% perbedaan frekuensi yang diperoleh
itu tidaklah signifikan. Konsekwensinya adalah hipotesis nihil yang diajukan, yaitu
bahwa tidak ada perbedaan yang signifikan dalam frekuensi pilihan sumber-sumber
berita dari tamatan S1 dan tamatan SLTA diterima.

7.2. t-Score

Pada dasarnya t-score tidak lain adalah z-score hanya saja di sini kita tidak lagi
menghadapi distribusi angka kasar, melainkan distribusi perbedaan. Inilah sebabnya

Samsudi - STATISTIKA 44
mengapa yang dijadikan x bukan sesuatu angka kasar, tetapi angka perbedaan mean,
kedua sampel yang diteliti. Lengkapnya t-score itu adalah sebagai berikut :

Mx −M −Mh
t =
y

SD bM

Dimana :
Mx = Mean dari sampel x
My = Mean dari sampel y
Mh = Mean hipotetik dari distribusi perbedaan mean
SDbM = Standard kesalahan perbedaan mean

Oleh karena Mh = 0, maka rumusnya mejadi:

M − M
t =
x y

SD bM

Sebagai contoh, data pada tabel 6.1, mean-mean yang kita peroleh adalah 25,89 dan
23,42 dengan SDbM = 1,75499. Jika kita mengisikan bilangan-bilangan itu ke dalam
rumus t- score, akan kita peroleh:

M − M 25 ,89 − 23 , 42 2 , 47
t= = = = 1, 407
x y

SD bM 1, 75499 1, 75499

Jika kita menggunakan taraf kepercayaan atau taraf penerimaan 95% (lebih
sering disebut taraf signifikansi 5%), maka kita tidak mempunyai bukti-bukti untuk
menolak hipotesis “bahwa tidak ada perbedaan antara kecerdasan murid-murid putera
dan murid-murid puteri yang kita teliti”. Atau dengan perkataan lain boleh dinyatakan
bahwa berdasarkan bukti-bukti yang dikumpulkan ternyata bahwa antara kedua jenis
kelamin itu dengan taraf kepercayaan 95% tidak terdapat perbedaan dalam hal
kecerdasan sebagaimana ditunjukkan oleh hasil test kecerdasan.

7.2.1. t-Test Untuk Sampel-Sampel yang Berkorelasi


t-Test sering juga digunakan dalam eksperimen-eksperimen yang menggunakan
sampel-sampel yang berkorelasi (correlated samples). Yang dimaksud dengan sampel-
sampel berkorelasi adalah sampel-sampel yang sudah disamakan (di-matched) salah
satu variabel (mungkin juga dua tiga variabelnya atau lebih). Misalnya saja, koefisien
kecerdasan atau IQ lebih diketahui mempunyai pengaruh terhadap prestasi belajar.
Dalam eksperimen-eksperimen yang menyangkut prestasi belajar, misalnya tentang
Samsudi - STATISTIKA 45
pengaruh metode belajar, misalnya tentang pengaruh metode terhadap prestasi sesuatu
mata pelajaran, maka IQ anak-anak yang ditugaskan dalam kelompok eksperimen dan
kelompok kontrol disamakan (dianggap) lebih dahulu. Maksudnya agar jika ada
perbedaan-perbedaan prestasi belajar dari eksperimen itu, dapat disimpulkan bahwa
perbedaan-perbedaan tersebut semata-mata ditimbulkan oleh perbedaan metode-metode
yang dieksperimenkan, bukan perbedaan yang diakibatkan oleh perbedaan IQ dari anak-
anak yang ditugaskan dalam kelompok eksperimen dan kelompok kontrol.

Ada dua rumus yang dipersiapkan untuk meneliti signifikansi perbedaan mean
dari sampel-sampel yang berkorelasi. Kedua rumus ini akan memberikan hasil yang
sama. Cuma saja rumus yang satu, disebut rumus panjang atau Long method, melalui
jalan yang melingkar-lingkar, sedang rumus yang satunya lagi, dibuat rumus pendek
atau short method, melalui jalan yang langsung dan singkat. Kedua rumus itu berbunyi :

RUMUS PANJANG :

Mk − Me
t=
(SD
2
Mk + SD 2
Me ) − 2r (SD )(SD )
ke Mk Me

Di mana :
SDk2
SDM2 k =
Nk − 1
SDe2
SDM2 e = k = Kelompok Kontrol
Ne − 1

rke =
∑ ke e = Kelompok eksperimen
(∑ k )(∑ e )
2 2

RUMUS PENDEK :

Mk − Me
t=
∑b 2

N ( N − 1)

Untuk segera dapat diketahui penggunaan dari kedua rumus itu akan diberikan
contoh-contohnya. Sekedar catatan perlu diberikan lebih dahulu.
1. Rumus panjang, diperuntukan bagi penelitian eksperimental yang menggunakan
method subjects designs, yaitu eksperimen yang menggunakan kelompok
eksperimen dan kelompok control yang sudah disamakan subyek demi subyek
sebelum eksperimen dijalankan. Yang disamakan adalah satu variabel (atau
lebih) yang telah diketahui mempunyai pengaruh terhadap hasil eksperimen,
yaitu variabel diluar variabel atau faktor yang dieksperimenkan.

Samsudi - STATISTIKA 46
2. Rumus pendek, adalah rumus yang serba guna dan efisien. Rumus ini
dipersiapkan untuk menyelesaikan penelitian eksperimen yang menggunakan
matched subjects designs. Seperti yang disebutkan dalam angka (1) diatas
dengan cara yang lebih singkat dan efisien. Kecuali itu rumus ini juga
disediakan untuk menganalisa eksperimen yang menggunakan designs
treatments by subjecte. Ini adalah eksperimen yang menggunakan hanya satu
kelompok (one group experiment) yang sekaligus menjadi kelompok
eksperimen dan kelompok kontrol pada periode-periode eksperimen yang
berlainan.

Contoh Penggunaan Rumus Pendek

TABEL 7.5
TABEL PERSIAPAN UNTUK T-TEST SAMPEL-SAMPEL
YANG BERKORELASI DENGAN RUMUS PENDEK

Pasangan
Subyek K E K2 E2 KE
K-E
(1) (2) (3) (4) (5) - (6)
1 – 12 5,0 5,2 -0,2 +0,2 0,04
2 – 14 5,8 6,5 -0,7 -0,3 0,09
3 – 15 5,8 4,9 +0,9 +1,3 1,69
4 – 17 6,3 7,8 -1,5 -1,1 1,21
5 – 15 6,3 6,6 -0,3 +0,1 0,01
6 – 16 6,5 7,5 -1,0 -0,6 0,36
7 – 13 6,9 6,1 +0,8 +1,2 1,44
8 – 20 7,2 8,3 -1,1 -0,7 0,49
9 – 19 7,4 8,1 -0,7 -0,3 0,09
10 - 18 7,8 8,0 -0,2 +0,2 0,04
Total 65,0 69,0 -4,0 0,0 5,46

MB =
∑B b = B - MB
N
− 4,0
=
10
= −0,4
Harus dicek :
∑B = ∑K − ∑E
Dan
∑ b = 0,0

Samsudi - STATISTIKA 47
Dimasukkan ke dalam rumus:

Mk − Me 6,5 − 6,9 6,4 0,4


t= = = = = 1,624
∑b 2
5,46 0,0606 0,246
N ( N − 1) 10

Selanjutnya pekerjaan-pekerjaan perhitungan lainnya sama sepenuhnya dengan


contoh yang diberikan sebelumnya, demikian juga interpretasi dari hasilnya.

Soal Latihan

1. Jelaskan pengertian yang tekandung dalam istikah “Teknik Analisa Komparasional”!


2. Apa yang dimaksud dengan “Teknik Analisa Komparasional Bivarian” dan “Taknik
Analisa Komparasional Multivarian”? Kemukkakan contohnya!
3. Jelaskan perbedaan pokok antara Tes “t” dan tes Kai Kuadrat sebagai Taknik analisa
Komparasional Bivariat!
4. Barilah penjelasan tentang prosedur yang perlu kita tempuh dalam rangka
memberikan interpretasi terhadap Kai kuadrat.
5. Dalam keadaan bagaimana sebuah Ho yang menyatakan tidak adanya perbedan yang
signifikan antara fo dan ft disetujui?
6. Buatlah sebuah ikhtisar tentang berbagai kegunaan Tes Kai Kuadrat dalam Praktek
kehidupan sehari hari, terutama dalam kegiatan penelitian di bidang pendidikan.
7. Data:
Diketahui: N =25;
MD = 0,45;
S DD = 0,83;
Soal :
a. Carilah “t”
b. Berikan interpretasi terhadap “to” dengan berkonsultasi Tabel Harga Kritik “t”,
pada taraf signifikansi 5%.
8. Data:
Diketahui : N1 = 65; N2= 82;
M1= 76,44; M2= 75,14;
SD1= 10,66; SD2= 12,59;
Soal:
a. Hitunglah “t”
b. Berikan interpretasi terhadap “to” denagn berkonsultasi pada table Harga Kritik
“t”, pada taraf signifikansi 5%.
9. Data:
Diketahui : N1 = 20 N2 = 20
ΣX12= 180 ΣX22= 160
Σx1 = 24 Σx2 = 22

Samsudi - STATISTIKA 48
Soal:
a. Carilah “t” dengan menggunakan rumus dari fisher!
b. Berikan interpretasi terhadap “to” denagn berkonsultasi terhadap table Harga
Kritik “t” pada taraf signifikansi 5%.
10. Sekor Hasil Tes Matematika dari 40 orang siswa SMK sebelum diajar dengan
metode baru adalah sebagai berkut:
68 50 58 40 62 54 66 70 46 56
60 64 42 52 48 44 76 72 43 74
51 65 57 51 55 49 62 59 64 59
53 54 45 55 60 75 70 50 40 53

Sedangkan sekor sasil tes Matematika dari 40 orang siswa yang sama di atas,
setelah diajar dengan metode baru adalah sebagai berikut:

87 55 72 45 71 66 84 90 54 69
75 81 48 51 57 54 99 93 58 96
50 83 69 77 65 58 77 72 64 59
70 60 55 59 69 79 70 59 48 65

Soal:
Selidiki secara seksama, apakah memang secara signifikan terdapat perbedaan Mean
hasil tes Matematika dikalangan 40 siswa SMK tersebut, antara sesudah dan sebelum
diajar dengan metode baru dengan cara:
a. Menemukan Ha dan Ho –nya lebih dahulu
b. Menguji kebenaran / kepalsuan hipotesa tersebut dengan membandingkan
besarnya to dan ttabel pada taraf signifikan 5%
c. Apa kesimpulan yang diperoleh?
11. Dalam suatu kegiatan yang dilaksanakan dengan tujuan untuk mengetahui
bagaimana pendapat para penonton televisi mengenai acara Dakwah yang
dituangkan dalam bentuk ceramah dan Sandiwara televisi, dalam penelitian mana
telah disiapkan 800 orang penonton televisi sebagai sempel penelitian, telah
berhasil dihimpun data jawaban yang mereka berikan kepada tim peneliti, sebagai
berikut:
Pendapat: f
A. Siaran Dakwah melalui sandiwara televise lebih baik daripada 243
ceramah
B. Siaran Dakwah melalui ceramah lebih baik daripada sandiwara 235
televisi
C. Siaran Dakwah melalui Ceramah dan sandiwara televise sama 232
baiknya
D. Saya tidak dapat menemukakan pendapat 90

Soal:
Berdasarkan perimbangan bahwa pendapat para penonton televisi mengenai Siaran
Dakwah itu merupakan faktor determinan (faktor yang menentukan) yang perlu
dipertimbangkan dalam penyusunan program Siaran Dakwah lewat televisi itu, cobalah
Samsudi - STATISTIKA 49
selidiki secara seksama, apakah memang secara signifikan terdapat perbedaan frekuansi
yang diibservasi dan frekuensi toritiknya, dengan cara:
a. Terlebih dahulu menyusun hipitesa alternative dan hipotera Nolnya.
b. Mengetes perbedan frekuensinya dengan menggunakan Teknik Analisis Kai
kuadrat.
c. Memberikan interpretasi terhadap kai kuadrat, dengan menggunakan signifikan
5%.
d. Kemukakan kesimpulannya
12. Sejumlah 300 oarang mahasiswa pada sebuah perguruan tinggi ditetapkan sebagai
sempel dalam rangka kegiatan penelitian yang berjudul “Komparasi Prestasi Studi
Mahasiswa Dalam hubungannya Dengan kegiatan Para Mahasiswa dalam
Organisasi-organisasi kemahasiswaan”. Mereka itu dibagi dalam kedua kelompok,
yaitu: 60 orang mahasiswa yang duduk dalam kepengurusan organisasi-organisasi
kemahasiswaan, dan 240 orang lainnya adalah mahasiswa yang tidak duduk dalam
kepengurusan organisasi kemahasiswaan. Dari kedua kelompok mahasiswa tersebut
berhasil dicatat hasil belajar mereka dalam ujian semester difakultas mereka masing
masing sebagai berikut: Dari sejumlah 60 orang mahasiswa yang menjadi pengurus
organisasi kemahasiswaan, 20 orang diantaranya lulus pada ujian utama; 25
diantaranya dinyatakan lulus dalm ujian ulangan, sedangkan sisanya yaitu 15 orang
dinyatakan gagal. Selanjutnya dari sejumlah 240 orang mahasiswa yang tiadak
menjadi pengurus organisasi kemahasiswaan, 80 orang diantaranya dinyatakan
lulus ujian utama, 120 orang lulus pada ujian utama dan 40 orang selebihnya
dinyatakan gagal dalam ujian tersebut.
Soal:
a. Rumuskan Hipotesis alternatifnya dan Hipotesis Nihilnya!
b. Ujilah Hipotesis tersebut dengan menggunakan Teknik analisis kai kadrat!
c. Berikan interpretasi terhadap Kai Kuadrat dengan menggunakan signifikan 5%.
d, Apa kesimpulan yang dapat dikemukakan?

13. Data:
Jenis Sekolah / sikap Baik Cukup Kurang Total:
keagamaan
Sekolah Umum 100 140 60 300
Sekolah Teknik 40 90 50 180
Sekolah Guru 63 40 17 120
Total 203 270 127 600=N
Soal:
Dengan menggunakan Teknik Analisa Kai Kuadrat, Ujilah hipotesis nol yang
menyatakan bahwa diantara 600 orang siswa SLTA yang berbeda jenis sekolahnya
itu tidak dapat berbeda sikap keagamaan yang signifikan!

Samsudi - STATISTIKA 50
BAB VIII

ANALISIS VARIANSI

Tujuan

Mahasiswa memiliki pemahaman tentang teknik analisis variansi sebagai alat analisis
data dan uji hipotesis yang meliputi mean kuadrat, asumsi-asumsi dalam Anava, Anava
Klasifikasi Tunggal dan Anava Klasifikasi Ganda dan dapat menggunakan Anava
untuk menganalisis data penelitian.

Samsudi - STATISTIKA 51
8.1. Konsep Mean Kuadrat

Perlu diingat kembali apa yang disebut varian dalam pembicaraan tentang SD
(standar deviasi). Varians adalah SD kuadrad, yang diperoleh dengan rumus:

SD 2
=
∑ x2
N
Hanya saja dalam hubungan dengan pembicaraan kita sekarang ini kwalitas itu tidak
disebut varians, melainkan Mean KUADRAT, disingkat dari mean dari jumlah
KUADRAT, dan diberi simbul MK, dan diperoleh dengan rumus:

DK
MK =
d b

DK = jumlah KUADRAT,
d b = derajad kebebasan.
Dalam teknik Anava ini yang menjadi alat pengukuran variabilitas antar
kelompok adalah mean KUADRAT atar kelompok (disingkat dengan MKant), sedang
yang menjadi alat pengukuran variabilitas dalam kelompok adalah mean KUADRAT
dalam kelompok (disingkat dengan MK dal).
Hasil bagi dari kedua komponen ini, yaitu MKant dan MKdal, akan memjadi
petunjuk seberapa jauh jarak penyimpangan mean-mean kelompok kita itu dari mean
hipotetis (yaitu bahwa tidak ada perbedaan antara mean-mena variabel yang diselidiki)
sebagai akibat dari kesalahan sampling. Jadi sebenarnya yang kita cari adalah
menemukan MKant yang mewakili variabilitas dalam kelompok. Jika kedua MKdal yang
mewakili variabilitas dalam kelompok. Jika kedua MK itu sudah kita ketemukan, maka
perbandingan antara keduanya akan dapat digunakan sebagai dasar menarik kesimpulan
statistik tentang obyek yang sedang kita teliti.
Rumus umum untuk mencari MK, yaitu :

Samsudi - STATISTIKA 52
DK an t DK dal
MK ant = MK dal =
db ant dbdal

dbdal = derajad kebebasan dalam kelompok, diperoleh dari dbtot dikurangi


dengan dbant sedang dbtot = N-1
dbant = derajad kebebasan antar kelompok, diperoleh dari jumlah kelompok
dikurangi satu, atau (m-1)

Sebagai contoh diperoleh data sebagai berikut:


N = 50 DKant = 19,72 dbant = 5 – 1 =4
m=5 DKdal = 254,30 dbdal = 50 – 1 – 4 = 45
Dengan mengisikan bilangan-bilangan itu ke dalam rumus MK dapat diperoleh:

DK ant 19,72 DKdal 254,30


MK ant = = MKdal = =
dbant 4 dbdal 45
= 4 , 93 = 5 , 56

8.2. F – Ratio

Adapun yang dimaksud dengan F-ratio adalah angka-angka perbandingan antara


MKant dengan MKdal dan didefinisikan dengan persamaan sebagai berikut :

MK
F = ant
MK da l

Besarnya nilai-nilai F yang terjadi hanya 5% dan 1% dari seluruh kejadian dari sample-
sampel yang diambil secara random, sekiranya memang hipotesis nilai adalah benar.
Jika MKant adalah sedemikian besarnya, jauh melebihi MKdal sehingga perbandingan
kedua MK itu menunjukkan nilai yang menyamai atau melebihi nilai F dalam tabel
pada dasar taraf signifikansi 5 % dan 1%, maka kita menyimpulkan bahwa tidak
mungkin nilai F sebesar itu terjadi kalau hipotesis nihil dan mengatakan bahwa F yang
kita peroleh menunjukkan nilai yang signifikan atas dasar taraf signifikansi 5 % dan 1
%.
Misalkan hipotesis nihil yang kita ajukan dalam penelitian kita itu adalah: “tidak
ada perbedaan yang signifikan antara kelima kelompok pelajar-pelajar SMA dari
berbagai daerah dalam soal kecakapan atau pengetahuan kebudayaan” .
MKant yang kita peroleh adalah 4.93, dan MKdal-nya 5,56. Jika harga-harga MK
tersebut kita isikan ke dalam rumus F, maka:

Samsudi - STATISTIKA 53
MK ant 4 , 93
F = =
MK da l 5 , 56
= 0 , 873

Mengkonsultasikan dengan Tabel F


Dari perhitungan di atas, dapatemukan bahwa:

MK
F db ant
; db dal = ant
F 4; 45 = 0,873
MK dal
Untuk mengkosultasikan harga F diatas, dapat ditempuh dua cara.
MK yang lebih kecil adalah MKant = 4,93 Derajad kebebasan dari MK ini = 4.
kita cari db = 4 dalam kolom sebelah kiri, kit abaca kekanan sampai menyilang kolom
db = 45 sebagai db dari MK kita yang lebih besar. Karena ternyata tidak ada kolom db =
45, maka kita ambil saja suatu bilangan diantara db = 40 dan db = 50, yaitu bilangan-
bilangan 5,71 dan 5,70, jika kita gunakan taraf signifikansi 5 %, sedang bilangan-
bilangan diantara 5,71 dan 5,70 adalah 5,705, taraf signifikansi 5%, sedang bilangan-
bilangan pada baris bawah adalah bilangan-bilangan batas F pada taraf signifikansi 1%.
Karena itu jika kita gunakan taraf signifikansi 1%, bilangan batas yang kita cari adalah
bilangan diantara 13,74 dan 13,69, yaitu bilangan 13,715.
Dari pemeriksaan pada tabel itu ternyata bahwa F yang kita peroleh sebesar
0,873 berada jauh di bawah batas signifikansi 5%, apalagi sebagai konsekuensinya
hipotesis nihil yang kita ajukan sebelum penelitian kita terima. Kesimpulan kita akan
berbunyi kira-kira sebagai berikut:
“Bahwa menurut bahan-bahan yang dikumpulkan dalam penelitian itu diperoleh bukti-
bukti antara pelajar-pelajar SMA dari berbagai daerah itu tidak terdapat perbedaan yang
signifikan mengenai pengetahuan kebudayaan”.

Tabel Ringkasan ANAVA


Hasil-hasil perhitungan analisis varians yang telah kita kerjakan berikutnya
dimasukkan ke dalam tabel berikut:

Tabel 8.1
Tabel Ringkasan Anava
F teoritis
Sumber Derajad Jumlah Mean
F empiris (hipotetis)
Variasi Kebebasan KUADRAT KUADRAT
FO Ft
SV db DK MK
5% 1%
Kelompok
Pelajar 4 19,72 4,93
SMA 0,873 5,705 13,715
Dalam
45 254,30 5,65
Kelompok
Total 49 274,02 - - - -

Samsudi - STATISTIKA 54
Kesimpulan : Karena FO = 0,873 < Ft5% = 5,705 maka HO diterima.

Adapun ringkasan rumus-rumus dalam table Anava:

Tabel 8.2
Tabel Ringkasan Anava dari bahan-bahan dalam tabel
Sumber
Variasi db JK RJK FO Ft
SV 5% 1%
Kelompok
(∑ X ) 2
(∑ X ) 2
DK ant
apa ? C–1 ∑ k
− tot

( antar)
nk N C −1 MK ant
? ?
Dalam (∑ X ) 2
DK dal MK
∑X
dal
Kelompok N–C 2
tot − k

(dalam) nk N −C

(∑ X ) 2

Total N-1 ∑ X 2 tot −


N
tot
- - - -

Pengujian : (1) JikaF O ≥ F t ? % , maka HO ditolak


(2) Jika F O ≤ F t ? % , maka HO diterima
Kesimpulan : (1) Ada perbedaan apa antara kelompok apa
(2) Tidak ada perbedaan apa antara kelompok apa
Dengan tabel ringkasan Anava yang tersedia itu, marilah kita kerjakan contoh
lain dibawah ini. Tabel 8.3ini memuat bahan hipotetis tentang sikap terhadap persoalan
“KLM” yang diperoleh dengan jalan angket. NIlai yang lebih besar menunjukkan sikap
yang lebih positip.
Tabel 8.3
Tabel distribusi sikap untuk contoh Anava
Kelompok I Kelompok II Kelompok III Total
2 2 2
X1 X X2 X X3 X X X2
1 2 3
68 4624 78 6084 94 8836 240 19544
63 3969 69 4761 82 6724 214 15454
58 3364 58 3364 73 5329 189 12057

Samsudi - STATISTIKA 55
51 2601 57 3249 67 4489 175 10339
41 1681 53 2809 66 4356 160 8846
40 1600 52 2704 62 3844 154 8148
34 1156 48 2304 60 3600 142 7060
27 729 46 2116 54 2916 127 5761
20 400 42 1764 50 2500 112 4664
18 324 27 729 32 1024 77 2077
420 20488 530 29884 640 43618 1590 993950
∑X
2
∑X
2
∑ ∑ ∑ ∑ ∑
2

2
X1 X 2 X 3 X X tot X tot
1 2 3

n1 = 10 n2 = 10 n3 = 10 N = 30
(∑ X ) 2
(1 .590 ) 2
(1) DKtot = ∑X 2
tot −
N
tot
= 93 .950 −
30
2528100
= 93.950−
30
= 93.950− 84270
= 9.680.

(2) DKan t =
(∑ X ) 1
2

+
(∑ X ) 2
2

+
(∑ X ) 3
2


(∑ X ) tot
2

n1 n2 n3 N

=
(420) (530) (640) (1.590)
2
+
2
+
2
+
2

10 10 10 30
= 86.690 − 84270
= 2.420

(3) DKdal = DK tot − DK ant


= 9.680 − 2.420
= 7.260

DK ant 2.420
(4) MKant = =
m −1 3 −1
= 1.210

MK dal 7.260
(5) MKdal = =
N − m 30 − 3
= 268,90
MK ant 1.210
(6) Fm – 1; N – m = =
MK dal 268,9

Samsudi - STATISTIKA 56
= 4 , 50

Hasil-hasil perhitungan itu kemudian disusun dalam tabel ringkasan Anava


sebagai berikut :

Tabel 8.4
Tabel Ringkasan Anava dari bahan tabel

Sumber
Signifikansi
Variasi db DK MK FO Ft
Nonsignifi
SV
Kelompok t.s.5%
2 2.420 1.210 Sig
“K” 3,35
4,50
Dalam t.s.1%
27 7.260 268,9 Nonsig
Kelompok 5,49
Total 29 9.680 - - - -

Jadi, dengan taraf signifikansi 5% kita akan menolak hipotesis nihilnya yang
mengatakan bahwa tidak ada perbedaan sikap antara ketiga kelompok yang diselidiki.
Kita menolaknya disebabkan karena kita meragukan bahwa variabilitas antar kelompok
sebesar 4,50 itu semata-mata disebabkan karena kesalahan sampling.
Bagaimana halnya jika kita gunakan taraf sigibifikansi 1%?. Bilangan batas
signifikansi atau batas penolakan hipotesis nihil dengan taraf signifikansi 1% adalah
5,49. Dengan demikian hipotesis nihil itu kita terima. Karena batas penolaknnya masih
belum dilewati. F yang kita peroleh = 4,50 dan ini masih di bawah Ft = 5,49 sebagai
batas signifikansinya. Kita menerima hipotesis nihilnya karena jikalau kita
menggunakan dasar taraf signifikansi 1%, kita memandang deviasi-deviasi yang
besarnya terjadi 5 kali dalam 100 atau 4 kali dalam 100 kemungkinan, atau malahan 2
kali dalam 100 kemungkinan masih disebabkan karena kesalahan sampling. Hanya
deviasi-deviasi yang terjadi 1 kali diantara 100 kejadian yang kita pandang tidak
disebabkan oleh kesalahan sampling.

Asumsi-asumsi Dalam Analisis Variansi


Pengujian dengan F test ini juga menggunakan asumsi-asumsi atau landasan-
landasan teori tertentu. Ada tiga macam asumsi yang perlu diindahkan dalam
penggunaan teknik Anava, yaitu
(1) Bahwa subyek-subyek atau individu-individu yang ditugaskan dalam sampel-
sampel penelitian harus diambil secara random secara terpisah satu sama lain dari
masing-masing populasinya.

Samsudi - STATISTIKA 57
(2) Bahwa distribusi gejala yang diselidiki dalam masing-masing populasi itu adalah
normal.
(3) Bahwa varians-varians atau SD2 dari masing-masinng populasi tidak menunjukkan
perbedaan yang signifikan satu sama lain.
Bagaimana memenuhi sarat-sarat yang ditentukan itu dapat dituturkan secara singkat
sebagai berikut :
(1) Random samples : dapat kita penuhi dengan cara yang sudah dibicarakan dalam
permulaan bab VII. Gunakan tabel bilangan random untuk mengambil random
clusters, random areas, atau random subjectsnya.
(2) Normal distributions: dapat kita penuhi melalui dua jalan. Pertama, atau kita
mengadakan pengetesan normalitas (test of normality) dengan rumus-rumus yang
sudah kita ketahui. Ini kita lakukan jika kita belum mempunyai bukti-bukti bahwa
gejala yang kita selidiki mengikuti cirri-ciri distribusi normal. Kedua, atau jika kita
telah mempunyai bukti-bukti bahwa varaibel yang kita selidiki telah mengikuti
distribusi normal, baik bukti ini kita peroleh dari penelitian-penelitian pendahuluan
maupun dari penelitian-penelitian orang lain yang mendahului, kita dapat
menggunakan bukti-bukti sebagai landasan untuk memenuhi sarat atau tuntutan
normalitas ini.
(3) Correlated variances : dapat kita penuhi dengan mengadakan pengetesan terhadap
varians-varians (test of variance) yang kita peroleh dari distribusi-distribusi yang
kita peroleh dari distribusi-distribusi yang kita selidiki. Rumus untuk ini adalah :
2
SD
F db Vb ; dbVk = bs
2
SD
kt

Dalam mana db Vb = derajad kebebasan dari Varians yang lebih besar, db Vk = derajad
2 2
kebebasan dari varians yang lebih kecil, dan SD dan SD masing-masing adalah
bs kt
varians yang lebih besar dan varians yang lebih kecil. Kongkritnya, dari bahan tabel 67
hal. 375 kita dapat mengetest variansnya seperti berikut :
Kelompok I
n = 10 ∑ x = 135. ∑x2 = 1881
1881 1352 18825
SD 2 = − 2 = 188,1 −
10 10 100
= 188,10 − 182,25
= 5,85

Kelompok II
n = 10 ∑ x = 153. ∑x2 = 2385
2385 1532 23409
SD =2
− 2 = 238,5 −
10 10 100

Samsudi - STATISTIKA 58
= 238,5 − 234,09
= 4,41

Dari perhitungan itu kita ketahui itu kita ketahui bahwa SD2 atau varians yang
lebih besar adalah varians dari kelompok I. Varians yang lebih besar ini kemudian kita
jadikan pembilang dalam test of variance kita.
5,85
Karena itu F 9;9 = = 1,33
4,41
Dengan melihat tabel pada derajad kebebasan 9 lawan 9 akan kita ketemukan
bahwa FO = 1,33 ini lebih kecil daripada F15% = 3,18. karena itu kita menyimpulkan
bahwa varians dari kelompok I dan kelompok II itu tidak berbeda secara signifikan, hal
mana berarti bahwa varians dari kedua kelompok itu dalam populasinya masing-masing
adalah tidak berbeda.
Analisa varians ternyata dapat digunakan untuk meneliti bahan-bahan yang
telah disusun ke dalam bermacam-macam distribusi. Di bawah ini diberikan contoh-
contoh penggunaan Anava pada (1) distribusi tunggal; (2) distribusi bergolong dan (3)
distribusi deskriptip. Penerapan itu akan dibaca secara berturut-turut.

8.3. Anava pada Distribusi Tunggal


Tabel di bawah ini menunjukkan distribusi tunggal dari hasil test psikologis
terhadap mahasiswa-mahasiswa yang baru ulai belajar mata pelajaran itu. Untuk tidak
menimbulkan kebingungan, perlu kiranya segera diberi keterangan tentang rumus-
rumus DK untuk bahan yang sudah distribusikan yang kelihatannya sepintas lalu
berbeda dengan rumus-rumus DK yang sudah kita pelajari. Pada dasarnya rumus-rumus
baru ini tidak ada bedanya dengan rumus-rumus yang terdahulu. Komponen f
dimasukkan ke dalam rumus-rumus baru ini disebabkan karena dalam distribusi
komponen f itu selalu ada. Jadinya,

(1)
DKtot = ∑ fX2tot −
(∑ fX ) tot
2

N
(2)
DKant =
(∑ fX ) − (∑ fX )
1
2
tot
2

+ .........+
(∑ fX ) − (∑ fX )
m
2
tot
2

n1 N nm N

(3) DK dal = DK tot − DK ant

Tabel 8.5
Distribusi hasil tes Potensi Akademik dari tiga kelompok mahasiswa
Kelompok 1 Kelompok II Kelompok III Total
Nilai 2
fX 1
X f fX1 f fX2 fX 22 f fX3 fX 32 f fXt fX t2

Samsudi - STATISTIKA 59
11 1 11 121 1 11 121 2 22 242 4 44 454
10 2 20 200 2 20 200 1 10 100 5 50 500
9 3 27 243 4 36 324 3 27 243 10 90 810
8 5 40 320 7 56 448 7 56 448 19 152 1216
7 9 63 441 11 77 539 5 35 245 25 175 1225
6 7 42 252 5 30 180 8 48 288 20 120 720
5 6 30 150 4 20 100 5 25 125 15 75 375
4 2 8 32 4 16 64 5 20 80 11 44 176
3 4 12 36 3 9 27 3 9 27 10 30 90
2 1 2 4 2 4 8 3 6 12 6 12 24
1 3 3 3 1 1 1 1 1 1 5 5 5
0 1 0 0 0 0 0 2 0 0 3 0 0
Total 44 258 1802 44 280 2012 45 259 1811 133 797 5625
Anava dari bahan tersebut dapat dikerjakan dengan cara-cara yang biasa :
797 2 635209
(1) DK tot = 5625 − = 5625 − = 5625 − 4776,01
133 133
= 848 , 99

2582 2802 2592 797 2


(2) DK ant = + + −
44 44 45 133
66564 78400 67081 635209
= + + −
44 44 45 133
= 1512,82 + 1781,82 + 1490,69 − 4776,01 = 4785,33 − 4776,01
= 9,32

(3) DKdal = 848,99 − 9,32 = 839,67


9,32
(4) MKant = = 4,66
2
839,67
(5) MKdal = = 6,46
130
4,66
(6) F 2;130 = = 0,72
6, 46

db dari MK yang lebih besar adalah 130, sedang db dari MK yang lebih kecil
adalah 2. jika kit abaca tabel F1 dengan db 130 lawan 2 maka akan kita ketahui bahwa
batas penolakan hipotesis pada taraf signifikansi 5% adalah 19,49, dan pada taraf
signifikansi 1% adalah 99,49. Ternyata nilai F yang kita peroleh itu berada sangat jauh
di bawah batas signifikansi 1%. Dengan begitu maka hipotesis nihil yang kita ajukan,
kita terima. Kesimpulan kita adalah bahwa atas dasar bahan-bahan yang kita kumpulkan
sampai sekian jauh, antara kelompok signifikansi tentang pengetahuan psikologi
mereka.

Samsudi - STATISTIKA 60
Tabel Singkatan Anava dari pekerjaan analisa tersebut di atas dapat dilihat
pada tabel 8.6 di bawah ini.
Tabel 8.6
Tabel Ringkasan Anava dari bahan dalam table 8.5
Sumber Signifikansi
db DK MK FO Ft
Variasi
Antar
2 9,32 4,66
Kelompok t.s.5%
0,72 Nonsig
Dalam =19,49
13 839,67 6,46
Kelompok
Total 132 848,99 - - - -

ANAVA PADA DISTRIBUSI BERGOLONG


Distribusi bergolong yang tercantum dalam tabel 8.7 di bawah ini
dipersiapkan untuk meneliti ada tidaknya perbedaan gaji guru-guru wanita dan pria.
Interval gaji diambil dari gaji rata-rata tiap-tiap bulannya.

Tabel 8.7
Tabel Distribusi Bergolong
Peria Wanita Total
Kode 2
Interval gaji fX 1
X f fX1 f fX2 fX 22 f fXt fX t2
Rp.7000-7999 6 4 24 144 1 6 36 5 30 180
Rp.6000-6999 5 8 40 200 5 25 125 13 65 325
Rp.5000-5999 4 12 48 192 10 40 160 22 88 352
Rp.4000-4999 3 15 45 135 12 36 108 27 81 243
Rp.3000-3999 2 8 16 32 18 36 72 26 52 104
Rp.2000-2999 1 3 3 3 7 7 7 10 10 10
Rp.1000-1999 0 1 0 0 3 0 0 4 0 0
Total - 51 176 706 56 150 508 107 326 1214

Kode-kode digunakan dalam tabel itu disebabkan karena sungguhpun kita


dapat melakukan analisa dengan metode yang lazim, yaitu dengan menggunakan titik-
titik tengah atau tanda-tanda kelas Rp 7.500,-, Rp 6.000,- dan seterusnya, kita akan
terlibat dalam mengKUADRATkan bilangan-bilangan besar. Dengan pengkodean itu
kita dapat menghemat sangat banyak waktu dan fikiran. Dari interval yang terendah
dimulai pengkodean dengan bilangan nol. Analisa variannya adalah :

3262 106276
(1) DK tot = 1214 − = 1214 − = 1214 − 993,23
107 107
= 220 , 77

Samsudi - STATISTIKA 61
1762 1502 3262 30976 22500 106276
(2) DK ant = + − = + −
51 56 107 51 56 107
= 607 ,37 + 401,79 − 993,23 = 1009 ,16 − 993,23
= 15,93
(3) DKdal = 220,77 −15,93 = 204,84
15,93
(4) MKant = = 15,93
1
204,84
(5) MKdal = = 1,95
105
15,93
(6) F1;105 = = 8,17
1,95
Dimasukkan dalam tabel ringkasan Anava :

Tabel 8.8
Ringkasan Anava dari bahan dalam tabel
Sumber Signifikansi
db DK MK FO Ft
Variasi

Sekse 1 15,93 15,93


8,17 t.s.1%=6,90 Sig
Dalam 105 204,84 1,95
Total 106 220,77 - - - -

db dari MK yang lebih besar = 1, dan db dari MK yang lebih kecil = 105.
Pemeriksaan pada tabel F menunjukkan bahwa dengan taraf signifikansi 5% dan 1 %
batas penolakan itu maka hipotesis nihilnya kita tolak. Kita menyimpulkan bahwa
berdasarkan bahan-bahan yang masuk ada perbedaan besarnya gaji guru-guru wanita
dna peria. Mean dari gaji peria = 176/51=3,45. sedang mean dari gaji wanita = 150/56 =
2,68. karena gaji peria ternyata lebih besar daripada wanita, dan perbedaan itu
signifikan, maka akhirnya kita menyimpulkan bahwa gaji adalah fungsi daripada jenis
kelamin, dan guru-guru peria mempunyai kecenderungan memperoleh gaji yang lebih
tinggi.

8.4. Analisis Variansi (ANAVA) Klasifikasi Ganda


Dalam bab VII kita telah membicarakan bagaimana mengetest hipotesis
tentang sesuatu variabel dari dua kelompok. Dalam bab XI kita telah maju satu langkah,
yaitu memperbincangkan cara mengetest hipotesis tentang sesuatu variabel dari tiga
kelompok atau lebih. Dalam bab ini kita maju satu langkah lagi. Kita ingin mengetahui
Samsudi - STATISTIKA 62
bagaimana mengetest hipotesis dari banyak kelompok yang tidak hanya menggunakan
satu klasifikasi, tetapi banyak klasifikasi. Mengadakan klasifikasi ganda ini bukan saja
mungkin dikerjakan dalam banyak penelitian, tetapi juga sangat berguna untuk
mendapatkan informasi yang lebih banyak dan lebih teliti. Kebenaran pernyataan
tersebut dapat dilihat dari contoh sebagai berikut :
Seorang insinyur mobil ingin meneliti lima macam merk sepeda motor untuk
menetapkan keadaan konsumsi bensin mereka. Dia mengambil dari tiap-tiap merk lima
buah sepeda motor dari model empat tahun yang lalu sampai model tahun ini. Semua
sepeda motor itu kemudian dijalankan dalam keadaan yang diawasi baik-baik dan
dicatat konsumsi bensinya tiap-tiap kilometernya. Kita misalkan hasil daripada test ini
adalah seperti berikut :

Tabel 8.9
Konsumsi bensin per km dari lima macam merk sepeda motor
M ERK
MODEL TOTAL
A B C D E
Tahun 2008 26 22 22 24 18 112
Tahun 2007 24 21 20 20 20 105
Tahun 2006 22 18 19 19 16 94
Tahun 2005 20 15 17 13 15 80
Tahun 2004 14 12 11 18 12 67
Total 106 88 89 91 81 458

Dengan menggunakan Anava yang biasa kita dapata mengetest hipotesis nihil
: “Bahwa ada perbedaan konsumsi bensin antara kelima merk sepeda motor itu”.
Dengan Anava klasifikasi tunggal akan kita peroleh hasil-hasil sebagai berikut :
4582
(1) DK tot = 26 + 24 + ... + 12 −
2 2 2
= 393,44
25
1062 882 892 942 812 4582
(2) DK ant = + + + + − = 69,04
5 5 5 5 5 25
(3) DKdal = 393,44− 69,04 = 324,40
69,04
(4) MK ant = = 17,26
4
324,40
(5) MKdal = = 16,22
20
17 ,26
(6) F 4;20 = = 1,06
16,22

Hasil-hasil perhitungan itu kita masukkan ke dalam tabel ringkasan Anava


sebagai berikut :

Tabel 8.10
Samsudi - STATISTIKA 63
Ringkasan Anava dari bahan dalam tabel 9.5

Sumber Signifikansi
db DK MK FO Ft
Variasi

Merk 4 60,04 17,26


1,06 t.s.5%=2,87 Non
Dalam 20 324,40 16,22
Total 24 393,44 - - - -

Nilai F dengan derajad kebebasan 4 lawan 20 adalah tidak signifikan.


Konsekwensinya hipotesis nilai yang dikemukakan tidak dapat ditolak. Kelima merk
sepeda motor itu tidak menunjukkan perbedaan konsumsi bensin yang menyakinkan.

Data dalam tabel di atas dapat juga digunakan untuk menetapkan DK-DK dari
merk maupun model. Analisa varians untuk ini pada prinsipnya adalah sama seperti
yang telah kita pelajari. Beberapa dari pekerjaan kita di atas dapat kita ambil lagi untuk
analisa ini.
2
Perlu dicatat bahwa suku 458 dalam perhitungan-perhitungan DKmerk dan
25
DKmodel di atas kita sebut suku koreksi. Jumlah pembilang pada tiap-tiap pecahan yang
ditambahkan sebelum diKUADRATkan harus sama dengan pembilang dari suku
koreksi. Demikian juga jumlah pembagi pada tiap-tiap pecahan yang ditambahkan
sebelum diKUADRATkan dalam tiap-tiap menghitung DK haruslah sama dengan
pembagi dari suku koreksi. Catatan ini perlu diperhatikan agar kita meneliti kembali
jumlah-jumlah itu sebelum menghitung tiap-tiap DK.
Hasil Anava dari data tersebut yang memasukkan dua jenis klasifikasi yaitu
klasifikasi merk dan klasifikasi odel, ditunjukkan dalam tabel 8.11 di bawah ini. Dari
dua klasifikasi ini dapat perbedaan yang signifikan antara kenihilan yang aseli, yaitu
bahwa tidak ada perbedaan yang signifikan antara kelima macam merk dapat ditest
kembali. Hipotesis yang kedua ialah hipotesis nihil tentang tidak adanya perbedaan
yang signifikan antara kelima mode. Periksalah kembali test hipotesis pertama yang
sudah dikerjakan di muka. Hipotesis nihil itu diterima atas dasar klasifikasi tunggal
(periksa tabel 8.10). Persoalannya sekarang apakah kesimpulan itu masih dapat
dipertahankan jadi faktor model turut diperhitungkan?

Tabel 8.11
Tabel ringkasan Anava tentang konsumsi bensin sepeda motor
ditinjau dari segu merk dan model
Sumber Jumlah Mean setujubabilitas
db FO
Variasi KUADRAT KUADRAT Kejadian (p)x)
Merk 4 69,04 17,26 4,96
p < 1 % xx)
Model 4 286,76 67,19 19,32
p < 1% xx)
Dalam 16 55,64 3,48 -

Samsudi - STATISTIKA 64
Total 24 393,44 - - -

X) Diartikan juga proporsi kesalahan dari tiap-tiap penolakan hipotesis nihil.


XX) Lebih lazim ditulis dalam bentuk setujuporsi sebagai berikut P < 0,01
Baiklah pertanyaan ini kita jawab setelah kita menyelesaikan pekerjaan kita dalam
mengisi tabel ringkasan di atas.
60,04
(5) MK merk = = 17,26
4
288,76
(6) MK mod el = = 67,19
4
55,64
(7) MK dal = = 3,48
16
17,26
(8) Untuk Merk : F4 ;16 = = 4,96
3,84
67,19
(9) Untuk Model : F 4;16 = = 19,32
3,84
Pemeriksaan pada tabel F menunjukkan kepada kita bahwa dengan derajad
kebebasan 4 lawan 16 batas penolakan hipotesis nihilnya adalah 3,01 untuk taraf
signifikansi 5%, dan 4,77 untuk taraf signifikansi 1%.
Dengan bukti-bukti itu dapatlah kita menjawab pertanyaan yang baru
diajukan. Hipotesis nihil tentang perbedaan konsumsi bensin di berbagai merk itu jika
model atau tahun pembuatannya telah turut diperhitungkan, tidak lagi dapat
dipertahankan. Kita menyimpulkan bahwa kelima jenis merk sepeda motor yang
diselidiki berbeda konsumsi bensinya.
Jelaslah bahwa analisa varians dengan menggunakan kalsifikasi ganda
merupakan alat pengetesan hipotesis yang lebih peka. Hal ini disebabkan karena MKdal
yang digunakan untuk menjadi pembagi dalam mencari nilai F disini tidak lagi 16,22
seperti yang digunakan dalam tabel 78, melainkan hanya 3,48, sedang pembilangnya
dalam F-Ratio untuk merk itu, yaitu MKmerk’ tetap konstan. Memang penambahhan
klasifikasi biasanya menambah halusnya test hipotesis. Tambahan halusnya ini tentu
saja tergantung sekali kepada tambahan arti daripada klasifikasi itu.
Untuk menyelesaikan pengetesan hipotesis model ini cukup kiranya jika kita
menggunakan Anava klasifikasi tunggal.
) DK tot = 393,44
(2) DK mod el = 286,76
(3) DKdal = 393,44− 286,76 = 106,68
(4) MKmodel = 67,19
324 , 4
(5) MK dal = = 16 , 22
20
67,19
(6) F 4;20 = = 12,66
5,33
Samsudi - STATISTIKA 65
P < 0,01.
Dengan kenyataan itu kita tetap menolak hipotesis nihil dan menyimpulkan
bahwa perbedaan konsumsi bensin menurut tahun-tahun pembuatan adalah sangat
signifikan.

Soal Latihan

1. Distribusi hasil tes Matematika terhadap tiga kelompok siswa disajikan sebagai
berikut:
Nilai Kelompok 1 Kelompok II Kelompok III Total
Matematika f f f f
80 1 1 2 4
79 2 2 1 5
78 3 4 3 10
77 5 7 7 19
76 9 11 5 25
75 7 5 8 20
72 6 4 5 15
68 2 4 5 11
66 4 3 3 10
62 1 2 3 6
61 3 1 1 5
60 1 0 2 3
Total 44 44 45 133

Ujilah pada taraf signifikansi 5%, apakah ada perbedaan secara signifikan nilai
matematika pada tiga kelompok tersebut. Buat/masukkan juga ke dalam tabel
ringkasan Anava.

2. Data di bawah ini menunjukan distribusi interval gaji kelompok guru sekolah
(SMA, MA dan SMK).

Kode Guru SMA Guru MA Guru SMK


Interval gaji (ribuan)
X f f f
Rp.700-699 6 4 1 3
Rp.600-699 5 8 5 7
Rp.500-599 4 12 10 9
Rp.400-499 3 15 12 14
Rp.300-399 2 8 18 15
Rp.200-299 1 3 7 6
Samsudi - STATISTIKA 66
Rp.100-199 0 1 3 2
Total - 51 56 56

Ujilah apakah ada perbedaan secara signifikan distribusi gaji tiga kelompok guru
tersebut, pada taraf signifikansi 5%. Buat/masukkan juga ke dalam tabel ringkasan
Anava.

3. Data rata-rata suhu mesin pada lima macam merek sepeda motor (A, B, C, D, dan E),
masing-masing untuk tahun pembuatan/model yang berbeda (2004, 2005, 2006,
2007, dan 2008), disajikan sebagai berikut:

M ERK
MODEL TOTAL
A B C D E
Tahun 2004 85 86 85 85 86
Tahun 2005 84 85 84 83 83
Tahun 2006 84 84 83 83 82
Tahun 2007 82 82 81 81 81
Tahun 2008 82 81 80 80 80
Total

Ujilah apakah ada perbedaan secara signifikan rata-rata panas mesin pada lima
merek motor yang berbeda dan model/tahun pembuatan yang berbeda, pada taraf
signifikansi 5%. Buat/masukkan juga ke dalam tabel ringkasan Anava.

Samsudi - STATISTIKA 67
BAB IX

ANALISIS REGRESI

Tujuan

Mahasiswa memiliki pemahaman tentang analisis regresi klasifikasi tunggal dan ganda
dan mampu menggunakannya untuk menganalisis data penelitian.

Samsudi - STATISTIKA 68
Realitas tentang hubungan/keterkaitan antar ubahan dapat dikategorikan dalam
konteks ubahan yang satu menjadi penyebab dari ubahan lainnya. Pola hubungan seperti
ini disebut sebagai kausalitas, artinya ubahan yang satu merupakan predictor, sedangkan
ubahan yang lain sebagai kriterium.
Misalnya, apakah prestasi belajar anak dapat diprediksikan dari angka
kecerdasan dan perbendaharaan bahasa (kosakata); apakah produktivitas kerja
karyawan dapat diprediksikan dari hasil tes seleksi dan lamanya latihan dan sebagainya.
Dalam contoh ini prestasi belajar dan produktivitas kerja merupakan ubahan kriterium,
sedangkan angka kecerdasan, perbendaharaan bahasa, hasil tes seleksi, dan lamanya
latihan merupakan ubahan predictor.
Suatu ubahan dapat diramalkan dari ubahan lain apabila antara ubahan yang
diramalkan, disebut terikat / dependend, dan ubahan yang digunakan untuk
meramalkan, disebut bebas / Independend, terdapat korelasi yang signifikan. Misalnya,
jika antara tinggi badan dan berat badan pada umur-umur tertentu terdapat korelasi yang
signifikan, maka berat badan orang pada umur tersebut dapat diramalkan dari tinggi
badannya.
Korelasi antara ubahan kriterium dengan ubahan predictor dapat dilukiskan
dalam suatu garis. Garis ini disebut garis regresi. Garis regresi mungkin merupakan
garis lurus (linear), mungkin merupakan garis lengkung (parabolic, hiperbolik, dan
sebagainya). Dalam kesempatan ini hanya akan kita bicarakan garis regresi yang linear.
Suatu garis regresi dapat dinyatakan dalam persamaan matematik. Persamaan ini
disebut persamaan regresi. Untuk garis regresi linear dnegan satu ubahan predictor
persamaannya adalah :
Y = aX + K
dalam mana Y = kriterium; X = prediktor; a = bilangan koefisien prediktor ; dan K =
bilangan konstan.
Untuk garus regresi linear dengan dua ubahan predictor persamaan garisnya
adalah :
Y = a1 X 1 + a2 X 2 + K
dan untuk m ubahan prediktor persamaannya adalah :
Y = a1 X 1 + a2 X 2 + ....... + am X m + K
dalam mana
Y = Kriterium

Samsudi - STATISTIKA 69
X1, X2, . . . . …, Xm = Prediktor 1, prediktor 2, prediktor ke- m
a1, a2, . . . . . . .. ., am = Koefisien prediktor 1, koefisien prediktor 2,. . . . .
. . . ., koefisien prediktor ke-m
K = Bilangan konstan
untuk menemukan persamaan guru regresi tersebut harga-harga koefisien prediktor dan
bilangan konstantanya dapat dicari dari data yang diselidiki.
Mengenai tugas kedua dari pembicaraan analisis regresi, yaitu memberi dasar
untuk pembicaraan mengenai analisis kovariansi, akan kita bicarakan pada waktu kita
membicarakan analisis kovariansi.

9.1 Analisis Regresi Linear Satu Prediktor

Tugas pokok analisis regresi adalah :


1. Mencari korelasi antara kriterium dengan prediktor, R
2. Menguji apakah korelasi itu signifikan ataukah tidak, → tabel
3. Mencari persamaan garis regresi, F
4. Menemukan sumbangan relatif antara sesama prediktor, jika prediktornya lebih
dari satu.

Jika kita melukis garis regresi untuk meramalkan kriterium dari prediktor, tujuan
kita adalah ingin mendapatkan dasar ramalan yang menghasilkan kesalahan yang
sekecil-kecilnya. Tujuan itu dapat tercapai, jika dari serangkaian ramalan jumlah
kesalahan-kesalahan raalan itu sama dengan nol. Kesalahan ramalan ini disebut residu.
Maksud pernyataan ini akan dapat kita fahami dari contoh-contoh yang akan diberikan
nanti.
Contoh :
Misalkan suatu penelitian ingin memastikan apakah berat badan orang pada
kelompok umur tertentu dapat diramalkan dari tinggi badan. Dalam penelitian itu
dikumpulkan data tinggi badan dan berat badan sepuluh orang sebagai berikut :

Tinggi Berat
Subyek
(dalam cm) (dalam kg)
No.
X. y
1 168 63
2 173 81
3 162 54
4 157 49
5 160 52
6 165 62
7 163 56
8 170 78
9 168 64
10 164 61

Korelasi antara prediktor X dengan kriterium Y dapat kita cari melalui teknik
korelasi momen tangkar dari Pearson, dengan rumus umum :
Samsudi - STATISTIKA 70
rxy =
∑ xy
(∑ x )(∑ y )
2 2

Telah kita ketahui bahwa :


( X )( Y )
∑ xy = ∑ XY − ∑ N ∑ ,
( X) ,
∑ x = ∑ X − ∑N , dan
2
2 2

( Y)
∑ y = ∑ Y − ∑N
2
2

Jika tekah kita lakukan komputasi terhadap data contoh hasil penelitian tersebut
(gunakan kalkulator yang ada fungsi statistiknya), akan kita temukan :
N = 10
∑X = 1.650 ∑Y = 620 ∑XY = 102.732
∑X2 = 272.460 ∑Y2 = 39.432

Dari itu
(1.650)(620) = 432
∑ xy = 102.732 − 10
1.6502
∑ x 2
= 272.460 −
10
= 210

6202
∑ y = 39.432 − 10 = 992
2

432
rxy = = 0,946
(210)(992)
Untuk menguji apakah harga rxy = 0,946 itu signifikan apa tidak, kita dapat
berkonsultasi dengan tabel r – teoretik dengan dengan N = 10 atau derajat kebebasan db
= 10 – 2 (Catatan: ada tabel r = teoretik yang menggunakan N, ada juga yang
menggunakan db, Ambilah mana saja yang tersedia pada Anda). Dari tabel r – teoretik
dengan N = 10 (atau db = 8) akan kita ketemukan harga r-teoretik pada taraf
signifikansi 1% atau rt1% = 0,765. karena itu harga rxy sebesar 0,946 itu kita nyatakan
sangat signifikan, dan kita dapat menyimpulkan bahwa korelasi antara X dan Y, yaitu
antara tinggi badan dan berat badan, sangat signifikan.
Dengan harga korelasi antara tinggi badan dan berat badan yang sangat
signifikan itu kita mempunyai landasan untuk meramalkan / mengestimasi berat badan
dari tinggi badan (sebenarnya boleh juga sebaliknya, kita dapat meramalkan tinggi
badan dari berat badan), dab karenanya kita dapat membuat garis regresi untuk prediksi
dengan rumus garis regresi untuk prediksi dengan rumus garis regresi satu-prediktor
yang sudah kita ketahui, yaitu :
Y = αX + K → Y = αx + bx → α = Koefisien prediktor
Samsudi - STATISTIKA 71
Untuk mengisi persamaan garis regresi itu harga koefisien prediktor (yaitu harga
a) dan harga bilangan konstan K harus kita ketemukan lebih dahulu. Harga-harga a dan
K itu dapat kita ketemukan melalui dua jalan : (a) dengan metode skor kasar, dan (b)
dengan metode skor deviasi. Kedua metode ini akan menghasilkan harga-harga a dan K
yang sama. Nanti kita akan memilih salah satu dari dua metode itu berdasarkan
pertimbangan efisiensi.
Dengan metode skor kasar harga-harga a dan K dapat dicari dari persamaan :
(1 ) Σ XY = a Σ X 2
+ KΣX
( 2 ) Σ Y = a Σ X + NK
Jika data yang sudah kita ketahui kita masukkan ke dalam rumus-rumus itu
(1) 102.732 = 272.460 a + 1.650 K
(2) 620 = 1.650 a + 10 K

dengan penyelesaian persamaan secara simultan akan kita ketemukan (dengan membagi
persamaan I dengan 1.650 dan persamaan 2 dengan 10) :

(3) 62, 26 = 165,13 a + K


(4) 62 = 165 a + K Subtitusi
(5) 0,26 = 0,13 a
(6) 62 = (165) (2) + K
K = - 268
Perlu dicatat bahwa dalam perhitungan terhadap data penelitian yang
sesungguhnya, ketelitian perhitungan harus diusahakan semaksimal mungkin, dengan
jumlah angka desimal yang lebih banyak, misalnya enam desimal atau delapan desimal.
Dalam contoh perhitungan di atas hanya digunakan dua desimal. Maka jika dalam
komputasi digunakan kalkulator, biarkanlah desimalnya mengambang (floating)
sehingga perhitungan-perhitungannya dapat membawa terus jumlah desimal sesuai
dengan kemampuan kalkulator tesebut. Misalnya, jika dalam perhitungan di atas
digunakan desimal yang menggambang sampai enam angka, hasilnya adalah a = 2,057
143, dan K = - 277, 428 595. Tentu saja perhitungan dengan enam desimal hasilnya
akan jauh lebih teliti daripada perhitungan dengan dua desimal.

Dengan harga a = 2 dan K = - 268, persamaan garis regresinya adalah :


Y = aX + K
Y = 2X − 268 → a = -268, b = 2
y = −268+ 2X

Dengan metode skor deviasi harga-harga a dan K dapat kita cari dari persamaan
y = ax
Σ xy
y =Y −Y, x = X − X, a=
Dalam mana dan
Σx 2
Samsudi - STATISTIKA 72
Jika data yang sudah diketemukan dimasukkan ke dalam rumus tersebut :
Σ xy = 432
Σ x 2 = 210
432
a = = 2 , 05
210
y = 2 , 05 x
Dari data yang dikumpulkan dapat dicari :
ΣY 620 ΣX 1.650
Y = = = 62 X = = = 165
N 10 N 10
Karena itu untuk persamaan garis regresi y = ax atau Y - Y = a ( X - X ) dapat
kita selesaikan:
Y − 62 = (2,05)( X − 165)
Y = 2,05 X − 338 , 25 + 62
Y = 2,05 X − 276 , 25
Dengan etode skor kasar kita menemukan persamaan garis regresinya Y = 2X –
268, sedang dengan metode skor deviasi kita menemukan persamaan garis regresinya Y
= 2,05 X – 276,25. Seharusnya dengan kedua metode itu kita tidak menemukan hasil
perhitungan yang berbeda. Perbedaan hasil perhitungan garis regresi yang kita temukan
itu semata-mata disebabkan karena ketelitian perhitungan saja. Dengan jumlah desimal
yang mengambang sampai enam desimal, hasilnya adalah
Y = 2,057143 X − 277 ,428595
Baiklah kita coba dulu meramalkan berat badan dari persamaan garis regresi Y =
2X-268 seperti yang dihasilkan dengan perhitungan dengan metode skor kasar. Maka
untuk tinggi badan atau X tertentu, berat badannya atau Y-nya akan
Untuk X = 175 Y = 2(175)-268 = 82;
Untuk X = 174 Y = 2(174)-268 = 80;
Dan seterusnya . . . .
Untuk X = 150 Y = 2(150) – 268 = 32
Jika dari perhitungan-perhitungan itu kita buat suatu tabel berikut.

Tabel 9.1
TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI
BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2 X – 268
Tinggi (cm) Berat (kg) Tinggi (cm) Berat (kg) Tinggi (cm) Berat (kg)
X Y X Y X Y
175 82 165 62 155 42
174 80 164 60 154 40
173 78 163 58 153 38
172 76 162 56 152 36
171 74 161 54 151 34
170 72 160 52 150 32
169 70 159 50 149 30
168 68 158 48 148 28
Samsudi - STATISTIKA 73
167 66 157 46 147 26
166 64 156 44 146 24

Bagaimana keadaannya jika kita menggunakan persamaan garis regresi Y = 2,05


X – 276,25 (seperti yang diperoleh dengan metode skor deviasi) dan persamaan garis
regresi Y = 2,057 143 X – 277,428 595 (yang diperoleh dengan ketelitian enam
desimal, baik dengan metode skor kasar ataupun skor deviasi)? Sambil
mendemontrasikan pentingnya ketelitian dalam perhitungan akan kita coba menyusun
tabel-tabel ramalan dengan persamaan garis regresi yang berbeda-beda itu.

Tabel. 9.2
TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI
BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2,05 X – 276,25
X Y X Y X Y

175 82,5 165 62,0 155 41,3


174 80,5 164 60,0 154 39,5
173 78,4 163 57,9 153 37,4
172 76,4 162 55,9 152 35,4
171 74,3 161 53,8 151 33,3

170 72,3 160 51,8 150 31,3


169 70,2 159 49,7 149 29,2
168 68,2 158 47,7 148 27,2
167 66,1 157 45,6 147 25,1
166 64,1 156 43,6 146 23,1

Tabel 9.3
TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI
BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2,057 143X – 277,428 595

X Y X Y X Y

175 82,6 165 62,0 155 41,4


174 80,5 164 59,9 154 39,4
173 78,5 163 57,9 153 37,3
172 76,4 162 55,8 152 35,3
171 74,3 161 53,8 151 33,2

170 72,3 160 51,7 150 31,1


169 70,2 159 49,7 149 29,1
168 68,2 158 47,6 148 27,0
167 66,1 157 45,5 147 25,0
166 64,1 156 43,5 146 22,9

Dari tiga tabel raalan yang telah kita susun itu tabel yang terakhir ini adalah
yang paling teliti, sedang tabel yang pertama merupakan tabel yang paling kurang teliti.
Ketelitian itu mungkin ada akibatnya dalam kesalahan ramalan atau residu. Ini dapat
kita uji dari perbandingan seperti di bawah ini.
Samsudi - STATISTIKA 74
9.2. Analisis Varians Garis Regresi
Sebelum kita melanjutkan pembicaraan mengenai analisis regresi dengan dua
prediktor atau lebih, ada baiknya kita membicarakan dulu apa yang sesungguhnya
disebut analisis regresi.
Jika suatu prediksi hanya menggunakan satu ubahan prediktor seperti contoh
ditas, pekerjaan “analisis regresi” seperti yang sudah kita kerjakan boleh dikatakan
selesai. Sebab besarnya korelasi antara prediktor dengan kriterium telah diketemukan,
uji signifikansinya sudah dijalankan; dan garis regresinya telah dibuat. Akan tetapi, jika
dalam prediksi digunakan beberapa prediktor, untuk menguji signifikansi garis
regresinya perlu dilakukan analisis variansi terhadap garis regresi tersebut. Apa yang
disebut analisis regresi sebenarnya adalah analisis variansi terhadap garis regresi,
dengan maksud untuk menguji signifikansi garis regresi yang bersangkutan. Dari
analisis regresi kita akan menghasilkan bilangan –F sebagaimana halnya jika kita
mengadakan analisis variansi. Untuk analisis regresi bilangan – F diperoleh dari rumus :
RK
F reg =
reg

RK res
Dalam mana Freg = Harga bilangan – F untuk garis regresi;
RKreg = Rerata Kuadrat garis regresi; dan
RKres = Rerata Kuadrat residu.
Jadi bilangan –F regresi diperoleh dari membandingkan (nisbah) RK regresi dengan RK
residu. Makin besar harga RK residu akan makin kecil harga F regresi. RK residu RK
“error” memang mempunyai cirri semacam itu: dalam perhitungan nisbah – F harga
bilangan –F akan sangat ditentukan oleh harga RK “error” nya. Maka, dalam analisis
garis regresi, jika harga F - regresi sangat kecil dan tidak signifikan , maka garis
regresinya tidak akan memberikan landasan untuk prediksi secara efisien.

Walaupun analisis variansi garis regresi lebih efektif untuk menganalisis garis
regresi dengan beberapa prediktor, namun sebagai dasar pemahaman marilah kita coba
menganalisis data satu prediktor dalam contoh di depan.

Metode Skor Kasar :


Dari data yang telah dikomputasi kita ketahui :
∑Y = 620 N = 10
∑Y2 = 39.432 a =2
∑XY = 102.732 K = - 268

Dalam analisis variansi perhitungan yang paling banyak harus dilakukan adalah
perhitungan mengenai jumlah Kuadrat JK (Jumlah Kuadrat). Jika hasil perhitungan JK
kita masukkan dalam tabel ringkasan analisis varians, maka perhitungan rerata Kuadrat
RK dan F-nya tidak akan banyak menghadapi kesulitan. Tata kerja itu akan kita tempuh
juga dalam percobaan kita menerapkan rumus-rumus analisis variansi ini.

Samsudi - STATISTIKA 75
6202
JKT = 39.432 − = 992
10
6202
JKreg = 2(102.732) + (− 268)(620) − = 864
10
JKres = 992 − 864 = 128

dbT = 10 − 1 = 9

dbreg = 1

dbres = 9 − 1 = 8

Dengan Satu-Prediktor : (dengan skor kasar)

Sumber
db JK RK
Variasi
Regresi (reg) 1 (Σxy )2
JK reg
Σx 2
dbreg
Residu (res) N–2 Σy 2 −
(Σxy ) 2
JK res
Σx 2
dbres
Total T N–1 ΣY 2 -
KRreg
Freg = ; db = 1 lawan N-2
KRres

(dengan skor deviasi)

Sumber
db JK RK Freg
Variasi
Regresi 1 (Σxy )2
(reg) JK reg
Σx 2 RK reg
dbreg
N–2 Σy 2 −
(Σxy )
2
JK res
RK res

Residu (res) Σx 2 dbres


Total ( T ) N–1 ΣY 2 - -

Samsudi - STATISTIKA 76
(dari rxy)

Sumber
db JK RK Freg
Variasi
Regresi(reg) 1 (r )(Σ y )
2 2
(r )(Σ y )
2 2

(r )(N − 2)
2

(1 − r )(Σ y )
2 2
1− r2
Residu (res) N–2 (1 − r )(Σ y )
2 2
N − 2
Total ( T ) N–1 ΣY 2
- -

TABEL RINGKASAN

Sumber
db JK RK Freg p
Variasi
Regresi(reg) 1 864 864 < 0,01
54,00
Residu (res) 8 128 10
Total ( T ) 9 992 - - -

Metode skor deviasi

Telah kita ketahui :

∑x2 = 210 ∑xy = 432


∑y2 = 992 N = 10
JKT = 992
dbT = 10 − 1 = 9
4322
JK reg = = 888,69 dbreg = 1
120
JK reg = 992 − 888,69 = 103,31 dbres = 9 − 1 = 8

TABEL RINGKASAN

Sumber
db JK RK Freg p
Variasi
Regresi(reg) 1 888,69 888,69 68,84 < 0,01
Residu (res) 8 103,31 12,91 - -
Total ( T ) 9 992 - - -

Melalui rxy :

Telah kita ketemukan :

r= 0,946 ∑y2 = 992 N = 10

Samsudi - STATISTIKA 77
JKT = 992 dbT = 10 − 1 = 9
JK reg = (0,946) (992) = 887,76
2
dbreg = 1
JK reg = 992 − 887 , 26 = 1 dbres = 9 − 1 = 8

TABEL RINGKASAN

Sumber
db JK RK Freg p
Variasi
Regresi(reg) 1 887,76 887,76 68,13 < 0,01
Residu (res) 8 104,24 13,03 - -
Total ( T ) 9 992 - - -

Dari tiga perhitungan tersebut kita memperoleh harga F regresi yang berbeda-
beda : yang pertama F = 54,00; yang kedua F= 68,84; dan yang ketiga F = 68,13. Dua
harga F yabf terakhir boleh dikatakan sama, tetapi harga F dari perhitungan yang
pertama ternyata sangat rendah. Seharusnya, dengan metode manapun hasilnya akan
sama saja. Perbedaan itu disebabkan karena ketelitian perhitungan.

9.3. Analisis Regresi: Dua Prediktor


Prinsip-prinsip untuk memprediksi kriterium dari satu prediktor berlaku juga
untuk memprediksi kriterium dari dua prediktor atau lebih. Dengan sedikit memperluas
perhitungannya , akan kita coba bagaimana menyelesaikan anlaisis regresi dengan dua
prediktor lebih dahulu.
Persamaan skor regresi dua prediktor adalah :
Y = a1 X1 + a2 X 2 + K
Dalam skor deviasi persamaan itu dapat dituliskan
y = a1 x1 + a 2 x2
Oleh karena itu dengan kalkulator tangan metode skor deviasi jauh lebih efisien
daripada metode skor kasar, maka dalam contoh analisis di bawah ini akan digunakan
saja metode skor deviasi. Metode skor kasar dapat juga kita coba sebagian untuk
mengetahui sekedar cara-cara menghitungnya.
Untuk menyelesaikan perhitungan garis regresi y = a1 x1 + a 2 x 2 harga koefisisen
prediktor a1 dan a2 dapat kita cari dari persamaan simultan :
Contoh :
Misalkan seorang peneliti ingin memastikan apakah nilai Statistik Dasar (Y)
dapat diprediksikan dari nilai Pretes Aljabar (X1) dan nilai Indeks Prestasi SMA (X2),
apa tidak. Untuk itu peneliti tersebut misalkan telah mengumpulkan data sebagai
berikut:

Samsudi - STATISTIKA 78
Mhs.
X1 X2 Y
No.
1 57 3,00 27
2 93 2,85 34
3 79 3,20 27
4 26 2,49 24
5 69 3,07 35

6 24 2,38 18
7 76 3,74 33
8 61 2,62 39
9 82 2,53 35
10 29 3,17 25

Dengan kalkulator kita akan menghasilkan perhitungan


N = 10
∑X1 = 596 ∑X 12 = 41.214
∑X2 = 29,05 ∑X 22 = 85,9537
∑Y = 297 ∑Y2 = 9.199
∑X1X2 = 1.765,99 ∑X1Y = 18.787 ∑X2Y = 867,75

Jika hasil perhitungan itu kita ubah dalam skor deviasi maka akan kita peroleh :
( X)
∑ = ∑ − ∑N = 41 .214 − 10 = 5 .692 , 4
2 2
2 5962 1
1 1

( X )
∑ = ∑ − ∑ N = 85 ,9537 − 10 = 1,56345
2 2
2 2 29 , 05 2
2 2

( y)
∑ y = ∑ y − ∑N = 9 ,199 − 10 = 378 ,1
2 2
2 297 2

( X )( X )
∑ X X = ∑ X X − ∑ ∑ = 1.765,99 −
(596)(29,05) = 34,61
1 2
1 2 1 2
N 10
(∑ X 1 )(∑ Y ) (596)(297 ) = 1.085,8
∑X Y = ∑X Y −
1 1
10
N
=18.787 −

(∑ X 2 )(∑ Y )
(29,05)(297 ) = 4,965
∑ X 1Y = ∑ X 2Y − N
=867,75 −
10
Persamaan simultan untuk menentukan a1 dan a2 adalah :
(1). ∑x 1 y = a 1 Σ x 12 + a 2 Σ x 1 x 2
(2). ∑ x 2 y = a1Σ x1 x 2 + a 2 ∑ x 22

Samsudi - STATISTIKA 79
Diisikan dan dikerjakan

(1). 1.085,8 = 53692,4 a1 + 34,61 a2


(2). 4,965 = 34,61 a1 + 1,563 45 a2

(1) ; 34, 61 = 31,372 435 71 = 164, 472 695 7 a1+ a2


(2) ; 1,56345 = 3,175 669 19 = 22, 136 940 74 a1+ a2
(3) – (4) = 28,196 766 52 = 142, 335 755 a1
28,19676652
a1 = = 0,198100375
142,335755
(4) 3,17569919 = (22,13694074 )(0,198100375) + a2
= 4,385336261 + a2
a2 = 3,17566919 − 4,385336261 = −1,2095667071

Persamaan garis regresi dalam skor deviasi yang kita cari adalah :
Y = a1 x1 + a2 x2

( ) (
Y − Y = a1 X 1 − X 1 + a2 X 2 − X 2 )
Y = a (X
1 1 − X ) + a (X
1 2 2 − X2 )+ Y
Dari pekerjaan di muka dapat diketemukan :
596
X1 = = 59,6
10
29,05
X2 = = 2,905
10
297
Y= = 29,7
10
a1 = 0,198100375
a2 = −1,209667071
Jadi,
Y = (0,198100375)( X 1 − 59,6 ) + (− 1,209667071)( X 2 − 2,905) + 29,7
= 0,198100375 X 1−11,80678235 − 1,209667071X 2 + 3,514082841 + 29,7
Y = 0,198100375 X 1 − 1,209667071X 2 + 21.40730049
Jika dibulatkan : Y = 0,2 X 1 − 1,2 X 2 + 21,4 → Y = a1 x1 − a2 x2 + K

Catatan : Pembulatan ini hanya untuk menggampangkan pencatatan


Untuk perhitungan-perhitungan (selanjutnya) masih baru
Digunakan bilangan yang belum dibulatkan.

Koefisien korelasi antara kriterium Y dengan prediktor X1 dan prediktor X2


dapat diperoleh dari rumus :

Samsudi - STATISTIKA 80
a 1Σ x1 y + a 2 Σ x 2 y
R y (1, 2 ) =
Σy 2
RY(1,2) = Koefisien korelasi antara Y dengan X1 dan X2
a1 = Koefisien prediktor X1
a2 = Koefisien prediktor X2
∑x1y = Jumlah setujuduk antara X1 dengan Y
∑x2y = Jumlah setujuduk antara X2 dengan Y
∑y2 = Jumlah Kuadrat kriterium Y

Jika hasil-hasil perhitungan di muka diisikan ke dalam rumus di atas :

R y (1, 2 ) =
(0,198100375 )(1 .085 ,8 ) + (− 1, 209667071 )(4,965 )
378 ,1
= 0,553005527 = 0,743643414

Jadi Ry(1,2) = 0,744


Dan R2y(1,2) = 0,553005527

Dalam perhitungan tersebut sekaligus dicari harga R2y(1,2) oleh karena dalam analisis
regresi nanti yang kita pakai adalah harga R2y(1,2)
Untuk menjawab pertanyaan, apakah harga Ry(1,2) = 0,744 itu signifikan apa
tidak, analisis regresi tidak lain adalah analisis regresi. Seperti sudah kita kenal, analisis
regresi tidak lain adalah analisis harga F si garis regresi. Dari analisis ini kita akan
menemukan harga F garis regresi, yang kemudian dapat kita uji apakah harga F itu
signifikan ataukah tidak.
Rumus F yang paling efisien, jika koefisien korelasi antara kriterium dengan
prediktor-prediktorny a telah diketemukan, adalah:

R 2 (N − m − 1)
=
( )
F reg
m 1− R2
F reg = Harga F garis regresi
N = Cacah kasus
m = Cacah prediktor
R = Koefisien korelasi antara kriterium dengan prediktor-prediktor.
Derajat kebebasan atau db untuk menguji harga F itu adalah m lawan N – m – 1.
Diisikan :
F reg =
(0 ,553055527 )(10 − 2 − 1) = 4,330 < 4,74
2 (1 − 0 ,553005527 )

Dengan db = m lawan N-m-1 atau 2 lawan 7 harga Ft5% = 4,74 jadi, jika
demikian, harga Freg sebesar 4,330 itu tidak signifikan. Kita menyimpulkan, tidak ada
korelasi antara Y dengan X1 dan X, atau antara nilai statistika Dasar dengan nilai Pretest

Samsudi - STATISTIKA 81
Aljabar dan persen kita tidak berani menggunakan prediktor nilai Pretest Aljabar dan
nilai Indeks Prestasi SMA untuk memprediksi nilai Statistik Dasar.
Rumus F regresi yang baru disebutkan di atas diperoleh dari setujuses analisis
variasi garis regresi yang agak panjang. Keseluruhan setujuse situ dapat dilihat dalam
tabel rangkuman analisis regresi sebagai berikut :

TABEL RINGKASAN ANALISIS REGRESI


Sumber
db JK RK
Variasi
m R2 (∑ y )2
( )
R 2 Σy 2
Regresi(reg)
m
Residu (res)
N-m-1 (1− R2 )(Σy2 ) ( )( )
1 − R 2 Σy 2
N − m −1
Total ( T ) N-1 ∑y2 --

R 2 Σy2 ( )
m R 2 (N − m − 1 )
= =
Freg
(
1 − R 2 Σy2 )( ) (
m 1− R2 )
N − m −1

Jadi, jika seluruh proses analisis tersebut kita ikuti, maka :

( )
JK reg = R 2 Σ Y 2 = (0 ,553005527 )(378 ,1) = 209 ,0913897
db reg = m = 2
JK 209 , 0913897
RK reg = = = 104 ,5456948
reg

db reg 2
( )( )
JK res = 1 − R 2 Σ Y 2 = (1 − 0,553005527 )(378 ,1) = 169 ,0086102
dbres = N − m − 1 = 10 − 2 − 1 = 7
JK res 169 ,0086102
RK res = = = 24 ,14408717
dbres 7
RK reg 104 ,5456948
JadiFreg = = = 4,330
RK res 24 ,14408717

Hasil analisis regresi tersebut kemudian dapat kita masukkan dalam tabel
ringkasan analisis sebagai berikut :

Samsudi - STATISTIKA 82
TABEL RINGKASAN ANALISIS REGRESI

Sumber
db JK RK
Variasi
209,091 389 7 104,545 694 8
Regresi(reg) 2
169,008 610 2 24, 144 087 17
Residu (res) 7
Total ( T ) 9 378,1 ----------

F = 4,330

Jika diinginkan mencari harga F regresi dengan rumus skor kasar, rumusnya
adalah :

( N − m − 1 )⎢ a1Σ X 1Y + a 2 Σ X 2Y + K Σ Y − (Σ Y ) ⎥
⎡ 2

Freg = ⎣ N ⎦
(
m Σ Y − a1Σ x1 y − a 2 Σ X 2Y − K Σ Y
2
)
Untuk mengingat kembali data dan hasil-hasil perhitungan yang sudah kita
ketemukan :
N = 10 m=2
a1 = 0,198 100 375 a2 = 1,209 667 071 K = 21, 407 300 49
∑X1Y = 18.787 ∑X2Y = 867,75
∑Y = 297 ∑Y2 = 9.199

Dikerjakan
N – m – 1 = 10 – 2 – 1 = 7
a1∑X1Y = (0,198 100 375) (18.787) = 3.721,711 745
a2∑X2Y = (-1,209 667 071) (867,75) = - 1.049,688 6
K∑Y = (21,407 300 49) (297) = 6.375, 968 245
(ΣY ) = 297 = 8.820,9
2 2

N 10

Diisikan :

7 (3.721,711745 + −1.049 ,6886 + 6.357 ,968245 − 8.820 ,9 )


Freg =
2(9.199 − 3.721,711745 − 1.049 ,6886 − 6.357 ,968245 )
1.463,63973
= = 4,330
338,01722

Rumus-rumus skor kasar untuk analisis regresi dapat dirangkum dalam tabel
seperti di bawah ini :

Samsudi - STATISTIKA 83
TABEL RINGKASAN ANALISIS REGRESI

Sumber
db JK RK
Variasi
Regresi(reg) m
a1ΣX 1Y + a2 ΣX 2Y + KΣY −
(ΣY )2 JK reg
N dbreg
Residu (res) N-m-1
ΣY 2 − a1Σx1 y − a2 ΣX 2Y − KΣY JK res
dbres

Total ( T ) N-1 ΣY 2

(ΣY )
2
--
N


(N − m − 1)⎢a1ΣX 1Y + a2ΣX 2Y + KΣY − (ΣY ) ⎤
2


= ⎣ N ⎦
Jadi Freg
(
m ΣY 2 − a1Σx1 y − a2ΣX 2Y − K ΣY )
Dikerjakan berikutnya :

JK reg = a1ΣX 1Y + a2ΣX 2Y + KΣY −


(ΣY )2
N
= 3.721,711745 + −1.049,6886 + 6.357,968245 − 8.820,9
= 209,09139
dbreg = m = 2
JK reg 209,09138
RK reg = = = 104,545695
dbreg 2
JK res = ΣY 2 − a1Σx1 y − a2ΣX 2Y − KΣY
= 9.199 − 3.721,711745 − −1.049,6886 − 6.357,968245
= 169,00861
dbres = N − m − 1 = 10 − 2 − 1 = 7
RK reg 169,00861
RK res = = = 24,14408714
RK res 7
RK reg 104,545695
Jadi Freg = = = 4,330
RK res 24,14408714

Sebagaimana biasa dari hasil analisis variansi garis regresi dibuatlah tabel ringkasan
analisis. Maka jika kita buat tabel ringkasan analisis regresi, hasilnya akan nampak
seperti tabel ringkasan analisis regresi seperti yang baru kita buat di muka.
Telah dikemukakan, apabila dalam mengerjakan analisis regresi kita hanya
mempunyai kalkulator tangan, cara yang paling efisien adalah menggunakan metode

Samsudi - STATISTIKA 84
skor deviasi. Karena itu untuk analisis-analisis berikutnya akan kita gunakan saja
metode skor deviasi, dan untuk metode skor kasar hanya akan dikemukakan rumusnya,
saja.

9.4. Analisis Regresi : m – Prediktor

Prinsip-prinsip analisis regresi dua prediktor berlaku sepenuhnya untuk analisis


regresi tiga prediktor, empat prediktor, lima prediktor dan seterusnya, jika dengan
sedikit perluasan. Hal tersebut dengan mudah kita fahami jika bandingkan rumus-
rumusnya untuk garis regresi maupun untuk koefisien korelasinya. Periksalah rumus-
rumus dibawah ini.
Persamaan Garis Regresi
Dua Prediktor : Y = a1 x1 + a 2 x2 + K
Tiga Prediktor : Y = a1 x1 + a2 x2 + a3 x3 + K
Empat Prediktor : Y = a1x1 + a2 x2 + a3 x3 + a4 x4 + K
m – Prediktor : Y = a1 x1 + ......am xm + K

Koefisien Korelasi

a1Σ x1 y + a 2 Σ x 2 y
Dua Prediktor : R (1 , 2 ) =
Σy2
y

a1Σ x1 y + a 2 Σ x 2 y + a 3 Σ x 3 y
Tiga Prediktor : R (1 , 2 ) =
Σy 2
y

a1Σ x1 y + a 2 Σ x 2 y + a 3 Σ x 3 y + a 4 Σ x 4 y
Empat Prediktor : R y (1, 2 ) =
Σy 2
a 1 Σ x 1 y + ....... + a m Σ x m y
m – Prediktor : R y (1 , 2 ) =
Σy 2

Samsudi - STATISTIKA 85
Soal Latihan

1. Jika suatu penelitian ingin menguji apakah berat badan orang pada kelompok umur
tertentu dapat diramalkan dari tinggi badan. Dalam penelitian itu dikumpulkan data
tinggi badan dan berat badan sepuluh orang sebagai berikut :

Tinggi Berat
Subyek
(dalam cm) (dalam kg)
No.
X. y
1 168 63
2 173 81
3 162 54
4 157 49
5 160 52
6 165 62
7 163 56
8 170 78
9 168 64
10 164 61

Ujilah pada taraf signifikansi 1%, dan gunakan table rangkuman analisis regresi.

2. Seorang peneliti akan menguji apakah nilai Praktik Kelistrikan Otomotif (X1) dan
Praktik Chasis (X2) berpengaruh terhadap nilai Praktik Trouble Shoting (Y)
mahasiswa Pendidikan Teknik Mesin. Untuk itu peneliti tersebut telah
mengumpulkan data sebagai berikut :

Mhs.
X1 X2 Y
No.
1 60 67 78
2 72 66 82
3 79 65 80
4 68 87 81
5 69 75 83
6 78 77 85
7 76 67 78
8 61 65 86
9 82 66 78
10 68 62 77
11 70 63 75
12 71 70 76
13 72 73 73
14 69 68 72
15 82 81 71
Ujilah pada taraf signifikansi 1%, dan gunakan table rangkuman analisis regresi.

Samsudi - STATISTIKA 86
DAFTAR PUSTAKA

Christensen, Larry B. 2001. Expeprimental Methodology. (Eighth Edition). Boston:


Allyn and Bacon.

Guilford, J.P; Fruchter, benjamin. 1985. Fundamental Statistics in Psychology and


Education. (Sixth Edition). Bogota: McGraw-Hill Book Co.

Hadi, Sutrisno. 1982. Statistik, Jilid 1, 2 dan 3. Yogyakarta: Fakultas Psikologi UGM

Hadi, Sutrisno. 1991. Analisis Regresi. Yogyakarta: Andi Offset

Mendenhall, William; Ott, Lyman; Larson, Ricahrd F. 1974. Statistics: a Tool for the
Social Sciences. California: Duxbury Press.

Sudijono, Anas. 1996. Pengantar Statitik Pendidikan. Jakarta: Rajawali

Sudjana. 1991. Desain dan Analisis Eksperimen. Edisi III. Bandung: Tarsito.

Sudjana. 1989. Statistika. Edisi ke 5. Bandung: Tarsito

Samsudi - STATISTIKA 87