PENDAHULUAN
A. PENDAHULUAN
Data berbentuk jamak, sedang datum berbentuk tunggal. Jadi data sama dengan
datum-datum.
Data ialah suatu bahan mentah yang jika diolah dengan baik melalui berbagai
analisis dapat melahirkan berbagai informasi. Dengan informasi tersebut, kita dapat
mengambil suatu keputusan. Dalam statistik dikenal istilah-istilah jenis data, tingkatan data,
sumber data, penyajian data, analisis data. Data dianalisis sesuai dengan jenis dan
tingkatannya, karena itu masing-masing tingkatan data mempunyai analisis sendiri
khususnya dalam analisis korelasi.
Data yang baik tentu saja harus yang mutakhir, cocok (relevant) dengan masalah
penelitian dari sumber yang dapat dipertanggungjawabkan, lengkap, akurat, objektif, dan
konsisten. Pengumpulan data sedapat mungkin diperoleh dari tangan pertama. Data yang
baik sangat diperlukan dalam penelitian, sebab bagaimanapun canggihnya suatu analisis data
jika tidak ditunjang oleh data yang baik, maka hasilnya kurang dapat
dipertanggungjawabkan.
B. JENIS DATA
Jenis data secara garis besarnya dapat dibagi atas dua macam yaitu data dikotomi dan
data kontinum.
1. Data Dikotomi
Data dikotomi disebut : data deskrit, data kategorik atau data nominal. Data ini
merupakan hasil perhitungan, sehingga tidak dijumpai bilangan pecahan. Data dikotomi
adalah data yang paling sederhana yang disusun menurut jenisnya atau kategorinya. Bila kita
telah memberikan nama kepada sesuatu berarti kita telah menentukan jenis atau kategorinya
menurut pengukuran kita. Dalam data dikotomi setiap data dikelompokkan menurut
kategorinya dan diberi angka. Angka-angka tersebut hanyalah label belaka, bukan
menunjukkan tingkatan (ranking). Dasar dalam menyusun kategori data tidak boleh
tumpang tindih (mutually exclusive). Kalau kita melakukan kategori secara alamiahnya,
maka disebut data dikotomi sebenarnya (true dichotomi) dan jika kategorinya dibuat-buat
sendiri (direkayasa), maka disebut data dikotomi dibuat-buat (artificial dichotomi).
Contoh dari data dikotomi sebenarnya antara lain adalah : jenis kelamin umpamanya
ada tiga yaitu laki-laki diberi angka 1, banci diberi angka 2 dan perempuan diberi angka 3.
Angka 3 pada wanita bukan berarti kekuatan wanita sama dengan tiga kali laki-laki.
Demikian pula banci sama dengan dua kali laki-laki. Tetapi seperti yang disebutkan tadi
bahwa angka-angka tersebut hanyalah label belaka. Banyak contoh-contoh data dikotomi
sebenarnya ini seperti macam warna kulit, suku bangsa, bahasa daerah, dan sebagainya.
2. Data Kontinum
Data kontinum terdiri atas tiga macam data yaitu : data ordinal, data interval, dan
data rasio. Ketiga macam data-data tersebut diuraikan seperti berikut ini :
a. Data ordinal
Data ordinal ialah data yang sudah diurutkan dari jenjang yang paling rendah sampai
ke jenjang yang paling tinggi, atau sebaliknya tergantung peringkat selera pengukuran yang
subjektif terhadap objek tertentu. Kita dapat menyatakan bahwa saya lebih suka jeruk A
daripada jeruk B meskipun sama-sama tergolong jenis jeruk. Selanjutnya jeruk B kita bobot
1 dan jeruk A kita bobot 2. Pembobotan biasanya merupakan urutannya. Oleh sebab itu, data
ordinal disebut juga sebagai data berurutan, data berjenjang, data berpangkat, data tata
jenjang, data ranks, dan data petala, data bertangga atau data bertingkat.
Pemberian jenjang tersebut pada umumnya dapat dilakukan sebagai berikut : Mula-
mula kita urutkan data itu mulai dari yang terendah sampai yang tertinggi. Demikian pula
sebaliknya. Kemudian berilah angka 1 untuk yang tertinggi, angka 2 pada yang berada di
bawahnya dan seterusnya.
Contoh-contoh data ordinal lainnya adalah : golongan gaji, pangkat, pendidikan
mulai Taman Kanak-kanak sampai Perguruan Tinggi, status sosial (tinggi, menengah, dan
rendah), Daftar Urutan Kepegawaian (DUK), dan sebagainya. Data ordinal ini lebih tinggi
kedudukannya dibandingkan dengan data nominal.
b. Data interval
Data interval mempunyai sifat-sifat nominal dari data ordinal. Di samping itu ada
sifat tambahan lainnya pada data interval yaitu mempunyai nol tidak mutlak. Akibatnya ia
mempunyai skala interval yang sama jaraknya. Pengukuran data interval tidak memberikan
jumlah yang absolut dari objek yang diukur.
c. Data rasio
Data rasio mengandung sifat-sifat interval, dan selain itu ia sudah mempunyai nilai
nol mutlak. Contoh dari data rasio diantaranya adalah : berat badan, tinggi, panjang, atau
jarak.
C. Tingkatan data
Tingkatan data kalau diurutkan dari yang tertinggi ke yang terendah yaitu : 1) rasio,
2) interval, 3) ordinal, dan 4) nominal. Dalam analisis statistik, jika perlu, maka data yang
tinggi dapat diturunkan ke tingkatan yang lebih rendah. Tetapi sebaliknya, data yang
tingkatannya rendah tidak dapat dinaikkan kepada tingkatan yang lebih tinggi.
E. Analisis data
Analisis data untuk masing-masing tingkatan (skala) data dapat dilakukan seperti
tabel berikut ini.
Tabel 2.1 Analisis Statistik yang Cocok untuk Empat Skala Data
Tes statistik
Skala Hubungan yang Statistik yang cocok
yang cocok
a. Penyajian data
Data dianalisis dan disajikan menurut gambar di bawah ini :
batang
garis
lambang (simbol)
diagram lingkaran (pastel)
peta (kartogram)
pencar (titik)
biasa
distribusi frekuensi
Penyajian data tabel distribusi frekuensi relatif
distribusi frekuensi kumulatif
distribusi frekuensi relatif-kumulatif
Nilai 48 – 54 disebut kelas interval. Urutan kelas interval disusun mulai data
terkecil sampai terbesar. Urutan kelas interval pertama (48 – 54) disebut kelas interval
pertama. Dan urutan kelas interval kedua (55 – 61) disebut kelas interval kedua. Demikian
seterusnya. Semua kelas interval berada di kolom kiri.
Sedangkan nilai yang berada di kolom kanan adalah nilai frekuensi yang disingkat
f. f = 1 berarti pegawai yang mempunyai nilai antara 48 sampai 54 adalah 1 orang.
Nilai-nilai di kiri kelas interval (48, 55, 62, 69, 76, 83, dan 90) disebut ujung bawah
kelas. Nilai 48 disebut ujung bawah kelas pertama, nilai 55 disebut ujung bawah kelas
kedua. Demikian seterusnya.
Nilai-nilai di kanan kelas interval (54, 61, 68, 75, 82, 89, dan 96) disebut ujung atas
kelas. Nilai 54 disebut ujung atas kelas pertama, nilai 61 disebut ujung atas kelas kedua.
Demikian seterusnya.
Selisih positif antara tiap dua ujung bawah berurutan disebut panjang kelas
interval, yang disingkat dengan p. Dalam tabel tersebut p = 55 – 48 = 7. Semua p sama
besarnya, dalam tabel tersebut = 7.
Jika ujung bawah kelas dikurangi 0,5 atau 0,05 atau 0,005 (tergantung ketelitian data
yang digunakan) dan ujung atas kelas ditambah 0,5 atau 0,05 atau 0,005; maka nilai tersebut
dinamakan batas kelas. Dalam tabel tersebut, batas kelasnya adalah 47,50 – 54,50. Dan
seterusnya.
(ujung bawah kelas + ujung atas kelas)
Tanda kelas = 2
48 54
Tanda kelas pertama untuk tabel tadi ialah 51 . Demikian seterusnya.
2
Langkah-langkah Membuat Tabel Distribusi Frekuensi
1) Urutkan data dari yang terkecil ke data terbesar
2) Hitung rentang yaitu data tertinggi dikurang data terendah dengan rumus :
R = data tertinggi – data terendah
3) Hitung banyak kelas dengan aturan Sturges yaitu :
banyak kelas = 1 + 3,3 log n
n = banyaknya data, hasil akhirnya dibulatkan. Banyak kelas paling sedikit 5 kelas dan
paling banyak 15 kelas, dipilih menurut keperluannya.
4) Hitung panjang kelas interval dengan rumus :
rentang
p= banyak kelas
5) Tentukan ujung bawah kelas interval pertama. Biasanya diambil data terkecil atau data
yang lebih kecil dari data terkecil tetapi selisihnya harus kurang dari panjang kelas yang
telah didapat.
6) Selanjutnya kelas interval pertama dihitung dengan cara menjumlahkan ujung bawah
kelas dengan p tadi dikurang 1. Demikian seterusnya.
7) Nilai f dihitung dengan menggunakan tabel penolong sebagai berikut.
Tabel Penolong
Nilai Tabulasi f
42
= = 7
6
5) Tentukan ujung bawah kelas interval pertama.
Biasanya diambil data terkecil = 48.
6) Selanjutnya kelas interval pertama dihitung dengan cara menjumlahkan ujung bawah
kelas dengan p tadi dikurang 1. Demikian seterusnya.
48 + 7 – 1 = 54
55 + 7 – 1 = 61
61 + 7 – 1 = 67
69 + 7 – 1 = 75
76 + 7 – 1 = 82
83 + 7 – 1 = 89
90 + 7 – 1 = 96
Nilai DP3 f
48 – 54 1
55 – 61 2
62 – 68 7
69 – 75 12
76 – 82 7
83 – 89 3
90 – 96 2
34
Contoh Soal
Lanjutkan tabel distribusi frekuensi di atas menjadi tabel distribusi relatif.
Jawab :
1
f (%) = x100% 2,94% demikian seterusnya, masukkan nilai tersebut ke dalam
34
tabel frekuensi relatif sehingga menjadi :
Tabel Distribusi Frekuensi untuk Nilai DP3
Nilai DP3 f
48 – 54 2,94
55 – 61 5,88
62 – 68 20,60
69 – 75 35,29
76 – 82 20,60
83 – 89 8,81
90 – 96 5,88
100,00
Jika diinginkan boleh saja tabel distribusi frekuensi digabungkan dengan tabel
distribusi frekuensi relatif menjadi tabel distribusi frekuensi – relatif sebagai berikut.
Tabel Distribusi Frekuensi untuk Nilai DP3
Nilai DP3 fabs frel
48 – 54 1 2,94
55 – 61 2 5,88
62 – 68 7 20,60
69 – 75 12 35,29
76 – 82 7 20,60
83 – 89 3 8,81
90 – 96 2 5,88
34 100,00
Jawab :
Tabel Distribusi Frekuensi Kumulatif Kurang dari Untuk Nilai DP3
Nilai DP3 fkum
kurang dari 48 0
kurang dari 55 1
kurang dari 62 3
kurang dari 69 10
kurang dari 76 22
kurang dari 83 29
kurang dari 90 32
kurang dari 97 34
Tabel Distribusi Frekuensi Kumulatif Relatif atau Lebih Untuk Nilai DP3
Nilai DP3 fkum(%)
48 atau lebih 100
55 atau lebih 97,06
62 atau lebih 91,18
69 atau lebih 70,59
76 atau lebih 35,29
83 atau lebih 14,71
90 atau lebih 5,88
E. HISTOGRAM
Histogram ialah penyajian data distribusi frekuensi yang diubah menjadi diagram
batang. Untuk menggambarkan histogram dipakai sumbu mendatar yang menyatakan batas-
batas kelas interval dan sumbu tegak yang menyatakan frekuensi absolut atau frekuensi
relatif.
Contohnya :
Buatlah histogram untuk tabel distribusi pada tabel di atas.
Jawab :
F. POLIGON FREKUENSI
Poligon frekuensi ialah gambar garis yang menghubungkan tengah-tengah tiap sisi
atas yang berdekatan dengan tengah-tengah jarak frekuensi absolut masing-masing. Jika
daftar distribusi frekuensi mempunyai kelas-kelas interval yang berbeda, maka tinggi
diagram tiap kelas harus disesuaikan. Untuk ini, ambil panjang kelas yang sama yang
terbanyak terjadi sebagai satuan pokok. Tinggi untuk kelas-kelas lainnya digambarkan
sebagai kebalikan dari panjang kelas dikalikan dengan frekuensi yang diberikan.
Contoh :
G. OGIVE (OZAIV)
Ogive ialah distribusi frekuensi komulatif yang digambarkan diagramnya dalam
sumbu tegak dan mendatar. Ogive “kurang dari” ialah diagram dari distribusi frekuensi
komulatif kurang dari. Dan ogive “atau lebih” ialah diagram dari distribusi frekuensi
komulatif atau lebih.
Contoh :
Buatlah ogive untuk tabel distribusi komulatif kurang dari untuk tabel di atas.
Jawab :
Contoh :Buatlah ogive untuk tabel distribusi frekuensi komulatif atau lebih untuk tabel di
atas. Jawab :
B. UKURAN PENEMPATAN
1. Median
Median (yang selanjutnya disingkat Me) ialah nilai tengah-tengah dari data yang
diobservasi, setelah data tersebut disusun mulai dari urutan yang terkecil sampai yang
terbesar atau sebaliknya. Jika jumlah datanya ganjil, maka Me terdapat tepat di tengah-
tengah.
Contoh sampel dengan data :
10, 9, 3, 5, 7, 12, 8 (ada tujuh data).
Data disusun menjadi : 3, 5, 7, 8, 9, 10, 12; maka Me = 8 (data yang di tengah-
tengah). Jika jumlah datanya genap, maka Me didapat dengan dua data di tengah-tengah
kemudian dibagi dua.
Contoh sampel dengan data :
10, 3, 12, 5, 7, 10, 8, 14, 14, 14 (10 data).
Data disusun menjadi : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14 sehingga,
(10 10)
Me = 10
2
Data yang sudah disusun dalam daftar distribusi frekuensi. Me dihitung dengan rumus :
Me = b+p (1/2 n – F)
f
Dari contoh di atas didapat data sampel : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14 (n = 10).
Buat dulu daftar distribusi frekuensinya.
rentang = data terbesar – data terkecil
= 14 – 3 = 11
banyak kelas = 1 + (3,3) log n
= 1 + 3,3 log 10
= 1 + 3,3 . 1
= 4,3 diambil 4
rentang
kelas internval = p =
banyak kelas
11
=
4
= 2,75 dibulatkan 3.
Nilai data f1
3–5 2
6–8 2
9 – 11 3
12 – 14 3
Jumlah 10
Setengah dari seluruh data ada = 5 buah, jadi Me terletak di kelas interval ketiga, karena
sampai dengan ini jumlah frekuensi sudah lebih dari 5 buah. Dari kelas Me ini didapat :
b = 11,5; p= 3; F= 2 + 2 = 4 dan n = 10
Sehingga :
54
Me = 11,5 + 3 = 11,5 + 0,3 = 11,8.
10
Me merupakan alat deskripsi yang baik untuk distribusi data yang tidak normal. Me sering
untuk memperbaiki harga rata-rata yang terdapat dalam sekelompok data yang ekstrem
harganya, sehingga kurang mewakili (representative) sebagai ukuran gejala pusat.
2. Kuartil
Kuartil ialah jika sekumpulan data dibagi empat bagian sama banyaknya, setelah
data disusun menurut nilai terkecil sampai terbesar. Ada tiga kuartil yaitu : Kuartil pertama =
K1, kuartil kedua = K2, dan kuartil ketiga = K3. Nama diberi dari kuartil terkecil dan untuk
menentukan nilai kuartil sebagai berikut :
1) susun urutan data dari terkecil sampai terbesar.
2) tetapkan 1 tk kuartil.
3) tetapkan nilai kuartil.
i(n + 1)
Letak K1 = data ke
4
Dengan i = 1, 2, 3
Contoh :
Sampel dengan data : 10, 3, 12, 5, 7, 10, 8, 14, 14, 14
Setelah diurutkan menjadi : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14
10 1
Letak K1 = data ke
4
= data ke- 2 ¾ atau 2,75, yaitu antara data ke-2 dengan data ke-3
Nilai K1 = data ke-2 + 1/4 (data ke-3 – data ke-2)
= 5 + 1/4 (7 – 5)
= 5 + 1/4 . 2
= 5 1/2
2(10 1)
Letak K2 = data ke = antara data ke-5 dengan data ke-6.
4
Nilai K2 = data ke-5 + 1/4 (data ke-6 – data ke-5)
= 10 + 1/4 (10 – 10)
= 10
3(10 1)
Letak K3 = = 8 1/4, yaitu antara data ke-8 dengan data ke-9.
2
Nilai K3 = data ke-8 + 1/4 (data ke-9 – data ke-8)
= 14.
Untuk data yang sudah dibuat tabel distribusi frekuensinya dihitung dengan rumus :
in
F
4
Ki = b + p f
dengan I = 1, 2, 3
di mana : b = batas kelas Ki ialah kelas interval di mana Ki akan terletak
p = panjang kelas Ki
F = jumlah frekuensi dengan tanda kelas lebih kecil dari tanda kelas Ki
f = frekuensi kelas Ki
Dengan menggunakan tabel distribusi di halaman tadi, maka didapat harga-harga
sebagai berikut :
Misalnya kita ingin menghitung kuartil kedua, maka 2/4 x 10 data = 5 data. Jadi K 2
terletak kelas ketiga. Dari kelas ketiga tersebut didapat :
b = 11,5
p = 3
f = 3
F = 7
i = 2
n = 10.
2.10
7
K1 = 11,3 + 3 4
3
2
= 11,3 + 3 ( )
3
= 9,3.
Angka ini bermakna bahwa 50% responden mendapat nilai tertinggi 8,3 sedangkan 50%
lainnya di bawah 9,3.
3. Desil
Desil ialah jika sekumpulan data dibagi sepuluh bagian sama banyaknya, setelah
disusun dari yang terendah sampai yang tertinggi. Perhitungannya analog dengan kuartil di
atas, hanya rumusnya saja berbeda dengan :
i (n + 1)
Letak Di = data ke = 10
Dengan i = 1, 2, 3, …………9
Contoh :
Data sampel yang sudah disusun di atas yaitu :
3, 5, 7, 8, 10, 10, 12, 14, 14, 14.
Misalnya kita akan menghitung desil ke-7, maka :
7(10 1)
letak D7 = data ke
10
= data ke-7,7 berada di antara data ke-7 dan ke-8.
nilai D7 = data ke-7 + 0,1 (data ke-8 – ke-7)
= 12 + 0,1 (14 – 12)
= 12,2.
Untuk data dalam tabel distribusi frekuensi, nilai Di dihitung dengan rumus :
di mana : b = batas bawah kelas Di
p = panjang kelas Di
F= jumlah frekuensi sebelum kelas Di
f = frekuensi kelas Di
Contoh :
Diketahui daftar frekuensi seperti di bawah ini :
Tabel
Distribusi Frekuensi
Nilai data f1
3–5 2
6–8 2
9 – 11 3
12 – 14 3
Jumlah 10
= 11,5
4. Persentil
Persentil ialah sekumpulan data yang dibagi 100 bagian yang sama besar, setelah
data itu disusun mulai dari yang terendah sampai yang tertinggi, sehingga menghasilkan 99
pembagi. Cara menghitung persentil seperti halnya menghitung desil. Perbedaannya terletak
pada rumusnya yaitu :
i(n + 1)
Letak Pi = data ke- 100
dengan i = 1, 2, 3, ……….99
Jika nilai Pi dihitung dari tabel distribusi frekuensi, maka rumusnya menjadi :
in -F
Di = b + p 100
f
dengan i = 1, 2, 3, ………100
Jika x adalah rata-rata untuk sampel, maka (baca mu) adalah rata-rata untuk
populasi. Jadi x adalah statistik, sedangkan adalah parameter untuk menyatakan rata-rata.
b. Guna rata-rata
Rata-rata stabil untuk matematik dan paling cocok untuk menghadapi distribusi
normal, dan paling reliabel untuk alat penafsiran atau ramalan (prediksi). Rata-rata dihitung
dengan rumus :
Jika x adalah rata-rata untuk sampel, maka adalah rata-rata populasi. Jadi x adalah statistik
sedangkan adalah parameter untuk menyatakan rata-rata.
Jika datanya dalam bentuk distribusi frekuensi, maka rumusnya :
c. Contoh soal
Diketahui data : 10, 3, 12, 5, 7, 10, 8, 14, 14, 14.
Berapa rata-ratanya?
Jawab :
Diketahui data :
Berapa rata-ratanya?
Jawab :
2. Rata-rata Ukur
Jika perbedaan tiap dua data berurutan tetap atau hampir tetap, maka rata-rata ukur
lebih baik digunakan daripada rata-rata hitung. Rumus rata-rata ukur adalah :
Contoh : Data x1 = 3, x2 = 9, x3 = 27
Berapa rata-ratanya?
U =
Jika nilai datanya besar, maka digunakan rumus :
Contoh : Data x1 = 10, x2 = 100, x3 = 1000
Berapa rata-rata ukurnya?
Jawab : log U = 2
Untuk data yang cenderung berkembang misalnya pertumbuhan penduduk, maka
rumusnya :
Contoh :
Penduduk Indonesia akhir tahun 1980 ada 147 juta. Jika program KB berhasil, maka
pada tahun 2000 nanti penduduk kita 230 juta. Berapa rata-rata pertumbuhan penduduk
setiap tahun.
Jawab :
t = 20
Po = 147
Pt = 230
Jadi laju pertambahan penduduk = 0,81% setiap tahun.
Jika datanya dalam bentuk distribusi frekuensi, maka rumusnya :
Contoh :
Diketahui data sebagai berikut :
3. Rata-rata Harmonik
Rata-rata harmonic untuk data x1, x2, x3 …. xn, sebuah sampel berukuran n dihitung
dengan rumus :
Contoh :
Data 3, 5, 7, 8, 10, 10, 12, 14, 14, 14. Berapa rata-rata harmoniknya?
Jawab :
H=
=
Jika datanya dalam bentuk tabel distribusi frekuensi, maka rata-rata harmoniknya
dihitung dengan rumus :
Contoh soal :
Diketahui data sebagai berikut :
H=
Berdasarkan hasil perhitungan rata-rata, rata-rata ukur dan rata-rata harmonik, maka
dapat ditarik kesimpulan bahwa ketiga ukuran gejala pusat tersebut mempunyai hubungan
yaitu : H < u < x .
4. Modus
Modus atau mode ialah nilai data yang paling sering muncul pada suatu pengamatan.
Jika nilai yang muncul itu hanya ada satu macam, maka modus tersebut dinamakan
unimodel. Dan jika nilai yang muncul ada dua macam, maka modus tersebut dinamakan
bimodal. Demikian seterusnya. Modus sering juga disingkat dengan Mo.
Contoh :
Modus merupakan alat deskripsi yang tepat namun kasar dan hanya sesuai untuk
mendeskripsikan kasus-kasus tipikal atau alat untuk mencari kejadian-kejadian yang sedang
populer saja. Modus tidak terpengaruh pada kasus ekstrem.
2. Pada distribusi juling positif. Mo terletak di bawah puncak kurva. Me di kanan Mo dan
x di kanan Me (B).
3. Pada distribusi juling negatif, Mo terletak di bawah puncak kurva, Me di kiri Mo dan x
di kiri Me (C)
E. UKURAN SIMPANGAN
Selain ukuran penempatan dan ukuran gejala pusat di atas, maka masih ada ukuran
lainnya yaitu ukuran simpangan atau ukuran variasi atau ukuran disperse. Ukuran ini
menggambarkan derajat berpencarnya data kuantitatif. Ukuran simpangan ini terdiri atas
rentang, rentang antarkuartil, simpangan kuartil, rata-rata simpangan, simpangan baku dan
koefisien variasi, serta varians. Dari bermacam-macam ukuran simpangan tersebut, maka
ukuran yang paling penting untuk dipelajari adalah rentang, simpangan baku, dan varians.
1. Rentang
Rentang ialah ukuran variasi yang paling sederhana yang dihitung dari datum
terbesar dikurang data terkecil. Rumusnya ialah :
Contoh soal :
Carilah rentang untuk data sampel : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14.
Jawab :
R = 14 – 3 = 8.
2. Simpangan Baku dan Varians
Ukuran simpangan baku yang paling banyak digunakan ialah simpangan baku.
Simpangan baku ialah suatu nilai yang menunjukkan tingkat variasi suatu kelompok data.
Jika simpangan baku tersebut dikuadratkan, maka ia disebut varians. Simpangan baku untuk
data sampel disebut s dan variansnya ialah s 2, sedangkan simpangan baku untuk data
populasi disebut (baca tho) dan variansnya ialah 2. Jadi s dengan s2 merupakan statistik
dan dan 2 merupakan parameter. Jika kita mempunyai sampel berukuran n dengan data
x1, x2, …. xn, dan rata-rata x, maka s2 dapat dihitung dengan rumus :
atau
Bila datanya sudah disusun dalam bentuk tabel distribusi frekuensi, maka rumusnya :
Selanjutnya, seperti halnya dengan rata-rata, maka kita dapat menghitung rata-rata
gabungan. Jadi jika ada k buah subsampel dengan :
subsampel 1 berukuran n1 dan simpangan baku s1
subsampel 2 berukuran n2 dan simpangan baku s2
…………………………………………………….
subsampel 1 berukuran nk dan simpangan baku sk
yang digabungkan menjadi sebuah sampel berukuran n = n1 + n2 + …. + nk, maka
simpangan bakunya dihitung dengan rumus :
atau lengkapnya :
Untuk mendapatkan nilai simpangan baku s, akarkanlah hasil s2 tersebut dan diambil harga
akar yang positif.
Langkah-langkah Menghitung Simpangan Baku :
1) Buatlah tabel penolong dengan bentuk berikut ini.
3) Cari s = s2
Contoh soal :
1. Diketahui data sampel : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14. Hitunglah simpangan
bakunya.
Jawab :
1) Buatlah tabel penolong dengan bentuk berikut ini.
3) Cari s =
atau dapat dihitung dengan cara :
1) Buatlah tabel penolong dengan bentuk berikut ini.
3) Diketahui
3) Cari s =
3. Diketahui data subsampel 1 : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14 dengan simpangan
baku = 3,92.
dan data subsampel 2 : 3, 5, 7, 8, 10, 10, 12 dengan simpangan baku = 3,13.
Hitunglah simpangan baku gabungannya.
Jawab :
F. ANGKA BAKU
Angka baku atau bilangan baku digunakan untuk membandingkan keadaan distribusi
gejala. Andaikan kita mempunyai sebuah sampel berukuran n dengan data x1, x2, …. xn
sedangkan rata-rata x dan simpangan baku s, maka angka bakunya dihitung dengan
rumus :
Contoh soal :
Diketahui data : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14.
Hitunglah angka bakunya masing-masing.
Jawab :
Simpangan baku = 3,92 dan x = 9.7.
Angka baku untuk x1 = 3 ialah z =
Lanjutkan untuk xi lainnya.
BAB V. DISTRIBUSI PELUANG
A. PENDAHULUAN
Distribusi peluang terdiri atas :
1. Distribusi binom.
2. Distribusi multinom.
3. Distribusi hipergeometrik.
4. Distribusi poisson.
5. Distribusi normal.
6. Distribusi student.
7. Distribusi chi-kuadrat.
8. Distribusi F.
Distribusi 1 sampai 4 digunakan untuk data acak diskrit dan distribusi 5 sampai 8
untuk data acak kontinu. Distribusi yang paling banyak digunakan dalam penelitian sosial
adalah distribusi 1 sampai 8 yang diuraikan sebagai berikut :
B. DISTRIBUSI NORMAL
1. Pendahuluan
Dalam bab terdahulu kita telah dapat menyajikan data menurut keadaan kelompok,
simpangan baku, dan angka baku. Penyajian tersebut dapat pula dilanjutkan dengan
menggunakan distribusi normal. Sebagai contoh, dalam suatu perlombaan lari masal kita
dapat menyajikan data dalam bentuk keadaan kelompok. Namun jika dikehendaki, data
tersebut dapat pula dilanjutkan dengan penyajian :
a. berapa pelari yang gagal untuk jarak 10 km?
b. berapa pelari yang sukses untuk jarak 10 km lebih?
c. apakah ada perbedaan jarak tempuh menurut kategori jenis kelamin, umur, dan
sebagainya?
d. adakah hubungan antara jarak tempuh dengan berat badan?
e. dapatkah diramalkan bahwa semakin banyak yang ikut, semakin banyak pula yang
berhasil?
Jadi, dengan menggunakan distribusi normal, penyajian daa dapat lebih bermakna
daripada hanya menggunakan penyajian kelompok saja. Karena dengan adanya persyaratan
normalitas data, maka data dapat dilanjutkan penyajiannya dalam bentuk membedakan,
mencari hubungannya, dan meramalkannya. Mengapa diperlukan data acak dan berdistribusi
normal? Jawabannya ialah karena hampir segala sesuatu yang ada di dunia ini akan lebih
mudah dibandingkan, dihubungkan, dan diramalkan apabila datanya acak dan berdistribusi
normal. Kebetulan pula bahwa hampir semua gejala alam mendekati distribusi normal. Jika
menggunakan data acak distribusi normal dalam sebuah kurve, maka kurve tersebut
dinamakan kurve normal.
2. Ciri-ciri Distribusi Normal
a. Berbentuk lonceng simetris terhadap x = .
Distribusi normal atau kurve normal disebut juga dengan nama distribusi Gauss,
karena persamaan matematisnya ditemkan oleh Gauss dengan rumus :
Jika x mempunyai bentuk - ~ < x < ~, maka disebut variabel acak X berdistribusi
normal. Dan rumus di atas dapat digambarkan sebagai berikut :
b. Grafiknya selalu berada di atas sumbu absis X.
0,3939
c. Mempunyai modus, jadi kurva unimodal tercapai pada x = = .
d. Grafiknya mendekati (berasimtutkan) sumbu absis X dimulai dari x = + 3 ke kanan
dan x = - 3 ke kiri.
e. Luas daerah grafik selalu = satu unit persegi.
3. Bentuk Kurve Normal
a. Normal umum
Di mana
Perubahan dari bentuk normal umum menjadi normal baku dilakukan dengan
langkah-langkah sebagai berikut :
1) Cari zhitung dengan rumus :
2) Gambarkan kurvenya.
3) Tuliskan nilai zhitung pada sumbu X di kurve di atas dan tarik garis dari titik z hitung ke atas
sehingga memotong garis kurve.
4) Luas yang terdapat dalam tabel merupakan luas daerah antara garis tegak ke titik 0 di tengah
kurve.
5) Carilah tempat nilai z dalam tabel normal.
6) Luas kurve normal = 1, karena = 0, maka luas dari 0 ke ujung kiri = 0,5. Luas dari 0 ke
titik kanan = 0,5.
Jika z bilangan bulat, maka luas daerah (dalam %) adalah sebagai berikut :
Jika z bukan bilangan bulat, maka luas daerahnya dicari dengan menggunakan tabel
kurve normal baku.
4. Cara Menggunakan Tabel Kurve Normal Baku
a. Berapa z = + 2,34?
Jawab : 0,4904 atau 49,04% (ke kanan).
b. Berapa z = -2,34?
Jawab : 0,4904 atau 49,04% (ke kiri).
c. Berapa luas antara z = -2,34 dan z = +2,34 atau (-2,34 < z < +2,34)?
Jawab : 49,04 + 49,04 = 98,08%.
d. Berapa luas antara z = 1,23 dengan z = 2,34 atau (1,23 < z < 2,34)?
Jawab : z = +2,34 = 49,04%
z = +1,23 = 39,07%
9,97%
e. Berapa luas z = +1,23 ke kanan?
Jawab : z = +1,23 ke kanan = 10,93%.
f. Berapa luas z = +1,23 ke kiri?
Jawab : 100% - 10,93% = 89,07%
g. Berapa nilai z untuk luas 49,60%?
Jawab : 2,65%.
5. Contoh Soal
Dari 100 responden didapat harga rata-rata untuk angket motivasi kerja = 75 dengan
simpangan baku = 4.
Ditanyakan :
1) Berapa jumlah responden yang mendapat nilai 80 ke atas?
2) Berapa jumlah responden yang mendapat nilai 70 ke bawah?
3) Berapa nilai responden yang dapat dikualifikasikan 10% dari nilai tertinggi?
Jawab :
X
1) z=
80 75
=
4
= 1,25 dari tabel kurve normal didapat luas ke kanan = 10,56%.
Jadi jumlah responden = 10,56% x 100 = 11. orang.
75 80
2) =
4
= -1,25 dari tabel kurve normal didapat luas ke kiri = 10,56%.
Jadi jumlah responden = 10,56% x 100 = 11 orang.
3) Batas kualifikasi 10% tertinggi = 50% - 10% = 40% dari tabel didapat 1,28.
Karena SD tertinggi = 4, maka untuk 1,28 SD = 1,28 x 4 = 5,12. Jadi skor tertinggi = 75 +
5,12 = 80,12.
Kriterianya : Jika k = 0,263 atau mendekati 0,263, maka datanya berdistribusi normal atau
mendekati distribusi normal.
D. DISTRIBUSI STUDENT
Pada tahun 1908, W.S. Gosset dengan nama samaran Student berhasil
mempublikasikan karyanya yang disebut dengan distribusi Student atau distribusi t.
Distribusi Student dapat digunakan untuk dapat yang tidak normal.
Tabel distribusi Student digunakan dengan cara membandingkannya nilai t hitung
dengan nilai ttabel yang didapat dari tabel distribusi Student atau selanjutnya disebut tabel t.
Tabel t berguna untuk :
(1) pengujian hipotesis,
(2) uji kesamaan dua rata-rata, dan
(3) uji signifikansi koefisien korelasi.
thitung didapat dengan menggunakan rumus :
E. DISTRIBUSI CHI-KUADRAT
Tabel chi-kuadrat atau 2 (baca chi-kuadrat) digunakan dengan cara
membandingkannya nilai 2hitung dengan nilai 2tabel yang didapat dari tabel 2. Tabel 2
berguna untuk mencari hubungan antara data nominal, pengujian normalitas data.
2tabel dicari dengan cara sebagai berikut :
1) Tentukan nilai apakah 0,001, 0,01, 0,05, atau 0,10
2) Hitung df atau dk = n – 1.
3) Cari nilai tersebut di dalam tabel 2 (terlampir)
Contoh Soal :
Diketahui :
Berapa :
Jawab :
F. DISTRIBUSI F
Tabel distribusi F selanjutnya disebut tabel F digunakan dengan cara
membandingkannya nilai Fhitung dengan nilai Ftabel yang didapat dari tabel F. Tabel F berguna
untuk :
(1) pengujian homogenitas data,
(2) pengujian signifikansi korelasi, dan
(3) pengujian linieritas data.
Ftabel dicari dengan cara sebagai berikut :
1) Tentukan nilai apakah 0,01 atau 0,05.
2) Hitung df atau dk dengan rumus tertentu, sehingga didapat pembilang dan
penyebutnya.
3) Dalam tabel F ada dk untuk pembilang dan ada dk untuk penyebut sehingga ditulis
F(dk pembilang, dk penyebut).
4) Cari nilai tersebut did alam tabel F (terlampir).
Contoh Soal:
Diketahui :
Berapa :
Jawab :
BAB VI
PENGUJIAN HIPOTESIS
A. PENDAHULUAN
Istilah hipotesis berasal dari bahasa Yunani, yaitu dari kata hupo dan thesis. Hupo
artinya sementara, atau kurang kebenarannya atau masih lemah kebenarannya. Sedangkan
thesis artinya pernyataan atau teori. Karena hipotesis adalah pernyataan sementara yang
masih lemah kebenarannya, maka perlu diuji kebenarannya, sehingga istilah hipotesis ialah
pernyataan sementara yang perlu diuji kebenarannya. Untuk menguji kebenaran sebuah
hipotesis digunakan pengujian yang disebut pengujian hipotesis atau pengetesan hipotesis
(testing hypothesis).
Sebelum suatu hipotesis diuji, maka hipotesis tersebut haruslah memenuhi syarat-
syarat yang ditentukan. Bagaimana syarat-syarat hipotesis yang baik itu? Untuk menjawab
pertanyaan ini diperlukan penelaahan yang mendalam terhadap buku-buku metodologi
penelitian. Hal ini bukanlah ruang lingkup pembahasan buku ini.
Pengujian hipotesis akan membawa kepada kesimpulan untuk menolak atau
menerima hipotesis. Dengan demikian kita dihadapkan pada dua pilihan. Agar pemilihan
kita lebih terinci dan mudah, maka diperlukan hipotesis alternatif yang selanjutnya disingkat
Ha dan hipotesis nol (null) yang selanjutnya disingkat H 0. Ha disebut juga sebagai hipotesis
kerja atau hipotesis penelitian (research hypothesis). Ha adalah lawan atau tandingan dari
H0. Ha cenderung dinyatakan dalam kalimat positif. Sedangkan H0 dinyatakan dalam
kalimat negatif.
Contohnya :
1. Ha : Terdapat hubungan fungsional yang positif antara variabel X dengan Y.
H0 : Tidak terdapat hubungan fungsional yang positif antara variabel X dengan Y.
2. Ha : Terdapat perbedaan motivasi kerja antara pria dengan wanita.
H0 : Tidak terdapat perbedaan motivasi kerja antara pria dengan wanita.
Ha dan H0 yang mengandung kata-kata signifikan dan atau linier kebalikan dari contoh di
atas.
Contoh :
1. Ha : Tidak terdapat hubungan fungsional yang signifikan antara variabel X dengan
Y.
H0 : Terdapat hubungan fungsional yang signifikan antara variabel X dengan Y.
2. Ha : Tidak terdapat hubungan fungsional yang linier antara variabel X dengan Y.
H0 : Terdapat hubungan fungsional yang linier antara variabel X dengan Y.
3. Ha : Tidak terdapat hubungan fungsional yang signifikan dan linier antara variabel
X dengan Y.
H0 : Terdapat hubungan fungsional yang signifikan dan linier antara variabel X
dengan Y.
Hipotesis tersebut di atas disebut hipotesis nondireksional atau tidak langsung.
Pasangannya disebut pengujian sederhana lawan sederhana. Pengujiannya menggunakan uji
dua pihak atau dua ekor.
Jika H0 dinyatakan dengan lebih besar, maka Ha dinyatakan dengan lebih kecil.
Hipotesis ini disebut hipotesis direksional. Pasangan ini disebut pengujian komposit
dengan komposit. Pengujiannya menggunakan uji satu pihak atau satu ekor yang disebut uji
pihak kiri.
Sebaliknya, jika H0 dinyatakan dengan lebih kecil, maka Ha harus dinyatakan dengan
lebih besar. Hipotesis ini disebut hipotesis direksional. Pasangannya disebut pengujian
komposit dengan komposit. Pengujiannya menggunakan uji satu pihak atau satu ekor yaitu
pihak kanan.
Sekarang yang menjadi masalah ialah kapan peneliti memakai hipotesis non
direksional dan kapan memakai hipotesis direksional? Atau dengan kata lain : Kapan
peneliti memakai uji dua pihak dan kapan uji satu pihak? Jawabnya ialah tergantung pada
keputusan yang akan diambil.
Keputusan untuk memilih uji dua pihak atau satu pihak bukanlah untuk memudahkan
mendapatkan signifikansi. Pilihannya tidaklah didasarkan atas pertimbangan statistik, tetapi
didasarkan atas keputusan yang akan diambil sebagai hasil dari penemuan penelitiannya.
Jika ingin membuat suatu keputusan untuk memilih salah satu dari dua bentuk gaya
mengajar atau gaya kepemimpinan, maka uji dua pihaklah yang lebih cocok untuk dipilih.
Sebaliknya, jika peneliti ingin memutuskan untuk mengadopsi suatu sistem baru atau
metode baru, maka uji satu pihaklah yang lebih cocok untuk dipilih. Oleh sebab itu, uji satu
pihak dapat membantu untuk pengembangan suatu teori.
Beberapa ahli berpendapat bahwa uji dua pihak lebih dapat dipertanggungjawabkan
untuk ilmu-ilmu sosial, karena seperti psikologi, sosiologi, pendidikan, administrasi dan
sebagainya sangat banyak variabel yang belum diketahui.
Pengujian H0 dan Ha memerlukan hipotesis statistik.
Hipotesis statistik ialah pernyataan khusus mengenai populasi atau sampel.
Selanjutnya hipotesis statistik inilah yang diuji. Pengujian dengan membandingkan hasil
perhitungan data dengan kriteria tertentu. Contoh hipotesis dalam bentuk kalimat diubah
menjadi hipotesis statistik.
1. Ha : Terdapat perbedaan motivasi kerja antara pria dengan wanita.
H0 : Tidak terdapat perbedaan motivasi kerja antara pria dengan wanita.
Bentuk hipotesis statistiknya adalah sebagai berikut :
Ha : pria wanita
H0 : pria = wanita
2. Ha : Prosedur kerja A lebih baik daripada prosedur kerja B.
H0 : Prosedur kerja A tidak lebih baik daripada prosedur kerja B.
Bentuk hipotesis statistiknya adalah :
Ha : A > B
H0 : A < B
Walaupun berdasarkan analisis statistik kita telah menolak atau menerima suatu
hipotesis, hal ini belumlah memberikan kebenaran mutlak 100% kepada kita, sebab kita
biasanya bekerja dengan data sampel sehingga kekeliruan sampling selalu ada betapa pun
kecilnya. Ada dua macam kesalahan sampling yaitu seperti uraian berikut ini.
D. KRITERIA PENGUJIAN
Penentuan kriteria pengujian dan nilai kritis digambarkan seperti tabel berikut ini.
E. LANGKAH-LANGKAH PENGUJIAN HIPOTESIS
1. Tulis Ha dan H0 dalam bentuk kalimat.
2. Tulis Ha dan H0 dalam bentuk statistik.
3. Hitung thitung atau zhitung (salah satu tergantung tak diketahui atau diketahui. Jika
tidak diketahui, maka thitung adalah :
di mana :
F. CONTOH SOAL UJI DUA PIHAK, PIHAK KANAN DAN PIHAK KIRI
Diketahui : Angket penelitian motivasi kerja suatu kantor dengan jumlah pertanyaan
sebanyak 10 buah. Jumlah responden = 30 orang. Angket mempunyai skala pertanyaan 1 =
sangat rendah, 2. rendah, 3. tinggi, dan 4, sangat tinggi, s = 7,23. x = 26,36.
Pertanyaan :
1. Apakah motivasi kerja karyawan di kantor tersebut = 60% rata-rata skor idealnya?
2. Apakah motivasi kerja karyawan di kantor tersebut > 60% rata-rata skor idealnya?
3. Apakah motivasi kerja karyawan di kantor tersebut < 60% rata-rata skor idealnya?
Jawab :
Skor ideal = 10 x 4 x 30 = 1200
Rata-rata skor ideal = 1200 : 30 = 40.
60% rata-rata skor ideal = 60% x 40 = 24.
Jawaban pertanyaan nomor 1
1. Ha dan H0 dalam bentuk kalimat.
Ha : Motivasi kerja karyawan = 60% rata-rata skor ideal.
H0 : Motivasi kerja karyawan 60% rata-rata skor ideal.
2. Hipotesis statistiknya
Ha : 24
H0 : = 24
3. thitung
x 0
thitung = s
n
26,36 24
= 7,23
30
= 1,78
4. Taraf siginfikansi () = 0,05.
5. ttabel dengan ketentuan :
= 0,05
dk = n – 1 = 30 – 1 = 29
dengan menggunakan uji dua pihak, maka diperoleh ttabel = 2,04.
6. Kriteria pengujian dua pihak :
Jika –ttabel < thitung < + ttabel, maka H0 diterima.
7. Ternyata -2,04 < 1,78 < +2,04 atau –ttabel < thitung < +ttabel, sehingga H0 diterima.
8. Kesimpulannya :
H0 yang berbunyi : “Motivasi kerja karyawan 60% rata-rata skor ideal” diterima.
Sebaliknya Ha yang berbunyi : “Motivasi kerja karyawan = 60% rata-rata skor ideal”,
ditolak.
26,36 24
= 7,23
30
= 1,78
4. Taraf siginfikansi () = 0,05.
5. ttabel dengan ketentuan :
= 0,05
dk = n – 1 = 30 – 1 = 29
dengan menggunakan uji dua pihak, maka diperoleh ttabel = 1,70.
6. Kriteria pengujian dua pihak :
Jika thitung < + ttabel, maka H0 diterima.
7. Ternyata 1,78 > 1,70 atau
thitung > +ttabel, sehingga H0 ditolak.
8. Kesimpulannya :
H0 yang berbunyi : “Motivasi kerja karyawan = 60% rata-rata skor ideal” ditolak.
Sebaliknya Ha yang berbunyi : “Motivasi kerja karyawan > 60% rata-rata skor ideal”,
diterima.
Jawaban pertanyaan nomor 3
1. Ha dan H0 dalam bentuk kalimat.
Ha : Motivasi kerja karyawan < 60% rata-rata skor ideal.
H0 : Motivasi kerja karyawan = 60% rata-rata skor ideal.
2. Hipotesis statistiknya
Ha : < 24
H0 : = 24
3. thitung
x 0
thitung = s
n
26,36 24
= 7,23
30
= 1,78
4. Taraf siginfikansi () = 0,05.
5. ttabel dengan ketentuan :
= 0,05
dk = n – 1 = 30 – 1 = 29
dengan menggunakan uji dua pihak, maka diperoleh ttabel = 1,70.
6. Kriteria pengujian dua pihak :
Jika thitung > + ttabel, maka H0 diterima.
7. Ternyata 1,78 > -1,70 atau
thitung > -ttabel, sehingga H0 diterima.
8. Kesimpulannya :
H0 yang berbunyi : “Motivasi kerja karyawan = 60% rata-rata skor ideal” diterima.
Sebaliknya Ha yang berbunyi : “Motivasi kerja karyawan < 60% rata-rata skor ideal”,
ditolak.
BAB VII
UJI KESAMAAN DUA VARIANS DAN DUA RATA-RATA
Varians Terbesar
F= Varians Terkecil
Contoh Soal :
Terdapat dua macam pengukuran prosedur kerja di sebuah kantor. Prosedur ke-1
dilakukan 10x menghasilkan s2 = 37,2 dan prosedur ke-2 dilakukan 13x menghasilkan s 2 =
37,2. = 0,10. Apakah kedua prosedur kerja tersebut mempunyai varian yang homogen?
Jawab :
1) Ha : Terdapat perbedaan varian 1 dengan varians 2.
H0 : Tidak terdapat perbedaan varian 1 dengan varians 2.
2) Ha : 221 ≠ 2II
H0 : 221 = 2II
3) Fhitung dengan menggunakan rumus :
Varians Terbesar
F= Varians Terkecil
37,2
= 24,7 = 1,506
Varians Terbesar
Fkini = Varians Terkecil
Ftabel kanan = f1/2 (dk varians terekcil -1, dk varians terbesar -1)
dengan menggunakan tabel F didapat nilai Ftabel kanan . Nilai ini selajutnya sebagai nilai
maksimal.
7) Cari Ftabel kiri dengan rumus :
Ftabel kanan = f(1 – ) (dk varians terekcil -1, dk varians terbesar -1)
2
(ni – 1)s2i
s = (ni – 1)
5) Hitung log s2
6) Hitung B dengan rumus :
B = (log s2) (ni – 1)
7) Cari 2hitung dengan rumus :
2hitung = (2,3026) B - (ni – 1) log si2
8) Tetapkan taraf signifikansi ()
9) Cari 2tabel dengan rumus :
2tabel = 2(1 - )(dk)
di mana dk = banyak kelompok – 1
dengan menggunakan tabel 2 didapat 2tabel.
10) Bandingkan 2hitung dengan 2tabel.
11) Buatlah kesimpulannya.
Jika rumus tersebut di atas digunakan untuk n1 = n2 maka rumus Fisher’s tersebut dapat
disederhanakan menjadi :
b. Jika kedua data sampel dependen (berkorelasi), maka rumus yang digunakan adalah rumus
uji t Fisher’s dengan bentuk :
c. Jika tidak diketahui dan sampelnya bebas dan kecil, maka perbedaan dua rata-rata dihitung
dengan rumus :
d. Jika kedua sampelnya dependen dalam observasi yang berpasangan maka rumusnya adalah :
e. Jika diketahui dan sampelnya besar, maka digunakan rumus :
A. PENDAHULUAN
Dalam kehidupan ini kita berhadapan dengan berbagai gejala yang meliputi berbagai
variabel. Sebagai contoh : (1) berat badan dalam taraf tertentu tergantung pada tinggi
badannya, (2) produktivitas kerja pada taraf tertentu tergantung pada efisiensi dan efektivitas
kerjanya, (3) produksi padi dalam taraf tertentu tergantung pada kesuburan tanah, teknologi
yang dipakai, banyak curah hujan, dan sebagainya.
Berdasarkan contoh-contoh di atas, maka tampaklah mana variabel bebas (yang
mempengaruhi) dan mana variabel terikat atau tergantung (yang dipengaruhi). Variabel yang
mempengaruhi ini dalam analisis regresi disebut sebagai variabel predictor, dengan
lambang X; sedangkan variabel yang dipengaruhi disebut variabel kriterium dengan
lambang Y.
Mengapa analisis regresi diperlukan? Jawabnya ialah kita sebagai ilmuwan atau
peneliti dituntut untuk mencari kebenaran secara ilmiah atau berdasarkan ilmu. Dan salah
satu fungsi ilmu ialah meramalkan (to predict). Fungsi ilmu yang lainnya adalah
menggambarkan (to describe), mengontrol (to control), dan menerangkan (to explain).
Berdasarkan fungsi ilmu tersebut, maka jika kita mempunyai dua buah variabel atau
lebih, maka sudah sewajarnyalah kalau kita ingin mempelajari bagaimana variabel-variabel
itu berhubungan atau dapat diramalkan. Hubungan yang diperoleh biasanya dinyatakan
dalam persamaan matematik yang menyatakan hubungan fungsional antara variabel-
variabel. Pelajaran yang menyangkut masalah ini disebut analisis regresi. Hubungan
fungsional antara satu variabel predictor dengan satu variabel kriterium disebut analisis
regresi tunggal, sedangkan hubungan fungsional yang lebih dari satu variabel disebut
analisis regresi ganda.
Bentuk persamaan regresi tersebut sering dibaca sebagai regresi X atas Y, artinya
regresi X sebagai variabel prediktornya dengan Y sebagai variabel kriteriumnya. Sebaliknya
ada pula persamaan regresi yang dibaca sebagai regresi Y atas X.
Koefisien arah regresi linier dinyatakan dengan huruf b yang juga menyatakan
perubahan rata-rata variabel Y untuk setiap variabel X sebesar satu bagian. Maksudnya ialah
bila harga b positif, maka variabel Y akan mengalami kenaikan atau pertambahan.
Sebaliknya bila b negatif, maka variabel Y akan mengalami penurunan.
Contoh :
Persamaan regresi antara pengunjung (X) dengan pembeli (Y) ialah Y = 9 + 0,50X.
Maknanya ialah karena b positif, maka hubungan fungsionalnya juga menjadi positif.
Selanjutnya kita dapat mengatakan bahwa jika setiap pengunjung (X) bertambah dengan 30
orang, maka rata-rata pembeli (Y) akan bertambah menjadi Y = 9 + 0,50.30 = 24 orang. Dan
akhirnya kita dapat menyimpulkan bahwa semakin banyak pengunjung, semakin banyak
pula pembelinya.
Contoh-contoh lainnya mengenai lima macam variasi persamaan regresi tunggal dan
gambar serta maknanya dapat dilihat dalam tabel berikut ini.
E. CARA MENGHITUNG PERSAMAAN REGRESI
Persamaan regresi dapat dihitung secara :
1) manual dengan bantuan tabel penolong
2) kalkulator
3) komputer
Pada kesempatan ini perhitungan analisis regresi dibatasi secara manual saja.
Jika b sudah dihitung lebih dahulu, maka a dapat dihitung dengan rumus :
7. Ujilah signifikansi dan linieritas persamaan regresi tersebut dengan menggunakan tabel
penolong yang disebut tabel Analisys of Varians (ANOVA) dengan bentuk pada Tabel XI.3.
8.
G. S
H.