Diktat Statistik A

BAB I.
PENDAHULUAN
A. PENGERTIAN ISTILAH STATISTIK DAN STATISTIKA

Statistik (statistic) berasal dari kata state yang artinya negara. Mengapa disebut
negara? Karena sejak dahulu kala statistik hanya digunakan untuk kepentingan-kepentingan
negara saja. Kepentingan negara itu meliputi berbagai bidang kehidupan dan penghidupan,
sehingga lahirlah istilah statistik, yang pemakaiannya disesuaikan dengan lingkup datanya.
Contohnya, dalam kehidupan sehari-hari sering kita dengar penghasilan orang
Indonesia rata-rata Rp 100.000,00 setiap bulan, tingkat inflasi rata-rata 9% setahun, bunga
deposito rata-rata 12% setahun, penduduk Indonesia yang bermukim di daerah pedesaan
rata-rata 70%, penganut agama Islam di setiap propinsi rata-rata 90%, dan seterusnya.
Ada kalanya data yang dikumpulkan di lapangan tidak disajikan dalam bentuk rata-
rata seperti tadi, tetapi disajikan dalam bentuk tabel atau diagram dengan uraian yang lebih
rinci dan di bagian atas atau bawah dari tabel atau diagram dituliskan judul yang sesuai
dengan nama ruang lingkup data yang diperoleh. Misalnya judul tabel atau diagram tadi
ditulis Statistik Sensus penduduk, Statistik Kepegawaian, Statistik Pengeluaran Keuangan,
Statistik Produksi Barang, Statistik Keluarga Berencana, Statistik Kelahiran, dan
sebagainya. Statistik yang fungsinya untuk menyajikan data tertentu dalam bentuk tabel dan
diagram ini termasuk statistik dalam arti sempit atau statistik deskriptif.
Statistik deskriptif ialah susunan angka yang memberikan gambaran tentang data
yang disajikan dalam bentuk-bentuk tabel, diagram, histogram, poligon frekuensi, ozaiv
(ogive), ukuran penempatan (median, kuartil, desil, dan persentil), ukuran gejala pusat (rata-
rata hitung, rata-rata ukur, rata-rata harmonic, dan modus), simpangan baku, angka baku,
kurva normal, korelasi, dan regresi linier. Sebaliknya, statistik dalam arti luas yaitu salah
satu alat untuk mengumpulkan data, mengolah data, menarik kesimpulan dan membuat
keputusan berdasarkan analisis data yang dikumpulkan tadi. Statistik dalam arti luas ini
meliputi penyajian data, yang berarti meliputi statistik dalam arti sempit di atas tadi. Statistik
dalam arti luas ini disebut juga dengan istilah statistik (statistics, statistik inferensial,
statistik induktif, statistik probabilitas). Contohnya ialah statistik parametrik dan
nonparametrik.
Selain istilah-istilah di atas, ada pula istilah statistik matematis dan statistika praktis.
Statistika matematis ialah ilmu yang mempelajari asal-usul atau penurunan model lain
yang bersifat teoretis, sedangkan statistika praktis ialah penerapan statistika matematis ke
dalam berbagai bidang ilmu lainnya sehingga lahirlah istilah statistika kedokteran, statistika
sosial, dan sebagainya. Bagi mereka yang ingin mendalami statistika praktis secara
mendalam sebaiknya memperkuat dasar-dasar statistika matematis terlebih dahulu.
Selanjutnya, ada pula istilah statistik parametrik dan nonparametrik.
Parametrik dapat digunakan apabila datanya memenuhi persyaratan berikut ini : (1)
interval, (2) normal, (3) homogen, (4) dipilih secara acak (random), dan (5) linier. Contoh-
contoh analisis statistik parametrik ini adalah: (a) pengujian hipotesis, (b) regresi (untuk
menyimpulkan), (c) korelasi (untuk menyimpulkan), (d) uji t, (e) anova, dan (f) anova.
Nonparametric dipakai apabila data kurang dari 30, atau tidak normal, dan tidak
linier.
Contoh adalah : Tes binomial, tes chi-kuadrat, Kruskal-Wallis, Fredman, tes
Kolmogorov-Smirnov, tes run, tes McNemar, tes tanda, tes Wilcoxon, tes Walsh, tes Fisher,
tes median, tes U Mann-Whitney, tes run Wald-Wolfowitz, tes reaksi ekstrem Moses, tes Q
Cohran, koefisien kontingensi, koefisien rank dari Sperman Brwon, koefisien rank dari
Kendall, dan uji normalitas dari Lillieford.
Tabel 1.1 dan I.2 di bawah ini memberikan gambaran tentang Teknik Inferensial dan
teknik statistic.
TABEL I.1 TEKNIK INFERENSIAL
JENIS DATA PARAMETRIK NON PARAMETRIK

KATEGORIK - Chi kuadrat
KUANTITATIF Ancova Uji Mann Whitney U
Anova Kruskal – Wallis
Uji t Uji Tanda Friedman
TABEL I.2 TEKNIK STATISTIK

KATEGORIK KUANTITATIF
DUA ATAU LEBIH
DIBEDAKAN
Deskriptif
o/o Poligon
Batang Mean
Pie Sebaran (spread)
Tabel Kontingensi Effect size
(cross break)
Inferensial Chi-kuadrat Uji t
(Chi-square) Anova
Ancova
Mann Whittney
Kruskal Wallis
Uji Tanda
Friedman
KORELASI Pencar
Kontingensi
Deskriptif reta
Inferensial Chi-kuadrat t untuk r
B. PERAN STATISTIK BAGI ILMU PENGETAHUAN

Statistika sebagai disiplin ilmu berguna untuk kemajuan ilmu dan teknologi. Karena
itu, kita dituntut untuk memahami statistik lebih mendalam. Jika tidak, kita akan semakin
ketinggalan dari perkembangan ilmu dan teknologi dengan negara lainnya. Terlebih-lebih di
abad komputer ini, angka-angka sangat berperan dalam komputerisasi.
Statistika dapat sebagai alat :
a. deskripsi yaitu menggambarkan atau menerangkan data seperti mengukur dampak dan
proses pembangunan melalui indikator-indikator ekonomi, indeksi harga konsumen, tingkat
inflasi, GNP, laporan nota keuangan negara dan sebagainya.
b. komparasi yaitu membandingkan data pada dua kelompok atau beberapa kelompok.
c. korelasi yaitu mencari besarnya hubungan data dalam suatu penelitian.
d. regresi yaitu meramalkan pengaruh data yang satu terhadap data yang lainnya. Atau
untuk estimasi terhadap kecenderungan-kecenderungan peristiwa yang akan terjadi di masa
depan.
e. komunikasi yaitu merupakan alat penghubung antar pihak berupa laporan data statistik
atau analisis statistik sehingga kita maupun pihak lainnya dapat memanfaatkannya dalam
membuat suatu keputusan.
BAB II. DATA
A. PENDAHULUAN
Data berbentuk jamak, sedang datum berbentuk tunggal. Jadi data sama dengan
datum-datum.
Data ialah suatu bahan mentah yang jika diolah dengan baik melalui berbagai
analisis dapat melahirkan berbagai informasi. Dengan informasi tersebut, kita dapat
mengambil suatu keputusan. Dalam statistik dikenal istilah-istilah jenis data, tingkatan data,
sumber data, penyajian data, analisis data. Data dianalisis sesuai dengan jenis dan
tingkatannya, karena itu masing-masing tingkatan data mempunyai analisis sendiri
khususnya dalam analisis korelasi.
Data yang baik tentu saja harus yang mutakhir, cocok (relevant) dengan masalah
penelitian dari sumber yang dapat dipertanggungjawabkan, lengkap, akurat, objektif, dan
konsisten. Pengumpulan data sedapat mungkin diperoleh dari tangan pertama. Data yang
baik sangat diperlukan dalam penelitian, sebab bagaimanapun canggihnya suatu analisis data
jika tidak ditunjang oleh data yang baik, maka hasilnya kurang dapat
dipertanggungjawabkan.
B. JENIS DATA
Jenis data secara garis besarnya dapat dibagi atas dua macam yaitu data dikotomi dan
data kontinum.
1. Data Dikotomi
Data dikotomi disebut : data deskrit, data kategorik atau data nominal. Data ini
merupakan hasil perhitungan, sehingga tidak dijumpai bilangan pecahan. Data dikotomi
adalah data yang paling sederhana yang disusun menurut jenisnya atau kategorinya. Bila kita
telah memberikan nama kepada sesuatu berarti kita telah menentukan jenis atau kategorinya
menurut pengukuran kita. Dalam data dikotomi setiap data dikelompokkan menurut
kategorinya dan diberi angka. Angka-angka tersebut hanyalah label belaka, bukan
menunjukkan tingkatan (ranking). Dasar dalam menyusun kategori data tidak boleh
tumpang tindih (mutually exclusive). Kalau kita melakukan kategori secara alamiahnya,
maka disebut data dikotomi sebenarnya (true dichotomi) dan jika kategorinya dibuat-buat
sendiri (direkayasa), maka disebut data dikotomi dibuat-buat (artificial dichotomi).
Contoh dari data dikotomi sebenarnya antara lain adalah : jenis kelamin umpamanya
ada tiga yaitu laki-laki diberi angka 1, banci diberi angka 2 dan perempuan diberi angka 3.
Angka 3 pada wanita bukan berarti kekuatan wanita sama dengan tiga kali laki-laki.
Demikian pula banci sama dengan dua kali laki-laki. Tetapi seperti yang disebutkan tadi
bahwa angka-angka tersebut hanyalah label belaka. Banyak contoh-contoh data dikotomi
sebenarnya ini seperti macam warna kulit, suku bangsa, bahasa daerah, dan sebagainya.
2. Data Kontinum
Data kontinum terdiri atas tiga macam data yaitu : data ordinal, data interval, dan
data rasio. Ketiga macam data-data tersebut diuraikan seperti berikut ini :
a. Data ordinal
Data ordinal ialah data yang sudah diurutkan dari jenjang yang paling rendah sampai
ke jenjang yang paling tinggi, atau sebaliknya tergantung peringkat selera pengukuran yang
subjektif terhadap objek tertentu. Kita dapat menyatakan bahwa saya lebih suka jeruk A
daripada jeruk B meskipun sama-sama tergolong jenis jeruk. Selanjutnya jeruk B kita bobot
1 dan jeruk A kita bobot 2. Pembobotan biasanya merupakan urutannya. Oleh sebab itu, data
ordinal disebut juga sebagai data berurutan, data berjenjang, data berpangkat, data tata
jenjang, data ranks, dan data petala, data bertangga atau data bertingkat.
Pemberian jenjang tersebut pada umumnya dapat dilakukan sebagai berikut : Mula-
mula kita urutkan data itu mulai dari yang terendah sampai yang tertinggi. Demikian pula
sebaliknya. Kemudian berilah angka 1 untuk yang tertinggi, angka 2 pada yang berada di
bawahnya dan seterusnya.
Contoh-contoh data ordinal lainnya adalah : golongan gaji, pangkat, pendidikan
mulai Taman Kanak-kanak sampai Perguruan Tinggi, status sosial (tinggi, menengah, dan
rendah), Daftar Urutan Kepegawaian (DUK), dan sebagainya. Data ordinal ini lebih tinggi
kedudukannya dibandingkan dengan data nominal.
b. Data interval
Data interval mempunyai sifat-sifat nominal dari data ordinal. Di samping itu ada
sifat tambahan lainnya pada data interval yaitu mempunyai nol tidak mutlak. Akibatnya ia
mempunyai skala interval yang sama jaraknya. Pengukuran data interval tidak memberikan
jumlah yang absolut dari objek yang diukur.
c. Data rasio
Data rasio mengandung sifat-sifat interval, dan selain itu ia sudah mempunyai nilai
nol mutlak. Contoh dari data rasio diantaranya adalah : berat badan, tinggi, panjang, atau
jarak.
C. Tingkatan data
Tingkatan data kalau diurutkan dari yang tertinggi ke yang terendah yaitu : 1) rasio,
2) interval, 3) ordinal, dan 4) nominal. Dalam analisis statistik, jika perlu, maka data yang
tinggi dapat diturunkan ke tingkatan yang lebih rendah. Tetapi sebaliknya, data yang
tingkatannya rendah tidak dapat dinaikkan kepada tingkatan yang lebih tinggi.
D. Sumber data dan teknik pengumpulan data

Data dapat dikumpulkan langsung oleh peneliti melalui pihak pertama yang disebut
sumber primer. Data yang dikumpulkan oleh penelitian melalui pihak kedua atau tangan
kedua disebut sumber sekunder, yaitu data yang diperoleh melalui wawancara kepada pihak
lain tentang objek dan subjek yang diteliti. Dari kedua macam sumber data tersebut, tentu
saja sumber data primer lebih dapat dipertanggungjawabkan daripada data yang didapat
melalui sumber sekunder.
Teknik-teknik pengumpulan data dapat dilakukan melalui : wawancara (interview),
pengmatan (observation), angket (questionnary), dan dokumentasi (documentation).
Wawancara dapat tidak sistematis atau sistematis. Pengamatan dapat tidak langsung
(nonparticipation) atau langsung (participation). Angket dapat tertutup atau terbuka. Peneliti
dapat menggunakan salah satu atau gabungan dari teknik-teknik pengumpulan data di atas.
Masing-masing teknik mempunyai keuntungan dan kerugiannya.
E. Analisis data
Analisis data untuk masing-masing tingkatan (skala) data dapat dilakukan seperti
tabel berikut ini.
Tabel 2.1 Analisis Statistik yang Cocok untuk Empat Skala Data
Tes statistik
Skala Hubungan yang Statistik yang cocok
yang cocok
Nominal (1) Ekuivalensi Modus

Frekuensi
Koefisien Kontingensi
Ordinal (1) ekuivalensi Median

Non-Parametrik
Persentil
(2) Lebih besar dari Spearman r

Kendall t
Kendall W
Interval (1) Ekuivalensi Mean (rata-rata)
(2) Lebih besar dari Simpangan baku

(3) Rasio sembarang dua Korelasi Momen Hasil
interval diketahui Kali Pearson
Parametrik
Korelasi Momen Hasil
Kali Ganda
Rasio (1) Ekuivalensi
(2) Lebih besar dari Mean geometrik
(3) Rasio sembarang dua Koefisien variasi

interval diketahui
(4) Rasio sembarang dua

harga interval diketahui
a. Penyajian data
Data dianalisis dan disajikan menurut gambar di bawah ini :
batang
garis
lambang (simbol)
diagram lingkaran (pastel)
peta (kartogram)
pencar (titik)
biasa
distribusi frekuensi
Penyajian data tabel distribusi frekuensi relatif
distribusi frekuensi kumulatif
distribusi frekuensi relatif-kumulatif
histogram gejala letak median

poligon frekuensi kuartil
ogive (ozaiv) desil
keadaan kelompok persentil
simpangan baku
angka baku gejala pusat rata-rata hitung
rata-rata ukur
rata-rata harmonik
mode
BAB III DISTRIBUSI FREKUENSI
A. TABEL DISTRIBUSI FREKUENSI
Tabel distribusi frekuensi sangat cocok untuk menyajikan data dalam beberapa
kelompok.
Sebelum membuat tabel distribusi frekuensi terlebih dahulu diberikan istilah-istilah
yang digunakan dengan contoh sebuah tabel distribusi frekuensi berikut ini.
Tabel 3.1Nilai DP3 untuk 34 PNS
Nilai DP3 f
48 – 54 1
55 – 61 2
62 – 68 7
69 – 75 12
76 – 82 7
83 – 89 3
90 – 96 2
34
Nilai 48 – 54 disebut kelas interval. Urutan kelas interval disusun mulai data
terkecil sampai terbesar. Urutan kelas interval pertama (48 – 54) disebut kelas interval
pertama. Dan urutan kelas interval kedua (55 – 61) disebut kelas interval kedua. Demikian
seterusnya. Semua kelas interval berada di kolom kiri.
Sedangkan nilai yang berada di kolom kanan adalah nilai frekuensi yang disingkat
f. f = 1 berarti pegawai yang mempunyai nilai antara 48 sampai 54 adalah 1 orang.
Nilai-nilai di kiri kelas interval (48, 55, 62, 69, 76, 83, dan 90) disebut ujung bawah
kelas. Nilai 48 disebut ujung bawah kelas pertama, nilai 55 disebut ujung bawah kelas
kedua. Demikian seterusnya.
Nilai-nilai di kanan kelas interval (54, 61, 68, 75, 82, 89, dan 96) disebut ujung atas
kelas. Nilai 54 disebut ujung atas kelas pertama, nilai 61 disebut ujung atas kelas kedua.
Demikian seterusnya.
Selisih positif antara tiap dua ujung bawah berurutan disebut panjang kelas
interval, yang disingkat dengan p. Dalam tabel tersebut p = 55 – 48 = 7. Semua p sama
besarnya, dalam tabel tersebut = 7.
Jika ujung bawah kelas dikurangi 0,5 atau 0,05 atau 0,005 (tergantung ketelitian data
yang digunakan) dan ujung atas kelas ditambah 0,5 atau 0,05 atau 0,005; maka nilai tersebut
dinamakan batas kelas. Dalam tabel tersebut, batas kelasnya adalah 47,50 – 54,50. Dan
seterusnya.
(ujung bawah kelas + ujung atas kelas)
Tanda kelas = 2
48  54
Tanda kelas pertama untuk tabel tadi ialah  51 . Demikian seterusnya.
2
Langkah-langkah Membuat Tabel Distribusi Frekuensi
1) Urutkan data dari yang terkecil ke data terbesar
2) Hitung rentang yaitu data tertinggi dikurang data terendah dengan rumus :
R = data tertinggi – data terendah
3) Hitung banyak kelas dengan aturan Sturges yaitu :
banyak kelas = 1 + 3,3 log n
n = banyaknya data, hasil akhirnya dibulatkan. Banyak kelas paling sedikit 5 kelas dan
paling banyak 15 kelas, dipilih menurut keperluannya.
4) Hitung panjang kelas interval dengan rumus :
rentang
p= banyak kelas
5) Tentukan ujung bawah kelas interval pertama. Biasanya diambil data terkecil atau data
yang lebih kecil dari data terkecil tetapi selisihnya harus kurang dari panjang kelas yang
telah didapat.
6) Selanjutnya kelas interval pertama dihitung dengan cara menjumlahkan ujung bawah
kelas dengan p tadi dikurang 1. Demikian seterusnya.
7) Nilai f dihitung dengan menggunakan tabel penolong sebagai berikut.
Tabel Penolong
Nilai Tabulasi f
8) Pindahkan nilai f ke tabel distribusi frekuensi.

Contoh Soal :
Diketahui data sebagai berikut :
71 75 57 88 64 80 75 75 80
82 90 68 90 88 71 75 71 81
48 82 72 62 68 74 79 79 84
75 57 75 75 68 65 68
Buatlah tabel distribusi frekuensinya.

Jawab :
1) Urutkan data dari yang terkecil ke data terbesar. Periksa dulu apakah jumlah data yang
diurutkan sudah cocok jumlahnya dengan data pada soalnya.
48 71 75 88
57 71 75 88
57 71 79 90
62 72 79 90
64 74 80
65 75 80
68 75 81
68 75 82
68 75 82
68 75 84
2) Hitung rentang yaitu data tertinggi dikurang data terendah dengan rumus :
R = data tertinggi – data terendah
= 90 – 48 = 42
3) Hitung banyak kelas dengan aturan Sturges yaitu :
banyak kelas = 1 + 3,3 log n
= 1 + 3,3 log 34 = 6,05 dibulatkan 6 atau 7.
4) Hitung panjang kelas interval dengan rumus :
rentang
p = banyak kelas
42
= = 7
6
5) Tentukan ujung bawah kelas interval pertama.
Biasanya diambil data terkecil = 48.
6) Selanjutnya kelas interval pertama dihitung dengan cara menjumlahkan ujung bawah
kelas dengan p tadi dikurang 1. Demikian seterusnya.
48 + 7 – 1 = 54
55 + 7 – 1 = 61
61 + 7 – 1 = 67
69 + 7 – 1 = 75
76 + 7 – 1 = 82
83 + 7 – 1 = 89
90 + 7 – 1 = 96
7) Nilai f dihitung dengan menggunakan tabel penolong sebagai berikut.

Tabel Penolong
Nilai Tabulasi f
48 – 54 |
55 – 61 ||
62 – 68 |||| ||
69 – 75 |||| |||| ||
76 – 82 |||| ||
83 – 89 |||
90 – 96 ||
8) Pindahkan nilai f ke tabel distribusi frekuensi.

Tabel Distribusi Frekuensi untuk
Nilai DP3
Nilai DP3 f
48 – 54 1
55 – 61 2
62 – 68 7
69 – 75 12
76 – 82 7
83 – 89 3
90 – 96 2
34
B. TABEL DISTRIBUSI FREKUENSI RELATIF

Jika dalam tabel distribusi frekuensi didapat nilai frekuensi absolut (f abs), maka
dalam tabel distribusi frekuensi relatif nilai frekuensi (f) dinyatakan dalam persen) (%)
yang disingkat f (%) atau f (rel). Untuk mendapatkan nilai f (%) dihitung dengan rumus :
f (abs) pertama
n
f (%) baris pertama = x 100%

demikian seterusnya
Contoh Soal
Lanjutkan tabel distribusi frekuensi di atas menjadi tabel distribusi relatif.
Jawab :
1
f (%) = x100%  2,94% demikian seterusnya, masukkan nilai tersebut ke dalam
34
tabel frekuensi relatif sehingga menjadi :
Tabel Distribusi Frekuensi untuk Nilai DP3
Nilai DP3 f
48 – 54 2,94
55 – 61 5,88
62 – 68 20,60
69 – 75 35,29
76 – 82 20,60
83 – 89 8,81
90 – 96 5,88
100,00
Jika diinginkan boleh saja tabel distribusi frekuensi digabungkan dengan tabel
distribusi frekuensi relatif menjadi tabel distribusi frekuensi – relatif sebagai berikut.
Tabel Distribusi Frekuensi untuk Nilai DP3
Nilai DP3 fabs frel
48 – 54 1 2,94
55 – 61 2 5,88
62 – 68 7 20,60
69 – 75 12 35,29
76 – 82 7 20,60
83 – 89 3 8,81
90 – 96 2 5,88
34 100,00
C. TABEL DISTRIBUSI FREKUENSI KUMULATIF

Tabel distribusi frekuensi komulatif ialah distribusi frekuensi biasa yang nilai
frekuensi kumulatifnya (fkum) didapat dengan jalan menjumlahkan frekuensi demi frekuensi.
Tabel distribusi frekuensi komulatif ada dua macam yaitu : komulatif kurang dari dan
komulatif atau lebih.
Contoh Soal :
Buatlah tabel distribusi frekuensi komulatif kurang dari dan atau lebih untuk tabel
distribusi frekuensi pada soal di atas.
Jawab :
Tabel Distribusi Frekuensi Kumulatif Kurang dari Untuk Nilai DP3
Nilai DP3 fkum
kurang dari 48 0
kurang dari 55 1
kurang dari 62 3
kurang dari 69 10
kurang dari 76 22
kurang dari 83 29
kurang dari 90 32
kurang dari 97 34
Tabel Distribusi Frekuensi Kumulatif atau Lebih Untuk Nilai DP3

Nilai DP3 fkum
48 atau lebih 34
55 atau lebih 33
62 atau lebih 31
69 atau lebih 24
76 atau lebih 12
83 atau lebih 5
90 atau lebih 2
D. DAFTAR DISTRIBUSI FREKUENSI KUMULATIF RELATIF

Daftar Distribusi Frekuensi Kumulatif Relatif ialah apabila nilai fkum dalam frekuensi
komulatif diubah dalam persen (%).
Contohnya :
Buatlah tabel distribusi frekuensi komulatif relatif kurang dari dan atau lebih untuk
tabel di atas.
Jawab :
Tabel Distribusi Frekuensi Kumulatif Relatif Kurang dari Untuk Nilai DP3
Nilai DP3 fkum(%)

kurang dari 48 0
kurang dari 55 2,94
kurang dari 62 8,82
kurang dari 69 29,41
kurang dari 97 100
Tabel Distribusi Frekuensi Kumulatif Relatif atau Lebih Untuk Nilai DP3
Nilai DP3 fkum(%)
48 atau lebih 100
55 atau lebih 97,06
62 atau lebih 91,18
69 atau lebih 70,59
76 atau lebih 35,29
83 atau lebih 14,71
90 atau lebih 5,88
E. HISTOGRAM
Histogram ialah penyajian data distribusi frekuensi yang diubah menjadi diagram
batang. Untuk menggambarkan histogram dipakai sumbu mendatar yang menyatakan batas-
batas kelas interval dan sumbu tegak yang menyatakan frekuensi absolut atau frekuensi
relatif.
Contohnya :
Buatlah histogram untuk tabel distribusi pada tabel di atas.
Jawab :
F. POLIGON FREKUENSI
Poligon frekuensi ialah gambar garis yang menghubungkan tengah-tengah tiap sisi
atas yang berdekatan dengan tengah-tengah jarak frekuensi absolut masing-masing. Jika
daftar distribusi frekuensi mempunyai kelas-kelas interval yang berbeda, maka tinggi
diagram tiap kelas harus disesuaikan. Untuk ini, ambil panjang kelas yang sama yang
terbanyak terjadi sebagai satuan pokok. Tinggi untuk kelas-kelas lainnya digambarkan
sebagai kebalikan dari panjang kelas dikalikan dengan frekuensi yang diberikan.
Contoh :
G. OGIVE (OZAIV)
Ogive ialah distribusi frekuensi komulatif yang digambarkan diagramnya dalam
sumbu tegak dan mendatar. Ogive “kurang dari” ialah diagram dari distribusi frekuensi
komulatif kurang dari. Dan ogive “atau lebih” ialah diagram dari distribusi frekuensi
komulatif atau lebih.
Contoh :
Buatlah ogive untuk tabel distribusi komulatif kurang dari untuk tabel di atas.
Jawab :
Contoh :Buatlah ogive untuk tabel distribusi frekuensi komulatif atau lebih untuk tabel di
atas. Jawab :
BAB IV. KEADAAN KELOMPOK

A. PENDAHULUAN
Penyajian data dengan cara-cara diagram, tabel, histogram, poligon, dan ozaiv dapat
dikembangkan menjadi ukuran penempatan maupun ukuran gejala pusat. Ukuran
penempatan disebut juga dengan istilah ukuran letak. Dan ukuran gejala pusat disebut juga
ukuran tendensi sentral.
Ukuran dari data sampel disebut statistik dan ukuran dari populasi disebut parameter.
Ukuran penempatan terdiri atas :
1. Median
2. Kuartil
3. Desil
4. Persentil
Ukuran gejala pusat terdiri atas :
1. Rata-rata atau rata-rata hitung.
2. Rata-rata ukur.
3. Rata-rata harmonic.
4. Modus.
Keadaan kelompok lainnya adalah : simpangan baku dan angka baku.
B. UKURAN PENEMPATAN
1. Median
Median (yang selanjutnya disingkat Me) ialah nilai tengah-tengah dari data yang
diobservasi, setelah data tersebut disusun mulai dari urutan yang terkecil sampai yang
terbesar atau sebaliknya. Jika jumlah datanya ganjil, maka Me terdapat tepat di tengah-
tengah.
Contoh sampel dengan data :
10, 9, 3, 5, 7, 12, 8 (ada tujuh data).
Data disusun menjadi : 3, 5, 7, 8, 9, 10, 12; maka Me = 8 (data yang di tengah-
tengah). Jika jumlah datanya genap, maka Me didapat dengan dua data di tengah-tengah
kemudian dibagi dua.
Contoh sampel dengan data :
10, 3, 12, 5, 7, 10, 8, 14, 14, 14 (10 data).
Data disusun menjadi : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14 sehingga,
(10  10)
Me =  10
2
Data yang sudah disusun dalam daftar distribusi frekuensi. Me dihitung dengan rumus :
Me = b+p (1/2 n – F)
f
di mana : b = batas bawah kelas Me yaitu kelas di mana Me akan terletak.

p = panjang kelas Me.
n = ukuran sampel atau banyak data.
F = jumlah semua frekuensi sebelum kelas Me.
f = frekuensi kelas Me.
Dari contoh di atas didapat data sampel : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14 (n = 10).
Buat dulu daftar distribusi frekuensinya.
rentang = data terbesar – data terkecil
= 14 – 3 = 11
banyak kelas = 1 + (3,3) log n
= 1 + 3,3 log 10
= 1 + 3,3 . 1
= 4,3 diambil 4
rentang
kelas internval = p =
banyak kelas
11
=
4
= 2,75 dibulatkan 3.
Tabel. Distribusi Frekuensi
Nilai data f1
3–5 2
6–8 2
9 – 11 3
12 – 14 3
Jumlah 10
Setengah dari seluruh data ada = 5 buah, jadi Me terletak di kelas interval ketiga, karena
sampai dengan ini jumlah frekuensi sudah lebih dari 5 buah. Dari kelas Me ini didapat :
b = 11,5; p= 3; F= 2 + 2 = 4 dan n = 10
Sehingga :
54
Me = 11,5 + 3   = 11,5 + 0,3 = 11,8.
 10 
Me merupakan alat deskripsi yang baik untuk distribusi data yang tidak normal. Me sering
untuk memperbaiki harga rata-rata yang terdapat dalam sekelompok data yang ekstrem
harganya, sehingga kurang mewakili (representative) sebagai ukuran gejala pusat.
2. Kuartil
Kuartil ialah jika sekumpulan data dibagi empat bagian sama banyaknya, setelah
data disusun menurut nilai terkecil sampai terbesar. Ada tiga kuartil yaitu : Kuartil pertama =
K1, kuartil kedua = K2, dan kuartil ketiga = K3. Nama diberi dari kuartil terkecil dan untuk
menentukan nilai kuartil sebagai berikut :
1) susun urutan data dari terkecil sampai terbesar.
2) tetapkan 1 tk kuartil.
3) tetapkan nilai kuartil.
i(n + 1)
Letak K1 = data ke
4
Dengan i = 1, 2, 3
Contoh :
Sampel dengan data : 10, 3, 12, 5, 7, 10, 8, 14, 14, 14
Setelah diurutkan menjadi : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14
10  1
Letak K1 = data ke
4
= data ke- 2 ¾ atau 2,75, yaitu antara data ke-2 dengan data ke-3
Nilai K1 = data ke-2 + 1/4 (data ke-3 – data ke-2)
= 5 + 1/4 (7 – 5)
= 5 + 1/4 . 2
= 5 1/2
2(10  1)
Letak K2 = data ke = antara data ke-5 dengan data ke-6.
4
= 10 + 1/4 (10 – 10)
= 10
3(10  1)
Letak K3 = = 8 1/4, yaitu antara data ke-8 dengan data ke-9.
2
= 14.
Untuk data yang sudah dibuat tabel distribusi frekuensinya dihitung dengan rumus :
 in 
 F
 4 
Ki = b + p  f 
 
 
dengan I = 1, 2, 3
di mana : b = batas kelas Ki ialah kelas interval di mana Ki akan terletak
p = panjang kelas Ki
F = jumlah frekuensi dengan tanda kelas lebih kecil dari tanda kelas Ki
f = frekuensi kelas Ki
Dengan menggunakan tabel distribusi di halaman tadi, maka didapat harga-harga
sebagai berikut :
Misalnya kita ingin menghitung kuartil kedua, maka 2/4 x 10 data = 5 data. Jadi K 2
terletak kelas ketiga. Dari kelas ketiga tersebut didapat :
b = 11,5
p = 3
f = 3
F = 7
i = 2
n = 10.
 2.10 
  7
K1 = 11,3 + 3  4 
3
2
= 11,3 + 3 (  )
3
= 9,3.
Angka ini bermakna bahwa 50% responden mendapat nilai tertinggi 8,3 sedangkan 50%
lainnya di bawah 9,3.
3. Desil
Desil ialah jika sekumpulan data dibagi sepuluh bagian sama banyaknya, setelah
disusun dari yang terendah sampai yang tertinggi. Perhitungannya analog dengan kuartil di
atas, hanya rumusnya saja berbeda dengan :
i (n + 1)
Letak Di = data ke = 10
Dengan i = 1, 2, 3, …………9
Contoh :
Data sampel yang sudah disusun di atas yaitu :
3, 5, 7, 8, 10, 10, 12, 14, 14, 14.
Misalnya kita akan menghitung desil ke-7, maka :
7(10  1)
letak D7 = data ke
10
= data ke-7,7 berada di antara data ke-7 dan ke-8.
nilai D7 = data ke-7 + 0,1 (data ke-8 – ke-7)
= 12 + 0,1 (14 – 12)
= 12,2.
Untuk data dalam tabel distribusi frekuensi, nilai Di dihitung dengan rumus :
di mana : b = batas bawah kelas Di
p = panjang kelas Di
F= jumlah frekuensi sebelum kelas Di
f = frekuensi kelas Di
Contoh :
Diketahui daftar frekuensi seperti di bawah ini :
Tabel
Distribusi Frekuensi
Nilai data f1
3–5 2
6–8 2
9 – 11 3
12 – 14 3
Jumlah 10
Diminta desil ke-7.

Jawab :
b= 8,5
p= 3
f = 3
F= 2+2=4
n= 10.
 7,10 
 4
 3 
D7 = 8,5 + 3  3 
 
 
= 11,5
4. Persentil
Persentil ialah sekumpulan data yang dibagi 100 bagian yang sama besar, setelah
data itu disusun mulai dari yang terendah sampai yang tertinggi, sehingga menghasilkan 99
pembagi. Cara menghitung persentil seperti halnya menghitung desil. Perbedaannya terletak
pada rumusnya yaitu :
i(n + 1)
Letak Pi = data ke- 100
dengan i = 1, 2, 3, ……….99
Jika nilai Pi dihitung dari tabel distribusi frekuensi, maka rumusnya menjadi :
in -F
Di = b + p 100
f
dengan i = 1, 2, 3, ………100
di mana : b = batas bawah kelas Pi

p = panjang kelas Pi
F = jumlah frekuensi sebelum kelas Pi
f = frekuensi kelas Pi
Presentil berguna untuk :
1) membagi distribusi menjadi beberapa kelas yang sama besar frekuensinya,
2) memisahkan sebagian distribusi dari sisanya,
3) menyusun normal penilaian, dan
4) menormalisasikan distribusi.
C. UKURAN GEJALA PUSAT

1. Rata-rata (Rata Hitung atau Mean)
a. Rumusnya
Rata-rata untuk data kuantitatif yang terdapat dalam sebuah sampel atau populasi
yang dihitung dengan rumus :
di mana : (baca x bar atau x garis) = rata-rata x
xi = jumlah seluruh nilai xi
ni = jumlah anggota sampel
Jika x adalah rata-rata untuk sampel, maka  (baca mu) adalah rata-rata untuk
populasi. Jadi x adalah statistik, sedangkan  adalah parameter untuk menyatakan rata-rata.
b. Guna rata-rata
Rata-rata stabil untuk matematik dan paling cocok untuk menghadapi distribusi
normal, dan paling reliabel untuk alat penafsiran atau ramalan (prediksi). Rata-rata dihitung
dengan rumus :
di mana : = x bar atau x garis atau rata-rata x

xi = jumlah data x
ni = jumlah anggota sampel
Jika x adalah rata-rata untuk sampel, maka  adalah rata-rata populasi. Jadi x adalah statistik
sedangkan  adalah parameter untuk menyatakan rata-rata.
Jika datanya dalam bentuk distribusi frekuensi, maka rumusnya :
c. Contoh soal
Diketahui data : 10, 3, 12, 5, 7, 10, 8, 14, 14, 14.
Berapa rata-ratanya?
Jawab :
Diketahui data :
Jawab :
2. Rata-rata Ukur
Jika perbedaan tiap dua data berurutan tetap atau hampir tetap, maka rata-rata ukur
lebih baik digunakan daripada rata-rata hitung. Rumus rata-rata ukur adalah :
Contoh : Data x1 = 3, x2 = 9, x3 = 27
U =
Jika nilai datanya besar, maka digunakan rumus :
Contoh : Data x1 = 10, x2 = 100, x3 = 1000
Berapa rata-rata ukurnya?
Jawab : log U = 2
Untuk data yang cenderung berkembang misalnya pertumbuhan penduduk, maka
rumusnya :
Contoh :
Penduduk Indonesia akhir tahun 1980 ada 147 juta. Jika program KB berhasil, maka
pada tahun 2000 nanti penduduk kita 230 juta. Berapa rata-rata pertumbuhan penduduk
setiap tahun.
Jawab :
t = 20
Po = 147
Pt = 230
Jadi laju pertambahan penduduk = 0,81% setiap tahun.
Jika datanya dalam bentuk distribusi frekuensi, maka rumusnya :
Contoh :
Ditanyakan : Berapa rata-rata ukurnya?

log U
3. Rata-rata Harmonik
Rata-rata harmonic untuk data x1, x2, x3 …. xn, sebuah sampel berukuran n dihitung
dengan rumus :
Contoh :
Data 3, 5, 7, 8, 10, 10, 12, 14, 14, 14. Berapa rata-rata harmoniknya?
Jawab :
H=
=
Jika datanya dalam bentuk tabel distribusi frekuensi, maka rata-rata harmoniknya
dihitung dengan rumus :
Contoh soal :
H=
Berdasarkan hasil perhitungan rata-rata, rata-rata ukur dan rata-rata harmonik, maka
dapat ditarik kesimpulan bahwa ketiga ukuran gejala pusat tersebut mempunyai hubungan
yaitu : H < u < x .
4. Modus
Modus atau mode ialah nilai data yang paling sering muncul pada suatu pengamatan.
Jika nilai yang muncul itu hanya ada satu macam, maka modus tersebut dinamakan
unimodel. Dan jika nilai yang muncul ada dua macam, maka modus tersebut dinamakan
bimodal. Demikian seterusnya. Modus sering juga disingkat dengan Mo.
Contoh :
Modus merupakan alat deskripsi yang tepat namun kasar dan hanya sesuai untuk
mendeskripsikan kasus-kasus tipikal atau alat untuk mencari kejadian-kejadian yang sedang
populer saja. Modus tidak terpengaruh pada kasus ekstrem.
D. HUBUNGAN ANTARA RATA-RATA, MEDIAN, DAN MODUS

1. Pada distribusi normal, rata-rata median dan modus bersekutu atau x = Mo = Me (A).
2. Pada distribusi juling positif. Mo terletak di bawah puncak kurva. Me di kanan Mo dan
x di kanan Me (B).
3. Pada distribusi juling negatif, Mo terletak di bawah puncak kurva, Me di kiri Mo dan x
di kiri Me (C)
E. UKURAN SIMPANGAN
Selain ukuran penempatan dan ukuran gejala pusat di atas, maka masih ada ukuran
lainnya yaitu ukuran simpangan atau ukuran variasi atau ukuran disperse. Ukuran ini
menggambarkan derajat berpencarnya data kuantitatif. Ukuran simpangan ini terdiri atas
rentang, rentang antarkuartil, simpangan kuartil, rata-rata simpangan, simpangan baku dan
koefisien variasi, serta varians. Dari bermacam-macam ukuran simpangan tersebut, maka
ukuran yang paling penting untuk dipelajari adalah rentang, simpangan baku, dan varians.
1. Rentang
Rentang ialah ukuran variasi yang paling sederhana yang dihitung dari datum
terbesar dikurang data terkecil. Rumusnya ialah :
Contoh soal :
Carilah rentang untuk data sampel : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14.
Jawab :
R = 14 – 3 = 8.
2. Simpangan Baku dan Varians
Ukuran simpangan baku yang paling banyak digunakan ialah simpangan baku.
Simpangan baku ialah suatu nilai yang menunjukkan tingkat variasi suatu kelompok data.
Jika simpangan baku tersebut dikuadratkan, maka ia disebut varians. Simpangan baku untuk
data sampel disebut s dan variansnya ialah s 2, sedangkan simpangan baku untuk data
populasi disebut  (baca tho) dan variansnya ialah 2. Jadi s dengan s2 merupakan statistik
dan  dan 2 merupakan parameter. Jika kita mempunyai sampel berukuran n dengan data
x1, x2, …. xn, dan rata-rata x, maka s2 dapat dihitung dengan rumus :
atau
Bila datanya sudah disusun dalam bentuk tabel distribusi frekuensi, maka rumusnya :
Selanjutnya, seperti halnya dengan rata-rata, maka kita dapat menghitung rata-rata
gabungan. Jadi jika ada k buah subsampel dengan :
subsampel 1 berukuran n1 dan simpangan baku s1
subsampel 2 berukuran n2 dan simpangan baku s2
…………………………………………………….
subsampel 1 berukuran nk dan simpangan baku sk
yang digabungkan menjadi sebuah sampel berukuran n = n1 + n2 + …. + nk, maka
simpangan bakunya dihitung dengan rumus :
atau lengkapnya :
Untuk mendapatkan nilai simpangan baku s, akarkanlah hasil s2 tersebut dan diambil harga
akar yang positif.
Langkah-langkah Menghitung Simpangan Baku :
1) Buatlah tabel penolong dengan bentuk berikut ini.
2) Masukkan nilai-nilai yang didapat dari tabel tersebut ke dalam rumus :
3) Cari s = s2
Contoh soal :
1. Diketahui data sampel : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14. Hitunglah simpangan
bakunya.
Jawab :
3) Cari s =
atau dapat dihitung dengan cara :
2) Masukan nilai tersebut ke rumus :
3) Diketahui
2. Diketahui data sebagai berikut :

Jawab :
1) Buat tabel penolongnya sebagai berikut :
3) Cari s =
3. Diketahui data subsampel 1 : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14 dengan simpangan
baku = 3,92.
dan data subsampel 2 : 3, 5, 7, 8, 10, 10, 12 dengan simpangan baku = 3,13.
Hitunglah simpangan baku gabungannya.
Jawab :
F. ANGKA BAKU
Angka baku atau bilangan baku digunakan untuk membandingkan keadaan distribusi
gejala. Andaikan kita mempunyai sebuah sampel berukuran n dengan data x1, x2, …. xn
sedangkan rata-rata x dan simpangan baku s, maka angka bakunya dihitung dengan
rumus :
Contoh soal :
Diketahui data : 3, 5, 7, 8, 10, 10, 12, 14, 14, 14.
Hitunglah angka bakunya masing-masing.
Jawab :
Simpangan baku = 3,92 dan x = 9.7.
Angka baku untuk x1 = 3 ialah z =
Lanjutkan untuk xi lainnya.
BAB V. DISTRIBUSI PELUANG
A. PENDAHULUAN
Distribusi peluang terdiri atas :
1. Distribusi binom.
2. Distribusi multinom.
3. Distribusi hipergeometrik.
4. Distribusi poisson.
5. Distribusi normal.
6. Distribusi student.
7. Distribusi chi-kuadrat.
8. Distribusi F.
Distribusi 1 sampai 4 digunakan untuk data acak diskrit dan distribusi 5 sampai 8
untuk data acak kontinu. Distribusi yang paling banyak digunakan dalam penelitian sosial
adalah distribusi 1 sampai 8 yang diuraikan sebagai berikut :
B. DISTRIBUSI NORMAL
1. Pendahuluan
Dalam bab terdahulu kita telah dapat menyajikan data menurut keadaan kelompok,
simpangan baku, dan angka baku. Penyajian tersebut dapat pula dilanjutkan dengan
menggunakan distribusi normal. Sebagai contoh, dalam suatu perlombaan lari masal kita
dapat menyajikan data dalam bentuk keadaan kelompok. Namun jika dikehendaki, data
tersebut dapat pula dilanjutkan dengan penyajian :
a. berapa pelari yang gagal untuk jarak 10 km?
b. berapa pelari yang sukses untuk jarak 10 km lebih?
c. apakah ada perbedaan jarak tempuh menurut kategori jenis kelamin, umur, dan
sebagainya?
d. adakah hubungan antara jarak tempuh dengan berat badan?
e. dapatkah diramalkan bahwa semakin banyak yang ikut, semakin banyak pula yang
berhasil?
Jadi, dengan menggunakan distribusi normal, penyajian daa dapat lebih bermakna
daripada hanya menggunakan penyajian kelompok saja. Karena dengan adanya persyaratan
normalitas data, maka data dapat dilanjutkan penyajiannya dalam bentuk membedakan,
mencari hubungannya, dan meramalkannya. Mengapa diperlukan data acak dan berdistribusi
normal? Jawabannya ialah karena hampir segala sesuatu yang ada di dunia ini akan lebih
mudah dibandingkan, dihubungkan, dan diramalkan apabila datanya acak dan berdistribusi
normal. Kebetulan pula bahwa hampir semua gejala alam mendekati distribusi normal. Jika
menggunakan data acak distribusi normal dalam sebuah kurve, maka kurve tersebut
dinamakan kurve normal.
2. Ciri-ciri Distribusi Normal
a. Berbentuk lonceng simetris terhadap x = .
Distribusi normal atau kurve normal disebut juga dengan nama distribusi Gauss,
karena persamaan matematisnya ditemkan oleh Gauss dengan rumus :
Jika x mempunyai bentuk - ~ < x < ~, maka disebut variabel acak X berdistribusi
normal. Dan rumus di atas dapat digambarkan sebagai berikut :
b. Grafiknya selalu berada di atas sumbu absis X.
0,3939
c. Mempunyai modus, jadi kurva unimodal tercapai pada x =  = .

d. Grafiknya mendekati (berasimtutkan) sumbu absis X dimulai dari x =  + 3  ke kanan
dan x =  - 3 ke kiri.
e. Luas daerah grafik selalu = satu unit persegi.
3. Bentuk Kurve Normal
a. Normal umum
Di mana
b. Normal baku (standar)
Perubahan dari bentuk normal umum menjadi normal baku dilakukan dengan
langkah-langkah sebagai berikut :
1) Cari zhitung dengan rumus :
2) Gambarkan kurvenya.
3) Tuliskan nilai zhitung pada sumbu X di kurve di atas dan tarik garis dari titik z hitung ke atas
sehingga memotong garis kurve.
4) Luas yang terdapat dalam tabel merupakan luas daerah antara garis tegak ke titik 0 di tengah
kurve.
5) Carilah tempat nilai z dalam tabel normal.
6) Luas kurve normal = 1, karena  = 0, maka luas dari 0 ke ujung kiri = 0,5. Luas dari 0 ke
titik kanan = 0,5.
Jika z bilangan bulat, maka luas daerah (dalam %) adalah sebagai berikut :
Jika z bukan bilangan bulat, maka luas daerahnya dicari dengan menggunakan tabel
kurve normal baku.
4. Cara Menggunakan Tabel Kurve Normal Baku
a. Berapa z = + 2,34?
Jawab : 0,4904 atau 49,04% (ke kanan).
b. Berapa z = -2,34?
Jawab : 0,4904 atau 49,04% (ke kiri).
c. Berapa luas antara z = -2,34 dan z = +2,34 atau (-2,34 < z < +2,34)?
Jawab : 49,04 + 49,04 = 98,08%.
d. Berapa luas antara z = 1,23 dengan z = 2,34 atau (1,23 < z < 2,34)?
Jawab : z = +2,34 = 49,04%
z = +1,23 = 39,07%
9,97%
e. Berapa luas z = +1,23 ke kanan?
Jawab : z = +1,23 ke kanan = 10,93%.
f. Berapa luas z = +1,23 ke kiri?
Jawab : 100% - 10,93% = 89,07%
g. Berapa nilai z untuk luas 49,60%?
Jawab : 2,65%.
5. Contoh Soal
Dari 100 responden didapat harga rata-rata untuk angket motivasi kerja = 75 dengan
simpangan baku = 4.
Ditanyakan :
1) Berapa jumlah responden yang mendapat nilai 80 ke atas?
2) Berapa jumlah responden yang mendapat nilai 70 ke bawah?
3) Berapa nilai responden yang dapat dikualifikasikan 10% dari nilai tertinggi?
Jawab :
X 
1) z=

80  75
=
4
= 1,25 dari tabel kurve normal didapat luas ke kanan = 10,56%.
Jadi jumlah responden = 10,56% x 100 = 11. orang.
75  80
2) =
4
= -1,25 dari tabel kurve normal didapat luas ke kiri = 10,56%.
Jadi jumlah responden = 10,56% x 100 = 11 orang.
3) Batas kualifikasi 10% tertinggi = 50% - 10% = 40% dari tabel didapat 1,28.
Karena SD tertinggi = 4, maka untuk 1,28 SD = 1,28 x 4 = 5,12. Jadi skor tertinggi = 75 +
5,12 = 80,12.
C. PENGUJIAN NORMALITAS DATA

Pengujian normalitas data digunakan untuk menguji apakah data kontinu
berdistribusi normal seingga analisis dengan validitas, reliabilitas, uji t, korelasi, regresi
dapat dilaksanakan.
Di pihak lain, beberapa ahli menyatakan bahwa uji normalitas tidak diperlukan
terhadap data yang jumlahnya sama dengan atau lebih dari 30 buah atau disebut sampel
besar (Sudjana, 1989 dan Sutrisno Hadi, 1986). Tetapi ada pula ahli yang menyatakan bahwa
data sudah dianggap normal jika jumlahnya 100 buah lebih (Nunnally, 1975 : 113). Pendapat
ini sejalan pula seperti yang diungkapkan oleh Sudjana (1989).
Pengujian normalitas data dapat dilakukan dengan cara :
(1) kertas peluang normal yang disingkat kertas peluang,
(2) koefisien kurtosis,
(3) koefisien kurtosis persentil,
(4) uji chi-kuadrat, dan
(5) Lilieford.
Dari kelima cara tersebut, maka cara (1) yang paling mudah dilaksanakan. Pengujian
normalitas data dengan uji chi-kuadrat lihat halaman 276.
Langkah-langkah Pengujian Normalitas dengan Kertas Peluang.
1) Urutkan data dari terendah sampai tertinggi.
2) Buat daftar distribusi komulatif relatif kurang dari.
3) Gambarkan nilai daftar tersebut ke kertas peluang.
4) Hubungkan titik-titik yang digambarkan di kertas peluang tadi.
5) Simpulkan bahwa data berdistribusi normal atau mendekati distribusi normal apabila
titik-titik yang dihubungkan tersebut merupakan garis lurus atau hampir lurus. Demikian
pula jika sebaliknya.
Contoh Soal:
Berdasarkan contoh soal halaman 71, ujilah apakah data tersebut berdistribusi normal?
Jawab: lihat gambar V.6
Pengujian Normalitas dengan Kurtosis
Kurtosis ialah tinggi atau rendahnya bentuk kurve normal. Kurve disebut normal,
apabila kurvenya tidak terlalu runcing (tinggi) atau tidak pula terlalu datar (rendah). Kurve
yang runcing disebut leptokurtic, kurve yang datar disebut platikurtik, dan kurve yang tidak
terlalu datar disebut Mesokurtik. Gambarnya seperti berikut ini.
Koefisien kurtosis diberi lambang a4 yang dicari dengan rumus :

Kriterianya :
Pengujian Normalitas Data dengan Koefisien Kurtosis Persentil

Pengujian normalitas data dengan koefisien kurtosis persentil dihitung dengan rumus
:
Kriterianya : Jika k = 0,263 atau mendekati 0,263, maka datanya berdistribusi normal atau
mendekati distribusi normal.
D. DISTRIBUSI STUDENT
Pada tahun 1908, W.S. Gosset dengan nama samaran Student berhasil
mempublikasikan karyanya yang disebut dengan distribusi Student atau distribusi t.
Distribusi Student dapat digunakan untuk dapat yang tidak normal.
Tabel distribusi Student digunakan dengan cara membandingkannya nilai t hitung
dengan nilai ttabel yang didapat dari tabel distribusi Student atau selanjutnya disebut tabel t.
Tabel t berguna untuk :
(1) pengujian hipotesis,
(2) uji kesamaan dua rata-rata, dan
(3) uji signifikansi koefisien korelasi.
thitung didapat dengan menggunakan rumus :
Sedangkan ttabel dicari dengan cara sebagai berikut :

1) Tentukan nilai  apakah 0,01, 0,02, 0,05, 0,10, 0,20 atau 0,50.
2) Tentukan apakah untuk uji dua pihak atau satu pihak.
3) Hitung df atau dk = n – 1 untuk uji hipotesis atau dk n – 2 untuk membedakan dua
rata-rata.
4) Cari nilai tersebut di dalam tabel t (terlampir).
Contoh Soal :
Diketahui
Berapa :
Jawab :
E. DISTRIBUSI CHI-KUADRAT
Tabel chi-kuadrat atau 2 (baca chi-kuadrat) digunakan dengan cara
membandingkannya nilai 2hitung dengan nilai 2tabel yang didapat dari tabel 2. Tabel 2
berguna untuk mencari hubungan antara data nominal, pengujian normalitas data.
2tabel dicari dengan cara sebagai berikut :
1) Tentukan nilai  apakah 0,001, 0,01, 0,05, atau 0,10
2) Hitung df atau dk = n – 1.
3) Cari nilai tersebut di dalam tabel 2 (terlampir)
Contoh Soal :
Diketahui :
Berapa :
Jawab :
F. DISTRIBUSI F
Tabel distribusi F selanjutnya disebut tabel F digunakan dengan cara
membandingkannya nilai Fhitung dengan nilai Ftabel yang didapat dari tabel F. Tabel F berguna
untuk :
(1) pengujian homogenitas data,
(2) pengujian signifikansi korelasi, dan
(3) pengujian linieritas data.
Ftabel dicari dengan cara sebagai berikut :
1) Tentukan nilai  apakah 0,01 atau 0,05.
2) Hitung df atau dk dengan rumus tertentu, sehingga didapat pembilang dan
penyebutnya.
3) Dalam tabel F ada dk untuk pembilang dan ada dk untuk penyebut sehingga ditulis
F(dk pembilang, dk penyebut).
4) Cari nilai tersebut did alam tabel F (terlampir).
Contoh Soal:
Diketahui :
Berapa :
Jawab :
BAB VI
PENGUJIAN HIPOTESIS
A. PENDAHULUAN
Istilah hipotesis berasal dari bahasa Yunani, yaitu dari kata hupo dan thesis. Hupo
artinya sementara, atau kurang kebenarannya atau masih lemah kebenarannya. Sedangkan
thesis artinya pernyataan atau teori. Karena hipotesis adalah pernyataan sementara yang
masih lemah kebenarannya, maka perlu diuji kebenarannya, sehingga istilah hipotesis ialah
pernyataan sementara yang perlu diuji kebenarannya. Untuk menguji kebenaran sebuah
hipotesis digunakan pengujian yang disebut pengujian hipotesis atau pengetesan hipotesis
(testing hypothesis).
Sebelum suatu hipotesis diuji, maka hipotesis tersebut haruslah memenuhi syarat-
syarat yang ditentukan. Bagaimana syarat-syarat hipotesis yang baik itu? Untuk menjawab
pertanyaan ini diperlukan penelaahan yang mendalam terhadap buku-buku metodologi
penelitian. Hal ini bukanlah ruang lingkup pembahasan buku ini.
Pengujian hipotesis akan membawa kepada kesimpulan untuk menolak atau
menerima hipotesis. Dengan demikian kita dihadapkan pada dua pilihan. Agar pemilihan
kita lebih terinci dan mudah, maka diperlukan hipotesis alternatif yang selanjutnya disingkat
Ha dan hipotesis nol (null) yang selanjutnya disingkat H 0. Ha disebut juga sebagai hipotesis
kerja atau hipotesis penelitian (research hypothesis). Ha adalah lawan atau tandingan dari
H0. Ha cenderung dinyatakan dalam kalimat positif. Sedangkan H0 dinyatakan dalam
kalimat negatif.
Contohnya :
1. Ha : Terdapat hubungan fungsional yang positif antara variabel X dengan Y.
H0 : Tidak terdapat hubungan fungsional yang positif antara variabel X dengan Y.
2. Ha : Terdapat perbedaan motivasi kerja antara pria dengan wanita.
H0 : Tidak terdapat perbedaan motivasi kerja antara pria dengan wanita.
Ha dan H0 yang mengandung kata-kata signifikan dan atau linier kebalikan dari contoh di
atas.
Contoh :
1. Ha : Tidak terdapat hubungan fungsional yang signifikan antara variabel X dengan
Y.
H0 : Terdapat hubungan fungsional yang signifikan antara variabel X dengan Y.
2. Ha : Tidak terdapat hubungan fungsional yang linier antara variabel X dengan Y.
H0 : Terdapat hubungan fungsional yang linier antara variabel X dengan Y.
3. Ha : Tidak terdapat hubungan fungsional yang signifikan dan linier antara variabel
X dengan Y.
H0 : Terdapat hubungan fungsional yang signifikan dan linier antara variabel X
dengan Y.
Hipotesis tersebut di atas disebut hipotesis nondireksional atau tidak langsung.
Pasangannya disebut pengujian sederhana lawan sederhana. Pengujiannya menggunakan uji
dua pihak atau dua ekor.
Jika H0 dinyatakan dengan lebih besar, maka Ha dinyatakan dengan lebih kecil.
Hipotesis ini disebut hipotesis direksional. Pasangan ini disebut pengujian komposit
dengan komposit. Pengujiannya menggunakan uji satu pihak atau satu ekor yang disebut uji
pihak kiri.
Sebaliknya, jika H0 dinyatakan dengan lebih kecil, maka Ha harus dinyatakan dengan
lebih besar. Hipotesis ini disebut hipotesis direksional. Pasangannya disebut pengujian
komposit dengan komposit. Pengujiannya menggunakan uji satu pihak atau satu ekor yaitu
pihak kanan.
Sekarang yang menjadi masalah ialah kapan peneliti memakai hipotesis non
direksional dan kapan memakai hipotesis direksional? Atau dengan kata lain : Kapan
peneliti memakai uji dua pihak dan kapan uji satu pihak? Jawabnya ialah tergantung pada
keputusan yang akan diambil.
Keputusan untuk memilih uji dua pihak atau satu pihak bukanlah untuk memudahkan
mendapatkan signifikansi. Pilihannya tidaklah didasarkan atas pertimbangan statistik, tetapi
didasarkan atas keputusan yang akan diambil sebagai hasil dari penemuan penelitiannya.
Jika ingin membuat suatu keputusan untuk memilih salah satu dari dua bentuk gaya
mengajar atau gaya kepemimpinan, maka uji dua pihaklah yang lebih cocok untuk dipilih.
Sebaliknya, jika peneliti ingin memutuskan untuk mengadopsi suatu sistem baru atau
metode baru, maka uji satu pihaklah yang lebih cocok untuk dipilih. Oleh sebab itu, uji satu
pihak dapat membantu untuk pengembangan suatu teori.
Beberapa ahli berpendapat bahwa uji dua pihak lebih dapat dipertanggungjawabkan
untuk ilmu-ilmu sosial, karena seperti psikologi, sosiologi, pendidikan, administrasi dan
sebagainya sangat banyak variabel yang belum diketahui.
Pengujian H0 dan Ha memerlukan hipotesis statistik.
Hipotesis statistik ialah pernyataan khusus mengenai populasi atau sampel.
Selanjutnya hipotesis statistik inilah yang diuji. Pengujian dengan membandingkan hasil
perhitungan data dengan kriteria tertentu. Contoh hipotesis dalam bentuk kalimat diubah
menjadi hipotesis statistik.
1. Ha : Terdapat perbedaan motivasi kerja antara pria dengan wanita.
H0 : Tidak terdapat perbedaan motivasi kerja antara pria dengan wanita.
Bentuk hipotesis statistiknya adalah sebagai berikut :
Ha : pria  wanita
H0 : pria = wanita
2. Ha : Prosedur kerja A lebih baik daripada prosedur kerja B.
H0 : Prosedur kerja A tidak lebih baik daripada prosedur kerja B.
Bentuk hipotesis statistiknya adalah :
Ha : A > B
H0 : A < B
Walaupun berdasarkan analisis statistik kita telah menolak atau menerima suatu
hipotesis, hal ini belumlah memberikan kebenaran mutlak 100% kepada kita, sebab kita
biasanya bekerja dengan data sampel sehingga kekeliruan sampling selalu ada betapa pun
kecilnya. Ada dua macam kesalahan sampling yaitu seperti uraian berikut ini.
B. DUA MACAM KESALAHAN

Dalam pengujian hipotesis akan terjadi dua macam kesalahan yaitu :
Kesalahan tipe 1 yaitu menolak hipotesis yang seharusnya tidak ditolak.
Kesalahan tipe 2 yaitu tidak menolak hipotesis yang seharusnya ditolak.
Pengertian dari pernyataan di atas mungkin lebih jelas jika diberikan contoh ini :
Suatu eksperimen pupuk A diberikan pada 100 pohon tertentu dan setelah sebulan
ternyata 50 dari pohon tersebut tidak menunjukkan reaksi dari pemupukan itu. Kemudian
pupuk B diberikan pula kepada 100 pohon tertentu lainnya ternyata hanya 40 pohon yang
tidak menunjukkan reaksi (berbuah).
Berdasarkan data di atas, maka biasanya orang menarik kesimpulan bahwa pupuk A
tidak lebih efektif dari pupuk B, kecuali lebih dari 50 pohon telah berbuah. Sehingga
menimbulkan pertanyaan : “Berapakah yang lebih dari 50 pohon itu?” Jadi berapakah
jumlah pohon yang berbuah untuk mengatakan bahwa pupuk A lebih efektif? Sayangnya,
metode statistik belum berhasil menjawab hal ini. Dalam setiap keadaan yang diketahui
tidaklah mungkin membuat kesimpulan sebagai kebenaran, kecuali suatu kesimpulan yang
agaknya benar dapat diputuskan. Dan jika keputusan dibuat, maka kemungkinan besar akan
terjadi kesalahan.
Misalnya 75 dari 100 pohon tadi berbuah dengan pemberian pupuk A, maka peneliti
dihadapkan dengan dua keputusan :
1. Pupuk A, nyatanya tidak lebih baik dari pupuk B, meskipun 75 dari pohon telah
berbuah. Karena mungkin saja hanya disebabkan kebetulan semata. Saya percaya bahwa
pupuk A tidak lebih baik dari pupuk B walaupun 75 dari 100 pohon telah berbuah.
2. Walaupun saya percaya bahwa 75 dari 100 pohon telah berbuah sebagai reaksi dari
pupuk A hanyalah suatu kebetulan belaka, kiranya cukup beralasan kalau saya percaya
bahwa pupuk A lebih efektif daripada pupuk B.
Jika peneliti memilih keputusan 1 di atas, maka ia telah melakukan kesalahan tipe 1,
jika peneliti memilih keputusan 2, maka ia telah melakukan kesalahan tipe 2.
Hubungan antara hipotesis, kesimpulan dan tipe kesalahan dapat digambarkan
seperti tabel di bawah ini :
Ketika merencanakan pengujian hipotesis, kedua tipe kesalahan tersebut hendaklah

dibuat sekecil mungkin. Kedua tipe kesalahan tersebut dinyatakan dalam peluang. Supaya
penilaian dapat dilakukan. Peluang ini juga sekaligus merupakan besarnya risiko kesalahan
yang ingin kita hadapi. Peluang membuat kesalahan tipe 1 biasanya dinyatakan dengan 
(baca alpha). Dan peluang membuat tipe 2 biasanya dinyatakan dengan lambang  (baca
beta). Oleh karena itu kesalahan tipe 1 disebut juga dengan kesalahan , dan kesalahan tipe
2 disebut juga dengan kesalahan .  disebut juga taraf signifikansi, taraf arti, taraf nyata
atau probability = p, taraf kesalahan, dan taraf kekeliruan.
Taraf signifikansi dinyatakan dalam dua atau tiga desimal atau dalam persen. Lawan
dari taraf signifikansi atau tanpa kesalahan ialah taraf kepercayaan. Jika taraf signifikansi
5%, maka dengan kata lain dapat disebut taraf kepercayaan = 95%. Demikian seterusnya.
Dalam penelitian sosial, besarnya  biasanya diambil 5% atau 1% (0,05 atau 0,01).
Penentuan besarnya  tergantung pada keinginan peneliti sebelum analisis statistik
dilakukan.
Arti  = 0,01 ialah kira-kira 1 dari 100 kesimpulan akan menolak hipotesis yang
seharusnya diterima. Atau dengan kata lain kira-kira 99% percaya bahwa kita telah membuat
kesimpulan yang benar.
Sebelum mengadakan pengujian hipotesis, maka asumsi-asumsi yang berlaku
hendaklah dipenuhi terlebih dahulu.
Asumsi-asumsi yang diperlukan sebelum melakukan pengujian hipotesis adalah :
1) Nyatakanlah dengan tegas bahwa data yang akan diuji tersebut berasal dari sampel
atau populasi. Jika menggunakan data sampel, maka rata-ratanya adalah . Dan jika
menggunakan data populasi, maka rata-ratanya adalah .
2) Data yang diuji berdistribusi normal.
C. MACAM PENGUJIAN HIPOTESIS

Pengujian hipotesis ada tiga macam yaitu :
1. Uji dua pihak.
2. Uji satu pihak, yaitu pihak kanan.
3. Uji satu pihak, yaitu pihak kiri.
Dalam pengujian hipotesis, yang diuji apakah H 0 ditolak atau diterima. Untuk dapat
memutuskan apakah H0 ditolak atau diterima, maka diperlukan kriteria tertentu dengan nilai
tertentu baik dari hasil perhitungan maupun hasil dari tabel. Kedua hasil tersebut
dibandingkan. Dalam hal ini dimisalkan kita menggunakan kita cari ttabel dari tabel t dengan
 tertentu.
Nilai ttabel dua pihak dan satu pihak dengan  tertentu diperoleh dengan melihat daftar
atau tabel t.
D. KRITERIA PENGUJIAN
Penentuan kriteria pengujian dan nilai kritis digambarkan seperti tabel berikut ini.
E. LANGKAH-LANGKAH PENGUJIAN HIPOTESIS
1. Tulis Ha dan H0 dalam bentuk kalimat.
2. Tulis Ha dan H0 dalam bentuk statistik.
3. Hitung thitung atau zhitung (salah satu tergantung  tak diketahui atau diketahui. Jika 
tidak diketahui, maka thitung adalah :
di mana :
Jika  diketahui, maka zhitung adalah :
4. Tentukan taraf signifikansi ().

5. Cari ttabel dengan ketentuan :
 seperti langkah 4,
dk = n – 1
dua pihak atau pihak kanan atau pihak kiri tergantung bunyi H0. Dengan menggunakan tabel
t diperoleh ttabel atau ztabel.
6. Tentukan kriteria pengujian.
7. Bandingkan thitung dengan ttabel atau zhitung dengan ztabel.
8. Buatlah kesimpulannya.
F. CONTOH SOAL UJI DUA PIHAK, PIHAK KANAN DAN PIHAK KIRI
Diketahui : Angket penelitian motivasi kerja suatu kantor dengan jumlah pertanyaan
sebanyak 10 buah. Jumlah responden = 30 orang. Angket mempunyai skala pertanyaan 1 =
sangat rendah, 2. rendah, 3. tinggi, dan 4, sangat tinggi, s = 7,23. x = 26,36.
Pertanyaan :
1. Apakah motivasi kerja karyawan di kantor tersebut = 60% rata-rata skor idealnya?
2. Apakah motivasi kerja karyawan di kantor tersebut > 60% rata-rata skor idealnya?
3. Apakah motivasi kerja karyawan di kantor tersebut < 60% rata-rata skor idealnya?
Jawab :
Skor ideal = 10 x 4 x 30 = 1200
Rata-rata skor ideal = 1200 : 30 = 40.
60% rata-rata skor ideal = 60% x 40 = 24.
Jawaban pertanyaan nomor 1
1. Ha dan H0 dalam bentuk kalimat.
Ha : Motivasi kerja karyawan = 60% rata-rata skor ideal.
H0 : Motivasi kerja karyawan  60% rata-rata skor ideal.
2. Hipotesis statistiknya
Ha :   24
H0 :  = 24
3. thitung
x  0
thitung = s
n
26,36  24
= 7,23
30
= 1,78
4. Taraf siginfikansi () = 0,05.
5. ttabel dengan ketentuan :
 = 0,05
dk = n – 1 = 30 – 1 = 29
dengan menggunakan uji dua pihak, maka diperoleh ttabel = 2,04.
6. Kriteria pengujian dua pihak :
Jika –ttabel < thitung < + ttabel, maka H0 diterima.
7. Ternyata -2,04 < 1,78 < +2,04 atau –ttabel < thitung < +ttabel, sehingga H0 diterima.
8. Kesimpulannya :
H0 yang berbunyi : “Motivasi kerja karyawan  60% rata-rata skor ideal” diterima.
Sebaliknya Ha yang berbunyi : “Motivasi kerja karyawan = 60% rata-rata skor ideal”,
ditolak.

Ha : Motivasi kerja karyawan > 60% rata-rata skor ideal.
H0 : Motivasi kerja karyawan = 60% rata-rata skor ideal.
Ha :  > 24
H0 :  = 24
3. thitung
x  0
thitung = s
n
26,36  24
= 7,23
30
= 1,78
 = 0,05
dk = n – 1 = 30 – 1 = 29
Jika thitung < + ttabel, maka H0 diterima.
7. Ternyata 1,78 > 1,70 atau
thitung > +ttabel, sehingga H0 ditolak.
8. Kesimpulannya :
H0 yang berbunyi : “Motivasi kerja karyawan = 60% rata-rata skor ideal” ditolak.
Sebaliknya Ha yang berbunyi : “Motivasi kerja karyawan > 60% rata-rata skor ideal”,
diterima.
Ha : Motivasi kerja karyawan < 60% rata-rata skor ideal.
H0 : Motivasi kerja karyawan = 60% rata-rata skor ideal.
Ha :  < 24
H0 :  = 24
3. thitung
x  0
thitung = s
n
26,36  24
= 7,23
30
= 1,78
 = 0,05
dk = n – 1 = 30 – 1 = 29
Jika thitung > + ttabel, maka H0 diterima.
7. Ternyata 1,78 > -1,70 atau
thitung > -ttabel, sehingga H0 diterima.
8. Kesimpulannya :
H0 yang berbunyi : “Motivasi kerja karyawan = 60% rata-rata skor ideal” diterima.
Sebaliknya Ha yang berbunyi : “Motivasi kerja karyawan < 60% rata-rata skor ideal”,
ditolak.
BAB VII
UJI KESAMAAN DUA VARIANS DAN DUA RATA-RATA
A. UJI KESAMAAN DUA VARIANS (HOMOGENITAS)

1. Pendahuluan
Uji kesamaan dua varians digunakan untuk menguji apakah kedua data tersebut
homogen yaitu dengan membandingkan kedua variansnya. Jika kedua varians sama
besarnya, maka uji homogenitas tidak perlu dilakukan lagi karena datanya sudah dapat
dianggap homogen. Namun untuk varians yang tidak sama besarnya, perlu diadakan
pengujian homogenitas melalui uji kesamaan dua varians ini.
Persyaratan agar pengujian homogenitas dapat dilakukan ialah apabila kedua datanya
telah terbukti berdistribusi normal. Untuk melakukan pengujian homogenitas ada beberapa
cara, namun dalam buku ini hanya diberikan tiga cara saja.
2. Cara Pengujian Homogenitas

Pengujian homogenitas ada tiga cara yaitu :
a. Varians terbesar dibandingkan varians terkecil.
b. Varians terkecil dibandingkan varians terbesar.
c. Uji Bartlett (untuk lebih dari 2 kelompok).
Ketiga cara pengujian diuraikan seperti di bawah ini.
a. Varian Terbesar Dibandingkan Varian Terkecil

Langkah-langkahnya sebagai berikut :
1) Tulis Ha dan H0 dalam bentuk kalimat.
2) Tulis Ha dan H0 dalam bentuk statistik.
3) Cari Fhitung dengan menggunakan rumus :
Varians Terbesar
F= Varians Terkecil
4) Tetapkan taraf signifikansi ().

5) Hitung Ftabel dengan rumus :
Ftabel = F1/2  (dk varians terbesar – 1, dk varians terkecil – 1)
dengan menggunakan tabel F didapat Ftabel.
6) Tentukan kriteria pengujian H0 yaitu :
Jika Fhitung < Ftabel, maka H0 diterima (homogen).
7) Bandingkan Fhitung dengan Ftabel.
8) Buatlah kesimpulannya.
Contoh Soal :
Terdapat dua macam pengukuran prosedur kerja di sebuah kantor. Prosedur ke-1
dilakukan 10x menghasilkan s2 = 37,2 dan prosedur ke-2 dilakukan 13x menghasilkan s 2 =
37,2.  = 0,10. Apakah kedua prosedur kerja tersebut mempunyai varian yang homogen?
Jawab :
1) Ha : Terdapat perbedaan varian 1 dengan varians 2.
H0 : Tidak terdapat perbedaan varian 1 dengan varians 2.
2) Ha : 221 ≠ 2II
H0 : 221 = 2II
3) Fhitung dengan menggunakan rumus :
Varians Terbesar
F= Varians Terkecil
37,2
= 24,7 = 1,506
4) Taraf signifikansi () = 0,10.

Ftabel = F1/2 (dk varians terbesar -1, dk varians terkecil -1)
= F1/2.0,10 (13 -1, 10 – 1)

= F0,05(12,9)
6) Kriteria pengujian H0 yaitu :
Jika Fhitung < Ftabel, maka H0 diterima (homogen).
7) Ternyata 1,506 < 3,070 atau Fhitung < Ftabel, sehingga H0 diterima (homogen).
8) Kesimpulannya :
H0 yang berbunyi : “Tidak terdapat peberdaan varians 1 dengan varians 2”, diterima
(homogen). Sebaliknya Ha yang berbunyi “Terdapat perbedaan varians 1 dengan varians 2”,
ditolak (tidak homogen).
b. Varians Terkecil Dibandingkan Varians Terbesar
Langkah-langahnya : untuk langkah 1 sampai 5 seperti di atas, tetapi untuk langkah 3
= Fhitung semula langkah 5 = Ftabel semula. Kemudian lanjutkan dengan langkah 6 dan seterusnya
sebagai berikut :
Cari Fhitung kini untuk langkah 3 dengan rumus :
Varians Terbesar
Fkini = Varians Terkecil
6) Cari Ftabel kanan dengan rumus :
Ftabel kanan = f1/2 (dk varians terekcil -1, dk varians terbesar -1)
dengan menggunakan tabel F didapat nilai Ftabel kanan . Nilai ini selajutnya sebagai nilai
maksimal.
7) Cari Ftabel kiri dengan rumus :
Ftabel kanan = f(1 – ) (dk varians terekcil -1, dk varians terbesar -1)
8) Tentukan kriteria pengujiannya yaitu :

Jika –Ftabel kiri < Fhitung kiri < +Ftabel kanan, maka H0 diterima (homogen).
9) Bandingkan nilai –Ftabel kini, Fhitung kiri dan Ftabel kanan.
Contoh soal : Soalnya sama seperti di atas tadi.
Pertanyaannya : Apakah kedua varians tersebut homogen?
Jawab :
1) Ha : Terdapat perbedaan varians 1 dengan varians 2.
H0 : Tidak terdapat perbedaan varians 1 dengan varians 2.
2) Ha : 221 ≠ 2II
H0 : 221 = 2II
3) Fhitung kini dengan menggunakan rumus :
24,7
Varians Terbesar
F= = 37,2  0,664
Varians Terkecil
4) Taraf signifikansi () = 0,10
Ftabel = F1/2 (dk varians terbesar -1, dk varians terkecil -1)
= F1/2.0,10 (13 – 1, 10 -1)
= F0,05 (12,9)
dengan menggunakan tabel F didapat Ftabel = 3,07 nilai ini sebagai Ftabel semula.
6) Cari Ftabel kanan dengan rumus :
Ftabel kanan = F1/2 (dk varians terkecil -1, dk varians terbesar -1)
= F ½.0,10(10 – 1) 13 – 1
= F 0,05(9,12)
dengan memakai tabel F didapat nilai Ftabel kanan = 2,80.
Nilai ini selanjutnya sebagai nilai maksimal.
7) Cari Ftabel kiri dengan rumus :
Ftabel kanan = F(1 - ) (dk varians terkecil -1, dk varians terbesar -1)
atau
1 1
Ftabel kanan = = 3,07 F0,328
tabel semula
8) Kriteria pengujiannya yaitu :

Jika –Ftabel kiri < Fhitung kini < + Ftabel kanan, maka H0 diterima (homogen).
9) Ternyata -0,328 < 0,664 < 2,800 atau –Ftabel kiri < Fhitung kini < Ftabel kanan.
10) Kesimpulannya :
H0 yang berbunyi : “Tidak terdapat perbedaan varians 1 dengan varians 2”, diterima
(homogen). Sebaliknya Ha yang berbunyi : “Terdapat perbedaan varians 1 dengan varians
2”, ditolak (tidak homogen).
c. Uji Bartlett
Uji Bartlett digunakan apabila pengujian homogenitas dilakukan terhadap tiga
varians atau lebih. Langkah-langkahnya adalah sebagai berikut :
2) Tulis Ha dan H0 dalam bentuk statistic.
3) Buatlah tabel penolong untuk uji Bartlett.
4) Hitung s2 dengan menggunakan rumus :
2
(ni – 1)s2i
s = (ni – 1)
5) Hitung log s2
6) Hitung B dengan rumus :
B = (log s2) (ni – 1)
7) Cari 2hitung dengan rumus :
2hitung = (2,3026) B - (ni – 1) log si2
8) Tetapkan taraf signifikansi ()
9) Cari 2tabel dengan rumus :
2tabel = 2(1 - )(dk)
di mana dk = banyak kelompok – 1
dengan menggunakan tabel 2 didapat 2tabel.
10) Bandingkan 2hitung dengan 2tabel.
B. UJI KESAMAAN DUA RATA-RATA

1. Pendahuluan
Uji kesamaan dua rata-rata digunakan untuk mengetahui ada atau tidak adanya
perbedaan (kesamaan) antara dua buah data. Salah satu teknik analisis statistik untuk
menguji kesamaan dua rata-rata ini ialah uji t (t test) karena rumus yang digunakan disebut
rumus t. Rumus t sendiri banyak ragamnya dan pemakaiannya disesuaikan dengan
karakteristik kedua data yang akan dibedakan.
Ada beberapa persyaratan yang harus dipenuhi sebelum uji t dilakukan.
Persyaratannya adalah :
a. data masing-masing berdistribusi normal.
b. data dipilih secara acak.
c. data masing-masing homogen.
2. Rumus-rumus untuk Uji t
a. Jika kedua data sampel independent (tidak berkorelasi), maka rumus yang digunakan adalah
rumus uji t Fisher’s dengan bentuk :
Jika rumus tersebut di atas digunakan untuk n1 = n2 maka rumus Fisher’s tersebut dapat
disederhanakan menjadi :
b. Jika kedua data sampel dependen (berkorelasi), maka rumus yang digunakan adalah rumus
uji t Fisher’s dengan bentuk :
c. Jika  tidak diketahui dan sampelnya bebas dan kecil, maka perbedaan dua rata-rata dihitung
dengan rumus :
d. Jika kedua sampelnya dependen dalam observasi yang berpasangan maka rumusnya adalah :
e. Jika  diketahui dan sampelnya besar, maka digunakan rumus :
f. Jika  tidak diketahui dan sampelnya besar, maka digunakan rumus :
3. Langkah-langkah Uji Kesamaan Dua Rata-rata

1) Uji atau asumsikan bahwa data dipilih secara acak.
2) Uji atau asumsikan bahwa data berdistribusi normal.
3) Asumsikan bahwa kedua variansnya homogen.
5) Tulis Ha dan H0 dalam bentuk statistik.
6) Cari thitung dengan rumus tertentu.
7) Tetapkan taraf signifikansinya ().
8) Cari ttabel dengan pengujian dua pihak di mana dk = n 1 + n2 – 2 dan dengan menggunakan
tabel t didapat nilai ttabel.
9) Tentukan kriteria pengujian yaitu :
Jika –ttabel < thitung < +ttabel, maka H0 diterima.
10) Bandingkan thitung dengan ttabel.
BAB VIII
ANALISIS REGRESI TUNGGAL
A. PENDAHULUAN
Dalam kehidupan ini kita berhadapan dengan berbagai gejala yang meliputi berbagai
variabel. Sebagai contoh : (1) berat badan dalam taraf tertentu tergantung pada tinggi
badannya, (2) produktivitas kerja pada taraf tertentu tergantung pada efisiensi dan efektivitas
kerjanya, (3) produksi padi dalam taraf tertentu tergantung pada kesuburan tanah, teknologi
yang dipakai, banyak curah hujan, dan sebagainya.
Berdasarkan contoh-contoh di atas, maka tampaklah mana variabel bebas (yang
mempengaruhi) dan mana variabel terikat atau tergantung (yang dipengaruhi). Variabel yang
mempengaruhi ini dalam analisis regresi disebut sebagai variabel predictor, dengan
lambang X; sedangkan variabel yang dipengaruhi disebut variabel kriterium dengan
lambang Y.
Mengapa analisis regresi diperlukan? Jawabnya ialah kita sebagai ilmuwan atau
peneliti dituntut untuk mencari kebenaran secara ilmiah atau berdasarkan ilmu. Dan salah
satu fungsi ilmu ialah meramalkan (to predict). Fungsi ilmu yang lainnya adalah
menggambarkan (to describe), mengontrol (to control), dan menerangkan (to explain).
Berdasarkan fungsi ilmu tersebut, maka jika kita mempunyai dua buah variabel atau
lebih, maka sudah sewajarnyalah kalau kita ingin mempelajari bagaimana variabel-variabel
itu berhubungan atau dapat diramalkan. Hubungan yang diperoleh biasanya dinyatakan
dalam persamaan matematik yang menyatakan hubungan fungsional antara variabel-
variabel. Pelajaran yang menyangkut masalah ini disebut analisis regresi. Hubungan
fungsional antara satu variabel predictor dengan satu variabel kriterium disebut analisis
regresi tunggal, sedangkan hubungan fungsional yang lebih dari satu variabel disebut
analisis regresi ganda.
B. GUNA ANALISIS REGRESI

Analisis regresi berguna untuk : mendapatkan hubungan fungsional antara dua
variabel atau lebih atau mendapatkan pengaruh antara variabel predictor terhadap variabel
kriteriumnya atau meramalkan pengaruh variabel predictor terhadap variabel kriteriumnya.
C. ASUMSI AGAR ANALISIS REGRESI DAPAT DIGUNAKAN
1. Variabel yang dicari hubungan fungsionalnya mempunyai data yang berdistribusi normal.
2. Variabel X tidak acak, sedangkan variabel Y harus acak.
3. Variabel yang dihubungkan mempunyai pasangan sama dari subjek yang sama pula.
4. Variabel yang dihubungkan mempunyai data interval atau rasio.
D. MAKNA PERSAMAAN ANALISIS REGRESI

Misalnya kita ingin mengetahui hubungan fungsional (pengaruh atau meramalkan
pengaruh) antara banyaknya pengunjung toko (variabel X) dengan banyaknya pembeli di
sebuah toko. Persamaan analisis regresinya ialah :
Bentuk persamaan regresi tersebut sering dibaca sebagai regresi X atas Y, artinya
regresi X sebagai variabel prediktornya dengan Y sebagai variabel kriteriumnya. Sebaliknya
ada pula persamaan regresi yang dibaca sebagai regresi Y atas X.
Koefisien arah regresi linier dinyatakan dengan huruf b yang juga menyatakan
perubahan rata-rata variabel Y untuk setiap variabel X sebesar satu bagian. Maksudnya ialah
bila harga b positif, maka variabel Y akan mengalami kenaikan atau pertambahan.
Sebaliknya bila b negatif, maka variabel Y akan mengalami penurunan.
Contoh :
Persamaan regresi antara pengunjung (X) dengan pembeli (Y) ialah Y = 9 + 0,50X.
Maknanya ialah karena b positif, maka hubungan fungsionalnya juga menjadi positif.
Selanjutnya kita dapat mengatakan bahwa jika setiap pengunjung (X) bertambah dengan 30
orang, maka rata-rata pembeli (Y) akan bertambah menjadi Y = 9 + 0,50.30 = 24 orang. Dan
akhirnya kita dapat menyimpulkan bahwa semakin banyak pengunjung, semakin banyak
pula pembelinya.
Contoh-contoh lainnya mengenai lima macam variasi persamaan regresi tunggal dan
gambar serta maknanya dapat dilihat dalam tabel berikut ini.
E. CARA MENGHITUNG PERSAMAAN REGRESI
Persamaan regresi dapat dihitung secara :
1) manual dengan bantuan tabel penolong
2) kalkulator
3) komputer
Pada kesempatan ini perhitungan analisis regresi dibatasi secara manual saja.
F. LANGKAH-LANGKAH MENGHITUNG PERSAMAAN REGRESI

1. Tulis Ha dan H0 dalam bentuk kalimat.
2. Tulis Ha dan H0 dalam bentuk statistik.
3. Buatlah tabel penolong seperti tabel di bawah ini.
4. Hitung a dengan rumus
5. Hitung b dengan rumus
Jika b sudah dihitung lebih dahulu, maka a dapat dihitung dengan rumus :
6. Masukkan nilai a dan b ke dalam persamaan regresi :
7. Ujilah signifikansi dan linieritas persamaan regresi tersebut dengan menggunakan tabel
penolong yang disebut tabel Analisys of Varians (ANOVA) dengan bentuk pada Tabel XI.3.
8.
G. S
H.

Diktat Statistik A

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Diktat Statistik A

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB I.

A. PENGERTIAN ISTILAH STATISTIK DAN STATISTIKA

JENIS DATA PARAMETRIK NON PARAMETRIK

TABEL I.2 TEKNIK STATISTIK

B. PERAN STATISTIK BAGI ILMU PENGETAHUAN

D. Sumber data dan teknik pengumpulan data

Nominal (1) Ekuivalensi Modus

Ordinal (1) ekuivalensi Median

(2) Lebih besar dari Spearman r

Interval (1) Ekuivalensi Mean (rata-rata)

(2) Lebih besar dari Simpangan baku

(2) Lebih besar dari Mean geometrik

(3) Rasio sembarang dua Koefisien variasi

(4) Rasio sembarang dua

histogram gejala letak median

8) Pindahkan nilai f ke tabel distribusi frekuensi.

Buatlah tabel distribusi frekuensinya.

7) Nilai f dihitung dengan menggunakan tabel penolong sebagai berikut.

8) Pindahkan nilai f ke tabel distribusi frekuensi.

B. TABEL DISTRIBUSI FREKUENSI RELATIF

f (%) baris pertama = x 100%

C. TABEL DISTRIBUSI FREKUENSI KUMULATIF

Tabel Distribusi Frekuensi Kumulatif atau Lebih Untuk Nilai DP3

D. DAFTAR DISTRIBUSI FREKUENSI KUMULATIF RELATIF

Nilai DP3 fkum(%)

BAB IV. KEADAAN KELOMPOK

di mana : b = batas bawah kelas Me yaitu kelas di mana Me akan terletak.

Tabel. Distribusi Frekuensi

Diminta desil ke-7.

di mana : b = batas bawah kelas Pi

C. UKURAN GEJALA PUSAT

di mana : = x bar atau x garis atau rata-rata x

Ditanyakan : Berapa rata-rata ukurnya?

D. HUBUNGAN ANTARA RATA-RATA, MEDIAN, DAN MODUS

2) Masukkan nilai-nilai yang didapat dari tabel tersebut ke dalam rumus :

2) Masukkan nilai-nilai yang didapat dari tabel tersebut ke dalam rumus :

2) Masukan nilai tersebut ke rumus :

2. Diketahui data sebagai berikut :

2) Masukkan nilai-nilai yang didapat dari tabel tersebut ke dalam rumus :

b. Normal baku (standar)

C. PENGUJIAN NORMALITAS DATA

Koefisien kurtosis diberi lambang a4 yang dicari dengan rumus :

Pengujian Normalitas Data dengan Koefisien Kurtosis Persentil

Sedangkan ttabel dicari dengan cara sebagai berikut :

B. DUA MACAM KESALAHAN

Ketika merencanakan pengujian hipotesis, kedua tipe kesalahan tersebut hendaklah

C. MACAM PENGUJIAN HIPOTESIS

Jika  diketahui, maka zhitung adalah :

4. Tentukan taraf signifikansi ().

Jawaban pertanyaan nomor 22

A. UJI KESAMAAN DUA VARIANS (HOMOGENITAS)

2. Cara Pengujian Homogenitas

a. Varian Terbesar Dibandingkan Varian Terkecil

4) Tetapkan taraf signifikansi ().

4) Taraf signifikansi () = 0,10.

Ftabel = F1/2 (dk varians terbesar -1, dk varians terkecil -1)

= F1/2.0,10 (13 -1, 10 – 1)

6) Cari Ftabel kanan dengan rumus :

8) Tentukan kriteria pengujiannya yaitu :

8) Kriteria pengujiannya yaitu :

4) Hitung s2 dengan menggunakan rumus :

B. UJI KESAMAAN DUA RATA-RATA

f. Jika  tidak diketahui dan sampelnya besar, maka digunakan rumus :

3. Langkah-langkah Uji Kesamaan Dua Rata-rata