Statistika 2

HANDO
UT
STATISTIKA II
Fakultas Ekonomi
Universitas 17 Agustus 1945
Banyuwangi
Handout Statistik 2
1. TEORI PROBABILITAS
A.
Konsep Probabilitas
Dalam kehidupan sehari-hari setiap orang selalu akan berhadapan
dengan masalah-masalah ketidakpastian (uncertainty).

Masalah ketidakpastian dicoba untuk dapat diukur atau dikuantifisir
dengan suatu konsep Probabilitas (probability, kemungkinan). Probabilitas (P)

dinyatakan dalam angka-angka 0 sampai 1. Probabilitas (P) = 0, artinya suatu
peristiwa atau kejadian mempunyai kemungkinan terjadi 0% atau dengan kata lain
peristiwa itu tidak mungkin terjadi.
Di lain pihak, apabila suatu peristiwa atau kejadian dinyatakan probabilitasnya (P) =
1, berarti bahwa peristiwa atau kejadian itu 100% pasti terjadi.
0 P 1
B.
Pengertian Probabilitas
Ada beberapa metode atau pendekatan untuk menjelaskan pengertian
probabilitas yaitu:
1.
Pendekatan Klasik atau Matematik
Teori probabilitas berkembang pada abad ke-19 di Perancis, pada waktu

perjudian mengalami kejayaan di Perancis, sehingga untuk menjelaskan teori
probabilitas digunakan alat-alat yang digunakan dalam perjudian, seperti
dadu, kartu dan sebagainya.
Menurut pendekatan klasik, terjadinya suatu peristiwa (P) diberikan definisi

sebagai
rasio
dari
kejadian
yang
menguntungkan
seluruh
kejadian/peristiwa apabila setiap kejadian mempunyai kesempatan yang

sama.
Apabila dirumuskan, maka probabilitas terjadinya suatu peristiwa (P) adalah:

P
K
S
dimana K = kejadian yang menguntungkan dan S = seluruh kejadian
Contoh-contoh dari pendekatan klasik:

a.
Pelemparan sebuah mata uang logam
b.
Sebuah dadu yang mempunyai 6 sisi
c.
Kartu Bridge
2.
Pendekatan Empiris atau Frekuensi

Pendekatan
ini
disebut
pendekatan
frekuensi, karena perhitungannya didasarkan pada frekuensi relatif sedang di

lain pihak disebut sebagai pendekatan empiris, karena perhitungannya
berdasarkan pada pengalaman empiris.
Bab 1: Teori Probabilitas
Hal 2 dari 148
Handout Statistik 2
Probabilitas terjadinya suatu peristiwa
menurut pendekatan empiris atau frekuensi adalah frekuensi relatif

terjadinya peristiwa tersebut di dalam percobaan yang berulang-ulang
yang tidak terhingga sifatnya. Karena pada hakekatnya suatu percobaan
yang berulang-ulang yang tidak terhingga tidak mungkin dilaksanakan, maka
di dalam perhitungan ini jumlah percobaannya dibatasi.
Contoh dari pendekatan ini adalah:
a.
Probabilitas terjadinya peristiwa kecelakaan lalu

lintas sebagai akibat pengemudi tidak memiliki Surat Ijin Mengemudi
b.
Probabilitas terjadinya peristiwa seorang pedagang

kaki lima berpindah tempat/lokasi usahanya.
Dalam menentukan pembatasan jumlah percobaan sesuai dengan
definisinya
perlu
pertimbangan
agar
cukup
banyak,
sebab
apabila
pembatasan jumlah percobaan terlampau sedikit atau kecil maka akan

membawa pada kesimpulan yang keliru.
3.
Probabilitas Subyektif
Di dalam kehidupan sehari-hari dapat dijumpai peristiwa-peristiwa yang
jarang terjadi, misalnya bangkrutnya suatu perusahaan, terbakarnya sebuah

toko, dan lain-lain.
Probabilitas terjadinya peristiwa-peristiwa yang jarang terjadi ini pada
hakekatnya sangat tergantung kepada pandangan masing-masing individu.

Pandangan individu ini dapat dikelompokkan ke dalam 2 kelompok, yakni:
-
pandangan yang optimis bahwa peristiwa itu akan terjadi,

sehingga probabilitasnya mendekati 1, misalkan P = 0,90
pandangan yang pesimis bahwa peristiwa itu akan terjadi,

sehingga probabilitasnya mendekati 0, misalkan P = 0,10
Kedua kelompok tersebut adalah sangat subyektif.
Agar dapat memperoleh hasil yang obyektif, maka kedua kelompok

pandangan tersebut perlu dikombinasikan, dengan cara menghitung nilai
rata-ratanya.
Hasil ini dapat dikatakan obyektif, karena telah dihitung segenap

pandangan individu yang berbeda, baik yang optimis maupun yang pesimis.
Pada hakekatnya semua probabilitas mengandung unsur subyektifitas

baik pada pendekatan klasik maupun pada pendekatan empiris. Pada pendekatan
klasik, unsur subyektifitas terletak di dalam memilih peristiwa yang menguntungkan,
pemilihan ini akan berbeda dari satu individu dengan individu yang lain (subyektif).
Demikian pula halnya pada pendekatan empiris, unsur subyektifitas terletak pada
pembatasan jumlah percobaannya. Masing-masing individu akan menetapkan
jumlah percobaannya secara berbeda (subyektif).
Hal 3 dari 148
Handout Statistik 2
C.
Ruang Sampel dan Sub-Ruang Sampel

1.
Pengertian Ruang Sampel Menurut Pendekatan Klasik

Ruang sampel menurut pendekatan klasik adalah suatu
himpunan yang mempunyai unsur seluruh peristiwa atau kejadian.

Contoh, dalam pelemparan sebuah mata uang, akan
dijumpai 2 macam peristiwa atau kejadian, yaitu peristiwa sisi gambar

sebagai peristiwa 1 dan sisi tulisan yang merupakan peristiwa 2. Maka ruang
sampel dari pelemparan sebuah mata uang mempunyai 2 unsur, yaitu unsur
sisi gambar dan sisi tulisan.
1
Sisi
Gamba
r
2
Sisi
Tulisan
Ruang Sampel
Dari bagan di atas, dapat dilihat bahwa ruang sampel merupakan jumlah dari
seluruh peristiwa.
Selanjutnya dari ruang sampel dapat disusun berbagai
macam sub-ruang sampel, karena sub ruang sampel merupakan bagian dari
ruang sampel.
Contoh pada pelemparan 2 buah mata uang secara
bersama, akan dijumpai peristiwa-peristiwa sebagai berikut:

(H,H), (H,T), (T,H) dan (T,T)
(H,H)
menunjukkan peristiwa kedua mata uang tersebut sisi gambar
(H,T),(T,H) menunjukkan kedua peristiwa tersebut masing-masing bersisi

gambar dan tulisan
(T,T)
menunjukkan peristiwa kedua mata uang tersebut sisi tulisan

Apabila masing-masing ini dianggap sebagai sub-ruang
sampel, maka dapat dibedakan 3 macam sub-ruang sampel.
Hal 4 dari 148
Handout Statistik 2
1
(H)
2
(H)
1
(H)
2
(T)
Sub-Ruang
Sampel 1
Sub-Ruang
Sampel 2
1
(T)
2
(H)
1
(T)
2
(T)
Ruang
Sampel
Sub-Ruang
Sampel 3
2. Pengertian Ruang Sample Menurut Pendekatan Frekuensi/Empiris

Pendekatan frekuensi menggunakan frekuensi sebagai
landasan, sehingga ruang sampel menurut pendekatan ini adalah jumlah

seluruh frekuensi.
Contoh,
jumlah
seluruh
mahasiswa
suatu
akademi
manajemen 1500 orang merupakan ruang sampel yang unsurnya terdiri dari
1500 orang mahasiswa. Dari ruang sampel ini dapat disusun berbagai subruang sampel, misalnya menurut jenis kelamin, asal daerah, asal sekolah,
pekerjaan orang tua, maupun tahun masuknya.
Menurut tahun masuknya dapat dibedakan menjadi 3
macam sub-ruang sampel yaitu tahun pertama, tahun kedua dan tahun
ketiga.
Sub-Ruang Sampel
Mahasiswa Tahun I
600 orang
Mahasiswa Tahun II
600 orang
Mahasiswa Tahun III
400 orang
Ruang Sampel
Mahasiswa Akademi
Manajemen
1500
orang
Hal
5 dari 148
Handout Statistik 2
D.
Peristiwa dan Probabilitas Suatu Peristiwa

1.
Pengertian Peristiwa
Apabila suatu ruang sampel merupakan suatu kumpulan hal yang bersifat
universal, maka dari ruang sampel dapat disusun dalam berbagai sub-ruang
sampel yang mempunyai sifat-sifat tertentu.
Sub-ruang sampel yang merupakan unsur-unsur yang mempunyai sifatsifat tertentu ini dapat disebut sebagai suatu peristiwa. Dalam pelemparan 2
buah mata uang dapat dibedakan 3 macam peristiwa yaitu peristiwa 2 sisi
gambar, 1 sisi gambar dan 1 sisi tulisan serta 2 sisi tulisan.
2.
Probabilitas Suatu Peristiwa
Probabilitas suatu peristiwa dirumuskan dengan P () yang diartikan P

sebagai probabilitas dan peristiwanya dinyatakan di antara tanda kurung.
P(A) diartikan sebagai probabilitas suatu peristiwa A. Apabila suatu

peristiwa A terjadi sebanyak n kali dari m percobaan, maka
P A n m
= Probabilitas
A = Peristiwa A
n
= Banyaknya peristiwa A terjadi
m = Jumlah seluruh peristiwa
Selanjutnya probabilitas terjadinya peristiwa yang bukan A dirumuskan

sebagai berikut:
P A 1 P A 1 n m
P A P A 1
= menyatakan peristiwa bukan A atau komplemen A
Misalkan peristiwa A adalah peristiwa kedua sisi mata uang menunjukkan

sisi gambar atau H. Terjadinya kedua sisi mata gambar semua atau (H.H)
adalah 1 dari 4 macam peristiwa. Maka sesuai rumus di atas, n = 1 dan m = 4:
P A 1 4
P A 1 1 4 3 4
P A P A 1
Hal 6 dari 148
Handout Statistik 2
Karena peristiwa A hanya terdiri 1 dari 4 peristiwa maka peristiwa yang

bukan A, yaitu 2 peristiwa sisi yang menunjukkan 1 gambar dan 1 tulisan (H,T
dan T,H) serta 1 peristiwa yang menunjukkan sisi tulisan (T,T).
E.
Asas-Asas Menghitung Probabilitas

1.
Peristiwa yang Saling Meniadakan/Saling Asing (Mutually

Exclusive)
Dua peristiwa dikatakan saling meniadakan atau saling asing, apabila

kedua peristiwa itu tidak dapat terjadi bersama-sama. Secara matematis
dikatakan dua peristiwa A dan B saling meniadakan atau saling asing, apabila
kedua peristiwa itu memiliki unsur yang sama (A dan B tidak ada). Dapat
dilukiskan dengan diagram Venn berikut:
atau
Apabila peristiwa A dan B saling meniadakan maka terjadinya peristiwa A

tidak dapat bersama dengan peristiwa B, artinya apabila peristiwa A terjadi, B
tidak terjadi dan sebaliknya.
Secara matematis, peristiwa saling meniadakan dapat dirumuskan

sebagai berikut:
P (A atau B) = P (A) + P(B)
atau
P (A U B) = P(A) + P(B)
Apabila peristiwanya lebih dari 2 peristiwa maka tetap berlaku asas

penjumlahan.
atau
B
Hal 7 dari 148
Handout Statistik 2
Secara matematis, peristiwa saling meniadakan dapat dirumuskan

sebagai berikut:
P (A atau B atau C) = P (A) + P(B) + P(C)
atau
P (A U B U C) = P(A) + P(B) + P(C)
2.
Peristiwa yang Tidak Saling Meniadakan
Dua peristiwa dikatakan tidak saling meniadakan, apabila peristiwa yang

satu dapat terjadi bersama dengan peristiwa yang lain. Dengan kata lain
kedua peristiwa itu tidak terpisah.
Peristiwa yang tidak saling meniadakan ini dapat digambarkan dalam

diagram Venn sebagai berikut:
AB
B
2 peristiwa yang tidak saling meniadakan ini dapat dirumuskan sebagai

berikut:
P (A atau B) = P(A) + P(B) P (A dan B)
Atau
P (A U B) = P(A) + P(B) P(A B)
Dalam penjumlahan P(A) dan P(B) sebenarnya P(A dan B) telah dihitung
2 kali, oleh karena itu dalam rumus di atas dikurangkan 1 kali.
Apabila ada 3 peristiwa yang tidak saling meniadakan, maka dapat

dirumuskan sebagai berikut:
P (A atau B atau C) = P(A) + P(B) + P(C) P (AB) P(AC) P(BC) + P(ABC)
Atau
P(A U B U C)=P(A) +P(B)+P(C) P(A B) P(A C) P(B C) P(A B
C)
3.
Peristiwa yang Komplementer
Apabila di dalam suatu ruang sampel terdapat peristiwa A dan bukan A (),
sedangkan mengandung semua unsur-unsur dalam ruang sampel
kecuali A, maka dikatakan peristiwa merupakan peristiwa yang
komplementer bagi A.
Hal 8 dari 148
Handout Statistik 2
Peristiwa A dan merupakan peristiwa yang eksklusif secara

bersama. Gabungan antara A dan merupakan sebuah ruang
sampel. Keadaan ini dapat digambarkan sebagai berikut:
Komplimen A ()
Ruang Sampel
Dirumuskan secara matematis:

P() = 1 - P(A)
P( A U ) = P(A) + P() = 1
4.
Peristiwa yang Independen
Dua peristiwa dikatakan independen apabila peristiwa yang satu tidak

mempengaruhi peristiwa yang lain. Dengan kata lain dapat dikemukakan
bahwa terjadinya peristiwa yang satu tidak mempengaruhi peristiwa yang
lain.
Probabilitas dari suatu peristiwa yang independen ini dapat dibedakan

menjadi 3 macam, yaitu:
a.
Marginal Probability (Probabilitas marjinal)
b.
Joint Probability (Probabilitas Gabungan)
c.
Conditional Probability (Probabilitas Bersyarat)
a.
Probabilitas Marginal
Probabilitas marginal atau probabilitas yang tidak bersyarat adalah

probabilitas terjadinya suatu peristiwa yang tidak memiliki
hubungan dengan terjadinya peristiwa yang lain.
Secara matematis dapat dirumuskan sebagai berikut:

Probabilitas terjadinya peristiwa A = P(A)
Probabilitas terjadinya peristiwa B = P(B)
b.
Probabilitas Gabungan
Probabilitas terjadinya 2 peristiwa atau lebih yang secara

bersama-sama atau secara berurutan merupakan hasil perkalian dari
probabilitas marginal atau probabilitas masing-masing peristiwa.
Secara matematis dirumuskan sebagai berikut:

P (A dan B) = P (A) x P(B)
P (A dan B dan C) = P (A) x P(B) x P(C)
Hal 9 dari 148
Handout Statistik 2
P (A dan B) = Probabilitas terjadinya peristiwa A dan B bersama atau

berurutan yang disebut joint probability
P(A)
= Probabilitas marginal dari peristiwa A
P(B)
= Probabilitas marginal dari peristiwa B
c.
Probabilitas Bersyarat pada Peristiwa yang

Independen
Probabilitas bersyarat adalah probabilitas terjadinya suatu peristiwa

dengan syarat peristiwa yang lain harus terjadi.
Sedangkan peristiwa yang independen adalah peristiwa yang tidak

dipengaruhi/tergantung pada peristiwa yang lain. Oleh sebab itu,
probabilitas bersyarat pada peristiwa yang independen dapat
dirumuskan secara matematis sebagai berikut:
P(B/A) = P(B)
Atau
P(A/B) = P(A)
P(B/A)
= Probabilitas peristiwa B dengan syarat peristiwa A harus

terjadi
P(A/B)
= Probabilitas peristiwa A dengan syarat peristiwa B harus

terjadi
Karena dalam peristiwa yang independen persyaratan ini tidak

berpengaruh, maka P(B/A) = P(B) sedangkan P(A/B) =P(A).
5.
Peristiwa yang Dependen

Dua peristiwa dikatakan dependen apabila peristiwa yang satu
dipengaruhi atau tergantung pada peristiwa yang lain. Probabilitas pada

peristiwa yang dependen ini ada 3 macam, yaitu marginal probability, joint
probability dan conditional probability.
a.
Probabilitas Bersyarat pada Peristiwa Dependen
Contoh, sebuah kotak berisi 10 buah bola dengan rincian:

3 buah bola merah bergaris
1 buah bola merah kotak-kotak
2 buah bola biru bergaris
4 buah bola biru kotak-kotak
Pada bola merah dapat dikatakan bahwa probabilitas bola bergaris
dengan syarat bola itu merah adalah P(G/M) = = 0,75. Dengan
perhitungan sebagai berikut:
Hal 10 dari 148
Handout Statistik 2
P (GM ) 3 10
3 10 10 4 3 4 0,75
P( M )
4 10
P G M
Untuk bola biru, probabilitas bola bergaris dengan syarat bola itu biru
adalah:
P G B
P (GB ) 2 10
2 10 10 6 2 6 0,33
P( B)
6 10
Probabilitas bersyarat dapat dirumuskan sebagai berikut:
P ( AB )
P( B)
P A B
b.
atau
P B A
P ( BA)
P ( A)
Joint Probabilitas dari Peristiwa Dependen
Berdasarkan rumus probabilitas bersyarat:
P ( AB )
maka P(AB) = P(A/B) x P(B)
P( B)
P A B
P(AB) merupakan joint probability dari peristiswa yang dependen.
c.
Marginal Probability dari Peristiwa Dependen
Marginal probability dari peristiwa yang dependen dapat dihitung

dengan menjumlah semua joint probability.
Contoh bola di atas, maka probabilitas bola merah adalah

P(M) = P(GM) + P(KM) = 3/10 + 1/10 = 4/10
6.
Teori Bayes
Teori Bayes yang lebih dikenal dengan nama kaedah Bayes memainkan
peranan yang penting dalam penggunaan probabilitas bersyarat dan
menghitung probabilitas subyektif. Teori ini dikembangkan oleh Thomas
Bayes pada tahun 1763.
Apabila A1, A2, A3 .. An merupakan suatu sekatan dari ruang sampel S dan
apabila peristiwa A1, A2, A3 .. An merupakan peristiwa yang lengkap
terbatas dengan probabilitas 0, maka probabilitasnya adalah:
P(A) = P(A1) P(A/A1) + P(A2) P(A/A2) + P(An) P(A/An)
atau
P(A) = P(An) P(A/An)
Sesuai dengan rumus probabilitas bersyarat maka kaedah bayes dapat

dirumuskan pula sebagai berikut:
P Ak A
P A Ak P Ak P A Ak
P A
P A
P Ak A
P Ak P A Ak
P A n P A A n
Hal 11 dari 148
Handout Statistik 2
Contoh, peti A berisi 3 bola hijau dan 5 bola merah, sedang peti B berisi 2
bola hijau, 1 bola merah dan 2 bola kuning. Apabila peti tersebut dipilih
secara random dan selanjutnya dipilih sebuah bola secara random pula, maka
probabilitas bola hijau dipilih dapat dijelaskan sebagai berikut:
Jika A merupakan peristiwa terpilihnya bola hijau, sedangkan terpilihnya peti
A dinyatakan dengan A1 dan terpilihnya peti B dengan A2, maka
P(A1)
= P(A2) = 1/2
P(A/A1)
= 3/8
P(A/A2)
= 2/5
Sesuai dengan teori Bayes, maka:
P A2 A
7.
P A2 P A A2
1 2 2 5
16 31
P A1 P A A1 P A2 P A A2 1 2 3 8 1 2 2 5
Harapan Matematis
Apabila P1, P2 Pn merupakan probabilitas terjadinya peristiwa-peristiwa

A1, A2 An yang merupakan peristiwa yang independen dan lengkap
terbatas, maka jumlah seluruh harapan matematis dirumuskan dengan:
A = A1P1 + A2P2 + AnPn
Harapan matematis ini terdapat pada sistem perjudian dan asuransi. Dalam
sistem perjudian pada asasnya penjudi membayar sejumlah uang untuk
menerima hak sejumlah uang atau tidak sama sekali. Hal yang sama akan
terjadi pada sistem asuransi jiwa, seorang yang mengasuransikan jiwanya
akan membayar premi asuransi. Selama jangka asuransi apabila dia
meninggal, maka dia akan memperoleh sejumlah polis asuransi penuh,
sedang jika dia sehat, maka dia tidak memperoleh apa-apa.
F.
Teori Pengambilan Keputusan

Setiap individu, kelompok, maupun perusahaan akan selalu menghadapi
masalah untuk bertindak berdasarkan berbagai alternatif tindakan. Pemilihan

alternatif
tindakan
ini
didasarkan
karena
adanya
masalah
ketidakpastian
(uncertainty).
Ada 2 macam pengambilan keputusan, yaitu:
1.
Teori pengambilan keputusan berdasarkan pendekatan klasik.

Teori ini didasarkan atas pertimbangan ekonomi secara tidak langsung
melainkan
merupakan
pengambilan
kesimpulan
terhadap
populasi
Hal 12 dari 148
Handout Statistik 2
berdasarkan pada informasi sampel sebagaimana yang dibahas dalam

pendugaan parameter maupun pengujian hipotesa.
2.
Teori pengambilan keputusan berdasarkan pendekatan Bayes

Pengambilan keputusan berdasar pendekatan ini dititikberatkan pada
penggunaan
pertimbangan
ekonomi
secara
langsung,
yakni
dengan
menggunakan tabel hasil (pay-off table).

G.
Dasar-Dasar Pengambilan Keputusan
Ada 4 dasar utama dalam pengambilan keputusan, yaitu:

1.
Alternatif Cara Bertindak

Dalam pengambilan keputusan kita dihadapkan pada berbagai alternatif pilihan.
Oleh sebab itu, perlu adanya evaluasi terhadap berbagai alternatif tindakan.
2.
Peristiwa atau Keadaan Dunia

Apabila di dalam pengambilan keputusan kita hanya menghadapi suatu peristiwa
atau keadaan, maka kita tidak akan menjumpai kesulitan dalam pengambilan
keputusan ini. Sebaliknya apabila kita menghadapi berbagai macam peristiwa
atau keadaan dalam dunia ini, maka pengambilan keputusan menjadi sulit
sehingga perlu mengadakan pendugaan berdasar informasi yang ada agar
pengambilan keputusan mendekati keadaan yang sebenarnya.
3.
Hasil (Pay off)

Agar suatu peristiwa atau keadaan sebagai hasil suatu tindakan dapat dievaluasi,
maka hasil tindakan ini dinyatakan dalam bentuk nilai/hasil (payoffs). Dalam
dunia perusahaan hasil ini disebut keuntungan atau dapat dirumuskan sebagai
biaya. Meski ada berbagai bentuk lain berupa manfaat atau kepuasan (utility).
4.
Kriteria Pengambilan Keputusan

Pengambilan keputusan harus menentukan bagaimana memilih alternatif terbaik
dalam cara bertindak.
Suatu kriteria yang banyak dipergunakan dalam pengambilan keputusan adalah
mengambil alternatif yang dapat mendatangkan keuntungan terbesar.
H.
Pengambilan Keputusan Berdasar Nilai yang Diharapkan (EMW =

Expected Monetary Value)
Setiap keuntungan yang telah diperhitungkan berdasar berbagai alternatif
tindakan telah disusun dalam bentuk tabel hasil, selanjutnya perlu dipertimbangkan
tindakan mana yang akan dipilih.
Apabila kita tidak memiliki informasi, maka kita dapat menduga probabilitas
terjadinya peristiwa dengan:

1.
Informasi Masa Lampau

Informasi masa lampau yang dipergunakan adalah keberhasilan pemasaran
produk mainan anak-anak pada masa lampau.
Hal 13 dari 148
Handout Statistik 2
2.
Informasi yang dimiliki dikombinasikan dengan pandangan

yang subyektif.
Informasi pengalaman masa lampau dikombinasikan dengan pandangan
terhadap permintaan produk mainan anak-anak dalam tahun ini
3.
Bentuk Distribusi Probabilitas

Bentuk distribusi probabilitasnya dapat berbentuk distribusi normal, binomial
maupun bentuk poisson.
Keputusan yang baik adalah memaksimumkan nilai yang yang diharapkan

atau keuntungan yang maksimal atau meminimumkan kerugian.
I.
Pengambilan Keputusan Berdasar Kemungkinan Kerugian

Kemungkinan
kerugian
yang
dimaksud
adalah
perbedaan
antara
kemungkinan diperolehnya keuntungan yang maksimal dengan keuntungan aktual

berdasar pada tindakan yang telah diambil atau keputusan yang telah dipilih.
Kerugian tidak dinyatakan dengan tanda negatif, karena merupakan

perbedaan keuntungan pada tindakan yang terbaik dengan keuntungan yang
diperoleh pada tindakan yang dipilih.
J.
Pengambilan Keputusan Berdasar Nilai yang Diharapkan Dari

Informasi Terbaik
Cara pengambilan keputusan berdasar kemungkinan kerugian yang diharapkan

(expected opportunity loss) dari suatu tindakan yang dirumuskan:
EOL (Ai) = Lij Pj
Dimana,
Pj = probabilitas terjadinya peristiwa J

Lij = kemungkinan kerugian dari tindakan i untuk peristiwa J
Perhitungan harapan kemungkinan kerugian akan menambah informasi dalam

pengambilan keputusan.
Pengambilan keputusan berdasar nilai yang diharapkan dari informasi terbaik

merupakan selisih dari keuntungan yang diharapkan pada kondisi tertentu dikurangi
nilai uang yang diharapkan berdasar tindakan alternatif yang terbaik.
Hal 14 dari 148
Handout Statistik 2
2. DISTRIBUSI TEORITIS
A. Pengertian Distribusi Teoritis
Distribusi teoritis adalah distribusi yang frekuensinya diturunkan secara

matematis. Pada distribusi frekuensi, frekuensinya diperoleh berdasarkan hasil-hasil
percobaan atau hasil observasi.
Perbedaan antara distribusi frekuensi dan distribusi teoritis dapat dijelaskan

dengan contoh berikut:
Sebuah mata uang dilempar sebanyak 100 kali, menurut hasil observasi atau
percobaan akan diperoleh berbagai frekuensi sebagai berikut:
Sisi Gambar (H)
Jumlah Frekuensi
III
IV
59
41
0 (sisi Tulisan)
I
54
II
61
1 (sisi Gambar)
46
39
41
100
100
100
Jumlah
Percobaan
V
62
VI
49
59
38
51
100
100
100
Dari tabel di atas dapat dilihat, bahwa berdasar pada 6 percobaan pelemparan
sebuah mata uang sebanyak 100 kali diperoleh berbagai macam hasil atau frekuensi
yang berbeda satu dengan yang lainnya.
Namun bila kita mengambil kesimpulan dari berbagai percobaan ini akan sampai
pula pada suatu teori bahwa mata uang itu setimbang, artinya probabilitas sisi
gambar atau H dengan sisi tulisan atau T akan sama, yaitu 50% : 50%.
Dengan kata lain, dapat dikatakan bahwa distribusi teoritisnya karena secara teoritis
sisi gambar (H) dan sisi tulisan (T) dari sebuah mata uang logam mempunyai
probabilitas yang sama yaitu 1/2 sehingga hasil pelemparan mata uang sebanyak 100
kali akan menghasilkan tabel berikut:
Jumlah H
0
1
Probabilitas
1/2
1/2
Jumlah
Frekuensi Teoritis
1/2 x 100 = 50
1/2 x 100 = 50
100
Dari tabel di atas dapat dilihat bahwa frekuensi teoritis diperoleh dengan mengalikan
probabilitas dengan jumlah percobaan.
B. Kegunaan Mempelajari Distribusi Teoritis
Dengan mempelajari distribusi teoritisnya, kita dapat mengetahui pola dari

distribusi frekuensinya. Sebagai contoh:
1. Seorang pengusaha penerbit buka perlu mengetahui selera bacaan para
langganannya apakah selerah itu berupa cerita novel, fiksi atau sejarah.
Bab 2: Distribusi Teoritis
Hal 15 dari 148
Handout Statistik 2
Pola ini dapat diketahui dengan pengalaman-pengalaman masa yang lalu.

2. Pengusaha toko sepatu perlu mengetahui pola permintaan dari para konsumen,
bagaimana distribusi dari nomor-nomor sepatu yang diminta para konsumen
3. Pengusaha rumah makan perlu mengetahui pola selera makanan yang digemari
para langganannya
Dengan mengetahui pola permintaan yang didasarkan pada pengalaman di masa
lalu, pengusaha tersebut akan dapat menyesuaikan persediaan barang-barangnya.

Dengan kata lain apabila kita dapat mengetahui distribusi teoritisnya, maka kita
akan mengetahui pola distribusi frekuensinya.
C. Macam dari Distribusi Teoritis
Ada 3 macam dari distribusi teoritis yaitu:
1. Distribusi Binomial (percobaan Bernoulli)

2. Distribusi Poisson
3. Distribusi Normal
1. Distribusi Binomial (percobaan Bernoulli)
Distribusi binomial adalah distribusi probabilitas dari suatu variabel
random yang bersifat diskrit. Distribusi binomial banyak digunakan di dalam

bidang perusahaan, bidang pengetahuan, sosial dan bidang-bidang lain.
Distribusi binomial juga disebut sebagai percobaan atau proses dari
Bernoulli, James Bernoulli adalah ahli matematika Swiss (1654-1705) yang sangat
berjasa bagi perkembangan penggunaan distribusi binomial.
Model dari percobaan Bernoulli mengambil beberapa anggapan, yaitu:
a.
Dalam setiap percobaan selalu dibedakan 2 unsur yaitu

peristiwa yang bersifat saling meniadakan (mutually exclusive)
Suatu ruang sampel selalu akan mengandung 2 unsur yaitu peristiwa sukses dan
peristiwa gagal.
b.
Probabilitas peristiwa sukses yang dirumuskan dengan

p dari suatu percobaan yang satu ke percobaan yang lain bersifat tetap.
Probabilitas peristiwa gagal dirumuskan dengan q atau (1-p)
c.
Masing-masing percobaan merupakan peristiwa yang

bersifat independen, artinya peristiwa yang satu tidak mempengaruhi peristiwa
yang lain.
Hal 16 dari 148
Handout Statistik 2
2. Distribusi Poisson
Distribusi Poisson ditemukan oleh seorang ahli matematika dari Perancis
bernama SD Poisson (1781-1840) yang dapat dipergunakan untuk menghitung

distribusi binomial apabila n sangat besar dan p kecil n besar apabila lebih dari 50
dan p kecil apabila kurang dari 0,10.
Distribusi ini merupakan limit dari distribusi binomial dan sangat luas
penggunaannya, misalnya di dalam industri untuk pengendalian mutu (quality

control), untuk memperkirakan banyaknya barang cacat, di dalam asuransi untuk
memperkirakan banyaknya kecelakaan, di dalam persoalan waktu menunggu
(waiting time) untuk menghitung banyaknya percakapan telpon atau datangnya
langganan atau di dalam pemasaran untuk memperkirakan jumlah pembaca iklan
yang membeli barang yang diiklankan.
Sifat-sifat dari suatu peristiwa yang menunjukkan distribusi probabilitas
dari Poisson guna menunjukkan suatu peristiwa yang merupakan suatu distribusi
Poisson dapat diambil contoh pada peristiwa datangnya kendaraan yang melewati
pintu gerbang pada jalan raya tol.
Dari peristiwa ini dapat diamati sebagai berikut:
1.
Rata-rata kedatangan kendaraan pada setiap jam dapat

dihitung berdasarkan pada data masa lampau
2.
Jika kita mengamati setiap periode dalam jarak setiap menit,

kita akan menjumpai sifat-sifat:
probabilitas kedatangan kendaraan untuk setiap menit sangat kecil dan

mempunyai nilai yang tetap (konstan)
probabilitas kedatangan 2 kendaraan atau lebih di dalam periode itu

(setiap menit) adalah sangat kecil dan dapat dikatakan mendekati 0 (nol)
peristiwa kedatangan kendaraan pada setiap menit merupakan peristiwa

yang independen
Apabila suatu peristiwa memenuhi persyaratan di atas, maka kita akan dapat
mengatakan bahwa peristiwa tersebut mempunyai sifat distribusi Poisson.
Distribusi Poisson adalah merupakan suatu distribusi dari variabel random yang
bersifat diskrit. Probabilitas dari peristiwa random yang bersifat diskrit dinyatakan
dengan x yang mempunyai nilai 0, 1, 2, dan seterusnya.
3. Distribusi Normal atau Kurva Normal
Distribusi normal adalah distribusi probabilitas yang bersifat kontinyu.

Karena distribusi normal merupakan distribusi probabilitas yang bersifat kontinyu
cukup penting, banyak para ahli matematika berusaha untuk mengembangkannya,
diantaranya adalah Karl Gauss, seorang ahli matematika dan astronomi pada abad
Hal 17 dari 148
Handout Statistik 2
ke-18, sehingga diberi penghargaan kepadanya distribusi normal disebut juga

Distribusi Gauss.
Ada 2 pertimbangan pokok sehingga distribusi normal mempunyai
peranan penting dalam statistik, yaitu:

a.
Beberapa hal yang dimiliki distribusi normal memungkinkan

distribusi ini dapat dipergunakan untuk berbagai analisa dengan cara penarikan
kesimpulan berdasar sampel yang diambil
b.
Distribusi normal sangat mendekati untuk menggambarkan

frekuensi yang diperoleh dari hasil observasi pada berbagai bidang baik yang
bersifat human seperti tinggi, berat, tingkat kecerdasan, hasil dari kegiatan yagn
bersifat fisik seperti produksi maupun ukuran-ukuran lain yang penting guna
keperluan manajemen baik di bidang sosial maupun ilmu pengetahuan alam.
Distribusi normal atau kurva normal adalah suatu distribusi yang
simetris dan berbentuk lonceng/genta yang menunjukkan hubungan antara

ordinat pada mean dengan berbagai ordinat pada berbagai jarak sigma ( ) yang
diukur dari mean.
Sifat-sifat dari distribusi normal adalah sebagai berikut:
a.
bentuk dari distribusi normal menyerupai lonceng dengan

sebuah puncak (unimodal)
b.
nilai rata-rata (mean) pada distribusi normal akan terletak di

tengah-tengah dari kurva normal
c.
bentuk distribusi normal adalah simetris, oleh sebab itu nilai

mean = median = modus
d.
ujung masing-masing sisi kurva akan sejajar dengan sumbu

horisontal dan tidak akan memotong sumbu horisontal itu
e.
sebagian besar dari data ada di tengah dan sebagian kecil dari
data ada pada masing-masing sisi/tepi
Hal 18 dari 148
Handout Statistik 2
68% dari data akan berada dalam jarak 1 standar deviasi, 95%
f.
dari data akan berada dalam jarak 2 standar deviasi dan 99% dari data berada
dalam jarak 3 standar deviasi.
Untuk mengetahui suatu distribusi apakah bersifat normal atau tidak
dapat dilakukan hal-hal sebagai berikut:

a.
kita gambarkan frekuensinya dalam bentuk kurva frekuensi dan

kita lihat apakah bentuk normal atau tidak
b.
kita bandingkan nilai mean, median dan modusnya apakah

ketiga nilai ini sama atau tidak, apabila sama maka distribusi itu berbentuk
normal
kita lihat apakah 68% dari data berada dalam jarak 1 standar
c.
deviasi (1 sigma), 95% dari data akan berada dalam jarak 2 standar deviasi (2
sigma) dan sebagainya
d.
kita gambarkan frekuensi kumulatifnya pada kertas logaritma

atau kertas probabilitas, apabila membentuk garis lurus maka distribusi itu
merupakan distribusi normal.
e.
Kita mengadakan test of goodness of fit.
Persamaan dari ordinat kurva normal dirumuskan sebagai berikut:
1
Y0
e
2
1 / 2 x 2
Y0 = ordinat pada mean atau ordinat maksimum
= deviasi standar
x
= nilai data
= 3,14159
e
= 2,71828
= rata-rata
Berdasarkan rumus di atas maka pada Y0 nilai x
= mean, sehingga e0 = 1.
Selanjutnya untuk menghitung ordinat yang maksimum masih harus dikalikan

dengan NCj, dimana N = jumlah frekuensi dan Cj = interval kelas.
Sehingga ordinat maksimum menjadi:
Y0 0,39894
NC i
Hal 19 dari 148
Handout Statistik 2
Selanjutnya untuk masing-masing nilai ordinat dapat dihitung dengan mengalikan

hasil dari rumus di atas dengan tabel ordinatnya (lihat lampiran)
Contoh:
Dari distribusi frekuensi penghasilan 50 karyawan perusahaan tahun 2005 (dalam
ribuan rupiah) diperoleh data sebagai berikut:
Nilai rata-rata (mean)
= 65,1
N atau jumlah frekuensi
= 50
Ci
= 10
Deviasi standar ()
= 16,78
Y0
= 11,9
= 0, 39894 x 500/16,78
Untuk nilai ordinat yang lain dapat dihitung berdasarkan nilai tabel ordinat dengan
dikalikan ordinat maksimum (11,9).
Besarnya nilai rata-rata dan deviasi standar tidak akan mempengaruhi
distribusi probabilitas yang berbentuk normal, karena seluruh jumlah daerah kurva
normal = 1, maka daerah kurva normal dapat menunjukkan probabilitas.
Secara matematis dapat dikatakan bahwa:
68% dari seluruh nilai data terletak dalam jarak 1 deviasi
a.
standar yang diukur dari mean

95% dari seluruh nilai data terletak dalam jarak 2 deviasi
b.

Hal 20 dari 148
Handout Statistik 2
99,7% dari seluruh nilai data terletak dalam jarak 3 deviasi
c.
Dapat ditunjukkan dengan gambar berikut:
Bentuk suatu kurva akan ditentukan oleh mean dan deviasi standarnya.
Oleh sebab itu, akan dijumpai berbagai macam tipe bentuk kurva. Menyusun suatu
tabel kurva akan menjadi sulit, karena nilai mean dan standar deviasi yang berbedabeda, sehingga untuk menyusun tabel kurva normal perlu adanya anggapananggapan bahwa untuk mean = 0 dan deviasi standar = 1.
Kurva normal standar dapat dilihat sebagai berikut:
Hal 21 dari 148
Handout Statistik 2
Segala bentuk kurva dengan mean dan deviasi yang berbeda selalu dapat
dikonversikan ke dalam bentuk kurva standar dengan mengubah skala x menjadi z

dengan rumus:
z
= jarak deviasi x terhadap nilai rata-rata
= variabel x
= mean
= deviasi standar
Contoh: Suatu distribusi normal dengan rata-rata = 50 dan deviasi standar = 25. Hal
ini dapat digambarkan sebagai berikut:
Hal 22 dari 148
Handout Statistik 2
Berdasarkan gambar di atas, maka konversi skala x menjadi skala z adalah sebagai
berikut:
a.
x = 25
z
25 50 25
1
25
25
b.
x=0
z
0 50 50
2
25
25
c.
x = 75
z
75 50 25
1
25
25
Disebelah kiri nilai rata-rata, nilai z adalah negatif, sedangkan untuk nilai z yang
terletak di sebelah kanan nilai rata-rata z adalah positif.
Karena bentuk kurva normal adalah simetris, maka tabel untuk nilai z
yang negatif sama dengan z yang positif. Tabel z = -1 sama dengan tabel z= +1 (lihat
lampiran).
Selanjutnya penggunaan daerah kurva normal dapat dijelaskan berbagai
kasus berikut:
a.
Menghitung daerah kurva normal antara z =

0 dan z = +1,25
Menurut tabel daerah kurva normal z = +1,25 adalah 0,3944. Apabila seluruh
daerah kurva normal dinyatakan 100% maka luas daerah kurva normal antara z
= 0 dan z = +1,25 adalah seluas = 39,44%.
b.
Menghitung
luas
daerah
kurva
normal
antara z = 0 dan z = -1,25.
Hal 23 dari 148
Handout Statistik 2
Sebagaimana telah dijelaskan bahwa kurva normal simetris bentuknya, maka

tabel z = 1,25 berlaku untuk nilai z positif dan negatif, sehingga z = -1,25 tabel z =
0,3944. Luas daerah kurva normal antara z = 0 dan z = -1,25 seluas 39,44%
c.
Menghitung
luas
daerah
kurva
normal
sebelah kanan z = +0,35

Menurut tabel daerah kurva normal z = +0,35 adalah 0,1368. Nilai ini
merupakan luas daerah kurva normal di sebalah kiri z = 0,35 sampai z = 0. Jadi
luas daerah kurva normal sebelah kanan z = 0,50 0,1368 = 0,3632 atay 36,32%.
d.
Menghitung luas daerah kurva normal sebelah kiri

z = +0,35
Menurut tabel daerah normal z = 0,35 adalah 0,1368. Luas daerah kurva normal
di sebelah kiri z=0,35 adalah 0,50 + 0,1368 = 0,6368 atau 63,68%.
Hal 24 dari 148
Handout Statistik 2
e.
Menghitung luas daerah kurva normal sebelah

kanan z = -1,45.
Tabel daerah kurva normal untuk z = -1,45 adalah 0,4265.
Luas daerah kurva normal di sebelah kanan z = -1,45 menjadi 0,50 + 0,4265 =
0,9265 atau 92,65%.
f.
Menghitung
luas
daerah
kurva
normal
antara z = 0,73 dan z = 1,64 (antara 2 nilai z yang positif).

Tabel daerah kurva normal untuk:
z = 1,64 adalah 0,4495
z = 0,73 adalah 0,2673
Selisihnya adalah 0,1822 atau 18,22% merupakan luas daerah kurva normal
antara z = 0,73 dan z = 1,64
g.
Menghitung
luas
daerah
kurva
normal
antara z = -0,50 dan z = +0,75 (antara z yang negatif dan z yang

positif)
Tabel daerah normal untuk:
z = -0,50 adalah 0,1915
z = +0,75 adalah 0,2734
Dijumlahkan merupakan luas daerah kurva normal antara z = -0,50 dan z =
+0,75 yakni 0,1915 + 0,2734 = 0,4649 atau 46,49%.
Hal 25 dari 148
Handout Statistik 2
h.
Menghitung nilai daerah di sebelah kanan nilai z

diketahui = 10%.
Daerah di sebelah kiri z = 0,50 0,10 = 0,40. Tabel z untuk nilai 0,4000 tidak
ada, dan nilai yang mendekati adalah 0,3997 untuk z=1,28. Jadi nilai z yang
dicari adalah z = 1,28
i.
Menghitung luas daerah kurva normal antara x 1 =

17,4 dan x2 = 58,8 apabila diketahui mean = 24 dan deviasi standar = 12
Sebelum kita menghitung luas daerah kurva normal, kita harus mengkonversikan
skala x menjadi skala z.
z1
17,4 24
0,55
12
z2
58,8 24
2,90
12
Tabel daerah kurva normal untuk:

z1 = -0,55 adalah 0,2088
z2 = +2,90 adalah 0,4981
Dijumlahkan menjadi 0,7069 atau 70,69%.
Hal 26 dari 148
Handout Statistik 2
Contoh soal:
a.
Perusahaan minuman teh botol setiap hari mengirim hasil

produksinya dengan kereta api ke luar kota. Rata-rata berat botol yang dikirim
adlaah 0,397 kg dan deviasi standar adalah 0,005kg. Apabila distribusi ukuran
berat ini merupakan distribusi normal, berapa persen teh botol yang dikirim
dengan kereta api akan mempunyai berat 0,400 kg ke atas?
Pertanyaan dalam soal ini dapat dijawab dengan menghitung luas daerah kurva
normal di sebelah kanan x = 0,400 kg.
Konversi skala x menjadi skala z adalah:
z
0,400 0,397
0,60
0,005
Tabel daerah kurva normal untuk z = 0,60 adalah 0,2257. Sehingga luasnya
menjadi 0,500 0,2257 = 0,2743 atau 27,43%.
b.
Keuntungan yang diperoleh oleh pedagang kaki lima yang menjual

makanan di malam hari rata-rata 68% dengan deviasi standar 8,2%. Apabila data
keuntungan ini merupakan distribusi normal, di bawah berapa persen
keuntungan yang diperoleh 10% dari pedagang kaki lima yang memperoleh
keuntungan terendah?
Di dalam soal ini diketahui bahwa 10% memperoleh keuntungan yang terendah.
Jadi luas daerah kurva normal di sebelah kanan nilai z =0,5000 0,1000 =
0,4000.
Hal 27 dari 148
Handout Statistik 2
Dari tabel z daerah kurva normal yang mendekati nilai ini adalah 0,3997 untuk z
= 1,28
1,28
x 68%
8,2%
x 68% 10,5% 57,5%
Jadi keuntungan yang diperoleh 10% pedagang kaki lima yang terendah ada di
bawah 57,5%.
Hal 28 dari 148
Handout Statistik 2
3. METODE SAMPLING
Dalam kehidupan sehari-hari sampel mempunyai peranan yang penting, hampir

semua pengetahuan, sikap dan tindakan seseorang selalu berdasarkan kepada
sampel. Seorang yang mengadakan perjalanan ataupun kunjungan ke suatu tempat
selama 1 minggu akan dapat bercerita banyak tentang daerah yang dikunjunginya
baik mengenai penduduknya, produksi daerah itu, kebudayaannya, hanya
berdasarkan pada apa yang dilihat selama 1 minggu. Seseorang yang akan membeli 1
kg mangga, akan mencoba untuk mengetahui manis tidaknya mangga yang akan
dibeli dengan mengambil sampel untuk dicicipinya.
Karena keterbatasan yang dimiliki menyebabkan peranan sampel menjadi sangat

penting. Yang menjadi permasalahan adalah bagaimana cara memilih sampel yang
baik.
A. Populasi dan Sampel (N dan n)
Populasi atau universe diberi definisi sebagai keseluruhan dari obyek yang
akan diteliti. Populasi di sini bukan dalam arti penduduk, karena obyek penelitian
dapat bermacam-macam misalkan, upah, produksi dan sebagainya.
Sedangkan sampel diberi definisi sebagai bagian dari populasi. Misalkan:

sebagian dari produksi bola lampu, sebagian dari produksi ban dan sebagainya.
B. Alasan-alasan Digunakannya Sampel

1.
Di dalam hal kita menghadapi obyek yang mudah rusak, seperti bola
lampu, ban kendaraan dan sebagainya, maka penelitian terhadap seluruh obyek
tidak mungkin dilakukan.
2.
Di dalam penelitian apabila kita menghadapi suatu obyek penelitian

yang bersifat homogen atau 100% sama maka kita tidak perlu mengadakan
penelitian terhadap seluruh obyek atau populasi, melainkan cukup dilakukan
terhadap sampel. Obyek yang bersifat homogen, misalkan: kadar garam pada air
laut.
3.
Penggunaan metode sampel dapat menghemat biaya. Penelitian

terhadap seluruh obyek yang dikenal dengan metode sensus memerlukan biaya yang
sangat besar baik berupa biaya persiapan, biaya pengumpulan data, biaya
pengolahan data dan sebagainya.
4.
Penelitian
yang
menggunakan
metode
sampel
dapat
cepat
diselesaikan. Dengan metode sampel kita hanya mengadakan penelitian terhadap

sebagian obyek, maka pengumpulan data, pengolahan data akan dapat menghemat
waktu.
5.
Penggunaan metode sampel akan dapat memperluas lingkup

informasi yang diperolehnya. Pada metode sensus kita tidak akan dapat memperoleh
informasi secara rinci. Sedang pada metode sampel dapat karena dimungkinkannya
Bab 3: Metode Sampling
Hal 28 dari 148
Handout Statistik 2
penggunaan personal yang ahli dan peralatan canggih maka hasil sampel dapat
diharapkan lebih terinci sehingga kita akan memperoleh pengetahuan yang lengkap
tentang sesuatu yang kita teliti.
6.
Penggunaan metode sampel memungkinkan dipergunakannya

persoal ahli dan terlatih sehingga hasil sampel diharapkan akan lebih tinggi
ketepatan hasilnya.
7.
Dengan berkembangnya teknik metode pengambilan sampel dan

perhitungan sampel maka hasil-hasil sampel dapat menggambarkan hasil
populasinya.
C. Pengertian Statistik dan Parameter
Secara matematis kita dapat mengukur suatu sampel dan populasi seperti,
mean, median, modus dan sebagainya.
Meskipun ukuran-ukuran ini mempunyai makna yang sama, namun di dalam

statistik dibedakan dengan penggunaan simbol-simbol yang berbeda.
Ukuran-ukuran sampel disebut dengan istilah statistik, sedang ukuranukuran untuk populasi disebut parameter.
Contoh:
Rata-rata usia mahasiswa di suatu perguruan tinggi adalah 22 tahun merupakan
parameter. Sedang apabila kita mengatakan rata-rata usia 5 orang mahasiswa suatu
perguruan tinggi 22 tahun maka rata-rata ini disebut statistik.
Perbedaan statistik dan parameter dapat dilihat pada tabel berikut:

Sampel
Statistik
1. Mean = x
2. Deviasi standar = s
3. Proporsi = x/n
4. Jumlah data = n
5. Koefisien korelasi = r
Populasi
Parameter
1. Mean =
2. Deviasi standar =
3. Proporsi = P
4. Jumlah data = N
5. Koefisien korelasi = R
D. Tahap-Tahap Dasar Dalam Penggunaan Metode Sampel
Penggunaan
metode
sampel
dalam
suatu
penelitian
kadang-kadang
menimbulkan masalah yang kompleks, karena berkaitan dengan
sifat dari
populasinya.
Suatu contoh betapa sulitnya memilih sampel dari suatu penduduk yang
bertempat tinggal terpencil dan sulit komunikasinya. Oleh karena adanya masalahmasalah yang komplek ini, maka perlu adanya suatu perencanaan baik dalam
persiapan maupun dalam pelaksanaannya secara terinci.
Hal 29 dari 148
Handout Statistik 2
Tahap-tahap dalam penelitian yang menggunakan metode sampel adalah
sebagai berikut:
1.
Menentukan Tujuan Penelitian

Suatu tujuan penelitian perlu dirumuskan dengan jelas, karena tujuan ini sangat
erat hubungannya dengan data yang perlu dikumpulkan sehingga masalahmasalah yang komplek dapat disederhanakan
2.
Perumusan Masalah
Sebagaimana telah dijelaskan bahwa populasi merupakan keseluruhan obyek
yang diteliti. Masalah populasi tidak timbul apabila keseluruhan obyek tersebut
telah tegas dirumuskan, misalkan bola lampu yang akan diteliti daya tahan ratarata yang dimiliki. Sebaliknya apabila obyek penelitian itu tidak tegas
dirumuskan, maka masalah populasi ini akan timbul.
Contoh:
Populasi pengusaha, pengertian pengusaha perlu dirumuskan dengan jelas,
misalkan pengusaha golongan ekonomi lemah.
Perumusan populasi yang tegas sangat diperlukan karena populasi yang akan
dipilih sebagian sebagai sampel ini harus sesuai dengan informasi yang kita cari.
Di samping itu penegasan terhadap populasi ini juga diperlukan apabila kita
ingin membandingkan dengan populasi yang lain, sehingga kesimpulan yang kita
kehendaki dapat sesuai dengan tujuan penelitian yang telah dirumuskan.
3.
Menentukan Jenis Data Yang Akan Dikumpulkan

Jenis data yang akan dikumpulkan perlu ditegaskan agar jangan sampai terjadi
pengumpulan data yang kurang relevan. Di lain pihak, data yang penting justru
tidak lengkap.
4.
Penentuan Metode Pengukuran

Apabila jenis data yang akan dikumpulkan telah ditegaskan, maka perlu
penentuan metode pengukuran yang akan dipergunakan
Contoh:
Data tentang kekayaan seseorang dapat diperoleh dari jawaban responden atau
catatan penghasilan. Kedua jenis data ini berbeda, sehingga perlu ditegaskan
data mana yang akan dipergunakan.
5.
Pemilihan Unit Sampling

Sebelum kita memilih sampel suatu populasi kita perlu membagi lebih dahulu
unsur-unsur populasi yang disebut unit sampling atay unit. Unit sampling ini
Hal 30 dari 148
Handout Statistik 2
perlu ditegaskan dan jangan sampai tumpang tindih karena unsur populasi tidak
boleh dipilih sebagai sampel sampai 2 atau 3 kali.
Contoh:
Populasi bola lampu. Unit sampling di sini adalah bola lampu (tegas
dirumuskan), sehingga tidak ada kemungkinan unit sampling terpilih lebih dari
sekali sebagai sampel.
Penelitian terhadap pedagang kaki lima, unit samplingnya adalah seorang
pedagang kaki lima.
6.
Pemilihan Sampel
Dewasa ini kita memiliki bermacam-macam metode pengambilan sampel. Suatu
hal yang penting adalah menentukan besarnya sampel yang selalu dikaitkan
dengan biaya penelitian
7.
Mengorganisir Petugas Lapang atau Pencacah

Suatu penelitian sangat memerlukan dukungan administrasi yang memadai,
antara lain petugas lapangan atau pengumpul data perlu disiapkan dengan baik.
Pengumpul data perlu dilatih lebih dahulu, sehingga tujuan pengumpulan data
akan tercapai, misalnya pemahaman terhadap pertanyaan-pertanyaan yang akan
ditanyakan terhadap responden, cara pencacahan, cara pengecekan dan
sebagainya.
8.
Penyusunan dan Analisa Data

Di dalam penyusunan data langkah pertama adalah mengedit daftar pertanyaan
untuk mencari kesalahan-kesalahan. Setelah diedit selanjutnya disusun dan
dianalisa.
Informasi-informasi
yang
lengkap
tentang
populasi
memberi
keuntungan terhadap sampel yang akan dipergunakan untuk pendugaan

terhadap populasi. Di samping itu informasi yang lengkap dapat pula
dipergunakan untuk kebutuhan penelitian di masa mendatang.
E. Peranan Teori Sampel
Tujuan dari teori sampling adalah membuat metode sampling menjadi lebih
efisien. Teori sampling mengembangkan cara pemilihan sampel serta perhitungan
sampel sebagai dasar pendugaan terhadap populasi yang setepat mungkin dengan
biaya yang serendah-rendahnya.
Agar suatu prosedur pengambilan sampel dan perhitungan sampel dapat tepat,
maka diperlukan pengetahuan terhadap populasinya. Suatu cara yang ditempuh
untuk penyederhanaan adalah kita selalu menganggap bahwa sampel itu mempunyai
distribusi yang normal.
Hal 31 dari 148
Handout Statistik 2
Teori sampling dahulu berkembang atas dasar populasi yang tidak terbatas,
selanjutnya berkembang pada pengertian populasi yagn terbatas. Secara umum di

dalam teori sampling dikatakan bahwa semakin besar sampel yang diambil maka
semakin banyak informasi yang diperoleh.
Masalah populasi yang tidak terbatas dan yang terbatas selanjutnya menjadi
tidak penting karena pengertian sampel merupakan bagian yang kecil dari suatu
populasi.
F. Metode Sampling
Pada dasarnya ada 2 macam metode guna pemilihan/pengambilan sampel,
yakni:
1.
Random atau Probabilitas sampel

Pada random atau probabilitas sampel ini semua unsur populasi mempunyai
kesempatan yang sama untuk dipilih sebagai sampel
2.
Non-Random atau Judgement Sampel

Pada judgement sampel pendapat dan pengetahuan seseorang akan menjadi
dasar dalam pemilihan unsur populasi untuk dipilih sebagai sampel.
Unsur subyektifitas sangat berperan di dalam memilih sampel
Metode random atau probabilitas sampel memungkinkan setiap unsur populasi
memiliki kesempatan atau kans (chance) yang sama untuk dipilih sebagai sampel,
sehingga dapat diharapkan hasil sampel ini obyektif.
Ada 5 macam metode random atau probabilitas sampel yaitu:
1. Simple Random Sample

2. Stratified Sampling
3. Cluster Sampling
4. Systematic Sampling
5. Multistage Sampling
1.
Simply Random Sample
Suatu sampel dikatakan random apabila setiap unsur dari populasi

mempunyai kesempatan yang sama untuk dipilih sebagai sampel.
Contoh: suatu populasi yang terbatas terdiri dari 4 orang karyawan

(N=4). Dari 4 orang karyawan ini akan dipilih sampel 2 orang (n=2) guna
keperluan wawancara. Berdasarkan pada rumus kombinasi, maka akan diperoleh
kemungkinan sebanyak:
4
4!
4 3 2 1
6
2! 4 2 ! 2 1 2 1
Hal 32 dari 148
Handout Statistik 2
Tabel berikut menunjukkan keenam kemungkinan tersebut:
Populasi (N)
A
B
C
D
Kemungkinan Sampel (n)

AB
AC
AD
BC
BD
CD
Probabilitas (P)
Probabilitas marginal merupakan
perjumlahan dari joint
probabilitas yang mengandung
peristiwa tersebut
P(A) = P(AB) + P(AC) + P(AD)
= 1/6 + 1/6 + 1/6 = 3/6
= 1/2
Tabel di atas menunjukkan pengambilan sampel dari populasi yang
terbatas. Populasi yang tidak terbatas adalah populasi yang unsur-unsurnya

secara teoritis tidak mungkin diteliti dalam jangka waktu tertentu.
Proses pengambilan sampel yang random adalah sebagai berikut:
a.
Metode Undian
Dalam contoh dimuka karyawan sebanyak 4 (N=4). Apabila kita ingin
mengambil sampel sebesar 2 (n=2) maka proses pemilihannya mudah
dilakukan dengan cara mengundi, yaitu masing-masing unsur populasi diberi
nomor 1 sampai 4, selanjutnya diundi untuk dipilih 2 sebagai sampel. Hasil
undian ini merupakan sampel yang terpilih.
Metode ini mudah dilakukan pada populasi yang jumlahnya sedikit. Apabila
unsur populasinya banyak atau besar, maka cara undian ini menjadi tidak
praktis.
Sehingga ditempuh dengan cara kedua, yaitu dengan menggunakan tabel
random.
b.
Metode dengan Tabel Random

Tabel berikut merupakan sebagian dari tabel random yang terdiri dari 10
angka. Angka-angka yang tidak teratur ini mengandung unsur angka dari 0
sampai 9.
Hal 33 dari 148
Handout Statistik 2
Cara menggunakan tabel di atas adalah sebagai berikut. Misalkan dari

populasi sebanyak 100 orang karyawan suatu perusahaan akan dipilih
sebanyak 10 orang sebagai sampel. Proses pengambilan random sampel
dengan tabel random dilakukan sebagai berikut:
-
unsur-unsur populasi mula-mula diberi nomor dari nomor 1 sampai

dengan nomor 100
Penggunaan tabel random dengan 2 angka sebelah kiri

Apabila kita mulai angka pertama, maka yang akan terpilih sebagai
sampel 1 adalah unsur populasi nomor 15.
Sampel 1
unsur populasi nomor 15
Sampel 2
Sampel 3
Sampel 4
Sampel 5
unsur populasi nomor 72 (nomor 00 dilewati)
Sampel 6
Sampel 7
Sampel 8
Sampel 9
Sampel 10
unsur populasi nomor 96 (nomor 41 dilewati karena telah

terpilih sebagai sampel nomor 3, masing-masing unsur
populasi hanya sekali dipilih sebagai sampel)
Hal 34 dari 148
Handout Statistik 2
Apabila sampel belum terpenuhi, sedang tabel telah habis sampai di

bawah dapat dilanjutkan dendan kolom berikutnya pada baris pertama.
2.
Stratified Sampling
Apabila unsur-unsur populasi tidak homogen atau heterogen,
maka proses pengambilan sampel dengan menggunakan random sampel akan

menimbulkan bias, karena masing-masing unsur populasi ini tidak mempunyai
kesempatan/kans atau probabilitas yang sama.
Guna mengurangi pengaruh faktor heterogen ini dapat
dilakukan pembagian unsur-unsur populasi dalam kelompok-kelompok kecil

(subkelompok) yang disebut strata.
Selanjutnya dari masing-masing strata ini dipilih sampelnya
secara random sesuatu dengan proporsinya. Oleh sebab itu, stratified sampling
disebut stratified random sampling.
Contoh: Suatu populasi terdiri dari 1000 orang pedagang kaki
lima dengan komposisi menurut jenis barang yang dijual:

Jenis Usaha
Strata I Makanan
II Minuman
III Kerajinan
IV Rokok
Jumlah pedagang
200
100
400
300
Apabila kita akan mengambil sampel sebanyak 20 pedagang, maka masingmasing strata akan diambil sampelnya secara proporsional:
Strata I = 200/1000 x 20
= 4 pedagang
Strata II = 100/1000 x 20
= 2 pedagang
Strata III= 400/1000 x 20
= 8 pedagang
Strata IV = 300/1000 x 20
= 6 pedagang
Jumlah seluruh sampel = 20 pedagang kaki lima

Selanjutnya proses pemilihan sampel pada masing-masing
strata dilakukan secara random.

3.
Cluster Sampling
Pada cluster sampling unsur-unsur populasi dibagi dalam
subkelompok yang disebut cluster (kelompok)

Pembagian unsur-unsur populasi ke dalam cluster ini dapat
dilakukan dengan menggunakan dasar wilayah administrasi pemerintahan,

batas-batas alam seperti sungai, gunung maupun jalan.
Hal 35 dari 148
Handout Statistik 2
Selanjutnya setelah kita membagi unsur-unsur populasi ke
dalam cluster, maka dari beberapa cluster ini dipilih salah satu cluster dengan
random. Dari cluster yang terpilih ini baru dipilih sampelnya secara random
pula.
Perbedaan dengan stratified sampling adalah terletak pada
pengambilan sampelnya. Pada stratified sampling, sampel dipilih dari seluruh

strata, sedang pada cluster sampling, sampel hanya dipilih dari salah satu cluster
saja. Karena masing-masing cluster ini mempunyai sifat homogen, sehingga
tidak perlu seluruh cluster diambil sampelnya.
4.
Systematic Sampling
Pada systematic sampling, unsur-unsur populasi dipilih dengan jarak interval

yang sama. Sebelum kita memilih sampel secara sistematis kita memilih titik
awal secara random, selanjutnya dipilih sampelnya pada setiap jarak interval
tertentu, misalkan setiap jarak kesepuluh.
Apabila titik awalnya nomor 6, selanjutnya adalah nomor 16, 26, 36 dan
seterusnya.
Perbedaan antara systematic sampling dengan simple random sampling

adalah bahwa pada systematic sampling, unsur-unsur populasi itu tidak
mempunyai kesempatan yang sama setelah ditentukan jarak interval dan titik
awal untuk memilih sampel.
Keuntungan dari systematic sampling adalah proses pemilihan sampel dapat

lebih cepat dilakukan, sedang di lain pihak dapat pula menghemat biaya.
5.
Multistage Sampling
Biasanya sampel dipilih dengan cara satu kali, sebelum proses pengumpulan
data dilakukan. Cara ini mempunyai kelemahan apabila sampel tersebut
ditentukan terlampau kecil. Oleh karena itu apabila kita akan menggunakan
sampel yang kecil, maka sebaiknya sampel tersebut dipilih secara bertahap
sampai pada keadaan di mana dipandang telah cukup untuk mengambil suatu
kesimpulan. Proses demikian disebut Multistage Sampling.
Contoh: suatu perusahaan minuman dalam kaleng ingin mengadakan

pengendalian terhadap proses produksinya dengan menetapkan persyaratan
jumlah minimal produk yang rusak. Apabila ternyata proses produksi mengalami
jumlah kerusakan produk yang melebihi batas toleransi, maka proses produksi
itu perlu diperbaiki.
Hal 36 dari 148
Hasil
YANG
MEMERL
UKAN
DANA
Handout Statistik 2
Tabel berikut menunjukkan proses pengambilan sampel secara bertingkat:

Sampel
I
II
III
IV
V
VI
VII
Besarnya
Sampel
Besar Sampel
20
20
20
20
20
20
20
20
40
60
80
100
120
140
Kombinasi Sampel
Jumlah Yang
Jumlah yang
Diterima
1
2
3
4
5
6
ditolak
3
4
5
6
7
8
8
Sampel I sebesar 20 unit kita perbaiki proses produksi jika jumlah produk yang
rusak 3 unit atau lebih dan kita teruskan jika jumlah yang rusak kurang dari 3.
Sampel II kalau diperlukan dengan 20 unit sebagai sampel dengan syarat proses
produksi diteruskan kalau produk yang rusak 1 unit dan diperbaiki kalau unit
produk yang rusak 4 atau lebih, proses ini diteruskan kalau masih dipandang
belum cukup.
Proses ini dipandang cukup apabila jumlah yang diterima dan ditolak sama.
Hal 37 dari 148
Handout Statistik 2
4. PENDUGAAN SECARA STATISTIK

Banyak alasan mengapa kita mengadakan pendugaan terhadap ukuran populasi
atas dasar ukuran sampel, antara lain dilihat dari sudut pertimbangan biaya, serta
keterbatasan waktu untuk mengadakan perhitungan terhadap seluruh populasi.
Beberapa contoh sebagai berikut:
a. Seorang manajer produksi ingin mengetahui apakah proses produksi yang baru
memang lebih baik daripada proses produksi yang lama dengan cara
mengadakan pengamatan terhadap sampel hasil produksi
b. Seorang manajer pemasaran ingin mengetahui kemampuan masyarakat untuk
membeli barang yang ditawarkan dengan mengadakan pengamatan terhadap
tingkat penghasilan masyarakat secara sampel
Kebutuhan akan informasi-informasi di atas tidak mudah dipenuhi tanpa
digunakannya metode sampel yang selanjutnya dapat dipergunakan untuk

mengadakan pendugaan terhadap parameter. Sehingga diperlukan pendugaan secara
statistik.
A. Macam Metode Pendugaan Secara Statistik
Metode pendugaan secara statistik pada hakekatnya dapat dibedakan menjadi 2
macam, yaitu:
1.
Pendugaan atas dasar nilai tunggal atau point estimation
2.
Pendugaan interval atau interval estimation
1.
Pendugaan Tunggal atau Pendugaan atas nilai tunggal
Adalah pendugaan nilai populasi atas dasar satu nilai dari sampel.
Contoh:
Rata-rata sampel ( x ) = Rp. 100.000 maka kita akan menduga nilai rata-rata
populasi () = Rp. 100.000.
Proporsi sampel (x/n) = 0,60 maka proporsi populasi (P) akan kita duga sebesar
0,60 pula
Cara pendugaan atas dasar satu nilai ini sangat sederhana, namun nilai
penduga yang demikian sukar sekali dapat identik dengan parameter yang kita
duga.
Apabila nilai penduga dapat identik dengan parameternya, hal ini

kemungkinan besar disebabkan oleh faktor kebetulan saja.
Cara
pendugaan
yang
didasarkan
pada
satu
nilai
ini,
tidak
memungkinkan kita untuk mengukur derajat kepercayaan kita terhadap

ketelitian pendugaan yang telah kita lakukan.
Bab 4: Pendugaan Secara Statistik
Hal 38 dari 148
Handout Statistik 2
2.
Pendugaan interval
Adalah suatu pendugaan terhadap parameter berdasarkan suatu interval, di

dalam interval mana kita harapkan dengan keyakinan tertentu parameter itu
akan terletak.
Hasil dari pendugaan interval ini diharapkan akan lebih obyektif. Pendugaan
interval akan memberikan kita nilai parameter dalam suatu interval dan bukan
nilai tunggal.
Pendugaan interval ini akan merupakan interval keyakinan atau interval

kepercayaan atau confidence limit/interval dan dapat dirumuskan secara umum
sebagai berikut:
st z /2 . st < parameter < st + z /2 . st
dimana:
st
= pendugaan atau statistik sampel
st
= deviasi standar untuk sampel
z. /2 = koefisien yang sesuai dengan interval keyakinan yang dipergunakan

dalam pendugaan interval dan nilainya diberikan dalam Tabel Luas
daerah Kurva Normal (Lampiran)
Misalkan dalam pendugaan interval, kita pergunakan interval keyakinan sebesar

95%. Hal tersebut berarti bahwa dalam jangka panjang, jika pendugaan itu
dilakukan berulang-ulang dengan cara yang sama, maka parameter populasi
akan tercakup di dalam interval yang bersangkutan 95% dari keseluruhan watu
atau dalam jangka waktu panjang kita akan mentolerir kesalahan duga (error of
estimate) sebesar 5%. Hal demikian dapat digambarkan sebagai berikut:
Dari gambar di atas jelas bahwa interval keyakinan (confondence interval)

dibatasi oleh batas keyakinan bawah (lower confidence level) dan batas
keyakinan atas (upper confidence level).
Dengan interval keyakinan 95%, maka masing-masing batas keyakinan atas

maupun bawah adalah 2,5%. Koefisien z dapat dicari pada tabel luas daerah
Hal 39 dari 148
Handout Statistik 2
kurva normal untuk luas daerah kurva (0,5000 0,0250 = 0, 4750) nilai z =
1,96; maka parameter akan terletak antara x -1,96 x dan x +1,96 x
B. Ciri-Ciri Suatu Penduga Yang Baik
Beberapa kriteria yang lazim digunakan untuk menetapkan suatu penduga yang
baik adalah:
1.
Tidak bias (unbiasedness)
2.
Konsistensi (consistency)
3.
Efisiensi (efficiency)
4.
Sufisiensi (sufficiency)
1.
Tidak Bias
Suatu penduga dikatakan tidak bias, apabila penduga tersebut secara
tepat dapat menduga nilai parameternya.

Contoh, apabila penduga dinyatakan dengan sedang parameter yang
akan diduga 0, maka penduga itu dikatakan tidak bias apabila:

E() = 0
Artinya nilai yang diharapkan sebagai penduga sama dengan nilai yang
diduganya. Apabila nilai penduga tidak sama dengan parameter yang diduga,
maka terjadilah bias.
Contoh: rata-rata sampel ( x ) = 20, sedangkan rata-rata populasi yang
diduga ternyata nilainya = 20, maka dikatakan bahwa rata-rata sampel

merupakan penduga yang baik atau tidak bias terhadap rata-rata populasi.
E ( x ) = = 20
Apabila rata-rata populasi ternyata nilainya 18, maka rata-rata sampel
menunjukkan bias yang positif (positively biased)
E(x )>
Sedangkan apabila rata-rata sampel nilainya lebih kecil daripada rata-rata
populasi yang diduga, maka dikatakan rata-rata sampel mempunyai bias yang
negatif (negatively biased).
E(x )<
Atau dalam gambar dapat dilihat:
1.
penduga yang tidak bias
Hal 40 dari 148
Handout Statistik 2
2.
2.
Penduga yang Bias Positif
3.
Penduga yang Bias Negatif
Konsistensi
a.
Suatu
penduga
dikatakan
konsisten, apabila besarnya sampel semakin bertambah mendekati tidak

terhingga, maka penduga tersebut akan semakin terkonsentrasi secara sempurna
pada parameter yang diduga.
b.
Keadaan di atas dapat dilihat

pada gambar berikut:
Hal 41 dari 148
Handout Statistik 2
c.
Jika
sampel
semakin
besar
seperti tercantum di gambar di atas, nampak semakin besar pula konsentrasi

pada parameternya.
d.
Dengan kata lain, semakin besar

sampelnya apabila penduga itu konsisten, maka biasnya atau variansnya semakin
mendekati .
e.
Rata-rata
sampel
(x )
merupakan penduga yang konsisten terhadap (parameter) karena variansnya

x = /n 0 jika sampelnya (n)
f.
Suatu penduga yang konsisten

belum tentu merupakan penduga yang baik, karena konsistensi hanya
merupakan salah satu syarat.
3.
Efisiensi
a. Suatu penduga dikatakan efisien apabila penduga tersebut memiliki varians yang
kecil. Apabila ada 2 penduga yang tidak bias, maka penduga yang memiliki
varians yang lebih kecil yang diukur berdasarkan pada efisiensi relatif (relative
efficiency) merupakan penduga yang lebih baik, karena lebih efisien.
b. Sebagai contoh dapat dikemukakan penduga parameter yang terdiri dari ratarata sampel dan median sampel, keduanya merupakan penduga yang tidak bias
terhadap rata-rata populasi. Kedua penduga statistik ini masing-masing memiliki
varians, yaitu varians rata-rata dan varians median.
c. Kedua varians tersebut dapat dibandingkan dalam bentuk efisiensi relatif.
Varians rata-rata (mean):
x2
2
n
Varians median:
2 Med
2
2n
Hal 42 dari 148
Handout Statistik 2
= 3,14159
Efisiensi relatif:
2 n
2x
2
Ef 2
0,64 (64%)
2
Med 2n
Efisiensi relatif sebesar 64% artinya varians rata-rata hanya 64% dari varians
median. Ini berarti untuk memperoleh varians yang sama, rata-rata hanya
memerlukan sampel dengan n = 64 elemen. Sedangkan untuk median diperlukan
sampel dengan n = 100 elemen.
Dengan diagram, kedua penduga tersebut dapat digambarkan sebagai berikut:
d. Apabila kita memiliki 2 penduga yaitu rata-rata dan median sebagai penduga
parameter, sedangkan varians nilai rata-rata lebih kecil daripada varians median,
maka efisiensi relatifnya dapat dinyatakan dengan:
Varians nilai rata-rata
Efisiensi relatif =
x 100%
Varians median
Karena varians yang lebih kecil menjadi pembilang, maka nilai dari efisiensi
relatif ini terletak antara 0 dan 100% (0 efisiensi relatif 100%)
Oleh karena itu, penduga yang mempunyai varians lebih kecil dikatakan lebih
efisien, sebab untuk mencapai varians yang sama hanya memerlukan elemen
sampel yang lebih kecil
4.
Sufisiensi
Suatu penduga dikatakan sufisien (cukup) apabila penduga itu memiliki seluruh
informasi tentang parameter yang akan diduga. Dengan kata lain tidak ada ukuran
statistik lain sebagai penduga yang lebih baik untuk menduga parameter.
Sebagai contoh dapat dikemukakan bahwa rata-rata sampel adalah penduga yang
sufisien terhadap rata-rata populasi, sebab selain rata-rata sampel tidak ada ukuran
lain misalnya: media atau modus yang dapat dipergunakan sebagai penduga yang
Hal 43 dari 148
Handout Statistik 2
lebih baik. Demikian pula proporsi sampel (x/n) merupakan penduga yang sufisien
bagi proporsi populasi (P).
C. Metode Maximum Likelihood
Metode ini dikembangkan oleh RA Fisher pada tahun 1920 yang merupakan
metode penting untuk pendugaan titik.
Kriteria-kriteria yang dimiliki metode maximum likelihood dalam proses

pendugaan parameter adalah sufisien, efisien dan konsisten.
Disamping itu apabila besarnya sampel bertambah, maka distribusi sampling

dari penduga maximum likelihood akan menyerupai suatu bentuk kurva normal.
Contoh: Probabilitas terjadinya sisi gambar pada sebuah mata uang yang tidak
setimbang misalkan: 1/4 atau 3/4. Proporsi sisi gambar yang sebenarnya tidak
diketahui. Untuk mengetahui apakah proporsi yang sebenarnya 1/4 atau 3/4,
dilakukan suatu percobaan pelemparan mata uang sebanyak 3 kali, dengan hasil
P(H,T,H) atau P(Gambar, Tulisan, Gambar). Dengan probabilitas 1/4 diperoleh hasil
sebagai berikut:
P(H,T,H) = (1/4) (3/4) (1/4) = 3/64
Dengan probabilitas 3/4 diperoleh hasil sebagai berikut:
P(H,T,H) = (3/4) (1/4) (3/4) = 9/64
Dari perhitungan tersebut dapat diketahui bahwa hasil percobaan menunjukkan
probabilitas = 3/64 untuk P=1/4 dan probabilitas = 9/ 64 untuk P = 3/4. Dari 2
keadaan, nampaknya P=3/4 merupakan penduga yang lebih mendekati kenyataan
daripada P=1/4. P=3/4 lebih banyak memberikan informasi daripada P=1/4.
Metode maximum likelihood adalah suatu metode untuk memperoleh penduga

(estmator) yang membuat probabilitas untuk memperoleh sampel yang diteliti
menjadi maksimum.
Suatu eksperimen binomial terdiri dari n percobaan yang menghasilkan

observasi x1, x2, x3 xn, dimana x = 1 kalau percobaan sukses dan x = 0 kalau
percobaan gagal. Dengan menggunakan metode maximum likelihood, kita mencari
(dibaca P topi) sebagai penduga parameter P.
penduga P
L P P x 1 P
n x
dimana, x = banyaknya sukses

Kita mencari P yang membuat L(P) menjadi maksimum, kita turunkan L(P) terhadap
P kemudian menyamakannya dengan nol.
Untuk mencari turunan L(P), dengan menggunakan log (Ln = log dengan bilangan
pokok e)
LnL P xLn P n x Ln1 P
dLnL P
x1 P n x 1 1 P 0
dP
x n x
P
1 P
x 1 P n x P
Hal 44 dari 148
Handout Statistik 2
x xP nP xP nP x
P
x
n
Jadi, penduga parameter P dengan menggunakan metode maximum likelihood

adalah P = x/n = perkiraan proporsi.
Kriteria suatu sampel dikatakan besar, apabila sampel tersebut lebih besar
daripada 30 (n > 30). Penduga interval ini ada 2 yaitu:
a. Pendugaan terhadap parameter rata-rata ().
b. Pendugaan terhadap parameter proporsi (P)
a. Pendugaan terhadap parameter rata-rata ()

1.
Untuk
mengadakan
pendugaan
parameter ini, dipergunakan rata-rata sampel ( x ) dengan interval

keyakinan tertentu.
2.
Rumus yang dipergunakan bertolak dari

rumus z untuk distribusi sampling sebagai berikut:
z
3.
Dari rumus di atas maka rata-rata

populasi () akan terletak dalam batas-batas sebagai berikut:

x z x z
n n
dimana :
= rata-rata sampel
= tabel z sesuai dengan tingkat keyakinan (confidence level)
= standar deviasi populasi
= jumlah sampel
4.
Rumus diatas berlaku untuk sampel

besar (n > 30) berasal dari populasi yang tidak terbatas atau populasi yang
terbatas pengambilan sampel dengan pemulihan.
5.
Apabila standar deviasi populasi ()

tidak diketahui, maka dapat dipergunakan standar deviasi sampel, sehingga
rumus di atas menjadi sebagai berikut:
Hal 45 dari 148
Handout Statistik 2
s s
x z x z
n n
6.
Sedang untuk populasi (N) yang terbatas

dan pengambilan sampel tanpa pemulihan, bila sampel yang digunakan (n) =
5% atau lebih dari N, maka digunakan rumus dengan faktor koreksi sebagai
berikut:
s N n s N n
x z x z
n N 1 n N 1
Pendugaan parameter dengan diketahui dan populasi tidak terbatas
i.
Rumus

x z x z
n n
jika kita mempergunakan penduga yang tidak bias
(x) untuk menduga parameter dengan interval keyakinan sebesar 95%

sedang telah diketahui, maka interval keyakinan diberikan sebagai:
x z0,025xx x z0,025xx
dimana: x
menurut tabel z, maka interval keyakinan 95% = 1,96.
Contoh: Sebuah biro perjalanan mengadakan suatu penelitian tentang

kepariwisataan di suatu kota dan ingin memperkirakan pengeluaran ratarata para wisatawan asing yang berkunjung ke kota itu. Guna keperluan
ini diambil sampel secara random yang terdiri dari 100 wisatawan asing
yang akan menjadi responden dalam penelitian ini.
Dari hasil penelitian dapat diketahui bahwa pengeluaran rata-rata setiap
kunjungan sebesar $500 per wisatawan. Jika kita anggap deviasi
pengeluaran semua wisatawan konstan sebesar $100, maka dengan
interval keyakinan 95%, buatlah rata-rata pengeluaran para wisatawan
asing yang berkunjung ke kota itu.
Hal 46 dari 148
Handout Statistik 2
Dari contoh di atas diketahui:

n = 100, x = $500, = $100, interval keyakinan = 95%, nilai z = 1,96
$100
$10
100
Maka rata-rata populasi akan terletak:

500 1,96 (10)
< < 500 + 1,96 (10)
500 19,6 < < 500 + 19,6

480,4 < < 519,6
Rata-rata pengeluaran para wisatawan per orang yang berkunjung ke kota
itu berkisar antara $480,4 hingga $519,6. Hal ini dapat digambarkan
sebagai berikut:
Pendugaan parameter dengan diketahui dan populasi terbatas
ii.
Jika sampel yang random dipilih dari populasi yang terbatas tanpa
pemulihan, x cenderung akan kurang dari
. Berapa selisihnya
tergantung pada jumlah populasinya relatif dibandingkan dengan

besarnya sampel
Makin besar persentase populasi yang dipilih sebagai sampel, makin

kurang variasi x dari sampel ke sampel. Selanjutnya rumus yang berlaku
adalah:
N n N n
x z x z
n N 1 n N 1
Contoh: Andaikan sampel sebesar n = 100 dan x = $500 dipilih dari

populasi yang terbatas N = 500 dan diketahui deviasi standar () = $100,
Hal 47 dari 148
Handout Statistik 2
maka pendugaan parameter dengan interval keyakinan 95% adalah

sebagai berikut:
$100
100
500 100
10 0,895 8,95
500 1
Jadi parameter akan terletak:

500 1,96 (8,95)
< < 500 + 1,96 (8,95)
500 17,5 < < 500 + 17,5

482,5 < < 517,5
Pendugaan parameter dengan tidak diketahui
iii.
Pada hakekatnya tergantung pada deviasi kuadrat dari , sehingga

mustahil jika diketahui tidak diketahui. Dalam kenyataannya kita
tidak mengetahui tentang sesuatu apapun mengenai parameter selain
dari sampel.
Jadi apabila deviasi standar populasi tidak diketahui, maka kita

melakukan pendugaan deviasi standar sampel (s), sehingga dipergunakan
rumus
s s
x z x z
n n
Contoh: sebuah sampel random terdiri dari 100 orang pedagang kaki
lima yang dipilih dari seluruh pedagang kaki lima di sebuah kota. Ratarata tingkat keuntungan yang diperoleh 20% dengan deviasi standar 2%.
Dengan mempergunakan interval keyakinan 95%, berapa tingkat
keuntungan semua pedagang kaki lima di kota itu?
Pada soal ini, n = 100, x =20%, s = 2% dan z0,025 = 1,96.
Karena sampelnya cukup besar, dapat diduga dengan x s
20 1,96 (2/10) < < 20 + 1,96 (2/10)

20 0,392 < < 20 + 0,392
19,6 < < 20,4
b. Pendugaan parameter Proporsi (P) dengan Sampel Besar (n>30)
-
Pendugaan
parameter
proporsi
dapat
dilakukan
dengan
mempergunakan proporsi sampel (x/n) secara tidak bias apabila sampel

random yang dipilih besar.
Hal 48 dari 148
Handout Statistik 2
Dapat menggunakan rumus sebagai berikut:
x nz
-
x n 1 x n
x n 1 x n
P x nz
n
n
Contoh: Suatu penelitian dilakukan oleh sebuah perguruan tinggi

swasta terhadap ketepatan waktu pembayaran SPP dari para mahasiswanya.
Dari 100 orang mahasiswa yang diteliti ternyata 30 orang mahasiswa
melakukan pembayaran SPP tidak tepat waktu. Dengan mempergunakan
interval keyakinan 95%, tentukan pendugaan interval proporsi dari
mahasiswa yang melakukan pembayaran SPP tidak tepat waktu.
Dari soal diatas diketahui n = 100, x = 30, z 0,025 = 1,96. Dengan
menggunakan rumus di atas diperoleh hasil sebagai berikut:
30 100 1.96
30 1001 30 100
30 1001 30 100
P 30 100 1.96
100
100
0,21 < P < 0,39

Dengan interval keyakinan 95% dapat dikatakan bahwa antara 21% sampai
39% dari para mahasiswa melakukan pembayaran SPP tidak tepat waktu.
Apabila unsur populasi (N) diketahui dan merupakan populasi terbatas,
sedang sampel diambil tanpa pemulihan maka perlu dilakukan koreksi yang
disebut koreksi populasi terbatas yakni:
N n
N 1
Sehingga rumus penduga interval proporsi populasi menjadi:
x nz
x n 1 x n
x n1 x n
N n
P x nz
N 1
n
N n
N 1
Kriteria suatu sampel yang kecil adalah apabila n 30. Pada sampel
yang kecil pendugaan parameter dengan mempergunakan s akan menghasilkan

selisih kesalahan.
Pada umumnya jika sampel kecil pendugaan parameter dilakukan
dengan distribusi t yang variabelnya distandardisir sebagai:

t
x
s/ n
Pada hakekatnya distribusi t ini menyerupai distribusi normal.
Perbedaannya terletak pada yang umumnya tidak diketahui. Pada distribusi

normal, standar pengubahan dilakukan dengan yang diketahui, sedangkan pada
distribusi t pengubahan dilakukan dengan mempergunakan yang dihitung dari
sampel.
Distribusi t ini dinamakan distribusi student sebagai nama samaran

dari WS Gosset yang menemukan distribusi ini tahun 1908.
Hal 49 dari 148
Handout Statistik 2
Perbandingan antara distribusi t dan distribusi normal dapat dilihat
pada gambar berikut:
Tabel distribusi t tersebut selanjutnya dapat dilihat pada lampiran.
Apabila n makin kecil, distribusi t akan makin melebar. Sebaliknya makin besar nnya distribusi t akan mendekati distribusi normal.
Tabel t tidak disusun berdasarkan besarnya sampel n, tetapi disusun
menurut derajat kebebasan (degree of freedom) yang dirumuskan dengan n-1.

Pengertian derajat kebebasan ini dapat dijelaskan sebagai berikut:
Tiga buah data mempunyai rata-rata = 5. Di dalam menentukan masing-masing data

ini kita mempunyai kebebasan kecuali pada data ketiga, karena jumlah ketiga data
tersebut harus = 15 (rata-rata = 15/3 = 5). Dengan kata lain, kita kehilangan 1 derajat
kebebasan atau kita hanya mempunyai 2 derajat kebebasan. Karena n = 3 , maka
derajat kebebasan dirumuskan dengan (n-1).
Pendugaan Parameter dengan Tidak Diketahui dan Populasi Tidak
a.
Terbatas
-
Contoh: Penelitian terhadap sampel sejumlah 16 orang wisatawan

asing yang berkunjung ke suatu kota menunjukkan pengeluaran rata-rata selama
tinggal di kota tersebut sebesar $500 dengan deviasi standar $100. Tentukan
pengeluaran rata-rata yang sebenarnya dengan menggunakan interval keyakinan
95%.
Dari soal diatas diketahui, n = 16, x = $500, s = $100, interval keyakinan 95%,
t0,025 df = 15, tabel t = 2,131.
Rumus yang dipergunakan adalah:
x ts n x ts n
Dengan menggunakan rumus di atas, maka didapat hasil sebagai berikut:
500 2,131 (100/4) < < 500 + 2,131 (100/4)
500 53,275 < < 500 + 53,275
446,725 < < 553,275
Hal 50 dari 148
Handout Statistik 2
Jadi pengeluaran rata-rata yang sebenarnya para wisatawan asing tersebut

antara $446,7 sampai $553,3.
-
Penggunaan distribusi t membawa asumsi bahwa variabel x harus

memiliki distribusi normal, jika distribusi tidak menyerupai distribusi normal,
maka penggunaan distribusi t hasilnya dapat meragukan.
Pendugaan Parameter dengan Tidak Diketahui dan Populasi Terbatas
b.
-
Sebagaimana telah dijelaskan untuk populasi yang terbatas perlu

adanya koreksi populasi terbatas, yaitu:
N n
N 1
Contoh: Dengan menggunakan contoh a, dan populasi N = 100 orang

maka faktor koreksi adalah:
100 16
100 1
84
99
0,848 0,92
Sehingga hasil pendugaan menjadi sebagai berikut:

500 (53,275 x 0,92)
< < 500 + (53,275 x 0,92)
500 49,07 < < 500 + 49,07

450,93 < < 549,07
c.
Pendugaan Parameter Proporsi

-
Dalam pendugaan interval proporsi dengan sampel yang kecil, maka

rumus yang dipergunakan adalah:
x nt
-
x n 1 x n
x n 1 x n
P x nt
n
n
Contoh, Penelitian terhadap sampel sebanyak 16 mahasiswa, ternyata 4 di

antaranya mempunyai kendaraan sendiri. Dengan interval keyakinan 95%,
tentukan proporsi mahasiswa yang memiliki kendaraan sendiri.
n = 16, x = 4, x/n = 0,25, t0,025 df = 15, tabel t = 2,131
0,25 2,131 0,1875 16 P 0,25 2,131 0,1875 16
0,02 < P < 0,48

Pendugaan interval untuk perbedaan dua rata-rata dan dua proporsi
adalah sama prosedurnya dengan pendugaan interval untuk rata-rata dan proporsi.
Pendugaan Parameter 1 - 2 jika 1 dan 2 diketahui
a.
-
Pendugaan interval selisih dua rata-rata (1 - 2) jika 1 dan 2 diketahui

x1 x2 z x1 x 2 1 2 x1 x2 z x1 x2
dimana
Hal 51 dari 148
Handout Statistik 2
12 22
x1 x 2
n1 n2
-
Contoh: Upah mingguan karyawan perusahaan asing dari 90 orang

karyawan rata-rata Rp. 100.000 dari 1 = Rp. 9.000, sedangkan perusahaan
nasional dari 90 orang karyawan rata-rata Rp. 50.000 dan 2 = Rp. 5.000.
Dengan menggunakan interval keyakinan 95% buatlah pendugaan interval antara
1 - 2.
Jawaban:
n1 = 90, x1 =Rp. 100.000, 1 = Rp. 9.000, z0,025 = 1,96, n2 = 90, x 2 =Rp. 50.000,
2 = Rp.5.000
x1 x 2
81000000 25000000
106000000 / 90 1085
90
90
Dengan menggunakan rumus di atas maka diperoleh hasil sebagai berikut:

(100000 50000) 1,96 (1085)
50000 2126,6
< 1 - 2 < (100000 50000) + 1,96 (1085)

< 1 - 2 < 50000 + 2126,6
47873,4 < 1 - 2 < 52126,6

Jadi dengan interval keyakinan 95%, selisih rata-rata upah mingguan karyawan
perusahaan asing dan nasional antara Rp. 47.873,4 sampai dengan Rp. 52.126,6.
Pendugaan Parameter 1 - 2 jika 1 dan 2 Tidak Diketahui
b.
-
Apabila 1 dan 2 tidak diketahui, maka dipergunakan dugaan deviasi

standar sampel yakni s1 dan s2 sehingga rumusnya menjadi sebagai berikut:
x1 x2 t sx1 x2 1 2 x1 x 2 t sx1 x2
dimana
sx1 x 2
-
(n1 1) s12 (n 2 1) s 22
1 n1 1 n 2
n1 n2 2
Contoh: Penghasilan setiap minggu dari pedagang kaki lima yang

berjualan di Jalan X dan Jalan Y adalah sebagai berikut (dalam ribuan rupiah)
Pedagang di Jl. X : 40 46 40 36 38 34 42 44 40
Pedagang di Jl. Y : 30 24 16 25 35 40 46 38 34
Dengan interval keyakinan 95%, buatlah pendugaan interval 1 - 2 dimana x1
=rata-rata penghasilan pedagang kaki lima di Jalan X dan
x 2 =rata-rata
penghasilan pedagang kaki lima di Jalan Y.

Jawaban:
n1 = 9, x1 =40, s1 = 14 = 3,74
n2 = 9, x 2 =32, s2 = 85,25 = 9,23
t0,025 , df = 9+9-2 = 16, tabel t = 2,120
Hal 52 dari 148
Handout Statistik 2
112 682
1 9 1 9 3,32
16
sx1 x 2
(40 32) 2,12 (3,32)
< 1 - 2 < (40 32) + 2,12 (3,32)
0,96 < 1 - 2 < 15,04 (dalam ribuan)

Dengan interval keyakinan 95%, kita harapkan perbedaan antara penghasilan
pedagang kaki lima yang berjualan di Jalan X dan Jalan Y adalah antara Rp. 960
sampai Rp. 15.040.
c.
Pendugaan Perbedaan Dua Proporsi

-
Pendugaan interval perbedaan dua proporsi (P1 P2) dirumuskan sebagai

berikut:
x1 x 2
x
x
z s P1 P 2 P1 P2 1 2 z s P1 P 2
n1 n 2
n1 n2
dimana
s P1 P 2
-
x1 n1 1 x1 n1 x 2 n 2 1 x 2 n2
n1
n2
Contoh: Dari sampel nasabah bank sebanyak 120 orang di kota A,

sebanyak 90 orang di antaranya pengusaha besar. Dan 120 orang nasabah bank
di kota B, 60 orang di antaranya pengusaha besar. Dengan tingkat keyakinan
95%, buatlah pendugaan interval (P1 P2), jika P1 = proporsi nasabah pengusaha
besar di kota A dan P2 = proporsi nasabah pengusaha besar di kota B.
Jawaban:
n1 = n2 = 120, x1/n1 = 90/120 = 0,75, x2/n2 = 60/120 = 0,50, z0,025 = 1,96
s P1 P 2
(0,75)(0,25) (0,50)(0,50)
120
120
0,003645 0,06
(0,75 0,50) 1,96 (0,06) < P1 P2 < (0,75 0,50) + 1,96 (0,06)
0,25 0,1176
< P1 P2 < 0,25 + 0,1176
0,1324 < P1 P2 < 0,3676

Dengan interval keyakinan 95% kita harapkan interval antara 0,13 atau 13%
sampai 0,37 atau 37% merupakan selisih proporsi nasabah bank di kota A dan
kota B yang terdiri dari pengusaha besar.
Dalam teori sampel telah dijelaskan bahwa jika n besar, maka distribusi
sampling akan menyerupai kurva normal. Dengan demikian kita dapat mengatakan
bahwa, jika suatu random sampel cukup besar, dengan interval keyakinan 95%
deviasi standar populasi akan terletak dalam jarak:
Hal 53 dari 148
Handout Statistik 2
s 1,96
2n
s 1,96
2n
Contoh:
Sampel sebesar 8 menunjukkan deviasi standar = 3. Dengan interval keyakinan 95%,
tentukan interval .
Jawaban:
n = 8, s = 3 dan z0,025 = 1,96
3 1,96
3
16
< < 3 1,96
3
16
3 1,47 < < 3 + 1,47

1,53 < < 4,47
Dengan interval keyakinan 95% kita harapkan akan terletak antara 1,53 dan 4,47.
Pada umumnya sebelum kita memilih sampel secara acak (random) guna
menduga parameter, kita seharusnya menetapkan terlebih dahulu berapa besarnya

sampel yang akan kita ambil, agar kita dapat menduga parameter dengan ketepatan
yang kita inginkan yang diukur berdasar lebarnya interval keyakinan yang kita
kehendaki.
Misalkan kita ingin mengetahui berapa besarnya sampel yang akan kita
gunakan agar dengan interval keyakinan 95%, selisih rata-rata populasi yang
sesungguhnya tidak lebih dari 5 secara searah. Dapat digambarkan sebagai berikut:
Dengan pembahasan sebelumnya dijelaskan bahwa lebar interval

keyakinan tertentu akan tergantung pada varians dan besarnya sampel. Jika varians
diketahui, lebarnya interval keyakinan dapat dirumuskan sebagai berikut:
zE s
atau
E = Error = Penyimpangan
s = standar deviasi sampel
Dari rumus diatas dapat ditentukan besarnya sampel (n) sebagai berikut:
Hal 54 dari 148
Handout Statistik 2
z.
n
E
dimana
n
= besarnya sampel
= nilai z yang besarnya ditentukan oleh interval keyakinan
= deviasi standar populasi
E = besarnya kesalahan yang diharapkan

Contoh:
Jika populasi normal diketahui sebesar 10 dan jika kita ingin interval keyakinan
95% yang mencakup rata-rata parameter tidak melebihi 10 lebarnya, berapa
besarnya sampel yang kita ambil?
Jawaban:
E = 5, = 10, z0,025 = 1,96
1,96(10)
15,36 15 sampel
Penentuan besarnya sampel dapat pula dihitung berdasarkan pendugaan
interval proporsi:
P P 1
n
atau
P (1 P )
E/z
n
z 2 P (1 P )
E2
Apabila P tidak diketahui, maka P(1-P) diganti dengan 1/4, yaitu nilai maksimum
untuk P(1-P).
Contoh: Perusahaan penjual alat-alat kosmetik ingin menduga proporsi konsumen
yang menyukai produknya. Dalam proses pendugaan ini pengusaha ingin agar selisih
dugaannya tidak melebihi 2% dari parameternya, sedangkan interval keyakinan yang
dikehendaki 95%. Berapa besarnya sampel bagi pendugaan proporsi populasi ini?
Jawaban:
(1,96) 2 (1 / 4)
2,401 2 sampel
(0,02) 2
Hal 55 dari 148
Handout Statistik 2
5. PENGUJIAN HIPOTESA
A. Arti dan Pentingnya Pengujian Hipotesa
Hipotesa adalah suatu anggapan atau pendapat yang diterima secara tentatip
untuk menjelaskan suatu fakta atau yang dipakai sebagai dasar bagi suatu
penelitian.
Beberapa contoh hipotesa dapat dikemukakan sebagai berikut:
a.
Seorang
manajer
produksi
menyatakan
bahwa
kerusakan produk dalam proses produksi hanya 10%

b.
Manajer pemasaran suatu perusahaan menyatakan

bahwa pemasaran produk-produk baru sangat tergantung pada iklan
c.
Manajer personalia menyatakan bahwa produktivitas

perusahaan masih dapat ditingkatkan 10% dengan meningkatkan kondisi kerja
d.
Seorang ekonom menyatakan bahwa resesi dunia

sangat mempengaruhi penerimaan devisa negara.
Hipotesa, anggapan atau pendapat di atas seringkali dipergunakan untuk
mengambil keputusan, kalau hipotesa itu keliru dengan sendirinya keputusannya

dapat keliru. Oleh karena itu, hipotesa harus diuji berdasarkan data empiris yaitu
data berdasar pada penelitian suatu sampel.
Berdasarkan keadaan yang nyata ini, maka hasil pengujian hipotesa dapat
dipergunakan sebagai dasar pengambilan keputusan. Kesalahan yang diakibatkan

pengambilan keputusan merupakan resiko dalam pengambilan keputusan.
Agar suatu hipotesa dapat diuji, hipotesa harus dirumuskan secara jelas dan
bersifat operasional.
Menurut sifat hipotesa kita dapat membedakan yang bersifat kualitatif, misalkan
seorang hakim menganggap seseorang bersalah atau kuantitatif yang disebut sebagai
hipotesa statistik, misalkan rata-rata pengeluaran sebulan Rp. 200.000.
Hipotesa statistik dirumuskan sebagai suatu pernyataan tentang nilai suatu
parameter, misalnya rata-rata populasi, proporsi populasi, varians populasi dan
sebagainya.
B. Prosedur Pengujian Hipotesa
Pengujian suatu hipotesa pada hakekatnya dapat disusun dalam beberapa tahap.
Pentahapan di dalam pengujian hipotesa ini secara keseluruhan merupakan

prosedur dari pengujian hipotesa.
Tahapan pengujian hipotesa adalah sebagai berikut:
1.
perumusan hipotesa nol dan hipotesa alternatif
2.
penentuan taraf nyata (significant level) biasanya digunakan simbol

, misalnya 10%, 5% atau 1%.
Bab 5: Pengujian Hipotesa
Hal 56 dari 148
Handout Statistik 2
3.
Menentukan statitik uji atau kriteria uji yang akan digunakan,

apakah dengan kurva normal, distribusi t, distribusi x2 atau dengan distribusi F.
4.
Pengambilam keputusan, apakah hipotesa dapat diterima ataukan

hipotesa ditolak.
1.
Perumusan Hipotesa Nol dan Hipotesa Alternatif

-
Hipotesa nol (null hypotheses) biasanya dirumuskan dengan H0. Disebut

hipotesa nol, karena hipotesa ini mempunyai perbedaan nol atau tidak
mempunyai perbedaan dnegan hipotesa yang sebenarnya.
Contoh, apabila kita ingin membuktikan bahwa obat A lebih efektif terhadap
penyakit daripada obat B, maka kita merumuskan hipotesanya efektivitas obat A
dan B sama.
Demikian pula apabila kita ingin membuktikan bahwa mesin A lebih produktif
dari mesin B, maka hipotesisnya dirumuskan produktivitas mesin A sama dengan
mesin B.
Hipotesa alternatif dirumuskan dengan H1 adalah hipotesa kerja yang

dirumuskan sebagai kebalikan dari hipotesa nol.
Contoh:
Pada hipotesa nol yang menyatakan bahwa efektivitas obat A sama dengan obat
B, hipotesa alternatifnya dirumuskan sebagai berikut:
a.
Efektifitas obat A tidak sama dengan obat B
b.
Efektifitas obat A lebih baik dari obat B
c.
Efektifitas obat A lebih jelek dari obat B
Ketiga hipotesa alternatif tersebut merupakan 3 alternatif yang dapat

dipergunakan sebagai perumusan hipotesa alternatif.
-
Setelah hipotesa nol dan hipotesa alternatif dirumuskan, maka

selanjutnya kita mengadakan observasi sampling. Atas dasar nilai statistik
sampel ini, maka keputusan diambil apakah hipotesa nol diterima atau ditolak.
Apabila kita menerima hipotesa nol maka hipotesa alternatif kita tolak
atau kalau kita menolak hipotesa nol maka hipotesa alternatif kita terima.
2.
Penentuan Taraf Nyata (Significant Level)

-
Tujuan dari pengujian hipotesa tidaklah semata-mata untuk menghitung

nilai statistik, melainkan untuk memutuskan apakah perbedaan antara nilai
statistik dan parameter sebagai suatu hipotesa cukup nyata atau tidak.
Contoh: Sebuah perusahaan pembuat pesawat terbang menyatakan

bahwa penggunaan bahan aluminium mempunyai rata-rata ketebalan 0,04 inci,
sedang batas toleransi yang dapat diterima 5%.
Di sini hipotesa nol (H0) = 0,04 inci.
Sedang batas toleransi 5% disebut taraf nyata atau signigicant level.
Hal 57 dari 148
Handout Statistik 2
Apabila hipotesa nol benar, maka taraf nyata ini menunjukkan persentase dari
rata-rata sampel atau nilai statistik yang terletak di luar batas kepercayaan atau
confidence level.
Diagram berikut menunjukkan taraf nyata 5% yang di dalam kurva normal
terletak pada ujung kurva masing-masing seluas 2,5%.
Menurut tabel daerah kurva normal, luas daerah kurva sebesar 95% akan
terletak dalam jarak 1,96 yang menunjukkan bahwa di daerah ini tidak ada
perbedaan yang nyata (significant) antara nilai statistik dan nilai parameter yang
dinyatakan sebagai hipotesa. Daerah ini disebut daerah penerimaan hipotesa
atau acceptance region. Sedang kedua ujung kurva dengan luas masing-masing
2,5% merupakan daerah penolakan hipotesa, karena daerah ini menunjukkan
adanya perbedaan yang nyata atau significant antara nilai statistik dan nilai
parameternya yang dijadikan hipotesa.
i.
Pemilihan Taraf Nyata (Significant Level)

-
Di dalam pemilihan taraf nyata ini tidak ada standar ukuran yang pasti.
Beberapa nilai taraf nyata yang banyak dipergunakan adalah 10%, 5% dan 1%.
Ada yang mengatakan bahwa taraf nyata 1% atau kurang dipergunakan di

bidang kesehatan, 5% di bidang ekonomi dan 10% untuk bidang pertanian.
Sedang Richard I. Levin dalam bukunya Statistics for Management

mengatakan bahwa taraf nyata 1% banyak dipergunakan untuk pengujian
hipotesa-hipotesa di dalam penelitian-penelitian.
Selanjutnya dikatakan bahwa tidak mungkin mempergunakan semua

kriteria taraf nyata melainkan harus ditetapkan salah satu nilai standar yang
minimal. Semakin besar nilai taraf nyata akan semakin besar probabilitasnya
untuk menolak hipotesa nol. Dapat dilihat pada diagram berikut:
Hal 58 dari 148
Handout Statistik 2
Dari gambar di atas ditunjukkan bahwa semakin besar nilai taraf nyata
maka semakin sempit daerah penerimaan hipotesa atau semakin besar
probabilitas untuk menolak hipotesa.
ii.
Pengujian dengan 2 sisi dan dengan 1 sisi

-
Di dalam pengujian hipotesa kita dapat mempergunakan 2

sisi atau 1 sisi pengujian (two tailed test or one tailed test).
Pengujian dengan 2 sisi adalah pengujian hipotesa yang

akan menolak hipotesa nol, jika nilai statistik mempunyai perbedaan nyata
lebih besar atau lebih kecil daripada parameter populasi yang dijadikan
hipotesa.
Pengujian dengan 2 sisi dilakukan apabila hipotesa

alternatifnya dirumuskan dengan:
H1 0
Contoh:
Suatu perusahaan yang memproduksi lampu pijar menyatakan bahwa daya
tahan lampu pijar hasil produksinya rata-rata 1000 jam.
Perumusan hipotesa nol dan hipotesa alternatifnya adalah sebagai berikut:
H0 =0 =1000 jam
Hal 59 dari 148
Handout Statistik 2
H1 0 1000 jam
Perumusan hiptoesa alternatif yang demikian dimaksudkan karena produsen
tidak menghendaki hasil produksinya mempunyai daya tahan yang lebih kecil
atau lebih besar dari rata-rata daya tahan yang telah ditetapkan sebesar 1000
jam.
Jika daya tahan lebih kecil dari daya tahan rata-rata yang telah ditetapkan,
maka perusahaan tersebut akan kehilangan konsumennya. Sebaliknya jika
daya tahan lampu pijar jauh di atas daya tahan rata-rata yang telah
ditetapkan maka perusahaan akan menghadapi biaya yang tinggi.
-
Dalam banyak hal kadang-kadang kita tidak memerlukan

pengujian dengan menggunakan 2 sisi, yaitu apabila kita menghadapi
masalah berikut ini. Misalkan pemerintah ingin membeli bola lampu pijar
dalam jumlah yang cukup besar untuk keperluan instansinya. Dalam
pembelian bola lampu ini, pemerintah menghendaki agar mutu produk cukup
baik dengan daya tahan rata-rata adalah 1000 jam, sehingga pemerintah
dapat memantau hasil pembeliannya dengan mengadakan penelitian sampel
dari bola lampu pijar yang dibelinya. Berdasarkan pertimbangan daya tahan
rata-rata dari bola lampu tersebut, pemerintah akan menolak apabila daya
tahan bola lampu yang dibelinya di bawah 1000 jam. Pemerintah akan
merasa diuntungkan, sebab semakin besar daya tahan bola lampu
pemerintah akan dapat menghemat pengeluarannya.
Dengan demikian hipotesa nol (H0) adalah = 1000 jam, sedangkan hipotesa
alternatifnya H1 adalah < 1000 jam. Pengujian ini disebut pengujian dengan
1 sisi di sebelah kiri.
Pengujian dengan 1 sisi di sebelah kiri dipergunakan

apabila hipotesa alternatif menyatakan lebih kecil dari hipotesa nolnya.
Apabila nilai statistik menunjukkan perbedaan yang nyata di bawah nilai
parameter yang dijadikan hipotesa, maka hal ini akan mengarah pada
kesimpulan yang akan menolak hipotesa nolnya. Karena daerah penolakan
hipotesa ini berada disebelah kiri, maka kita mengatakan pengujian hipotesa
ini pengujian dengan 1 sisi di sebelah kiri.
Hal 60 dari 148
Handout Statistik 2
Pengujian hipotesa dengan 1 sisi di sebelah kanan

dipergunakan apabila kita menghadapi hipotesa alternatif yang menyatakan
lebih besar dari hipotesa nolnya. Daerah penolakan hipotesa berada di
sebelah kanan.
3.
Penentuan Statistik Uji

-
Pada umumnya statistik uji yang dipergunakan sebagai dasar

pengambilan keputusan dalam pengujian hipotesa apabila sampelnya besar
dalam hal ini n 30.
dimana: Penggunaan statistik uji z ini tergantung pada ciri

hipotesanya dan asumsi-asumsi tentang populasinya yang dirumuskan sebagai
berikut:
z
st parameter
st
st
= statistik (nilai sampel)
parameter
= hipotesa parameternya
st
= deviasi standar sampel
Sebaliknya apabila sampelnya kecil dalam hal ini n<30 maka akan
digunakan statistik uji t sebagai dasar pengujian hipotesa dirumuskan sebagai
berikut:
t
st parameter
st
dimana t = distribusi t dengan derajat kebebasan sebesar n 1.

4.
Pengambilan Keputusan
-
Di dalam setiap proses pengambilan keputusan tentang apakah kita

akan menerima ataukah menolak suatu hipotesa, kita akan selalu dihadapkan
pada 2 macam kesalahan, yakni dirumuskan dengan kesalahan jenis 1 atau type 1
error dan kesalahan jenis II atau type II error.
Kesalahan jenis I akan kita jumpai apabila kita menolak suatu

hipotesa yang benar (H0 benar) sedang kesalahan jenis II akan kita jumpai
apabila kita menerima suatu hipotesa yang keliru (H0 keliru sedang H1 benar).
Hal 61 dari 148
Handout Statistik 2
Secara skematis kedua jenis kesalahan tersebut dapat dilihat pada

tabel berikut:
Hipotesa
Keputusan
Menerima H0
Jika H0 benar
Keputusan betul
Probabilitas = 1 -
(tingkat keyakinan)
Kesalahan jenis I
Menolak H0
Jika H0 Keliru (H1 Benar)

Kesalahan jenis II
Probabilitas =
Keputusan betul
Probabilitas =
Probabilitas = 1 -
(taraf nyata)
(kuasa pengujian)
Pengujian hipotesa dapat dilakukan dengan 1 sisi yakni dengan nilai

kritis atau daerah penolakan terdapat pada salah satu ujung kurva atau dengan
mempergunakan 2 sisi dengan nilai kritis atau daerah penolakan pada kedua
ujung kurva.
Misalkan
kita
mengadakan
pengujian
hipotesa
dengan
mempergunakan 1 sisi dengan = 0,05 dan misalkan hipotesa nol (H 0) yang

menyatakan pengeluaran rata-rata setiap hari untuk salesman Rp. 10.000
sedangkan statistik sampel terletak pada daerah penolakan, maka secara
konsekuen kita harus menolak H0. Dengan demikian keputusan itu membuat
resiko kesalahan sebesar 0,05. Sebaliknya apabila H0 yang menyatakan
pengeluaran rata-rata setiap hari untuk salesman Rp. 10.000 tidak benar, maka
H1 yang benar, sedangkan statistik sampel terletak dalam daerah penerimaan,
secara konsekuen kita harus menerima H0 dengan membuat kesalahan menerima
H0 palsu sebesar .
-
Secara teoritis kedua jenis kesalahan tersebut sedapat mungkin harus

diusahakan sekecil mungkin dengan melalui pemilihan daerah kritis yang
setepat-tepatnya.
Prosedur pengujian hipotesa yang baik seharusnya mengikuti suatu

asas umum sebagai berikut:
Bila terdapat beberapa daerah kritis yang memiliki probabilitas kesalahan jenis I
yang sama dan sudah ditentukan, maka pengujian hipotesa yang terbaik adalah
yang memiliki probabilitas kesalahan jenis II yang sekecil mungkin.
Secara grafis kedua jenis kesalahan dapat terlihat pada gambar

berikut:
Hal 62 dari 148
Handout Statistik 2
Nilai kritis searah dapat ditentukan dengan rumus:

z
/ n
Apabila = Rp. 10.000, z0,05 = 1,64, = 500 dan n = 100. Nilai kritis = Rp.
10.082.
Jika H0 benar, maka = probabilitas kesalahan
a.
menolak H0 benar sebesar 5% (0,05)

Jika H0 keliru (H1 benar), maka = probabilitas
b.
kesalahan menerima H0 yang keliru.

Hubungan antara , dan n
Di dalam pengujian hipotesa
kita lebih dahulu harus menentukan besarnya kesalahan jenis I () karena

kesalahan ini dapat dikuasai.
Selanjutnya
kita
tentukan
besarnya sampel (n) dan akhirnya mengatur pengujian hipotesa yang sifatnya
meminimumkan kesalahan jenis II.
Hal 63 dari 148
Handout Statistik 2
Apabila
besarnya
sampel
telah ditentukan maka besarnya kesalahan jenis II akan berangsur-angsur

berkurang selama kesalahan jenis I berangsur-angsur naik dan sebaliknya.
Contoh: H0 =50, =12, n
=36, dan = 0,05 dalam pengujian 2 sisi. Dengan menggunakan

rumus z, maka daerah penolakan hipotesa akan terletak antara 46,080
dan 53,920. Daerah ini dapat terlihat pada gambar berikut:
Apabila besarnya rata-rata populasi yang sebenarnya () = 52, maka

besarnya menjadi:
z1
46,08 52
2,96
2
tabel kumulatif = 0,0013
z2
53,92 52
0,96
2
tabel kumulatif = 0,8289
Luas menjadi 0,8289 0,0013 = 0,8276

Luas 1 - menjadi 0,0013 + (1 0,8289) = 0,1724
Luas daerah 1 - dapat dilihat pada gambar berikut:
Luas = 0,830 bila n=36, = 0,484 bila n=100, = 0,021 bila

n=400, = 0,00001 bila n=1000.
Apabila tetap, sedang n diperbesar, maka daerah penolakan hipotesa
akan semakin besar sedang daerah penerimaan hipotesa akan
semakin sempit.
Hal 64 dari 148
Handout Statistik 2
Hal ini dapat mendukung kebenaran teori sampel yang menyatakan

apabila sampel makin besar (n makin besar) maka rata-rata ukuran
sampel akan mendekati ukuran populasinya.
Selain itu, dengan makin besarnya n sedang tetap, akan
mengakibatkan pengurangan dan memperbesar luas 1 -
. Hal
demikian membuktikan kegunaan sampel besar dalam pengujian

hipotesa.
Makin kecil maka 1 - akan makin besar atau makin besar
probabilitas untuk menolak hipotesa yang keliru. Penolakan hipotesa

yang keliru dinamakan kuasa pengujian (power or the test).
Pengertian
tentang
Kuasa
Pengujian dan Kurva Fungsi Kuasa

Kuasa pengujian atau 1 - adalah probabilitas untuk menolak
1.
hipotesa yang keliru.

2.
Contoh: Suatu rumah sakit di dalam mengadakan pengobatan

pasiennya mempergunakan obat dengan dosis masing-masing 100 cc.
Untuk memenuhi kebutuhan obat ini, rumah sakit selalu membeli obat
dari suatu perusahaan farmasi yang memproduksinya secara langsung,
sehingga diketahui deviasi standarnya 2 cc.
Dalam
setiap
kali
pengiriman
obat,
rumah
sakit
mengadakan
pengamatan dengan mengambil sampel sebanyak 50 buah kemasan

yang setiap dosis mempunyai isi rata-rata 99,75 cc.
Apabila rumah sakit tersebut menetapkan taraf nyata atau significant
level
10%
dan
menyatakan
bahwa
dosis
obat-obatan
tersebut
terlampau kecil, bagaimana kesimpulan yang dapat kita peroleh?

Jawaban:
H0 : = 100 cc
H1 : < 100 cc
Penyimpangan standar/baku terhadap nilai rata-rata dengan deviasi standar
populasi diketahui = 2 dapat dihitung sebagai berikut:
x
n 2 / 50 2 / 7,07 0,2829 (0,28 cc)
Karena pengujian hipotesa ini diarahkan pada hipotesa alternatif yang lebih
kecil, maka pengujian hipotesanya mempergunakan 1 sisi di sebelah kiri. Taraf
nyata 10% menunjukkan nilai z = -1,28. Jadi batas daerah penerimaan hipotesa
adalah:
100 1,28 (0,28) = 100 0,36 = 99,64 cc
Nilai ini merupakan batas terendah dari dosis obat yang dapat ditolerir oleh
rumah sakit untuk dapat diterima.
Hal 65 dari 148
Handout Statistik 2
Nilai rata-rata sampel sebesar 99,75 cc akan terletak pada daerah penerimaan,
artinya dosis 99,75 cc masih dapat ditolerir.
3.
Selanjutnya berbagai batas daerah penerimaan hipotesa dengan

berbagai variasi dalam jarak berbagai standar error dengan = 99,61
cc dapat dijelaskan sebagai berikut:
a.
Untuk
99,42
cc
berarti
(99,42
99,61)/0,28 = 0,68 standar error atau z = 0,68 menurut tabel z,

luasnya adalah 0,2517. 1 - = 0,7517
b.
Untuk
99,64
cc
berarti
(99,64

luasnya adalah 0,0438. 1 - = 0,5438
c.
Untuk
99,80
cc
berarti
(99,80

luasnya adalah 0,2517. 1 - = 0,2483
4.
Kita dapat menggambarkan kurva kuasa (power curve) sebagai

berikut:
Hal 66 dari 148
Handout Statistik 2
5.
Dari gambar di atas ditunjukkan bahwa semakin jauh ukuran

sampel dengan hipotesa, semakin besar kita akan menolak hipotesa
nol menerima hipotesa alternatif.
C. Berbagai Contoh Pengujian Hipotesa Dalam Berbagai Kasus

1.
Pengujian Hipotesa terhadap Nilai Rata-Rata

Dalam pengujian hipotesa terhadap nilai rata-rata ini, kita akan menjumpai
berbagai kasus, yakni: apabila deviasi standar populasinya diketahui dan apabila
deviasi standar populasinya tidak diketahui.
Apabila deviasi standar populasi tidak diketahui, maka dipergunakan deviasi
standar sampel.
Selanjutnya dalam pengujian hipotesa terhadap nilai rata-rata ini akan
dibedakan dalam hal sampel yang besar (n > 30) dan sampel kecil (n 30).
Untuk sampel yang besar akan digunakan distribusi z dan untuk sampel yang
kecil digunakan distribusi t.
a.
Pengujian Hipotesa terhadap Nilai Rata-Rata dengan

Sampel Besar
-
Apabila Deviasi Standar Populasi Diketahui

Suatu perusahaan pembuat pesawat terbang penumpang menyatakan bahwa
hasil produksinya setelah dipergunakan dalam jangka waktu 1 tahun
diperlukan pengecekan kembali selama 11 jam dengan deviasi standar 3,5
jam. Setelah selang 3 tahun, tehnisi pesawat meragukan hipotesa ini,
sehingga perlu dilakukan pengamatan kembali dengan mengambil sampel
Hal 67 dari 148
Handout Statistik 2
sebanyak 49 buah pesawat. Ternyata waktu rata-rata yang diperlukan untuk

mengadakan pemeliharaan ini 12 jam. Teknisi masih percaya bahwa deviasi
standarnya tetap.
Apakah ada alasan untuk meragukan bahwa waktu yang diperlukan untuk
pemeliharaan pesawat terbang dalam 1 tahun diperlukan 11 jam, apabila
dipergunakan taraf nyata 10%?
Persoalan ini dapat dipecahkan dengan langkah-langkah sebagai berikut:
H0 : = 11 jam
1.
H1 : 11 jam
2.
Taraf
nyata
10%
dengan 2 sisi pengujian nilai z = 1,64

3.
Statistik
uji,
distribusi z
z
/ n
Berdasarkan pada rumus di atas kita dapat menghitung z:

z
12 11
3,5 / 49
1 / 0,5 2
4.
Kesimpulan:
>
1,64, perbedaan signifikan cukup besar sehingga hipotesa ditolak.

Kesimpulan ini dapat ditunjukkan dalam gambar berikut:
Apabila dipergunakan taraf nyata 5%, maka menurut tabel z, nilai z = 1,96.
Karena hasil statistik uji = 2 masih lebih besar daripada 1,96; maka
kesimpulan tidak berubah.
Hal 68 dari 148
Handout Statistik 2
Apabila dipergunakan taraf nyata 1%, maka menurut tabel z, nilai z = 2,58.
Karena hasil statistik uji = 2 dan lebih kecil daripada 2,58, maka kesimpulan
berubah yang berarti perbedaan tidak signifikan, sehingga hipotesa diterima.
Apabila Deviasi Standar Populasi Tidak Diketahui

Dalam hal deviasi standar populasinya tidak diketahui, maka digunakan
deviasi standar sampel (s), sehingga rumus yang berlaku adalah:
z
x
s/ n
Contoh: Suatu perusahaan minuman botol yang telah terisi rata-rata 32 ons,
sesuai dengan standar yang telah ditetapkan oleh bagian produksi. Dalam
pemasaran akhir-akhir ini ternyata banyak keluhan dari para konsumen,
sehingga lembaga konsumen mengadakan pemeriksaan terhadap produksi
teh botol dengan mengambil sampel sebanyak 100 botol. Ternyata berat ratarata 31,8 dengan deviasi standar 2 ons.
Dengan mempergunakan taraf nyata 5%, apakah keluhan para konsumen
terhadap produksi teh botol ini dapat dibenarkan?
Pemecahan masalah tersebut di atas adalah sebagai berikut:
1.
H0 : = 32 ons
H1 : 32 ons
2.
Taraf nyata 5% dengan 2 sisi pengujian, nilai z = 1,96
3.
Statistik uji, distribusi z
Hal 69 dari 148
Handout Statistik 2
x
s/ n

z
4.
31,8 32
0,2 / 0,2 1
2 / 100
Kesimpulan: -1 > - 1,96 (z mendekati nol), perbedaan dikatakan

tidak berarti (tidak signifikan) sehingga hipotesa diterima. Jadi keluhan
para konsumen terhadap produksi teh botoh dinyatakan sebagai tidak
mempunyai alasan yang kuat.
Apabila kita mempergunakan pengujian 1 sisi, maka digunakan pengujian 1

sisi kiri.
H1 : < 32 ons, taraf nyata 5% 1 sisi kiri, tabel z = 1,64
Kesimpulan: -1,00 > -1,64 perbedaan tidak signifikan, maka hipotesa
diterima.
b.
Pengujian Hipotesa Terhadap Nilai Rata-Rata dengan

Sample Kecil
-
Pengujian hipotesa terhadap sampel kecil menggunakan distribusi t

dengan tabel t dan memperhatikan derajat kebebasan (degree of freedom).
1.
Apabila Deviasi Standar Populasi Diketahui
Hal 70 dari 148
Handout Statistik 2
Industri pesawat terbang dengan rata-rata populasi () = 11 jam dan deviasi

standar = 3,5 jam, sedang rata-rata sampel = 12 jam, besarnya sampel (n) = 9.
Pengujian hipotesa dengan taraf nyata 5% dan 2 sisi pengujian.
Pemecahan masalahnya adalah sebagai berikut:
1.
H0 : = 11 jam
H1 : 11 jam
2.
Taraf nyata 5% dengan 2 sisi pengujian, maka tabel t yang

digunakan t0,025 dengan derajat kebebasan 9-1 =8. Nilai t = 2,306.
3.
Statistik uji, distribusi t

t
x
/ n

t
4.
12 11
3,5 / 9
1 / 1,67 0,6
Kesimpulan: Hasil statistik uji +0,6 adalah lebih kecil daripada

+2,306, sehingga perbedaannya tidak signifikan. Hipotesa diterima.
Dalam soal di atas, apabila kita menggunakan pengujian 1 sisi, maka langkahlangkah pengujian hipotesa menjadi sebagai berikut:
1.
H0 : = 11 jam
H1 : > 11 jam
2.
Taraf nyata 5% dengan 1 sisi pengujian, maka tabel t yang

digunakan t0,05 dengan derajat kebebasan 9-1 =8. Nilai t = 1,860.
3.
Kesimpulan: Hasil statistik uji +0,6 kita bandingkan dengan

+1,860, dan terlihat perbedaannya tidak signifikan. Jadi hipotesa
diterima. Kesimpulan ini dapat ditunjukkan dalam gambar berikut:
Hal 71 dari 148
Handout Statistik 2
2.
Apabila Standar Deviasi Populasi Tidak Diketahui

Dalam hal standar deviasi populasi tidak diketahui, maka dapat dilakukan
dengan pendekatan standar deviasi sampel yang dinotasikan dengan s,
sehingga akan berlaku rumus sebagai berikut:
t
x
s/ n
Contoh: Suatu hipotesa mengatakan bahwa keuntungan pedagang kaki lima

di kota M rata-rata setiap hari 25%. Kita ingin membuktikan kebenaran
hipotesa ini dengan mengambil sampel 9 orang pedagang kaki lima yang ada
disepanjang jalan protokol.
Hasil observasi tersebut adalah:
20%, 22%, 18%, 19%, 21%, 20%, 23%, 17%, 20%.
Dengan menggunakan taraf nyata 5%, adakah alasan untuk mendukung
kebenaran di atas?
Penyelesaian soal di atas adalah sebagai berikut:
1. H0 : = 25%
H1 : 25%
2. Taraf nyata 5% dengan 2 sisi pengujian, maka nilai t 0,025 dengan derajat
kebebasan 9-1 =8 adalah 2,306.
3. Statistik uji dengan x = 20%, s = 1,8% dan n = 9
t
/ n
0,20 0,25
0,018 / 9
0,05
8,3
0,006
4. Kesimpulan: Hasil statistik uji -8,3 adalah lebih kecil daripada -2,306,
sehingga perbedaannya signifikan. Hipotesa ditolak. Kesimpulan ini
dapat ditunjukkan dalam gambar berikut:
Hal 72 dari 148
Handout Statistik 2
Apabila dipergunakan pengujian 1 sisi, maka langkah pengujian hipotesanya

menjadi sebagai berikut:
1. H0 : = 25%
H1 : < 25%
2. Taraf nyata 5% dengan 1 sisi pengujian dengan sisi pengujian sebelah kiri,
maka nilai t = -1,860.
3. Statistik uji hasilnya adalah -8,3.
4. Kesimpulan: Hasil statistik uji -8,3 adalah lebih kecil dari -1,860, maka
perbedaan dikatakan signifikan. Jadi hipotesa ditolak. Kesimpulan ini
dapat ditunjukkan dalam gambar berikut:
2.
Pengujian Hipotesa terhadap Proporsi

Distribusi binomial merupakan distribusi teoritis dari proporsi. Apabila
sampel semakin besar, distribusi binomial akan menyerupai distribusi normal.
Berdasarkan hal ini kita dapat menggunakan distribusi normal dalam pendekatan
distribusi sampling.
Dalam rangka untuk menerima atau menolak hipotesa yang berupa proporsi
akan digunakan statistik uji sebagai berikut:
P P0
P 0 (1 P0 )
n
Hal 73 dari 148
Handout Statistik 2
Pada hakekatnya P tidak dapat diketahui dan umumnya diganti dengan x/n,
sehingga statistik ujinya menjadi sebagai berikut:
x / n P0
P 0 (1 P0 )
n
Contoh: Personalia dari suatu perusahaan akan mengadakan promosi
terhadap para karyawan yang telah mengikuti pendidikan dan latihan dalam rangka
program pengembangan karyawan. Hasil pendidikan dan latihan menyatakan bahwa
80% atau 0,80 dari para karyawan yang telah mengikuti pendidikan dan latihan
akan memenui persyarataan promosi jabatan. Dalam rangka ini bagian personalia
mengambil langkah mengadakan wawancara langsung dari 150 karyawan yang telah
mengikuti pendidikan dan latihan sebagai sampel dan ternyata hanya 70% dari
sampel yang dapat dipertimbangkan dalam promosi jabatan.
Manajer
personalia
ingin
memperoleh
keyakinan
terhadap
hipotesa
yang
mengatakan bahwa 80% dari hasil pendidikan dan latihan akan memenuhi
persyaratan promosi jabatan dengan menggunakan taraf nyata 5%.
Penyelesaian masalah tersebut adalah sebagai berikut:
1.
H0 : P = 0,8
H1 : P 0,8
2.
Taraf nyata 5% dengan 2 sisi pengujian, maka nilai z0,025 adalah 1,96.
3.
Statistik hipotesa yang uji yang digunakan adalah
4.
x / n P0
P 0 (1 P0 )
n
0,70 0,80
(0,80)(0,20)
150
0,10 / 0,0010666 0,10 / 0,03 3.3
Kesimpulan: Hasil statistik uji -3,3 adalah lebih kecil daripada -1,96,
sehingga perbedaan antara sampel dan hipotesa adalah signifikan. Jadi
mengatakan bahwa 80% dari karyawan yang mengikuti pendidikan dan latihan
memenuhi persyaratan promosi ditolak. Kesimpulan ini dapat ditunjukkan
dalam gambar berikut:
Apabila menggunakan pengujian 1 sisi, langkah-langkahnya adalah sebagai berikut:

1.
H0 : P = 0,8
Hal 74 dari 148
Handout Statistik 2
H1 : P < 0,8
2.
Taraf nyata 5% dengan 1 sisi pengujian dengan sisi pengujian sebelah kiri,
maka nilai z = -1,64.
3.
Statistik uji hasilnya adalah -3,3.
4.
Kesimpulan: Hasil statistik uji -3,3 adalah lebih kecil dari -1,64, maka
perbedaan dikatakan signifikan. Jadi hipotesa ditolak. Kesimpulan ini dapat
ditunjukkan dalam gambar berikut:
3.
Pengujian Hipotesa Terhadap Perbedaan 2 Nilai Rata-Rata

Dalam pengambilan keputusan kadang-kadang seorang manajer harus
menentukan apakah parameter-parameter dari 2 populasi mempunyai persamaan
atau perbedaan. Contoh, sebuah perusahaan ingin menguji apakah penerimaan gaji
karyawati lebih rendah daripada penerimaan gaji karyawan yang mengerjakan
pekerjaan yang sama.
Untuk menyelesaikan permasalahan di atas, maka digunakan distribusi

sampling perbedaan dari 2 nilai rata-rata (sampling distribution of the difference
between sample means). Dapat dijelaskan dengan gambar berikut:
Hal 75 dari 148
Handout Statistik 2
Dari gambar di atas jelas bahwa perbedaan 2 nilai rata-rata adalah perbedaan
antara x1 dan x 2 . Perbedaan ini akan positifif apabila x1 lebih besar dari x 2 ,
sedangkan apabila x1 lebih kecil daripada x 2 maka hasilnya negatif.
Rata-rata distribusi sampling perbedaan 2 nilai rata-rata dinotasikan dengan
x x sama dengan x x dana jika 1 2 maka x x 0 .

1
Deviasi standar dari perbedaan 2 nilai rata-rata dinotasikan dengan:
x1 x2
12 22
n1
n2
dimana:
x x = standar error perbedaan 2 nilai rata-rata

1
= standar deviasi populasi 1

= standar deviasi populasi 2
n1
= besarnya sampel dari populasi 1
n2
= besarnya sampel dari populasi 2
Hal 76 dari 148
Handout Statistik 2
a.
Pengujian Hipotesa terhadap Perbedaan 2 Nilai RataRata Apbila Standar Deviasi Populasi Diketahui untuk Sampel Besar
Pengujian hipotesa terhadap perbedaan 2 nilai rata-rata dengan sampel besar yaitu
apabila jumlah sampel atau n lebih dari 30. Apabila kedua standar deviasi populasi
diketahui, maka statisik uji dirumuskan sebagai berikut:
( x1 x 2 ) ( 1 2 )
12 22
n1 n2
karena 1 2 maka perumusannya menjadi:
( x1 x 2 )
12 22
n1 n2
Contoh:
Sebuah perusahaan mebel ingin membandingkan efisiensi dari 2 sistem manajemen
dalam proses pembuatan mebel.
Dalam pembuatan mebel dibedakan 2 macam proses produksi, yaitu proses
mempersiapkan bahan setengah jadi dan proses menjadikan bahan jadi (finishing).
Untuk mengadakan pengamatan diambil jumlah sampel hari kerja yang sama yaitu
40 hari.
Dari mesin yang menghasilkan proses I dihasilkan rata-rata 30 unit, sedang proses II
menghasilkan rata-rata 28 unit.
Berdasarkan pengalaman yang lalu, deviasi standar proses I = 3, sedangkan proses II
= 2. Dengan menggunakan taraf nyata 5%, dapatkah kita mengatakan bahwa kedua
proses produsi tersebut mempunyai efisiensi yang berbeda?
Penyelesaian masalah tersebut adalah sebagai berikut:
1.
H0 : 1 = 2
H1 : 1 2
2.
Taraf nyata 5% dengan 2 sisi pengujian nilai z = 1,96.
3.
Statistik uji hasilnya adalah:
4.
(30 28)
9
4
40 40
2
0,325
2 / 0,57 3,5
Kesimpulan: Hasil statistik uji 3,3 adalah lebih besar dari 1,96, maka
perbedaan dikatakan signifikan. Jadi hipotesa ditolak. Kesimpulan ini dapat
ditunjukkan dalam gambar berikut:
Hal 77 dari 148
Handout Statistik 2
b.
Pengujian Hipotesa terhadap Perbedaan 2 Nilai Ratarata Apabila Standar Deviasi Populasi Tidak Diketahui Untuk Sampel Besar
Menggunakan rumus sebagai berikut:
( x1 x 2 )
s12 s 22
n1 n2
Deviasi standar sampel digunakan sebagai pendekatan deviasi standar populasi.

c.
Pengujian Hipotesa terhadap Perbedaan 2 Nilai RataRata Apabila Standar Deviasi Populasi Tidak Diketahui untuk Sampel Yang Kecil
Dalam pengujian hipotesa terhadap perbedaan 2 nilai rata-rata dengan sampel kecil
maka dipergunakan distribusi t dengan memperhatikan derajat kebebasan n-1.
Statistik uji untuk pengujian hipotesa ini menjadi:
( x1 x 2 )
(n1 1) s (n 2 1) s 22
(n1 n 2 2)
2
1
1 1
n1 n2
Contoh:
Seorang manajer produksi suatu perusahaan yang menghasilkan pompa air ingin
membandingkan efisiensi waktu perakitan 2 jenis pompa tangan jenis A dan B.
Untuk pompa tangan jenis A dipilih sampel sebanyak 10 buah. Setelah diadakan
pengamatan dalam perakitannya membutuhkan waktu rata-rata 20 menit setiap unit
pompa dengan deviasi standar 3 menit. Sedangkan untuk jenis B dipilih sampel 15
unit ternyata membutuhkan waktu rata-rata untuk perakitan 21 menit dengan
deviasi standar 2 menit.
Untuk pengujian hipotesa ini ditetapkan taraf nyata 5%. Penyelesaian masalah ini
adalah sebagai berikut:
1.
H0 : 1 = 2
Hal 78 dari 148
Handout Statistik 2
H1 : 1 2
2.
Taraf nyata 5% dengan 2 sisi pengujian berarti t 0,025 dengan derajat

kebebasan (n1+n2-2) = 10 + 15 -2 = 23 menurut tabel t = 2,069.
3.
( 20 21)
(9)(3) (14)(2)
(10 15 2)
4.
1
1
10 15
1
81 56
23
1
6
1
(5,96)(0,17)
1 / 1,007 0,99
Kesimpulan: Hasil statistik uji -0,99 > -2,069 maka perbedaan dikatakan
tidak signifikan. Jadi hipotesa diterima. Kesimpulan ini dapat ditunjukkan dalam
gambar berikut:
4.
Pengujian Hipotesa terhadap Perbedaan 2 Proporsi

Masalah lain yang penting dalam pengujian hipotesa terhadap 2 sampel adalah
perbedaan 2 proporsi. Pada hakekatnya pengujian hipotesa terhadap perbedaan 2
proporsi sama dengan pengujian hipotesa terhadap perbedaan 2 nilai rata-rata.
Dalam pengujian hipotesa terhadap perbedaan 2 proporsi ini akan dapat dijawab
pertanyaan-pertanyaan yang muncul berkaitan dengan apakah perbedaan 2 proporsi
sampel disebabkan karena faktor kebetulan ataukah disebabkan oleh faktor-faktor
yang lain.
Contoh: Dua perusahaan minuman botol A dan B telah memutuskan untuk

mengadakan perubahan bentuk botol dalam rangka untuk meningkatkan selera para
konsumennya. Oleh karena hal itu masih merupakan suatu usaha percobaan, maka
sementara dipasarkan 2 macam produk lama dan baru.
Manajer produksi 2 perusahaan ingin meneliti tentang proporsi preferensi para
konsumen terhadap produk baru. Dari hasil penelitian ini diperoleh bahwa dari
sampel 150 konsumen, 75 di antaranya menyukai produk baru dari perusahaan A
sedang dari sampel sebanyak 200 konsumen ternyata 120 di antaranya menyukai
produk baru dari perusahaan B.
Dengan menggunakan taraf nyata 1%, dapatkah kita mengambil keputusan bahwa
pemasaran produk baru minuman botol dari kedua perusahaan itu tidak berbeda?
Masalah tersebut dapat diselesaikan dengan langkah-langkah berikut:
Hal 79 dari 148
Handout Statistik 2
1.
H0 : p1 - p2 = 0
H1 : p1 - p2 0
2.
Taraf nyata 1% dengan 2 sisi pengujian z = 2,58.
3.
x1 / n1 x 2 / n2
P(1 P )(1 n1 1 n 2 )
dimana
nilai
x1 x 2
n1 n 2
sehingga dengan:
x1 = 75, n1 = 150, x1/n1 = 75/150 = 0,50
x2 = 120, n1 = 200, x2/n2 = 120/200 = 0,60
75 120
195 / 350 0,56
150 200
(1-P) = 1 0,56 = 0,44

z
4.
0,50 0,60
(0,56)(0,44)(1 150 1 200)
0,10
(0,2464)(0,01167 )
0,10 / 0,054 1,852
Kesimpulan: Hasil statistik uji -1,852 > -2,58 maka perbedaan dikatakan
tidak signifikan. Jadi hipotesa diterima. Jadi tidak ada perbedaan yang besar
proporsi para konsumen yang menyukai produk baru dari perusahaan A dan B.
Hal 80 dari 148
Handout Statistik 2
6. DISTRIBUSI KAI KUADRAT (X2)
Distribusi kai kuadrat (x2) merupakan metode pengujian hipotesa terhadap

perbedaan lebih dari 2 proporsi.
Contoh, manajer pemasaran suatu perusahaan ingin mengetahui apakah

perbedaan proporsi penjualan produk baru dari perusahaannya pada 3 daerah
pemasaran yang berbeda disebabkan karena kebetulan ataukan disebabkan karena
faktor-faktor lain, sehingga preferensi terhadap produkbaru pada 3 daerah
pemasaran tersebut berbeda.
Distribusi x2 (kai kuadrat) memiliki beberapa kelemahan pada penggunaannya,

yaitu:
1. Penggunaan pengujian terhadap persesuaian frekuensi hasil observasi dengan
frekuensi teoritisnya disebut test of goodness of fit.
2. Pengujian terhadap hubungan antar-variabel disebut test of independence
3. Pengujian terhadap homogenitas suatu variabel disebut test of homogenity.
A. Distribusi Kai Kuadrat (x2) dan Ciri-Cirinya
Distribusi variabel random x1, x2, .., xn yang normal memiliki E(x) = n dan
varians (x) = 2. Variabel random normal demikian dapat diubah dalam bentuk
standar dengan rumus:
z
dimana: E(x) = =0 dan varians (x) = 2 = 1

Andaikan kita memiliki statistik,
= x12 + x22 + .. xn2
maka statistik di atas memiliki distribusi x2 dengan fungsi kepadatan.
f ( )
1
2 ( n ) / 2 ( n / 2 ) 1e (1 / 2 ) ; 0
(n / 2 1)!
f ( ) 0 bagi yang lain
dimana
n = jumlah variabel random independen yang dijumlahkan. Variabel random
independen ini memiliki derajat kebebasan sebesar n.
Tabel Kai kuadrat dapat dilihat pada lampiran. Menurut tabel tersebut apabila
derajat kebebasan = 10, dan taraf nyata (signicant level) =10% maka akan diperoleh
nilai x2 = 15,99.
Dapat digambarkan sebagai berikut:
Bab 6: Distribusi Kai Kuadrat (x2)
Hal 81 dari 148
Handout Statistik 2
Menurut gambar di atas hipotesa akan ditolak untuk semua nilai-nilai yang lebih
besar daripada 15,99. Sedangkan untuk nilai-nilai kurang dari atau sama dengan
15,99 hipotesa diterima.
Pada hakekatnya rata-rata dan varians distribusi x 2 dimana semua variabel yang
berjumlah n adalah independen dengan derajat kebebasan = n, dinyatakan dengan:
E ( x 2 ) x 2 n
Varians x2= 2x2 = 2n
Di dalam kenyataan kita jarang menjumpai variabel random yang independen

dan dalam bentuk distribusi normal dengan rata-rata nol dan varians = 1. Jika kita
memiliki
variabel
random
dengan
distribusi
normal,
kita
selalu
dapat
menstandarisir.
Andaikan kita memiliki serangkaian variabel random x 1, x2, .. xn yang normal

dengan 1, 2, n dan varians 12, 22 n2 maka variabel di atas dapat diubah ke
dalam:
zi
xi
; i = 1,2.n
i
dimana z1, z2, .. zn merupakan rangkaian variabel random yang didistribusikan

secara normal dan independen dengan rata-rata () = 0 dan varians = 1. Sehingga
dapat dikatakan
x
memiliki distribusi kai kuadrat dengan derajat kebebasan = n.
Jika x12 dan x22 independen dan memiliki distribusi x 2 dengan derajat
kebebasan sebesar n1 + n2 maka x12 + x22 akan didistribusikan sebagai x2 dengan
derajat kebebasan kebebasan sebesar n 1 + n2. Kaedah penjumlahan ini berlaku
umum bagi sejumlah k variabel x2 yang independen.
Karl Pearson beranggapan bahwa distribusi multinomial yang diskrit dapat

diubah mendekati distribusi x2 jika n mendekati tidak terhingga.
Perumusan tentang hubungan distribusi multinomial dan distribusi x 2 di atas

menjadikan distribusi x2 suatu distribusi yang penting artinya dalam analisa statistik.
Hal 82 dari 148
Handout Statistik 2
Contoh: Misalkan probabilitas terjadinya suatu peristiwa = 1/4. Sedangkan
peristiwa tersebut terjadi sebanyak 40 kali sebagaimana disajikan dalam tabel

berikut:
Peristiwa (x)
1
2
3
4
Jumlah
N
8
11
12
9
40
Dari tabel di atas p = 1/4 dan n =40. Distribusi bersama (joint distribution) n1, n2, n3
dan n4 disebut distribusi multinomial dengan fungsi kepadatan (density function):
f ( n1 ,n2 ,n2 ,n4 )
n!
n
n
n
n
p1 1 p 2 2 p3 3 p 4 4
n1 ! n 2 ! n3 ! n 4 !
Karl Pearson mengungkapkan, jika
xi
ni npi
np i
2
2
2
2
dan jika x1 x 2 x3 x4
maka distribusi akan mendekati distribusi x2 dengan derajat kebebasan sebesar 4

1 = 3 jika n menjadi semakin besar.
Berapa besar n yang dibutuhan agar secara aproksimatif mendekati distribusi x 2?
Jika npi > 5 maka kita dapat menggunakan distribusi x2 sebagai pendekatan. Jika npi
< 5 kelompok atau kategori yang terlampau kecil harus digabung agar np i > 5 dapat
dipenuhi.
B. Penggunaan Distribusi Kai Kuadrat
1.
Pengujian tentang Kompabilitas (Test of Goodness of Fit)
Dalam pengujian tentang kompabilitas, persoalan yang kita hadapi adalah

menguji apakah frekuensi yang diobservasi memang konsisten dengan frekuensi
teoritisnya. Apabila konsisten atau tidak terdapat perbedaan yang nyata atau
signifikan, maka hipotesa dapat diterima. Sebaliknya apabila tidak terdapat
konsistensi, maka hipotesa ditolak artinya hipotesa teoritisnya tidak didukung
oleh hasil observasinya.
Perkiraan Pearson dirumuskan sebagai berikut:
x2
(ni npi ) 2
npi
dapat pula secara skematis ditulis sebagai berikut:
x2
(Oi E i ) 2
Ei
atau
( fo fe )2
f
e
dengan derajat kebebasan sebesar k 1
dimana
Hal 83 dari 148
Handout Statistik 2
Oi
= Frekuensi observasi (fo)
Ei
= Frekuensi teoritis (fe)
x2 merupakan ukuran perbedaan antara frekuensi observasi dengan frekuensi

teoritis, apabila tidak ada perbedaan antara frekuensi observasi dengan frekuensi
teoritis, maka x2 = 0.
Semakin besar perbedaan antara frekuensi observasi dengan frekuensi teoritis

maka nilai x2 akan menjadi besar.
Nilai x2 akan dievaluasi dengan distribusi kai kuadrat. Prosedur pengujian

hipotesa dilakukan dengan langkah-langkah sebagai berikut:
a.
nyatakan hipotesa nol dan hipotesa alternatifnya
b.
tentukan taraf nyata dan derajat kebebasannya
c.
tentukan statistik uji x2 .
d.
pengambilan keputusan
Contoh: Sebuah lembaga manajemen ingin mengetahui pola konsumsi terhadap

5 macam merk ban mobil yang dominan di dalam pemasaran ban. Untuk
keperluan ini dipilih 1000 orang konsumen.
Dari hasil observasi yang dilakukan terhadap sampel ini, diperoleh informasi
sebagai berikut:
Preferensi Merk Ban
A
B
C
D
E
Jumlah
Jumlah Konsumen
210
310
170
85
225
1000
Apabila proporsi preferensi konsumen untuk setiap merk ban dinyatakan dengan
PA, PB, PC, PD, PE, kita dapat merumuskan hipotesa nol dan hipotesa alternatifnya
sebagai berikut:
a. H0 : PA = PB = PC = PD = PE = 0,20
H1 : PA PB PC PD PE 0,20
b. Taraf nyata 5% dengan derajat kebebasan k -1 = 5 -1 = 4. Menurut tabel, x 2
= 9,488.
c. Statistik uji yang dipergunakan adalah sebagai berikut:
x2
( fo fe )2
fe
Prefensi
Frekuensi
Frekuensi
Konsumsi
Observasi
Teoritis
(fo-fe)
(fo-fe)2
(f0-fe)2
fe
Hal 84 dari 148
Handout Statistik 2
Ban
A
B
C
D
E
Jumlah
(fo)
210
310
170
85
225
1000
(fe)
200
200
200
200
200
1000
10
110
-30
-115
25
0
100
12100
900
13225
625
26950
x2
0,500
60,500
4,500
66,125
3,125
134,750
( fo fe )2
= 134,750
fe
d. Kesimpulan:
Hasil statistik uji x2 = 134,750 lebih besar daripada 9,488. Berarti ada
perbedaan yang significant antara frekuensi hasil observasi dengan
frekuensi teoritis, sehingga hipotesa yang mengatakan bahwa tidak ada
perbedaan proporsi konsumsi ban untuk ke-5 merk ditolak (H 0 ditolak).
Jelasnya dapat dilihat dengan gambar berikut:
2.
Pengujian Sifat Independensi (Test of Independence)
Pengujian
kompabilitas
digunakan
jika data
populasi maupun sampel
diklasifikasikan menurut satu atribut tunggal (single atribute) maupun jika kita
ingin menguji distribusi probabilitas populasi hipotesis.
Apabila klasifikasi data sampel maupun data populasi dalam beberapa atribut
sedang distribusi probabilitasnya tidak diketahui, maka pengujian kompabilitas
sulit digunakan. Misalkan setiap konsumen dapat diklasifikasikan menurut
penghasilannya dan kualitas sabun mandi yang dipergunakan, sedang proporsi
tiap golongan dalam populasi tidak diketahui. Persoalan yang ingin diketahui
adalah apakah ada hubungan antara penghasilan dan kualitas sabun mandi yang
dipergunakan. Pengujian yang demikian disebut pengujian sifat independensi.
Dalam pengujian hipotesa ini kita hanya sampai pada kesimpulan apakah kedua
atribut tersebut mempunyai sifat independen atau tidak.
a.
Populasi Tabel Dwikasta

Populasi
yang
terdiri
dari
keluarga
konsumen
sabun
mandi
dapat
diklasifikasikan menurut tingkat penghasilannya dan jenis sabun mandi yang
Hal 85 dari 148
Handout Statistik 2
digunakannya. Klasifikasi ini dapat disajikan dalam tabel dwikasta sebagai

berikut:
Penghasilan
Tinggi (A1)
Rendah (A2)
Jumlah Kolom (Nj)
Kualitas Sabun Mandi

Baik (B1)
Rendah (B2)
N11
N12
N21
N22
N.1
N.2
Jenis Baris
(Ni)
N1
N2
N
Keterangan:
N
= Jumlah seluruh unsur populasi
N11
= Jumlah konsumen yang penghasilanya tinggi (A) dan menggunakan

sabun mandi kualitas baik (B1)
N1
= Penjunlahan baris 1
N.1
= Penjumlahan Kolom 1
= Indeks baris
= Indeks kolom
Apabila dinyatakan dalam bentuk proporsi maka tabelnya menjadi sebagai

berikut:
Penghasilan
Tinggi (A1)
Rendah (A2)
Jumlah Kolom (Nj)

Baik (B1)
Rendah (B2)
N11/N = P11
N12/N = P12
N21/N = P21
N22/N = P22
P.1
P.2
Jenis Baris
(Ni)
P1
P2
1,0
Keterangan:
P11
= Proporsi populasi yang mempunyai penghasilan tinggi yang

menggunakan sabun mandi kualitas baik
P.1 + P.2
= N.1/N + N.2/N = 1
P1 +P2
= N1/N + N2/N = 1
= Proporsi Populasi yang tidak diketahui
b.
Sampel dan Tabel Dwikasta

Random sampel sebesar n yagn dipilih dari populasi yang diklasifikasikan
menurut tingkat penghasilan dan kualitas sabun mandi yang dipergunakan.
Hasilnya dapat disajikan dalam tabel ini.

Penghasilan
Tinggi (A1)

Baik (B1)
Rendah (B2)
n11
n12
Jenis Baris
(ni)
n1
Hal 86 dari 148
Handout Statistik 2
Rendah (A2)
Jumlah Kolom (Nj)
n21
n.1
n22
n.2
n2
n
Misalkan sebuah sampel sebesar n = 300 yang dipilih dari populasi, ternyata
yang berpenghasilan tinggi n1 = 100, n2 = 200, n.1 = 150 dan n.2 = 150, dan jika
kelompok
yang
berpenghasilan
tinggi
sejumlah
40
orang
ternyata
mempergunakan sabun mandi kualitas yang baik, maka dengan sendirinya

kelompok yang mempergunakan sabun mandi kualitas rendah adalah 60 orang.
Sedangkan kelompok yang berpenghasilan rendah akan mempergunakan sabun
mandi kualitas baik 110 dan kualitas rendah 90. Maka tabel dwikastanya
menjadi:
Baik (B1)
Rendah (B2)
40
60
110
90
n.1 = 150
n.2 = 150
Penghasilan
Tinggi (A1)
Rendah (A2)
Jumlah Kolom (Nj)
Jenis Baris
(ni)
n1 = 100
n2= 200
300
Selanjutnya untuk masing-masing baris dan kolom dapat dihitung frekuensi

teoritisnya.
Baris 1 kolom 1, fe = n1 x (n.1/n) = 100 x 150/300 = 50
Baik (B1)
Rendah (B2)
Fo
fe
fo
fe
40
(50)
60
(50)
110
(100)
90
(100)
150
(150)
150
(150)
Penghasilan
Tinggi (A1)
Rendah (A2)
Jumlah Kolom (Nj)
Jenis Baris
(ni)
100
200
300
Prosedur pengujian hipotesa dilakukan dengan langkah-langkah:

H0 : Ada hubungan antara tingkat penghasilan dan kualitas sabun
mandi yang digunakan
H1 : Tidak ada hubungan antara tingkat penghasilan dan kualitas sabun
mandi yang digunakan
a.
Taraf nyata 5% dengan derajat kebebasan (r-1) (c-1) = (2-1) (2-1) = 1.

Menurut tabel, x2 = 3,841.
b.
Statistik uji yang dipergunakan adalah sebagai berikut:
x2
x2
c.
( fo fe )2
fe
40 50 2
50
(60 50) 2 (110 100) 2 (90 100) 2
6
50
100
100
Kesimpulan:
Hasil statistik uji = 6 adalah lebih besar daripada 3,841. Berarti perbedaanya
signifikan atau cukup besar, sehingga hipotesa ditolak. Yang berarti bahwa
Hal 87 dari 148
Handout Statistik 2
tidak ada hubungan antara tingkat penghasilan dengan sabun mandi yang
dipergunakan.
3.
Pengujian terhadap Sifat Homogenitas (Test of Homogenity)
Dalam pengujian hipotesa kita kadang-kadang dihadapkan pada suatu masalah

apakah 2 sampel lebih berasal dari satu populasi atau dengan perkataan lain
apakah satu sampel dengan sampel lain mempunyai persamaan.
Pengujian untuk mengetahui apakah 2 sampel atau lebih bersifat homogen atau
sama disebut pengujian sifat homogenitas atau test of homogenity.
Sample ALTA
Sampel 1
Sampel 2
10
10
20
10
30
40
20
30
20
10
n1 = 100
n2 = 100
Nilai
A
B
C
D
F
Jumlah
20
30
70
50
30
n = 200
Suatu penelitian terhadap hasil seleksi perguruan tinggi terhadap 2 sampel

sekolah lanjutan tingkat atas yang masing-masing dengan sampel sebesar 100,
menunjukkan hasil nilai seleksi sebagai berikut:
a.
Hipotesa nol dapat dirumuskan kedua sampel di atas

mempunyai distribusi probabilitas yang sama yaitu distribusi probabilitas
dari populasi.
Hipotesa alternatifnya menyatakan bahwa kedua sampel tersebut tidak
memiliki distribusi probabilitas yang sama.
b.
Taraf nyata 5% dengan derajat kebebasan (5-1) (2-1) =

4. Menurut tabel x = 9,49
2
Statistik uji yang dipergunakan adalah x2.
c.
Sebelum kita menghitung nilai x2, kita menghitung frekuensi teoritisnya lebih
dahulu dan membandingkannya dengan frekuensi observasinya.
fe 11 = n1 x (n1/n) = 100 x 20/300 = 10
fe 21 = n1 x (n1/n) = 100 x 30/300 = 15
fe 31 = n2 x (n1/n) = 100 x 70/300 = 35
Hal 88 dari 148
Handout Statistik 2
fe 41 = n2 x (n1/n) = 100 x 50/300 = 25

fe 51 = n2 x (n1/n) = 100 x 30/300 = 15
Untuk nilai fe 21, fe 22, fe 23, fe 24 dan fe 25 nilainya sama dengan di atas.
Nilai
A
B
C
D
F
Sample ALTA
Sampel 1
Sampel 2
fo
Fe
fo
fe
10
20
30
20
20
(10)
(15)
(35)
(25)
(15)
10
10
40
30
10
(10)
(15)
(35)
(25)
(15)
Sampel 1
Sampel 2
(fo f2)2
(fo f2)
fe
0/10 = 0
25/15 = 1,6
25/35 = 0,7
25/25 = 1
25/15 = 1,6
fe
0/10 = 0
25/15 = 1,6
25/35 = 0,7
25/25 = 1
25/15 = 1,6
Jumlah
()
0
3,2
1,4
2,0
3,2
x2 = 9,8
d.
Kesimpulan:
Hasil statistik uji 9,8 lebih besar daripada 9,48. Berarti ada perbedaan yang
signifikan sehingga hipotesa ditolak. Dapat dijelaskan dalam gambar berikut:
Hal 89 dari 148
Handout Statistik 2
7. ANALISA VARIANS
Pembahasan sebelumnya menyatakan bahwa distribusi kai kuadrat (x 2)
merupakan pengujian hipotesa untuk mengetahui perbedaan lebih dari 2 proporsi,

sehingga kita dapat mengambil keputusan apakah sampel tersebut berasal dari
populasi yang memiliki proporsi yang sama.
Suatu metode pengujian hipotesa yang dapat digunakan untuk mengadakan
pengujian terhadap lebih dari 2 rata-rata sampel disebut Analisa Varians

Dengan menggunakan analisa varians kita akan dapat mengambil suatu
kesimpulan apakah sampel tersebut berasal dari populasi yang memiliki nilai ratarata yang sama.
Contoh: analisa varians dapat digunakan untuk membandingkan daya tahan 4
macam
produksi
ban.
Membandingkan
macam
metode
latihan
yang
diselenggarakan oleh suatu perusahaan dalam rangka peningkatan karir para

karyawannya.
Analisa varians selanjutnya dikenal sebagai distribusi F yang dikembangkan oleh
RA Fisher pada tahun 1920.

A. Perumusan Masalah
Manajer pendidikan dan latihan suatu perusahaan perakitan radio kaset ingin
mengadakan evaluasi terhadap 3 metode pendidikan dan latihan bagi karyawankaryawannya yang baru.
Ada 3 macam metode pendidikan dan latihan sebagai berikut:
1.
Pendidikan dan latihan terhadap para karyawan yang baru dengan

cara mendidik dan melatih secara individual di dalam perusahaan.
2.
Mendidik masing-masing karyawan baru secara individual dan

terpisah dengan bimbingan pelatih
3.
Mendidik dan melatih para karyawan baru dengan metode audio

visual, film dengan belajar mandiri.
Setelah pendidikan dan latihan dapat diselesaikan, manajer produksi bersama

dengan manajer pendidikan dan latihan mengadakan evaluasi terhadap hasilnya.
Untuk keperluan penelitian ini dipilih sampel 5 orang karyawan yang telah
mengikuti masing-masing metode dan dilakukan pencatatan terhadap hasil produksi
setiap hari yang dapat diselesaikan oleh masing-masing karyawan tersebut seperti
disajikan dalam tabel berikut:
Bab 7: Analisa Varians
Hal 90 dari 148
Handout Statistik 2
Metode I
15
18
19
22
11
= 85
x1 = 17
Metode II
22
27
18
21
17
= 105
x 2 = 21
Metode III
18
24
16
22
15
= 95
x 3 = 19
B. Perumusan Hipotesa
Metode analisa varians dipergunakan untuk mengetahui apakah rata-rata dari 3
sampel karyawan yang telah mengikuti pendidikan dan latihan dengan metode yang
berbeda ini mempunyai perbedaan dalam produktifitas ataukah tidak. Dengan kata
lain dapat dikatakan apakah 3 sampel yang masing-masing berupa rata-rata sampel
I, II dan III bersifat dari populasi yang sama.
Perumusan hipotesa nol:
H0 : 1 = 2 = 3
H1 : 1 2 3
Apabila di dalam pengujian hipotesa ini 3 rata-rata sampel sama, kita sampai
pada kesimpulan bahwa 3 macam metode pendidikan dan latihan ini tidak
mempengaruhi produktivitas karyawan.
Sebaliknya apabila ke-3 rata-rata sampel tersebut menunjukkan perbedaan yang
nyata atau berarti signifikan, maka berarti ketiga macam metode pendidikan dan
latihan tersebut mempengaruhi produktivitas karyawan, sehingga perlu adanya
peninjauan kembali terhadap ketiga macam metode pendidikan dan latihan tersebut.
C. Konsep Dasar Analisa Varians
Di dalam analisa varians kita selalu beranggapan bahwa sampel yang dipilih
berasal dari populasi yang normal dengan varians yang sama, kecuali jika sampel
yang dipilih cukup besar, maka anggapan tentang distribusi normal ini tidak
diperlukan.
Di dalam penelaahan 3 macam metode pendidikan dan latihan ini hipotesa nol
merumuskan bahwa ketiga populasi ini mempunyai nilai rata-rata yang sama.
Apabila hipotesa ini benar, maka klasifikasi dalam 3 macam metode dalam tabel di
atas tidak perlu karena semua sampel berasal dari satu populasi.
Analisa varians berdasarkan pada perbandingan 2 macam nilai penduga
terhadap varians populasi (2). 2 nilai penduga varians populasi tersebut adalah:
a.
Varians antar sampel (variance among the sample

means)
Varians antar sampel ini selanjutnya dinotasikan dengan S a2. Dalam contoh di
atas, varians antar sampel adalah varians di antara nilai rata-rata sampel 1 = 17,
rata-rata sampel 2 =17 dan rata-rata sampel 3 = 19.
Hal 91 dari 148
Handout Statistik 2
b.
Varians dalam sampel (variance within the sample

means)
Varians dalam sampel adalah varians di dalam ketiga sampel. Dalam contoh yang
dimaksud dengan varians dalam sampel adalah dari data (15, 18,19,22,11),
(22,27,18,21,17) dan (18,24,16,22,15). Varians dalam sampel ini dinotasikan
dengan Sw2.
Perbandingan 2 nilai varians tersebut merupakan penduga terhadap varians

populasi. Apabila nilai penduga ini sama atau mendekati sama, maka hipotesa benar.
Sebaliknya apabila kedua nilai perbandingan ini berbeda dengan varians
populasinya, maka hipotesanya keliru.
Kita dapat menyimpulkan ketiga langkah dalam analisa varians tersebut sebagai
berikut:
1. Tentukan penduga pertama dari varians populasi dari varians antar sampel
2. Tentukan penduga kedua terhadap varians populasi dari varians dalam sampel
3. Bandingkan kedua nilai penduga ini. Jika hasilnya mendekati sama atau hampir
sama berarti hipotesanya benar.
D. Cara Perhitungan Varians Antar Sampel

Langkah pertama dalam analisa varians adalah menghitung penduga
pertama varians populasi dari varians antar sampel. Dalam contoh ada 3 sampel,
varians antar sampel di dalam istilah statistik disebut pula sebagai between column
sample (varians antar kolom).
Rumus varians sampel adalah sebagai berikut:
(x x)
n 1
Karena kita menghitung 3 nilai rata-rata sampel dan rata-rata
keseluruhan, maka selanjutnya x diganti dengan x dan x diganti dengan x (ratarata keseluruhan/rata-rata dari rata-rata).
Varians antar sampel dirumuskan sebagai berikut:
S a2
(x x )
n 1
n di sini adalah 3 sampel atau 3 kolom.

Perhitungan data menjadi sebagai berikut:
x
19
19
19
17
21
19
S a2
(x -x )
-2
2
0
( x - x )2
4
4
0
( x - x )2=8
8
4
(3 1)
Bertolak pada rumus standard error of mean atau standar error yagn
dirumuskan dengan:
Hal 92 dari 148
Handout Statistik 2
= standard error of mean
= standar deviasi populasi

n
= besarnya sampel, dalam contoh ini 5 dan bukan 3.
Rumus ini dapat ditulis:

x n
atau
2 x n
Karena nilai standard error of mean tidak dimiliki, maka nilai ini diganti dengan
standar deviasi antar sampel sebagai penduga pertama dari varians populasi.
Perumusan varians populasi yang diduga menjadi:
2
2 Sa n
2
dimana S a 4 dan n = 5,sehingga:
2 = 4 x 5 =20
E. Cara Perhitungan Varians Dalam Sampel
Penduga varians populasi yang kedua adalah varians dalam sampel.
Varians ini disebut juga within column variance.

Kita mempunyai anggapan bahwa varians dari ketiga populasi sama. Oleh
sebab itu, kita dapat menggunakan salah satu varians sampel sebagai penduga
varians populasi yang kedua.
Penduga terhadap varians populasi ini akan menjadi lebih tepat apabila
kita menggunakan ketiga varians sampel ini sebagai penduga yang kedua.
Varians dalam sampel dirumuskan dengan:
S w2
S12 S 22 ..... S n2
n
Sw2 = Varians dalam sampel

S12 ++ Sn2= varians sampel 1 sampai ke-n
n
= banyaknya sampel/banyaknya kolom
Perhitungan varians dalam sampel dapat dilihat pada tabel berikut:
Hal 93 dari 148
Handout Statistik 2
Metode I
Metode II
Metode III
Rata-rata sampel = 17
x1 )
( x x1 ) ( x x1 ) 2
X
15
18
19
22
11
-2
1
2
5
-6
x1 =17
=70
S12
4
1
4
25
36
(x
x1 ) 2
(x x )
22
27
18
21
17
1
6
-3
0
4
x2 =21
62
n 1
S12 = 70/(5-1) = 70/4 = 17,5
S w2
( x x1 ) ( x x1 ) 2
( x3 )
x2 )
S 22
1
36
9
0
16
(x
x1 ) 2 =
(x x
n 1
( x x1 ) ( x x1 ) 2
X
18
24
16
22
15
-1
5
-3
3
-4
x 3 =19
(x
60
2
S22 = 62/(5-1) = 62/4 = 15,5
1
25
9
9
16
S2
x1 ) 2 =
(x x )
n 1
S32 = 60/(5-1) = 60/4 = 15
S12 S 22 S 32 17,5 15,5 15 48
16 (penduga kedua varians populasi)

3
3
3
F. Pengujian Statistik F
Statistik F selanjutnya disingkat F merupakan rasio dari varians antar

sampel sebagai penduga varians populasi yang pertama dengan varians dalam
sampel sebagai penduga populasi yang kedua, selanjutnya dirumuskan:
S a2
S w2
Sehingga dengan data dalam contoh didapat F = 20/16 = 1,25
Pembilang, dalam hal ini varians antar sampel sebagai penduga varians
populasi merupakan penduga yang baik. Penyebut dalam hal ini varians dalam
sampel sebagai penduga varians populasi merupakan penduga yang baik pula.
Dengan demikian apabila hipotesanya benar, maka nilai pembilang dan penyebut
akan cenderung sama.
Jika nilai F semakin mendekati 1, semakin besar kemungkinan hipotesa

nol dapat diterima. Sebaliknya apabila nilai F besar, semakin besar kemungkinan
hipotesa nol ditolak dan semakin besar kemungkinan hipotesa alternatif diterima.
G. Distribusi F
Distribusi F ditandai dengan 2 macam derajat kebebasan, yaitu derajat

kebebasan dari pembilang dan derajat kebebasan dari penyebut. Bentuk dari
distribusi F sangat ditentukan oleh 2 nilai derajat kebebasan ini.
Bentuk umum dari kurva distribusi F adalah condong ke kanan dan akan
cenderung menjadi bentuk normal atau simetris apabila derajat kebebasan dari
pembilang dan penyebut semakin besar.
Bentuk ketiga macam kurva distribusi F dapat disajikan dalam gambar berikut:
Hal 94 dari 148
Handout Statistik 2
Dari gambar di atas dapat dilihat bahwa semakin besar derajat kebebasan dari
pembilang dan penyebut, maka bentuk kurva akan mendekati suatu bentuk kurva
normal atau kurva yang simetris.
H. Derajat Kebebasan dari Distribusi F
Distribusi F mempunyai 2 macam derajat kebebasan, yaitu derajat kebebasan
pembilang dan derajat kebebasan penyebut.

1.
Derajat kebebasan Pembilang (numerator)
Dalam menghitung varians antar sampel (Sa2) dalam contoh didasarkan pada 3
nilai varians sampel untuk memperoleh ( x x ) 2 untuk memperoleh ( x x ) 2 .
Apabila kita dapat mengetahui kedua nilai ( x x ) 2 maka untuk menilai yang
ketiga secara otomatis dapat diketahui/ditentukan sehingga kita mengatakan
kehilangan 1 derajat kebebasan dari jumlah sampel (jumlah kolom).
Dari penjelasan ini dapat dirumuskan:

Derajat kebebasan pembilang = (jumlah sampel 1)
atau
Derajat kebebasan pembilang = n 1
Dimana n juga dipakai k (kolom)
2.
Derajat kebebasan Penyebut (Denominator)
Di dalam perhitungan varians dalam sampel, kita menggunakan semua nilai

sampel, dalam menghitung ( x x ) 2 kita menggunakan 5 nilai ( x x ) .
Apabila kita mengetahui 4 nilai ( x x ) maka nilai yang kelima secara

otomatis dapat dihitung/ditentukan. Sehingga kita kehilangan 1 derajat
kebebasan untuk setiap sampel. Karena ada 3 sampel, maka kita hanya
mempunyai 4 x 3 = 12 derajat kebebasan.
Hal ini dapat dirumuskan sebagai berikut:
Hal 95 dari 148
Handout Statistik 2
Derajat kebebasan penyebut = (jumlah data setiap sampel 1) (jumlah sampel)

Derajat kebebasan penyebut = (n-1) x k
Dalam contoh n=5 dan k=3 sehingga derajat kebebasan penyebut = (5 -1) x 3 =12.
I. Cara Mempergunakan Tabel F
Guna pengujian hipotesa dengan distribusi F kita mempergunakan Tabel F.

Dalam tabel F, kolom menunjukkan derajat kebebasan dari pembilang dan pada
baris menunjukkan derajat kebebasan untuk penyebut.
Tabel F akan berbeda untuk setiap taraf nyata.
Contoh: pada taraf nyata 5%, dengan derajat kebebasan pembilang = 2 dan
derajat kebebasan penyebut = 12, maka tabel F = 3,89.
J. Kesimpulan dari Pengujian Hipotesa
Dalam pengujian hipotesa terhadap 3 macam metode pendidikan dan latihan

telah diperoleh hasil statistik uji dari distribusi F = 1,25. Hasil ini kita bandingkan
dengan nilai tabel = 3,89. Karena hasil statistik uji lebih kecil maka perbedaan
dikatakan tidak nyata sehingga hipotesa dapat diterima.
Dapat dijelaskan dalam gambar berikut:
Karena statistik uji F = 1,25 terletak pada daerah penerimaan, maka hipotesa
diterima. Kita dapat menarik kesimpulan bahwa ketiga metode pendidikan dan
latihan tersebut tidak menimbulkan perbedaan dalam produktivitas tenaga kerja.
K. Pengujian Hipotesa dengan Distribusi F Apabila Sampel Tidak Sama
Sebuah perusahaan pakaian jadi yang besar menerima pesanan berupa produk
baru dalam jumlah yang besar, sehingga diputuskan akan ditunjuk alternatif 5 subkontraktor, yang masing-masing perusahaan sub-kontraktor ini menggunakan 400
orang tenaga kerja. Perusahaan kontraktor sangat menaruh perhatian terhadap
masalah tenaga kerja, sehingga dilakukan penelitian terhadap tingkat absensi para
karyawan pada kelima perusahaan sub-kontraktor selama beberapa hari kerja.
Penelitian ini dimaksudkan untuk mengetahui apakah tingkat persentase absensi
Hal 96 dari 148
Handout Statistik 2
pada kelima perusahaan sub-kontraktor itu sama atau berbeda, dengan taraf nyata
5%.
Dari hasil pengumpulan data absensi karyawan pada kelima perusahaan sub-
kontraktor diperoleh data sebagai berikut (dalam persentase):

Perusahaan
A
B
C
D
E
Persentase absensi berdasar sampel hari kerja

9
10
11
7
6
8
7
7
7
9
8
5
7
10
8
7
8
6
11
sampel
6
5
4
3
2
Penyelesaian masalah ini dilakukan dengan langkah-langkah berikut:
H0 : 1 = 2 = 3 = 4 = 5
a.
H1 : 1 2 3 4 5
b.
Statistik uji distribusi F didasarkan pada perhitungan:

1.
varians antar sampel (Sa2)

Rata-rata ( x )
A=9
B=7
C=8
D=6
E = 10,5
x -x
8
8
8
8
8
1
-1
0
-2
2,5
x -x
)2
1
1
0
4
6,25
- x )2 =12,25
2
a
S = 12,25/4 = 3,06
(9 6) (7 5) (8 4) (6 3) (10,5 2)
x
160 / 20 8
65 43 2
Varians antar sampel dengan hasil 3,06 adalah penduga pertama terhadap
varians populasi. Pada sampel yang tidak sama pernduga pertama ini tidak
dikalikan dengan n (besarnya sampel) lagi karena pada perhitungan rata-rata
keseluruhan sudah digunakan faktor penimbang.
2.
Varians dalam Sampel (Sw2)

Perhitungan varians dalam sampel adalah sebagai berikut:
Perusahaan A
Rata-rata: 9
Perusahaan B
Rata-rata: 7
Perusahaan C
Rata-rata: 8
Perusahaan D
Rata-rata: 6
Hal 97 dari 148
Perusahaan E
Rata-rata: 10
Handout Statistik 2
n1 = 6
n2 = 5
n3 = 4
n4 = 3
n5 = 2
(x x) (x x)2
(x x) (x x)2
(x x) (x x)2
(x x) (x x)2
(x x) (x x)2
-1
0
1
2
-2
0
1
0
1
4
4
0
= 10
S12 = 10/(6-1) = 2
0
-1
1
0
0
0
1
1
0
0
=2
S22 = 2/(5-1) = 0,5
S w2
3.
0
-1
1
0
0
1
1
0
=2
S32 = 2/(4-1) = 0,67
0
-1
1
0
1
1
=2
S42 = 2/(3-1) = 1
2 0,5 0,67 1 0,5 4,67
0,934
5
5
0,5
-0,5
= 0,5
S52 = 0,5/(2-1) = 0,5
Nilai F
Nilai F merupakan rasio dari kedua penduga parameter (varians populasi) =
3,06/0,934 = 3,28.
Taraf nyata 5% dengan derajat kebebasan pembilang = 5 1 = 4. Derajat
kebebasan penyebut = (6-1) + (5-1) + (4-1) + (3-1) + (2-1) = 15.
Tabel F = 3,06.
c.
Kesimpulan:
Hasil statistik uji
= 3,28 lebih besar daripada 3,06 (f tabel) berarti ada
perbedaan yang nyata sehingga hipotesa ditolak. Artinya persentase absensi pada
masing-masing perusahaan sub-kontraktor tidak sama.
L. Analisa Varians dengan 2 Klasifikasi (Two way Anova)

Kita ingin mengetahui variasi yang timbul dengan adanya media promosi yang
berbeda dari berbagai macam komoditi dagangan. 2 klasifikasi ini meliputi

klasifikasi macam media promosi di satu pihak dan klasifikasi macam komoditi
dagangan dipihak lain.
Dalam pengamatan ini akan diteliti:
a.
0,25
0,25
apakah ada perbedaan 3 macam media promosi?

Hal 98 dari 148
Handout Statistik 2
b.
apakah ada pengaruh dalam pengelompokan macam

komoditi dagangan?
Hasil penelitian tentang media promosi dan macam komoditi dagangan dapat
dilihat dalam tabel berikut:

Macam
Macam Media Promosi
Komoditi
Dagangan
A
B
C
Jumlah
Radio
TV
Surat Kabar
24
23
25
72
19
17
21
57
20
14
17
51
Jumlah
63
54
63
180
3 macam komoditi dagangan dipromosikan dengan 3 media promosi yang
berbeda yaitu media radio, TV dan Surat kabar. Dengan menggunakan taraf nyata
5%, ujilah:
a.
Apakah efektifitas ketiga media promosi itu sama?
b.
Apakah pengelompokan menjadi 3 macam komoditi dagangan

itu tidak ada pengaruhnya?
Dalam uji hipotesa ini kita mempunyai 2 macam hipotesa yaitu:

a. H0 : 1 = 2 = 3 =
H1 : 1 2 3 (hipotesa berdasar baris/macam komoditi)
b. H0 : .1 = .2 = .3 =
H1 : .1 .2 .3 (hipotesa berdasar kolom/media promosi)
Beberapa notasi yang digunakan adalah:

SSR
= jumlah kuadrat baris
SSC
= jumlah kuadrat kolom
SSE
= jumlah kuadrat penyimpangan
SST
= total dari jumlah kuadrat
MSS
= rata-rata dari jumlah kuadrat
MSSR
= varians berdasar baris
MSSC
= varians berdasar kolom
MSSE
= varians berdasar penyimpangan
Tabel Anova dapat disusun sebagai berikut:

Varians
Baris (b)
Jumlah
Derajat
Kuadrat (SS)
kebebasan (df)
SSR
(b-1)
Rata-rata jumlah kuadrat (MSS)
S12
SSR
MSSR
b 1
Hal 99 dari 148
S12
S 32
Handout Statistik 2
Kolom (k)
Penyimpangan
(error)
Jumlah
SSC
(k-1)
SSE
(b-1) (k-1)
SST
(b-1) (k-1)
S 22
S 32
SSC
MSSC
k 1
S 22
S 32
SSE
MSSE
(b 1)(k 1)
SSE = SST SSR - SSC
Selanjutnya penggunaan tabel F disesuaikan degnan taraf nyata yang dipilih.
Berdasar pada data dapat dihitung sebagai berikut:

1.
SST xi . j
2
i 1 j 1
(Ti. j ) 2
b.k
SST = (24)2+(23)2+ (25)2+ (19)2+(17)2+(21)2+(20)2+(14)2+(17)2 (180)2/(3x3)

SST = 3706 3600 = 106
2
(Ti ) 2 (Ti. j )
2. SSR
k
b.k
i 1
b
SSR
63 2 54 2 63 2
180 2
3618 3600 18
3
(3 3)
k
3. SSC
(T j ) 2
j 1
SSC
(Ti. j ) 2
b.k
72 2 57 2 512 180 2
3678 3600 78
3
(3 3)
MSSC
SSC
78 / 2 39
k 1
SSE = SST SSR SSC = 106 -18 -78 = 10

MSSE
SSE
10 / 4 2,5
(b 1)( k 1)
Fb = 9/4 = 2,25 F0,05 df 2/4 nilai tabel 6,94 (efek baris)

Fk = 39/4 = 9,75 F0,05 df 2/4 nilai tabel 6,94 (efek kolom)
Kesimpulan:
1.
Pengujian efek baris : 2,25 < 6,94. Perbedaan tidak nyata, hipotesa nol
diterima. Artinya pengelompokan macam komoditi dagangan tidak ada
pengaruhnya.
2.
Pengujian efek kolom: 9,75 > 6,94. Perbedaan nyata, hipotesa nol ditolak.
Artinya perbedaan macam media promosi memiliki pengaruh yang besar
terhadap penjualan.
Hal 100 dari 148
Handout Statistik 2
8. REGRESI DAN KORELASI

Seorang pimpinan perusahaan setiap hari selalu dihadapkan pada masalah
pengambilan keputusan yang berkaitan dengan hal-hal di masa mendatang. Agar

pengambilan keputusan ini dapat tepat dilakukan dia harus mendasarkan pada halhal yang diketahui dan dihubungkan dengan hal-hal atau keadaan-keadaan di masa
mendatang.
Analisis regresi dan korelasi
akan menunjukkan bagaimana sifat hubungan
antara 2 variabel dan besarnya hubungan 2 variabel tersebut.

Pada analisis regresi kita menentukan suatu persamaan garis berdasarkan suatu
rumus matematika yang menunjukkan hubungan antara variabel yang diketahui

dengan variabel yang tidak atau belum diketahui. Sedang analisis korelasi akan
menunjukkan berapa besar tingkat hubungan 2 variabel.
A. Macam Hubungan Antara 2 Variabel
Analisis regresi dan korelasi mendasarkan diri pada hubungan 2 variabel.
Variabel yang diketahui disebut independent variable atau variabel yang

mempengaruhi sedang variabel yang belum diketahui disebut dependent variable
atau variabel yang dipengaruhi. Variabel yang mempengaruhi disebut variabel X
sedang variabel yang dipengaruhi disebut Y.
Pada dasar kita dapat membedakan 3 macam sifat hubungan antara 2 variabel,
yaitu:
1.
Hubungan searah atau hubungan positif
2.
Hubungan yang bersifat kebalikan atau hubungan negatif
3.
Tidak ada hubungan
1.
Hubungan searah atau hubungan positif

-
Dua variabel dikatakan mempunyai hubungan searah atau postif apabila

perubahan variabel independen (X) akan mempengaruhi variabel dependen (Y)
yang searah pula. Artinya jika variabel X bertambah, maka variabel Y juga
bertambah atau sebaliknya, apabila X berkurang maka Y juga berkurang. Contoh:
hubungan antara pengeluaran biaya iklan (X) dengan jumlah penjualan (Y).
Hubungan ini dapat dilihat pada gambar berikut:
Bab 8: Regresi dan Korelasi
Hal 101 dari 148
Handout Statistik 2
2.
Hubungan Yang Bersifat Berkebalikan atau Hubungan Negatif

-
Dua
variabel
dikatakan
mempunyai
hubungan
yang
bersifat
berkebalikan atau negatif, apabila perubahan variabel independen (X) akan

mempengaruhi variabel dependen (Y) pada arah yang berlawanan. Artinya
apabila variabel X bertambah, maka variabel Y berkurang atau sebaliknya jika X
turun makan Y akan naik. Contoh, antara usia kendaraan (X) dengan tingkat
harganya (Y). Semakin tinggi usia kendaraan akan semakin turun harganya.
-
Hubungan 2 variabel yang berkebalikan ini dapat digambarkan

sebagai berikut:
3.
Tidak Ada Hubungan

-
Dua
variabel
dikatakan
tidak
mempunyai
hubungan
apabila
perubahan pada variabel independen (X) tidak mempengaruhi perubahan pada

variabel dependen (Y) atau variabel independen yang tetap (X tetap) justru
terjadi perubahan pada variabel dependen (Y berubah).
-
Contoh: konsumsi pangan sebagai variabel independen (X) yang

berubah dengan tingginya gedung (Y).
Hubungan ini terlihat dalam gambar berikut:
Hal 102 dari 148
Handout Statistik 2
B. Pengertian Garis Regresi
Perkataan regresi mula-mula digunakan oleh Sir Francis Galton tahun 1877 pada
waktu mengadakan penelitian hubungan antara tinggi orang tua dengan tinggi
anaknya. Galton berkesimpulan bahwa rata-rata tinggi anak yang berasal dari orang
tua yang tinggi lebih rendah daripada tinggi rata-rata orang tuanya. Sebaliknya anakanak yang berasal dari orang tua yang rendah, tinggi rata-rata anaknya lebih tinggi
daripada tinggi orang tuanya. Dengan singkat dikatakan terjadi regress atau terjadi
tendensi yang semakin turun.
Selanjutnya istilah Regression digunakan untuk menggambarkan garis yang

menunjukkan adanya hubungan antara 2 variabel. Ada beberapa ahli statistik yang
lebih menyukai menggunakan estimating line atau garis taksiran daripada
menggunakan istilah garis regresi.
C. Kegunaan Garis Regresi
Dengan mempelajari garis regresi kita akan dapat menentukan hubungan

perubahan variabel yang satu terhadap variabel lainnya.
Selanjutnya dari hubungan 2 variabel ini dapat dikembangkan untuk analisis

3 variabel atau lebih.
D. Perbedaan Antara Regresi dan Korelasi
Regresi menunjukkan hubungan antara variabel yang satu dengan variabel

yang lain. Sifat hubungan ini juga dapat dijelaskan antara variabel yang satu sebagai
penyebab sedang yang lain sebagai akibat, dalam bentuk variabel yang independen
dan variabel yang dependen.
Korelasi lebih menunjukan hubungan sebab akibat ini. Pada korelasi

dijelaskan besarnya tingkat hubungan antara variabel yang satu dengan variabel
yang lain.
E. Cara menggambar Garis Regresi
Ada 2 cara menggambar garis regresi, yaitu:
Hal 103 dari 148
Handout Statistik 2
1.
Metode Diagram Berserak (the scatter diagram)
2.
Metode Jumlah kuadrat terkecil (the least squares Method)
1.
Metode Diagram Berserak

Hubungan 2 variabel dapat digambarkan dalam Diagram Berserak. Pada
diagram ini variabel independen digambarkan pada skala horisontal (skala X)

sedangk variabel dependen digambarkan pada skala vertikal (skala Y).
Selanjutnya pasangan 2 variabel digambarkan pada diagram ini. Apabila gambar
titik-titik pada diagram itu menunjukkan suatu garis lurus, maka berarti ada
hubungan sempurna antara variabel yang satu dengan variabel yang lain.
Dalam kenyataan di dalam masalah ekonomi dan perusahaan, kita jarang
menjumpai sifat hubungan sempurna ini, sehingga masalah utama adalah

bagaimana cara menggambar garis pada diagram itu yang dianggap dapat
mewakili titik-titik yang berada dalam diagram berserak.
Beberapa hal yang perlu diperhatikan dalam menggambar garis pada
diagram berserak adalah:

a.
garis yang digambar harus sedekat mungkin dengan

semua titik yang ada di dalam diagram berserak
b.
Jumlah titik-titik yang berada pada masing-masing

bagian garis yakni bagian atas dan bawah harus sama.
c.
Garis itu harus digambar sedemikian rupa,sehingga

titik-titik yang berada di bagian atas dan bawah mempunyai jarak yang sama.
Contoh:
Variabel X
2
3
5
6
8
9
Variabel Y
6
5
7
8
12
11
Dua variabel tersebut dapat digambarkan dalam diagram berserak sebagai

berikut:
Hal 104 dari 148
Handout Statistik 2
Variabel X digambarkan pada sumbu horisontal, sedang variabel Y pada sumbu

vertikal. Selanjutnya titik-titik pada diagram berserak merupakan variabel X dan
Y yang berpasangan dapat digambarkan dengan mudah. Garis regresi yang
merupakan garis lurus digambarkan dengan metode bebas (free hands method).
Metode diagram berserak ini mempunyai kebaikan sederhana dan

mudah, namun mempunyai kelemahan, karena garis regresi digambar dengan
metode bebas, maka hasilnya sangat subyektif, artinya hasilnya sangat
tergantung individu yang membuat garis.
2.
Metode Jumlah Kuadrat Terkecil
Garis regresi yang digambarkan dengan metode jumlah kuadrat terkecil,

didasarkan pada suatu persamaan:
Y = a + bX
Nilai a dan b dicari berdasarkan 2 persamaan sebagai berikut:
= Na + bX
XY
= aX + bX2
Selanjutnya dapat diselesaikan dalam tabel berikut:

X (iklan)
2
3
5
6
8
9
= 33
Y (Penjualan)
6
5
7
8
12
11
= 49
X2
4
9
25
36
64
81
= 219
XY
12
15
35
48
96
99
= 305
Y = a +bX
4,84 = 2,94 + 2(0,95)
5,79 = 2,94 + 3(0,95)
7,69 = 2,94 + 5(0,95)
8,64 = 2,94 + 6(0,95)
10,54 = 2,94 + 8(0,95)
11,49 = 2,94 + 9(0,95)
I. 49 = 6a + 33b . x 11 . 539 = 66a + 363b

II. 305 = 33a + 219b x 2 .. 610 = 66a + 438b
----------------------71 = 75b
b = 0,95 (slope/lereng garis)
49 = 6a + 33(0,95) 6a = 49 31,25 a = 2,94 (intersep)
Persamaan garis regresi: Y = 2,94 + 0,95 X
Persamaan regresi: Y = 2,94 + 0,95 X dapat digambarkan dalam diagram

berikut:
Hal 105 dari 148
Handout Statistik 2
Persamaan regresi di atas dapat digunakan untuk mengadakan peramalan
di masa mendatang dengan ekstrapolasi.

Misalkan untuk variabel X sebesar 13, maka Y dapat dihitung:
Y = 2,94 + (0,95 x 13) = 15,29
Nilai Y = 15,29 dapat digambarkan dalam bagan sebagai hasil proyeksi.
Garis Regresi Y = a + bX dapat dipecahkan dengan mencari nilai a dan b
dengan menggunakan rumus sebagai berikut:
XY NXY
X 2 NX 2
a Y bX
Apabila digunakan rumus di atas, maka akan diperoleh hasil sebagai
berikut:
305 6(5,5)(8,1) 305 269,5 35,5
0,95
219 181,5 37,5
219 6(5,5) 2
a 8,1 (0,95)(5,5) 2,94
Persamaan regresinya menjadi:

Y = 2,94 + 0,95 X
Pengecekan terhadap garis regresi dapat dilakukan dengan 2 cara yaitu:
a.
dengan melihat gambar garis regresi pada diagram berserak

apakah semua titik-titik berada sepanjang garis regresi. Cara ini adalah cara
sederhana tetapi kurang sempurna hasilnya. Caraini disebut sebagai metode
kasar.
b.
Untuk mengetahui ketepatan garis regresi dengan menggunakan

rumus matematis. Pada metode jumlah kuadrat terkecil syarat utama adalah
Hal 106 dari 148
Handout Statistik 2
jumlah deviasi positif dan negatif harus nol agar garis regresi terletak di
tengah titik-titik pada diagram berserak.
Dapat dilihat dalam tabel berikut:
Y Variabel
6
5
7
8
12
11
Y (Garis Regresi)
4,84
5,79
7,69
8,64
10,54
11,49
Penyimpangan
(6 - 4,84) = +1,16
(5 5,79) = -0,79
(7 - 7,69) = -0,69
(8 8,64) = -0,64
(12 10,54) = +1,46
(11 11,49) = -0,49
Jumlah Penyimpangan = 0
(dibulakan dari 0,01)
F. Penyimpangan Standar Terhadap Garis Regresi (Standard Error of

Estimate)
Ketepatan suatu garis regresi dapat dilihat sepintas apabila semua titik
dalam diagram berserak mendekati garis regresi. Penyimpangan titik-titik dalam

diagram berserak secara statistik diukur dengan suatu konsep yang disebut: The
standard error of estimate atau penyimpangan standar terhadap garis regresi yang
dinotasikan dengan Se atau Syx.
Pengertian penyimpangan standar terhadap garis regresi ini identik
dengan penyimpangan standar. Apabila pada penyimpangan standar titik tolaknya

nilai rata-rata, maka pada penyimpangan terhadap garis regresi titik tolaknya
pengukuran dari garis regresi (Y).
Kita dapat lihat perbandingan 2 garis regresi yang masing-masing
mempunyai penyimpangan yang berbeda berikut ini:
Dari 2 gambar di atas kita dapat membandingkan bahwa gambar A titik-
titiknya
lebih
mendekati
garis
regresi
sehingga
dapat
dikatakan
bahwa
penyimpangan terhadap garis regresi kecil. Pada gambar B penyimpangan terhadap

garis regresi besar. Dari 2 gambar tadi gambar A lebih tepat daripada gambar B.
Selanjutnya perumusan dari penyimpangan terhadap garis regresi

Hal 107 dari 148
Handout Statistik 2
Se
(Y Y ' ) 2
N 2
Se = standard error of estimate

Y
= nilai data Y
Y = nilai regresi
N = jumlah frekuensi
Pembagi di sini N-2 karena pada perhitungan a dan b untuk menentukan persamaan
regresi kita telah kehilangan 2 derajat kebebasan.
Penggunaan rumus di atas disajikan dalam tabel berikut:
Iklan (X)
2
3
5
6
8
9
Penjualan (Y)
6
5
7
8
12
11
Se
Regresi (Y)
4,84
5,79
7,69
8,64
10,54
11,49
5,23 / 4
(Y-Y)2
1,35
0,62
0,48
0,41
2,13
0,24
(Y-Y)2 = 5,23
(Y-Y)
+1,16
-0,79
-0,69
-0,64
+1,46
-0,49
1,3075 1,14
Metode lain yang dapat digunakan untuk menghitung penyimpangan
standar terhadap regresi secara pendek dapat dirumuskan sebagai berikut:
Se
Y 2 a Y b XY
N 2
Berdasarkan rumus diatas, maka perhitungannya dapat dijelaskan dalam tabel

berikut:
X (iklan)
2
3
5
6
8
9
= 33
Se
Y (Penjualan)
6
5
7
8
12
11
= 49
X2
4
9
25
36
64
81
= 219
439 49(2,94) 0,95(305)
62
XY
12
15
35
48
96
99
= 305
Y2
36
25
49
64
144
121
= 439
5,19
1,2975 1,14
4
G. Interpretasi Penyimpangan Standar Terhadap Garis Regresi
Penyimpangan standar terhadap garis regresi dapat diinterpretasikan

sama dengan deviasi standar terhadap nilai rata-rata. Semakin besar Se atau
penyimpangan standar terhadap garis regresi semakin tersebar titik-titik yang
berada sekitar garis regresi. Sebaliknya semakin kecil Se semakin dekat titik-titik
yang berada di sekitar garis regresi.
Hal 108 dari 148
Handout Statistik 2
Apabila Se=0 atau tidak ada, berarti semua titik berada sepanjang garis
regresi. Yang berarti bahwa garis regresi dapat digunakan secara sempurna untuk
menaksir variabel dependen.
Selanjutnya dengan asumsi bahwa semua data observasi berada di sekitar

garis regresi dalam bentuk distribusi normal, maka berdasarkan Se kita dapat
mengatakan bahwa:
68% dari data observasi akan berada dalam jarak 1 Se
95,5% dari data observasi akan berada dalam jarak 2 Se
99,7% dari data observasi akan berada dalam jarak 3 Se
Berdasarkan contoh sebelumnya, maka pernyataan di atas dapat

dijabarkan sebagai berikut: Persamaan regresi Y = 2,94 + 0,95X, sedang Se = 1,14
maka jarak 1 Se adalah:
Y = 2,94 + 0,95 ( 1,14) atau Y antara (2,94 + 1,083) dan (2,94 1,083)
Jarak 1 Se akan terletak antara 1,857 dan 4,023
Dapat digambarkan sebagai berikut:
Prediksi terhadap penyimpangan standar pada garis regresi akan tepat

apabila digunakan rumus sebagai berikut:
Sp Se 1 1 / N
(X X 0 )2
X 2 X 02
X0 = Nilai X tertentu yang dipakai menaksir Y

Dengan rumus di atas akan diperoleh hasil yang berbeda untuk setiap X 0 . Makin
jauh jarak X0 terhadap nilai rata-rata, maka Sp akan besar, sebaliknya semakin dekat
Hal 109 dari 148
Handout Statistik 2
X0 terhadap nilai rata-rata, maka Sp akan kecil. Apabila hasil akar pangkat dua = 1
maka Sp = Se.
H. Koefisien Regresi
Lereng garis regresi disebut koefisien regresi. Persamaan garis regresi
dinyatakan dengan :
Y = a + bX
Dari persamaan di atas yang dimaksudkan dengan koefisien regresi
adalah b. Nilai b di sini dapat positif atau negatif. Apabila koefisien regresi positif,
maka garis regresi akan mempunyai lereng positif, yang berarti hubungan 2 variabel
X dan Y searah atau positif. Apabila koefisien regresi negatif, maka garis regresi akan
mempunyai lereng yang negatif yang berarti hubungan 2 variabel X dan Y
berlawanan arah atau hubungannya negatif.
Besar kecilnya pengaruhi perubahan variabel X terhadap variabel Y akan
ditentukan oleh besar kecilnya koefisien regresi atau nilai b.
I. Koefisien Determinasi
Koefisien determinasi adalah suatu alat utama untuk mengetahui sejauh mana
tingkat hubungan antara variabel X dan variabel Y. Koefisien determinasi ini dapat
ditentukan berdasarkan hubungan antara 2 macam variasi, yaitu:
1.
Variasi variabel Y terhadap garis regresi (Y) = (Y-Y)2
2.
Variasi variabel Y terhadap rata-ratanya ( Y ) = (Y- Y )2

Koefisien determinasi dirumuskan sebagai berikut:
r2 1
(Y Y ' ) 2
(Y Y ) 2
J. Interpretasi Koefisien Determinasi

Untuk menjelaskannya diambil 2 contoh ekstrim sebagai berikut:
1.
Hubungan Sempurna antara Variabel X dan Y

o
Hubungan sempurna antara variabel X dan Y ditunjukkan dengan

perubahan variabel X akan diikuti dengan perubahan variabel Y, dengan
proporsi yang sama. Sebagai contoh dapat dilihat dalam tabel berikut:
X
1
2
3
4
5
Y
2
4
6
8
10
Y = 30
Regresi Y
2
4
6
8
10
(Y-Y)
0
0
0
0
0
(Y-Y)2
0
0
0
0
0
(Y-Y)2 =0
(Y- Y )
-4
-2
0
2
4
(Y- Y )2
16
4
0
4
16
(Y- Y )2=40
Hal 110 dari 148
Handout Statistik 2
Y = 30/5 = 6
r 2 = 1 0/40 = 1
Koefisien determinasi = 1, menunjukkan hubungan sempurna
2.
Tidak Ada Hubungan Antara Variabel X dan Y

Variabel X dikatakan tidak mempunyai hubungan dengan variabel Y yaitu
apabila perubahan variabel X tidak mempengaruhi variabel Y.

o
Tabel berikut menunjukkan contoh ini:

X
1
2
3
4
5
Y
5
10
5
10
5
Y = 35
Y = 35/5 = 7
Regresi Y
7
7
7
7
7
(Y-Y)
-2
3
-2
3
-2
(Y-Y)2
4
9
4
9
4
(Y-Y)2 =30
(Y- Y )
-2
3
-2
3
-2
(Y- Y )2
4
9
4
9
4
(Y- Y )2=30
r 2 = 1 30/30 = 0
Koefisien determinasi = 0, menunjukkan tidak ada hubungan
Besarnya nilai koefisien determinasi terletak antara 0 dan 1. Determinasi = 0

menunjukkan tidak adanya hubungan antara variabel X dan Y, sedang determinasi =
1 menunjukkan adanya hubungan sempurna antara variabel X dan Y
0 r2 1
Interpretasi terhadap koefisien determinasi dapat dijelaskan dengan gambar

berikut:
Hal 111 dari 148
Handout Statistik 2
Dari gambar di atas nampak bahwa dari sebuah variabel Y, yang kita pilih sebagai
contoh pembahasan dapat diuraikan sebagai berikut:
Jarak antara variabel Y terhadap nilai rata-ratanya disebut Total Deviation atau
jumlah seluruh deviasi. Jarak antara garis regresi (Y) dengan nilai rata-ratanya
disebut explained deviation atau deviasi yang dapat dikelaskan. Selanjutnya
selisihnya yaitu jarak antara Y terhadap garis regresi disebut sebagai unexplained
deviation atau deviasi yang tidak dapat dijelaskan.
Secara singkat penjelasannya dapat dirumuskan sebagai berikut:
(Y Y ) 2
Total Deviation
(Y 'Y ) 2
= Explained deviation
(Y Y ' ) 2
+ Unexplained deviation
Apabila unexplained deviation dinyatakan sebagai bagian dari seluruhnya atau

ratio terhadap keseluruhan, maka:
(Y Y ' ) 2
(Y Y ) 2
Sedangkan rumus determinasi adalah:
r2 1
(Y Y ' ) 2
(Y Y ) 2
Dari rumus koefisien determinasi di atas berarti suatu ukuran yang dapat
memberikan penjelasan terhadap variabel Y atau ukuran yang dapat memberi
penjelasan sejauh mana hubungan antara variabel X dan variabel Y.
Metode lain yang dapat menjelaskan koefisien determinasi berdasarkan regresi

adalah rumus sebagai berikut:
a Y b XY NY 2
r
Y 2 NY 2
2
K. Koefisien Korelasi (r)

Hal 112 dari 148
Handout Statistik 2
Koefisien korelasi yang dinyatakan dengan r merupakan alat kedua untuk
menjelaskan hubungan antara variabel X dan Y. Koefisien korelasi sebagai akar dari
koefisien determinasi:
r r2 1
(Y Y ' ) 2
(Y Y ) 2
Apabila suatu garis regresi mempunyai lereng positif, maka r merupakan akar
dari bilangan yang positif. Apabila suatu garis regresi mempunyai lereng negatif,
maka r merupakan akar dari bilangan negatif. Jadi nilai r menunjukkan arah
hubungan antara variabel X dan Y. Pada hubungan yang searah atau positif maka
nilai r akan terletak antara 0 dan 1.
Koefisien korelasi tidak dapat menjelaskan secara langsung misalnya r = 0,9.
Apabila r = 0,9 maka r2 = 0,81. berarti 81% dari variabel Y dapat dijelaskan oleh garis
regresi.
L. Kegunaan Korelasi
Ada beberapa manfaat dalam mempelajari korelasi yaitu:
1.
Penentuan adanya hubungan serta besarnya hubungan antara 2

variabel merupakan masalah utama yang perlu mendapat jawaban dalam
statistik. Koefisien korelasi merupakan ukuran yang dapat menjelaskan besar
kecilnya hubungan antara 2 variabel
2.
Biasanya dengan mengetahui adanya hubungan antara 2 variabel

atau lebih kita akan dapat mengadakan peramalan terhadap variabel lainnya.
Contoh, dengan meningkatkan jumlah produksi alat-alat elektronik, sedangkan
faktor-faktor lainnya tetap, dapat diharapkan harga barang-barang tersebut akan
turun.
3.
Dengan mengetahui adanya hubungan antara 2 variabel, maka

dengan diketahuinya 1 variabel dapat diadakan penaksiran terhadap variabel
yang lain dengan bantuan garis regresi
M. Korelasi dan Hubungan Sebab Akibat

Korelasi hanyalah menunjukkan adanya hubungan antara 2 variabel atau lebih
serta menunjukkan berapa besarnya hubungan antara 2 variabel tersebut. Korelasi

tidak dapat menunjukkan adanya hubungan sebab akibat antara 2 variabel.
Hubungan sebab akibat sebenarnya merupakan akibat adanya korelasi. Adanya
korelasi antara suatu variabel dengan variabel lain disebabkan karena adanya satu
atau beberapa sebab sebagai berikut:
1.
Korelasi yang benar-benar ditimbulkan oleh faktor kebetulan saja.

Ada beberapa hal yang secara kebetulan dapat menunjukkan adanya korelasi,
meskipun kalau kita korelasi demikian sebenarnya bohong belaka. Misalnya
variabel harga gula dan tinggi mahasiswa.
Hal 113 dari 148
Handout Statistik 2
2.
Variabel yang mempunyai korelasi sebenarnya dipengaruhi oleh

variabel atau faktor-faktor lain. Misalkan harga gula dan harga sepatu sangat
dipengaruhi oleh faktor ketiga yaitu penghasilan atau harga barang-barang lain.
Jadi hubungan sebab akibat mungkin ada tetapi korelasinya menjadi kurang
penting.
3.
Kedua variabel yang mempunyai hubungan sulit ditunjukkan mana

sebagai faktor penyebab dan mana yang menjadi faktor akibat. Misalnya antara
permintaan dan penawaran. Adanya korelasi belum tentu menunjukkan adanya
faktor
sebab
akibat,
tetapi
adanya
faktor
sebab
akibat
selalu
dapat
mengakibatkan adanya korelasi.

N. Metode-Metode yang Digunakan Untuk Mempelajari Korelasi
Untuk mempelajari korelasi pada hakekatnya dapat dibedakan adanya 2 metode,
yaitu:
1.
Mempelajari hubungan 2 variabel secara visual
2.
Mengukur besarnya tingkat hubungan antara 2 variabel secara

matematis
1.
Mempelajari secara visual

Untuk mempelajari hubungan 2 variabel dapat dilakukan dengan 2 pengamatan
yaitu:
a.
Pengamatan terhadap diagram berserak

Mula-mula 2 variabel yang mempunyai hubungan yaitu X dan Y dilukiskan
dalam satu diagram berserak, selanjutnya kita menafsirkan sifat hubungannya
berdasarkan diagram tersebut. Contoh:
Gambar A menunjukkan adanya hubungan positif atau searah antara X dan Y.

Gambar B menunjukkan adanya hubungan negatif antara X dan Y. Sedangkan
gambar C menunjukkan tidak ada hubungan antara X dan Y.
Kebaikan metode diagram berserak:
-
metode ini sangat sederhana dan mudah, serta tidak memerlukan

pengetahuan matematika untuk mempelajarinya.
Hal 114 dari 148
Handout Statistik 2
tidak dipengaruhi oleh nilai ekstrem
langkah pertama kita harus menggambarkan diagram berserak
Kelemahan metode ini:

Metode ini hanya menunjukkan adanya hubungan serta sifat hubungan antara 2
variabel, sedang ukuran yang tepat untuk menentukan besarnya hubungan
antara 2 variabel ini tidak dapat ditunjukkan.
b.
Metode grafik
Dengan metode ini kedua variabel X dan Y masing-masing digambarkan dalam
satu kertas/diagram. Selanjutnya kita dapat melihat apakah kedua grafik itu
menunjukkan arah yang sama, yang berarti ada hubungan antara 2 variabel
tersebut, sedang apabila tidak menunjukkan arah yang sama, maka berarti tidak
ada hubungan antara variabel X dan Y.
Contoh:
Data berikut menunjukan data ekspor kapas (X) dan impor mesin tenun (Y):
Tahun
1980
1981
1982
1983
1984
1985
1986
Ekspor (X)
42
44
58
55
89
90
66
Impor (Y)
46
49
53
58
65
76
58
Tabel di atas dapat digambarkan sebagai berikut:
Grafik di atas menunjukkan bahwa antara variabel X dan Y mempunyai

hubungan yang erat.
Kebaikan metode grafik:
Sebagaimana halnya metode diagram berserak, maka metode grafik ini
mempunyai kebaikan karena sederhana dan mudah diikuti. Secara visual grafik
ini dapat menunjukkan adanya sifat hubungan antara variabel yang satu dengan
variabel yang lain.
Hal 115 dari 148
Handout Statistik 2
Kelemahan metode grafik:

Metode ini tidak dapat menunjukkan secara tepat tentang besarnya tingkat
hubungan antara variabel X dan Y. Dengan demikian perlu adanya suatu ukuran
dalam bentuk bilangan untuk mengukur besarnya tingkat hubungan antara
variabel X dan Y. Hal ini akan dijelaskan dalam metode matematis berikut.
2.
Mengukur Besarnya Tingkat Hubungan Secara Matematis
Kita dapat membedakan 2 macam cara perhitungan koefisien korelasi yaitu:

a. untuk data tidak berkelompok
b. untuk data berkelompok
a.
Untuk data tidak berkelompok (ungrouped data)

-
Perhitungan koefisien korelasi menggunakan rumus:
r 1
(Y Y ' ) 2
(Y Y ) 2
X2
XY
(Y-Y)
(Y-Y)2
(Y- Y )
5
11
4
5
3
2
X=30
31
40
30
34
25
20
Y=180
25
121
16
25
9
4
= 200
155
440
120
170
75
40
30
42
28
30
26
24
+1
-2
+2
+4
+1
-4
1
4
4
16
1
16
=42
+1
+10
0
+4
-5
-10
X 30 / 6 5
(Y- Y
)2
1
100
0
16
25
100
=242
Y 180 / 6 30
Y = Na + bX . 180 = 6a + 30b x 5 900 = 30a + 150b

XY = aX + bX2 . 1000 = 30a + 200b. x 1 1000 = 30a + 200b
-------------------------100 = 50b b = 2
6a = 120
a = 20
Persamaan Regresi: Y = 20 + 2X
r 1
(Y Y ' ) 2
(Y Y )
42
1 0,17
242
0,83 0,91
Product Moment Method. Moment (m) adalah suatu ukuran yang

didasarkan pada pangkat deviasinya
Moment X ditulis x
Hal 116 dari 148
Handout Statistik 2
Moment 1 (m1) = ( X X )1 x
Moment 2 (m2) = ( X X ) 2 x 2
Moment Y ditulis y
Moment 1 (m1) = (Y Y )1 y
Moment 2 (m2) = (Y Y ) 2 y 2
Dan seterusnya
Product moment adalah hasil perkalian antara moment X dan moment Y yang
dirumuskan:
xy
N
dimana = product moment

x = moment x
y = moment y
N = banyaknya kejadian
Selanjutnya koefisien korelasi dirumuskan sebagai berikut:

r
Sx Sy
dimana, r
= koefisien korelasi
= product moment
Sx
= standar deviasi X
Sy
= standar deviasi Y
Penggunaan rumus di atas disajikan dalam tabel berikut:

X
5
11
4
5
3
2
=30
X =
31
40
30
34
25
20
=180
Y =3
Sy
( X X ) x (Y Y ) y
0
+6
-1
0
-2
-3
xy 100
16,67
N
6
242 / 6
+1
+10
0
+4
-5
-10
xy
0
60
0
0
10
30
=100
( X X )2 x 2
0
36
1
0
4
9
=50
Sx
(Y Y ) 2 y 2
1
100
0
16
25
100
=242
50 / 6
8,33 2,89
40,33 6,35
Hal 117 dari 148
Handout Statistik 2
Sx Sy
16,67
16,67
0,91
2,89(6,35)
18,35
Rumus Karl Pearsons
N XY ( X )( Y )
N X 2 ( X ) 2
N Y 2 ( Y ) 2
Penggunaan rumus di atas adalah sebagai berikut:

X
5
11
4
5
3
2
= 30
Y
31
40
30
34
25
20
= 180
Y2
961
1600
900
1156
625
400
= 5642
N Y 2 ( Y ) 2
6(1000) (30)(180)
6( 200) (30) 2
6(5642) (180) 2
6000 5400
1200 900 33852 32400

r
b.
N XY ( X )( Y )
N X 2 ( X ) 2
X2
36
121
16
25
9
4
= 200
XY
155
440
120
170
75
40
= 1000
600
300 1450
600
600
0,91
17,32 38,11 660
Untuk data Berkelompok

1.
Korelasi untuk data berkelompok, pada

dasarnya merupakan kombunasi dari 2 tabel frekuensi yakni tabel frekuensi X
Hal 118 dari 148
Handout Statistik 2
dan Y. Dengan kombinasi ini, maka bentuk tabel frekuensi menjadi tabel
frekuensi menurut bilangan yang bersifat ganda.
2.
Selanjutnya untuk koefisien korelasi

dihitung berdasarkan rumus sebagai berikut:
N fydxdy ( fxdx)( fydy )

N fxdx 2 ( fxdx) 2
N fydy 2 ( fydy ) 2
dimana:
r
fx = frekuensi X
fy = frekuensi Y
dx = deviasi X
dy = deviasi Y
3.
Berikut ini contoh perhitungan korelasi

data berkelompok secara sederhana:
X (Pengeluaran Iklan)
4
5
4
4
5
2
3
7
8
7
Y (Penjualan)
8
6
7
6
4
4
5
8
9
7
Apabila masing-masing variabel tersebut dikelompokkan dalam kelas-kelas atau

dalam bentuk tabel frekuensi akan diperoleh 2 tabel frekuensi:
Tabel Frekuensi X
Kelas-Kelas
Frekuensi X
13
2
46
5
79
3
Tabel Frekuensi Y
Kelas-Kelas
Frekuensi Y
89
3
67
4
45
3
Hal 119 dari 148
Handout Statistik 2
4.
Dari
tabel
frekuensi
tersebut
kemudian digabungkan menjadi satu yang merupakan gabungan antara variabel

X dan variabel Y, serta memasukkan frekuensi kedua variabel dalam tabel
gabungan:
X
46
1
3
1
13
89
67
45
5.
79
2
1
Selanjutnya untuk menghitung koefisien

korelasinya, tabel diatas dilengkapi menjadi:
X
13
89
67
45
fx
dx
fxdx
fxdx2
fxdydx
2
2
0
0
0
0
46
1
3
1
5
1
5
5
5
79
2
1
3
2
6
12
10
fy
3
4
3
10
3
11
17
15
dy
2
1
0
3
fydy
6
4
0
10
fydy2
12
4
0
16
fydxdy
10
5
0
15
Penentuan deviasi (d) dilakukan sebagaimana dalam tabel frekuensi biasa untuk
variabel X maupun Y hanya perlu diperhatikan arah deviasi. Semakin besar arah
kelasnya semakin besar deviasinya. Nilai deviasi = 0 untuk variabel X maupun Y
harus sama letaknya, yang selanjutnya nilai deviasi akan tergantung arah kelas
masing-masing variabel.
6.
Berdasarkan hasil tabel di atas, maka

dapat dihitung koefisien korelasi sebagai berikut:
r
10(15) (11)(10)
10(17) (11)
10(16) (10)
7.
40
0,74
54,25
Apabila kita menentukan deviasi = 0

pada kelas yang di tengah, maka akan diperoleh hasil sebagaimana tampak pada
tabel berikut:
X
13
Y
89
67
45
fx
dx
fxdx
2
2
-1
-2
46
1
3
1
5
0
0
79
2
1
3
1
3
fy
3
4
3
10
0
1
dy
1
0
-1
3
fydy
3
0
-3
0
fydy2
3
0
3
6
fydxdy
2
0
2
4
Hal 120 dari 148
Handout Statistik 2
fxdx2
fxdydx
2
2
0
0
3
2
5
4
8.
Berdasarkan tabel di atas, koefisien

korelasi diperoleh:
r
10( 40) (0)(1)

10(5) (1)
10(6) (0)
9.
40
0,74
54,25
Kesimpulan deviasi 0 dpat diletakkan

pada sembarang kelas, asal diperhatikan bahwa variabel X dan Y merupakan
variabel yang berpasangan. Dengan demikian letak deviasi 0 harus sama, apakah
di kelas yang ditengah, ataukah pada ujung kelas, serta arah deviasi harus
disesuaikan dengan arah kelas.
Sifat-Sifat Korelasi Pearson:
1.
Nilai koefisien korelasi terletak antara +1 dan -1, apabila hubungan 2

variabel itu menunjukkan adanya korelasi. Apabila menunjukkan tidak adanya
korelasi, nilainya = 0.
2.
Dalam metode perhitungannya menggunakan seluruh variabel
3.
Koefisien korelasi ini menunjukkan arah korelasi maupun besarnya

tingkat korelasi.
4.
Koefisien korelasi ini kadang-kadang dapat membawa kesimpulan yang

salah apabila variabelnya kurang tepat dalam memilihnya.
5.
Koefisien korelasi tidak dapat membuktikan adanya hubungan sebab

akibat.
Kebaikan koefisien Korelasi Pearson:

Kebaikannya adalah tidak saja besarnya tingkat korelasi dapat diketahui, melainkan
pula arah hubungan 2 variabel itupun dapat diketahui.
Kelemahan koefisien korelasi Pearson:
1. Adanya anggapan bahwa hubungan 2 variabel itu hubungannya bersifat linear
2. Koefisien korelasi ini sulit ditafsirkan, sehingga membawa penafsiran yang keliru
3. Metode ini jika dibandingkan dengan metode lain lebih sulit.
4. Mudah dipengaruhi nilai ekstrim
O. Korelasi Berdasarkan Ranking (Rank Correlation)

1.
Metode perhitungan koefisien korelasi

berdasarkan rangking dikenalkan oleh Profesor Charles Spearman. Metode ini dapat
digunakan untuk menghitung koefisien korelasi untuk variabel yang nilai datanya
tidak diketahui melainkan hanya urutan nilai atau rangkingnya yang diketahui.
Hal 121 dari 148
Handout Statistik 2
2.
Sebagai contoh, ranking nilai ujian 5

orang mahasiswa yang mengikuti ujian Statistika dan Ekonomi.
3.
Spearman mengajukan suatu rumus

untuk menghitung koefisien korelasi sebagai berikut:
6 D2
r 1
N ( N 2 1)
dimana:
= jumlah
D = Perbedaan (difference)
6
= Bilangan konstan
4.
Nilai koefisien korelasi ini akan terletak

antara -1 jika hubungan 2 variabel itu bersifat negatif, sedang jika sifat hubungan 2
variabel itu positif maka nilainya +1. Apabila 2 variabel itu tidak menunjukkan
adanya hubungan, maka r = 0.
5.
Penggunaan rumus di atas dapat dilihat

pada tabel berikut:
Ranking
Ranking
Statistik (X)
1
2
3
4
5
Ekonomi (Y)
1
2
3
4
5
r 1
D (X-Y)
D2
0
0
0
0
0
0
0
0
0
0
=0
6( 0)
1 0 1
5( 25 1)
Caranya:
1. susun data berdasarkan ranking, apabila ada ranking yang sama, maka ranking
ditentukan berdasar rata-ratanya.
Contoh, ranking 6,5 untuk ranking 6 dan 7 yang sama nilainya.
2. Hitung perbedaan ranking untuk masing-masing data (D)
3. Kuadratkan hasilnya (D2) dan jumlahkan hasilnya
4. Gunakan rumus Spearman
6.
Contoh:
Data berikut menunjukkan data penjualan televisi (X) dan video recorder (Y):
X
115
134
120
130
124
128
Y
130
132
128
130
127
125
Hal 122 dari 148
Handout Statistik 2
Perhitungan koefisien korelasinya adalah sebagai berikut:

Televisi
Video
Ranking
Ranking
(X)
115
134
120
130
124
128
(Y)
130
132
128
130
127
125
(X)
6
1
5
2
4
3
(Y)
2,5
1
4
2,5
5
6
D (X-Y)
D2
3,5
0
1
-0,5
-1
-3
12,25
0
1
0,25
1
9
=23,50
6(23,50)
r 1
1 141 / 210 69 / 210 0,33
6(36 1)
7.
Kendalls
Rank
Correlation
menggunakan rumus untuk menghitung rank correlation sebagai berikut:

r
S
1 / 2 N ( N 1)
= sums (jumlah nilai di atas dan di bawah ranking Y)
Contoh:
Nilai X
115
134
120
130
124
128
Nilai Y
130
132
128
130
127
125
Ranking X
6
1
5
2
4
3
Ranking Y
2,5
1
4
2,5
5
6
S
(-1) + (+3) = +2
(0) + (+4) = +4
(-1) + (+2) = +1
(0) + (+2) = +2
(0) + (+1) = +1
(0) + (0) = 0
= 10
10
10 / 15 0,67
1 / 2(6)(6 1)
Penjelasan dalam menghitung S (jumlah):

Ranking Y : 2,5 nilai dibawahnya 1 jadi -1 sedang nilai yang diatasnya 3, jadi +3
jumlah = +2
Dibawahnya 1 : di bawah nilai 1 tidak ada jadi 0, sedang yang diatasnya ada 4 jadi
+4, jumlah = +4
Hal 123 dari 148
Handout Statistik 2
8.
Kebaikan-kebaikan Rank korelasi:

1.
metode ini mudah dihitung dan mudah dimengerti
2.
metode ini dapat digunakan untuk menghitung koefisien korelasi

pada data yang bersifat kualitatif
3.
Pada data yang bersifat ranking, maka metode ini merupakan

satu-satunya metode perhitungan koefisien korelasi.
4.
Pada data bukan ranking, dapat dihitung pula dengan metode ini.
9.
Kelemahan Rank Korelasi

1. Metode ini tidak dapat digunakan untuk menghitung korelasi data berkelompok
2. Untuk data yang lebih dari 30, perhitungannya akan menjadi sulit. Sebaiknya
metode ini digunakan untuk data kurang dari 30.
3. Metode ini hasilnya kurang teliti dibandingkan dengan metode Pearson
P. Beberapa Analisis Yang Perlu Diperhatikan Dalam Analisis Regresi

dan Korelasi
1.
Ekstrapolasi data observasi

Suatu anggapan yang keliru apabila garis regresi dapat diaplikasikan pada
rentang suatu nilai. Regresi hanya didasarkan pada suatu nilai sampel.
Persamaan garis regresi hanya benar untuk suatu rentang nilai yang sama dari
sampel itu.
2.
Analisis regresi dan korelasi tidak menentukan sebab akibat

Kekeliruan yang dapat timbul adalah adanya anggapan dalam analisis regresi dan
korelasi bahwa perubahan satu variabel disebabkan oleh perubahan variabel lain.
Analisis regresi dan korelasi tidak dapat menjelaskan hubungan sebab akibat.
3.
Penggunaan trend masa lampau untuk menduga trend masa

depan
Kita harus hati-hati dalam menggunakan data masa lampau guna menghitung
persamaan regresi. Beberapa hal atau keadaan dapat mempengaruhi satu atau
lebih pada asumsi yang kita gunakan dalam analisis regresi.
4.
Kesalahan dalam menafsirkan koefisien korelasi dan koefisien

determinasi
Koefisien korelasi biasanya ditafsirkan sebagai prosentase. Jika diketahui r =
0,60; secara keliru ditafsirkan bahwa garis regresi dapat menjelaskan 60% dari
variasi Y, yang sebenarnya hanya (0,60)2 atau 0,36 = 36%.
Koefisien determinasi akan keliru ditafsirkan untuk menjelaskan prosentase
perubahan variabel dependen sebagai akibat perubahan variabel independen.
Hal 124 dari 148
Handout Statistik 2
Koefisien determinasi hanya mengukur berapa baik suatu variabel digambarkan

oleh variabel yang lain bukan berapa besar perubahannya.
5.
Sifat hubungan dalam analisis regresi adalah bersifat umum

Hubungan antara 2 variabel dalam analisis regresi adalah bersifat umum. Misal
hubungan antara penggunaan bahan bakar dengan jarak yang ditempuh.
Q. Rata-Rata dan Variasi Koefisien-Koefisien Regresi
Yang dimaksud dengan koefisien regresi adalah koefisien regresi penaksir yaitu a
dan b. Persoalan yang muncul adalah seberapa jauh atau dekat garis regresi (Y = a
+bX) menyimpang dari garis regresi populasinya.
Hal ini berarti kita harus mengetahui bagaimana a terdistribusi di sekitar (a

untuk populasi) dan bagaimana b terdistribusi disekitar . Atau secara matematis
dapat ditulis:
E(a) =
Var (a) = 2/n
E(b) =
Var (b) = 2/xi2
Dengan catatan bahwa 2 adalah variasi dari e (atau variasi nilai Y di sekitar garis
regresi). ei adalah perbedaan Yi dengan nilai ekpektasinya E(Yi) = + X, jadi:
ei = Yi - E(Yi)
ei = Yi - - Xi
Yi = + Xi + ei
Dari persamaan regresi estimasi Y = a + bX, koefisien yang regresi yang kita
estimasi adalah a dan b. Dari kedua koefisien ini nilai estimasi b seringkali dianggap
lebih penting artinya daripada a. Hal ini disebabkan karena b menunjukkan rasio
perolehan Y dan X. Atau dengan kata lain, melalui koefisien b kita dapat melihat pola
hubungan ketergantungan antara variabel Y dan variabel X.
Dinyatakan bahwa:
E(b) =
Var (b) = 2/xi2
Hal ini dimaksudkan bahwa nilai harapan b adalah dari populasi atau dengan kata
lain bahwa koefisien estimator (penduga) b tidak bias (menyimpang) dari koefisien
regresi populasi .
Untuk mengetahui apakah koefisien b tidak bias dari koefisien regresi populasi
maka kita harus melihat bagaimana bentuk distribusi probabilitas b. Karena secara
Hal 125 dari 148
Handout Statistik 2
teoritis tidak dapat diketahui bentuk distribusi probabilitas tersebut, maka

diasumsikan bahwa variabel-variabel random Y terdistribusi secara normal.
Ini berarti bahwa setiap variabel random Y tersebut secara normal dengan (Y) =
+ X sebagai nilai harapan atau nilai rata-rata hitungnya dan 2 sebagai
variansnya. Karena b merupakan kombinasi linear dari Y maka nilai b terdistribusi
secara normal juga. Dapat digambarkan sebagai berikut:
Dari gambar di atas terlihat bahawa statistik b tersebar secara normal dengan nilai
harapan dan varians sebesar 2/xi2.
Apabila kita menghendaki agar nilai distribusi normal dapat dimanfaatkan maka
distribusi normal perlu diterjemahkan ke dalam distribusi norrmal yang memiliki
rata-rata hitung sama dengan nol dan standar deviasi sama dengan satu.
z
b
b
dimana b = standar deviasi dari b, atau:
x
i 1
2
i
Nilai 2 adalah varians faktor gangguan ei atau varians variabel random Yi dalam
populasi (dan adalah standar deviasi) yang nilainya tidak dapat diketahui. Oleh
karena itu nilai 2 yaitu nilai varians Yi atau varians (ei) perlu diestimasi dengan
memakai varians ei sebagai penaksirnya, yaitu varians yang terdapat dalam sampel
atau sering ditulis:
S2
1 n
(Yi Yi ' ) 2
n 2 i 1
Apabila S2 ini dipakai untuk menggantikan (menaksir) nilai 2 maka distribusi

probabilitas b tidak lagi normal, melainkan sudah berubah menjadi distribusi t
dengan (n-2) sebagai derajat kebebasannya.
Hal 126 dari 148
Handout Statistik 2
b
S
n
x
i 1
2
i
Distribusi t inilah yang untuk selanjutnya akan digunakan dalam penentuan interval
kepercayaan bagi parameter dan dalam penyajian hipotesa mengenai parameter
ini.
Misalkan sekarang kita gunakan t0,025 sebagai nilai t yang membatasi 2,5 persen
dari luas areal di bawah distribusi t pada ujung sebelah kanan distribusi tersebut.
Oleh karena sifat simetris distribusi tersebut maka luas daerah yang terletak di
sebelah kiri t0,025 adalah 2,5 persen juga. Dengan demikian luas areal antara t 0,025
sampai dengan t0,025 adalah 95 persen dari keseluruhan wilayah distribusi t tersebut.
Dengan kata lain, probabilitas nilai t berada di antara -t 0,025 dengan t0,025 adalah 0,95
atau:
Pr (t0,025 < t < t0,025 ) = 0,95
Probabilitas interval keyakinan 95 persen bagi parameter adalah:
b t 0 , 025
x
i i
2
i
sedangkan untuk parameter adalah:
a t 0,025
Contoh:
Apabila kita memiliki data penggunaan pupuk dan hasil panen sebagai berikut:
Pemakain Pupuk (X)
60
80
100
120
140
Hasil panen (Y)

24
26
30
32
33
Hal 127 dari 148
Handout Statistik 2
Untuk menghitung S dapat disajikan dalam tabel berikut:

Xi
60
80
100
120
140
=500
X =100
Yi
24
26
30
32
33
=145
Y =29
Xi
-40
-20
0
20
40
=0
xi2
1600
400
0
400
1600
=4000
yi
24,2
26,6
29,0
31,4
33,8
(yi-Y)
-0,2
-0,6
1,0
0,6
-0,8
= 0
(yi Y)2
0,04
0,36
1,00
0,36
0,64
=2,4
Dari tabel di atas didapat persamaan regresi: Y=29 + 0,12Xi.

Nilai S diperoleh sebagai berikut:
S2
1 n
(Yi Yi ' ) 2 1 / 3(2,40) 0,8
n 2 i 1
atau S = 0,8 = 0,9.

Karena nilai S sudah diketahui maka interval kepercayaan bagi dan dapat
diperoleh.
Dengan memasukkan a = 29, n = 5 dan t 0,025 = 3,182 (lihat taabel distribusi t), maka
akan diperoleh:
S
a t 0 ,025
= 29 3,182 (0,9/5)
= 29 1,21
sebagai interval kepercayaan 95% bagi parameter
Jadi apabila ditulis secara lain, interval keyakinan 95% bagi adalah:
27,79 < < 30,21
n
Dengan memasukkan nilai b = 0,12 ; S = 0,9 dan
X
i 1
2
1
=4000 dan t0,025 = 3,182,
maka akan diperoleh interval kepercayaan 95% utuk parameter yaitu:

= 0,12 3,182 (0,9/4000)
= 0,12 0,0859
atau dapat ditulis: 0,0341 < < 0,2059.
Hal 128 dari 148
Handout Statistik 2
Uji hipoteses yang paling perlu dilakukan dalam analisa regresi bertujuan
menunjukkan ada tidaknya hubungaan linear yang signifikan antara variabel X dan
Y. Ada tidaknya hubungan linear yang nyata (signifikan) antara variabel X dan Y
adalah ditentukan oleh ada tidaknya secara signifikan parameter yaitu bergantung
pada ada tidaknya perbedaan yang nyata (signifikan) antara nilai parameter
dengan nol.
Ini berarti bahwa yang perlu ditunjukkan adalah apakah = 0 atau 0.

Seperti halnya pengujian hipotesis yang biasa kite perlu menguji hipotesa nol:
=0
yaitu hipotesa yang menyatakan bahwa tidak ada perbedaan yang nyata antara
dengan nol.
Hipotesa alternatifnya adalah:
0
yaitu hipotesa yang menyatakan bahwa ada perbedaan yang nyata antara nilai
dengan nol.
Biasanya kita mengadakan pengujian hipotesis dengan memakai 2 sisi kurva

distribusi t. Misalnya derajat kepercayaan yang kita kehendaki adalah 95%.
Hipotesis diterima apabila nilai t yang dihitung dari sampel ternyata lebih kecil
(secara absolut) daripada t tabel. Demikian pula sebaliknya, hipotesa ditolak
(menerima hipotesa alternatif) apabila t hitung lebih besar (secara absolut) dari t
tabel.
Dengan menggunakan soal di atas, kita dapat hitung nilai t sebagai berikut:
b
S
n
x
i 1
0,12
8,433
0,9
4000
Nilai t hitung tersebut lebih besar daripada t tabel (3,182). Oleh karena itu
berdasarkan tingkat kesalahan 5% kita menolak hipotesa nol dan menerima hipotesa
alternatif. Ini berarti bahwa b =0,12 adalah berbeda secara nyata dengan nol.
Sehingga dapat dikatakan bahwa parameter regresi yang ditaksir itu tidak sama
dengan nol. Atau ada hubungan regresi linear yang nyata antara X dan Y.
Dalam beberapa hal kita dapat juga memakai uji t satu sisi. Hal ini dilakukan
apabila hubungan yang diperkirakan sudah jelas arahnya. Sebagai contoh, apabila
kita menghubungkan antara tingkat konsumsi C dengan penghasilan Y dengan
menggunakan model:
C = a + bY
Secara teoritis dapat diduga bahwa penghasilan Y akan mempengaruhi konsumsi

C dalam hubungan yang positif. Dalam kasus demikian H0 dapat diuji dengan satu
sisi saja yaitu dengan:
H0 : = 0
Hal 129 dari 148
Handout Statistik 2
H1 : > 0
Dengan menggunakan hipotesa di atas kriteria penolakan hipotesa nol tersebut juga
akan berubah. Kita akan menolak hipotesa nol dan menerima hipotesa alternatif
dengan derajat kepercayaan 5% jika nilai t hitung lebih besar daripada t tabel. Jika
tidak lebih besar maka kita akan menerima hipotesa nol.
Hal 130 dari 148
Handout Statistik 2
9. ANALISIS REGRESI GANDA DAN KORELASI GANDA

Apabila kita menggunakan lebih dari satu variabel yang mempengaruhi
(independent variabel) untuk menaksir variabel dependen, maka taksiran kita akan
menjadi lebih akurat. Proses ini disebut analisis regresi ganda.
A. Pengertian Regresi Ganda dan Korelasi Ganda
Contoh:
Apabila kita ingin mengetahui hubungan antara jumlah rumah yang terjual dengan
jumlah pengeluaran iklan F maka analisis ini disebut regresi sederhana. Jika kita
ingin meningkatkan akurasinya, maka kita dapat menambah variabel lain, misalnya
jumlah agen penjualan, analisis ini disebut regresi berganda.
Keuntungan analisis regresi ganda ialah kita dapat menggunakan informasi lebih
banyak sebagai variabel, guna menduga variabel dependen. Dengan demikian hasil
estimasi kita menjadi lebih akurat.
Dengan demikian kita dapat mendifinisikan regresi ganda adalah regresi yang
menggunakan lebih dari 1 variabel independen guna menduga variabel dependen.

B. Langkah-Langkah Analisis Regresi Ganda dan Korelasi Ganda
Ada 3 langkah atau tahap untuk proses analisis regresi ganda dan korelasi ganda,
yaitu:
1.
Menentukan persamaan regresi ganda
2.
Menentukan penyimpangannya (standard error of estimate)
3.
Menggunakan analisis korelasi ganda untuk menentukan ketetapan

persamaan garis regresinya
C. Persamaan Garis Regresi Ganda
Dalam regresi sederhana, X adalah variabel independen. Oleh karena dalam

regresi ganda variabel independen lebih dari 1, maka dapat digunakan simbol X 1, X2
dan seterusnya.
Y = a + bX1 + cX2
Dimana:
Y
= nilai yang diduga
= intersep
X1 dan X2
= nilai dari 2 variabel independen
b dan c
= lereng garis yang berkaitam dengan variabel X1 dan X2.
Bab 9: Analisis Regresi Ganda dan Korelasi Ganda
Hal 131 dari 148
Handout Statistik 2
Persamaan garis tersebut dapat digambarkan dalam grafik 3 dimensi berikut:
Besarnya penyimpangan persamaan regresi ganda dihitung menggunakan

metode jumlah kuadrat terkecil dengan kriteria pendugan bidang jumlah kuadrat
penyimpangan minimum, yaitu penyimpangan titik-titik terhadap titik-titik yang
terletak dalam bidang.
3 persamaan yang digunakan untuk menghitung konstanta a, b dan c adalah:
Y Na b X 1 c X 2
2
X 1Y a X 1 b X 1 c X 1 X 2
X 2Y a X 2 b X 1 X 2 c X 2
Contoh:
Penjualan (Y)
7
12
17
20
Iklan Radio (X1)

4
7
9
12
Iklan TV (X2)
1
2
5
8
Berdasarkan tabel diatas, disusunlah tabel berikut:

Y
7
12
17
20
=56
X1
4
7
9
12
=32
X2
1
2
5
8
=16
X1Y
X2Y
28
7
84
24
153
85
240
160
=505 =276
X1X2
4
14
45
96
=159
X12
16
49
81
144
=290
X22
1
4
25
64
=94
Y2
49
144
289
400
=882
Berdasar tabel diatas, maka diperoleh 3 persamaan sebagai berikut:

1.
56 = 4a + 32b +16c
2.
505 = 32a + 290b +159c
3.
276 = 16a + 159b + 94c
Penyelesaian:
Persamaan 1 dan 2 menghasilkan persamaan 4
Persamaan 1 x 8
..
448 = 32a + 256b + 128c
Hal 132 dari 148
Handout Statistik 2
Persamaan 2 x 1
..
505 = 32a + 290b + 159c

-------------------------------- -
Persamaan (4)
57 =
34b + 31c
Persamaan 1 dan 3 menghasilan persamaan 5

Persamaan 1 x 4
..
224 = 16a + 128b + 64c
Persamaan 3 x 1
..
276 = 16a + 159b + 94c

-------------------------------- -
Persamaan (5)
52 =
31b + 30c
Persamaan (4) dan (5) akan diperoleh konstanta c:

Persamaan 4 x 31 ..
1767 = 1054b + 961c
Persamaan 5 x 34 ..
1768 = 1054b + 1020c

-------------------------------- -
Persamaan (5)
1=
59c
c = 0,017
Nilai c disubstitusikan pada persamaan 4 diperoleh konstanta b:
57 = 34b + 31(0,017)
57 = 34b + 0,527
56,473 = 34b
b = 1,66
Nilai c dan b disubstitusikan pada persaman 1 diperoleh konstanta a:
56= 4a + (32)(1,66) + (16)(0,017)
56 = 4a + 53,12 + 0,272
4a = 2,608
a = 0,652
Persamaan regresi ganda adalah:
Y = 0,652 + 1,66X1 + 0,017 X2
D. Interpretasi Konstanta A, B dan C
Konstanta a adalah intersep dari Y. Sedang b dan c adalah lereng garis regresi
ganda. Konstanta a, b dan c disebut koefisien regresi ganda (the estimated
regression coeficients).
Konstanta a adalah jumlah Y tanpa variabel X. Konstanta b dan c adalah besar

perubahan X1 dan X2 terhadap Y.
E. Regresi Ganda dan Peramalan atau Proyeksi
Hal 133 dari 148
Handout Statistik 2
Persamaan garis regresi ganda dapat digunakan untuk peramalan atau proyeksi.
Yakni dengan mengubah variabel X1 dan X2 akan dapat diramalkan pengaruhnya

terhadap Y.
F. Definisi dan Efek Multikolinearitas
Dalam analisa regresi ganda, koefisien regresi menjadi kurang reliabel apabila
tingka korelasi antar variabel independen meningkat. Apabila tingkat korelasi antar
variabel independen tinggi maka kita menjumpai masalah multikolinearitas
(multicolinearity).
Contoh: apabila kita menduga penjualan berdasarkan variabel independen
jumlah penjual dan gajinya. Kedua variabel ini mempunyai hubungan yang erat.
Variabel tambahan justru akan memberika penyimpangan besar pada nilai koefisien
regresinya.
Agar multikolinearitas dapat seminimum mungkin, maka sebelum menggunakan
analisis regresi ganda, digunakan analisis regresi sederhana antar variabel

independen.
G. Penyimpangan Standar Terhadap Garis Regresi Ganda
Dalam regresi sederhana, pandangan terhadap garis regresi akan menjadi
semakin akurat apabila penyimpangan terhadap garis regresi semakin kecil. Hal
demikian juga berlaku pada regresi ganda.
Penyimpangan terhadap garis regresi ganda dapat dirumuskan sebagai berikut:
Se
Y 2 (aY ) (bX 1Y ) (cX 2Y )

n3
Se = penyimpangan standar terhadap regresi ganda

Y
= nilai variabel dependen
X1 dan X2 = variabel independen

n
= jumlah unsur sampel
a, b dan c = koefisien regresi

H. Penentuan Interval Keyakian terhadap Variabel Y
Pada regresi sederhana, kita dapat menggunakan penyimpangan standar

terhadap garis regresi dan distribusi t untuk menentukan interval keyakinan pada
garis regresi ganda.
Contoh, nilai penjualan (Y= 17,456) dan penyimpangan standar terhadap regresi
ganda (Se) = 1,58. Dengan menggunakan 96% batas kepercayaan tabel t dengan
derajat kebebasan (4-3) = 1 adalah 12,706. Interval keyakinan dapat dihitung sebagai
berikut:
Hal 134 dari 148
Handout Statistik 2
Y + t(Se)
= 17,456 + 12,706 x 1,59

= 17,456 + 20,075
= 37,53 sebagai batas atas
dan
Y + t(Se)
= 17,456 - 12,706 x 1,59

= 17,456 - 20,075
= -2,619 sebagai batas bawah
Dengan kepercayaan 95%, maka jumlah penjualan akan terletak antara -2,619 dan
37,53.
I. Koefisien Determinasi Ganda
Dalam analisis regresi sederhana telah dijelaskan ukuran tingkat hubungan
antara 2 variabel dengan koefisien determinasi (r2).

Koefisien determinasi adalah bagian variasi total dari variabel independen (Y)
yang dijelaskan oleh garis regresi. Demikian pula pada regresi ganda,koefisien ini
disebut koefisien determinasi ganda (R2) yaitu bagian dari variabel total dari Y yang
dijelaskan oleh bidang regresi.
Rumus koefisien determinasi ganda adalah:
a Y b X 1Y c X nY 2
R
Y 2 nY 2
2
X1 dan X2 = variabel independen

Y
= rata-rata variabel independen
= jumlah unsur sampel
a, b dan c = koefisien regresi ganda

Y
= variabel dependen
Interpretasi koefisien determinasi ganda adalah sebagai berikut: misalkan R 2 =
0,975 maka dapat diinterpretasikan bahwa variabel X 1 dan X2 menjelaskan 97,5%

dari variabel total Y.
Hal 135 dari 148
lampiran

Statistika 2

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Statistika 2

Diunggah oleh

Hak Cipta:

Format Tersedia

HANDO

dengan masalah-masalah ketidakpastian (uncertainty).

dengan suatu konsep Probabilitas (probability, kemungkinan). Probabilitas (P)

Pendekatan Klasik atau Matematik

Teori probabilitas berkembang pada abad ke-19 di Perancis, pada waktu

Menurut pendekatan klasik, terjadinya suatu peristiwa (P) diberikan definisi

kejadian/peristiwa apabila setiap kejadian mempunyai kesempatan yang

Apabila dirumuskan, maka probabilitas terjadinya suatu peristiwa (P) adalah:

dimana K = kejadian yang menguntungkan dan S = seluruh kejadian

Contoh-contoh dari pendekatan klasik:

Pelemparan sebuah mata uang logam

Sebuah dadu yang mempunyai 6 sisi

Pendekatan Empiris atau Frekuensi

frekuensi, karena perhitungannya didasarkan pada frekuensi relatif sedang di

Hal 2 dari 148

Probabilitas terjadinya suatu peristiwa

menurut pendekatan empiris atau frekuensi adalah frekuensi relatif

Probabilitas terjadinya peristiwa kecelakaan lalu

Probabilitas terjadinya peristiwa seorang pedagang

pembatasan jumlah percobaan terlampau sedikit atau kecil maka akan

jarang terjadi, misalnya bangkrutnya suatu perusahaan, terbakarnya sebuah

hakekatnya sangat tergantung kepada pandangan masing-masing individu.

pandangan yang optimis bahwa peristiwa itu akan terjadi,

pandangan yang pesimis bahwa peristiwa itu akan terjadi,

Kedua kelompok tersebut adalah sangat subyektif.

Agar dapat memperoleh hasil yang obyektif, maka kedua kelompok

Hasil ini dapat dikatakan obyektif, karena telah dihitung segenap

Pada hakekatnya semua probabilitas mengandung unsur subyektifitas

Bab 1: Teori Probabilitas

Hal 3 dari 148

Ruang Sampel dan Sub-Ruang Sampel

Pengertian Ruang Sampel Menurut Pendekatan Klasik

himpunan yang mempunyai unsur seluruh peristiwa atau kejadian.

dijumpai 2 macam peristiwa atau kejadian, yaitu peristiwa sisi gambar

bersama, akan dijumpai peristiwa-peristiwa sebagai berikut:

menunjukkan peristiwa kedua mata uang tersebut sisi gambar

(H,T),(T,H) menunjukkan kedua peristiwa tersebut masing-masing bersisi

menunjukkan peristiwa kedua mata uang tersebut sisi tulisan

sampel, maka dapat dibedakan 3 macam sub-ruang sampel.

Bab 1: Teori Probabilitas

Hal 4 dari 148

2. Pengertian Ruang Sample Menurut Pendekatan Frekuensi/Empiris

landasan, sehingga ruang sampel menurut pendekatan ini adalah jumlah

Bab 1: Teori Probabilitas

Peristiwa dan Probabilitas Suatu Peristiwa

Probabilitas Suatu Peristiwa

Probabilitas suatu peristiwa dirumuskan dengan P () yang diartikan P

P(A) diartikan sebagai probabilitas suatu peristiwa A. Apabila suatu

= Banyaknya peristiwa A terjadi

m = Jumlah seluruh peristiwa

Selanjutnya probabilitas terjadinya peristiwa yang bukan A dirumuskan

= menyatakan peristiwa bukan A atau komplemen A

Misalkan peristiwa A adalah peristiwa kedua sisi mata uang menunjukkan

Bab 1: Teori Probabilitas

Hal 6 dari 148

Karena peristiwa A hanya terdiri 1 dari 4 peristiwa maka peristiwa yang

Asas-Asas Menghitung Probabilitas

Peristiwa yang Saling Meniadakan/Saling Asing (Mutually

Dua peristiwa dikatakan saling meniadakan atau saling asing, apabila

Apabila peristiwa A dan B saling meniadakan maka terjadinya peristiwa A

Secara matematis, peristiwa saling meniadakan dapat dirumuskan

Apabila peristiwanya lebih dari 2 peristiwa maka tetap berlaku asas

Bab 1: Teori Probabilitas