Anda di halaman 1dari 147

HANDO

UT
STATISTIKA II

Fakultas Ekonomi
Universitas 17 Agustus 1945
Banyuwangi

Handout Statistik 2

1. TEORI PROBABILITAS
A.

Konsep Probabilitas
Dalam kehidupan sehari-hari setiap orang selalu akan berhadapan

dengan masalah-masalah ketidakpastian (uncertainty).


Masalah ketidakpastian dicoba untuk dapat diukur atau dikuantifisir

dengan suatu konsep Probabilitas (probability, kemungkinan). Probabilitas (P)


dinyatakan dalam angka-angka 0 sampai 1. Probabilitas (P) = 0, artinya suatu
peristiwa atau kejadian mempunyai kemungkinan terjadi 0% atau dengan kata lain
peristiwa itu tidak mungkin terjadi.
Di lain pihak, apabila suatu peristiwa atau kejadian dinyatakan probabilitasnya (P) =
1, berarti bahwa peristiwa atau kejadian itu 100% pasti terjadi.
0 P 1

B.

Pengertian Probabilitas
Ada beberapa metode atau pendekatan untuk menjelaskan pengertian

probabilitas yaitu:
1.

Pendekatan Klasik atau Matematik

Teori probabilitas berkembang pada abad ke-19 di Perancis, pada waktu


perjudian mengalami kejayaan di Perancis, sehingga untuk menjelaskan teori
probabilitas digunakan alat-alat yang digunakan dalam perjudian, seperti
dadu, kartu dan sebagainya.

Menurut pendekatan klasik, terjadinya suatu peristiwa (P) diberikan definisi


sebagai

rasio

dari

kejadian

yang

menguntungkan

seluruh

kejadian/peristiwa apabila setiap kejadian mempunyai kesempatan yang


sama.

Apabila dirumuskan, maka probabilitas terjadinya suatu peristiwa (P) adalah:


P

K
S

dimana K = kejadian yang menguntungkan dan S = seluruh kejadian

Contoh-contoh dari pendekatan klasik:


a.

Pelemparan sebuah mata uang logam

b.

Sebuah dadu yang mempunyai 6 sisi

c.

Kartu Bridge

2.

Pendekatan Empiris atau Frekuensi


Pendekatan

ini

disebut

pendekatan

frekuensi, karena perhitungannya didasarkan pada frekuensi relatif sedang di


lain pihak disebut sebagai pendekatan empiris, karena perhitungannya
berdasarkan pada pengalaman empiris.
Bab 1: Teori Probabilitas

Hal 2 dari 148

Handout Statistik 2

Probabilitas terjadinya suatu peristiwa

menurut pendekatan empiris atau frekuensi adalah frekuensi relatif


terjadinya peristiwa tersebut di dalam percobaan yang berulang-ulang
yang tidak terhingga sifatnya. Karena pada hakekatnya suatu percobaan
yang berulang-ulang yang tidak terhingga tidak mungkin dilaksanakan, maka
di dalam perhitungan ini jumlah percobaannya dibatasi.
Contoh dari pendekatan ini adalah:

a.

Probabilitas terjadinya peristiwa kecelakaan lalu


lintas sebagai akibat pengemudi tidak memiliki Surat Ijin Mengemudi

b.

Probabilitas terjadinya peristiwa seorang pedagang


kaki lima berpindah tempat/lokasi usahanya.
Dalam menentukan pembatasan jumlah percobaan sesuai dengan

definisinya

perlu

pertimbangan

agar

cukup

banyak,

sebab

apabila

pembatasan jumlah percobaan terlampau sedikit atau kecil maka akan


membawa pada kesimpulan yang keliru.
3.

Probabilitas Subyektif
Di dalam kehidupan sehari-hari dapat dijumpai peristiwa-peristiwa yang

jarang terjadi, misalnya bangkrutnya suatu perusahaan, terbakarnya sebuah


toko, dan lain-lain.
Probabilitas terjadinya peristiwa-peristiwa yang jarang terjadi ini pada

hakekatnya sangat tergantung kepada pandangan masing-masing individu.


Pandangan individu ini dapat dikelompokkan ke dalam 2 kelompok, yakni:
-

pandangan yang optimis bahwa peristiwa itu akan terjadi,


sehingga probabilitasnya mendekati 1, misalkan P = 0,90

pandangan yang pesimis bahwa peristiwa itu akan terjadi,


sehingga probabilitasnya mendekati 0, misalkan P = 0,10

Kedua kelompok tersebut adalah sangat subyektif.

Agar dapat memperoleh hasil yang obyektif, maka kedua kelompok


pandangan tersebut perlu dikombinasikan, dengan cara menghitung nilai
rata-ratanya.

Hasil ini dapat dikatakan obyektif, karena telah dihitung segenap


pandangan individu yang berbeda, baik yang optimis maupun yang pesimis.

Pada hakekatnya semua probabilitas mengandung unsur subyektifitas


baik pada pendekatan klasik maupun pada pendekatan empiris. Pada pendekatan
klasik, unsur subyektifitas terletak di dalam memilih peristiwa yang menguntungkan,
pemilihan ini akan berbeda dari satu individu dengan individu yang lain (subyektif).
Demikian pula halnya pada pendekatan empiris, unsur subyektifitas terletak pada
pembatasan jumlah percobaannya. Masing-masing individu akan menetapkan
jumlah percobaannya secara berbeda (subyektif).

Bab 1: Teori Probabilitas

Hal 3 dari 148

Handout Statistik 2

C.

Ruang Sampel dan Sub-Ruang Sampel


1.

Pengertian Ruang Sampel Menurut Pendekatan Klasik


Ruang sampel menurut pendekatan klasik adalah suatu

himpunan yang mempunyai unsur seluruh peristiwa atau kejadian.


Contoh, dalam pelemparan sebuah mata uang, akan

dijumpai 2 macam peristiwa atau kejadian, yaitu peristiwa sisi gambar


sebagai peristiwa 1 dan sisi tulisan yang merupakan peristiwa 2. Maka ruang
sampel dari pelemparan sebuah mata uang mempunyai 2 unsur, yaitu unsur
sisi gambar dan sisi tulisan.

1
Sisi
Gamba
r

2
Sisi
Tulisan

Ruang Sampel

Dari bagan di atas, dapat dilihat bahwa ruang sampel merupakan jumlah dari
seluruh peristiwa.
Selanjutnya dari ruang sampel dapat disusun berbagai

macam sub-ruang sampel, karena sub ruang sampel merupakan bagian dari
ruang sampel.
Contoh pada pelemparan 2 buah mata uang secara

bersama, akan dijumpai peristiwa-peristiwa sebagai berikut:


(H,H), (H,T), (T,H) dan (T,T)
(H,H)

menunjukkan peristiwa kedua mata uang tersebut sisi gambar

(H,T),(T,H) menunjukkan kedua peristiwa tersebut masing-masing bersisi


gambar dan tulisan
(T,T)

menunjukkan peristiwa kedua mata uang tersebut sisi tulisan


Apabila masing-masing ini dianggap sebagai sub-ruang

sampel, maka dapat dibedakan 3 macam sub-ruang sampel.

Bab 1: Teori Probabilitas

Hal 4 dari 148

Handout Statistik 2

1
(H)

2
(H)

1
(H)

2
(T)

Sub-Ruang
Sampel 1

Sub-Ruang
Sampel 2
1
(T)

2
(H)

1
(T)

2
(T)

Ruang
Sampel

Sub-Ruang
Sampel 3

2. Pengertian Ruang Sample Menurut Pendekatan Frekuensi/Empiris


Pendekatan frekuensi menggunakan frekuensi sebagai

landasan, sehingga ruang sampel menurut pendekatan ini adalah jumlah


seluruh frekuensi.
Contoh,

jumlah

seluruh

mahasiswa

suatu

akademi

manajemen 1500 orang merupakan ruang sampel yang unsurnya terdiri dari
1500 orang mahasiswa. Dari ruang sampel ini dapat disusun berbagai subruang sampel, misalnya menurut jenis kelamin, asal daerah, asal sekolah,
pekerjaan orang tua, maupun tahun masuknya.
Menurut tahun masuknya dapat dibedakan menjadi 3

macam sub-ruang sampel yaitu tahun pertama, tahun kedua dan tahun
ketiga.
Sub-Ruang Sampel
Mahasiswa Tahun I
600 orang

Bab 1: Teori Probabilitas

Mahasiswa Tahun II
600 orang
Mahasiswa Tahun III
400 orang

Ruang Sampel
Mahasiswa Akademi
Manajemen
1500
orang
Hal
5 dari 148

Handout Statistik 2

D.

Peristiwa dan Probabilitas Suatu Peristiwa


1.

Pengertian Peristiwa

Apabila suatu ruang sampel merupakan suatu kumpulan hal yang bersifat
universal, maka dari ruang sampel dapat disusun dalam berbagai sub-ruang
sampel yang mempunyai sifat-sifat tertentu.

Sub-ruang sampel yang merupakan unsur-unsur yang mempunyai sifatsifat tertentu ini dapat disebut sebagai suatu peristiwa. Dalam pelemparan 2
buah mata uang dapat dibedakan 3 macam peristiwa yaitu peristiwa 2 sisi
gambar, 1 sisi gambar dan 1 sisi tulisan serta 2 sisi tulisan.

2.

Probabilitas Suatu Peristiwa

Probabilitas suatu peristiwa dirumuskan dengan P () yang diartikan P


sebagai probabilitas dan peristiwanya dinyatakan di antara tanda kurung.

P(A) diartikan sebagai probabilitas suatu peristiwa A. Apabila suatu


peristiwa A terjadi sebanyak n kali dari m percobaan, maka
P A n m

= Probabilitas

A = Peristiwa A
n

= Banyaknya peristiwa A terjadi

m = Jumlah seluruh peristiwa

Selanjutnya probabilitas terjadinya peristiwa yang bukan A dirumuskan


sebagai berikut:
P A 1 P A 1 n m
P A P A 1

= menyatakan peristiwa bukan A atau komplemen A

Misalkan peristiwa A adalah peristiwa kedua sisi mata uang menunjukkan


sisi gambar atau H. Terjadinya kedua sisi mata gambar semua atau (H.H)
adalah 1 dari 4 macam peristiwa. Maka sesuai rumus di atas, n = 1 dan m = 4:
P A 1 4
P A 1 1 4 3 4
P A P A 1

Bab 1: Teori Probabilitas

Hal 6 dari 148

Handout Statistik 2

Karena peristiwa A hanya terdiri 1 dari 4 peristiwa maka peristiwa yang


bukan A, yaitu 2 peristiwa sisi yang menunjukkan 1 gambar dan 1 tulisan (H,T
dan T,H) serta 1 peristiwa yang menunjukkan sisi tulisan (T,T).

E.

Asas-Asas Menghitung Probabilitas


1.

Peristiwa yang Saling Meniadakan/Saling Asing (Mutually


Exclusive)

Dua peristiwa dikatakan saling meniadakan atau saling asing, apabila


kedua peristiwa itu tidak dapat terjadi bersama-sama. Secara matematis
dikatakan dua peristiwa A dan B saling meniadakan atau saling asing, apabila
kedua peristiwa itu memiliki unsur yang sama (A dan B tidak ada). Dapat
dilukiskan dengan diagram Venn berikut:

atau

Apabila peristiwa A dan B saling meniadakan maka terjadinya peristiwa A


tidak dapat bersama dengan peristiwa B, artinya apabila peristiwa A terjadi, B
tidak terjadi dan sebaliknya.

Secara matematis, peristiwa saling meniadakan dapat dirumuskan


sebagai berikut:
P (A atau B) = P (A) + P(B)
atau
P (A U B) = P(A) + P(B)

Apabila peristiwanya lebih dari 2 peristiwa maka tetap berlaku asas


penjumlahan.

atau
B

Bab 1: Teori Probabilitas

Hal 7 dari 148

Handout Statistik 2

Secara matematis, peristiwa saling meniadakan dapat dirumuskan


sebagai berikut:
P (A atau B atau C) = P (A) + P(B) + P(C)
atau
P (A U B U C) = P(A) + P(B) + P(C)

2.

Peristiwa yang Tidak Saling Meniadakan

Dua peristiwa dikatakan tidak saling meniadakan, apabila peristiwa yang


satu dapat terjadi bersama dengan peristiwa yang lain. Dengan kata lain
kedua peristiwa itu tidak terpisah.

Peristiwa yang tidak saling meniadakan ini dapat digambarkan dalam


diagram Venn sebagai berikut:

AB
B

2 peristiwa yang tidak saling meniadakan ini dapat dirumuskan sebagai


berikut:
P (A atau B) = P(A) + P(B) P (A dan B)
Atau
P (A U B) = P(A) + P(B) P(A B)

Dalam penjumlahan P(A) dan P(B) sebenarnya P(A dan B) telah dihitung
2 kali, oleh karena itu dalam rumus di atas dikurangkan 1 kali.

Apabila ada 3 peristiwa yang tidak saling meniadakan, maka dapat


dirumuskan sebagai berikut:
P (A atau B atau C) = P(A) + P(B) + P(C) P (AB) P(AC) P(BC) + P(ABC)
Atau
P(A U B U C)=P(A) +P(B)+P(C) P(A B) P(A C) P(B C) P(A B

C)
3.

Peristiwa yang Komplementer

Apabila di dalam suatu ruang sampel terdapat peristiwa A dan bukan A (),
sedangkan mengandung semua unsur-unsur dalam ruang sampel
kecuali A, maka dikatakan peristiwa merupakan peristiwa yang
komplementer bagi A.

Bab 1: Teori Probabilitas

Hal 8 dari 148

Handout Statistik 2

Peristiwa A dan merupakan peristiwa yang eksklusif secara


bersama. Gabungan antara A dan merupakan sebuah ruang
sampel. Keadaan ini dapat digambarkan sebagai berikut:

Komplimen A ()

Ruang Sampel

Dirumuskan secara matematis:


P() = 1 - P(A)
P( A U ) = P(A) + P() = 1

4.

Peristiwa yang Independen

Dua peristiwa dikatakan independen apabila peristiwa yang satu tidak


mempengaruhi peristiwa yang lain. Dengan kata lain dapat dikemukakan
bahwa terjadinya peristiwa yang satu tidak mempengaruhi peristiwa yang
lain.

Probabilitas dari suatu peristiwa yang independen ini dapat dibedakan


menjadi 3 macam, yaitu:
a.

Marginal Probability (Probabilitas marjinal)

b.

Joint Probability (Probabilitas Gabungan)

c.

Conditional Probability (Probabilitas Bersyarat)

a.

Probabilitas Marginal

Probabilitas marginal atau probabilitas yang tidak bersyarat adalah


probabilitas terjadinya suatu peristiwa yang tidak memiliki
hubungan dengan terjadinya peristiwa yang lain.

Secara matematis dapat dirumuskan sebagai berikut:


Probabilitas terjadinya peristiwa A = P(A)
Probabilitas terjadinya peristiwa B = P(B)

b.

Probabilitas Gabungan

Probabilitas terjadinya 2 peristiwa atau lebih yang secara


bersama-sama atau secara berurutan merupakan hasil perkalian dari
probabilitas marginal atau probabilitas masing-masing peristiwa.

Secara matematis dirumuskan sebagai berikut:


P (A dan B) = P (A) x P(B)
P (A dan B dan C) = P (A) x P(B) x P(C)

Bab 1: Teori Probabilitas

Hal 9 dari 148

Handout Statistik 2

P (A dan B) = Probabilitas terjadinya peristiwa A dan B bersama atau


berurutan yang disebut joint probability
P(A)

= Probabilitas marginal dari peristiwa A

P(B)

= Probabilitas marginal dari peristiwa B

c.

Probabilitas Bersyarat pada Peristiwa yang


Independen

Probabilitas bersyarat adalah probabilitas terjadinya suatu peristiwa


dengan syarat peristiwa yang lain harus terjadi.

Sedangkan peristiwa yang independen adalah peristiwa yang tidak


dipengaruhi/tergantung pada peristiwa yang lain. Oleh sebab itu,
probabilitas bersyarat pada peristiwa yang independen dapat
dirumuskan secara matematis sebagai berikut:
P(B/A) = P(B)
Atau
P(A/B) = P(A)
P(B/A)

= Probabilitas peristiwa B dengan syarat peristiwa A harus


terjadi

P(A/B)

= Probabilitas peristiwa A dengan syarat peristiwa B harus


terjadi

Karena dalam peristiwa yang independen persyaratan ini tidak


berpengaruh, maka P(B/A) = P(B) sedangkan P(A/B) =P(A).
5.

Peristiwa yang Dependen


Dua peristiwa dikatakan dependen apabila peristiwa yang satu

dipengaruhi atau tergantung pada peristiwa yang lain. Probabilitas pada


peristiwa yang dependen ini ada 3 macam, yaitu marginal probability, joint
probability dan conditional probability.
a.

Probabilitas Bersyarat pada Peristiwa Dependen

Contoh, sebuah kotak berisi 10 buah bola dengan rincian:


3 buah bola merah bergaris
1 buah bola merah kotak-kotak
2 buah bola biru bergaris
4 buah bola biru kotak-kotak
Pada bola merah dapat dikatakan bahwa probabilitas bola bergaris
dengan syarat bola itu merah adalah P(G/M) = = 0,75. Dengan
perhitungan sebagai berikut:

Bab 1: Teori Probabilitas

Hal 10 dari 148

Handout Statistik 2

P (GM ) 3 10

3 10 10 4 3 4 0,75
P( M )
4 10

P G M

Untuk bola biru, probabilitas bola bergaris dengan syarat bola itu biru
adalah:
P G B

P (GB ) 2 10

2 10 10 6 2 6 0,33
P( B)
6 10

Probabilitas bersyarat dapat dirumuskan sebagai berikut:

P ( AB )
P( B)

P A B

b.

atau

P B A

P ( BA)
P ( A)

Joint Probabilitas dari Peristiwa Dependen

Berdasarkan rumus probabilitas bersyarat:

P ( AB )
maka P(AB) = P(A/B) x P(B)
P( B)

P A B

P(AB) merupakan joint probability dari peristiswa yang dependen.

c.

Marginal Probability dari Peristiwa Dependen

Marginal probability dari peristiwa yang dependen dapat dihitung


dengan menjumlah semua joint probability.

Contoh bola di atas, maka probabilitas bola merah adalah


P(M) = P(GM) + P(KM) = 3/10 + 1/10 = 4/10

6.

Teori Bayes

Teori Bayes yang lebih dikenal dengan nama kaedah Bayes memainkan
peranan yang penting dalam penggunaan probabilitas bersyarat dan
menghitung probabilitas subyektif. Teori ini dikembangkan oleh Thomas
Bayes pada tahun 1763.

Apabila A1, A2, A3 .. An merupakan suatu sekatan dari ruang sampel S dan
apabila peristiwa A1, A2, A3 .. An merupakan peristiwa yang lengkap
terbatas dengan probabilitas 0, maka probabilitasnya adalah:
P(A) = P(A1) P(A/A1) + P(A2) P(A/A2) + P(An) P(A/An)
atau
P(A) = P(An) P(A/An)

Sesuai dengan rumus probabilitas bersyarat maka kaedah bayes dapat


dirumuskan pula sebagai berikut:

P Ak A

P A Ak P Ak P A Ak

P A
P A

P Ak A

P Ak P A Ak
P A n P A A n

Bab 1: Teori Probabilitas

Hal 11 dari 148

Handout Statistik 2

Contoh, peti A berisi 3 bola hijau dan 5 bola merah, sedang peti B berisi 2
bola hijau, 1 bola merah dan 2 bola kuning. Apabila peti tersebut dipilih
secara random dan selanjutnya dipilih sebuah bola secara random pula, maka
probabilitas bola hijau dipilih dapat dijelaskan sebagai berikut:
Jika A merupakan peristiwa terpilihnya bola hijau, sedangkan terpilihnya peti
A dinyatakan dengan A1 dan terpilihnya peti B dengan A2, maka
P(A1)

= P(A2) = 1/2

P(A/A1)

= 3/8

P(A/A2)

= 2/5

Sesuai dengan teori Bayes, maka:

P A2 A

7.

P A2 P A A2
1 2 2 5

16 31
P A1 P A A1 P A2 P A A2 1 2 3 8 1 2 2 5
Harapan Matematis

Apabila P1, P2 Pn merupakan probabilitas terjadinya peristiwa-peristiwa


A1, A2 An yang merupakan peristiwa yang independen dan lengkap
terbatas, maka jumlah seluruh harapan matematis dirumuskan dengan:
A = A1P1 + A2P2 + AnPn

Harapan matematis ini terdapat pada sistem perjudian dan asuransi. Dalam
sistem perjudian pada asasnya penjudi membayar sejumlah uang untuk
menerima hak sejumlah uang atau tidak sama sekali. Hal yang sama akan
terjadi pada sistem asuransi jiwa, seorang yang mengasuransikan jiwanya
akan membayar premi asuransi. Selama jangka asuransi apabila dia
meninggal, maka dia akan memperoleh sejumlah polis asuransi penuh,
sedang jika dia sehat, maka dia tidak memperoleh apa-apa.

F.

Teori Pengambilan Keputusan


Setiap individu, kelompok, maupun perusahaan akan selalu menghadapi

masalah untuk bertindak berdasarkan berbagai alternatif tindakan. Pemilihan


alternatif

tindakan

ini

didasarkan

karena

adanya

masalah

ketidakpastian

(uncertainty).
Ada 2 macam pengambilan keputusan, yaitu:

1.

Teori pengambilan keputusan berdasarkan pendekatan klasik.


Teori ini didasarkan atas pertimbangan ekonomi secara tidak langsung
melainkan

Bab 1: Teori Probabilitas

merupakan

pengambilan

kesimpulan

terhadap

populasi

Hal 12 dari 148

Handout Statistik 2

berdasarkan pada informasi sampel sebagaimana yang dibahas dalam


pendugaan parameter maupun pengujian hipotesa.
2.

Teori pengambilan keputusan berdasarkan pendekatan Bayes


Pengambilan keputusan berdasar pendekatan ini dititikberatkan pada
penggunaan

pertimbangan

ekonomi

secara

langsung,

yakni

dengan

menggunakan tabel hasil (pay-off table).


G.

Dasar-Dasar Pengambilan Keputusan

Ada 4 dasar utama dalam pengambilan keputusan, yaitu:


1.

Alternatif Cara Bertindak


Dalam pengambilan keputusan kita dihadapkan pada berbagai alternatif pilihan.
Oleh sebab itu, perlu adanya evaluasi terhadap berbagai alternatif tindakan.

2.

Peristiwa atau Keadaan Dunia


Apabila di dalam pengambilan keputusan kita hanya menghadapi suatu peristiwa
atau keadaan, maka kita tidak akan menjumpai kesulitan dalam pengambilan
keputusan ini. Sebaliknya apabila kita menghadapi berbagai macam peristiwa
atau keadaan dalam dunia ini, maka pengambilan keputusan menjadi sulit
sehingga perlu mengadakan pendugaan berdasar informasi yang ada agar
pengambilan keputusan mendekati keadaan yang sebenarnya.

3.

Hasil (Pay off)


Agar suatu peristiwa atau keadaan sebagai hasil suatu tindakan dapat dievaluasi,
maka hasil tindakan ini dinyatakan dalam bentuk nilai/hasil (payoffs). Dalam
dunia perusahaan hasil ini disebut keuntungan atau dapat dirumuskan sebagai
biaya. Meski ada berbagai bentuk lain berupa manfaat atau kepuasan (utility).

4.

Kriteria Pengambilan Keputusan


Pengambilan keputusan harus menentukan bagaimana memilih alternatif terbaik
dalam cara bertindak.
Suatu kriteria yang banyak dipergunakan dalam pengambilan keputusan adalah
mengambil alternatif yang dapat mendatangkan keuntungan terbesar.

H.

Pengambilan Keputusan Berdasar Nilai yang Diharapkan (EMW =


Expected Monetary Value)
Setiap keuntungan yang telah diperhitungkan berdasar berbagai alternatif

tindakan telah disusun dalam bentuk tabel hasil, selanjutnya perlu dipertimbangkan
tindakan mana yang akan dipilih.
Apabila kita tidak memiliki informasi, maka kita dapat menduga probabilitas

terjadinya peristiwa dengan:


1.

Informasi Masa Lampau


Informasi masa lampau yang dipergunakan adalah keberhasilan pemasaran
produk mainan anak-anak pada masa lampau.

Bab 1: Teori Probabilitas

Hal 13 dari 148

Handout Statistik 2

2.

Informasi yang dimiliki dikombinasikan dengan pandangan


yang subyektif.
Informasi pengalaman masa lampau dikombinasikan dengan pandangan
terhadap permintaan produk mainan anak-anak dalam tahun ini

3.

Bentuk Distribusi Probabilitas


Bentuk distribusi probabilitasnya dapat berbentuk distribusi normal, binomial
maupun bentuk poisson.

Keputusan yang baik adalah memaksimumkan nilai yang yang diharapkan


atau keuntungan yang maksimal atau meminimumkan kerugian.

I.

Pengambilan Keputusan Berdasar Kemungkinan Kerugian


Kemungkinan

kerugian

yang

dimaksud

adalah

perbedaan

antara

kemungkinan diperolehnya keuntungan yang maksimal dengan keuntungan aktual


berdasar pada tindakan yang telah diambil atau keputusan yang telah dipilih.

Kerugian tidak dinyatakan dengan tanda negatif, karena merupakan


perbedaan keuntungan pada tindakan yang terbaik dengan keuntungan yang
diperoleh pada tindakan yang dipilih.

J.

Pengambilan Keputusan Berdasar Nilai yang Diharapkan Dari


Informasi Terbaik

Cara pengambilan keputusan berdasar kemungkinan kerugian yang diharapkan


(expected opportunity loss) dari suatu tindakan yang dirumuskan:
EOL (Ai) = Lij Pj
Dimana,

Pj = probabilitas terjadinya peristiwa J


Lij = kemungkinan kerugian dari tindakan i untuk peristiwa J

Perhitungan harapan kemungkinan kerugian akan menambah informasi dalam


pengambilan keputusan.

Pengambilan keputusan berdasar nilai yang diharapkan dari informasi terbaik


merupakan selisih dari keuntungan yang diharapkan pada kondisi tertentu dikurangi
nilai uang yang diharapkan berdasar tindakan alternatif yang terbaik.

Bab 1: Teori Probabilitas

Hal 14 dari 148

Handout Statistik 2

2. DISTRIBUSI TEORITIS
A. Pengertian Distribusi Teoritis

Distribusi teoritis adalah distribusi yang frekuensinya diturunkan secara


matematis. Pada distribusi frekuensi, frekuensinya diperoleh berdasarkan hasil-hasil
percobaan atau hasil observasi.

Perbedaan antara distribusi frekuensi dan distribusi teoritis dapat dijelaskan


dengan contoh berikut:
Sebuah mata uang dilempar sebanyak 100 kali, menurut hasil observasi atau
percobaan akan diperoleh berbagai frekuensi sebagai berikut:

Sisi Gambar (H)

Jumlah Frekuensi
III
IV
59
41

0 (sisi Tulisan)

I
54

II
61

1 (sisi Gambar)

46

39

41

100

100

100

Jumlah
Percobaan

V
62

VI
49

59

38

51

100

100

100

Dari tabel di atas dapat dilihat, bahwa berdasar pada 6 percobaan pelemparan
sebuah mata uang sebanyak 100 kali diperoleh berbagai macam hasil atau frekuensi
yang berbeda satu dengan yang lainnya.
Namun bila kita mengambil kesimpulan dari berbagai percobaan ini akan sampai
pula pada suatu teori bahwa mata uang itu setimbang, artinya probabilitas sisi
gambar atau H dengan sisi tulisan atau T akan sama, yaitu 50% : 50%.
Dengan kata lain, dapat dikatakan bahwa distribusi teoritisnya karena secara teoritis
sisi gambar (H) dan sisi tulisan (T) dari sebuah mata uang logam mempunyai
probabilitas yang sama yaitu 1/2 sehingga hasil pelemparan mata uang sebanyak 100
kali akan menghasilkan tabel berikut:
Jumlah H
0
1

Probabilitas
1/2
1/2
Jumlah

Frekuensi Teoritis
1/2 x 100 = 50
1/2 x 100 = 50
100

Dari tabel di atas dapat dilihat bahwa frekuensi teoritis diperoleh dengan mengalikan
probabilitas dengan jumlah percobaan.
B. Kegunaan Mempelajari Distribusi Teoritis

Dengan mempelajari distribusi teoritisnya, kita dapat mengetahui pola dari


distribusi frekuensinya. Sebagai contoh:
1. Seorang pengusaha penerbit buka perlu mengetahui selera bacaan para
langganannya apakah selerah itu berupa cerita novel, fiksi atau sejarah.

Bab 2: Distribusi Teoritis

Hal 15 dari 148

Handout Statistik 2

Pola ini dapat diketahui dengan pengalaman-pengalaman masa yang lalu.


2. Pengusaha toko sepatu perlu mengetahui pola permintaan dari para konsumen,
bagaimana distribusi dari nomor-nomor sepatu yang diminta para konsumen
3. Pengusaha rumah makan perlu mengetahui pola selera makanan yang digemari
para langganannya
Dengan mengetahui pola permintaan yang didasarkan pada pengalaman di masa

lalu, pengusaha tersebut akan dapat menyesuaikan persediaan barang-barangnya.


Dengan kata lain apabila kita dapat mengetahui distribusi teoritisnya, maka kita
akan mengetahui pola distribusi frekuensinya.
C. Macam dari Distribusi Teoritis
Ada 3 macam dari distribusi teoritis yaitu:

1. Distribusi Binomial (percobaan Bernoulli)


2. Distribusi Poisson
3. Distribusi Normal
1. Distribusi Binomial (percobaan Bernoulli)
Distribusi binomial adalah distribusi probabilitas dari suatu variabel

random yang bersifat diskrit. Distribusi binomial banyak digunakan di dalam


bidang perusahaan, bidang pengetahuan, sosial dan bidang-bidang lain.
Distribusi binomial juga disebut sebagai percobaan atau proses dari

Bernoulli, James Bernoulli adalah ahli matematika Swiss (1654-1705) yang sangat
berjasa bagi perkembangan penggunaan distribusi binomial.
Model dari percobaan Bernoulli mengambil beberapa anggapan, yaitu:

a.

Dalam setiap percobaan selalu dibedakan 2 unsur yaitu


peristiwa yang bersifat saling meniadakan (mutually exclusive)
Suatu ruang sampel selalu akan mengandung 2 unsur yaitu peristiwa sukses dan
peristiwa gagal.

b.

Probabilitas peristiwa sukses yang dirumuskan dengan


p dari suatu percobaan yang satu ke percobaan yang lain bersifat tetap.
Probabilitas peristiwa gagal dirumuskan dengan q atau (1-p)

c.

Masing-masing percobaan merupakan peristiwa yang


bersifat independen, artinya peristiwa yang satu tidak mempengaruhi peristiwa
yang lain.

Bab 2: Distribusi Teoritis

Hal 16 dari 148

Handout Statistik 2

2. Distribusi Poisson
Distribusi Poisson ditemukan oleh seorang ahli matematika dari Perancis

bernama SD Poisson (1781-1840) yang dapat dipergunakan untuk menghitung


distribusi binomial apabila n sangat besar dan p kecil n besar apabila lebih dari 50
dan p kecil apabila kurang dari 0,10.
Distribusi ini merupakan limit dari distribusi binomial dan sangat luas

penggunaannya, misalnya di dalam industri untuk pengendalian mutu (quality


control), untuk memperkirakan banyaknya barang cacat, di dalam asuransi untuk
memperkirakan banyaknya kecelakaan, di dalam persoalan waktu menunggu
(waiting time) untuk menghitung banyaknya percakapan telpon atau datangnya
langganan atau di dalam pemasaran untuk memperkirakan jumlah pembaca iklan
yang membeli barang yang diiklankan.
Sifat-sifat dari suatu peristiwa yang menunjukkan distribusi probabilitas

dari Poisson guna menunjukkan suatu peristiwa yang merupakan suatu distribusi
Poisson dapat diambil contoh pada peristiwa datangnya kendaraan yang melewati
pintu gerbang pada jalan raya tol.
Dari peristiwa ini dapat diamati sebagai berikut:
1.

Rata-rata kedatangan kendaraan pada setiap jam dapat


dihitung berdasarkan pada data masa lampau

2.

Jika kita mengamati setiap periode dalam jarak setiap menit,


kita akan menjumpai sifat-sifat:

probabilitas kedatangan kendaraan untuk setiap menit sangat kecil dan


mempunyai nilai yang tetap (konstan)

probabilitas kedatangan 2 kendaraan atau lebih di dalam periode itu


(setiap menit) adalah sangat kecil dan dapat dikatakan mendekati 0 (nol)

peristiwa kedatangan kendaraan pada setiap menit merupakan peristiwa


yang independen

Apabila suatu peristiwa memenuhi persyaratan di atas, maka kita akan dapat
mengatakan bahwa peristiwa tersebut mempunyai sifat distribusi Poisson.
Distribusi Poisson adalah merupakan suatu distribusi dari variabel random yang
bersifat diskrit. Probabilitas dari peristiwa random yang bersifat diskrit dinyatakan
dengan x yang mempunyai nilai 0, 1, 2, dan seterusnya.
3. Distribusi Normal atau Kurva Normal

Distribusi normal adalah distribusi probabilitas yang bersifat kontinyu.


Karena distribusi normal merupakan distribusi probabilitas yang bersifat kontinyu
cukup penting, banyak para ahli matematika berusaha untuk mengembangkannya,
diantaranya adalah Karl Gauss, seorang ahli matematika dan astronomi pada abad

Bab 2: Distribusi Teoritis

Hal 17 dari 148

Handout Statistik 2

ke-18, sehingga diberi penghargaan kepadanya distribusi normal disebut juga


Distribusi Gauss.
Ada 2 pertimbangan pokok sehingga distribusi normal mempunyai

peranan penting dalam statistik, yaitu:


a.

Beberapa hal yang dimiliki distribusi normal memungkinkan


distribusi ini dapat dipergunakan untuk berbagai analisa dengan cara penarikan
kesimpulan berdasar sampel yang diambil

b.

Distribusi normal sangat mendekati untuk menggambarkan


frekuensi yang diperoleh dari hasil observasi pada berbagai bidang baik yang
bersifat human seperti tinggi, berat, tingkat kecerdasan, hasil dari kegiatan yagn
bersifat fisik seperti produksi maupun ukuran-ukuran lain yang penting guna
keperluan manajemen baik di bidang sosial maupun ilmu pengetahuan alam.
Distribusi normal atau kurva normal adalah suatu distribusi yang

simetris dan berbentuk lonceng/genta yang menunjukkan hubungan antara


ordinat pada mean dengan berbagai ordinat pada berbagai jarak sigma ( ) yang
diukur dari mean.

Sifat-sifat dari distribusi normal adalah sebagai berikut:

a.

bentuk dari distribusi normal menyerupai lonceng dengan


sebuah puncak (unimodal)

b.

nilai rata-rata (mean) pada distribusi normal akan terletak di


tengah-tengah dari kurva normal

c.

bentuk distribusi normal adalah simetris, oleh sebab itu nilai


mean = median = modus

d.

ujung masing-masing sisi kurva akan sejajar dengan sumbu


horisontal dan tidak akan memotong sumbu horisontal itu

e.

sebagian besar dari data ada di tengah dan sebagian kecil dari
data ada pada masing-masing sisi/tepi

Bab 2: Distribusi Teoritis

Hal 18 dari 148

Handout Statistik 2

68% dari data akan berada dalam jarak 1 standar deviasi, 95%

f.

dari data akan berada dalam jarak 2 standar deviasi dan 99% dari data berada
dalam jarak 3 standar deviasi.
Untuk mengetahui suatu distribusi apakah bersifat normal atau tidak

dapat dilakukan hal-hal sebagai berikut:


a.

kita gambarkan frekuensinya dalam bentuk kurva frekuensi dan


kita lihat apakah bentuk normal atau tidak

b.

kita bandingkan nilai mean, median dan modusnya apakah


ketiga nilai ini sama atau tidak, apabila sama maka distribusi itu berbentuk
normal
kita lihat apakah 68% dari data berada dalam jarak 1 standar

c.

deviasi (1 sigma), 95% dari data akan berada dalam jarak 2 standar deviasi (2
sigma) dan sebagainya
d.

kita gambarkan frekuensi kumulatifnya pada kertas logaritma


atau kertas probabilitas, apabila membentuk garis lurus maka distribusi itu
merupakan distribusi normal.

e.

Kita mengadakan test of goodness of fit.

Persamaan dari ordinat kurva normal dirumuskan sebagai berikut:

1
Y0
e
2

1 / 2 x 2

Y0 = ordinat pada mean atau ordinat maksimum

= deviasi standar
x

= nilai data

= 3,14159
e

= 2,71828

= rata-rata

Berdasarkan rumus di atas maka pada Y0 nilai x

= mean, sehingga e0 = 1.

Selanjutnya untuk menghitung ordinat yang maksimum masih harus dikalikan


dengan NCj, dimana N = jumlah frekuensi dan Cj = interval kelas.
Sehingga ordinat maksimum menjadi:

Y0 0,39894

Bab 2: Distribusi Teoritis

NC i

Hal 19 dari 148

Handout Statistik 2

Selanjutnya untuk masing-masing nilai ordinat dapat dihitung dengan mengalikan


hasil dari rumus di atas dengan tabel ordinatnya (lihat lampiran)

Contoh:
Dari distribusi frekuensi penghasilan 50 karyawan perusahaan tahun 2005 (dalam
ribuan rupiah) diperoleh data sebagai berikut:
Nilai rata-rata (mean)

= 65,1

N atau jumlah frekuensi

= 50

Ci

= 10

Deviasi standar ()

= 16,78

Y0

= 11,9

= 0, 39894 x 500/16,78

Untuk nilai ordinat yang lain dapat dihitung berdasarkan nilai tabel ordinat dengan
dikalikan ordinat maksimum (11,9).

Besarnya nilai rata-rata dan deviasi standar tidak akan mempengaruhi

distribusi probabilitas yang berbentuk normal, karena seluruh jumlah daerah kurva
normal = 1, maka daerah kurva normal dapat menunjukkan probabilitas.
Secara matematis dapat dikatakan bahwa:
68% dari seluruh nilai data terletak dalam jarak 1 deviasi

a.

standar yang diukur dari mean


95% dari seluruh nilai data terletak dalam jarak 2 deviasi

b.

standar yang diukur dari mean


Bab 2: Distribusi Teoritis

Hal 20 dari 148

Handout Statistik 2

99,7% dari seluruh nilai data terletak dalam jarak 3 deviasi

c.

standar yang diukur dari mean

Dapat ditunjukkan dengan gambar berikut:

Bentuk suatu kurva akan ditentukan oleh mean dan deviasi standarnya.
Oleh sebab itu, akan dijumpai berbagai macam tipe bentuk kurva. Menyusun suatu
tabel kurva akan menjadi sulit, karena nilai mean dan standar deviasi yang berbedabeda, sehingga untuk menyusun tabel kurva normal perlu adanya anggapananggapan bahwa untuk mean = 0 dan deviasi standar = 1.
Kurva normal standar dapat dilihat sebagai berikut:

Bab 2: Distribusi Teoritis

Hal 21 dari 148

Handout Statistik 2

Segala bentuk kurva dengan mean dan deviasi yang berbeda selalu dapat

dikonversikan ke dalam bentuk kurva standar dengan mengubah skala x menjadi z


dengan rumus:
z

= jarak deviasi x terhadap nilai rata-rata

= variabel x

= mean

= deviasi standar

Contoh: Suatu distribusi normal dengan rata-rata = 50 dan deviasi standar = 25. Hal
ini dapat digambarkan sebagai berikut:

Bab 2: Distribusi Teoritis

Hal 22 dari 148

Handout Statistik 2

Berdasarkan gambar di atas, maka konversi skala x menjadi skala z adalah sebagai
berikut:
a.

x = 25
z

25 50 25

1
25
25

b.

x=0
z

0 50 50

2
25
25

c.

x = 75
z

75 50 25

1
25
25

Disebelah kiri nilai rata-rata, nilai z adalah negatif, sedangkan untuk nilai z yang
terletak di sebelah kanan nilai rata-rata z adalah positif.
Karena bentuk kurva normal adalah simetris, maka tabel untuk nilai z

yang negatif sama dengan z yang positif. Tabel z = -1 sama dengan tabel z= +1 (lihat
lampiran).
Selanjutnya penggunaan daerah kurva normal dapat dijelaskan berbagai

kasus berikut:
a.

Menghitung daerah kurva normal antara z =


0 dan z = +1,25
Menurut tabel daerah kurva normal z = +1,25 adalah 0,3944. Apabila seluruh
daerah kurva normal dinyatakan 100% maka luas daerah kurva normal antara z
= 0 dan z = +1,25 adalah seluas = 39,44%.

b.

Menghitung

luas

daerah

kurva

normal

antara z = 0 dan z = -1,25.

Bab 2: Distribusi Teoritis

Hal 23 dari 148

Handout Statistik 2

Sebagaimana telah dijelaskan bahwa kurva normal simetris bentuknya, maka


tabel z = 1,25 berlaku untuk nilai z positif dan negatif, sehingga z = -1,25 tabel z =
0,3944. Luas daerah kurva normal antara z = 0 dan z = -1,25 seluas 39,44%

c.

Menghitung

luas

daerah

kurva

normal

sebelah kanan z = +0,35


Menurut tabel daerah kurva normal z = +0,35 adalah 0,1368. Nilai ini
merupakan luas daerah kurva normal di sebalah kiri z = 0,35 sampai z = 0. Jadi
luas daerah kurva normal sebelah kanan z = 0,50 0,1368 = 0,3632 atay 36,32%.

d.

Menghitung luas daerah kurva normal sebelah kiri


z = +0,35
Menurut tabel daerah normal z = 0,35 adalah 0,1368. Luas daerah kurva normal
di sebelah kiri z=0,35 adalah 0,50 + 0,1368 = 0,6368 atau 63,68%.

Bab 2: Distribusi Teoritis

Hal 24 dari 148

Handout Statistik 2

e.

Menghitung luas daerah kurva normal sebelah


kanan z = -1,45.
Tabel daerah kurva normal untuk z = -1,45 adalah 0,4265.
Luas daerah kurva normal di sebelah kanan z = -1,45 menjadi 0,50 + 0,4265 =
0,9265 atau 92,65%.

f.

Menghitung

luas

daerah

kurva

normal

antara z = 0,73 dan z = 1,64 (antara 2 nilai z yang positif).


Tabel daerah kurva normal untuk:
z = 1,64 adalah 0,4495
z = 0,73 adalah 0,2673
Selisihnya adalah 0,1822 atau 18,22% merupakan luas daerah kurva normal
antara z = 0,73 dan z = 1,64

g.

Menghitung

luas

daerah

kurva

normal

antara z = -0,50 dan z = +0,75 (antara z yang negatif dan z yang


positif)
Tabel daerah normal untuk:
z = -0,50 adalah 0,1915
z = +0,75 adalah 0,2734
Dijumlahkan merupakan luas daerah kurva normal antara z = -0,50 dan z =
+0,75 yakni 0,1915 + 0,2734 = 0,4649 atau 46,49%.

Bab 2: Distribusi Teoritis

Hal 25 dari 148

Handout Statistik 2

h.

Menghitung nilai daerah di sebelah kanan nilai z


diketahui = 10%.
Daerah di sebelah kiri z = 0,50 0,10 = 0,40. Tabel z untuk nilai 0,4000 tidak
ada, dan nilai yang mendekati adalah 0,3997 untuk z=1,28. Jadi nilai z yang
dicari adalah z = 1,28

i.

Menghitung luas daerah kurva normal antara x 1 =


17,4 dan x2 = 58,8 apabila diketahui mean = 24 dan deviasi standar = 12
Sebelum kita menghitung luas daerah kurva normal, kita harus mengkonversikan
skala x menjadi skala z.
z1

17,4 24
0,55
12

z2

58,8 24
2,90
12

Tabel daerah kurva normal untuk:


z1 = -0,55 adalah 0,2088
z2 = +2,90 adalah 0,4981
Dijumlahkan menjadi 0,7069 atau 70,69%.

Bab 2: Distribusi Teoritis

Hal 26 dari 148

Handout Statistik 2

Contoh soal:

a.

Perusahaan minuman teh botol setiap hari mengirim hasil


produksinya dengan kereta api ke luar kota. Rata-rata berat botol yang dikirim
adlaah 0,397 kg dan deviasi standar adalah 0,005kg. Apabila distribusi ukuran
berat ini merupakan distribusi normal, berapa persen teh botol yang dikirim
dengan kereta api akan mempunyai berat 0,400 kg ke atas?
Pertanyaan dalam soal ini dapat dijawab dengan menghitung luas daerah kurva
normal di sebelah kanan x = 0,400 kg.
Konversi skala x menjadi skala z adalah:
z

0,400 0,397
0,60
0,005

Tabel daerah kurva normal untuk z = 0,60 adalah 0,2257. Sehingga luasnya
menjadi 0,500 0,2257 = 0,2743 atau 27,43%.

b.

Keuntungan yang diperoleh oleh pedagang kaki lima yang menjual


makanan di malam hari rata-rata 68% dengan deviasi standar 8,2%. Apabila data
keuntungan ini merupakan distribusi normal, di bawah berapa persen
keuntungan yang diperoleh 10% dari pedagang kaki lima yang memperoleh
keuntungan terendah?
Di dalam soal ini diketahui bahwa 10% memperoleh keuntungan yang terendah.
Jadi luas daerah kurva normal di sebelah kanan nilai z =0,5000 0,1000 =
0,4000.

Bab 2: Distribusi Teoritis

Hal 27 dari 148

Handout Statistik 2

Dari tabel z daerah kurva normal yang mendekati nilai ini adalah 0,3997 untuk z
= 1,28
1,28

x 68%
8,2%

x 68% 10,5% 57,5%

Jadi keuntungan yang diperoleh 10% pedagang kaki lima yang terendah ada di
bawah 57,5%.

Bab 2: Distribusi Teoritis

Hal 28 dari 148

Handout Statistik 2

3. METODE SAMPLING

Dalam kehidupan sehari-hari sampel mempunyai peranan yang penting, hampir


semua pengetahuan, sikap dan tindakan seseorang selalu berdasarkan kepada
sampel. Seorang yang mengadakan perjalanan ataupun kunjungan ke suatu tempat
selama 1 minggu akan dapat bercerita banyak tentang daerah yang dikunjunginya
baik mengenai penduduknya, produksi daerah itu, kebudayaannya, hanya
berdasarkan pada apa yang dilihat selama 1 minggu. Seseorang yang akan membeli 1
kg mangga, akan mencoba untuk mengetahui manis tidaknya mangga yang akan
dibeli dengan mengambil sampel untuk dicicipinya.

Karena keterbatasan yang dimiliki menyebabkan peranan sampel menjadi sangat


penting. Yang menjadi permasalahan adalah bagaimana cara memilih sampel yang
baik.

A. Populasi dan Sampel (N dan n)

Populasi atau universe diberi definisi sebagai keseluruhan dari obyek yang
akan diteliti. Populasi di sini bukan dalam arti penduduk, karena obyek penelitian
dapat bermacam-macam misalkan, upah, produksi dan sebagainya.

Sedangkan sampel diberi definisi sebagai bagian dari populasi. Misalkan:


sebagian dari produksi bola lampu, sebagian dari produksi ban dan sebagainya.

B. Alasan-alasan Digunakannya Sampel


1.

Di dalam hal kita menghadapi obyek yang mudah rusak, seperti bola
lampu, ban kendaraan dan sebagainya, maka penelitian terhadap seluruh obyek
tidak mungkin dilakukan.

2.

Di dalam penelitian apabila kita menghadapi suatu obyek penelitian


yang bersifat homogen atau 100% sama maka kita tidak perlu mengadakan
penelitian terhadap seluruh obyek atau populasi, melainkan cukup dilakukan
terhadap sampel. Obyek yang bersifat homogen, misalkan: kadar garam pada air
laut.

3.

Penggunaan metode sampel dapat menghemat biaya. Penelitian


terhadap seluruh obyek yang dikenal dengan metode sensus memerlukan biaya yang
sangat besar baik berupa biaya persiapan, biaya pengumpulan data, biaya
pengolahan data dan sebagainya.

4.

Penelitian

yang

menggunakan

metode

sampel

dapat

cepat

diselesaikan. Dengan metode sampel kita hanya mengadakan penelitian terhadap


sebagian obyek, maka pengumpulan data, pengolahan data akan dapat menghemat
waktu.
5.

Penggunaan metode sampel akan dapat memperluas lingkup


informasi yang diperolehnya. Pada metode sensus kita tidak akan dapat memperoleh
informasi secara rinci. Sedang pada metode sampel dapat karena dimungkinkannya

Bab 3: Metode Sampling

Hal 28 dari 148

Handout Statistik 2

penggunaan personal yang ahli dan peralatan canggih maka hasil sampel dapat
diharapkan lebih terinci sehingga kita akan memperoleh pengetahuan yang lengkap
tentang sesuatu yang kita teliti.
6.

Penggunaan metode sampel memungkinkan dipergunakannya


persoal ahli dan terlatih sehingga hasil sampel diharapkan akan lebih tinggi
ketepatan hasilnya.

7.

Dengan berkembangnya teknik metode pengambilan sampel dan


perhitungan sampel maka hasil-hasil sampel dapat menggambarkan hasil
populasinya.

C. Pengertian Statistik dan Parameter

Secara matematis kita dapat mengukur suatu sampel dan populasi seperti,
mean, median, modus dan sebagainya.

Meskipun ukuran-ukuran ini mempunyai makna yang sama, namun di dalam


statistik dibedakan dengan penggunaan simbol-simbol yang berbeda.

Ukuran-ukuran sampel disebut dengan istilah statistik, sedang ukuranukuran untuk populasi disebut parameter.

Contoh:
Rata-rata usia mahasiswa di suatu perguruan tinggi adalah 22 tahun merupakan
parameter. Sedang apabila kita mengatakan rata-rata usia 5 orang mahasiswa suatu
perguruan tinggi 22 tahun maka rata-rata ini disebut statistik.

Perbedaan statistik dan parameter dapat dilihat pada tabel berikut:


Sampel
Statistik

1. Mean = x
2. Deviasi standar = s
3. Proporsi = x/n
4. Jumlah data = n
5. Koefisien korelasi = r

Populasi
Parameter
1. Mean =
2. Deviasi standar =
3. Proporsi = P
4. Jumlah data = N
5. Koefisien korelasi = R

D. Tahap-Tahap Dasar Dalam Penggunaan Metode Sampel

Penggunaan

metode

sampel

dalam

suatu

penelitian

kadang-kadang

menimbulkan masalah yang kompleks, karena berkaitan dengan

sifat dari

populasinya.

Suatu contoh betapa sulitnya memilih sampel dari suatu penduduk yang
bertempat tinggal terpencil dan sulit komunikasinya. Oleh karena adanya masalahmasalah yang komplek ini, maka perlu adanya suatu perencanaan baik dalam
persiapan maupun dalam pelaksanaannya secara terinci.

Bab 3: Metode Sampling

Hal 29 dari 148

Handout Statistik 2

Tahap-tahap dalam penelitian yang menggunakan metode sampel adalah

sebagai berikut:
1.

Menentukan Tujuan Penelitian


Suatu tujuan penelitian perlu dirumuskan dengan jelas, karena tujuan ini sangat
erat hubungannya dengan data yang perlu dikumpulkan sehingga masalahmasalah yang komplek dapat disederhanakan

2.

Perumusan Masalah
Sebagaimana telah dijelaskan bahwa populasi merupakan keseluruhan obyek
yang diteliti. Masalah populasi tidak timbul apabila keseluruhan obyek tersebut
telah tegas dirumuskan, misalkan bola lampu yang akan diteliti daya tahan ratarata yang dimiliki. Sebaliknya apabila obyek penelitian itu tidak tegas
dirumuskan, maka masalah populasi ini akan timbul.
Contoh:
Populasi pengusaha, pengertian pengusaha perlu dirumuskan dengan jelas,
misalkan pengusaha golongan ekonomi lemah.
Perumusan populasi yang tegas sangat diperlukan karena populasi yang akan
dipilih sebagian sebagai sampel ini harus sesuai dengan informasi yang kita cari.
Di samping itu penegasan terhadap populasi ini juga diperlukan apabila kita
ingin membandingkan dengan populasi yang lain, sehingga kesimpulan yang kita
kehendaki dapat sesuai dengan tujuan penelitian yang telah dirumuskan.

3.

Menentukan Jenis Data Yang Akan Dikumpulkan


Jenis data yang akan dikumpulkan perlu ditegaskan agar jangan sampai terjadi
pengumpulan data yang kurang relevan. Di lain pihak, data yang penting justru
tidak lengkap.

4.

Penentuan Metode Pengukuran


Apabila jenis data yang akan dikumpulkan telah ditegaskan, maka perlu
penentuan metode pengukuran yang akan dipergunakan
Contoh:
Data tentang kekayaan seseorang dapat diperoleh dari jawaban responden atau
catatan penghasilan. Kedua jenis data ini berbeda, sehingga perlu ditegaskan
data mana yang akan dipergunakan.

5.

Pemilihan Unit Sampling


Sebelum kita memilih sampel suatu populasi kita perlu membagi lebih dahulu
unsur-unsur populasi yang disebut unit sampling atay unit. Unit sampling ini

Bab 3: Metode Sampling

Hal 30 dari 148

Handout Statistik 2

perlu ditegaskan dan jangan sampai tumpang tindih karena unsur populasi tidak
boleh dipilih sebagai sampel sampai 2 atau 3 kali.
Contoh:
Populasi bola lampu. Unit sampling di sini adalah bola lampu (tegas
dirumuskan), sehingga tidak ada kemungkinan unit sampling terpilih lebih dari
sekali sebagai sampel.
Penelitian terhadap pedagang kaki lima, unit samplingnya adalah seorang
pedagang kaki lima.
6.

Pemilihan Sampel
Dewasa ini kita memiliki bermacam-macam metode pengambilan sampel. Suatu
hal yang penting adalah menentukan besarnya sampel yang selalu dikaitkan
dengan biaya penelitian

7.

Mengorganisir Petugas Lapang atau Pencacah


Suatu penelitian sangat memerlukan dukungan administrasi yang memadai,
antara lain petugas lapangan atau pengumpul data perlu disiapkan dengan baik.
Pengumpul data perlu dilatih lebih dahulu, sehingga tujuan pengumpulan data
akan tercapai, misalnya pemahaman terhadap pertanyaan-pertanyaan yang akan
ditanyakan terhadap responden, cara pencacahan, cara pengecekan dan
sebagainya.

8.

Penyusunan dan Analisa Data


Di dalam penyusunan data langkah pertama adalah mengedit daftar pertanyaan
untuk mencari kesalahan-kesalahan. Setelah diedit selanjutnya disusun dan
dianalisa.

Informasi-informasi

yang

lengkap

tentang

populasi

memberi

keuntungan terhadap sampel yang akan dipergunakan untuk pendugaan


terhadap populasi. Di samping itu informasi yang lengkap dapat pula
dipergunakan untuk kebutuhan penelitian di masa mendatang.
E. Peranan Teori Sampel

Tujuan dari teori sampling adalah membuat metode sampling menjadi lebih
efisien. Teori sampling mengembangkan cara pemilihan sampel serta perhitungan
sampel sebagai dasar pendugaan terhadap populasi yang setepat mungkin dengan
biaya yang serendah-rendahnya.

Agar suatu prosedur pengambilan sampel dan perhitungan sampel dapat tepat,
maka diperlukan pengetahuan terhadap populasinya. Suatu cara yang ditempuh
untuk penyederhanaan adalah kita selalu menganggap bahwa sampel itu mempunyai
distribusi yang normal.

Bab 3: Metode Sampling

Hal 31 dari 148

Handout Statistik 2

Teori sampling dahulu berkembang atas dasar populasi yang tidak terbatas,

selanjutnya berkembang pada pengertian populasi yagn terbatas. Secara umum di


dalam teori sampling dikatakan bahwa semakin besar sampel yang diambil maka
semakin banyak informasi yang diperoleh.
Masalah populasi yang tidak terbatas dan yang terbatas selanjutnya menjadi

tidak penting karena pengertian sampel merupakan bagian yang kecil dari suatu
populasi.
F. Metode Sampling
Pada dasarnya ada 2 macam metode guna pemilihan/pengambilan sampel,

yakni:
1.

Random atau Probabilitas sampel


Pada random atau probabilitas sampel ini semua unsur populasi mempunyai
kesempatan yang sama untuk dipilih sebagai sampel

2.

Non-Random atau Judgement Sampel


Pada judgement sampel pendapat dan pengetahuan seseorang akan menjadi
dasar dalam pemilihan unsur populasi untuk dipilih sebagai sampel.
Unsur subyektifitas sangat berperan di dalam memilih sampel
Metode random atau probabilitas sampel memungkinkan setiap unsur populasi

memiliki kesempatan atau kans (chance) yang sama untuk dipilih sebagai sampel,
sehingga dapat diharapkan hasil sampel ini obyektif.
Ada 5 macam metode random atau probabilitas sampel yaitu:

1. Simple Random Sample


2. Stratified Sampling
3. Cluster Sampling
4. Systematic Sampling
5. Multistage Sampling
1.

Simply Random Sample

Suatu sampel dikatakan random apabila setiap unsur dari populasi


mempunyai kesempatan yang sama untuk dipilih sebagai sampel.

Contoh: suatu populasi yang terbatas terdiri dari 4 orang karyawan


(N=4). Dari 4 orang karyawan ini akan dipilih sampel 2 orang (n=2) guna
keperluan wawancara. Berdasarkan pada rumus kombinasi, maka akan diperoleh
kemungkinan sebanyak:
4

4!
4 3 2 1

6
2! 4 2 ! 2 1 2 1

Bab 3: Metode Sampling

Hal 32 dari 148

Handout Statistik 2

Tabel berikut menunjukkan keenam kemungkinan tersebut:

Populasi (N)
A
B
C
D

Kemungkinan Sampel (n)


AB
AC
AD
BC
BD
CD

Probabilitas (P)
Probabilitas marginal merupakan
perjumlahan dari joint
probabilitas yang mengandung
peristiwa tersebut
P(A) = P(AB) + P(AC) + P(AD)
= 1/6 + 1/6 + 1/6 = 3/6
= 1/2

Tabel di atas menunjukkan pengambilan sampel dari populasi yang

terbatas. Populasi yang tidak terbatas adalah populasi yang unsur-unsurnya


secara teoritis tidak mungkin diteliti dalam jangka waktu tertentu.
Proses pengambilan sampel yang random adalah sebagai berikut:

a.

Metode Undian
Dalam contoh dimuka karyawan sebanyak 4 (N=4). Apabila kita ingin
mengambil sampel sebesar 2 (n=2) maka proses pemilihannya mudah
dilakukan dengan cara mengundi, yaitu masing-masing unsur populasi diberi
nomor 1 sampai 4, selanjutnya diundi untuk dipilih 2 sebagai sampel. Hasil
undian ini merupakan sampel yang terpilih.
Metode ini mudah dilakukan pada populasi yang jumlahnya sedikit. Apabila
unsur populasinya banyak atau besar, maka cara undian ini menjadi tidak
praktis.
Sehingga ditempuh dengan cara kedua, yaitu dengan menggunakan tabel
random.

b.

Metode dengan Tabel Random


Tabel berikut merupakan sebagian dari tabel random yang terdiri dari 10
angka. Angka-angka yang tidak teratur ini mengandung unsur angka dari 0
sampai 9.

Bab 3: Metode Sampling

Hal 33 dari 148

Handout Statistik 2

Cara menggunakan tabel di atas adalah sebagai berikut. Misalkan dari


populasi sebanyak 100 orang karyawan suatu perusahaan akan dipilih
sebanyak 10 orang sebagai sampel. Proses pengambilan random sampel
dengan tabel random dilakukan sebagai berikut:
-

unsur-unsur populasi mula-mula diberi nomor dari nomor 1 sampai


dengan nomor 100

Penggunaan tabel random dengan 2 angka sebelah kiri


Apabila kita mulai angka pertama, maka yang akan terpilih sebagai
sampel 1 adalah unsur populasi nomor 15.
Sampel 1

unsur populasi nomor 15

Sampel 2

unsur populasi nomor 09

Sampel 3

unsur populasi nomor 41

Sampel 4

unsur populasi nomor 74

Sampel 5

unsur populasi nomor 72 (nomor 00 dilewati)

Sampel 6

unsur populasi nomor 67

Sampel 7

unsur populasi nomor 55

Sampel 8

unsur populasi nomor 71

Sampel 9

unsur populasi nomor 35

Sampel 10

unsur populasi nomor 96 (nomor 41 dilewati karena telah


terpilih sebagai sampel nomor 3, masing-masing unsur
populasi hanya sekali dipilih sebagai sampel)

Bab 3: Metode Sampling

Hal 34 dari 148

Handout Statistik 2

Apabila sampel belum terpenuhi, sedang tabel telah habis sampai di


bawah dapat dilanjutkan dendan kolom berikutnya pada baris pertama.

2.

Stratified Sampling
Apabila unsur-unsur populasi tidak homogen atau heterogen,

maka proses pengambilan sampel dengan menggunakan random sampel akan


menimbulkan bias, karena masing-masing unsur populasi ini tidak mempunyai
kesempatan/kans atau probabilitas yang sama.
Guna mengurangi pengaruh faktor heterogen ini dapat

dilakukan pembagian unsur-unsur populasi dalam kelompok-kelompok kecil


(subkelompok) yang disebut strata.
Selanjutnya dari masing-masing strata ini dipilih sampelnya

secara random sesuatu dengan proporsinya. Oleh sebab itu, stratified sampling
disebut stratified random sampling.
Contoh: Suatu populasi terdiri dari 1000 orang pedagang kaki

lima dengan komposisi menurut jenis barang yang dijual:


Jenis Usaha
Strata I Makanan
II Minuman
III Kerajinan
IV Rokok

Jumlah pedagang
200
100
400
300

Apabila kita akan mengambil sampel sebanyak 20 pedagang, maka masingmasing strata akan diambil sampelnya secara proporsional:
Strata I = 200/1000 x 20

= 4 pedagang

Strata II = 100/1000 x 20

= 2 pedagang

Strata III= 400/1000 x 20

= 8 pedagang

Strata IV = 300/1000 x 20

= 6 pedagang

Jumlah seluruh sampel = 20 pedagang kaki lima


Selanjutnya proses pemilihan sampel pada masing-masing

strata dilakukan secara random.


3.

Cluster Sampling
Pada cluster sampling unsur-unsur populasi dibagi dalam

subkelompok yang disebut cluster (kelompok)


Pembagian unsur-unsur populasi ke dalam cluster ini dapat

dilakukan dengan menggunakan dasar wilayah administrasi pemerintahan,


batas-batas alam seperti sungai, gunung maupun jalan.

Bab 3: Metode Sampling

Hal 35 dari 148

Handout Statistik 2

Selanjutnya setelah kita membagi unsur-unsur populasi ke

dalam cluster, maka dari beberapa cluster ini dipilih salah satu cluster dengan
random. Dari cluster yang terpilih ini baru dipilih sampelnya secara random
pula.
Perbedaan dengan stratified sampling adalah terletak pada

pengambilan sampelnya. Pada stratified sampling, sampel dipilih dari seluruh


strata, sedang pada cluster sampling, sampel hanya dipilih dari salah satu cluster
saja. Karena masing-masing cluster ini mempunyai sifat homogen, sehingga
tidak perlu seluruh cluster diambil sampelnya.
4.

Systematic Sampling

Pada systematic sampling, unsur-unsur populasi dipilih dengan jarak interval


yang sama. Sebelum kita memilih sampel secara sistematis kita memilih titik
awal secara random, selanjutnya dipilih sampelnya pada setiap jarak interval
tertentu, misalkan setiap jarak kesepuluh.

Apabila titik awalnya nomor 6, selanjutnya adalah nomor 16, 26, 36 dan
seterusnya.

Perbedaan antara systematic sampling dengan simple random sampling


adalah bahwa pada systematic sampling, unsur-unsur populasi itu tidak
mempunyai kesempatan yang sama setelah ditentukan jarak interval dan titik
awal untuk memilih sampel.

Keuntungan dari systematic sampling adalah proses pemilihan sampel dapat


lebih cepat dilakukan, sedang di lain pihak dapat pula menghemat biaya.

5.

Multistage Sampling

Biasanya sampel dipilih dengan cara satu kali, sebelum proses pengumpulan
data dilakukan. Cara ini mempunyai kelemahan apabila sampel tersebut
ditentukan terlampau kecil. Oleh karena itu apabila kita akan menggunakan
sampel yang kecil, maka sebaiknya sampel tersebut dipilih secara bertahap
sampai pada keadaan di mana dipandang telah cukup untuk mengambil suatu
kesimpulan. Proses demikian disebut Multistage Sampling.

Contoh: suatu perusahaan minuman dalam kaleng ingin mengadakan


pengendalian terhadap proses produksinya dengan menetapkan persyaratan
jumlah minimal produk yang rusak. Apabila ternyata proses produksi mengalami
jumlah kerusakan produk yang melebihi batas toleransi, maka proses produksi
itu perlu diperbaiki.

Bab 3: Metode Sampling

Hal 36 dari 148

Hasil
YANG

MEMERL
UKAN
DANA

Handout Statistik 2

Tabel berikut menunjukkan proses pengambilan sampel secara bertingkat:


Sampel
I
II
III
IV
V
VI
VII

Besarnya
Sampel

Besar Sampel

20
20
20
20
20
20
20

20
40
60
80
100
120
140

Kombinasi Sampel
Jumlah Yang

Jumlah yang

Diterima
1
2
3
4
5
6

ditolak
3
4
5
6
7
8
8

Sampel I sebesar 20 unit kita perbaiki proses produksi jika jumlah produk yang
rusak 3 unit atau lebih dan kita teruskan jika jumlah yang rusak kurang dari 3.
Sampel II kalau diperlukan dengan 20 unit sebagai sampel dengan syarat proses
produksi diteruskan kalau produk yang rusak 1 unit dan diperbaiki kalau unit
produk yang rusak 4 atau lebih, proses ini diteruskan kalau masih dipandang
belum cukup.
Proses ini dipandang cukup apabila jumlah yang diterima dan ditolak sama.

Bab 3: Metode Sampling

Hal 37 dari 148

Handout Statistik 2

4. PENDUGAAN SECARA STATISTIK


Banyak alasan mengapa kita mengadakan pendugaan terhadap ukuran populasi

atas dasar ukuran sampel, antara lain dilihat dari sudut pertimbangan biaya, serta
keterbatasan waktu untuk mengadakan perhitungan terhadap seluruh populasi.
Beberapa contoh sebagai berikut:

a. Seorang manajer produksi ingin mengetahui apakah proses produksi yang baru
memang lebih baik daripada proses produksi yang lama dengan cara
mengadakan pengamatan terhadap sampel hasil produksi
b. Seorang manajer pemasaran ingin mengetahui kemampuan masyarakat untuk
membeli barang yang ditawarkan dengan mengadakan pengamatan terhadap
tingkat penghasilan masyarakat secara sampel
Kebutuhan akan informasi-informasi di atas tidak mudah dipenuhi tanpa

digunakannya metode sampel yang selanjutnya dapat dipergunakan untuk


mengadakan pendugaan terhadap parameter. Sehingga diperlukan pendugaan secara
statistik.
A. Macam Metode Pendugaan Secara Statistik
Metode pendugaan secara statistik pada hakekatnya dapat dibedakan menjadi 2

macam, yaitu:
1.

Pendugaan atas dasar nilai tunggal atau point estimation

2.

Pendugaan interval atau interval estimation

1.

Pendugaan Tunggal atau Pendugaan atas nilai tunggal

Adalah pendugaan nilai populasi atas dasar satu nilai dari sampel.

Contoh:
Rata-rata sampel ( x ) = Rp. 100.000 maka kita akan menduga nilai rata-rata
populasi () = Rp. 100.000.
Proporsi sampel (x/n) = 0,60 maka proporsi populasi (P) akan kita duga sebesar
0,60 pula
Cara pendugaan atas dasar satu nilai ini sangat sederhana, namun nilai

penduga yang demikian sukar sekali dapat identik dengan parameter yang kita
duga.

Apabila nilai penduga dapat identik dengan parameternya, hal ini


kemungkinan besar disebabkan oleh faktor kebetulan saja.

Cara

pendugaan

yang

didasarkan

pada

satu

nilai

ini,

tidak

memungkinkan kita untuk mengukur derajat kepercayaan kita terhadap


ketelitian pendugaan yang telah kita lakukan.

Bab 4: Pendugaan Secara Statistik

Hal 38 dari 148

Handout Statistik 2

2.

Pendugaan interval

Adalah suatu pendugaan terhadap parameter berdasarkan suatu interval, di


dalam interval mana kita harapkan dengan keyakinan tertentu parameter itu
akan terletak.

Hasil dari pendugaan interval ini diharapkan akan lebih obyektif. Pendugaan
interval akan memberikan kita nilai parameter dalam suatu interval dan bukan
nilai tunggal.

Pendugaan interval ini akan merupakan interval keyakinan atau interval


kepercayaan atau confidence limit/interval dan dapat dirumuskan secara umum
sebagai berikut:
st z /2 . st < parameter < st + z /2 . st
dimana:
st

= pendugaan atau statistik sampel

st

= deviasi standar untuk sampel

z. /2 = koefisien yang sesuai dengan interval keyakinan yang dipergunakan


dalam pendugaan interval dan nilainya diberikan dalam Tabel Luas
daerah Kurva Normal (Lampiran)

Misalkan dalam pendugaan interval, kita pergunakan interval keyakinan sebesar


95%. Hal tersebut berarti bahwa dalam jangka panjang, jika pendugaan itu
dilakukan berulang-ulang dengan cara yang sama, maka parameter populasi
akan tercakup di dalam interval yang bersangkutan 95% dari keseluruhan watu
atau dalam jangka waktu panjang kita akan mentolerir kesalahan duga (error of
estimate) sebesar 5%. Hal demikian dapat digambarkan sebagai berikut:

Dari gambar di atas jelas bahwa interval keyakinan (confondence interval)


dibatasi oleh batas keyakinan bawah (lower confidence level) dan batas
keyakinan atas (upper confidence level).

Dengan interval keyakinan 95%, maka masing-masing batas keyakinan atas


maupun bawah adalah 2,5%. Koefisien z dapat dicari pada tabel luas daerah

Bab 4: Pendugaan Secara Statistik

Hal 39 dari 148

Handout Statistik 2

kurva normal untuk luas daerah kurva (0,5000 0,0250 = 0, 4750) nilai z =
1,96; maka parameter akan terletak antara x -1,96 x dan x +1,96 x
B. Ciri-Ciri Suatu Penduga Yang Baik
Beberapa kriteria yang lazim digunakan untuk menetapkan suatu penduga yang

baik adalah:
1.

Tidak bias (unbiasedness)

2.

Konsistensi (consistency)

3.

Efisiensi (efficiency)

4.

Sufisiensi (sufficiency)

1.

Tidak Bias
Suatu penduga dikatakan tidak bias, apabila penduga tersebut secara

tepat dapat menduga nilai parameternya.


Contoh, apabila penduga dinyatakan dengan sedang parameter yang

akan diduga 0, maka penduga itu dikatakan tidak bias apabila:


E() = 0
Artinya nilai yang diharapkan sebagai penduga sama dengan nilai yang
diduganya. Apabila nilai penduga tidak sama dengan parameter yang diduga,
maka terjadilah bias.
Contoh: rata-rata sampel ( x ) = 20, sedangkan rata-rata populasi yang

diduga ternyata nilainya = 20, maka dikatakan bahwa rata-rata sampel


merupakan penduga yang baik atau tidak bias terhadap rata-rata populasi.
E ( x ) = = 20
Apabila rata-rata populasi ternyata nilainya 18, maka rata-rata sampel
menunjukkan bias yang positif (positively biased)
E(x )>
Sedangkan apabila rata-rata sampel nilainya lebih kecil daripada rata-rata
populasi yang diduga, maka dikatakan rata-rata sampel mempunyai bias yang
negatif (negatively biased).
E(x )<
Atau dalam gambar dapat dilihat:
1.

Bab 4: Pendugaan Secara Statistik

penduga yang tidak bias

Hal 40 dari 148

Handout Statistik 2

2.

2.

Penduga yang Bias Positif

3.

Penduga yang Bias Negatif

Konsistensi
a.

Suatu

penduga

dikatakan

konsisten, apabila besarnya sampel semakin bertambah mendekati tidak


terhingga, maka penduga tersebut akan semakin terkonsentrasi secara sempurna
pada parameter yang diduga.
b.

Keadaan di atas dapat dilihat


pada gambar berikut:

Bab 4: Pendugaan Secara Statistik

Hal 41 dari 148

Handout Statistik 2

c.

Jika

sampel

semakin

besar

seperti tercantum di gambar di atas, nampak semakin besar pula konsentrasi


pada parameternya.
d.

Dengan kata lain, semakin besar


sampelnya apabila penduga itu konsisten, maka biasnya atau variansnya semakin
mendekati .

e.

Rata-rata

sampel

(x )

merupakan penduga yang konsisten terhadap (parameter) karena variansnya


x = /n 0 jika sampelnya (n)
f.

Suatu penduga yang konsisten


belum tentu merupakan penduga yang baik, karena konsistensi hanya
merupakan salah satu syarat.

3.

Efisiensi
a. Suatu penduga dikatakan efisien apabila penduga tersebut memiliki varians yang
kecil. Apabila ada 2 penduga yang tidak bias, maka penduga yang memiliki
varians yang lebih kecil yang diukur berdasarkan pada efisiensi relatif (relative
efficiency) merupakan penduga yang lebih baik, karena lebih efisien.
b. Sebagai contoh dapat dikemukakan penduga parameter yang terdiri dari ratarata sampel dan median sampel, keduanya merupakan penduga yang tidak bias
terhadap rata-rata populasi. Kedua penduga statistik ini masing-masing memiliki
varians, yaitu varians rata-rata dan varians median.
c. Kedua varians tersebut dapat dibandingkan dalam bentuk efisiensi relatif.
Varians rata-rata (mean):

x2

2
n

Varians median:

2 Med

Bab 4: Pendugaan Secara Statistik

2
2n

Hal 42 dari 148

Handout Statistik 2

= 3,14159
Efisiensi relatif:

2 n
2x
2
Ef 2

0,64 (64%)
2
Med 2n
Efisiensi relatif sebesar 64% artinya varians rata-rata hanya 64% dari varians
median. Ini berarti untuk memperoleh varians yang sama, rata-rata hanya
memerlukan sampel dengan n = 64 elemen. Sedangkan untuk median diperlukan
sampel dengan n = 100 elemen.
Dengan diagram, kedua penduga tersebut dapat digambarkan sebagai berikut:

d. Apabila kita memiliki 2 penduga yaitu rata-rata dan median sebagai penduga
parameter, sedangkan varians nilai rata-rata lebih kecil daripada varians median,
maka efisiensi relatifnya dapat dinyatakan dengan:
Varians nilai rata-rata
Efisiensi relatif =

x 100%
Varians median

Karena varians yang lebih kecil menjadi pembilang, maka nilai dari efisiensi
relatif ini terletak antara 0 dan 100% (0 efisiensi relatif 100%)
Oleh karena itu, penduga yang mempunyai varians lebih kecil dikatakan lebih
efisien, sebab untuk mencapai varians yang sama hanya memerlukan elemen
sampel yang lebih kecil
4.

Sufisiensi

Suatu penduga dikatakan sufisien (cukup) apabila penduga itu memiliki seluruh
informasi tentang parameter yang akan diduga. Dengan kata lain tidak ada ukuran
statistik lain sebagai penduga yang lebih baik untuk menduga parameter.

Sebagai contoh dapat dikemukakan bahwa rata-rata sampel adalah penduga yang
sufisien terhadap rata-rata populasi, sebab selain rata-rata sampel tidak ada ukuran
lain misalnya: media atau modus yang dapat dipergunakan sebagai penduga yang

Bab 4: Pendugaan Secara Statistik

Hal 43 dari 148

Handout Statistik 2

lebih baik. Demikian pula proporsi sampel (x/n) merupakan penduga yang sufisien
bagi proporsi populasi (P).
C. Metode Maximum Likelihood

Metode ini dikembangkan oleh RA Fisher pada tahun 1920 yang merupakan
metode penting untuk pendugaan titik.

Kriteria-kriteria yang dimiliki metode maximum likelihood dalam proses


pendugaan parameter adalah sufisien, efisien dan konsisten.

Disamping itu apabila besarnya sampel bertambah, maka distribusi sampling


dari penduga maximum likelihood akan menyerupai suatu bentuk kurva normal.

Contoh: Probabilitas terjadinya sisi gambar pada sebuah mata uang yang tidak
setimbang misalkan: 1/4 atau 3/4. Proporsi sisi gambar yang sebenarnya tidak
diketahui. Untuk mengetahui apakah proporsi yang sebenarnya 1/4 atau 3/4,
dilakukan suatu percobaan pelemparan mata uang sebanyak 3 kali, dengan hasil
P(H,T,H) atau P(Gambar, Tulisan, Gambar). Dengan probabilitas 1/4 diperoleh hasil
sebagai berikut:
P(H,T,H) = (1/4) (3/4) (1/4) = 3/64
Dengan probabilitas 3/4 diperoleh hasil sebagai berikut:
P(H,T,H) = (3/4) (1/4) (3/4) = 9/64
Dari perhitungan tersebut dapat diketahui bahwa hasil percobaan menunjukkan
probabilitas = 3/64 untuk P=1/4 dan probabilitas = 9/ 64 untuk P = 3/4. Dari 2
keadaan, nampaknya P=3/4 merupakan penduga yang lebih mendekati kenyataan
daripada P=1/4. P=3/4 lebih banyak memberikan informasi daripada P=1/4.

Metode maximum likelihood adalah suatu metode untuk memperoleh penduga


(estmator) yang membuat probabilitas untuk memperoleh sampel yang diteliti
menjadi maksimum.

Suatu eksperimen binomial terdiri dari n percobaan yang menghasilkan


observasi x1, x2, x3 xn, dimana x = 1 kalau percobaan sukses dan x = 0 kalau
percobaan gagal. Dengan menggunakan metode maximum likelihood, kita mencari
(dibaca P topi) sebagai penduga parameter P.
penduga P
L P P x 1 P

n x

dimana, x = banyaknya sukses


Kita mencari P yang membuat L(P) menjadi maksimum, kita turunkan L(P) terhadap
P kemudian menyamakannya dengan nol.
Untuk mencari turunan L(P), dengan menggunakan log (Ln = log dengan bilangan
pokok e)
LnL P xLn P n x Ln1 P

dLnL P
x1 P n x 1 1 P 0
dP
x n x

P
1 P
Bab 4: Pendugaan Secara Statistik

x 1 P n x P

Hal 44 dari 148

Handout Statistik 2

x xP nP xP nP x
P

x
n

Jadi, penduga parameter P dengan menggunakan metode maximum likelihood


adalah P = x/n = perkiraan proporsi.

Kriteria suatu sampel dikatakan besar, apabila sampel tersebut lebih besar
daripada 30 (n > 30). Penduga interval ini ada 2 yaitu:
a. Pendugaan terhadap parameter rata-rata ().
b. Pendugaan terhadap parameter proporsi (P)

a. Pendugaan terhadap parameter rata-rata ()


1.

Untuk

mengadakan

pendugaan

parameter ini, dipergunakan rata-rata sampel ( x ) dengan interval


keyakinan tertentu.
2.

Rumus yang dipergunakan bertolak dari


rumus z untuk distribusi sampling sebagai berikut:
z

3.

Dari rumus di atas maka rata-rata


populasi () akan terletak dalam batas-batas sebagai berikut:


x z x z
n n
dimana :

= rata-rata sampel

= tabel z sesuai dengan tingkat keyakinan (confidence level)

= standar deviasi populasi

= jumlah sampel

4.

Rumus diatas berlaku untuk sampel


besar (n > 30) berasal dari populasi yang tidak terbatas atau populasi yang
terbatas pengambilan sampel dengan pemulihan.

5.

Apabila standar deviasi populasi ()


tidak diketahui, maka dapat dipergunakan standar deviasi sampel, sehingga
rumus di atas menjadi sebagai berikut:

Bab 4: Pendugaan Secara Statistik

Hal 45 dari 148

Handout Statistik 2

s s
x z x z
n n
6.

Sedang untuk populasi (N) yang terbatas


dan pengambilan sampel tanpa pemulihan, bila sampel yang digunakan (n) =
5% atau lebih dari N, maka digunakan rumus dengan faktor koreksi sebagai
berikut:

s N n s N n
x z x z
n N 1 n N 1
Pendugaan parameter dengan diketahui dan populasi tidak terbatas

i.

Rumus


x z x z
n n

jika kita mempergunakan penduga yang tidak bias

(x) untuk menduga parameter dengan interval keyakinan sebesar 95%


sedang telah diketahui, maka interval keyakinan diberikan sebagai:

x z0,025xx x z0,025xx
dimana: x

menurut tabel z, maka interval keyakinan 95% = 1,96.

Contoh: Sebuah biro perjalanan mengadakan suatu penelitian tentang


kepariwisataan di suatu kota dan ingin memperkirakan pengeluaran ratarata para wisatawan asing yang berkunjung ke kota itu. Guna keperluan
ini diambil sampel secara random yang terdiri dari 100 wisatawan asing
yang akan menjadi responden dalam penelitian ini.
Dari hasil penelitian dapat diketahui bahwa pengeluaran rata-rata setiap
kunjungan sebesar $500 per wisatawan. Jika kita anggap deviasi
pengeluaran semua wisatawan konstan sebesar $100, maka dengan
interval keyakinan 95%, buatlah rata-rata pengeluaran para wisatawan
asing yang berkunjung ke kota itu.

Bab 4: Pendugaan Secara Statistik

Hal 46 dari 148

Handout Statistik 2

Dari contoh di atas diketahui:


n = 100, x = $500, = $100, interval keyakinan = 95%, nilai z = 1,96

$100
$10
100

Maka rata-rata populasi akan terletak:


500 1,96 (10)

< < 500 + 1,96 (10)

500 19,6 < < 500 + 19,6


480,4 < < 519,6
Rata-rata pengeluaran para wisatawan per orang yang berkunjung ke kota
itu berkisar antara $480,4 hingga $519,6. Hal ini dapat digambarkan
sebagai berikut:

Pendugaan parameter dengan diketahui dan populasi terbatas

ii.

Jika sampel yang random dipilih dari populasi yang terbatas tanpa
pemulihan, x cenderung akan kurang dari

. Berapa selisihnya

tergantung pada jumlah populasinya relatif dibandingkan dengan


besarnya sampel

Makin besar persentase populasi yang dipilih sebagai sampel, makin


kurang variasi x dari sampel ke sampel. Selanjutnya rumus yang berlaku

adalah:

N n N n
x z x z
n N 1 n N 1

Contoh: Andaikan sampel sebesar n = 100 dan x = $500 dipilih dari


populasi yang terbatas N = 500 dan diketahui deviasi standar () = $100,

Bab 4: Pendugaan Secara Statistik

Hal 47 dari 148

Handout Statistik 2

maka pendugaan parameter dengan interval keyakinan 95% adalah


sebagai berikut:

$100
100

500 100
10 0,895 8,95
500 1

Jadi parameter akan terletak:


500 1,96 (8,95)

< < 500 + 1,96 (8,95)

500 17,5 < < 500 + 17,5


482,5 < < 517,5
Pendugaan parameter dengan tidak diketahui

iii.

Pada hakekatnya tergantung pada deviasi kuadrat dari , sehingga


mustahil jika diketahui tidak diketahui. Dalam kenyataannya kita
tidak mengetahui tentang sesuatu apapun mengenai parameter selain
dari sampel.

Jadi apabila deviasi standar populasi tidak diketahui, maka kita


melakukan pendugaan deviasi standar sampel (s), sehingga dipergunakan

rumus

s s
x z x z
n n

Contoh: sebuah sampel random terdiri dari 100 orang pedagang kaki
lima yang dipilih dari seluruh pedagang kaki lima di sebuah kota. Ratarata tingkat keuntungan yang diperoleh 20% dengan deviasi standar 2%.
Dengan mempergunakan interval keyakinan 95%, berapa tingkat
keuntungan semua pedagang kaki lima di kota itu?
Pada soal ini, n = 100, x =20%, s = 2% dan z0,025 = 1,96.
Karena sampelnya cukup besar, dapat diduga dengan x s

20 1,96 (2/10) < < 20 + 1,96 (2/10)


20 0,392 < < 20 + 0,392
19,6 < < 20,4
b. Pendugaan parameter Proporsi (P) dengan Sampel Besar (n>30)
-

Pendugaan

parameter

proporsi

dapat

dilakukan

dengan

mempergunakan proporsi sampel (x/n) secara tidak bias apabila sampel


random yang dipilih besar.

Bab 4: Pendugaan Secara Statistik

Hal 48 dari 148

Handout Statistik 2

Dapat menggunakan rumus sebagai berikut:

x nz
-

x n 1 x n
x n 1 x n
P x nz
n
n

Contoh: Suatu penelitian dilakukan oleh sebuah perguruan tinggi


swasta terhadap ketepatan waktu pembayaran SPP dari para mahasiswanya.
Dari 100 orang mahasiswa yang diteliti ternyata 30 orang mahasiswa
melakukan pembayaran SPP tidak tepat waktu. Dengan mempergunakan
interval keyakinan 95%, tentukan pendugaan interval proporsi dari
mahasiswa yang melakukan pembayaran SPP tidak tepat waktu.
Dari soal diatas diketahui n = 100, x = 30, z 0,025 = 1,96. Dengan
menggunakan rumus di atas diperoleh hasil sebagai berikut:

30 100 1.96

30 1001 30 100
30 1001 30 100
P 30 100 1.96
100
100

0,21 < P < 0,39


Dengan interval keyakinan 95% dapat dikatakan bahwa antara 21% sampai
39% dari para mahasiswa melakukan pembayaran SPP tidak tepat waktu.
Apabila unsur populasi (N) diketahui dan merupakan populasi terbatas,
sedang sampel diambil tanpa pemulihan maka perlu dilakukan koreksi yang
disebut koreksi populasi terbatas yakni:
N n
N 1

Sehingga rumus penduga interval proporsi populasi menjadi:

x nz

x n 1 x n

x n1 x n
N n
P x nz

N 1
n

N n
N 1

Kriteria suatu sampel yang kecil adalah apabila n 30. Pada sampel

yang kecil pendugaan parameter dengan mempergunakan s akan menghasilkan


selisih kesalahan.
Pada umumnya jika sampel kecil pendugaan parameter dilakukan

dengan distribusi t yang variabelnya distandardisir sebagai:


t

x
s/ n

Pada hakekatnya distribusi t ini menyerupai distribusi normal.

Perbedaannya terletak pada yang umumnya tidak diketahui. Pada distribusi


normal, standar pengubahan dilakukan dengan yang diketahui, sedangkan pada
distribusi t pengubahan dilakukan dengan mempergunakan yang dihitung dari
sampel.

Distribusi t ini dinamakan distribusi student sebagai nama samaran


dari WS Gosset yang menemukan distribusi ini tahun 1908.

Bab 4: Pendugaan Secara Statistik

Hal 49 dari 148

Handout Statistik 2

Perbandingan antara distribusi t dan distribusi normal dapat dilihat

pada gambar berikut:

Tabel distribusi t tersebut selanjutnya dapat dilihat pada lampiran.

Apabila n makin kecil, distribusi t akan makin melebar. Sebaliknya makin besar nnya distribusi t akan mendekati distribusi normal.
Tabel t tidak disusun berdasarkan besarnya sampel n, tetapi disusun

menurut derajat kebebasan (degree of freedom) yang dirumuskan dengan n-1.


Pengertian derajat kebebasan ini dapat dijelaskan sebagai berikut:

Tiga buah data mempunyai rata-rata = 5. Di dalam menentukan masing-masing data


ini kita mempunyai kebebasan kecuali pada data ketiga, karena jumlah ketiga data
tersebut harus = 15 (rata-rata = 15/3 = 5). Dengan kata lain, kita kehilangan 1 derajat
kebebasan atau kita hanya mempunyai 2 derajat kebebasan. Karena n = 3 , maka
derajat kebebasan dirumuskan dengan (n-1).
Pendugaan Parameter dengan Tidak Diketahui dan Populasi Tidak

a.

Terbatas
-

Contoh: Penelitian terhadap sampel sejumlah 16 orang wisatawan


asing yang berkunjung ke suatu kota menunjukkan pengeluaran rata-rata selama
tinggal di kota tersebut sebesar $500 dengan deviasi standar $100. Tentukan
pengeluaran rata-rata yang sebenarnya dengan menggunakan interval keyakinan
95%.
Dari soal diatas diketahui, n = 16, x = $500, s = $100, interval keyakinan 95%,
t0,025 df = 15, tabel t = 2,131.
Rumus yang dipergunakan adalah:

x ts n x ts n
Dengan menggunakan rumus di atas, maka didapat hasil sebagai berikut:
500 2,131 (100/4) < < 500 + 2,131 (100/4)
500 53,275 < < 500 + 53,275
446,725 < < 553,275

Bab 4: Pendugaan Secara Statistik

Hal 50 dari 148

Handout Statistik 2

Jadi pengeluaran rata-rata yang sebenarnya para wisatawan asing tersebut


antara $446,7 sampai $553,3.
-

Penggunaan distribusi t membawa asumsi bahwa variabel x harus


memiliki distribusi normal, jika distribusi tidak menyerupai distribusi normal,
maka penggunaan distribusi t hasilnya dapat meragukan.
Pendugaan Parameter dengan Tidak Diketahui dan Populasi Terbatas

b.
-

Sebagaimana telah dijelaskan untuk populasi yang terbatas perlu


adanya koreksi populasi terbatas, yaitu:

N n
N 1

Contoh: Dengan menggunakan contoh a, dan populasi N = 100 orang


maka faktor koreksi adalah:
100 16

100 1

84

99

0,848 0,92

Sehingga hasil pendugaan menjadi sebagai berikut:


500 (53,275 x 0,92)

< < 500 + (53,275 x 0,92)

500 49,07 < < 500 + 49,07


450,93 < < 549,07
c.

Pendugaan Parameter Proporsi


-

Dalam pendugaan interval proporsi dengan sampel yang kecil, maka


rumus yang dipergunakan adalah:

x nt
-

x n 1 x n
x n 1 x n
P x nt
n
n

Contoh, Penelitian terhadap sampel sebanyak 16 mahasiswa, ternyata 4 di


antaranya mempunyai kendaraan sendiri. Dengan interval keyakinan 95%,
tentukan proporsi mahasiswa yang memiliki kendaraan sendiri.
n = 16, x = 4, x/n = 0,25, t0,025 df = 15, tabel t = 2,131
0,25 2,131 0,1875 16 P 0,25 2,131 0,1875 16

0,02 < P < 0,48


Pendugaan interval untuk perbedaan dua rata-rata dan dua proporsi

adalah sama prosedurnya dengan pendugaan interval untuk rata-rata dan proporsi.
Pendugaan Parameter 1 - 2 jika 1 dan 2 diketahui

a.
-

Pendugaan interval selisih dua rata-rata (1 - 2) jika 1 dan 2 diketahui


dirumuskan sebagai berikut:

x1 x2 z x1 x 2 1 2 x1 x2 z x1 x2
dimana

Bab 4: Pendugaan Secara Statistik

Hal 51 dari 148

Handout Statistik 2

12 22
x1 x 2

n1 n2
-

Contoh: Upah mingguan karyawan perusahaan asing dari 90 orang


karyawan rata-rata Rp. 100.000 dari 1 = Rp. 9.000, sedangkan perusahaan
nasional dari 90 orang karyawan rata-rata Rp. 50.000 dan 2 = Rp. 5.000.
Dengan menggunakan interval keyakinan 95% buatlah pendugaan interval antara
1 - 2.
Jawaban:
n1 = 90, x1 =Rp. 100.000, 1 = Rp. 9.000, z0,025 = 1,96, n2 = 90, x 2 =Rp. 50.000,
2 = Rp.5.000
x1 x 2

81000000 25000000

106000000 / 90 1085
90
90

Dengan menggunakan rumus di atas maka diperoleh hasil sebagai berikut:


(100000 50000) 1,96 (1085)
50000 2126,6

< 1 - 2 < (100000 50000) + 1,96 (1085)


< 1 - 2 < 50000 + 2126,6

47873,4 < 1 - 2 < 52126,6


Jadi dengan interval keyakinan 95%, selisih rata-rata upah mingguan karyawan
perusahaan asing dan nasional antara Rp. 47.873,4 sampai dengan Rp. 52.126,6.
Pendugaan Parameter 1 - 2 jika 1 dan 2 Tidak Diketahui

b.
-

Apabila 1 dan 2 tidak diketahui, maka dipergunakan dugaan deviasi


standar sampel yakni s1 dan s2 sehingga rumusnya menjadi sebagai berikut:

x1 x2 t sx1 x2 1 2 x1 x 2 t sx1 x2
dimana

sx1 x 2
-

(n1 1) s12 (n 2 1) s 22
1 n1 1 n 2
n1 n2 2

Contoh: Penghasilan setiap minggu dari pedagang kaki lima yang


berjualan di Jalan X dan Jalan Y adalah sebagai berikut (dalam ribuan rupiah)
Pedagang di Jl. X : 40 46 40 36 38 34 42 44 40
Pedagang di Jl. Y : 30 24 16 25 35 40 46 38 34
Dengan interval keyakinan 95%, buatlah pendugaan interval 1 - 2 dimana x1
=rata-rata penghasilan pedagang kaki lima di Jalan X dan

x 2 =rata-rata

penghasilan pedagang kaki lima di Jalan Y.


Jawaban:
n1 = 9, x1 =40, s1 = 14 = 3,74
n2 = 9, x 2 =32, s2 = 85,25 = 9,23
t0,025 , df = 9+9-2 = 16, tabel t = 2,120
Bab 4: Pendugaan Secara Statistik

Hal 52 dari 148

Handout Statistik 2

112 682
1 9 1 9 3,32
16

sx1 x 2

(40 32) 2,12 (3,32)

< 1 - 2 < (40 32) + 2,12 (3,32)

0,96 < 1 - 2 < 15,04 (dalam ribuan)


Dengan interval keyakinan 95%, kita harapkan perbedaan antara penghasilan
pedagang kaki lima yang berjualan di Jalan X dan Jalan Y adalah antara Rp. 960
sampai Rp. 15.040.
c.

Pendugaan Perbedaan Dua Proporsi


-

Pendugaan interval perbedaan dua proporsi (P1 P2) dirumuskan sebagai


berikut:

x1 x 2
x
x

z s P1 P 2 P1 P2 1 2 z s P1 P 2
n1 n 2
n1 n2
dimana

s P1 P 2
-

x1 n1 1 x1 n1 x 2 n 2 1 x 2 n2

n1
n2

Contoh: Dari sampel nasabah bank sebanyak 120 orang di kota A,


sebanyak 90 orang di antaranya pengusaha besar. Dan 120 orang nasabah bank
di kota B, 60 orang di antaranya pengusaha besar. Dengan tingkat keyakinan
95%, buatlah pendugaan interval (P1 P2), jika P1 = proporsi nasabah pengusaha
besar di kota A dan P2 = proporsi nasabah pengusaha besar di kota B.
Jawaban:
n1 = n2 = 120, x1/n1 = 90/120 = 0,75, x2/n2 = 60/120 = 0,50, z0,025 = 1,96
s P1 P 2

(0,75)(0,25) (0,50)(0,50)

120
120

0,003645 0,06

(0,75 0,50) 1,96 (0,06) < P1 P2 < (0,75 0,50) + 1,96 (0,06)
0,25 0,1176

< P1 P2 < 0,25 + 0,1176

0,1324 < P1 P2 < 0,3676


Dengan interval keyakinan 95% kita harapkan interval antara 0,13 atau 13%
sampai 0,37 atau 37% merupakan selisih proporsi nasabah bank di kota A dan
kota B yang terdiri dari pengusaha besar.

Dalam teori sampel telah dijelaskan bahwa jika n besar, maka distribusi
sampling akan menyerupai kurva normal. Dengan demikian kita dapat mengatakan
bahwa, jika suatu random sampel cukup besar, dengan interval keyakinan 95%
deviasi standar populasi akan terletak dalam jarak:

Bab 4: Pendugaan Secara Statistik

Hal 53 dari 148

Handout Statistik 2

s 1,96

2n

s 1,96

2n

Contoh:
Sampel sebesar 8 menunjukkan deviasi standar = 3. Dengan interval keyakinan 95%,
tentukan interval .
Jawaban:
n = 8, s = 3 dan z0,025 = 1,96
3 1,96

3
16

< < 3 1,96

3
16

3 1,47 < < 3 + 1,47


1,53 < < 4,47
Dengan interval keyakinan 95% kita harapkan akan terletak antara 1,53 dan 4,47.
Pada umumnya sebelum kita memilih sampel secara acak (random) guna

menduga parameter, kita seharusnya menetapkan terlebih dahulu berapa besarnya


sampel yang akan kita ambil, agar kita dapat menduga parameter dengan ketepatan
yang kita inginkan yang diukur berdasar lebarnya interval keyakinan yang kita
kehendaki.

Misalkan kita ingin mengetahui berapa besarnya sampel yang akan kita
gunakan agar dengan interval keyakinan 95%, selisih rata-rata populasi yang
sesungguhnya tidak lebih dari 5 secara searah. Dapat digambarkan sebagai berikut:

Dengan pembahasan sebelumnya dijelaskan bahwa lebar interval


keyakinan tertentu akan tergantung pada varians dan besarnya sampel. Jika varians
diketahui, lebarnya interval keyakinan dapat dirumuskan sebagai berikut:
zE s

atau

E = Error = Penyimpangan
s = standar deviasi sampel
Dari rumus diatas dapat ditentukan besarnya sampel (n) sebagai berikut:

Bab 4: Pendugaan Secara Statistik

Hal 54 dari 148

Handout Statistik 2

z.
n
E

dimana
n

= besarnya sampel

= nilai z yang besarnya ditentukan oleh interval keyakinan

= deviasi standar populasi

E = besarnya kesalahan yang diharapkan


Contoh:
Jika populasi normal diketahui sebesar 10 dan jika kita ingin interval keyakinan
95% yang mencakup rata-rata parameter tidak melebihi 10 lebarnya, berapa
besarnya sampel yang kita ambil?
Jawaban:
E = 5, = 10, z0,025 = 1,96
1,96(10)

15,36 15 sampel

Penentuan besarnya sampel dapat pula dihitung berdasarkan pendugaan

interval proporsi:

P P 1
n

atau

P (1 P )
E/z
n

z 2 P (1 P )
E2

Apabila P tidak diketahui, maka P(1-P) diganti dengan 1/4, yaitu nilai maksimum
untuk P(1-P).
Contoh: Perusahaan penjual alat-alat kosmetik ingin menduga proporsi konsumen
yang menyukai produknya. Dalam proses pendugaan ini pengusaha ingin agar selisih
dugaannya tidak melebihi 2% dari parameternya, sedangkan interval keyakinan yang
dikehendaki 95%. Berapa besarnya sampel bagi pendugaan proporsi populasi ini?
Jawaban:

(1,96) 2 (1 / 4)
2,401 2 sampel
(0,02) 2

Bab 4: Pendugaan Secara Statistik

Hal 55 dari 148

Handout Statistik 2

5. PENGUJIAN HIPOTESA
A. Arti dan Pentingnya Pengujian Hipotesa
Hipotesa adalah suatu anggapan atau pendapat yang diterima secara tentatip

untuk menjelaskan suatu fakta atau yang dipakai sebagai dasar bagi suatu
penelitian.
Beberapa contoh hipotesa dapat dikemukakan sebagai berikut:

a.

Seorang

manajer

produksi

menyatakan

bahwa

kerusakan produk dalam proses produksi hanya 10%


b.

Manajer pemasaran suatu perusahaan menyatakan


bahwa pemasaran produk-produk baru sangat tergantung pada iklan

c.

Manajer personalia menyatakan bahwa produktivitas


perusahaan masih dapat ditingkatkan 10% dengan meningkatkan kondisi kerja

d.

Seorang ekonom menyatakan bahwa resesi dunia


sangat mempengaruhi penerimaan devisa negara.
Hipotesa, anggapan atau pendapat di atas seringkali dipergunakan untuk

mengambil keputusan, kalau hipotesa itu keliru dengan sendirinya keputusannya


dapat keliru. Oleh karena itu, hipotesa harus diuji berdasarkan data empiris yaitu
data berdasar pada penelitian suatu sampel.
Berdasarkan keadaan yang nyata ini, maka hasil pengujian hipotesa dapat

dipergunakan sebagai dasar pengambilan keputusan. Kesalahan yang diakibatkan


pengambilan keputusan merupakan resiko dalam pengambilan keputusan.
Agar suatu hipotesa dapat diuji, hipotesa harus dirumuskan secara jelas dan

bersifat operasional.
Menurut sifat hipotesa kita dapat membedakan yang bersifat kualitatif, misalkan

seorang hakim menganggap seseorang bersalah atau kuantitatif yang disebut sebagai
hipotesa statistik, misalkan rata-rata pengeluaran sebulan Rp. 200.000.
Hipotesa statistik dirumuskan sebagai suatu pernyataan tentang nilai suatu
parameter, misalnya rata-rata populasi, proporsi populasi, varians populasi dan
sebagainya.
B. Prosedur Pengujian Hipotesa
Pengujian suatu hipotesa pada hakekatnya dapat disusun dalam beberapa tahap.

Pentahapan di dalam pengujian hipotesa ini secara keseluruhan merupakan


prosedur dari pengujian hipotesa.
Tahapan pengujian hipotesa adalah sebagai berikut:

1.

perumusan hipotesa nol dan hipotesa alternatif

2.

penentuan taraf nyata (significant level) biasanya digunakan simbol


, misalnya 10%, 5% atau 1%.

Bab 5: Pengujian Hipotesa

Hal 56 dari 148

Handout Statistik 2

3.

Menentukan statitik uji atau kriteria uji yang akan digunakan,


apakah dengan kurva normal, distribusi t, distribusi x2 atau dengan distribusi F.

4.

Pengambilam keputusan, apakah hipotesa dapat diterima ataukan


hipotesa ditolak.

1.

Perumusan Hipotesa Nol dan Hipotesa Alternatif


-

Hipotesa nol (null hypotheses) biasanya dirumuskan dengan H0. Disebut


hipotesa nol, karena hipotesa ini mempunyai perbedaan nol atau tidak
mempunyai perbedaan dnegan hipotesa yang sebenarnya.
Contoh, apabila kita ingin membuktikan bahwa obat A lebih efektif terhadap
penyakit daripada obat B, maka kita merumuskan hipotesanya efektivitas obat A
dan B sama.
Demikian pula apabila kita ingin membuktikan bahwa mesin A lebih produktif
dari mesin B, maka hipotesisnya dirumuskan produktivitas mesin A sama dengan
mesin B.

Hipotesa alternatif dirumuskan dengan H1 adalah hipotesa kerja yang


dirumuskan sebagai kebalikan dari hipotesa nol.
Contoh:
Pada hipotesa nol yang menyatakan bahwa efektivitas obat A sama dengan obat
B, hipotesa alternatifnya dirumuskan sebagai berikut:
a.

Efektifitas obat A tidak sama dengan obat B

b.

Efektifitas obat A lebih baik dari obat B

c.

Efektifitas obat A lebih jelek dari obat B

Ketiga hipotesa alternatif tersebut merupakan 3 alternatif yang dapat


dipergunakan sebagai perumusan hipotesa alternatif.
-

Setelah hipotesa nol dan hipotesa alternatif dirumuskan, maka


selanjutnya kita mengadakan observasi sampling. Atas dasar nilai statistik
sampel ini, maka keputusan diambil apakah hipotesa nol diterima atau ditolak.

Apabila kita menerima hipotesa nol maka hipotesa alternatif kita tolak
atau kalau kita menolak hipotesa nol maka hipotesa alternatif kita terima.

2.

Penentuan Taraf Nyata (Significant Level)


-

Tujuan dari pengujian hipotesa tidaklah semata-mata untuk menghitung


nilai statistik, melainkan untuk memutuskan apakah perbedaan antara nilai
statistik dan parameter sebagai suatu hipotesa cukup nyata atau tidak.

Contoh: Sebuah perusahaan pembuat pesawat terbang menyatakan


bahwa penggunaan bahan aluminium mempunyai rata-rata ketebalan 0,04 inci,
sedang batas toleransi yang dapat diterima 5%.
Di sini hipotesa nol (H0) = 0,04 inci.
Sedang batas toleransi 5% disebut taraf nyata atau signigicant level.

Bab 5: Pengujian Hipotesa

Hal 57 dari 148

Handout Statistik 2

Apabila hipotesa nol benar, maka taraf nyata ini menunjukkan persentase dari
rata-rata sampel atau nilai statistik yang terletak di luar batas kepercayaan atau
confidence level.
Diagram berikut menunjukkan taraf nyata 5% yang di dalam kurva normal
terletak pada ujung kurva masing-masing seluas 2,5%.

Menurut tabel daerah kurva normal, luas daerah kurva sebesar 95% akan
terletak dalam jarak 1,96 yang menunjukkan bahwa di daerah ini tidak ada
perbedaan yang nyata (significant) antara nilai statistik dan nilai parameter yang
dinyatakan sebagai hipotesa. Daerah ini disebut daerah penerimaan hipotesa
atau acceptance region. Sedang kedua ujung kurva dengan luas masing-masing
2,5% merupakan daerah penolakan hipotesa, karena daerah ini menunjukkan
adanya perbedaan yang nyata atau significant antara nilai statistik dan nilai
parameternya yang dijadikan hipotesa.

i.

Pemilihan Taraf Nyata (Significant Level)


-

Di dalam pemilihan taraf nyata ini tidak ada standar ukuran yang pasti.
Beberapa nilai taraf nyata yang banyak dipergunakan adalah 10%, 5% dan 1%.

Ada yang mengatakan bahwa taraf nyata 1% atau kurang dipergunakan di


bidang kesehatan, 5% di bidang ekonomi dan 10% untuk bidang pertanian.

Sedang Richard I. Levin dalam bukunya Statistics for Management


mengatakan bahwa taraf nyata 1% banyak dipergunakan untuk pengujian
hipotesa-hipotesa di dalam penelitian-penelitian.

Selanjutnya dikatakan bahwa tidak mungkin mempergunakan semua


kriteria taraf nyata melainkan harus ditetapkan salah satu nilai standar yang
minimal. Semakin besar nilai taraf nyata akan semakin besar probabilitasnya
untuk menolak hipotesa nol. Dapat dilihat pada diagram berikut:

Bab 5: Pengujian Hipotesa

Hal 58 dari 148

Handout Statistik 2

Dari gambar di atas ditunjukkan bahwa semakin besar nilai taraf nyata
maka semakin sempit daerah penerimaan hipotesa atau semakin besar
probabilitas untuk menolak hipotesa.

ii.

Pengujian dengan 2 sisi dan dengan 1 sisi


-

Di dalam pengujian hipotesa kita dapat mempergunakan 2


sisi atau 1 sisi pengujian (two tailed test or one tailed test).

Pengujian dengan 2 sisi adalah pengujian hipotesa yang


akan menolak hipotesa nol, jika nilai statistik mempunyai perbedaan nyata
lebih besar atau lebih kecil daripada parameter populasi yang dijadikan
hipotesa.

Pengujian dengan 2 sisi dilakukan apabila hipotesa


alternatifnya dirumuskan dengan:
H1 0
Contoh:
Suatu perusahaan yang memproduksi lampu pijar menyatakan bahwa daya
tahan lampu pijar hasil produksinya rata-rata 1000 jam.
Perumusan hipotesa nol dan hipotesa alternatifnya adalah sebagai berikut:
H0 =0 =1000 jam

Bab 5: Pengujian Hipotesa

Hal 59 dari 148

Handout Statistik 2

H1 0 1000 jam
Perumusan hiptoesa alternatif yang demikian dimaksudkan karena produsen
tidak menghendaki hasil produksinya mempunyai daya tahan yang lebih kecil
atau lebih besar dari rata-rata daya tahan yang telah ditetapkan sebesar 1000
jam.
Jika daya tahan lebih kecil dari daya tahan rata-rata yang telah ditetapkan,
maka perusahaan tersebut akan kehilangan konsumennya. Sebaliknya jika
daya tahan lampu pijar jauh di atas daya tahan rata-rata yang telah
ditetapkan maka perusahaan akan menghadapi biaya yang tinggi.
-

Dalam banyak hal kadang-kadang kita tidak memerlukan


pengujian dengan menggunakan 2 sisi, yaitu apabila kita menghadapi
masalah berikut ini. Misalkan pemerintah ingin membeli bola lampu pijar
dalam jumlah yang cukup besar untuk keperluan instansinya. Dalam
pembelian bola lampu ini, pemerintah menghendaki agar mutu produk cukup
baik dengan daya tahan rata-rata adalah 1000 jam, sehingga pemerintah
dapat memantau hasil pembeliannya dengan mengadakan penelitian sampel
dari bola lampu pijar yang dibelinya. Berdasarkan pertimbangan daya tahan
rata-rata dari bola lampu tersebut, pemerintah akan menolak apabila daya
tahan bola lampu yang dibelinya di bawah 1000 jam. Pemerintah akan
merasa diuntungkan, sebab semakin besar daya tahan bola lampu
pemerintah akan dapat menghemat pengeluarannya.
Dengan demikian hipotesa nol (H0) adalah = 1000 jam, sedangkan hipotesa
alternatifnya H1 adalah < 1000 jam. Pengujian ini disebut pengujian dengan
1 sisi di sebelah kiri.

Pengujian dengan 1 sisi di sebelah kiri dipergunakan


apabila hipotesa alternatif menyatakan lebih kecil dari hipotesa nolnya.
Apabila nilai statistik menunjukkan perbedaan yang nyata di bawah nilai
parameter yang dijadikan hipotesa, maka hal ini akan mengarah pada
kesimpulan yang akan menolak hipotesa nolnya. Karena daerah penolakan
hipotesa ini berada disebelah kiri, maka kita mengatakan pengujian hipotesa
ini pengujian dengan 1 sisi di sebelah kiri.

Bab 5: Pengujian Hipotesa

Hal 60 dari 148

Handout Statistik 2

Pengujian hipotesa dengan 1 sisi di sebelah kanan


dipergunakan apabila kita menghadapi hipotesa alternatif yang menyatakan
lebih besar dari hipotesa nolnya. Daerah penolakan hipotesa berada di
sebelah kanan.

3.

Penentuan Statistik Uji


-

Pada umumnya statistik uji yang dipergunakan sebagai dasar


pengambilan keputusan dalam pengujian hipotesa apabila sampelnya besar
dalam hal ini n 30.

dimana: Penggunaan statistik uji z ini tergantung pada ciri


hipotesanya dan asumsi-asumsi tentang populasinya yang dirumuskan sebagai
berikut:
z

st parameter
st

st

= statistik (nilai sampel)

parameter

= hipotesa parameternya

st

= deviasi standar sampel

Sebaliknya apabila sampelnya kecil dalam hal ini n<30 maka akan
digunakan statistik uji t sebagai dasar pengujian hipotesa dirumuskan sebagai
berikut:
t

st parameter
st

dimana t = distribusi t dengan derajat kebebasan sebesar n 1.


4.

Pengambilan Keputusan
-

Di dalam setiap proses pengambilan keputusan tentang apakah kita


akan menerima ataukah menolak suatu hipotesa, kita akan selalu dihadapkan
pada 2 macam kesalahan, yakni dirumuskan dengan kesalahan jenis 1 atau type 1
error dan kesalahan jenis II atau type II error.

Kesalahan jenis I akan kita jumpai apabila kita menolak suatu


hipotesa yang benar (H0 benar) sedang kesalahan jenis II akan kita jumpai
apabila kita menerima suatu hipotesa yang keliru (H0 keliru sedang H1 benar).

Bab 5: Pengujian Hipotesa

Hal 61 dari 148

Handout Statistik 2

Secara skematis kedua jenis kesalahan tersebut dapat dilihat pada


tabel berikut:

Hipotesa
Keputusan
Menerima H0

Jika H0 benar
Keputusan betul
Probabilitas = 1 -
(tingkat keyakinan)
Kesalahan jenis I

Menolak H0

Jika H0 Keliru (H1 Benar)


Kesalahan jenis II
Probabilitas =
Keputusan betul

Probabilitas =

Probabilitas = 1 -

(taraf nyata)

(kuasa pengujian)

Pengujian hipotesa dapat dilakukan dengan 1 sisi yakni dengan nilai


kritis atau daerah penolakan terdapat pada salah satu ujung kurva atau dengan
mempergunakan 2 sisi dengan nilai kritis atau daerah penolakan pada kedua
ujung kurva.

Misalkan

kita

mengadakan

pengujian

hipotesa

dengan

mempergunakan 1 sisi dengan = 0,05 dan misalkan hipotesa nol (H 0) yang


menyatakan pengeluaran rata-rata setiap hari untuk salesman Rp. 10.000
sedangkan statistik sampel terletak pada daerah penolakan, maka secara
konsekuen kita harus menolak H0. Dengan demikian keputusan itu membuat
resiko kesalahan sebesar 0,05. Sebaliknya apabila H0 yang menyatakan
pengeluaran rata-rata setiap hari untuk salesman Rp. 10.000 tidak benar, maka
H1 yang benar, sedangkan statistik sampel terletak dalam daerah penerimaan,
secara konsekuen kita harus menerima H0 dengan membuat kesalahan menerima
H0 palsu sebesar .
-

Secara teoritis kedua jenis kesalahan tersebut sedapat mungkin harus


diusahakan sekecil mungkin dengan melalui pemilihan daerah kritis yang
setepat-tepatnya.

Prosedur pengujian hipotesa yang baik seharusnya mengikuti suatu


asas umum sebagai berikut:
Bila terdapat beberapa daerah kritis yang memiliki probabilitas kesalahan jenis I
yang sama dan sudah ditentukan, maka pengujian hipotesa yang terbaik adalah
yang memiliki probabilitas kesalahan jenis II yang sekecil mungkin.

Secara grafis kedua jenis kesalahan dapat terlihat pada gambar


berikut:

Bab 5: Pengujian Hipotesa

Hal 62 dari 148

Handout Statistik 2

Nilai kritis searah dapat ditentukan dengan rumus:


z

/ n

Apabila = Rp. 10.000, z0,05 = 1,64, = 500 dan n = 100. Nilai kritis = Rp.
10.082.
Jika H0 benar, maka = probabilitas kesalahan

a.

menolak H0 benar sebesar 5% (0,05)


Jika H0 keliru (H1 benar), maka = probabilitas

b.

kesalahan menerima H0 yang keliru.


Hubungan antara , dan n

Di dalam pengujian hipotesa

kita lebih dahulu harus menentukan besarnya kesalahan jenis I () karena


kesalahan ini dapat dikuasai.
Selanjutnya

kita

tentukan

besarnya sampel (n) dan akhirnya mengatur pengujian hipotesa yang sifatnya
meminimumkan kesalahan jenis II.
Bab 5: Pengujian Hipotesa

Hal 63 dari 148

Handout Statistik 2

Apabila

besarnya

sampel

telah ditentukan maka besarnya kesalahan jenis II akan berangsur-angsur


berkurang selama kesalahan jenis I berangsur-angsur naik dan sebaliknya.
Contoh: H0 =50, =12, n

=36, dan = 0,05 dalam pengujian 2 sisi. Dengan menggunakan


rumus z, maka daerah penolakan hipotesa akan terletak antara 46,080
dan 53,920. Daerah ini dapat terlihat pada gambar berikut:

Apabila besarnya rata-rata populasi yang sebenarnya () = 52, maka


besarnya menjadi:
z1

46,08 52
2,96
2

tabel kumulatif = 0,0013

z2

53,92 52
0,96
2

tabel kumulatif = 0,8289

Luas menjadi 0,8289 0,0013 = 0,8276


Luas 1 - menjadi 0,0013 + (1 0,8289) = 0,1724
Luas daerah 1 - dapat dilihat pada gambar berikut:

Luas = 0,830 bila n=36, = 0,484 bila n=100, = 0,021 bila


n=400, = 0,00001 bila n=1000.
Apabila tetap, sedang n diperbesar, maka daerah penolakan hipotesa
akan semakin besar sedang daerah penerimaan hipotesa akan
semakin sempit.

Bab 5: Pengujian Hipotesa

Hal 64 dari 148

Handout Statistik 2

Hal ini dapat mendukung kebenaran teori sampel yang menyatakan


apabila sampel makin besar (n makin besar) maka rata-rata ukuran
sampel akan mendekati ukuran populasinya.
Selain itu, dengan makin besarnya n sedang tetap, akan

mengakibatkan pengurangan dan memperbesar luas 1 -

. Hal

demikian membuktikan kegunaan sampel besar dalam pengujian


hipotesa.
Makin kecil maka 1 - akan makin besar atau makin besar

probabilitas untuk menolak hipotesa yang keliru. Penolakan hipotesa


yang keliru dinamakan kuasa pengujian (power or the test).
Pengertian

tentang

Kuasa

Pengujian dan Kurva Fungsi Kuasa


Kuasa pengujian atau 1 - adalah probabilitas untuk menolak

1.

hipotesa yang keliru.


2.

Contoh: Suatu rumah sakit di dalam mengadakan pengobatan


pasiennya mempergunakan obat dengan dosis masing-masing 100 cc.
Untuk memenuhi kebutuhan obat ini, rumah sakit selalu membeli obat
dari suatu perusahaan farmasi yang memproduksinya secara langsung,
sehingga diketahui deviasi standarnya 2 cc.
Dalam

setiap

kali

pengiriman

obat,

rumah

sakit

mengadakan

pengamatan dengan mengambil sampel sebanyak 50 buah kemasan


yang setiap dosis mempunyai isi rata-rata 99,75 cc.
Apabila rumah sakit tersebut menetapkan taraf nyata atau significant
level

10%

dan

menyatakan

bahwa

dosis

obat-obatan

tersebut

terlampau kecil, bagaimana kesimpulan yang dapat kita peroleh?


Jawaban:
H0 : = 100 cc
H1 : < 100 cc
Penyimpangan standar/baku terhadap nilai rata-rata dengan deviasi standar
populasi diketahui = 2 dapat dihitung sebagai berikut:
x

n 2 / 50 2 / 7,07 0,2829 (0,28 cc)

Karena pengujian hipotesa ini diarahkan pada hipotesa alternatif yang lebih
kecil, maka pengujian hipotesanya mempergunakan 1 sisi di sebelah kiri. Taraf
nyata 10% menunjukkan nilai z = -1,28. Jadi batas daerah penerimaan hipotesa
adalah:
100 1,28 (0,28) = 100 0,36 = 99,64 cc
Nilai ini merupakan batas terendah dari dosis obat yang dapat ditolerir oleh
rumah sakit untuk dapat diterima.

Bab 5: Pengujian Hipotesa

Hal 65 dari 148

Handout Statistik 2

Nilai rata-rata sampel sebesar 99,75 cc akan terletak pada daerah penerimaan,
artinya dosis 99,75 cc masih dapat ditolerir.

3.

Selanjutnya berbagai batas daerah penerimaan hipotesa dengan


berbagai variasi dalam jarak berbagai standar error dengan = 99,61
cc dapat dijelaskan sebagai berikut:
a.

Untuk

99,42

cc

berarti

(99,42

99,61)/0,28 = 0,68 standar error atau z = 0,68 menurut tabel z,


luasnya adalah 0,2517. 1 - = 0,7517
b.

Untuk

99,64

cc

berarti

(99,64

99,61)/0,28 = 0,11 standar error atau z = 0,11 menurut tabel z,


luasnya adalah 0,0438. 1 - = 0,5438
c.

Untuk

99,80

cc

berarti

(99,80

99,61)/0,28 = 0,68 standar error atau z = 0,68 menurut tabel z,


luasnya adalah 0,2517. 1 - = 0,2483
4.

Kita dapat menggambarkan kurva kuasa (power curve) sebagai


berikut:

Bab 5: Pengujian Hipotesa

Hal 66 dari 148

Handout Statistik 2

5.

Dari gambar di atas ditunjukkan bahwa semakin jauh ukuran


sampel dengan hipotesa, semakin besar kita akan menolak hipotesa
nol menerima hipotesa alternatif.

C. Berbagai Contoh Pengujian Hipotesa Dalam Berbagai Kasus


1.

Pengujian Hipotesa terhadap Nilai Rata-Rata


Dalam pengujian hipotesa terhadap nilai rata-rata ini, kita akan menjumpai

berbagai kasus, yakni: apabila deviasi standar populasinya diketahui dan apabila
deviasi standar populasinya tidak diketahui.
Apabila deviasi standar populasi tidak diketahui, maka dipergunakan deviasi

standar sampel.
Selanjutnya dalam pengujian hipotesa terhadap nilai rata-rata ini akan

dibedakan dalam hal sampel yang besar (n > 30) dan sampel kecil (n 30).
Untuk sampel yang besar akan digunakan distribusi z dan untuk sampel yang
kecil digunakan distribusi t.
a.

Pengujian Hipotesa terhadap Nilai Rata-Rata dengan


Sampel Besar
-

Apabila Deviasi Standar Populasi Diketahui


Suatu perusahaan pembuat pesawat terbang penumpang menyatakan bahwa
hasil produksinya setelah dipergunakan dalam jangka waktu 1 tahun
diperlukan pengecekan kembali selama 11 jam dengan deviasi standar 3,5
jam. Setelah selang 3 tahun, tehnisi pesawat meragukan hipotesa ini,
sehingga perlu dilakukan pengamatan kembali dengan mengambil sampel

Bab 5: Pengujian Hipotesa

Hal 67 dari 148

Handout Statistik 2

sebanyak 49 buah pesawat. Ternyata waktu rata-rata yang diperlukan untuk


mengadakan pemeliharaan ini 12 jam. Teknisi masih percaya bahwa deviasi
standarnya tetap.
Apakah ada alasan untuk meragukan bahwa waktu yang diperlukan untuk
pemeliharaan pesawat terbang dalam 1 tahun diperlukan 11 jam, apabila
dipergunakan taraf nyata 10%?
Persoalan ini dapat dipecahkan dengan langkah-langkah sebagai berikut:
H0 : = 11 jam

1.
H1 : 11 jam
2.

Taraf

nyata

10%

dengan 2 sisi pengujian nilai z = 1,64


3.

Statistik

uji,

distribusi z
z

/ n

Berdasarkan pada rumus di atas kita dapat menghitung z:


z

12 11
3,5 / 49

1 / 0,5 2

4.

Kesimpulan:

>

1,64, perbedaan signifikan cukup besar sehingga hipotesa ditolak.


Kesimpulan ini dapat ditunjukkan dalam gambar berikut:

Apabila dipergunakan taraf nyata 5%, maka menurut tabel z, nilai z = 1,96.
Karena hasil statistik uji = 2 masih lebih besar daripada 1,96; maka
kesimpulan tidak berubah.

Bab 5: Pengujian Hipotesa

Hal 68 dari 148

Handout Statistik 2

Apabila dipergunakan taraf nyata 1%, maka menurut tabel z, nilai z = 2,58.
Karena hasil statistik uji = 2 dan lebih kecil daripada 2,58, maka kesimpulan
berubah yang berarti perbedaan tidak signifikan, sehingga hipotesa diterima.

Apabila Deviasi Standar Populasi Tidak Diketahui


Dalam hal deviasi standar populasinya tidak diketahui, maka digunakan
deviasi standar sampel (s), sehingga rumus yang berlaku adalah:
z

x
s/ n

Contoh: Suatu perusahaan minuman botol yang telah terisi rata-rata 32 ons,
sesuai dengan standar yang telah ditetapkan oleh bagian produksi. Dalam
pemasaran akhir-akhir ini ternyata banyak keluhan dari para konsumen,
sehingga lembaga konsumen mengadakan pemeriksaan terhadap produksi
teh botol dengan mengambil sampel sebanyak 100 botol. Ternyata berat ratarata 31,8 dengan deviasi standar 2 ons.
Dengan mempergunakan taraf nyata 5%, apakah keluhan para konsumen
terhadap produksi teh botol ini dapat dibenarkan?
Pemecahan masalah tersebut di atas adalah sebagai berikut:
1.

H0 : = 32 ons
H1 : 32 ons

2.

Taraf nyata 5% dengan 2 sisi pengujian, nilai z = 1,96

3.

Statistik uji, distribusi z

Bab 5: Pengujian Hipotesa

Hal 69 dari 148

Handout Statistik 2

x
s/ n

Berdasarkan pada rumus di atas kita dapat menghitung z:


z

4.

31,8 32
0,2 / 0,2 1
2 / 100

Kesimpulan: -1 > - 1,96 (z mendekati nol), perbedaan dikatakan


tidak berarti (tidak signifikan) sehingga hipotesa diterima. Jadi keluhan
para konsumen terhadap produksi teh botoh dinyatakan sebagai tidak
mempunyai alasan yang kuat.
Kesimpulan ini dapat ditunjukkan dalam gambar berikut:

Apabila kita mempergunakan pengujian 1 sisi, maka digunakan pengujian 1


sisi kiri.
H1 : < 32 ons, taraf nyata 5% 1 sisi kiri, tabel z = 1,64
Kesimpulan: -1,00 > -1,64 perbedaan tidak signifikan, maka hipotesa
diterima.

b.

Pengujian Hipotesa Terhadap Nilai Rata-Rata dengan


Sample Kecil
-

Pengujian hipotesa terhadap sampel kecil menggunakan distribusi t


dengan tabel t dan memperhatikan derajat kebebasan (degree of freedom).

1.

Apabila Deviasi Standar Populasi Diketahui

Bab 5: Pengujian Hipotesa

Hal 70 dari 148

Handout Statistik 2

Industri pesawat terbang dengan rata-rata populasi () = 11 jam dan deviasi


standar = 3,5 jam, sedang rata-rata sampel = 12 jam, besarnya sampel (n) = 9.
Pengujian hipotesa dengan taraf nyata 5% dan 2 sisi pengujian.
Pemecahan masalahnya adalah sebagai berikut:
1.

H0 : = 11 jam
H1 : 11 jam

2.

Taraf nyata 5% dengan 2 sisi pengujian, maka tabel t yang


digunakan t0,025 dengan derajat kebebasan 9-1 =8. Nilai t = 2,306.

3.

Statistik uji, distribusi t


t

x
/ n

Berdasarkan pada rumus di atas kita dapat menghitung z:


t

4.

12 11
3,5 / 9

1 / 1,67 0,6

Kesimpulan: Hasil statistik uji +0,6 adalah lebih kecil daripada


+2,306, sehingga perbedaannya tidak signifikan. Hipotesa diterima.
Kesimpulan ini dapat ditunjukkan dalam gambar berikut:

Dalam soal di atas, apabila kita menggunakan pengujian 1 sisi, maka langkahlangkah pengujian hipotesa menjadi sebagai berikut:
1.

H0 : = 11 jam
H1 : > 11 jam

2.

Taraf nyata 5% dengan 1 sisi pengujian, maka tabel t yang


digunakan t0,05 dengan derajat kebebasan 9-1 =8. Nilai t = 1,860.

3.

Kesimpulan: Hasil statistik uji +0,6 kita bandingkan dengan


+1,860, dan terlihat perbedaannya tidak signifikan. Jadi hipotesa
diterima. Kesimpulan ini dapat ditunjukkan dalam gambar berikut:

Bab 5: Pengujian Hipotesa

Hal 71 dari 148

Handout Statistik 2

2.

Apabila Standar Deviasi Populasi Tidak Diketahui


Dalam hal standar deviasi populasi tidak diketahui, maka dapat dilakukan
dengan pendekatan standar deviasi sampel yang dinotasikan dengan s,
sehingga akan berlaku rumus sebagai berikut:
t

x
s/ n

Contoh: Suatu hipotesa mengatakan bahwa keuntungan pedagang kaki lima


di kota M rata-rata setiap hari 25%. Kita ingin membuktikan kebenaran
hipotesa ini dengan mengambil sampel 9 orang pedagang kaki lima yang ada
disepanjang jalan protokol.
Hasil observasi tersebut adalah:
20%, 22%, 18%, 19%, 21%, 20%, 23%, 17%, 20%.
Dengan menggunakan taraf nyata 5%, adakah alasan untuk mendukung
kebenaran di atas?
Penyelesaian soal di atas adalah sebagai berikut:
1. H0 : = 25%
H1 : 25%
2. Taraf nyata 5% dengan 2 sisi pengujian, maka nilai t 0,025 dengan derajat
kebebasan 9-1 =8 adalah 2,306.
3. Statistik uji dengan x = 20%, s = 1,8% dan n = 9
t

/ n

0,20 0,25
0,018 / 9

0,05
8,3
0,006

4. Kesimpulan: Hasil statistik uji -8,3 adalah lebih kecil daripada -2,306,
sehingga perbedaannya signifikan. Hipotesa ditolak. Kesimpulan ini
dapat ditunjukkan dalam gambar berikut:

Bab 5: Pengujian Hipotesa

Hal 72 dari 148

Handout Statistik 2

Apabila dipergunakan pengujian 1 sisi, maka langkah pengujian hipotesanya


menjadi sebagai berikut:
1. H0 : = 25%
H1 : < 25%
2. Taraf nyata 5% dengan 1 sisi pengujian dengan sisi pengujian sebelah kiri,
maka nilai t = -1,860.
3. Statistik uji hasilnya adalah -8,3.
4. Kesimpulan: Hasil statistik uji -8,3 adalah lebih kecil dari -1,860, maka
perbedaan dikatakan signifikan. Jadi hipotesa ditolak. Kesimpulan ini
dapat ditunjukkan dalam gambar berikut:

2.

Pengujian Hipotesa terhadap Proporsi


Distribusi binomial merupakan distribusi teoritis dari proporsi. Apabila
sampel semakin besar, distribusi binomial akan menyerupai distribusi normal.
Berdasarkan hal ini kita dapat menggunakan distribusi normal dalam pendekatan
distribusi sampling.

Dalam rangka untuk menerima atau menolak hipotesa yang berupa proporsi
akan digunakan statistik uji sebagai berikut:

Bab 5: Pengujian Hipotesa

P P0
P 0 (1 P0 )
n
Hal 73 dari 148

Handout Statistik 2

Pada hakekatnya P tidak dapat diketahui dan umumnya diganti dengan x/n,
sehingga statistik ujinya menjadi sebagai berikut:

x / n P0
P 0 (1 P0 )
n

Contoh: Personalia dari suatu perusahaan akan mengadakan promosi

terhadap para karyawan yang telah mengikuti pendidikan dan latihan dalam rangka
program pengembangan karyawan. Hasil pendidikan dan latihan menyatakan bahwa
80% atau 0,80 dari para karyawan yang telah mengikuti pendidikan dan latihan
akan memenui persyarataan promosi jabatan. Dalam rangka ini bagian personalia
mengambil langkah mengadakan wawancara langsung dari 150 karyawan yang telah
mengikuti pendidikan dan latihan sebagai sampel dan ternyata hanya 70% dari
sampel yang dapat dipertimbangkan dalam promosi jabatan.
Manajer

personalia

ingin

memperoleh

keyakinan

terhadap

hipotesa

yang

mengatakan bahwa 80% dari hasil pendidikan dan latihan akan memenuhi
persyaratan promosi jabatan dengan menggunakan taraf nyata 5%.
Penyelesaian masalah tersebut adalah sebagai berikut:
1.

H0 : P = 0,8
H1 : P 0,8

2.

Taraf nyata 5% dengan 2 sisi pengujian, maka nilai z0,025 adalah 1,96.

3.

Statistik hipotesa yang uji yang digunakan adalah

4.

x / n P0
P 0 (1 P0 )
n

0,70 0,80
(0,80)(0,20)
150

0,10 / 0,0010666 0,10 / 0,03 3.3

Kesimpulan: Hasil statistik uji -3,3 adalah lebih kecil daripada -1,96,
sehingga perbedaan antara sampel dan hipotesa adalah signifikan. Jadi
mengatakan bahwa 80% dari karyawan yang mengikuti pendidikan dan latihan
memenuhi persyaratan promosi ditolak. Kesimpulan ini dapat ditunjukkan
dalam gambar berikut:

Apabila menggunakan pengujian 1 sisi, langkah-langkahnya adalah sebagai berikut:


1.

H0 : P = 0,8

Bab 5: Pengujian Hipotesa

Hal 74 dari 148

Handout Statistik 2

H1 : P < 0,8
2.

Taraf nyata 5% dengan 1 sisi pengujian dengan sisi pengujian sebelah kiri,
maka nilai z = -1,64.

3.

Statistik uji hasilnya adalah -3,3.

4.

Kesimpulan: Hasil statistik uji -3,3 adalah lebih kecil dari -1,64, maka
perbedaan dikatakan signifikan. Jadi hipotesa ditolak. Kesimpulan ini dapat
ditunjukkan dalam gambar berikut:

3.

Pengujian Hipotesa Terhadap Perbedaan 2 Nilai Rata-Rata


Dalam pengambilan keputusan kadang-kadang seorang manajer harus
menentukan apakah parameter-parameter dari 2 populasi mempunyai persamaan
atau perbedaan. Contoh, sebuah perusahaan ingin menguji apakah penerimaan gaji
karyawati lebih rendah daripada penerimaan gaji karyawan yang mengerjakan
pekerjaan yang sama.

Untuk menyelesaikan permasalahan di atas, maka digunakan distribusi


sampling perbedaan dari 2 nilai rata-rata (sampling distribution of the difference
between sample means). Dapat dijelaskan dengan gambar berikut:

Bab 5: Pengujian Hipotesa

Hal 75 dari 148

Handout Statistik 2

Dari gambar di atas jelas bahwa perbedaan 2 nilai rata-rata adalah perbedaan

antara x1 dan x 2 . Perbedaan ini akan positifif apabila x1 lebih besar dari x 2 ,
sedangkan apabila x1 lebih kecil daripada x 2 maka hasilnya negatif.
Rata-rata distribusi sampling perbedaan 2 nilai rata-rata dinotasikan dengan

x x sama dengan x x dana jika 1 2 maka x x 0 .


1

Deviasi standar dari perbedaan 2 nilai rata-rata dinotasikan dengan:

x1 x2

12 22

n1
n2

dimana:

x x = standar error perbedaan 2 nilai rata-rata


1

= standar deviasi populasi 1


= standar deviasi populasi 2

n1

= besarnya sampel dari populasi 1

n2

= besarnya sampel dari populasi 2

Bab 5: Pengujian Hipotesa

Hal 76 dari 148

Handout Statistik 2

a.

Pengujian Hipotesa terhadap Perbedaan 2 Nilai RataRata Apbila Standar Deviasi Populasi Diketahui untuk Sampel Besar
Pengujian hipotesa terhadap perbedaan 2 nilai rata-rata dengan sampel besar yaitu
apabila jumlah sampel atau n lebih dari 30. Apabila kedua standar deviasi populasi
diketahui, maka statisik uji dirumuskan sebagai berikut:

( x1 x 2 ) ( 1 2 )

12 22

n1 n2

karena 1 2 maka perumusannya menjadi:

( x1 x 2 )

12 22

n1 n2

Contoh:
Sebuah perusahaan mebel ingin membandingkan efisiensi dari 2 sistem manajemen
dalam proses pembuatan mebel.
Dalam pembuatan mebel dibedakan 2 macam proses produksi, yaitu proses
mempersiapkan bahan setengah jadi dan proses menjadikan bahan jadi (finishing).
Untuk mengadakan pengamatan diambil jumlah sampel hari kerja yang sama yaitu
40 hari.
Dari mesin yang menghasilkan proses I dihasilkan rata-rata 30 unit, sedang proses II
menghasilkan rata-rata 28 unit.
Berdasarkan pengalaman yang lalu, deviasi standar proses I = 3, sedangkan proses II
= 2. Dengan menggunakan taraf nyata 5%, dapatkah kita mengatakan bahwa kedua
proses produsi tersebut mempunyai efisiensi yang berbeda?
Penyelesaian masalah tersebut adalah sebagai berikut:
1.

H0 : 1 = 2
H1 : 1 2

2.

Taraf nyata 5% dengan 2 sisi pengujian nilai z = 1,96.

3.

Statistik uji hasilnya adalah:

4.

(30 28)
9
4

40 40

2
0,325

2 / 0,57 3,5

Kesimpulan: Hasil statistik uji 3,3 adalah lebih besar dari 1,96, maka
perbedaan dikatakan signifikan. Jadi hipotesa ditolak. Kesimpulan ini dapat
ditunjukkan dalam gambar berikut:

Bab 5: Pengujian Hipotesa

Hal 77 dari 148

Handout Statistik 2

b.

Pengujian Hipotesa terhadap Perbedaan 2 Nilai Ratarata Apabila Standar Deviasi Populasi Tidak Diketahui Untuk Sampel Besar
Menggunakan rumus sebagai berikut:

( x1 x 2 )
s12 s 22

n1 n2

Deviasi standar sampel digunakan sebagai pendekatan deviasi standar populasi.


c.

Pengujian Hipotesa terhadap Perbedaan 2 Nilai RataRata Apabila Standar Deviasi Populasi Tidak Diketahui untuk Sampel Yang Kecil
Dalam pengujian hipotesa terhadap perbedaan 2 nilai rata-rata dengan sampel kecil
maka dipergunakan distribusi t dengan memperhatikan derajat kebebasan n-1.
Statistik uji untuk pengujian hipotesa ini menjadi:

( x1 x 2 )
(n1 1) s (n 2 1) s 22
(n1 n 2 2)
2
1

1 1

n1 n2

Contoh:
Seorang manajer produksi suatu perusahaan yang menghasilkan pompa air ingin
membandingkan efisiensi waktu perakitan 2 jenis pompa tangan jenis A dan B.
Untuk pompa tangan jenis A dipilih sampel sebanyak 10 buah. Setelah diadakan
pengamatan dalam perakitannya membutuhkan waktu rata-rata 20 menit setiap unit
pompa dengan deviasi standar 3 menit. Sedangkan untuk jenis B dipilih sampel 15
unit ternyata membutuhkan waktu rata-rata untuk perakitan 21 menit dengan
deviasi standar 2 menit.

Untuk pengujian hipotesa ini ditetapkan taraf nyata 5%. Penyelesaian masalah ini
adalah sebagai berikut:
1.

H0 : 1 = 2

Bab 5: Pengujian Hipotesa

Hal 78 dari 148

Handout Statistik 2

H1 : 1 2
2.

Taraf nyata 5% dengan 2 sisi pengujian berarti t 0,025 dengan derajat


kebebasan (n1+n2-2) = 10 + 15 -2 = 23 menurut tabel t = 2,069.

3.

Statistik uji hasilnya adalah:

( 20 21)
(9)(3) (14)(2)
(10 15 2)

4.

1
1

10 15

1
81 56
23

1
6

1
(5,96)(0,17)

1 / 1,007 0,99

Kesimpulan: Hasil statistik uji -0,99 > -2,069 maka perbedaan dikatakan
tidak signifikan. Jadi hipotesa diterima. Kesimpulan ini dapat ditunjukkan dalam
gambar berikut:

4.

Pengujian Hipotesa terhadap Perbedaan 2 Proporsi


Masalah lain yang penting dalam pengujian hipotesa terhadap 2 sampel adalah
perbedaan 2 proporsi. Pada hakekatnya pengujian hipotesa terhadap perbedaan 2
proporsi sama dengan pengujian hipotesa terhadap perbedaan 2 nilai rata-rata.

Dalam pengujian hipotesa terhadap perbedaan 2 proporsi ini akan dapat dijawab
pertanyaan-pertanyaan yang muncul berkaitan dengan apakah perbedaan 2 proporsi
sampel disebabkan karena faktor kebetulan ataukah disebabkan oleh faktor-faktor
yang lain.

Contoh: Dua perusahaan minuman botol A dan B telah memutuskan untuk


mengadakan perubahan bentuk botol dalam rangka untuk meningkatkan selera para
konsumennya. Oleh karena hal itu masih merupakan suatu usaha percobaan, maka
sementara dipasarkan 2 macam produk lama dan baru.
Manajer produksi 2 perusahaan ingin meneliti tentang proporsi preferensi para
konsumen terhadap produk baru. Dari hasil penelitian ini diperoleh bahwa dari
sampel 150 konsumen, 75 di antaranya menyukai produk baru dari perusahaan A
sedang dari sampel sebanyak 200 konsumen ternyata 120 di antaranya menyukai
produk baru dari perusahaan B.
Dengan menggunakan taraf nyata 1%, dapatkah kita mengambil keputusan bahwa
pemasaran produk baru minuman botol dari kedua perusahaan itu tidak berbeda?
Masalah tersebut dapat diselesaikan dengan langkah-langkah berikut:

Bab 5: Pengujian Hipotesa

Hal 79 dari 148

Handout Statistik 2

1.

H0 : p1 - p2 = 0
H1 : p1 - p2 0

2.

Taraf nyata 1% dengan 2 sisi pengujian z = 2,58.

3.

Statistik uji hasilnya adalah:

x1 / n1 x 2 / n2
P(1 P )(1 n1 1 n 2 )

dimana
nilai

x1 x 2
n1 n 2

sehingga dengan:
x1 = 75, n1 = 150, x1/n1 = 75/150 = 0,50
x2 = 120, n1 = 200, x2/n2 = 120/200 = 0,60

75 120
195 / 350 0,56
150 200

(1-P) = 1 0,56 = 0,44


z

4.

0,50 0,60
(0,56)(0,44)(1 150 1 200)

0,10
(0,2464)(0,01167 )

0,10 / 0,054 1,852

Kesimpulan: Hasil statistik uji -1,852 > -2,58 maka perbedaan dikatakan
tidak signifikan. Jadi hipotesa diterima. Jadi tidak ada perbedaan yang besar
proporsi para konsumen yang menyukai produk baru dari perusahaan A dan B.
Kesimpulan ini dapat ditunjukkan dalam gambar berikut:

Bab 5: Pengujian Hipotesa

Hal 80 dari 148

Handout Statistik 2

6. DISTRIBUSI KAI KUADRAT (X2)

Distribusi kai kuadrat (x2) merupakan metode pengujian hipotesa terhadap


perbedaan lebih dari 2 proporsi.

Contoh, manajer pemasaran suatu perusahaan ingin mengetahui apakah


perbedaan proporsi penjualan produk baru dari perusahaannya pada 3 daerah
pemasaran yang berbeda disebabkan karena kebetulan ataukan disebabkan karena
faktor-faktor lain, sehingga preferensi terhadap produkbaru pada 3 daerah
pemasaran tersebut berbeda.

Distribusi x2 (kai kuadrat) memiliki beberapa kelemahan pada penggunaannya,


yaitu:
1. Penggunaan pengujian terhadap persesuaian frekuensi hasil observasi dengan
frekuensi teoritisnya disebut test of goodness of fit.
2. Pengujian terhadap hubungan antar-variabel disebut test of independence
3. Pengujian terhadap homogenitas suatu variabel disebut test of homogenity.

A. Distribusi Kai Kuadrat (x2) dan Ciri-Cirinya

Distribusi variabel random x1, x2, .., xn yang normal memiliki E(x) = n dan
varians (x) = 2. Variabel random normal demikian dapat diubah dalam bentuk
standar dengan rumus:
z

dimana: E(x) = =0 dan varians (x) = 2 = 1


Andaikan kita memiliki statistik,
= x12 + x22 + .. xn2
maka statistik di atas memiliki distribusi x2 dengan fungsi kepadatan.
f ( )

1
2 ( n ) / 2 ( n / 2 ) 1e (1 / 2 ) ; 0
(n / 2 1)!

f ( ) 0 bagi yang lain

dimana
n = jumlah variabel random independen yang dijumlahkan. Variabel random
independen ini memiliki derajat kebebasan sebesar n.

Tabel Kai kuadrat dapat dilihat pada lampiran. Menurut tabel tersebut apabila
derajat kebebasan = 10, dan taraf nyata (signicant level) =10% maka akan diperoleh
nilai x2 = 15,99.
Dapat digambarkan sebagai berikut:

Bab 6: Distribusi Kai Kuadrat (x2)

Hal 81 dari 148

Handout Statistik 2

Menurut gambar di atas hipotesa akan ditolak untuk semua nilai-nilai yang lebih
besar daripada 15,99. Sedangkan untuk nilai-nilai kurang dari atau sama dengan
15,99 hipotesa diterima.

Pada hakekatnya rata-rata dan varians distribusi x 2 dimana semua variabel yang
berjumlah n adalah independen dengan derajat kebebasan = n, dinyatakan dengan:
E ( x 2 ) x 2 n

Varians x2= 2x2 = 2n

Di dalam kenyataan kita jarang menjumpai variabel random yang independen


dan dalam bentuk distribusi normal dengan rata-rata nol dan varians = 1. Jika kita
memiliki

variabel

random

dengan

distribusi

normal,

kita

selalu

dapat

menstandarisir.

Andaikan kita memiliki serangkaian variabel random x 1, x2, .. xn yang normal


dengan 1, 2, n dan varians 12, 22 n2 maka variabel di atas dapat diubah ke
dalam:

zi

xi
; i = 1,2.n
i

dimana z1, z2, .. zn merupakan rangkaian variabel random yang didistribusikan


secara normal dan independen dengan rata-rata () = 0 dan varians = 1. Sehingga
dapat dikatakan
x

memiliki distribusi kai kuadrat dengan derajat kebebasan = n.

Jika x12 dan x22 independen dan memiliki distribusi x 2 dengan derajat
kebebasan sebesar n1 + n2 maka x12 + x22 akan didistribusikan sebagai x2 dengan
derajat kebebasan kebebasan sebesar n 1 + n2. Kaedah penjumlahan ini berlaku
umum bagi sejumlah k variabel x2 yang independen.

Karl Pearson beranggapan bahwa distribusi multinomial yang diskrit dapat


diubah mendekati distribusi x2 jika n mendekati tidak terhingga.

Perumusan tentang hubungan distribusi multinomial dan distribusi x 2 di atas


menjadikan distribusi x2 suatu distribusi yang penting artinya dalam analisa statistik.

Bab 6: Distribusi Kai Kuadrat (x2)

Hal 82 dari 148

Handout Statistik 2

Contoh: Misalkan probabilitas terjadinya suatu peristiwa = 1/4. Sedangkan

peristiwa tersebut terjadi sebanyak 40 kali sebagaimana disajikan dalam tabel


berikut:
Peristiwa (x)
1
2
3
4
Jumlah

N
8
11
12
9
40

Dari tabel di atas p = 1/4 dan n =40. Distribusi bersama (joint distribution) n1, n2, n3
dan n4 disebut distribusi multinomial dengan fungsi kepadatan (density function):
f ( n1 ,n2 ,n2 ,n4 )

n!
n
n
n
n
p1 1 p 2 2 p3 3 p 4 4
n1 ! n 2 ! n3 ! n 4 !

Karl Pearson mengungkapkan, jika

xi

ni npi
np i

2
2
2
2
dan jika x1 x 2 x3 x4

maka distribusi akan mendekati distribusi x2 dengan derajat kebebasan sebesar 4


1 = 3 jika n menjadi semakin besar.
Berapa besar n yang dibutuhan agar secara aproksimatif mendekati distribusi x 2?
Jika npi > 5 maka kita dapat menggunakan distribusi x2 sebagai pendekatan. Jika npi
< 5 kelompok atau kategori yang terlampau kecil harus digabung agar np i > 5 dapat
dipenuhi.
B. Penggunaan Distribusi Kai Kuadrat
1.

Pengujian tentang Kompabilitas (Test of Goodness of Fit)

Dalam pengujian tentang kompabilitas, persoalan yang kita hadapi adalah


menguji apakah frekuensi yang diobservasi memang konsisten dengan frekuensi
teoritisnya. Apabila konsisten atau tidak terdapat perbedaan yang nyata atau
signifikan, maka hipotesa dapat diterima. Sebaliknya apabila tidak terdapat
konsistensi, maka hipotesa ditolak artinya hipotesa teoritisnya tidak didukung
oleh hasil observasinya.

Perkiraan Pearson dirumuskan sebagai berikut:

x2

(ni npi ) 2
npi

dapat pula secara skematis ditulis sebagai berikut:

x2

(Oi E i ) 2
Ei

atau

( fo fe )2
f
e

dengan derajat kebebasan sebesar k 1

dimana
Bab 6: Distribusi Kai Kuadrat (x2)

Hal 83 dari 148

Handout Statistik 2

Oi

= Frekuensi observasi (fo)

Ei

= Frekuensi teoritis (fe)

x2 merupakan ukuran perbedaan antara frekuensi observasi dengan frekuensi


teoritis, apabila tidak ada perbedaan antara frekuensi observasi dengan frekuensi
teoritis, maka x2 = 0.

Semakin besar perbedaan antara frekuensi observasi dengan frekuensi teoritis


maka nilai x2 akan menjadi besar.

Nilai x2 akan dievaluasi dengan distribusi kai kuadrat. Prosedur pengujian


hipotesa dilakukan dengan langkah-langkah sebagai berikut:

a.

nyatakan hipotesa nol dan hipotesa alternatifnya

b.

tentukan taraf nyata dan derajat kebebasannya

c.

tentukan statistik uji x2 .

d.

pengambilan keputusan

Contoh: Sebuah lembaga manajemen ingin mengetahui pola konsumsi terhadap


5 macam merk ban mobil yang dominan di dalam pemasaran ban. Untuk
keperluan ini dipilih 1000 orang konsumen.
Dari hasil observasi yang dilakukan terhadap sampel ini, diperoleh informasi
sebagai berikut:
Preferensi Merk Ban
A
B
C
D
E
Jumlah

Jumlah Konsumen
210
310
170
85
225
1000

Apabila proporsi preferensi konsumen untuk setiap merk ban dinyatakan dengan
PA, PB, PC, PD, PE, kita dapat merumuskan hipotesa nol dan hipotesa alternatifnya
sebagai berikut:
a. H0 : PA = PB = PC = PD = PE = 0,20
H1 : PA PB PC PD PE 0,20
b. Taraf nyata 5% dengan derajat kebebasan k -1 = 5 -1 = 4. Menurut tabel, x 2
= 9,488.
c. Statistik uji yang dipergunakan adalah sebagai berikut:

x2

( fo fe )2
fe

Prefensi

Frekuensi

Frekuensi

Konsumsi

Observasi

Teoritis

Bab 6: Distribusi Kai Kuadrat (x2)

(fo-fe)

(fo-fe)2

(f0-fe)2
fe

Hal 84 dari 148

Handout Statistik 2

Ban
A
B
C
D
E
Jumlah

(fo)
210
310
170
85
225
1000

(fe)
200
200
200
200
200
1000

10
110
-30
-115
25
0

100
12100
900
13225
625
26950

x2

0,500
60,500
4,500
66,125
3,125
134,750

( fo fe )2
= 134,750
fe

d. Kesimpulan:
Hasil statistik uji x2 = 134,750 lebih besar daripada 9,488. Berarti ada
perbedaan yang significant antara frekuensi hasil observasi dengan
frekuensi teoritis, sehingga hipotesa yang mengatakan bahwa tidak ada
perbedaan proporsi konsumsi ban untuk ke-5 merk ditolak (H 0 ditolak).
Jelasnya dapat dilihat dengan gambar berikut:

2.

Pengujian Sifat Independensi (Test of Independence)

Pengujian

kompabilitas

digunakan

jika data

populasi maupun sampel

diklasifikasikan menurut satu atribut tunggal (single atribute) maupun jika kita
ingin menguji distribusi probabilitas populasi hipotesis.

Apabila klasifikasi data sampel maupun data populasi dalam beberapa atribut
sedang distribusi probabilitasnya tidak diketahui, maka pengujian kompabilitas
sulit digunakan. Misalkan setiap konsumen dapat diklasifikasikan menurut
penghasilannya dan kualitas sabun mandi yang dipergunakan, sedang proporsi
tiap golongan dalam populasi tidak diketahui. Persoalan yang ingin diketahui
adalah apakah ada hubungan antara penghasilan dan kualitas sabun mandi yang
dipergunakan. Pengujian yang demikian disebut pengujian sifat independensi.

Dalam pengujian hipotesa ini kita hanya sampai pada kesimpulan apakah kedua
atribut tersebut mempunyai sifat independen atau tidak.

a.

Populasi Tabel Dwikasta


Populasi

yang

terdiri

dari

keluarga

konsumen

sabun

mandi

dapat

diklasifikasikan menurut tingkat penghasilannya dan jenis sabun mandi yang

Bab 6: Distribusi Kai Kuadrat (x2)

Hal 85 dari 148

Handout Statistik 2

digunakannya. Klasifikasi ini dapat disajikan dalam tabel dwikasta sebagai


berikut:

Penghasilan
Tinggi (A1)
Rendah (A2)
Jumlah Kolom (Nj)

Kualitas Sabun Mandi


Baik (B1)
Rendah (B2)
N11
N12
N21
N22
N.1
N.2

Jenis Baris
(Ni)
N1
N2
N

Keterangan:
N

= Jumlah seluruh unsur populasi

N11

= Jumlah konsumen yang penghasilanya tinggi (A) dan menggunakan


sabun mandi kualitas baik (B1)

N1

= Penjunlahan baris 1

N.1

= Penjumlahan Kolom 1

= Indeks baris

= Indeks kolom

Apabila dinyatakan dalam bentuk proporsi maka tabelnya menjadi sebagai


berikut:
Penghasilan
Tinggi (A1)
Rendah (A2)
Jumlah Kolom (Nj)

Kualitas Sabun Mandi


Baik (B1)
Rendah (B2)
N11/N = P11
N12/N = P12
N21/N = P21
N22/N = P22
P.1
P.2

Jenis Baris
(Ni)
P1
P2
1,0

Keterangan:
P11

= Proporsi populasi yang mempunyai penghasilan tinggi yang


menggunakan sabun mandi kualitas baik

P.1 + P.2

= N.1/N + N.2/N = 1

P1 +P2

= N1/N + N2/N = 1

= Proporsi Populasi yang tidak diketahui

b.

Sampel dan Tabel Dwikasta


Random sampel sebesar n yagn dipilih dari populasi yang diklasifikasikan
menurut tingkat penghasilan dan kualitas sabun mandi yang dipergunakan.

Hasilnya dapat disajikan dalam tabel ini.


Penghasilan
Tinggi (A1)
Bab 6: Distribusi Kai Kuadrat (x2)

Kualitas Sabun Mandi


Baik (B1)
Rendah (B2)
n11
n12

Jenis Baris
(ni)
n1
Hal 86 dari 148

Handout Statistik 2

Rendah (A2)
Jumlah Kolom (Nj)

n21
n.1

n22
n.2

n2
n

Misalkan sebuah sampel sebesar n = 300 yang dipilih dari populasi, ternyata
yang berpenghasilan tinggi n1 = 100, n2 = 200, n.1 = 150 dan n.2 = 150, dan jika
kelompok

yang

berpenghasilan

tinggi

sejumlah

40

orang

ternyata

mempergunakan sabun mandi kualitas yang baik, maka dengan sendirinya


kelompok yang mempergunakan sabun mandi kualitas rendah adalah 60 orang.
Sedangkan kelompok yang berpenghasilan rendah akan mempergunakan sabun
mandi kualitas baik 110 dan kualitas rendah 90. Maka tabel dwikastanya
menjadi:
Kualitas Sabun Mandi
Baik (B1)
Rendah (B2)
40
60
110
90
n.1 = 150
n.2 = 150

Penghasilan
Tinggi (A1)
Rendah (A2)
Jumlah Kolom (Nj)

Jenis Baris
(ni)
n1 = 100
n2= 200
300

Selanjutnya untuk masing-masing baris dan kolom dapat dihitung frekuensi


teoritisnya.
Baris 1 kolom 1, fe = n1 x (n.1/n) = 100 x 150/300 = 50
Baris 1 kolom 2, fe = n1 x (n.2/n) = 100 x 150/300 = 50
Baris 2 kolom 1, fe = n2 x (n.1/n) = 200 x 150/300 = 100
Baris 2 kolom 2, fe = n2 x (n.2/n) = 200 x 150/300 = 100
Kualitas Sabun Mandi
Baik (B1)
Rendah (B2)
Fo
fe
fo
fe
40
(50)
60
(50)
110
(100)
90
(100)
150
(150)
150
(150)

Penghasilan
Tinggi (A1)
Rendah (A2)
Jumlah Kolom (Nj)

Jenis Baris
(ni)
100
200
300

Prosedur pengujian hipotesa dilakukan dengan langkah-langkah:


H0 : Ada hubungan antara tingkat penghasilan dan kualitas sabun
mandi yang digunakan
H1 : Tidak ada hubungan antara tingkat penghasilan dan kualitas sabun
mandi yang digunakan
a.

Taraf nyata 5% dengan derajat kebebasan (r-1) (c-1) = (2-1) (2-1) = 1.


Menurut tabel, x2 = 3,841.

b.

Statistik uji yang dipergunakan adalah sebagai berikut:

x2
x2
c.

( fo fe )2
fe

40 50 2
50

(60 50) 2 (110 100) 2 (90 100) 2

6
50
100
100

Kesimpulan:
Hasil statistik uji = 6 adalah lebih besar daripada 3,841. Berarti perbedaanya
signifikan atau cukup besar, sehingga hipotesa ditolak. Yang berarti bahwa

Bab 6: Distribusi Kai Kuadrat (x2)

Hal 87 dari 148

Handout Statistik 2

tidak ada hubungan antara tingkat penghasilan dengan sabun mandi yang
dipergunakan.

3.

Pengujian terhadap Sifat Homogenitas (Test of Homogenity)

Dalam pengujian hipotesa kita kadang-kadang dihadapkan pada suatu masalah


apakah 2 sampel lebih berasal dari satu populasi atau dengan perkataan lain
apakah satu sampel dengan sampel lain mempunyai persamaan.

Pengujian untuk mengetahui apakah 2 sampel atau lebih bersifat homogen atau
sama disebut pengujian sifat homogenitas atau test of homogenity.
Sample ALTA
Sampel 1
Sampel 2
10
10
20
10
30
40
20
30
20
10
n1 = 100
n2 = 100

Nilai
A
B
C
D
F

Jumlah
20
30
70
50
30
n = 200

Suatu penelitian terhadap hasil seleksi perguruan tinggi terhadap 2 sampel


sekolah lanjutan tingkat atas yang masing-masing dengan sampel sebesar 100,
menunjukkan hasil nilai seleksi sebagai berikut:
a.

Hipotesa nol dapat dirumuskan kedua sampel di atas


mempunyai distribusi probabilitas yang sama yaitu distribusi probabilitas
dari populasi.
Hipotesa alternatifnya menyatakan bahwa kedua sampel tersebut tidak
memiliki distribusi probabilitas yang sama.

b.

Taraf nyata 5% dengan derajat kebebasan (5-1) (2-1) =


4. Menurut tabel x = 9,49
2

Statistik uji yang dipergunakan adalah x2.

c.

Sebelum kita menghitung nilai x2, kita menghitung frekuensi teoritisnya lebih
dahulu dan membandingkannya dengan frekuensi observasinya.
fe 11 = n1 x (n1/n) = 100 x 20/300 = 10
fe 21 = n1 x (n1/n) = 100 x 30/300 = 15
fe 31 = n2 x (n1/n) = 100 x 70/300 = 35
Bab 6: Distribusi Kai Kuadrat (x2)

Hal 88 dari 148

Handout Statistik 2

fe 41 = n2 x (n1/n) = 100 x 50/300 = 25


fe 51 = n2 x (n1/n) = 100 x 30/300 = 15
Untuk nilai fe 21, fe 22, fe 23, fe 24 dan fe 25 nilainya sama dengan di atas.
Nilai
A
B
C
D
F

Sample ALTA
Sampel 1
Sampel 2
fo

Fe

fo

fe

10
20
30
20
20

(10)
(15)
(35)
(25)
(15)

10
10
40
30
10

(10)
(15)
(35)
(25)
(15)

Sampel 1

Sampel 2

(fo f2)2

(fo f2)

fe
0/10 = 0
25/15 = 1,6
25/35 = 0,7
25/25 = 1
25/15 = 1,6

fe
0/10 = 0
25/15 = 1,6
25/35 = 0,7
25/25 = 1
25/15 = 1,6

Jumlah
()
0
3,2
1,4
2,0
3,2

x2 = 9,8
d.

Kesimpulan:
Hasil statistik uji 9,8 lebih besar daripada 9,48. Berarti ada perbedaan yang
signifikan sehingga hipotesa ditolak. Dapat dijelaskan dalam gambar berikut:

Bab 6: Distribusi Kai Kuadrat (x2)

Hal 89 dari 148

Handout Statistik 2

7. ANALISA VARIANS
Pembahasan sebelumnya menyatakan bahwa distribusi kai kuadrat (x 2)

merupakan pengujian hipotesa untuk mengetahui perbedaan lebih dari 2 proporsi,


sehingga kita dapat mengambil keputusan apakah sampel tersebut berasal dari
populasi yang memiliki proporsi yang sama.
Suatu metode pengujian hipotesa yang dapat digunakan untuk mengadakan

pengujian terhadap lebih dari 2 rata-rata sampel disebut Analisa Varians


Dengan menggunakan analisa varians kita akan dapat mengambil suatu

kesimpulan apakah sampel tersebut berasal dari populasi yang memiliki nilai ratarata yang sama.
Contoh: analisa varians dapat digunakan untuk membandingkan daya tahan 4

macam

produksi

ban.

Membandingkan

macam

metode

latihan

yang

diselenggarakan oleh suatu perusahaan dalam rangka peningkatan karir para


karyawannya.
Analisa varians selanjutnya dikenal sebagai distribusi F yang dikembangkan oleh

RA Fisher pada tahun 1920.


A. Perumusan Masalah
Manajer pendidikan dan latihan suatu perusahaan perakitan radio kaset ingin

mengadakan evaluasi terhadap 3 metode pendidikan dan latihan bagi karyawankaryawannya yang baru.
Ada 3 macam metode pendidikan dan latihan sebagai berikut:

1.

Pendidikan dan latihan terhadap para karyawan yang baru dengan


cara mendidik dan melatih secara individual di dalam perusahaan.

2.

Mendidik masing-masing karyawan baru secara individual dan


terpisah dengan bimbingan pelatih

3.

Mendidik dan melatih para karyawan baru dengan metode audio


visual, film dengan belajar mandiri.

Setelah pendidikan dan latihan dapat diselesaikan, manajer produksi bersama


dengan manajer pendidikan dan latihan mengadakan evaluasi terhadap hasilnya.

Untuk keperluan penelitian ini dipilih sampel 5 orang karyawan yang telah
mengikuti masing-masing metode dan dilakukan pencatatan terhadap hasil produksi
setiap hari yang dapat diselesaikan oleh masing-masing karyawan tersebut seperti
disajikan dalam tabel berikut:

Bab 7: Analisa Varians

Hal 90 dari 148

Handout Statistik 2

Metode I
15
18
19
22
11
= 85
x1 = 17

Metode II
22
27
18
21
17
= 105
x 2 = 21

Metode III
18
24
16
22
15
= 95
x 3 = 19

B. Perumusan Hipotesa
Metode analisa varians dipergunakan untuk mengetahui apakah rata-rata dari 3

sampel karyawan yang telah mengikuti pendidikan dan latihan dengan metode yang
berbeda ini mempunyai perbedaan dalam produktifitas ataukah tidak. Dengan kata
lain dapat dikatakan apakah 3 sampel yang masing-masing berupa rata-rata sampel
I, II dan III bersifat dari populasi yang sama.
Perumusan hipotesa nol:

H0 : 1 = 2 = 3
H1 : 1 2 3
Apabila di dalam pengujian hipotesa ini 3 rata-rata sampel sama, kita sampai

pada kesimpulan bahwa 3 macam metode pendidikan dan latihan ini tidak
mempengaruhi produktivitas karyawan.
Sebaliknya apabila ke-3 rata-rata sampel tersebut menunjukkan perbedaan yang

nyata atau berarti signifikan, maka berarti ketiga macam metode pendidikan dan
latihan tersebut mempengaruhi produktivitas karyawan, sehingga perlu adanya
peninjauan kembali terhadap ketiga macam metode pendidikan dan latihan tersebut.
C. Konsep Dasar Analisa Varians
Di dalam analisa varians kita selalu beranggapan bahwa sampel yang dipilih

berasal dari populasi yang normal dengan varians yang sama, kecuali jika sampel
yang dipilih cukup besar, maka anggapan tentang distribusi normal ini tidak
diperlukan.
Di dalam penelaahan 3 macam metode pendidikan dan latihan ini hipotesa nol

merumuskan bahwa ketiga populasi ini mempunyai nilai rata-rata yang sama.
Apabila hipotesa ini benar, maka klasifikasi dalam 3 macam metode dalam tabel di
atas tidak perlu karena semua sampel berasal dari satu populasi.
Analisa varians berdasarkan pada perbandingan 2 macam nilai penduga

terhadap varians populasi (2). 2 nilai penduga varians populasi tersebut adalah:
a.

Varians antar sampel (variance among the sample


means)
Varians antar sampel ini selanjutnya dinotasikan dengan S a2. Dalam contoh di
atas, varians antar sampel adalah varians di antara nilai rata-rata sampel 1 = 17,
rata-rata sampel 2 =17 dan rata-rata sampel 3 = 19.

Bab 7: Analisa Varians

Hal 91 dari 148

Handout Statistik 2

b.

Varians dalam sampel (variance within the sample


means)
Varians dalam sampel adalah varians di dalam ketiga sampel. Dalam contoh yang
dimaksud dengan varians dalam sampel adalah dari data (15, 18,19,22,11),
(22,27,18,21,17) dan (18,24,16,22,15). Varians dalam sampel ini dinotasikan
dengan Sw2.

Perbandingan 2 nilai varians tersebut merupakan penduga terhadap varians


populasi. Apabila nilai penduga ini sama atau mendekati sama, maka hipotesa benar.
Sebaliknya apabila kedua nilai perbandingan ini berbeda dengan varians
populasinya, maka hipotesanya keliru.

Kita dapat menyimpulkan ketiga langkah dalam analisa varians tersebut sebagai
berikut:
1. Tentukan penduga pertama dari varians populasi dari varians antar sampel
2. Tentukan penduga kedua terhadap varians populasi dari varians dalam sampel
3. Bandingkan kedua nilai penduga ini. Jika hasilnya mendekati sama atau hampir
sama berarti hipotesanya benar.

D. Cara Perhitungan Varians Antar Sampel


Langkah pertama dalam analisa varians adalah menghitung penduga

pertama varians populasi dari varians antar sampel. Dalam contoh ada 3 sampel,
varians antar sampel di dalam istilah statistik disebut pula sebagai between column
sample (varians antar kolom).
Rumus varians sampel adalah sebagai berikut:

(x x)

n 1

Karena kita menghitung 3 nilai rata-rata sampel dan rata-rata

keseluruhan, maka selanjutnya x diganti dengan x dan x diganti dengan x (ratarata keseluruhan/rata-rata dari rata-rata).
Varians antar sampel dirumuskan sebagai berikut:

S a2

(x x )

n 1

n di sini adalah 3 sampel atau 3 kolom.


Perhitungan data menjadi sebagai berikut:

x
19
19
19

17
21
19
S a2

(x -x )
-2
2
0

( x - x )2
4
4
0
( x - x )2=8

8
4
(3 1)

Bertolak pada rumus standard error of mean atau standar error yagn
dirumuskan dengan:

Bab 7: Analisa Varians

Hal 92 dari 148

Handout Statistik 2

= standard error of mean

= standar deviasi populasi


n

= besarnya sampel, dalam contoh ini 5 dan bukan 3.

Rumus ini dapat ditulis:


x n

atau

2 x n

Karena nilai standard error of mean tidak dimiliki, maka nilai ini diganti dengan
standar deviasi antar sampel sebagai penduga pertama dari varians populasi.
Perumusan varians populasi yang diduga menjadi:
2

2 Sa n
2
dimana S a 4 dan n = 5,sehingga:

2 = 4 x 5 =20
E. Cara Perhitungan Varians Dalam Sampel
Penduga varians populasi yang kedua adalah varians dalam sampel.

Varians ini disebut juga within column variance.


Kita mempunyai anggapan bahwa varians dari ketiga populasi sama. Oleh

sebab itu, kita dapat menggunakan salah satu varians sampel sebagai penduga
varians populasi yang kedua.
Penduga terhadap varians populasi ini akan menjadi lebih tepat apabila

kita menggunakan ketiga varians sampel ini sebagai penduga yang kedua.
Varians dalam sampel dirumuskan dengan:

S w2

S12 S 22 ..... S n2
n

Sw2 = Varians dalam sampel


S12 ++ Sn2= varians sampel 1 sampai ke-n
n

= banyaknya sampel/banyaknya kolom

Perhitungan varians dalam sampel dapat dilihat pada tabel berikut:

Bab 7: Analisa Varians

Hal 93 dari 148

Handout Statistik 2

Metode I

Metode II

Metode III

Rata-rata sampel = 17

Rata-rata sampel = 21

Rata-rata sampel = 19

x1 )

( x x1 ) ( x x1 ) 2

X
15
18
19
22
11

-2
1
2
5
-6

x1 =17
=70

S12

4
1
4
25
36
(x

x1 ) 2

(x x )

22
27
18
21
17

1
6
-3
0
4

x2 =21
62

n 1

S12 = 70/(5-1) = 70/4 = 17,5

S w2

( x x1 ) ( x x1 ) 2

( x3 )

x2 )

S 22

1
36
9
0
16
(x

x1 ) 2 =

(x x
n 1

( x x1 ) ( x x1 ) 2

X
18
24
16
22
15

-1
5
-3
3
-4

x 3 =19

(x

60
2

S22 = 62/(5-1) = 62/4 = 15,5

1
25
9
9
16

S2

x1 ) 2 =

(x x )

n 1

S32 = 60/(5-1) = 60/4 = 15

S12 S 22 S 32 17,5 15,5 15 48

16 (penduga kedua varians populasi)


3
3
3

F. Pengujian Statistik F

Statistik F selanjutnya disingkat F merupakan rasio dari varians antar


sampel sebagai penduga varians populasi yang pertama dengan varians dalam
sampel sebagai penduga populasi yang kedua, selanjutnya dirumuskan:

S a2
S w2

Sehingga dengan data dalam contoh didapat F = 20/16 = 1,25

Pembilang, dalam hal ini varians antar sampel sebagai penduga varians
populasi merupakan penduga yang baik. Penyebut dalam hal ini varians dalam
sampel sebagai penduga varians populasi merupakan penduga yang baik pula.
Dengan demikian apabila hipotesanya benar, maka nilai pembilang dan penyebut
akan cenderung sama.

Jika nilai F semakin mendekati 1, semakin besar kemungkinan hipotesa


nol dapat diterima. Sebaliknya apabila nilai F besar, semakin besar kemungkinan
hipotesa nol ditolak dan semakin besar kemungkinan hipotesa alternatif diterima.

G. Distribusi F

Distribusi F ditandai dengan 2 macam derajat kebebasan, yaitu derajat


kebebasan dari pembilang dan derajat kebebasan dari penyebut. Bentuk dari
distribusi F sangat ditentukan oleh 2 nilai derajat kebebasan ini.

Bentuk umum dari kurva distribusi F adalah condong ke kanan dan akan
cenderung menjadi bentuk normal atau simetris apabila derajat kebebasan dari
pembilang dan penyebut semakin besar.

Bentuk ketiga macam kurva distribusi F dapat disajikan dalam gambar berikut:

Bab 7: Analisa Varians

Hal 94 dari 148

Handout Statistik 2

Dari gambar di atas dapat dilihat bahwa semakin besar derajat kebebasan dari

pembilang dan penyebut, maka bentuk kurva akan mendekati suatu bentuk kurva
normal atau kurva yang simetris.
H. Derajat Kebebasan dari Distribusi F
Distribusi F mempunyai 2 macam derajat kebebasan, yaitu derajat kebebasan

pembilang dan derajat kebebasan penyebut.


1.

Derajat kebebasan Pembilang (numerator)

Dalam menghitung varians antar sampel (Sa2) dalam contoh didasarkan pada 3
nilai varians sampel untuk memperoleh ( x x ) 2 untuk memperoleh ( x x ) 2 .

Apabila kita dapat mengetahui kedua nilai ( x x ) 2 maka untuk menilai yang
ketiga secara otomatis dapat diketahui/ditentukan sehingga kita mengatakan
kehilangan 1 derajat kebebasan dari jumlah sampel (jumlah kolom).

Dari penjelasan ini dapat dirumuskan:


Derajat kebebasan pembilang = (jumlah sampel 1)
atau
Derajat kebebasan pembilang = n 1
Dimana n juga dipakai k (kolom)

2.

Derajat kebebasan Penyebut (Denominator)

Di dalam perhitungan varians dalam sampel, kita menggunakan semua nilai


sampel, dalam menghitung ( x x ) 2 kita menggunakan 5 nilai ( x x ) .

Apabila kita mengetahui 4 nilai ( x x ) maka nilai yang kelima secara


otomatis dapat dihitung/ditentukan. Sehingga kita kehilangan 1 derajat
kebebasan untuk setiap sampel. Karena ada 3 sampel, maka kita hanya
mempunyai 4 x 3 = 12 derajat kebebasan.

Hal ini dapat dirumuskan sebagai berikut:

Bab 7: Analisa Varians

Hal 95 dari 148

Handout Statistik 2

Derajat kebebasan penyebut = (jumlah data setiap sampel 1) (jumlah sampel)


Derajat kebebasan penyebut = (n-1) x k
Dalam contoh n=5 dan k=3 sehingga derajat kebebasan penyebut = (5 -1) x 3 =12.
I. Cara Mempergunakan Tabel F

Guna pengujian hipotesa dengan distribusi F kita mempergunakan Tabel F.


Dalam tabel F, kolom menunjukkan derajat kebebasan dari pembilang dan pada
baris menunjukkan derajat kebebasan untuk penyebut.

Tabel F akan berbeda untuk setiap taraf nyata.

Contoh: pada taraf nyata 5%, dengan derajat kebebasan pembilang = 2 dan
derajat kebebasan penyebut = 12, maka tabel F = 3,89.

J. Kesimpulan dari Pengujian Hipotesa

Dalam pengujian hipotesa terhadap 3 macam metode pendidikan dan latihan


telah diperoleh hasil statistik uji dari distribusi F = 1,25. Hasil ini kita bandingkan
dengan nilai tabel = 3,89. Karena hasil statistik uji lebih kecil maka perbedaan
dikatakan tidak nyata sehingga hipotesa dapat diterima.

Dapat dijelaskan dalam gambar berikut:

Karena statistik uji F = 1,25 terletak pada daerah penerimaan, maka hipotesa
diterima. Kita dapat menarik kesimpulan bahwa ketiga metode pendidikan dan
latihan tersebut tidak menimbulkan perbedaan dalam produktivitas tenaga kerja.

K. Pengujian Hipotesa dengan Distribusi F Apabila Sampel Tidak Sama

Sebuah perusahaan pakaian jadi yang besar menerima pesanan berupa produk
baru dalam jumlah yang besar, sehingga diputuskan akan ditunjuk alternatif 5 subkontraktor, yang masing-masing perusahaan sub-kontraktor ini menggunakan 400
orang tenaga kerja. Perusahaan kontraktor sangat menaruh perhatian terhadap
masalah tenaga kerja, sehingga dilakukan penelitian terhadap tingkat absensi para
karyawan pada kelima perusahaan sub-kontraktor selama beberapa hari kerja.
Penelitian ini dimaksudkan untuk mengetahui apakah tingkat persentase absensi

Bab 7: Analisa Varians

Hal 96 dari 148

Handout Statistik 2

pada kelima perusahaan sub-kontraktor itu sama atau berbeda, dengan taraf nyata
5%.
Dari hasil pengumpulan data absensi karyawan pada kelima perusahaan sub-

kontraktor diperoleh data sebagai berikut (dalam persentase):


Perusahaan
A
B
C
D
E

Persentase absensi berdasar sampel hari kerja


9
10
11
7
6
8
7
7
7
9
8
5
7
10

8
7
8
6
11

sampel
6
5
4
3
2

Penyelesaian masalah ini dilakukan dengan langkah-langkah berikut:

H0 : 1 = 2 = 3 = 4 = 5

a.
H1 : 1 2 3 4 5
b.

Statistik uji distribusi F didasarkan pada perhitungan:


1.

varians antar sampel (Sa2)


Rata-rata ( x )
A=9
B=7
C=8
D=6
E = 10,5

x -x

8
8
8
8
8

1
-1
0
-2
2,5

x -x

)2

1
1
0
4
6,25
- x )2 =12,25

2
a

S = 12,25/4 = 3,06

(9 6) (7 5) (8 4) (6 3) (10,5 2)
x
160 / 20 8
65 43 2

Varians antar sampel dengan hasil 3,06 adalah penduga pertama terhadap
varians populasi. Pada sampel yang tidak sama pernduga pertama ini tidak
dikalikan dengan n (besarnya sampel) lagi karena pada perhitungan rata-rata
keseluruhan sudah digunakan faktor penimbang.

2.

Varians dalam Sampel (Sw2)


Perhitungan varians dalam sampel adalah sebagai berikut:

Perusahaan A
Rata-rata: 9

Bab 7: Analisa Varians

Perusahaan B
Rata-rata: 7

Perusahaan C
Rata-rata: 8

Perusahaan D
Rata-rata: 6

Hal 97 dari 148

Perusahaan E
Rata-rata: 10

Handout Statistik 2

n1 = 6

n2 = 5

n3 = 4

n4 = 3

n5 = 2

(x x) (x x)2

(x x) (x x)2

(x x) (x x)2

(x x) (x x)2

(x x) (x x)2

-1
0
1
2
-2
0

1
0
1
4
4
0
= 10
S12 = 10/(6-1) = 2

0
-1
1
0
0

0
1
1
0
0

=2
S22 = 2/(5-1) = 0,5

S w2
3.

0
-1
1
0

0
1
1
0

=2
S32 = 2/(4-1) = 0,67

0
-1
1

0
1
1

=2
S42 = 2/(3-1) = 1

2 0,5 0,67 1 0,5 4,67

0,934
5
5

0,5
-0,5

= 0,5
S52 = 0,5/(2-1) = 0,5

Nilai F
Nilai F merupakan rasio dari kedua penduga parameter (varians populasi) =
3,06/0,934 = 3,28.
Taraf nyata 5% dengan derajat kebebasan pembilang = 5 1 = 4. Derajat
kebebasan penyebut = (6-1) + (5-1) + (4-1) + (3-1) + (2-1) = 15.
Tabel F = 3,06.

c.

Kesimpulan:
Hasil statistik uji

= 3,28 lebih besar daripada 3,06 (f tabel) berarti ada

perbedaan yang nyata sehingga hipotesa ditolak. Artinya persentase absensi pada
masing-masing perusahaan sub-kontraktor tidak sama.

L. Analisa Varians dengan 2 Klasifikasi (Two way Anova)


Kita ingin mengetahui variasi yang timbul dengan adanya media promosi yang

berbeda dari berbagai macam komoditi dagangan. 2 klasifikasi ini meliputi


klasifikasi macam media promosi di satu pihak dan klasifikasi macam komoditi
dagangan dipihak lain.
Dalam pengamatan ini akan diteliti:

a.

Bab 7: Analisa Varians

0,25
0,25

apakah ada perbedaan 3 macam media promosi?


Hal 98 dari 148

Handout Statistik 2

b.

apakah ada pengaruh dalam pengelompokan macam


komoditi dagangan?
Hasil penelitian tentang media promosi dan macam komoditi dagangan dapat

dilihat dalam tabel berikut:


Macam

Macam Media Promosi

Komoditi
Dagangan
A
B
C
Jumlah

Radio

TV

Surat Kabar

24
23
25
72

19
17
21
57

20
14
17
51

Jumlah
63
54
63
180

3 macam komoditi dagangan dipromosikan dengan 3 media promosi yang

berbeda yaitu media radio, TV dan Surat kabar. Dengan menggunakan taraf nyata
5%, ujilah:
a.

Apakah efektifitas ketiga media promosi itu sama?

b.

Apakah pengelompokan menjadi 3 macam komoditi dagangan


itu tidak ada pengaruhnya?

Dalam uji hipotesa ini kita mempunyai 2 macam hipotesa yaitu:


a. H0 : 1 = 2 = 3 =
H1 : 1 2 3 (hipotesa berdasar baris/macam komoditi)
b. H0 : .1 = .2 = .3 =
H1 : .1 .2 .3 (hipotesa berdasar kolom/media promosi)

Beberapa notasi yang digunakan adalah:


SSR

= jumlah kuadrat baris

SSC

= jumlah kuadrat kolom

SSE

= jumlah kuadrat penyimpangan

SST

= total dari jumlah kuadrat

MSS

= rata-rata dari jumlah kuadrat

MSSR

= varians berdasar baris

MSSC

= varians berdasar kolom

MSSE

= varians berdasar penyimpangan

Tabel Anova dapat disusun sebagai berikut:


Varians
Baris (b)

Jumlah

Derajat

Kuadrat (SS)

kebebasan (df)

SSR

(b-1)

Bab 7: Analisa Varians

Rata-rata jumlah kuadrat (MSS)

S12

SSR
MSSR
b 1

Hal 99 dari 148

S12
S 32

Handout Statistik 2

Kolom (k)
Penyimpangan
(error)
Jumlah

SSC

(k-1)

SSE

(b-1) (k-1)

SST

(b-1) (k-1)

S 22
S 32

SSC
MSSC
k 1

S 22
S 32

SSE
MSSE
(b 1)(k 1)

SSE = SST SSR - SSC

Selanjutnya penggunaan tabel F disesuaikan degnan taraf nyata yang dipilih.

Berdasar pada data dapat dihitung sebagai berikut:


1.

SST xi . j
2

i 1 j 1

(Ti. j ) 2
b.k

SST = (24)2+(23)2+ (25)2+ (19)2+(17)2+(21)2+(20)2+(14)2+(17)2 (180)2/(3x3)


SST = 3706 3600 = 106
2
(Ti ) 2 (Ti. j )
2. SSR

k
b.k
i 1
b

SSR

63 2 54 2 63 2
180 2

3618 3600 18
3
(3 3)
k

3. SSC

(T j ) 2

j 1

SSC

(Ti. j ) 2
b.k

72 2 57 2 512 180 2

3678 3600 78
3
(3 3)

MSSC

SSC
78 / 2 39
k 1

SSE = SST SSR SSC = 106 -18 -78 = 10


MSSE

SSE
10 / 4 2,5
(b 1)( k 1)

Fb = 9/4 = 2,25 F0,05 df 2/4 nilai tabel 6,94 (efek baris)


Fk = 39/4 = 9,75 F0,05 df 2/4 nilai tabel 6,94 (efek kolom)
Kesimpulan:

1.

Pengujian efek baris : 2,25 < 6,94. Perbedaan tidak nyata, hipotesa nol
diterima. Artinya pengelompokan macam komoditi dagangan tidak ada
pengaruhnya.

2.

Pengujian efek kolom: 9,75 > 6,94. Perbedaan nyata, hipotesa nol ditolak.
Artinya perbedaan macam media promosi memiliki pengaruh yang besar
terhadap penjualan.

Bab 7: Analisa Varians

Hal 100 dari 148

Handout Statistik 2

8. REGRESI DAN KORELASI


Seorang pimpinan perusahaan setiap hari selalu dihadapkan pada masalah

pengambilan keputusan yang berkaitan dengan hal-hal di masa mendatang. Agar


pengambilan keputusan ini dapat tepat dilakukan dia harus mendasarkan pada halhal yang diketahui dan dihubungkan dengan hal-hal atau keadaan-keadaan di masa
mendatang.
Analisis regresi dan korelasi

akan menunjukkan bagaimana sifat hubungan

antara 2 variabel dan besarnya hubungan 2 variabel tersebut.


Pada analisis regresi kita menentukan suatu persamaan garis berdasarkan suatu

rumus matematika yang menunjukkan hubungan antara variabel yang diketahui


dengan variabel yang tidak atau belum diketahui. Sedang analisis korelasi akan
menunjukkan berapa besar tingkat hubungan 2 variabel.
A. Macam Hubungan Antara 2 Variabel
Analisis regresi dan korelasi mendasarkan diri pada hubungan 2 variabel.

Variabel yang diketahui disebut independent variable atau variabel yang


mempengaruhi sedang variabel yang belum diketahui disebut dependent variable
atau variabel yang dipengaruhi. Variabel yang mempengaruhi disebut variabel X
sedang variabel yang dipengaruhi disebut Y.
Pada dasar kita dapat membedakan 3 macam sifat hubungan antara 2 variabel,

yaitu:
1.

Hubungan searah atau hubungan positif

2.

Hubungan yang bersifat kebalikan atau hubungan negatif

3.

Tidak ada hubungan

1.

Hubungan searah atau hubungan positif


-

Dua variabel dikatakan mempunyai hubungan searah atau postif apabila


perubahan variabel independen (X) akan mempengaruhi variabel dependen (Y)
yang searah pula. Artinya jika variabel X bertambah, maka variabel Y juga
bertambah atau sebaliknya, apabila X berkurang maka Y juga berkurang. Contoh:
hubungan antara pengeluaran biaya iklan (X) dengan jumlah penjualan (Y).

Hubungan ini dapat dilihat pada gambar berikut:

Bab 8: Regresi dan Korelasi

Hal 101 dari 148

Handout Statistik 2

2.

Hubungan Yang Bersifat Berkebalikan atau Hubungan Negatif


-

Dua

variabel

dikatakan

mempunyai

hubungan

yang

bersifat

berkebalikan atau negatif, apabila perubahan variabel independen (X) akan


mempengaruhi variabel dependen (Y) pada arah yang berlawanan. Artinya
apabila variabel X bertambah, maka variabel Y berkurang atau sebaliknya jika X
turun makan Y akan naik. Contoh, antara usia kendaraan (X) dengan tingkat
harganya (Y). Semakin tinggi usia kendaraan akan semakin turun harganya.
-

Hubungan 2 variabel yang berkebalikan ini dapat digambarkan


sebagai berikut:

3.

Tidak Ada Hubungan


-

Dua

variabel

dikatakan

tidak

mempunyai

hubungan

apabila

perubahan pada variabel independen (X) tidak mempengaruhi perubahan pada


variabel dependen (Y) atau variabel independen yang tetap (X tetap) justru
terjadi perubahan pada variabel dependen (Y berubah).
-

Contoh: konsumsi pangan sebagai variabel independen (X) yang


berubah dengan tingginya gedung (Y).

Hubungan ini terlihat dalam gambar berikut:

Bab 8: Regresi dan Korelasi

Hal 102 dari 148

Handout Statistik 2

B. Pengertian Garis Regresi

Perkataan regresi mula-mula digunakan oleh Sir Francis Galton tahun 1877 pada
waktu mengadakan penelitian hubungan antara tinggi orang tua dengan tinggi
anaknya. Galton berkesimpulan bahwa rata-rata tinggi anak yang berasal dari orang
tua yang tinggi lebih rendah daripada tinggi rata-rata orang tuanya. Sebaliknya anakanak yang berasal dari orang tua yang rendah, tinggi rata-rata anaknya lebih tinggi
daripada tinggi orang tuanya. Dengan singkat dikatakan terjadi regress atau terjadi
tendensi yang semakin turun.

Selanjutnya istilah Regression digunakan untuk menggambarkan garis yang


menunjukkan adanya hubungan antara 2 variabel. Ada beberapa ahli statistik yang
lebih menyukai menggunakan estimating line atau garis taksiran daripada
menggunakan istilah garis regresi.

C. Kegunaan Garis Regresi

Dengan mempelajari garis regresi kita akan dapat menentukan hubungan


perubahan variabel yang satu terhadap variabel lainnya.

Selanjutnya dari hubungan 2 variabel ini dapat dikembangkan untuk analisis


3 variabel atau lebih.

D. Perbedaan Antara Regresi dan Korelasi

Regresi menunjukkan hubungan antara variabel yang satu dengan variabel


yang lain. Sifat hubungan ini juga dapat dijelaskan antara variabel yang satu sebagai
penyebab sedang yang lain sebagai akibat, dalam bentuk variabel yang independen
dan variabel yang dependen.

Korelasi lebih menunjukan hubungan sebab akibat ini. Pada korelasi


dijelaskan besarnya tingkat hubungan antara variabel yang satu dengan variabel
yang lain.

E. Cara menggambar Garis Regresi

Ada 2 cara menggambar garis regresi, yaitu:

Bab 8: Regresi dan Korelasi

Hal 103 dari 148

Handout Statistik 2

1.

Metode Diagram Berserak (the scatter diagram)

2.

Metode Jumlah kuadrat terkecil (the least squares Method)

1.

Metode Diagram Berserak


Hubungan 2 variabel dapat digambarkan dalam Diagram Berserak. Pada

diagram ini variabel independen digambarkan pada skala horisontal (skala X)


sedangk variabel dependen digambarkan pada skala vertikal (skala Y).
Selanjutnya pasangan 2 variabel digambarkan pada diagram ini. Apabila gambar
titik-titik pada diagram itu menunjukkan suatu garis lurus, maka berarti ada
hubungan sempurna antara variabel yang satu dengan variabel yang lain.
Dalam kenyataan di dalam masalah ekonomi dan perusahaan, kita jarang

menjumpai sifat hubungan sempurna ini, sehingga masalah utama adalah


bagaimana cara menggambar garis pada diagram itu yang dianggap dapat
mewakili titik-titik yang berada dalam diagram berserak.
Beberapa hal yang perlu diperhatikan dalam menggambar garis pada

diagram berserak adalah:


a.

garis yang digambar harus sedekat mungkin dengan


semua titik yang ada di dalam diagram berserak

b.

Jumlah titik-titik yang berada pada masing-masing


bagian garis yakni bagian atas dan bawah harus sama.

c.

Garis itu harus digambar sedemikian rupa,sehingga


titik-titik yang berada di bagian atas dan bawah mempunyai jarak yang sama.

Contoh:
Variabel X
2
3
5
6
8
9

Variabel Y
6
5
7
8
12
11

Dua variabel tersebut dapat digambarkan dalam diagram berserak sebagai


berikut:

Bab 8: Regresi dan Korelasi

Hal 104 dari 148

Handout Statistik 2

Variabel X digambarkan pada sumbu horisontal, sedang variabel Y pada sumbu


vertikal. Selanjutnya titik-titik pada diagram berserak merupakan variabel X dan
Y yang berpasangan dapat digambarkan dengan mudah. Garis regresi yang
merupakan garis lurus digambarkan dengan metode bebas (free hands method).

Metode diagram berserak ini mempunyai kebaikan sederhana dan


mudah, namun mempunyai kelemahan, karena garis regresi digambar dengan
metode bebas, maka hasilnya sangat subyektif, artinya hasilnya sangat
tergantung individu yang membuat garis.

2.

Metode Jumlah Kuadrat Terkecil

Garis regresi yang digambarkan dengan metode jumlah kuadrat terkecil,


didasarkan pada suatu persamaan:
Y = a + bX
Nilai a dan b dicari berdasarkan 2 persamaan sebagai berikut:

= Na + bX

XY

= aX + bX2

Selanjutnya dapat diselesaikan dalam tabel berikut:


X (iklan)
2
3
5
6
8
9
= 33

Y (Penjualan)
6
5
7
8
12
11
= 49

X2
4
9
25
36
64
81
= 219

XY
12
15
35
48
96
99
= 305

Y = a +bX
4,84 = 2,94 + 2(0,95)
5,79 = 2,94 + 3(0,95)
7,69 = 2,94 + 5(0,95)
8,64 = 2,94 + 6(0,95)
10,54 = 2,94 + 8(0,95)
11,49 = 2,94 + 9(0,95)

I. 49 = 6a + 33b . x 11 . 539 = 66a + 363b


II. 305 = 33a + 219b x 2 .. 610 = 66a + 438b
----------------------71 = 75b
b = 0,95 (slope/lereng garis)
49 = 6a + 33(0,95) 6a = 49 31,25 a = 2,94 (intersep)
Persamaan garis regresi: Y = 2,94 + 0,95 X

Persamaan regresi: Y = 2,94 + 0,95 X dapat digambarkan dalam diagram


berikut:

Bab 8: Regresi dan Korelasi

Hal 105 dari 148

Handout Statistik 2

Persamaan regresi di atas dapat digunakan untuk mengadakan peramalan

di masa mendatang dengan ekstrapolasi.


Misalkan untuk variabel X sebesar 13, maka Y dapat dihitung:
Y = 2,94 + (0,95 x 13) = 15,29
Nilai Y = 15,29 dapat digambarkan dalam bagan sebagai hasil proyeksi.

Garis Regresi Y = a + bX dapat dipecahkan dengan mencari nilai a dan b

dengan menggunakan rumus sebagai berikut:

XY NXY
X 2 NX 2

a Y bX

Apabila digunakan rumus di atas, maka akan diperoleh hasil sebagai

berikut:

305 6(5,5)(8,1) 305 269,5 35,5

0,95
219 181,5 37,5
219 6(5,5) 2

a 8,1 (0,95)(5,5) 2,94

Persamaan regresinya menjadi:


Y = 2,94 + 0,95 X
Pengecekan terhadap garis regresi dapat dilakukan dengan 2 cara yaitu:

a.

dengan melihat gambar garis regresi pada diagram berserak


apakah semua titik-titik berada sepanjang garis regresi. Cara ini adalah cara
sederhana tetapi kurang sempurna hasilnya. Caraini disebut sebagai metode
kasar.

b.

Untuk mengetahui ketepatan garis regresi dengan menggunakan


rumus matematis. Pada metode jumlah kuadrat terkecil syarat utama adalah

Bab 8: Regresi dan Korelasi

Hal 106 dari 148

Handout Statistik 2

jumlah deviasi positif dan negatif harus nol agar garis regresi terletak di
tengah titik-titik pada diagram berserak.
Dapat dilihat dalam tabel berikut:
Y Variabel
6
5
7
8
12
11

Y (Garis Regresi)
4,84
5,79
7,69
8,64
10,54
11,49

Penyimpangan
(6 - 4,84) = +1,16
(5 5,79) = -0,79
(7 - 7,69) = -0,69
(8 8,64) = -0,64
(12 10,54) = +1,46
(11 11,49) = -0,49
Jumlah Penyimpangan = 0
(dibulakan dari 0,01)

F. Penyimpangan Standar Terhadap Garis Regresi (Standard Error of


Estimate)
Ketepatan suatu garis regresi dapat dilihat sepintas apabila semua titik

dalam diagram berserak mendekati garis regresi. Penyimpangan titik-titik dalam


diagram berserak secara statistik diukur dengan suatu konsep yang disebut: The
standard error of estimate atau penyimpangan standar terhadap garis regresi yang
dinotasikan dengan Se atau Syx.
Pengertian penyimpangan standar terhadap garis regresi ini identik

dengan penyimpangan standar. Apabila pada penyimpangan standar titik tolaknya


nilai rata-rata, maka pada penyimpangan terhadap garis regresi titik tolaknya
pengukuran dari garis regresi (Y).
Kita dapat lihat perbandingan 2 garis regresi yang masing-masing

mempunyai penyimpangan yang berbeda berikut ini:

Dari 2 gambar di atas kita dapat membandingkan bahwa gambar A titik-

titiknya

lebih

mendekati

garis

regresi

sehingga

dapat

dikatakan

bahwa

penyimpangan terhadap garis regresi kecil. Pada gambar B penyimpangan terhadap


garis regresi besar. Dari 2 gambar tadi gambar A lebih tepat daripada gambar B.

Selanjutnya perumusan dari penyimpangan terhadap garis regresi


dirumuskan sebagai berikut:

Bab 8: Regresi dan Korelasi

Hal 107 dari 148

Handout Statistik 2

Se

(Y Y ' ) 2
N 2

Se = standard error of estimate


Y

= nilai data Y

Y = nilai regresi
N = jumlah frekuensi
Pembagi di sini N-2 karena pada perhitungan a dan b untuk menentukan persamaan
regresi kita telah kehilangan 2 derajat kebebasan.
Penggunaan rumus di atas disajikan dalam tabel berikut:

Iklan (X)
2
3
5
6
8
9

Penjualan (Y)
6
5
7
8
12
11
Se

Regresi (Y)
4,84
5,79
7,69
8,64
10,54
11,49
5,23 / 4

(Y-Y)2
1,35
0,62
0,48
0,41
2,13
0,24
(Y-Y)2 = 5,23

(Y-Y)
+1,16
-0,79
-0,69
-0,64
+1,46
-0,49

1,3075 1,14

Metode lain yang dapat digunakan untuk menghitung penyimpangan

standar terhadap regresi secara pendek dapat dirumuskan sebagai berikut:

Se

Y 2 a Y b XY
N 2

Berdasarkan rumus diatas, maka perhitungannya dapat dijelaskan dalam tabel


berikut:
X (iklan)
2
3
5
6
8
9
= 33

Se

Y (Penjualan)
6
5
7
8
12
11
= 49

X2
4
9
25
36
64
81
= 219

439 49(2,94) 0,95(305)

62

XY
12
15
35
48
96
99
= 305

Y2
36
25
49
64
144
121
= 439

5,19
1,2975 1,14
4

G. Interpretasi Penyimpangan Standar Terhadap Garis Regresi

Penyimpangan standar terhadap garis regresi dapat diinterpretasikan


sama dengan deviasi standar terhadap nilai rata-rata. Semakin besar Se atau
penyimpangan standar terhadap garis regresi semakin tersebar titik-titik yang
berada sekitar garis regresi. Sebaliknya semakin kecil Se semakin dekat titik-titik
yang berada di sekitar garis regresi.

Bab 8: Regresi dan Korelasi

Hal 108 dari 148

Handout Statistik 2

Apabila Se=0 atau tidak ada, berarti semua titik berada sepanjang garis
regresi. Yang berarti bahwa garis regresi dapat digunakan secara sempurna untuk
menaksir variabel dependen.

Selanjutnya dengan asumsi bahwa semua data observasi berada di sekitar


garis regresi dalam bentuk distribusi normal, maka berdasarkan Se kita dapat
mengatakan bahwa:
68% dari data observasi akan berada dalam jarak 1 Se
95,5% dari data observasi akan berada dalam jarak 2 Se
99,7% dari data observasi akan berada dalam jarak 3 Se

Berdasarkan contoh sebelumnya, maka pernyataan di atas dapat


dijabarkan sebagai berikut: Persamaan regresi Y = 2,94 + 0,95X, sedang Se = 1,14
maka jarak 1 Se adalah:
Y = 2,94 + 0,95 ( 1,14) atau Y antara (2,94 + 1,083) dan (2,94 1,083)
Jarak 1 Se akan terletak antara 1,857 dan 4,023

Dapat digambarkan sebagai berikut:

Prediksi terhadap penyimpangan standar pada garis regresi akan tepat


apabila digunakan rumus sebagai berikut:

Sp Se 1 1 / N

(X X 0 )2
X 2 X 02

X0 = Nilai X tertentu yang dipakai menaksir Y


Dengan rumus di atas akan diperoleh hasil yang berbeda untuk setiap X 0 . Makin
jauh jarak X0 terhadap nilai rata-rata, maka Sp akan besar, sebaliknya semakin dekat
Bab 8: Regresi dan Korelasi

Hal 109 dari 148

Handout Statistik 2

X0 terhadap nilai rata-rata, maka Sp akan kecil. Apabila hasil akar pangkat dua = 1
maka Sp = Se.
H. Koefisien Regresi
Lereng garis regresi disebut koefisien regresi. Persamaan garis regresi

dinyatakan dengan :
Y = a + bX
Dari persamaan di atas yang dimaksudkan dengan koefisien regresi

adalah b. Nilai b di sini dapat positif atau negatif. Apabila koefisien regresi positif,
maka garis regresi akan mempunyai lereng positif, yang berarti hubungan 2 variabel
X dan Y searah atau positif. Apabila koefisien regresi negatif, maka garis regresi akan
mempunyai lereng yang negatif yang berarti hubungan 2 variabel X dan Y
berlawanan arah atau hubungannya negatif.
Besar kecilnya pengaruhi perubahan variabel X terhadap variabel Y akan

ditentukan oleh besar kecilnya koefisien regresi atau nilai b.

I. Koefisien Determinasi
Koefisien determinasi adalah suatu alat utama untuk mengetahui sejauh mana

tingkat hubungan antara variabel X dan variabel Y. Koefisien determinasi ini dapat
ditentukan berdasarkan hubungan antara 2 macam variasi, yaitu:
1.

Variasi variabel Y terhadap garis regresi (Y) = (Y-Y)2

2.

Variasi variabel Y terhadap rata-ratanya ( Y ) = (Y- Y )2


Koefisien determinasi dirumuskan sebagai berikut:

r2 1

(Y Y ' ) 2
(Y Y ) 2

J. Interpretasi Koefisien Determinasi


Untuk menjelaskannya diambil 2 contoh ekstrim sebagai berikut:

1.

Hubungan Sempurna antara Variabel X dan Y


o

Hubungan sempurna antara variabel X dan Y ditunjukkan dengan


perubahan variabel X akan diikuti dengan perubahan variabel Y, dengan
proporsi yang sama. Sebagai contoh dapat dilihat dalam tabel berikut:
X
1
2
3
4
5

Y
2
4
6
8
10
Y = 30

Bab 8: Regresi dan Korelasi

Regresi Y
2
4
6
8
10

(Y-Y)
0
0
0
0
0

(Y-Y)2
0
0
0
0
0
(Y-Y)2 =0

(Y- Y )
-4
-2
0
2
4

(Y- Y )2
16
4
0
4
16
(Y- Y )2=40

Hal 110 dari 148

Handout Statistik 2

Y = 30/5 = 6

r 2 = 1 0/40 = 1

Koefisien determinasi = 1, menunjukkan hubungan sempurna

2.

Tidak Ada Hubungan Antara Variabel X dan Y


Variabel X dikatakan tidak mempunyai hubungan dengan variabel Y yaitu

apabila perubahan variabel X tidak mempengaruhi variabel Y.


o

Tabel berikut menunjukkan contoh ini:


X
1
2
3
4
5

Y
5
10
5
10
5
Y = 35

Y = 35/5 = 7

Regresi Y
7
7
7
7
7

(Y-Y)
-2
3
-2
3
-2

(Y-Y)2
4
9
4
9
4
(Y-Y)2 =30

(Y- Y )
-2
3
-2
3
-2

(Y- Y )2
4
9
4
9
4
(Y- Y )2=30

r 2 = 1 30/30 = 0

Koefisien determinasi = 0, menunjukkan tidak ada hubungan

Besarnya nilai koefisien determinasi terletak antara 0 dan 1. Determinasi = 0


menunjukkan tidak adanya hubungan antara variabel X dan Y, sedang determinasi =
1 menunjukkan adanya hubungan sempurna antara variabel X dan Y
0 r2 1

Interpretasi terhadap koefisien determinasi dapat dijelaskan dengan gambar


berikut:

Bab 8: Regresi dan Korelasi

Hal 111 dari 148

Handout Statistik 2

Dari gambar di atas nampak bahwa dari sebuah variabel Y, yang kita pilih sebagai
contoh pembahasan dapat diuraikan sebagai berikut:
Jarak antara variabel Y terhadap nilai rata-ratanya disebut Total Deviation atau
jumlah seluruh deviasi. Jarak antara garis regresi (Y) dengan nilai rata-ratanya
disebut explained deviation atau deviasi yang dapat dikelaskan. Selanjutnya
selisihnya yaitu jarak antara Y terhadap garis regresi disebut sebagai unexplained
deviation atau deviasi yang tidak dapat dijelaskan.
Secara singkat penjelasannya dapat dirumuskan sebagai berikut:

(Y Y ) 2
Total Deviation

(Y 'Y ) 2

= Explained deviation

(Y Y ' ) 2

+ Unexplained deviation

Apabila unexplained deviation dinyatakan sebagai bagian dari seluruhnya atau


ratio terhadap keseluruhan, maka:

(Y Y ' ) 2
(Y Y ) 2

Sedangkan rumus determinasi adalah:

r2 1

(Y Y ' ) 2
(Y Y ) 2

Dari rumus koefisien determinasi di atas berarti suatu ukuran yang dapat
memberikan penjelasan terhadap variabel Y atau ukuran yang dapat memberi
penjelasan sejauh mana hubungan antara variabel X dan variabel Y.

Metode lain yang dapat menjelaskan koefisien determinasi berdasarkan regresi


adalah rumus sebagai berikut:

a Y b XY NY 2
r
Y 2 NY 2
2

K. Koefisien Korelasi (r)


Bab 8: Regresi dan Korelasi

Hal 112 dari 148

Handout Statistik 2

Koefisien korelasi yang dinyatakan dengan r merupakan alat kedua untuk

menjelaskan hubungan antara variabel X dan Y. Koefisien korelasi sebagai akar dari
koefisien determinasi:

r r2 1

(Y Y ' ) 2
(Y Y ) 2

Apabila suatu garis regresi mempunyai lereng positif, maka r merupakan akar

dari bilangan yang positif. Apabila suatu garis regresi mempunyai lereng negatif,
maka r merupakan akar dari bilangan negatif. Jadi nilai r menunjukkan arah
hubungan antara variabel X dan Y. Pada hubungan yang searah atau positif maka
nilai r akan terletak antara 0 dan 1.
Koefisien korelasi tidak dapat menjelaskan secara langsung misalnya r = 0,9.

Apabila r = 0,9 maka r2 = 0,81. berarti 81% dari variabel Y dapat dijelaskan oleh garis
regresi.
L. Kegunaan Korelasi
Ada beberapa manfaat dalam mempelajari korelasi yaitu:

1.

Penentuan adanya hubungan serta besarnya hubungan antara 2


variabel merupakan masalah utama yang perlu mendapat jawaban dalam
statistik. Koefisien korelasi merupakan ukuran yang dapat menjelaskan besar
kecilnya hubungan antara 2 variabel

2.

Biasanya dengan mengetahui adanya hubungan antara 2 variabel


atau lebih kita akan dapat mengadakan peramalan terhadap variabel lainnya.
Contoh, dengan meningkatkan jumlah produksi alat-alat elektronik, sedangkan
faktor-faktor lainnya tetap, dapat diharapkan harga barang-barang tersebut akan
turun.

3.

Dengan mengetahui adanya hubungan antara 2 variabel, maka


dengan diketahuinya 1 variabel dapat diadakan penaksiran terhadap variabel
yang lain dengan bantuan garis regresi

M. Korelasi dan Hubungan Sebab Akibat


Korelasi hanyalah menunjukkan adanya hubungan antara 2 variabel atau lebih

serta menunjukkan berapa besarnya hubungan antara 2 variabel tersebut. Korelasi


tidak dapat menunjukkan adanya hubungan sebab akibat antara 2 variabel.
Hubungan sebab akibat sebenarnya merupakan akibat adanya korelasi. Adanya
korelasi antara suatu variabel dengan variabel lain disebabkan karena adanya satu
atau beberapa sebab sebagai berikut:
1.

Korelasi yang benar-benar ditimbulkan oleh faktor kebetulan saja.


Ada beberapa hal yang secara kebetulan dapat menunjukkan adanya korelasi,
meskipun kalau kita korelasi demikian sebenarnya bohong belaka. Misalnya
variabel harga gula dan tinggi mahasiswa.

Bab 8: Regresi dan Korelasi

Hal 113 dari 148

Handout Statistik 2

2.

Variabel yang mempunyai korelasi sebenarnya dipengaruhi oleh


variabel atau faktor-faktor lain. Misalkan harga gula dan harga sepatu sangat
dipengaruhi oleh faktor ketiga yaitu penghasilan atau harga barang-barang lain.
Jadi hubungan sebab akibat mungkin ada tetapi korelasinya menjadi kurang
penting.

3.

Kedua variabel yang mempunyai hubungan sulit ditunjukkan mana


sebagai faktor penyebab dan mana yang menjadi faktor akibat. Misalnya antara
permintaan dan penawaran. Adanya korelasi belum tentu menunjukkan adanya
faktor

sebab

akibat,

tetapi

adanya

faktor

sebab

akibat

selalu

dapat

mengakibatkan adanya korelasi.


N. Metode-Metode yang Digunakan Untuk Mempelajari Korelasi
Untuk mempelajari korelasi pada hakekatnya dapat dibedakan adanya 2 metode,

yaitu:
1.

Mempelajari hubungan 2 variabel secara visual

2.

Mengukur besarnya tingkat hubungan antara 2 variabel secara


matematis

1.

Mempelajari secara visual


Untuk mempelajari hubungan 2 variabel dapat dilakukan dengan 2 pengamatan
yaitu:
a.

Pengamatan terhadap diagram berserak


Mula-mula 2 variabel yang mempunyai hubungan yaitu X dan Y dilukiskan
dalam satu diagram berserak, selanjutnya kita menafsirkan sifat hubungannya
berdasarkan diagram tersebut. Contoh:

Gambar A menunjukkan adanya hubungan positif atau searah antara X dan Y.


Gambar B menunjukkan adanya hubungan negatif antara X dan Y. Sedangkan
gambar C menunjukkan tidak ada hubungan antara X dan Y.
Kebaikan metode diagram berserak:
-

metode ini sangat sederhana dan mudah, serta tidak memerlukan


pengetahuan matematika untuk mempelajarinya.

Bab 8: Regresi dan Korelasi

Hal 114 dari 148

Handout Statistik 2

tidak dipengaruhi oleh nilai ekstrem

langkah pertama kita harus menggambarkan diagram berserak

Kelemahan metode ini:


Metode ini hanya menunjukkan adanya hubungan serta sifat hubungan antara 2
variabel, sedang ukuran yang tepat untuk menentukan besarnya hubungan
antara 2 variabel ini tidak dapat ditunjukkan.
b.

Metode grafik
Dengan metode ini kedua variabel X dan Y masing-masing digambarkan dalam
satu kertas/diagram. Selanjutnya kita dapat melihat apakah kedua grafik itu
menunjukkan arah yang sama, yang berarti ada hubungan antara 2 variabel
tersebut, sedang apabila tidak menunjukkan arah yang sama, maka berarti tidak
ada hubungan antara variabel X dan Y.
Contoh:
Data berikut menunjukan data ekspor kapas (X) dan impor mesin tenun (Y):
Tahun
1980
1981
1982
1983
1984
1985
1986

Ekspor (X)
42
44
58
55
89
90
66

Impor (Y)
46
49
53
58
65
76
58

Tabel di atas dapat digambarkan sebagai berikut:

Grafik di atas menunjukkan bahwa antara variabel X dan Y mempunyai


hubungan yang erat.
Kebaikan metode grafik:
Sebagaimana halnya metode diagram berserak, maka metode grafik ini
mempunyai kebaikan karena sederhana dan mudah diikuti. Secara visual grafik
ini dapat menunjukkan adanya sifat hubungan antara variabel yang satu dengan
variabel yang lain.
Bab 8: Regresi dan Korelasi

Hal 115 dari 148

Handout Statistik 2

Kelemahan metode grafik:


Metode ini tidak dapat menunjukkan secara tepat tentang besarnya tingkat
hubungan antara variabel X dan Y. Dengan demikian perlu adanya suatu ukuran
dalam bentuk bilangan untuk mengukur besarnya tingkat hubungan antara
variabel X dan Y. Hal ini akan dijelaskan dalam metode matematis berikut.
2.

Mengukur Besarnya Tingkat Hubungan Secara Matematis

Kita dapat membedakan 2 macam cara perhitungan koefisien korelasi yaitu:


a. untuk data tidak berkelompok
b. untuk data berkelompok

a.

Untuk data tidak berkelompok (ungrouped data)


-

Perhitungan koefisien korelasi menggunakan rumus:

r 1

(Y Y ' ) 2
(Y Y ) 2

X2

XY

(Y-Y)

(Y-Y)2

(Y- Y )

5
11
4
5
3
2
X=30

31
40
30
34
25
20
Y=180

25
121
16
25
9
4
= 200

155
440
120
170
75
40

30
42
28
30
26
24

+1
-2
+2
+4
+1
-4

1
4
4
16
1
16
=42

+1
+10
0
+4
-5
-10

X 30 / 6 5

(Y- Y
)2
1
100
0
16
25
100
=242

Y 180 / 6 30

Y = Na + bX . 180 = 6a + 30b x 5 900 = 30a + 150b


XY = aX + bX2 . 1000 = 30a + 200b. x 1 1000 = 30a + 200b
-------------------------100 = 50b b = 2
6a = 120
a = 20
Persamaan Regresi: Y = 20 + 2X

r 1

(Y Y ' ) 2
(Y Y )

42
1 0,17
242

0,83 0,91

Product Moment Method. Moment (m) adalah suatu ukuran yang


didasarkan pada pangkat deviasinya
Moment X ditulis x

Bab 8: Regresi dan Korelasi

Hal 116 dari 148

Handout Statistik 2

Moment 1 (m1) = ( X X )1 x
Moment 2 (m2) = ( X X ) 2 x 2
Moment Y ditulis y
Moment 1 (m1) = (Y Y )1 y
Moment 2 (m2) = (Y Y ) 2 y 2
Dan seterusnya
Product moment adalah hasil perkalian antara moment X dan moment Y yang
dirumuskan:

xy
N

dimana = product moment


x = moment x
y = moment y
N = banyaknya kejadian

Selanjutnya koefisien korelasi dirumuskan sebagai berikut:


r

Sx Sy

dimana, r

= koefisien korelasi

= product moment

Sx

= standar deviasi X

Sy

= standar deviasi Y

Penggunaan rumus di atas disajikan dalam tabel berikut:


X

5
11
4
5
3
2
=30
X =

31
40
30
34
25
20
=180
Y =3

Sy

( X X ) x (Y Y ) y

0
+6
-1
0
-2
-3

xy 100

16,67
N
6
242 / 6

Bab 8: Regresi dan Korelasi

+1
+10
0
+4
-5
-10

xy
0
60
0
0
10
30
=100

( X X )2 x 2
0
36
1
0
4
9
=50

Sx

(Y Y ) 2 y 2
1
100
0
16
25
100
=242

50 / 6

8,33 2,89

40,33 6,35

Hal 117 dari 148

Handout Statistik 2

Sx Sy

16,67
16,67

0,91
2,89(6,35)
18,35

Rumus Karl Pearsons

N XY ( X )( Y )

N X 2 ( X ) 2

N Y 2 ( Y ) 2

Penggunaan rumus di atas adalah sebagai berikut:


X
5
11
4
5
3
2
= 30

Y
31
40
30
34
25
20
= 180

Y2
961
1600
900
1156
625
400
= 5642

N Y 2 ( Y ) 2

6(1000) (30)(180)
6( 200) (30) 2

6(5642) (180) 2

6000 5400

1200 900 33852 32400


r

b.

N XY ( X )( Y )

N X 2 ( X ) 2

X2
36
121
16
25
9
4
= 200

XY
155
440
120
170
75
40
= 1000

600
300 1450

600
600

0,91
17,32 38,11 660

Untuk data Berkelompok


1.

Korelasi untuk data berkelompok, pada


dasarnya merupakan kombunasi dari 2 tabel frekuensi yakni tabel frekuensi X

Bab 8: Regresi dan Korelasi

Hal 118 dari 148

Handout Statistik 2

dan Y. Dengan kombinasi ini, maka bentuk tabel frekuensi menjadi tabel
frekuensi menurut bilangan yang bersifat ganda.
2.

Selanjutnya untuk koefisien korelasi


dihitung berdasarkan rumus sebagai berikut:

N fydxdy ( fxdx)( fydy )


N fxdx 2 ( fxdx) 2

N fydy 2 ( fydy ) 2

dimana:
r

= koefisien korelasi

N = jumlah frekuensi
fx = frekuensi X
fy = frekuensi Y
dx = deviasi X
dy = deviasi Y

3.

Berikut ini contoh perhitungan korelasi


data berkelompok secara sederhana:
X (Pengeluaran Iklan)
4
5
4
4
5
2
3
7
8
7

Y (Penjualan)
8
6
7
6
4
4
5
8
9
7

Apabila masing-masing variabel tersebut dikelompokkan dalam kelas-kelas atau


dalam bentuk tabel frekuensi akan diperoleh 2 tabel frekuensi:
Tabel Frekuensi X
Kelas-Kelas
Frekuensi X
13
2
46
5
79
3
Tabel Frekuensi Y
Kelas-Kelas
Frekuensi Y
89
3
67
4
45
3

Bab 8: Regresi dan Korelasi

Hal 119 dari 148

Handout Statistik 2

4.

Dari

tabel

frekuensi

tersebut

kemudian digabungkan menjadi satu yang merupakan gabungan antara variabel


X dan variabel Y, serta memasukkan frekuensi kedua variabel dalam tabel
gabungan:
X
46
1
3
1

13
89
67
45

5.

79
2
1

Selanjutnya untuk menghitung koefisien


korelasinya, tabel diatas dilengkapi menjadi:
X
13

89
67
45
fx
dx
fxdx
fxdx2
fxdydx

2
2
0
0
0
0

46
1
3
1
5
1
5
5
5

79
2
1
3
2
6
12
10

fy
3
4
3
10
3
11
17
15

dy
2
1
0
3

fydy
6
4
0
10

fydy2
12
4
0
16

fydxdy
10
5
0
15

Penentuan deviasi (d) dilakukan sebagaimana dalam tabel frekuensi biasa untuk
variabel X maupun Y hanya perlu diperhatikan arah deviasi. Semakin besar arah
kelasnya semakin besar deviasinya. Nilai deviasi = 0 untuk variabel X maupun Y
harus sama letaknya, yang selanjutnya nilai deviasi akan tergantung arah kelas
masing-masing variabel.
6.

Berdasarkan hasil tabel di atas, maka


dapat dihitung koefisien korelasi sebagai berikut:
r

10(15) (11)(10)
10(17) (11)

10(16) (10)

7.

40
0,74
54,25

Apabila kita menentukan deviasi = 0


pada kelas yang di tengah, maka akan diperoleh hasil sebagaimana tampak pada
tabel berikut:
X
13
Y

89
67
45
fx
dx
fxdx

Bab 8: Regresi dan Korelasi

2
2
-1
-2

46
1
3
1
5
0
0

79
2
1
3
1
3

fy
3
4
3
10
0
1

dy
1
0
-1
3

fydy
3
0
-3
0

fydy2
3
0
3
6

fydxdy
2
0
2
4

Hal 120 dari 148

Handout Statistik 2

fxdx2
fxdydx

2
2

0
0

3
2

5
4

8.

Berdasarkan tabel di atas, koefisien


korelasi diperoleh:
r

10( 40) (0)(1)


10(5) (1)

10(6) (0)

9.

40
0,74
54,25

Kesimpulan deviasi 0 dpat diletakkan


pada sembarang kelas, asal diperhatikan bahwa variabel X dan Y merupakan
variabel yang berpasangan. Dengan demikian letak deviasi 0 harus sama, apakah
di kelas yang ditengah, ataukah pada ujung kelas, serta arah deviasi harus
disesuaikan dengan arah kelas.
Sifat-Sifat Korelasi Pearson:

1.

Nilai koefisien korelasi terletak antara +1 dan -1, apabila hubungan 2


variabel itu menunjukkan adanya korelasi. Apabila menunjukkan tidak adanya
korelasi, nilainya = 0.

2.

Dalam metode perhitungannya menggunakan seluruh variabel

3.

Koefisien korelasi ini menunjukkan arah korelasi maupun besarnya


tingkat korelasi.

4.

Koefisien korelasi ini kadang-kadang dapat membawa kesimpulan yang


salah apabila variabelnya kurang tepat dalam memilihnya.

5.

Koefisien korelasi tidak dapat membuktikan adanya hubungan sebab


akibat.

Kebaikan koefisien Korelasi Pearson:


Kebaikannya adalah tidak saja besarnya tingkat korelasi dapat diketahui, melainkan
pula arah hubungan 2 variabel itupun dapat diketahui.
Kelemahan koefisien korelasi Pearson:
1. Adanya anggapan bahwa hubungan 2 variabel itu hubungannya bersifat linear
2. Koefisien korelasi ini sulit ditafsirkan, sehingga membawa penafsiran yang keliru
3. Metode ini jika dibandingkan dengan metode lain lebih sulit.
4. Mudah dipengaruhi nilai ekstrim

O. Korelasi Berdasarkan Ranking (Rank Correlation)


1.

Metode perhitungan koefisien korelasi


berdasarkan rangking dikenalkan oleh Profesor Charles Spearman. Metode ini dapat
digunakan untuk menghitung koefisien korelasi untuk variabel yang nilai datanya
tidak diketahui melainkan hanya urutan nilai atau rangkingnya yang diketahui.

Bab 8: Regresi dan Korelasi

Hal 121 dari 148

Handout Statistik 2

2.

Sebagai contoh, ranking nilai ujian 5


orang mahasiswa yang mengikuti ujian Statistika dan Ekonomi.

3.

Spearman mengajukan suatu rumus


untuk menghitung koefisien korelasi sebagai berikut:

6 D2
r 1
N ( N 2 1)
dimana:

= koefisien korelasi

= jumlah

D = Perbedaan (difference)
N = jumlah frekuensi
6

= Bilangan konstan

4.

Nilai koefisien korelasi ini akan terletak


antara -1 jika hubungan 2 variabel itu bersifat negatif, sedang jika sifat hubungan 2
variabel itu positif maka nilainya +1. Apabila 2 variabel itu tidak menunjukkan
adanya hubungan, maka r = 0.

5.

Penggunaan rumus di atas dapat dilihat


pada tabel berikut:
Ranking

Ranking

Statistik (X)
1
2
3
4
5

Ekonomi (Y)
1
2
3
4
5

r 1

D (X-Y)

D2

0
0
0
0
0

0
0
0
0
0
=0

6( 0)
1 0 1
5( 25 1)

Caranya:
1. susun data berdasarkan ranking, apabila ada ranking yang sama, maka ranking
ditentukan berdasar rata-ratanya.
Contoh, ranking 6,5 untuk ranking 6 dan 7 yang sama nilainya.
2. Hitung perbedaan ranking untuk masing-masing data (D)
3. Kuadratkan hasilnya (D2) dan jumlahkan hasilnya
4. Gunakan rumus Spearman
6.

Contoh:
Data berikut menunjukkan data penjualan televisi (X) dan video recorder (Y):
X
115
134
120
130
124
128

Bab 8: Regresi dan Korelasi

Y
130
132
128
130
127
125
Hal 122 dari 148

Handout Statistik 2

Perhitungan koefisien korelasinya adalah sebagai berikut:


Televisi

Video

Ranking

Ranking

(X)
115
134
120
130
124
128

(Y)
130
132
128
130
127
125

(X)
6
1
5
2
4
3

(Y)
2,5
1
4
2,5
5
6

D (X-Y)

D2

3,5
0
1
-0,5
-1
-3

12,25
0
1
0,25
1
9

=23,50

6(23,50)
r 1
1 141 / 210 69 / 210 0,33
6(36 1)
7.

Kendalls

Rank

Correlation

menggunakan rumus untuk menghitung rank correlation sebagai berikut:


r

S
1 / 2 N ( N 1)

= koefisien korelasi

= sums (jumlah nilai di atas dan di bawah ranking Y)

N = jumlah frekuensi
Contoh:
Nilai X
115
134
120
130
124
128

Nilai Y
130
132
128
130
127
125

Ranking X
6
1
5
2
4
3

Ranking Y
2,5
1
4
2,5
5
6

S
(-1) + (+3) = +2
(0) + (+4) = +4
(-1) + (+2) = +1
(0) + (+2) = +2
(0) + (+1) = +1
(0) + (0) = 0
= 10

10
10 / 15 0,67
1 / 2(6)(6 1)

Penjelasan dalam menghitung S (jumlah):


Ranking Y : 2,5 nilai dibawahnya 1 jadi -1 sedang nilai yang diatasnya 3, jadi +3
jumlah = +2
Dibawahnya 1 : di bawah nilai 1 tidak ada jadi 0, sedang yang diatasnya ada 4 jadi
+4, jumlah = +4
Bab 8: Regresi dan Korelasi

Hal 123 dari 148

Handout Statistik 2

8.

Kebaikan-kebaikan Rank korelasi:


1.

metode ini mudah dihitung dan mudah dimengerti

2.

metode ini dapat digunakan untuk menghitung koefisien korelasi


pada data yang bersifat kualitatif

3.

Pada data yang bersifat ranking, maka metode ini merupakan


satu-satunya metode perhitungan koefisien korelasi.

4.

Pada data bukan ranking, dapat dihitung pula dengan metode ini.

9.

Kelemahan Rank Korelasi


1. Metode ini tidak dapat digunakan untuk menghitung korelasi data berkelompok
2. Untuk data yang lebih dari 30, perhitungannya akan menjadi sulit. Sebaiknya
metode ini digunakan untuk data kurang dari 30.
3. Metode ini hasilnya kurang teliti dibandingkan dengan metode Pearson

P. Beberapa Analisis Yang Perlu Diperhatikan Dalam Analisis Regresi


dan Korelasi
1.

Ekstrapolasi data observasi


Suatu anggapan yang keliru apabila garis regresi dapat diaplikasikan pada
rentang suatu nilai. Regresi hanya didasarkan pada suatu nilai sampel.
Persamaan garis regresi hanya benar untuk suatu rentang nilai yang sama dari
sampel itu.

2.

Analisis regresi dan korelasi tidak menentukan sebab akibat


Kekeliruan yang dapat timbul adalah adanya anggapan dalam analisis regresi dan
korelasi bahwa perubahan satu variabel disebabkan oleh perubahan variabel lain.
Analisis regresi dan korelasi tidak dapat menjelaskan hubungan sebab akibat.

3.

Penggunaan trend masa lampau untuk menduga trend masa


depan
Kita harus hati-hati dalam menggunakan data masa lampau guna menghitung
persamaan regresi. Beberapa hal atau keadaan dapat mempengaruhi satu atau
lebih pada asumsi yang kita gunakan dalam analisis regresi.

4.

Kesalahan dalam menafsirkan koefisien korelasi dan koefisien


determinasi
Koefisien korelasi biasanya ditafsirkan sebagai prosentase. Jika diketahui r =
0,60; secara keliru ditafsirkan bahwa garis regresi dapat menjelaskan 60% dari
variasi Y, yang sebenarnya hanya (0,60)2 atau 0,36 = 36%.
Koefisien determinasi akan keliru ditafsirkan untuk menjelaskan prosentase
perubahan variabel dependen sebagai akibat perubahan variabel independen.

Bab 8: Regresi dan Korelasi

Hal 124 dari 148

Handout Statistik 2

Koefisien determinasi hanya mengukur berapa baik suatu variabel digambarkan


oleh variabel yang lain bukan berapa besar perubahannya.
5.

Sifat hubungan dalam analisis regresi adalah bersifat umum


Hubungan antara 2 variabel dalam analisis regresi adalah bersifat umum. Misal
hubungan antara penggunaan bahan bakar dengan jarak yang ditempuh.

Q. Rata-Rata dan Variasi Koefisien-Koefisien Regresi

Yang dimaksud dengan koefisien regresi adalah koefisien regresi penaksir yaitu a
dan b. Persoalan yang muncul adalah seberapa jauh atau dekat garis regresi (Y = a
+bX) menyimpang dari garis regresi populasinya.

Hal ini berarti kita harus mengetahui bagaimana a terdistribusi di sekitar (a


untuk populasi) dan bagaimana b terdistribusi disekitar . Atau secara matematis
dapat ditulis:
E(a) =
Var (a) = 2/n
E(b) =
Var (b) = 2/xi2
Dengan catatan bahwa 2 adalah variasi dari e (atau variasi nilai Y di sekitar garis
regresi). ei adalah perbedaan Yi dengan nilai ekpektasinya E(Yi) = + X, jadi:
ei = Yi - E(Yi)
ei = Yi - - Xi
Yi = + Xi + ei

Dari persamaan regresi estimasi Y = a + bX, koefisien yang regresi yang kita
estimasi adalah a dan b. Dari kedua koefisien ini nilai estimasi b seringkali dianggap
lebih penting artinya daripada a. Hal ini disebabkan karena b menunjukkan rasio
perolehan Y dan X. Atau dengan kata lain, melalui koefisien b kita dapat melihat pola
hubungan ketergantungan antara variabel Y dan variabel X.

Dinyatakan bahwa:
E(b) =
Var (b) = 2/xi2
Hal ini dimaksudkan bahwa nilai harapan b adalah dari populasi atau dengan kata
lain bahwa koefisien estimator (penduga) b tidak bias (menyimpang) dari koefisien
regresi populasi .

Untuk mengetahui apakah koefisien b tidak bias dari koefisien regresi populasi
maka kita harus melihat bagaimana bentuk distribusi probabilitas b. Karena secara

Bab 8: Regresi dan Korelasi

Hal 125 dari 148

Handout Statistik 2

teoritis tidak dapat diketahui bentuk distribusi probabilitas tersebut, maka


diasumsikan bahwa variabel-variabel random Y terdistribusi secara normal.

Ini berarti bahwa setiap variabel random Y tersebut secara normal dengan (Y) =
+ X sebagai nilai harapan atau nilai rata-rata hitungnya dan 2 sebagai
variansnya. Karena b merupakan kombinasi linear dari Y maka nilai b terdistribusi
secara normal juga. Dapat digambarkan sebagai berikut:

Dari gambar di atas terlihat bahawa statistik b tersebar secara normal dengan nilai
harapan dan varians sebesar 2/xi2.

Apabila kita menghendaki agar nilai distribusi normal dapat dimanfaatkan maka
distribusi normal perlu diterjemahkan ke dalam distribusi norrmal yang memiliki
rata-rata hitung sama dengan nol dan standar deviasi sama dengan satu.
z

b
b

dimana b = standar deviasi dari b, atau:

x
i 1

2
i

Nilai 2 adalah varians faktor gangguan ei atau varians variabel random Yi dalam
populasi (dan adalah standar deviasi) yang nilainya tidak dapat diketahui. Oleh
karena itu nilai 2 yaitu nilai varians Yi atau varians (ei) perlu diestimasi dengan
memakai varians ei sebagai penaksirnya, yaitu varians yang terdapat dalam sampel
atau sering ditulis:

S2

1 n
(Yi Yi ' ) 2

n 2 i 1

Apabila S2 ini dipakai untuk menggantikan (menaksir) nilai 2 maka distribusi


probabilitas b tidak lagi normal, melainkan sudah berubah menjadi distribusi t
dengan (n-2) sebagai derajat kebebasannya.

Bab 8: Regresi dan Korelasi

Hal 126 dari 148

Handout Statistik 2

b
S
n

x
i 1

2
i

Distribusi t inilah yang untuk selanjutnya akan digunakan dalam penentuan interval
kepercayaan bagi parameter dan dalam penyajian hipotesa mengenai parameter
ini.

Misalkan sekarang kita gunakan t0,025 sebagai nilai t yang membatasi 2,5 persen
dari luas areal di bawah distribusi t pada ujung sebelah kanan distribusi tersebut.
Oleh karena sifat simetris distribusi tersebut maka luas daerah yang terletak di
sebelah kiri t0,025 adalah 2,5 persen juga. Dengan demikian luas areal antara t 0,025
sampai dengan t0,025 adalah 95 persen dari keseluruhan wilayah distribusi t tersebut.
Dengan kata lain, probabilitas nilai t berada di antara -t 0,025 dengan t0,025 adalah 0,95
atau:
Pr (t0,025 < t < t0,025 ) = 0,95

Probabilitas interval keyakinan 95 persen bagi parameter adalah:

b t 0 , 025

x
i i

2
i

sedangkan untuk parameter adalah:

a t 0,025

Contoh:
Apabila kita memiliki data penggunaan pupuk dan hasil panen sebagai berikut:
Pemakain Pupuk (X)
60
80
100
120
140

Bab 8: Regresi dan Korelasi

Hasil panen (Y)


24
26
30
32
33
Hal 127 dari 148

Handout Statistik 2

Untuk menghitung S dapat disajikan dalam tabel berikut:


Xi
60
80
100
120
140
=500
X =100

Yi
24
26
30
32
33
=145
Y =29

Xi
-40
-20
0
20
40
=0

xi2
1600
400
0
400
1600
=4000

yi
24,2
26,6
29,0
31,4
33,8

(yi-Y)
-0,2
-0,6
1,0
0,6
-0,8
= 0

(yi Y)2
0,04
0,36
1,00
0,36
0,64
=2,4

Dari tabel di atas didapat persamaan regresi: Y=29 + 0,12Xi.


Nilai S diperoleh sebagai berikut:

S2

1 n
(Yi Yi ' ) 2 1 / 3(2,40) 0,8

n 2 i 1

atau S = 0,8 = 0,9.


Karena nilai S sudah diketahui maka interval kepercayaan bagi dan dapat
diperoleh.
Dengan memasukkan a = 29, n = 5 dan t 0,025 = 3,182 (lihat taabel distribusi t), maka
akan diperoleh:
S

a t 0 ,025

= 29 3,182 (0,9/5)
= 29 1,21
sebagai interval kepercayaan 95% bagi parameter
Jadi apabila ditulis secara lain, interval keyakinan 95% bagi adalah:
27,79 < < 30,21
n

Dengan memasukkan nilai b = 0,12 ; S = 0,9 dan

X
i 1

2
1

=4000 dan t0,025 = 3,182,

maka akan diperoleh interval kepercayaan 95% utuk parameter yaitu:


= 0,12 3,182 (0,9/4000)
= 0,12 0,0859
atau dapat ditulis: 0,0341 < < 0,2059.
Bab 8: Regresi dan Korelasi

Hal 128 dari 148

Handout Statistik 2

Uji hipoteses yang paling perlu dilakukan dalam analisa regresi bertujuan
menunjukkan ada tidaknya hubungaan linear yang signifikan antara variabel X dan
Y. Ada tidaknya hubungan linear yang nyata (signifikan) antara variabel X dan Y
adalah ditentukan oleh ada tidaknya secara signifikan parameter yaitu bergantung
pada ada tidaknya perbedaan yang nyata (signifikan) antara nilai parameter
dengan nol.

Ini berarti bahwa yang perlu ditunjukkan adalah apakah = 0 atau 0.


Seperti halnya pengujian hipotesis yang biasa kite perlu menguji hipotesa nol:
=0
yaitu hipotesa yang menyatakan bahwa tidak ada perbedaan yang nyata antara
dengan nol.
Hipotesa alternatifnya adalah:
0
yaitu hipotesa yang menyatakan bahwa ada perbedaan yang nyata antara nilai
dengan nol.

Biasanya kita mengadakan pengujian hipotesis dengan memakai 2 sisi kurva


distribusi t. Misalnya derajat kepercayaan yang kita kehendaki adalah 95%.

Hipotesis diterima apabila nilai t yang dihitung dari sampel ternyata lebih kecil
(secara absolut) daripada t tabel. Demikian pula sebaliknya, hipotesa ditolak
(menerima hipotesa alternatif) apabila t hitung lebih besar (secara absolut) dari t
tabel.

Dengan menggunakan soal di atas, kita dapat hitung nilai t sebagai berikut:

b
S
n

x
i 1

0,12
8,433
0,9
4000

Nilai t hitung tersebut lebih besar daripada t tabel (3,182). Oleh karena itu
berdasarkan tingkat kesalahan 5% kita menolak hipotesa nol dan menerima hipotesa
alternatif. Ini berarti bahwa b =0,12 adalah berbeda secara nyata dengan nol.
Sehingga dapat dikatakan bahwa parameter regresi yang ditaksir itu tidak sama
dengan nol. Atau ada hubungan regresi linear yang nyata antara X dan Y.

Dalam beberapa hal kita dapat juga memakai uji t satu sisi. Hal ini dilakukan
apabila hubungan yang diperkirakan sudah jelas arahnya. Sebagai contoh, apabila
kita menghubungkan antara tingkat konsumsi C dengan penghasilan Y dengan
menggunakan model:
C = a + bY

Secara teoritis dapat diduga bahwa penghasilan Y akan mempengaruhi konsumsi


C dalam hubungan yang positif. Dalam kasus demikian H0 dapat diuji dengan satu
sisi saja yaitu dengan:
H0 : = 0

Bab 8: Regresi dan Korelasi

Hal 129 dari 148

Handout Statistik 2

H1 : > 0
Dengan menggunakan hipotesa di atas kriteria penolakan hipotesa nol tersebut juga
akan berubah. Kita akan menolak hipotesa nol dan menerima hipotesa alternatif
dengan derajat kepercayaan 5% jika nilai t hitung lebih besar daripada t tabel. Jika
tidak lebih besar maka kita akan menerima hipotesa nol.

Bab 8: Regresi dan Korelasi

Hal 130 dari 148

Handout Statistik 2

9. ANALISIS REGRESI GANDA DAN KORELASI GANDA


Apabila kita menggunakan lebih dari satu variabel yang mempengaruhi

(independent variabel) untuk menaksir variabel dependen, maka taksiran kita akan
menjadi lebih akurat. Proses ini disebut analisis regresi ganda.
A. Pengertian Regresi Ganda dan Korelasi Ganda
Contoh:

Apabila kita ingin mengetahui hubungan antara jumlah rumah yang terjual dengan
jumlah pengeluaran iklan F maka analisis ini disebut regresi sederhana. Jika kita
ingin meningkatkan akurasinya, maka kita dapat menambah variabel lain, misalnya
jumlah agen penjualan, analisis ini disebut regresi berganda.
Keuntungan analisis regresi ganda ialah kita dapat menggunakan informasi lebih

banyak sebagai variabel, guna menduga variabel dependen. Dengan demikian hasil
estimasi kita menjadi lebih akurat.
Dengan demikian kita dapat mendifinisikan regresi ganda adalah regresi yang

menggunakan lebih dari 1 variabel independen guna menduga variabel dependen.


B. Langkah-Langkah Analisis Regresi Ganda dan Korelasi Ganda
Ada 3 langkah atau tahap untuk proses analisis regresi ganda dan korelasi ganda,

yaitu:
1.

Menentukan persamaan regresi ganda

2.

Menentukan penyimpangannya (standard error of estimate)

3.

Menggunakan analisis korelasi ganda untuk menentukan ketetapan


persamaan garis regresinya

C. Persamaan Garis Regresi Ganda

Dalam regresi sederhana, X adalah variabel independen. Oleh karena dalam


regresi ganda variabel independen lebih dari 1, maka dapat digunakan simbol X 1, X2
dan seterusnya.
Y = a + bX1 + cX2
Dimana:
Y

= nilai yang diduga

= intersep

X1 dan X2

= nilai dari 2 variabel independen

b dan c

= lereng garis yang berkaitam dengan variabel X1 dan X2.

Bab 9: Analisis Regresi Ganda dan Korelasi Ganda

Hal 131 dari 148

Handout Statistik 2

Persamaan garis tersebut dapat digambarkan dalam grafik 3 dimensi berikut:

Besarnya penyimpangan persamaan regresi ganda dihitung menggunakan


metode jumlah kuadrat terkecil dengan kriteria pendugan bidang jumlah kuadrat
penyimpangan minimum, yaitu penyimpangan titik-titik terhadap titik-titik yang
terletak dalam bidang.
3 persamaan yang digunakan untuk menghitung konstanta a, b dan c adalah:

Y Na b X 1 c X 2
2

X 1Y a X 1 b X 1 c X 1 X 2
X 2Y a X 2 b X 1 X 2 c X 2

Contoh:

Penjualan (Y)
7
12
17
20

Iklan Radio (X1)


4
7
9
12

Iklan TV (X2)
1
2
5
8

Berdasarkan tabel diatas, disusunlah tabel berikut:


Y
7
12
17
20
=56

X1
4
7
9
12
=32

X2
1
2
5
8
=16

X1Y
X2Y
28
7
84
24
153
85
240
160
=505 =276

X1X2
4
14
45
96
=159

X12
16
49
81
144
=290

X22
1
4
25
64
=94

Y2
49
144
289
400
=882

Berdasar tabel diatas, maka diperoleh 3 persamaan sebagai berikut:


1.

56 = 4a + 32b +16c

2.

505 = 32a + 290b +159c

3.

276 = 16a + 159b + 94c

Penyelesaian:
Persamaan 1 dan 2 menghasilkan persamaan 4
Persamaan 1 x 8

..

448 = 32a + 256b + 128c

Bab 9: Analisis Regresi Ganda dan Korelasi Ganda

Hal 132 dari 148

Handout Statistik 2

Persamaan 2 x 1

..

505 = 32a + 290b + 159c


-------------------------------- -

Persamaan (4)

57 =

34b + 31c

Persamaan 1 dan 3 menghasilan persamaan 5


Persamaan 1 x 4

..

224 = 16a + 128b + 64c

Persamaan 3 x 1

..

276 = 16a + 159b + 94c


-------------------------------- -

Persamaan (5)

52 =

31b + 30c

Persamaan (4) dan (5) akan diperoleh konstanta c:


Persamaan 4 x 31 ..

1767 = 1054b + 961c

Persamaan 5 x 34 ..

1768 = 1054b + 1020c


-------------------------------- -

Persamaan (5)

1=

59c

c = 0,017
Nilai c disubstitusikan pada persamaan 4 diperoleh konstanta b:
57 = 34b + 31(0,017)
57 = 34b + 0,527
56,473 = 34b
b = 1,66
Nilai c dan b disubstitusikan pada persaman 1 diperoleh konstanta a:
56= 4a + (32)(1,66) + (16)(0,017)
56 = 4a + 53,12 + 0,272
4a = 2,608
a = 0,652
Persamaan regresi ganda adalah:
Y = 0,652 + 1,66X1 + 0,017 X2
D. Interpretasi Konstanta A, B dan C

Konstanta a adalah intersep dari Y. Sedang b dan c adalah lereng garis regresi
ganda. Konstanta a, b dan c disebut koefisien regresi ganda (the estimated
regression coeficients).

Konstanta a adalah jumlah Y tanpa variabel X. Konstanta b dan c adalah besar


perubahan X1 dan X2 terhadap Y.

E. Regresi Ganda dan Peramalan atau Proyeksi

Bab 9: Analisis Regresi Ganda dan Korelasi Ganda

Hal 133 dari 148

Handout Statistik 2

Persamaan garis regresi ganda dapat digunakan untuk peramalan atau proyeksi.

Yakni dengan mengubah variabel X1 dan X2 akan dapat diramalkan pengaruhnya


terhadap Y.
F. Definisi dan Efek Multikolinearitas
Dalam analisa regresi ganda, koefisien regresi menjadi kurang reliabel apabila

tingka korelasi antar variabel independen meningkat. Apabila tingkat korelasi antar
variabel independen tinggi maka kita menjumpai masalah multikolinearitas
(multicolinearity).
Contoh: apabila kita menduga penjualan berdasarkan variabel independen

jumlah penjual dan gajinya. Kedua variabel ini mempunyai hubungan yang erat.
Variabel tambahan justru akan memberika penyimpangan besar pada nilai koefisien
regresinya.
Agar multikolinearitas dapat seminimum mungkin, maka sebelum menggunakan

analisis regresi ganda, digunakan analisis regresi sederhana antar variabel


independen.
G. Penyimpangan Standar Terhadap Garis Regresi Ganda
Dalam regresi sederhana, pandangan terhadap garis regresi akan menjadi

semakin akurat apabila penyimpangan terhadap garis regresi semakin kecil. Hal
demikian juga berlaku pada regresi ganda.
Penyimpangan terhadap garis regresi ganda dapat dirumuskan sebagai berikut:

Se

Y 2 (aY ) (bX 1Y ) (cX 2Y )


n3

Se = penyimpangan standar terhadap regresi ganda


Y

= nilai variabel dependen

X1 dan X2 = variabel independen


n

= jumlah unsur sampel

a, b dan c = koefisien regresi


H. Penentuan Interval Keyakian terhadap Variabel Y

Pada regresi sederhana, kita dapat menggunakan penyimpangan standar


terhadap garis regresi dan distribusi t untuk menentukan interval keyakinan pada
garis regresi ganda.

Contoh, nilai penjualan (Y= 17,456) dan penyimpangan standar terhadap regresi
ganda (Se) = 1,58. Dengan menggunakan 96% batas kepercayaan tabel t dengan
derajat kebebasan (4-3) = 1 adalah 12,706. Interval keyakinan dapat dihitung sebagai
berikut:

Bab 9: Analisis Regresi Ganda dan Korelasi Ganda

Hal 134 dari 148

Handout Statistik 2

Y + t(Se)

= 17,456 + 12,706 x 1,59


= 17,456 + 20,075
= 37,53 sebagai batas atas

dan
Y + t(Se)

= 17,456 - 12,706 x 1,59


= 17,456 - 20,075
= -2,619 sebagai batas bawah

Dengan kepercayaan 95%, maka jumlah penjualan akan terletak antara -2,619 dan
37,53.
I. Koefisien Determinasi Ganda
Dalam analisis regresi sederhana telah dijelaskan ukuran tingkat hubungan

antara 2 variabel dengan koefisien determinasi (r2).


Koefisien determinasi adalah bagian variasi total dari variabel independen (Y)

yang dijelaskan oleh garis regresi. Demikian pula pada regresi ganda,koefisien ini
disebut koefisien determinasi ganda (R2) yaitu bagian dari variabel total dari Y yang
dijelaskan oleh bidang regresi.
Rumus koefisien determinasi ganda adalah:

a Y b X 1Y c X nY 2
R
Y 2 nY 2
2

X1 dan X2 = variabel independen


Y

= rata-rata variabel independen

= jumlah unsur sampel

a, b dan c = koefisien regresi ganda


Y

= variabel dependen
Interpretasi koefisien determinasi ganda adalah sebagai berikut: misalkan R 2 =

0,975 maka dapat diinterpretasikan bahwa variabel X 1 dan X2 menjelaskan 97,5%


dari variabel total Y.

Bab 9: Analisis Regresi Ganda dan Korelasi Ganda

Hal 135 dari 148

lampiran

Anda mungkin juga menyukai