UT
STATISTIKA II
Fakultas Ekonomi
Universitas 17 Agustus 1945
Banyuwangi
Handout Statistik 2
1. TEORI PROBABILITAS
A.
Konsep Probabilitas
Dalam kehidupan sehari-hari setiap orang selalu akan berhadapan
B.
Pengertian Probabilitas
Ada beberapa metode atau pendekatan untuk menjelaskan pengertian
probabilitas yaitu:
1.
rasio
dari
kejadian
yang
menguntungkan
seluruh
K
S
b.
c.
Kartu Bridge
2.
ini
disebut
pendekatan
Handout Statistik 2
a.
b.
definisinya
perlu
pertimbangan
agar
cukup
banyak,
sebab
apabila
Probabilitas Subyektif
Di dalam kehidupan sehari-hari dapat dijumpai peristiwa-peristiwa yang
Handout Statistik 2
C.
1
Sisi
Gamba
r
2
Sisi
Tulisan
Ruang Sampel
Dari bagan di atas, dapat dilihat bahwa ruang sampel merupakan jumlah dari
seluruh peristiwa.
Selanjutnya dari ruang sampel dapat disusun berbagai
macam sub-ruang sampel, karena sub ruang sampel merupakan bagian dari
ruang sampel.
Contoh pada pelemparan 2 buah mata uang secara
Handout Statistik 2
1
(H)
2
(H)
1
(H)
2
(T)
Sub-Ruang
Sampel 1
Sub-Ruang
Sampel 2
1
(T)
2
(H)
1
(T)
2
(T)
Ruang
Sampel
Sub-Ruang
Sampel 3
jumlah
seluruh
mahasiswa
suatu
akademi
manajemen 1500 orang merupakan ruang sampel yang unsurnya terdiri dari
1500 orang mahasiswa. Dari ruang sampel ini dapat disusun berbagai subruang sampel, misalnya menurut jenis kelamin, asal daerah, asal sekolah,
pekerjaan orang tua, maupun tahun masuknya.
Menurut tahun masuknya dapat dibedakan menjadi 3
macam sub-ruang sampel yaitu tahun pertama, tahun kedua dan tahun
ketiga.
Sub-Ruang Sampel
Mahasiswa Tahun I
600 orang
Mahasiswa Tahun II
600 orang
Mahasiswa Tahun III
400 orang
Ruang Sampel
Mahasiswa Akademi
Manajemen
1500
orang
Hal
5 dari 148
Handout Statistik 2
D.
Pengertian Peristiwa
Apabila suatu ruang sampel merupakan suatu kumpulan hal yang bersifat
universal, maka dari ruang sampel dapat disusun dalam berbagai sub-ruang
sampel yang mempunyai sifat-sifat tertentu.
Sub-ruang sampel yang merupakan unsur-unsur yang mempunyai sifatsifat tertentu ini dapat disebut sebagai suatu peristiwa. Dalam pelemparan 2
buah mata uang dapat dibedakan 3 macam peristiwa yaitu peristiwa 2 sisi
gambar, 1 sisi gambar dan 1 sisi tulisan serta 2 sisi tulisan.
2.
= Probabilitas
A = Peristiwa A
n
Handout Statistik 2
E.
atau
atau
B
Handout Statistik 2
2.
AB
B
Dalam penjumlahan P(A) dan P(B) sebenarnya P(A dan B) telah dihitung
2 kali, oleh karena itu dalam rumus di atas dikurangkan 1 kali.
C)
3.
Apabila di dalam suatu ruang sampel terdapat peristiwa A dan bukan A (),
sedangkan mengandung semua unsur-unsur dalam ruang sampel
kecuali A, maka dikatakan peristiwa merupakan peristiwa yang
komplementer bagi A.
Handout Statistik 2
Komplimen A ()
Ruang Sampel
4.
b.
c.
a.
Probabilitas Marginal
b.
Probabilitas Gabungan
Handout Statistik 2
P(B)
c.
P(A/B)
Handout Statistik 2
P (GM ) 3 10
3 10 10 4 3 4 0,75
P( M )
4 10
P G M
Untuk bola biru, probabilitas bola bergaris dengan syarat bola itu biru
adalah:
P G B
P (GB ) 2 10
2 10 10 6 2 6 0,33
P( B)
6 10
P ( AB )
P( B)
P A B
b.
atau
P B A
P ( BA)
P ( A)
P ( AB )
maka P(AB) = P(A/B) x P(B)
P( B)
P A B
c.
6.
Teori Bayes
Teori Bayes yang lebih dikenal dengan nama kaedah Bayes memainkan
peranan yang penting dalam penggunaan probabilitas bersyarat dan
menghitung probabilitas subyektif. Teori ini dikembangkan oleh Thomas
Bayes pada tahun 1763.
Apabila A1, A2, A3 .. An merupakan suatu sekatan dari ruang sampel S dan
apabila peristiwa A1, A2, A3 .. An merupakan peristiwa yang lengkap
terbatas dengan probabilitas 0, maka probabilitasnya adalah:
P(A) = P(A1) P(A/A1) + P(A2) P(A/A2) + P(An) P(A/An)
atau
P(A) = P(An) P(A/An)
P Ak A
P A Ak P Ak P A Ak
P A
P A
P Ak A
P Ak P A Ak
P A n P A A n
Handout Statistik 2
Contoh, peti A berisi 3 bola hijau dan 5 bola merah, sedang peti B berisi 2
bola hijau, 1 bola merah dan 2 bola kuning. Apabila peti tersebut dipilih
secara random dan selanjutnya dipilih sebuah bola secara random pula, maka
probabilitas bola hijau dipilih dapat dijelaskan sebagai berikut:
Jika A merupakan peristiwa terpilihnya bola hijau, sedangkan terpilihnya peti
A dinyatakan dengan A1 dan terpilihnya peti B dengan A2, maka
P(A1)
= P(A2) = 1/2
P(A/A1)
= 3/8
P(A/A2)
= 2/5
P A2 A
7.
P A2 P A A2
1 2 2 5
16 31
P A1 P A A1 P A2 P A A2 1 2 3 8 1 2 2 5
Harapan Matematis
Harapan matematis ini terdapat pada sistem perjudian dan asuransi. Dalam
sistem perjudian pada asasnya penjudi membayar sejumlah uang untuk
menerima hak sejumlah uang atau tidak sama sekali. Hal yang sama akan
terjadi pada sistem asuransi jiwa, seorang yang mengasuransikan jiwanya
akan membayar premi asuransi. Selama jangka asuransi apabila dia
meninggal, maka dia akan memperoleh sejumlah polis asuransi penuh,
sedang jika dia sehat, maka dia tidak memperoleh apa-apa.
F.
tindakan
ini
didasarkan
karena
adanya
masalah
ketidakpastian
(uncertainty).
Ada 2 macam pengambilan keputusan, yaitu:
1.
merupakan
pengambilan
kesimpulan
terhadap
populasi
Handout Statistik 2
pertimbangan
ekonomi
secara
langsung,
yakni
dengan
2.
3.
4.
H.
tindakan telah disusun dalam bentuk tabel hasil, selanjutnya perlu dipertimbangkan
tindakan mana yang akan dipilih.
Apabila kita tidak memiliki informasi, maka kita dapat menduga probabilitas
Handout Statistik 2
2.
3.
I.
kerugian
yang
dimaksud
adalah
perbedaan
antara
J.
Handout Statistik 2
2. DISTRIBUSI TEORITIS
A. Pengertian Distribusi Teoritis
Jumlah Frekuensi
III
IV
59
41
0 (sisi Tulisan)
I
54
II
61
1 (sisi Gambar)
46
39
41
100
100
100
Jumlah
Percobaan
V
62
VI
49
59
38
51
100
100
100
Dari tabel di atas dapat dilihat, bahwa berdasar pada 6 percobaan pelemparan
sebuah mata uang sebanyak 100 kali diperoleh berbagai macam hasil atau frekuensi
yang berbeda satu dengan yang lainnya.
Namun bila kita mengambil kesimpulan dari berbagai percobaan ini akan sampai
pula pada suatu teori bahwa mata uang itu setimbang, artinya probabilitas sisi
gambar atau H dengan sisi tulisan atau T akan sama, yaitu 50% : 50%.
Dengan kata lain, dapat dikatakan bahwa distribusi teoritisnya karena secara teoritis
sisi gambar (H) dan sisi tulisan (T) dari sebuah mata uang logam mempunyai
probabilitas yang sama yaitu 1/2 sehingga hasil pelemparan mata uang sebanyak 100
kali akan menghasilkan tabel berikut:
Jumlah H
0
1
Probabilitas
1/2
1/2
Jumlah
Frekuensi Teoritis
1/2 x 100 = 50
1/2 x 100 = 50
100
Dari tabel di atas dapat dilihat bahwa frekuensi teoritis diperoleh dengan mengalikan
probabilitas dengan jumlah percobaan.
B. Kegunaan Mempelajari Distribusi Teoritis
Handout Statistik 2
Bernoulli, James Bernoulli adalah ahli matematika Swiss (1654-1705) yang sangat
berjasa bagi perkembangan penggunaan distribusi binomial.
Model dari percobaan Bernoulli mengambil beberapa anggapan, yaitu:
a.
b.
c.
Handout Statistik 2
2. Distribusi Poisson
Distribusi Poisson ditemukan oleh seorang ahli matematika dari Perancis
dari Poisson guna menunjukkan suatu peristiwa yang merupakan suatu distribusi
Poisson dapat diambil contoh pada peristiwa datangnya kendaraan yang melewati
pintu gerbang pada jalan raya tol.
Dari peristiwa ini dapat diamati sebagai berikut:
1.
2.
Apabila suatu peristiwa memenuhi persyaratan di atas, maka kita akan dapat
mengatakan bahwa peristiwa tersebut mempunyai sifat distribusi Poisson.
Distribusi Poisson adalah merupakan suatu distribusi dari variabel random yang
bersifat diskrit. Probabilitas dari peristiwa random yang bersifat diskrit dinyatakan
dengan x yang mempunyai nilai 0, 1, 2, dan seterusnya.
3. Distribusi Normal atau Kurva Normal
Handout Statistik 2
b.
a.
b.
c.
d.
e.
sebagian besar dari data ada di tengah dan sebagian kecil dari
data ada pada masing-masing sisi/tepi
Handout Statistik 2
68% dari data akan berada dalam jarak 1 standar deviasi, 95%
f.
dari data akan berada dalam jarak 2 standar deviasi dan 99% dari data berada
dalam jarak 3 standar deviasi.
Untuk mengetahui suatu distribusi apakah bersifat normal atau tidak
b.
c.
deviasi (1 sigma), 95% dari data akan berada dalam jarak 2 standar deviasi (2
sigma) dan sebagainya
d.
e.
1
Y0
e
2
1 / 2 x 2
= deviasi standar
x
= nilai data
= 3,14159
e
= 2,71828
= rata-rata
= mean, sehingga e0 = 1.
Y0 0,39894
NC i
Handout Statistik 2
Contoh:
Dari distribusi frekuensi penghasilan 50 karyawan perusahaan tahun 2005 (dalam
ribuan rupiah) diperoleh data sebagai berikut:
Nilai rata-rata (mean)
= 65,1
= 50
Ci
= 10
Deviasi standar ()
= 16,78
Y0
= 11,9
= 0, 39894 x 500/16,78
Untuk nilai ordinat yang lain dapat dihitung berdasarkan nilai tabel ordinat dengan
dikalikan ordinat maksimum (11,9).
distribusi probabilitas yang berbentuk normal, karena seluruh jumlah daerah kurva
normal = 1, maka daerah kurva normal dapat menunjukkan probabilitas.
Secara matematis dapat dikatakan bahwa:
68% dari seluruh nilai data terletak dalam jarak 1 deviasi
a.
b.
Handout Statistik 2
c.
Bentuk suatu kurva akan ditentukan oleh mean dan deviasi standarnya.
Oleh sebab itu, akan dijumpai berbagai macam tipe bentuk kurva. Menyusun suatu
tabel kurva akan menjadi sulit, karena nilai mean dan standar deviasi yang berbedabeda, sehingga untuk menyusun tabel kurva normal perlu adanya anggapananggapan bahwa untuk mean = 0 dan deviasi standar = 1.
Kurva normal standar dapat dilihat sebagai berikut:
Handout Statistik 2
Segala bentuk kurva dengan mean dan deviasi yang berbeda selalu dapat
= variabel x
= mean
= deviasi standar
Contoh: Suatu distribusi normal dengan rata-rata = 50 dan deviasi standar = 25. Hal
ini dapat digambarkan sebagai berikut:
Handout Statistik 2
Berdasarkan gambar di atas, maka konversi skala x menjadi skala z adalah sebagai
berikut:
a.
x = 25
z
25 50 25
1
25
25
b.
x=0
z
0 50 50
2
25
25
c.
x = 75
z
75 50 25
1
25
25
Disebelah kiri nilai rata-rata, nilai z adalah negatif, sedangkan untuk nilai z yang
terletak di sebelah kanan nilai rata-rata z adalah positif.
Karena bentuk kurva normal adalah simetris, maka tabel untuk nilai z
yang negatif sama dengan z yang positif. Tabel z = -1 sama dengan tabel z= +1 (lihat
lampiran).
Selanjutnya penggunaan daerah kurva normal dapat dijelaskan berbagai
kasus berikut:
a.
b.
Menghitung
luas
daerah
kurva
normal
Handout Statistik 2
c.
Menghitung
luas
daerah
kurva
normal
d.
Handout Statistik 2
e.
f.
Menghitung
luas
daerah
kurva
normal
g.
Menghitung
luas
daerah
kurva
normal
Handout Statistik 2
h.
i.
17,4 24
0,55
12
z2
58,8 24
2,90
12
Handout Statistik 2
Contoh soal:
a.
0,400 0,397
0,60
0,005
Tabel daerah kurva normal untuk z = 0,60 adalah 0,2257. Sehingga luasnya
menjadi 0,500 0,2257 = 0,2743 atau 27,43%.
b.
Handout Statistik 2
Dari tabel z daerah kurva normal yang mendekati nilai ini adalah 0,3997 untuk z
= 1,28
1,28
x 68%
8,2%
Jadi keuntungan yang diperoleh 10% pedagang kaki lima yang terendah ada di
bawah 57,5%.
Handout Statistik 2
3. METODE SAMPLING
Populasi atau universe diberi definisi sebagai keseluruhan dari obyek yang
akan diteliti. Populasi di sini bukan dalam arti penduduk, karena obyek penelitian
dapat bermacam-macam misalkan, upah, produksi dan sebagainya.
Di dalam hal kita menghadapi obyek yang mudah rusak, seperti bola
lampu, ban kendaraan dan sebagainya, maka penelitian terhadap seluruh obyek
tidak mungkin dilakukan.
2.
3.
4.
Penelitian
yang
menggunakan
metode
sampel
dapat
cepat
Handout Statistik 2
penggunaan personal yang ahli dan peralatan canggih maka hasil sampel dapat
diharapkan lebih terinci sehingga kita akan memperoleh pengetahuan yang lengkap
tentang sesuatu yang kita teliti.
6.
7.
Secara matematis kita dapat mengukur suatu sampel dan populasi seperti,
mean, median, modus dan sebagainya.
Ukuran-ukuran sampel disebut dengan istilah statistik, sedang ukuranukuran untuk populasi disebut parameter.
Contoh:
Rata-rata usia mahasiswa di suatu perguruan tinggi adalah 22 tahun merupakan
parameter. Sedang apabila kita mengatakan rata-rata usia 5 orang mahasiswa suatu
perguruan tinggi 22 tahun maka rata-rata ini disebut statistik.
1. Mean = x
2. Deviasi standar = s
3. Proporsi = x/n
4. Jumlah data = n
5. Koefisien korelasi = r
Populasi
Parameter
1. Mean =
2. Deviasi standar =
3. Proporsi = P
4. Jumlah data = N
5. Koefisien korelasi = R
Penggunaan
metode
sampel
dalam
suatu
penelitian
kadang-kadang
sifat dari
populasinya.
Suatu contoh betapa sulitnya memilih sampel dari suatu penduduk yang
bertempat tinggal terpencil dan sulit komunikasinya. Oleh karena adanya masalahmasalah yang komplek ini, maka perlu adanya suatu perencanaan baik dalam
persiapan maupun dalam pelaksanaannya secara terinci.
Handout Statistik 2
sebagai berikut:
1.
2.
Perumusan Masalah
Sebagaimana telah dijelaskan bahwa populasi merupakan keseluruhan obyek
yang diteliti. Masalah populasi tidak timbul apabila keseluruhan obyek tersebut
telah tegas dirumuskan, misalkan bola lampu yang akan diteliti daya tahan ratarata yang dimiliki. Sebaliknya apabila obyek penelitian itu tidak tegas
dirumuskan, maka masalah populasi ini akan timbul.
Contoh:
Populasi pengusaha, pengertian pengusaha perlu dirumuskan dengan jelas,
misalkan pengusaha golongan ekonomi lemah.
Perumusan populasi yang tegas sangat diperlukan karena populasi yang akan
dipilih sebagian sebagai sampel ini harus sesuai dengan informasi yang kita cari.
Di samping itu penegasan terhadap populasi ini juga diperlukan apabila kita
ingin membandingkan dengan populasi yang lain, sehingga kesimpulan yang kita
kehendaki dapat sesuai dengan tujuan penelitian yang telah dirumuskan.
3.
4.
5.
Handout Statistik 2
perlu ditegaskan dan jangan sampai tumpang tindih karena unsur populasi tidak
boleh dipilih sebagai sampel sampai 2 atau 3 kali.
Contoh:
Populasi bola lampu. Unit sampling di sini adalah bola lampu (tegas
dirumuskan), sehingga tidak ada kemungkinan unit sampling terpilih lebih dari
sekali sebagai sampel.
Penelitian terhadap pedagang kaki lima, unit samplingnya adalah seorang
pedagang kaki lima.
6.
Pemilihan Sampel
Dewasa ini kita memiliki bermacam-macam metode pengambilan sampel. Suatu
hal yang penting adalah menentukan besarnya sampel yang selalu dikaitkan
dengan biaya penelitian
7.
8.
Informasi-informasi
yang
lengkap
tentang
populasi
memberi
Tujuan dari teori sampling adalah membuat metode sampling menjadi lebih
efisien. Teori sampling mengembangkan cara pemilihan sampel serta perhitungan
sampel sebagai dasar pendugaan terhadap populasi yang setepat mungkin dengan
biaya yang serendah-rendahnya.
Agar suatu prosedur pengambilan sampel dan perhitungan sampel dapat tepat,
maka diperlukan pengetahuan terhadap populasinya. Suatu cara yang ditempuh
untuk penyederhanaan adalah kita selalu menganggap bahwa sampel itu mempunyai
distribusi yang normal.
Handout Statistik 2
Teori sampling dahulu berkembang atas dasar populasi yang tidak terbatas,
tidak penting karena pengertian sampel merupakan bagian yang kecil dari suatu
populasi.
F. Metode Sampling
Pada dasarnya ada 2 macam metode guna pemilihan/pengambilan sampel,
yakni:
1.
2.
memiliki kesempatan atau kans (chance) yang sama untuk dipilih sebagai sampel,
sehingga dapat diharapkan hasil sampel ini obyektif.
Ada 5 macam metode random atau probabilitas sampel yaitu:
4!
4 3 2 1
6
2! 4 2 ! 2 1 2 1
Handout Statistik 2
Populasi (N)
A
B
C
D
Probabilitas (P)
Probabilitas marginal merupakan
perjumlahan dari joint
probabilitas yang mengandung
peristiwa tersebut
P(A) = P(AB) + P(AC) + P(AD)
= 1/6 + 1/6 + 1/6 = 3/6
= 1/2
a.
Metode Undian
Dalam contoh dimuka karyawan sebanyak 4 (N=4). Apabila kita ingin
mengambil sampel sebesar 2 (n=2) maka proses pemilihannya mudah
dilakukan dengan cara mengundi, yaitu masing-masing unsur populasi diberi
nomor 1 sampai 4, selanjutnya diundi untuk dipilih 2 sebagai sampel. Hasil
undian ini merupakan sampel yang terpilih.
Metode ini mudah dilakukan pada populasi yang jumlahnya sedikit. Apabila
unsur populasinya banyak atau besar, maka cara undian ini menjadi tidak
praktis.
Sehingga ditempuh dengan cara kedua, yaitu dengan menggunakan tabel
random.
b.
Handout Statistik 2
Sampel 2
Sampel 3
Sampel 4
Sampel 5
Sampel 6
Sampel 7
Sampel 8
Sampel 9
Sampel 10
Handout Statistik 2
2.
Stratified Sampling
Apabila unsur-unsur populasi tidak homogen atau heterogen,
secara random sesuatu dengan proporsinya. Oleh sebab itu, stratified sampling
disebut stratified random sampling.
Contoh: Suatu populasi terdiri dari 1000 orang pedagang kaki
Jumlah pedagang
200
100
400
300
Apabila kita akan mengambil sampel sebanyak 20 pedagang, maka masingmasing strata akan diambil sampelnya secara proporsional:
Strata I = 200/1000 x 20
= 4 pedagang
Strata II = 100/1000 x 20
= 2 pedagang
= 8 pedagang
Strata IV = 300/1000 x 20
= 6 pedagang
Cluster Sampling
Pada cluster sampling unsur-unsur populasi dibagi dalam
Handout Statistik 2
dalam cluster, maka dari beberapa cluster ini dipilih salah satu cluster dengan
random. Dari cluster yang terpilih ini baru dipilih sampelnya secara random
pula.
Perbedaan dengan stratified sampling adalah terletak pada
Systematic Sampling
Apabila titik awalnya nomor 6, selanjutnya adalah nomor 16, 26, 36 dan
seterusnya.
5.
Multistage Sampling
Biasanya sampel dipilih dengan cara satu kali, sebelum proses pengumpulan
data dilakukan. Cara ini mempunyai kelemahan apabila sampel tersebut
ditentukan terlampau kecil. Oleh karena itu apabila kita akan menggunakan
sampel yang kecil, maka sebaiknya sampel tersebut dipilih secara bertahap
sampai pada keadaan di mana dipandang telah cukup untuk mengambil suatu
kesimpulan. Proses demikian disebut Multistage Sampling.
Hasil
YANG
MEMERL
UKAN
DANA
Handout Statistik 2
Besarnya
Sampel
Besar Sampel
20
20
20
20
20
20
20
20
40
60
80
100
120
140
Kombinasi Sampel
Jumlah Yang
Jumlah yang
Diterima
1
2
3
4
5
6
ditolak
3
4
5
6
7
8
8
Sampel I sebesar 20 unit kita perbaiki proses produksi jika jumlah produk yang
rusak 3 unit atau lebih dan kita teruskan jika jumlah yang rusak kurang dari 3.
Sampel II kalau diperlukan dengan 20 unit sebagai sampel dengan syarat proses
produksi diteruskan kalau produk yang rusak 1 unit dan diperbaiki kalau unit
produk yang rusak 4 atau lebih, proses ini diteruskan kalau masih dipandang
belum cukup.
Proses ini dipandang cukup apabila jumlah yang diterima dan ditolak sama.
Handout Statistik 2
atas dasar ukuran sampel, antara lain dilihat dari sudut pertimbangan biaya, serta
keterbatasan waktu untuk mengadakan perhitungan terhadap seluruh populasi.
Beberapa contoh sebagai berikut:
a. Seorang manajer produksi ingin mengetahui apakah proses produksi yang baru
memang lebih baik daripada proses produksi yang lama dengan cara
mengadakan pengamatan terhadap sampel hasil produksi
b. Seorang manajer pemasaran ingin mengetahui kemampuan masyarakat untuk
membeli barang yang ditawarkan dengan mengadakan pengamatan terhadap
tingkat penghasilan masyarakat secara sampel
Kebutuhan akan informasi-informasi di atas tidak mudah dipenuhi tanpa
macam, yaitu:
1.
2.
1.
Adalah pendugaan nilai populasi atas dasar satu nilai dari sampel.
Contoh:
Rata-rata sampel ( x ) = Rp. 100.000 maka kita akan menduga nilai rata-rata
populasi () = Rp. 100.000.
Proporsi sampel (x/n) = 0,60 maka proporsi populasi (P) akan kita duga sebesar
0,60 pula
Cara pendugaan atas dasar satu nilai ini sangat sederhana, namun nilai
penduga yang demikian sukar sekali dapat identik dengan parameter yang kita
duga.
Cara
pendugaan
yang
didasarkan
pada
satu
nilai
ini,
tidak
Handout Statistik 2
2.
Pendugaan interval
Hasil dari pendugaan interval ini diharapkan akan lebih obyektif. Pendugaan
interval akan memberikan kita nilai parameter dalam suatu interval dan bukan
nilai tunggal.
st
Handout Statistik 2
kurva normal untuk luas daerah kurva (0,5000 0,0250 = 0, 4750) nilai z =
1,96; maka parameter akan terletak antara x -1,96 x dan x +1,96 x
B. Ciri-Ciri Suatu Penduga Yang Baik
Beberapa kriteria yang lazim digunakan untuk menetapkan suatu penduga yang
baik adalah:
1.
2.
Konsistensi (consistency)
3.
Efisiensi (efficiency)
4.
Sufisiensi (sufficiency)
1.
Tidak Bias
Suatu penduga dikatakan tidak bias, apabila penduga tersebut secara
Handout Statistik 2
2.
2.
3.
Konsistensi
a.
Suatu
penduga
dikatakan
Handout Statistik 2
c.
Jika
sampel
semakin
besar
e.
Rata-rata
sampel
(x )
3.
Efisiensi
a. Suatu penduga dikatakan efisien apabila penduga tersebut memiliki varians yang
kecil. Apabila ada 2 penduga yang tidak bias, maka penduga yang memiliki
varians yang lebih kecil yang diukur berdasarkan pada efisiensi relatif (relative
efficiency) merupakan penduga yang lebih baik, karena lebih efisien.
b. Sebagai contoh dapat dikemukakan penduga parameter yang terdiri dari ratarata sampel dan median sampel, keduanya merupakan penduga yang tidak bias
terhadap rata-rata populasi. Kedua penduga statistik ini masing-masing memiliki
varians, yaitu varians rata-rata dan varians median.
c. Kedua varians tersebut dapat dibandingkan dalam bentuk efisiensi relatif.
Varians rata-rata (mean):
x2
2
n
Varians median:
2 Med
2
2n
Handout Statistik 2
= 3,14159
Efisiensi relatif:
2 n
2x
2
Ef 2
0,64 (64%)
2
Med 2n
Efisiensi relatif sebesar 64% artinya varians rata-rata hanya 64% dari varians
median. Ini berarti untuk memperoleh varians yang sama, rata-rata hanya
memerlukan sampel dengan n = 64 elemen. Sedangkan untuk median diperlukan
sampel dengan n = 100 elemen.
Dengan diagram, kedua penduga tersebut dapat digambarkan sebagai berikut:
d. Apabila kita memiliki 2 penduga yaitu rata-rata dan median sebagai penduga
parameter, sedangkan varians nilai rata-rata lebih kecil daripada varians median,
maka efisiensi relatifnya dapat dinyatakan dengan:
Varians nilai rata-rata
Efisiensi relatif =
x 100%
Varians median
Karena varians yang lebih kecil menjadi pembilang, maka nilai dari efisiensi
relatif ini terletak antara 0 dan 100% (0 efisiensi relatif 100%)
Oleh karena itu, penduga yang mempunyai varians lebih kecil dikatakan lebih
efisien, sebab untuk mencapai varians yang sama hanya memerlukan elemen
sampel yang lebih kecil
4.
Sufisiensi
Suatu penduga dikatakan sufisien (cukup) apabila penduga itu memiliki seluruh
informasi tentang parameter yang akan diduga. Dengan kata lain tidak ada ukuran
statistik lain sebagai penduga yang lebih baik untuk menduga parameter.
Sebagai contoh dapat dikemukakan bahwa rata-rata sampel adalah penduga yang
sufisien terhadap rata-rata populasi, sebab selain rata-rata sampel tidak ada ukuran
lain misalnya: media atau modus yang dapat dipergunakan sebagai penduga yang
Handout Statistik 2
lebih baik. Demikian pula proporsi sampel (x/n) merupakan penduga yang sufisien
bagi proporsi populasi (P).
C. Metode Maximum Likelihood
Metode ini dikembangkan oleh RA Fisher pada tahun 1920 yang merupakan
metode penting untuk pendugaan titik.
Contoh: Probabilitas terjadinya sisi gambar pada sebuah mata uang yang tidak
setimbang misalkan: 1/4 atau 3/4. Proporsi sisi gambar yang sebenarnya tidak
diketahui. Untuk mengetahui apakah proporsi yang sebenarnya 1/4 atau 3/4,
dilakukan suatu percobaan pelemparan mata uang sebanyak 3 kali, dengan hasil
P(H,T,H) atau P(Gambar, Tulisan, Gambar). Dengan probabilitas 1/4 diperoleh hasil
sebagai berikut:
P(H,T,H) = (1/4) (3/4) (1/4) = 3/64
Dengan probabilitas 3/4 diperoleh hasil sebagai berikut:
P(H,T,H) = (3/4) (1/4) (3/4) = 9/64
Dari perhitungan tersebut dapat diketahui bahwa hasil percobaan menunjukkan
probabilitas = 3/64 untuk P=1/4 dan probabilitas = 9/ 64 untuk P = 3/4. Dari 2
keadaan, nampaknya P=3/4 merupakan penduga yang lebih mendekati kenyataan
daripada P=1/4. P=3/4 lebih banyak memberikan informasi daripada P=1/4.
n x
dLnL P
x1 P n x 1 1 P 0
dP
x n x
P
1 P
Bab 4: Pendugaan Secara Statistik
x 1 P n x P
Handout Statistik 2
x xP nP xP nP x
P
x
n
Kriteria suatu sampel dikatakan besar, apabila sampel tersebut lebih besar
daripada 30 (n > 30). Penduga interval ini ada 2 yaitu:
a. Pendugaan terhadap parameter rata-rata ().
b. Pendugaan terhadap parameter proporsi (P)
Untuk
mengadakan
pendugaan
3.
x z x z
n n
dimana :
= rata-rata sampel
= jumlah sampel
4.
5.
Handout Statistik 2
s s
x z x z
n n
6.
s N n s N n
x z x z
n N 1 n N 1
Pendugaan parameter dengan diketahui dan populasi tidak terbatas
i.
Rumus
x z x z
n n
x z0,025xx x z0,025xx
dimana: x
Handout Statistik 2
$100
$10
100
ii.
Jika sampel yang random dipilih dari populasi yang terbatas tanpa
pemulihan, x cenderung akan kurang dari
. Berapa selisihnya
adalah:
N n N n
x z x z
n N 1 n N 1
Handout Statistik 2
$100
100
500 100
10 0,895 8,95
500 1
iii.
rumus
s s
x z x z
n n
Contoh: sebuah sampel random terdiri dari 100 orang pedagang kaki
lima yang dipilih dari seluruh pedagang kaki lima di sebuah kota. Ratarata tingkat keuntungan yang diperoleh 20% dengan deviasi standar 2%.
Dengan mempergunakan interval keyakinan 95%, berapa tingkat
keuntungan semua pedagang kaki lima di kota itu?
Pada soal ini, n = 100, x =20%, s = 2% dan z0,025 = 1,96.
Karena sampelnya cukup besar, dapat diduga dengan x s
Pendugaan
parameter
proporsi
dapat
dilakukan
dengan
Handout Statistik 2
x nz
-
x n 1 x n
x n 1 x n
P x nz
n
n
30 100 1.96
30 1001 30 100
30 1001 30 100
P 30 100 1.96
100
100
x nz
x n 1 x n
x n1 x n
N n
P x nz
N 1
n
N n
N 1
Kriteria suatu sampel yang kecil adalah apabila n 30. Pada sampel
x
s/ n
Handout Statistik 2
Apabila n makin kecil, distribusi t akan makin melebar. Sebaliknya makin besar nnya distribusi t akan mendekati distribusi normal.
Tabel t tidak disusun berdasarkan besarnya sampel n, tetapi disusun
a.
Terbatas
-
x ts n x ts n
Dengan menggunakan rumus di atas, maka didapat hasil sebagai berikut:
500 2,131 (100/4) < < 500 + 2,131 (100/4)
500 53,275 < < 500 + 53,275
446,725 < < 553,275
Handout Statistik 2
b.
-
N n
N 1
100 1
84
99
0,848 0,92
x nt
-
x n 1 x n
x n 1 x n
P x nt
n
n
adalah sama prosedurnya dengan pendugaan interval untuk rata-rata dan proporsi.
Pendugaan Parameter 1 - 2 jika 1 dan 2 diketahui
a.
-
x1 x2 z x1 x 2 1 2 x1 x2 z x1 x2
dimana
Handout Statistik 2
12 22
x1 x 2
n1 n2
-
81000000 25000000
106000000 / 90 1085
90
90
b.
-
x1 x2 t sx1 x2 1 2 x1 x 2 t sx1 x2
dimana
sx1 x 2
-
(n1 1) s12 (n 2 1) s 22
1 n1 1 n 2
n1 n2 2
x 2 =rata-rata
Handout Statistik 2
112 682
1 9 1 9 3,32
16
sx1 x 2
x1 x 2
x
x
z s P1 P 2 P1 P2 1 2 z s P1 P 2
n1 n 2
n1 n2
dimana
s P1 P 2
-
x1 n1 1 x1 n1 x 2 n 2 1 x 2 n2
n1
n2
(0,75)(0,25) (0,50)(0,50)
120
120
0,003645 0,06
(0,75 0,50) 1,96 (0,06) < P1 P2 < (0,75 0,50) + 1,96 (0,06)
0,25 0,1176
Dalam teori sampel telah dijelaskan bahwa jika n besar, maka distribusi
sampling akan menyerupai kurva normal. Dengan demikian kita dapat mengatakan
bahwa, jika suatu random sampel cukup besar, dengan interval keyakinan 95%
deviasi standar populasi akan terletak dalam jarak:
Handout Statistik 2
s 1,96
2n
s 1,96
2n
Contoh:
Sampel sebesar 8 menunjukkan deviasi standar = 3. Dengan interval keyakinan 95%,
tentukan interval .
Jawaban:
n = 8, s = 3 dan z0,025 = 1,96
3 1,96
3
16
3
16
Misalkan kita ingin mengetahui berapa besarnya sampel yang akan kita
gunakan agar dengan interval keyakinan 95%, selisih rata-rata populasi yang
sesungguhnya tidak lebih dari 5 secara searah. Dapat digambarkan sebagai berikut:
atau
E = Error = Penyimpangan
s = standar deviasi sampel
Dari rumus diatas dapat ditentukan besarnya sampel (n) sebagai berikut:
Handout Statistik 2
z.
n
E
dimana
n
= besarnya sampel
15,36 15 sampel
interval proporsi:
P P 1
n
atau
P (1 P )
E/z
n
z 2 P (1 P )
E2
Apabila P tidak diketahui, maka P(1-P) diganti dengan 1/4, yaitu nilai maksimum
untuk P(1-P).
Contoh: Perusahaan penjual alat-alat kosmetik ingin menduga proporsi konsumen
yang menyukai produknya. Dalam proses pendugaan ini pengusaha ingin agar selisih
dugaannya tidak melebihi 2% dari parameternya, sedangkan interval keyakinan yang
dikehendaki 95%. Berapa besarnya sampel bagi pendugaan proporsi populasi ini?
Jawaban:
(1,96) 2 (1 / 4)
2,401 2 sampel
(0,02) 2
Handout Statistik 2
5. PENGUJIAN HIPOTESA
A. Arti dan Pentingnya Pengujian Hipotesa
Hipotesa adalah suatu anggapan atau pendapat yang diterima secara tentatip
untuk menjelaskan suatu fakta atau yang dipakai sebagai dasar bagi suatu
penelitian.
Beberapa contoh hipotesa dapat dikemukakan sebagai berikut:
a.
Seorang
manajer
produksi
menyatakan
bahwa
c.
d.
bersifat operasional.
Menurut sifat hipotesa kita dapat membedakan yang bersifat kualitatif, misalkan
seorang hakim menganggap seseorang bersalah atau kuantitatif yang disebut sebagai
hipotesa statistik, misalkan rata-rata pengeluaran sebulan Rp. 200.000.
Hipotesa statistik dirumuskan sebagai suatu pernyataan tentang nilai suatu
parameter, misalnya rata-rata populasi, proporsi populasi, varians populasi dan
sebagainya.
B. Prosedur Pengujian Hipotesa
Pengujian suatu hipotesa pada hakekatnya dapat disusun dalam beberapa tahap.
1.
2.
Handout Statistik 2
3.
4.
1.
b.
c.
Apabila kita menerima hipotesa nol maka hipotesa alternatif kita tolak
atau kalau kita menolak hipotesa nol maka hipotesa alternatif kita terima.
2.
Handout Statistik 2
Apabila hipotesa nol benar, maka taraf nyata ini menunjukkan persentase dari
rata-rata sampel atau nilai statistik yang terletak di luar batas kepercayaan atau
confidence level.
Diagram berikut menunjukkan taraf nyata 5% yang di dalam kurva normal
terletak pada ujung kurva masing-masing seluas 2,5%.
Menurut tabel daerah kurva normal, luas daerah kurva sebesar 95% akan
terletak dalam jarak 1,96 yang menunjukkan bahwa di daerah ini tidak ada
perbedaan yang nyata (significant) antara nilai statistik dan nilai parameter yang
dinyatakan sebagai hipotesa. Daerah ini disebut daerah penerimaan hipotesa
atau acceptance region. Sedang kedua ujung kurva dengan luas masing-masing
2,5% merupakan daerah penolakan hipotesa, karena daerah ini menunjukkan
adanya perbedaan yang nyata atau significant antara nilai statistik dan nilai
parameternya yang dijadikan hipotesa.
i.
Di dalam pemilihan taraf nyata ini tidak ada standar ukuran yang pasti.
Beberapa nilai taraf nyata yang banyak dipergunakan adalah 10%, 5% dan 1%.
Handout Statistik 2
Dari gambar di atas ditunjukkan bahwa semakin besar nilai taraf nyata
maka semakin sempit daerah penerimaan hipotesa atau semakin besar
probabilitas untuk menolak hipotesa.
ii.
Handout Statistik 2
H1 0 1000 jam
Perumusan hiptoesa alternatif yang demikian dimaksudkan karena produsen
tidak menghendaki hasil produksinya mempunyai daya tahan yang lebih kecil
atau lebih besar dari rata-rata daya tahan yang telah ditetapkan sebesar 1000
jam.
Jika daya tahan lebih kecil dari daya tahan rata-rata yang telah ditetapkan,
maka perusahaan tersebut akan kehilangan konsumennya. Sebaliknya jika
daya tahan lampu pijar jauh di atas daya tahan rata-rata yang telah
ditetapkan maka perusahaan akan menghadapi biaya yang tinggi.
-
Handout Statistik 2
3.
st parameter
st
st
parameter
= hipotesa parameternya
st
Sebaliknya apabila sampelnya kecil dalam hal ini n<30 maka akan
digunakan statistik uji t sebagai dasar pengujian hipotesa dirumuskan sebagai
berikut:
t
st parameter
st
Pengambilan Keputusan
-
Handout Statistik 2
Hipotesa
Keputusan
Menerima H0
Jika H0 benar
Keputusan betul
Probabilitas = 1 -
(tingkat keyakinan)
Kesalahan jenis I
Menolak H0
Probabilitas =
Probabilitas = 1 -
(taraf nyata)
(kuasa pengujian)
Misalkan
kita
mengadakan
pengujian
hipotesa
dengan
Handout Statistik 2
/ n
Apabila = Rp. 10.000, z0,05 = 1,64, = 500 dan n = 100. Nilai kritis = Rp.
10.082.
Jika H0 benar, maka = probabilitas kesalahan
a.
b.
kita
tentukan
besarnya sampel (n) dan akhirnya mengatur pengujian hipotesa yang sifatnya
meminimumkan kesalahan jenis II.
Bab 5: Pengujian Hipotesa
Handout Statistik 2
Apabila
besarnya
sampel
46,08 52
2,96
2
z2
53,92 52
0,96
2
Handout Statistik 2
. Hal
tentang
Kuasa
1.
setiap
kali
pengiriman
obat,
rumah
sakit
mengadakan
10%
dan
menyatakan
bahwa
dosis
obat-obatan
tersebut
Karena pengujian hipotesa ini diarahkan pada hipotesa alternatif yang lebih
kecil, maka pengujian hipotesanya mempergunakan 1 sisi di sebelah kiri. Taraf
nyata 10% menunjukkan nilai z = -1,28. Jadi batas daerah penerimaan hipotesa
adalah:
100 1,28 (0,28) = 100 0,36 = 99,64 cc
Nilai ini merupakan batas terendah dari dosis obat yang dapat ditolerir oleh
rumah sakit untuk dapat diterima.
Handout Statistik 2
Nilai rata-rata sampel sebesar 99,75 cc akan terletak pada daerah penerimaan,
artinya dosis 99,75 cc masih dapat ditolerir.
3.
Untuk
99,42
cc
berarti
(99,42
Untuk
99,64
cc
berarti
(99,64
Untuk
99,80
cc
berarti
(99,80
Handout Statistik 2
5.
berbagai kasus, yakni: apabila deviasi standar populasinya diketahui dan apabila
deviasi standar populasinya tidak diketahui.
Apabila deviasi standar populasi tidak diketahui, maka dipergunakan deviasi
standar sampel.
Selanjutnya dalam pengujian hipotesa terhadap nilai rata-rata ini akan
dibedakan dalam hal sampel yang besar (n > 30) dan sampel kecil (n 30).
Untuk sampel yang besar akan digunakan distribusi z dan untuk sampel yang
kecil digunakan distribusi t.
a.
Handout Statistik 2
1.
H1 : 11 jam
2.
Taraf
nyata
10%
Statistik
uji,
distribusi z
z
/ n
12 11
3,5 / 49
1 / 0,5 2
4.
Kesimpulan:
>
Apabila dipergunakan taraf nyata 5%, maka menurut tabel z, nilai z = 1,96.
Karena hasil statistik uji = 2 masih lebih besar daripada 1,96; maka
kesimpulan tidak berubah.
Handout Statistik 2
Apabila dipergunakan taraf nyata 1%, maka menurut tabel z, nilai z = 2,58.
Karena hasil statistik uji = 2 dan lebih kecil daripada 2,58, maka kesimpulan
berubah yang berarti perbedaan tidak signifikan, sehingga hipotesa diterima.
x
s/ n
Contoh: Suatu perusahaan minuman botol yang telah terisi rata-rata 32 ons,
sesuai dengan standar yang telah ditetapkan oleh bagian produksi. Dalam
pemasaran akhir-akhir ini ternyata banyak keluhan dari para konsumen,
sehingga lembaga konsumen mengadakan pemeriksaan terhadap produksi
teh botol dengan mengambil sampel sebanyak 100 botol. Ternyata berat ratarata 31,8 dengan deviasi standar 2 ons.
Dengan mempergunakan taraf nyata 5%, apakah keluhan para konsumen
terhadap produksi teh botol ini dapat dibenarkan?
Pemecahan masalah tersebut di atas adalah sebagai berikut:
1.
H0 : = 32 ons
H1 : 32 ons
2.
3.
Handout Statistik 2
x
s/ n
4.
31,8 32
0,2 / 0,2 1
2 / 100
b.
1.
Handout Statistik 2
H0 : = 11 jam
H1 : 11 jam
2.
3.
x
/ n
4.
12 11
3,5 / 9
1 / 1,67 0,6
Dalam soal di atas, apabila kita menggunakan pengujian 1 sisi, maka langkahlangkah pengujian hipotesa menjadi sebagai berikut:
1.
H0 : = 11 jam
H1 : > 11 jam
2.
3.
Handout Statistik 2
2.
x
s/ n
/ n
0,20 0,25
0,018 / 9
0,05
8,3
0,006
4. Kesimpulan: Hasil statistik uji -8,3 adalah lebih kecil daripada -2,306,
sehingga perbedaannya signifikan. Hipotesa ditolak. Kesimpulan ini
dapat ditunjukkan dalam gambar berikut:
Handout Statistik 2
2.
Dalam rangka untuk menerima atau menolak hipotesa yang berupa proporsi
akan digunakan statistik uji sebagai berikut:
P P0
P 0 (1 P0 )
n
Hal 73 dari 148
Handout Statistik 2
Pada hakekatnya P tidak dapat diketahui dan umumnya diganti dengan x/n,
sehingga statistik ujinya menjadi sebagai berikut:
x / n P0
P 0 (1 P0 )
n
terhadap para karyawan yang telah mengikuti pendidikan dan latihan dalam rangka
program pengembangan karyawan. Hasil pendidikan dan latihan menyatakan bahwa
80% atau 0,80 dari para karyawan yang telah mengikuti pendidikan dan latihan
akan memenui persyarataan promosi jabatan. Dalam rangka ini bagian personalia
mengambil langkah mengadakan wawancara langsung dari 150 karyawan yang telah
mengikuti pendidikan dan latihan sebagai sampel dan ternyata hanya 70% dari
sampel yang dapat dipertimbangkan dalam promosi jabatan.
Manajer
personalia
ingin
memperoleh
keyakinan
terhadap
hipotesa
yang
mengatakan bahwa 80% dari hasil pendidikan dan latihan akan memenuhi
persyaratan promosi jabatan dengan menggunakan taraf nyata 5%.
Penyelesaian masalah tersebut adalah sebagai berikut:
1.
H0 : P = 0,8
H1 : P 0,8
2.
Taraf nyata 5% dengan 2 sisi pengujian, maka nilai z0,025 adalah 1,96.
3.
4.
x / n P0
P 0 (1 P0 )
n
0,70 0,80
(0,80)(0,20)
150
Kesimpulan: Hasil statistik uji -3,3 adalah lebih kecil daripada -1,96,
sehingga perbedaan antara sampel dan hipotesa adalah signifikan. Jadi
mengatakan bahwa 80% dari karyawan yang mengikuti pendidikan dan latihan
memenuhi persyaratan promosi ditolak. Kesimpulan ini dapat ditunjukkan
dalam gambar berikut:
H0 : P = 0,8
Handout Statistik 2
H1 : P < 0,8
2.
Taraf nyata 5% dengan 1 sisi pengujian dengan sisi pengujian sebelah kiri,
maka nilai z = -1,64.
3.
4.
Kesimpulan: Hasil statistik uji -3,3 adalah lebih kecil dari -1,64, maka
perbedaan dikatakan signifikan. Jadi hipotesa ditolak. Kesimpulan ini dapat
ditunjukkan dalam gambar berikut:
3.
Handout Statistik 2
Dari gambar di atas jelas bahwa perbedaan 2 nilai rata-rata adalah perbedaan
antara x1 dan x 2 . Perbedaan ini akan positifif apabila x1 lebih besar dari x 2 ,
sedangkan apabila x1 lebih kecil daripada x 2 maka hasilnya negatif.
Rata-rata distribusi sampling perbedaan 2 nilai rata-rata dinotasikan dengan
x1 x2
12 22
n1
n2
dimana:
n1
n2
Handout Statistik 2
a.
Pengujian Hipotesa terhadap Perbedaan 2 Nilai RataRata Apbila Standar Deviasi Populasi Diketahui untuk Sampel Besar
Pengujian hipotesa terhadap perbedaan 2 nilai rata-rata dengan sampel besar yaitu
apabila jumlah sampel atau n lebih dari 30. Apabila kedua standar deviasi populasi
diketahui, maka statisik uji dirumuskan sebagai berikut:
( x1 x 2 ) ( 1 2 )
12 22
n1 n2
( x1 x 2 )
12 22
n1 n2
Contoh:
Sebuah perusahaan mebel ingin membandingkan efisiensi dari 2 sistem manajemen
dalam proses pembuatan mebel.
Dalam pembuatan mebel dibedakan 2 macam proses produksi, yaitu proses
mempersiapkan bahan setengah jadi dan proses menjadikan bahan jadi (finishing).
Untuk mengadakan pengamatan diambil jumlah sampel hari kerja yang sama yaitu
40 hari.
Dari mesin yang menghasilkan proses I dihasilkan rata-rata 30 unit, sedang proses II
menghasilkan rata-rata 28 unit.
Berdasarkan pengalaman yang lalu, deviasi standar proses I = 3, sedangkan proses II
= 2. Dengan menggunakan taraf nyata 5%, dapatkah kita mengatakan bahwa kedua
proses produsi tersebut mempunyai efisiensi yang berbeda?
Penyelesaian masalah tersebut adalah sebagai berikut:
1.
H0 : 1 = 2
H1 : 1 2
2.
3.
4.
(30 28)
9
4
40 40
2
0,325
2 / 0,57 3,5
Kesimpulan: Hasil statistik uji 3,3 adalah lebih besar dari 1,96, maka
perbedaan dikatakan signifikan. Jadi hipotesa ditolak. Kesimpulan ini dapat
ditunjukkan dalam gambar berikut:
Handout Statistik 2
b.
Pengujian Hipotesa terhadap Perbedaan 2 Nilai Ratarata Apabila Standar Deviasi Populasi Tidak Diketahui Untuk Sampel Besar
Menggunakan rumus sebagai berikut:
( x1 x 2 )
s12 s 22
n1 n2
Pengujian Hipotesa terhadap Perbedaan 2 Nilai RataRata Apabila Standar Deviasi Populasi Tidak Diketahui untuk Sampel Yang Kecil
Dalam pengujian hipotesa terhadap perbedaan 2 nilai rata-rata dengan sampel kecil
maka dipergunakan distribusi t dengan memperhatikan derajat kebebasan n-1.
Statistik uji untuk pengujian hipotesa ini menjadi:
( x1 x 2 )
(n1 1) s (n 2 1) s 22
(n1 n 2 2)
2
1
1 1
n1 n2
Contoh:
Seorang manajer produksi suatu perusahaan yang menghasilkan pompa air ingin
membandingkan efisiensi waktu perakitan 2 jenis pompa tangan jenis A dan B.
Untuk pompa tangan jenis A dipilih sampel sebanyak 10 buah. Setelah diadakan
pengamatan dalam perakitannya membutuhkan waktu rata-rata 20 menit setiap unit
pompa dengan deviasi standar 3 menit. Sedangkan untuk jenis B dipilih sampel 15
unit ternyata membutuhkan waktu rata-rata untuk perakitan 21 menit dengan
deviasi standar 2 menit.
Untuk pengujian hipotesa ini ditetapkan taraf nyata 5%. Penyelesaian masalah ini
adalah sebagai berikut:
1.
H0 : 1 = 2
Handout Statistik 2
H1 : 1 2
2.
3.
( 20 21)
(9)(3) (14)(2)
(10 15 2)
4.
1
1
10 15
1
81 56
23
1
6
1
(5,96)(0,17)
1 / 1,007 0,99
Kesimpulan: Hasil statistik uji -0,99 > -2,069 maka perbedaan dikatakan
tidak signifikan. Jadi hipotesa diterima. Kesimpulan ini dapat ditunjukkan dalam
gambar berikut:
4.
Dalam pengujian hipotesa terhadap perbedaan 2 proporsi ini akan dapat dijawab
pertanyaan-pertanyaan yang muncul berkaitan dengan apakah perbedaan 2 proporsi
sampel disebabkan karena faktor kebetulan ataukah disebabkan oleh faktor-faktor
yang lain.
Handout Statistik 2
1.
H0 : p1 - p2 = 0
H1 : p1 - p2 0
2.
3.
x1 / n1 x 2 / n2
P(1 P )(1 n1 1 n 2 )
dimana
nilai
x1 x 2
n1 n 2
sehingga dengan:
x1 = 75, n1 = 150, x1/n1 = 75/150 = 0,50
x2 = 120, n1 = 200, x2/n2 = 120/200 = 0,60
75 120
195 / 350 0,56
150 200
4.
0,50 0,60
(0,56)(0,44)(1 150 1 200)
0,10
(0,2464)(0,01167 )
Kesimpulan: Hasil statistik uji -1,852 > -2,58 maka perbedaan dikatakan
tidak signifikan. Jadi hipotesa diterima. Jadi tidak ada perbedaan yang besar
proporsi para konsumen yang menyukai produk baru dari perusahaan A dan B.
Kesimpulan ini dapat ditunjukkan dalam gambar berikut:
Handout Statistik 2
Distribusi variabel random x1, x2, .., xn yang normal memiliki E(x) = n dan
varians (x) = 2. Variabel random normal demikian dapat diubah dalam bentuk
standar dengan rumus:
z
1
2 ( n ) / 2 ( n / 2 ) 1e (1 / 2 ) ; 0
(n / 2 1)!
dimana
n = jumlah variabel random independen yang dijumlahkan. Variabel random
independen ini memiliki derajat kebebasan sebesar n.
Tabel Kai kuadrat dapat dilihat pada lampiran. Menurut tabel tersebut apabila
derajat kebebasan = 10, dan taraf nyata (signicant level) =10% maka akan diperoleh
nilai x2 = 15,99.
Dapat digambarkan sebagai berikut:
Handout Statistik 2
Menurut gambar di atas hipotesa akan ditolak untuk semua nilai-nilai yang lebih
besar daripada 15,99. Sedangkan untuk nilai-nilai kurang dari atau sama dengan
15,99 hipotesa diterima.
Pada hakekatnya rata-rata dan varians distribusi x 2 dimana semua variabel yang
berjumlah n adalah independen dengan derajat kebebasan = n, dinyatakan dengan:
E ( x 2 ) x 2 n
variabel
random
dengan
distribusi
normal,
kita
selalu
dapat
menstandarisir.
zi
xi
; i = 1,2.n
i
Jika x12 dan x22 independen dan memiliki distribusi x 2 dengan derajat
kebebasan sebesar n1 + n2 maka x12 + x22 akan didistribusikan sebagai x2 dengan
derajat kebebasan kebebasan sebesar n 1 + n2. Kaedah penjumlahan ini berlaku
umum bagi sejumlah k variabel x2 yang independen.
Handout Statistik 2
N
8
11
12
9
40
Dari tabel di atas p = 1/4 dan n =40. Distribusi bersama (joint distribution) n1, n2, n3
dan n4 disebut distribusi multinomial dengan fungsi kepadatan (density function):
f ( n1 ,n2 ,n2 ,n4 )
n!
n
n
n
n
p1 1 p 2 2 p3 3 p 4 4
n1 ! n 2 ! n3 ! n 4 !
xi
ni npi
np i
2
2
2
2
dan jika x1 x 2 x3 x4
x2
(ni npi ) 2
npi
x2
(Oi E i ) 2
Ei
atau
( fo fe )2
f
e
dimana
Bab 6: Distribusi Kai Kuadrat (x2)
Handout Statistik 2
Oi
Ei
a.
b.
c.
d.
pengambilan keputusan
Jumlah Konsumen
210
310
170
85
225
1000
Apabila proporsi preferensi konsumen untuk setiap merk ban dinyatakan dengan
PA, PB, PC, PD, PE, kita dapat merumuskan hipotesa nol dan hipotesa alternatifnya
sebagai berikut:
a. H0 : PA = PB = PC = PD = PE = 0,20
H1 : PA PB PC PD PE 0,20
b. Taraf nyata 5% dengan derajat kebebasan k -1 = 5 -1 = 4. Menurut tabel, x 2
= 9,488.
c. Statistik uji yang dipergunakan adalah sebagai berikut:
x2
( fo fe )2
fe
Prefensi
Frekuensi
Frekuensi
Konsumsi
Observasi
Teoritis
(fo-fe)
(fo-fe)2
(f0-fe)2
fe
Handout Statistik 2
Ban
A
B
C
D
E
Jumlah
(fo)
210
310
170
85
225
1000
(fe)
200
200
200
200
200
1000
10
110
-30
-115
25
0
100
12100
900
13225
625
26950
x2
0,500
60,500
4,500
66,125
3,125
134,750
( fo fe )2
= 134,750
fe
d. Kesimpulan:
Hasil statistik uji x2 = 134,750 lebih besar daripada 9,488. Berarti ada
perbedaan yang significant antara frekuensi hasil observasi dengan
frekuensi teoritis, sehingga hipotesa yang mengatakan bahwa tidak ada
perbedaan proporsi konsumsi ban untuk ke-5 merk ditolak (H 0 ditolak).
Jelasnya dapat dilihat dengan gambar berikut:
2.
Pengujian
kompabilitas
digunakan
jika data
diklasifikasikan menurut satu atribut tunggal (single atribute) maupun jika kita
ingin menguji distribusi probabilitas populasi hipotesis.
Apabila klasifikasi data sampel maupun data populasi dalam beberapa atribut
sedang distribusi probabilitasnya tidak diketahui, maka pengujian kompabilitas
sulit digunakan. Misalkan setiap konsumen dapat diklasifikasikan menurut
penghasilannya dan kualitas sabun mandi yang dipergunakan, sedang proporsi
tiap golongan dalam populasi tidak diketahui. Persoalan yang ingin diketahui
adalah apakah ada hubungan antara penghasilan dan kualitas sabun mandi yang
dipergunakan. Pengujian yang demikian disebut pengujian sifat independensi.
Dalam pengujian hipotesa ini kita hanya sampai pada kesimpulan apakah kedua
atribut tersebut mempunyai sifat independen atau tidak.
a.
yang
terdiri
dari
keluarga
konsumen
sabun
mandi
dapat
Handout Statistik 2
Penghasilan
Tinggi (A1)
Rendah (A2)
Jumlah Kolom (Nj)
Jenis Baris
(Ni)
N1
N2
N
Keterangan:
N
N11
N1
= Penjunlahan baris 1
N.1
= Penjumlahan Kolom 1
= Indeks baris
= Indeks kolom
Jenis Baris
(Ni)
P1
P2
1,0
Keterangan:
P11
P.1 + P.2
= N.1/N + N.2/N = 1
P1 +P2
= N1/N + N2/N = 1
b.
Jenis Baris
(ni)
n1
Hal 86 dari 148
Handout Statistik 2
Rendah (A2)
Jumlah Kolom (Nj)
n21
n.1
n22
n.2
n2
n
Misalkan sebuah sampel sebesar n = 300 yang dipilih dari populasi, ternyata
yang berpenghasilan tinggi n1 = 100, n2 = 200, n.1 = 150 dan n.2 = 150, dan jika
kelompok
yang
berpenghasilan
tinggi
sejumlah
40
orang
ternyata
Penghasilan
Tinggi (A1)
Rendah (A2)
Jumlah Kolom (Nj)
Jenis Baris
(ni)
n1 = 100
n2= 200
300
Penghasilan
Tinggi (A1)
Rendah (A2)
Jumlah Kolom (Nj)
Jenis Baris
(ni)
100
200
300
b.
x2
x2
c.
( fo fe )2
fe
40 50 2
50
6
50
100
100
Kesimpulan:
Hasil statistik uji = 6 adalah lebih besar daripada 3,841. Berarti perbedaanya
signifikan atau cukup besar, sehingga hipotesa ditolak. Yang berarti bahwa
Handout Statistik 2
tidak ada hubungan antara tingkat penghasilan dengan sabun mandi yang
dipergunakan.
3.
Pengujian untuk mengetahui apakah 2 sampel atau lebih bersifat homogen atau
sama disebut pengujian sifat homogenitas atau test of homogenity.
Sample ALTA
Sampel 1
Sampel 2
10
10
20
10
30
40
20
30
20
10
n1 = 100
n2 = 100
Nilai
A
B
C
D
F
Jumlah
20
30
70
50
30
n = 200
b.
c.
Sebelum kita menghitung nilai x2, kita menghitung frekuensi teoritisnya lebih
dahulu dan membandingkannya dengan frekuensi observasinya.
fe 11 = n1 x (n1/n) = 100 x 20/300 = 10
fe 21 = n1 x (n1/n) = 100 x 30/300 = 15
fe 31 = n2 x (n1/n) = 100 x 70/300 = 35
Bab 6: Distribusi Kai Kuadrat (x2)
Handout Statistik 2
Sample ALTA
Sampel 1
Sampel 2
fo
Fe
fo
fe
10
20
30
20
20
(10)
(15)
(35)
(25)
(15)
10
10
40
30
10
(10)
(15)
(35)
(25)
(15)
Sampel 1
Sampel 2
(fo f2)2
(fo f2)
fe
0/10 = 0
25/15 = 1,6
25/35 = 0,7
25/25 = 1
25/15 = 1,6
fe
0/10 = 0
25/15 = 1,6
25/35 = 0,7
25/25 = 1
25/15 = 1,6
Jumlah
()
0
3,2
1,4
2,0
3,2
x2 = 9,8
d.
Kesimpulan:
Hasil statistik uji 9,8 lebih besar daripada 9,48. Berarti ada perbedaan yang
signifikan sehingga hipotesa ditolak. Dapat dijelaskan dalam gambar berikut:
Handout Statistik 2
7. ANALISA VARIANS
Pembahasan sebelumnya menyatakan bahwa distribusi kai kuadrat (x 2)
kesimpulan apakah sampel tersebut berasal dari populasi yang memiliki nilai ratarata yang sama.
Contoh: analisa varians dapat digunakan untuk membandingkan daya tahan 4
macam
produksi
ban.
Membandingkan
macam
metode
latihan
yang
mengadakan evaluasi terhadap 3 metode pendidikan dan latihan bagi karyawankaryawannya yang baru.
Ada 3 macam metode pendidikan dan latihan sebagai berikut:
1.
2.
3.
Untuk keperluan penelitian ini dipilih sampel 5 orang karyawan yang telah
mengikuti masing-masing metode dan dilakukan pencatatan terhadap hasil produksi
setiap hari yang dapat diselesaikan oleh masing-masing karyawan tersebut seperti
disajikan dalam tabel berikut:
Handout Statistik 2
Metode I
15
18
19
22
11
= 85
x1 = 17
Metode II
22
27
18
21
17
= 105
x 2 = 21
Metode III
18
24
16
22
15
= 95
x 3 = 19
B. Perumusan Hipotesa
Metode analisa varians dipergunakan untuk mengetahui apakah rata-rata dari 3
sampel karyawan yang telah mengikuti pendidikan dan latihan dengan metode yang
berbeda ini mempunyai perbedaan dalam produktifitas ataukah tidak. Dengan kata
lain dapat dikatakan apakah 3 sampel yang masing-masing berupa rata-rata sampel
I, II dan III bersifat dari populasi yang sama.
Perumusan hipotesa nol:
H0 : 1 = 2 = 3
H1 : 1 2 3
Apabila di dalam pengujian hipotesa ini 3 rata-rata sampel sama, kita sampai
pada kesimpulan bahwa 3 macam metode pendidikan dan latihan ini tidak
mempengaruhi produktivitas karyawan.
Sebaliknya apabila ke-3 rata-rata sampel tersebut menunjukkan perbedaan yang
nyata atau berarti signifikan, maka berarti ketiga macam metode pendidikan dan
latihan tersebut mempengaruhi produktivitas karyawan, sehingga perlu adanya
peninjauan kembali terhadap ketiga macam metode pendidikan dan latihan tersebut.
C. Konsep Dasar Analisa Varians
Di dalam analisa varians kita selalu beranggapan bahwa sampel yang dipilih
berasal dari populasi yang normal dengan varians yang sama, kecuali jika sampel
yang dipilih cukup besar, maka anggapan tentang distribusi normal ini tidak
diperlukan.
Di dalam penelaahan 3 macam metode pendidikan dan latihan ini hipotesa nol
merumuskan bahwa ketiga populasi ini mempunyai nilai rata-rata yang sama.
Apabila hipotesa ini benar, maka klasifikasi dalam 3 macam metode dalam tabel di
atas tidak perlu karena semua sampel berasal dari satu populasi.
Analisa varians berdasarkan pada perbandingan 2 macam nilai penduga
terhadap varians populasi (2). 2 nilai penduga varians populasi tersebut adalah:
a.
Handout Statistik 2
b.
Kita dapat menyimpulkan ketiga langkah dalam analisa varians tersebut sebagai
berikut:
1. Tentukan penduga pertama dari varians populasi dari varians antar sampel
2. Tentukan penduga kedua terhadap varians populasi dari varians dalam sampel
3. Bandingkan kedua nilai penduga ini. Jika hasilnya mendekati sama atau hampir
sama berarti hipotesanya benar.
pertama varians populasi dari varians antar sampel. Dalam contoh ada 3 sampel,
varians antar sampel di dalam istilah statistik disebut pula sebagai between column
sample (varians antar kolom).
Rumus varians sampel adalah sebagai berikut:
(x x)
n 1
keseluruhan, maka selanjutnya x diganti dengan x dan x diganti dengan x (ratarata keseluruhan/rata-rata dari rata-rata).
Varians antar sampel dirumuskan sebagai berikut:
S a2
(x x )
n 1
x
19
19
19
17
21
19
S a2
(x -x )
-2
2
0
( x - x )2
4
4
0
( x - x )2=8
8
4
(3 1)
Bertolak pada rumus standard error of mean atau standar error yagn
dirumuskan dengan:
Handout Statistik 2
atau
2 x n
Karena nilai standard error of mean tidak dimiliki, maka nilai ini diganti dengan
standar deviasi antar sampel sebagai penduga pertama dari varians populasi.
Perumusan varians populasi yang diduga menjadi:
2
2 Sa n
2
dimana S a 4 dan n = 5,sehingga:
2 = 4 x 5 =20
E. Cara Perhitungan Varians Dalam Sampel
Penduga varians populasi yang kedua adalah varians dalam sampel.
sebab itu, kita dapat menggunakan salah satu varians sampel sebagai penduga
varians populasi yang kedua.
Penduga terhadap varians populasi ini akan menjadi lebih tepat apabila
kita menggunakan ketiga varians sampel ini sebagai penduga yang kedua.
Varians dalam sampel dirumuskan dengan:
S w2
S12 S 22 ..... S n2
n
Handout Statistik 2
Metode I
Metode II
Metode III
Rata-rata sampel = 17
Rata-rata sampel = 21
Rata-rata sampel = 19
x1 )
( x x1 ) ( x x1 ) 2
X
15
18
19
22
11
-2
1
2
5
-6
x1 =17
=70
S12
4
1
4
25
36
(x
x1 ) 2
(x x )
22
27
18
21
17
1
6
-3
0
4
x2 =21
62
n 1
S w2
( x x1 ) ( x x1 ) 2
( x3 )
x2 )
S 22
1
36
9
0
16
(x
x1 ) 2 =
(x x
n 1
( x x1 ) ( x x1 ) 2
X
18
24
16
22
15
-1
5
-3
3
-4
x 3 =19
(x
60
2
1
25
9
9
16
S2
x1 ) 2 =
(x x )
n 1
F. Pengujian Statistik F
S a2
S w2
Pembilang, dalam hal ini varians antar sampel sebagai penduga varians
populasi merupakan penduga yang baik. Penyebut dalam hal ini varians dalam
sampel sebagai penduga varians populasi merupakan penduga yang baik pula.
Dengan demikian apabila hipotesanya benar, maka nilai pembilang dan penyebut
akan cenderung sama.
G. Distribusi F
Bentuk umum dari kurva distribusi F adalah condong ke kanan dan akan
cenderung menjadi bentuk normal atau simetris apabila derajat kebebasan dari
pembilang dan penyebut semakin besar.
Bentuk ketiga macam kurva distribusi F dapat disajikan dalam gambar berikut:
Handout Statistik 2
Dari gambar di atas dapat dilihat bahwa semakin besar derajat kebebasan dari
pembilang dan penyebut, maka bentuk kurva akan mendekati suatu bentuk kurva
normal atau kurva yang simetris.
H. Derajat Kebebasan dari Distribusi F
Distribusi F mempunyai 2 macam derajat kebebasan, yaitu derajat kebebasan
Dalam menghitung varians antar sampel (Sa2) dalam contoh didasarkan pada 3
nilai varians sampel untuk memperoleh ( x x ) 2 untuk memperoleh ( x x ) 2 .
Apabila kita dapat mengetahui kedua nilai ( x x ) 2 maka untuk menilai yang
ketiga secara otomatis dapat diketahui/ditentukan sehingga kita mengatakan
kehilangan 1 derajat kebebasan dari jumlah sampel (jumlah kolom).
2.
Handout Statistik 2
Contoh: pada taraf nyata 5%, dengan derajat kebebasan pembilang = 2 dan
derajat kebebasan penyebut = 12, maka tabel F = 3,89.
Karena statistik uji F = 1,25 terletak pada daerah penerimaan, maka hipotesa
diterima. Kita dapat menarik kesimpulan bahwa ketiga metode pendidikan dan
latihan tersebut tidak menimbulkan perbedaan dalam produktivitas tenaga kerja.
Sebuah perusahaan pakaian jadi yang besar menerima pesanan berupa produk
baru dalam jumlah yang besar, sehingga diputuskan akan ditunjuk alternatif 5 subkontraktor, yang masing-masing perusahaan sub-kontraktor ini menggunakan 400
orang tenaga kerja. Perusahaan kontraktor sangat menaruh perhatian terhadap
masalah tenaga kerja, sehingga dilakukan penelitian terhadap tingkat absensi para
karyawan pada kelima perusahaan sub-kontraktor selama beberapa hari kerja.
Penelitian ini dimaksudkan untuk mengetahui apakah tingkat persentase absensi
Handout Statistik 2
pada kelima perusahaan sub-kontraktor itu sama atau berbeda, dengan taraf nyata
5%.
Dari hasil pengumpulan data absensi karyawan pada kelima perusahaan sub-
8
7
8
6
11
sampel
6
5
4
3
2
H0 : 1 = 2 = 3 = 4 = 5
a.
H1 : 1 2 3 4 5
b.
x -x
8
8
8
8
8
1
-1
0
-2
2,5
x -x
)2
1
1
0
4
6,25
- x )2 =12,25
2
a
S = 12,25/4 = 3,06
(9 6) (7 5) (8 4) (6 3) (10,5 2)
x
160 / 20 8
65 43 2
Varians antar sampel dengan hasil 3,06 adalah penduga pertama terhadap
varians populasi. Pada sampel yang tidak sama pernduga pertama ini tidak
dikalikan dengan n (besarnya sampel) lagi karena pada perhitungan rata-rata
keseluruhan sudah digunakan faktor penimbang.
2.
Perusahaan A
Rata-rata: 9
Perusahaan B
Rata-rata: 7
Perusahaan C
Rata-rata: 8
Perusahaan D
Rata-rata: 6
Perusahaan E
Rata-rata: 10
Handout Statistik 2
n1 = 6
n2 = 5
n3 = 4
n4 = 3
n5 = 2
(x x) (x x)2
(x x) (x x)2
(x x) (x x)2
(x x) (x x)2
(x x) (x x)2
-1
0
1
2
-2
0
1
0
1
4
4
0
= 10
S12 = 10/(6-1) = 2
0
-1
1
0
0
0
1
1
0
0
=2
S22 = 2/(5-1) = 0,5
S w2
3.
0
-1
1
0
0
1
1
0
=2
S32 = 2/(4-1) = 0,67
0
-1
1
0
1
1
=2
S42 = 2/(3-1) = 1
0,934
5
5
0,5
-0,5
= 0,5
S52 = 0,5/(2-1) = 0,5
Nilai F
Nilai F merupakan rasio dari kedua penduga parameter (varians populasi) =
3,06/0,934 = 3,28.
Taraf nyata 5% dengan derajat kebebasan pembilang = 5 1 = 4. Derajat
kebebasan penyebut = (6-1) + (5-1) + (4-1) + (3-1) + (2-1) = 15.
Tabel F = 3,06.
c.
Kesimpulan:
Hasil statistik uji
perbedaan yang nyata sehingga hipotesa ditolak. Artinya persentase absensi pada
masing-masing perusahaan sub-kontraktor tidak sama.
a.
0,25
0,25
Handout Statistik 2
b.
Komoditi
Dagangan
A
B
C
Jumlah
Radio
TV
Surat Kabar
24
23
25
72
19
17
21
57
20
14
17
51
Jumlah
63
54
63
180
berbeda yaitu media radio, TV dan Surat kabar. Dengan menggunakan taraf nyata
5%, ujilah:
a.
b.
SSC
SSE
SST
MSS
MSSR
MSSC
MSSE
Jumlah
Derajat
Kuadrat (SS)
kebebasan (df)
SSR
(b-1)
S12
SSR
MSSR
b 1
S12
S 32
Handout Statistik 2
Kolom (k)
Penyimpangan
(error)
Jumlah
SSC
(k-1)
SSE
(b-1) (k-1)
SST
(b-1) (k-1)
S 22
S 32
SSC
MSSC
k 1
S 22
S 32
SSE
MSSE
(b 1)(k 1)
SST xi . j
2
i 1 j 1
(Ti. j ) 2
b.k
k
b.k
i 1
b
SSR
63 2 54 2 63 2
180 2
3618 3600 18
3
(3 3)
k
3. SSC
(T j ) 2
j 1
SSC
(Ti. j ) 2
b.k
72 2 57 2 512 180 2
3678 3600 78
3
(3 3)
MSSC
SSC
78 / 2 39
k 1
SSE
10 / 4 2,5
(b 1)( k 1)
1.
Pengujian efek baris : 2,25 < 6,94. Perbedaan tidak nyata, hipotesa nol
diterima. Artinya pengelompokan macam komoditi dagangan tidak ada
pengaruhnya.
2.
Pengujian efek kolom: 9,75 > 6,94. Perbedaan nyata, hipotesa nol ditolak.
Artinya perbedaan macam media promosi memiliki pengaruh yang besar
terhadap penjualan.
Handout Statistik 2
yaitu:
1.
2.
3.
1.
Handout Statistik 2
2.
Dua
variabel
dikatakan
mempunyai
hubungan
yang
bersifat
3.
Dua
variabel
dikatakan
tidak
mempunyai
hubungan
apabila
Handout Statistik 2
Perkataan regresi mula-mula digunakan oleh Sir Francis Galton tahun 1877 pada
waktu mengadakan penelitian hubungan antara tinggi orang tua dengan tinggi
anaknya. Galton berkesimpulan bahwa rata-rata tinggi anak yang berasal dari orang
tua yang tinggi lebih rendah daripada tinggi rata-rata orang tuanya. Sebaliknya anakanak yang berasal dari orang tua yang rendah, tinggi rata-rata anaknya lebih tinggi
daripada tinggi orang tuanya. Dengan singkat dikatakan terjadi regress atau terjadi
tendensi yang semakin turun.
Handout Statistik 2
1.
2.
1.
b.
c.
Contoh:
Variabel X
2
3
5
6
8
9
Variabel Y
6
5
7
8
12
11
Handout Statistik 2
2.
= Na + bX
XY
= aX + bX2
Y (Penjualan)
6
5
7
8
12
11
= 49
X2
4
9
25
36
64
81
= 219
XY
12
15
35
48
96
99
= 305
Y = a +bX
4,84 = 2,94 + 2(0,95)
5,79 = 2,94 + 3(0,95)
7,69 = 2,94 + 5(0,95)
8,64 = 2,94 + 6(0,95)
10,54 = 2,94 + 8(0,95)
11,49 = 2,94 + 9(0,95)
Handout Statistik 2
XY NXY
X 2 NX 2
a Y bX
berikut:
0,95
219 181,5 37,5
219 6(5,5) 2
a.
b.
Handout Statistik 2
jumlah deviasi positif dan negatif harus nol agar garis regresi terletak di
tengah titik-titik pada diagram berserak.
Dapat dilihat dalam tabel berikut:
Y Variabel
6
5
7
8
12
11
Y (Garis Regresi)
4,84
5,79
7,69
8,64
10,54
11,49
Penyimpangan
(6 - 4,84) = +1,16
(5 5,79) = -0,79
(7 - 7,69) = -0,69
(8 8,64) = -0,64
(12 10,54) = +1,46
(11 11,49) = -0,49
Jumlah Penyimpangan = 0
(dibulakan dari 0,01)
titiknya
lebih
mendekati
garis
regresi
sehingga
dapat
dikatakan
bahwa
Handout Statistik 2
Se
(Y Y ' ) 2
N 2
= nilai data Y
Y = nilai regresi
N = jumlah frekuensi
Pembagi di sini N-2 karena pada perhitungan a dan b untuk menentukan persamaan
regresi kita telah kehilangan 2 derajat kebebasan.
Penggunaan rumus di atas disajikan dalam tabel berikut:
Iklan (X)
2
3
5
6
8
9
Penjualan (Y)
6
5
7
8
12
11
Se
Regresi (Y)
4,84
5,79
7,69
8,64
10,54
11,49
5,23 / 4
(Y-Y)2
1,35
0,62
0,48
0,41
2,13
0,24
(Y-Y)2 = 5,23
(Y-Y)
+1,16
-0,79
-0,69
-0,64
+1,46
-0,49
1,3075 1,14
Se
Y 2 a Y b XY
N 2
Se
Y (Penjualan)
6
5
7
8
12
11
= 49
X2
4
9
25
36
64
81
= 219
62
XY
12
15
35
48
96
99
= 305
Y2
36
25
49
64
144
121
= 439
5,19
1,2975 1,14
4
Handout Statistik 2
Apabila Se=0 atau tidak ada, berarti semua titik berada sepanjang garis
regresi. Yang berarti bahwa garis regresi dapat digunakan secara sempurna untuk
menaksir variabel dependen.
Sp Se 1 1 / N
(X X 0 )2
X 2 X 02
Handout Statistik 2
X0 terhadap nilai rata-rata, maka Sp akan kecil. Apabila hasil akar pangkat dua = 1
maka Sp = Se.
H. Koefisien Regresi
Lereng garis regresi disebut koefisien regresi. Persamaan garis regresi
dinyatakan dengan :
Y = a + bX
Dari persamaan di atas yang dimaksudkan dengan koefisien regresi
adalah b. Nilai b di sini dapat positif atau negatif. Apabila koefisien regresi positif,
maka garis regresi akan mempunyai lereng positif, yang berarti hubungan 2 variabel
X dan Y searah atau positif. Apabila koefisien regresi negatif, maka garis regresi akan
mempunyai lereng yang negatif yang berarti hubungan 2 variabel X dan Y
berlawanan arah atau hubungannya negatif.
Besar kecilnya pengaruhi perubahan variabel X terhadap variabel Y akan
I. Koefisien Determinasi
Koefisien determinasi adalah suatu alat utama untuk mengetahui sejauh mana
tingkat hubungan antara variabel X dan variabel Y. Koefisien determinasi ini dapat
ditentukan berdasarkan hubungan antara 2 macam variasi, yaitu:
1.
2.
r2 1
(Y Y ' ) 2
(Y Y ) 2
1.
Y
2
4
6
8
10
Y = 30
Regresi Y
2
4
6
8
10
(Y-Y)
0
0
0
0
0
(Y-Y)2
0
0
0
0
0
(Y-Y)2 =0
(Y- Y )
-4
-2
0
2
4
(Y- Y )2
16
4
0
4
16
(Y- Y )2=40
Handout Statistik 2
Y = 30/5 = 6
r 2 = 1 0/40 = 1
2.
Y
5
10
5
10
5
Y = 35
Y = 35/5 = 7
Regresi Y
7
7
7
7
7
(Y-Y)
-2
3
-2
3
-2
(Y-Y)2
4
9
4
9
4
(Y-Y)2 =30
(Y- Y )
-2
3
-2
3
-2
(Y- Y )2
4
9
4
9
4
(Y- Y )2=30
r 2 = 1 30/30 = 0
Handout Statistik 2
Dari gambar di atas nampak bahwa dari sebuah variabel Y, yang kita pilih sebagai
contoh pembahasan dapat diuraikan sebagai berikut:
Jarak antara variabel Y terhadap nilai rata-ratanya disebut Total Deviation atau
jumlah seluruh deviasi. Jarak antara garis regresi (Y) dengan nilai rata-ratanya
disebut explained deviation atau deviasi yang dapat dikelaskan. Selanjutnya
selisihnya yaitu jarak antara Y terhadap garis regresi disebut sebagai unexplained
deviation atau deviasi yang tidak dapat dijelaskan.
Secara singkat penjelasannya dapat dirumuskan sebagai berikut:
(Y Y ) 2
Total Deviation
(Y 'Y ) 2
= Explained deviation
(Y Y ' ) 2
+ Unexplained deviation
(Y Y ' ) 2
(Y Y ) 2
r2 1
(Y Y ' ) 2
(Y Y ) 2
Dari rumus koefisien determinasi di atas berarti suatu ukuran yang dapat
memberikan penjelasan terhadap variabel Y atau ukuran yang dapat memberi
penjelasan sejauh mana hubungan antara variabel X dan variabel Y.
a Y b XY NY 2
r
Y 2 NY 2
2
Handout Statistik 2
menjelaskan hubungan antara variabel X dan Y. Koefisien korelasi sebagai akar dari
koefisien determinasi:
r r2 1
(Y Y ' ) 2
(Y Y ) 2
Apabila suatu garis regresi mempunyai lereng positif, maka r merupakan akar
dari bilangan yang positif. Apabila suatu garis regresi mempunyai lereng negatif,
maka r merupakan akar dari bilangan negatif. Jadi nilai r menunjukkan arah
hubungan antara variabel X dan Y. Pada hubungan yang searah atau positif maka
nilai r akan terletak antara 0 dan 1.
Koefisien korelasi tidak dapat menjelaskan secara langsung misalnya r = 0,9.
Apabila r = 0,9 maka r2 = 0,81. berarti 81% dari variabel Y dapat dijelaskan oleh garis
regresi.
L. Kegunaan Korelasi
Ada beberapa manfaat dalam mempelajari korelasi yaitu:
1.
2.
3.
Handout Statistik 2
2.
3.
sebab
akibat,
tetapi
adanya
faktor
sebab
akibat
selalu
dapat
yaitu:
1.
2.
1.
Handout Statistik 2
Metode grafik
Dengan metode ini kedua variabel X dan Y masing-masing digambarkan dalam
satu kertas/diagram. Selanjutnya kita dapat melihat apakah kedua grafik itu
menunjukkan arah yang sama, yang berarti ada hubungan antara 2 variabel
tersebut, sedang apabila tidak menunjukkan arah yang sama, maka berarti tidak
ada hubungan antara variabel X dan Y.
Contoh:
Data berikut menunjukan data ekspor kapas (X) dan impor mesin tenun (Y):
Tahun
1980
1981
1982
1983
1984
1985
1986
Ekspor (X)
42
44
58
55
89
90
66
Impor (Y)
46
49
53
58
65
76
58
Handout Statistik 2
a.
r 1
(Y Y ' ) 2
(Y Y ) 2
X2
XY
(Y-Y)
(Y-Y)2
(Y- Y )
5
11
4
5
3
2
X=30
31
40
30
34
25
20
Y=180
25
121
16
25
9
4
= 200
155
440
120
170
75
40
30
42
28
30
26
24
+1
-2
+2
+4
+1
-4
1
4
4
16
1
16
=42
+1
+10
0
+4
-5
-10
X 30 / 6 5
(Y- Y
)2
1
100
0
16
25
100
=242
Y 180 / 6 30
r 1
(Y Y ' ) 2
(Y Y )
42
1 0,17
242
0,83 0,91
Handout Statistik 2
Moment 1 (m1) = ( X X )1 x
Moment 2 (m2) = ( X X ) 2 x 2
Moment Y ditulis y
Moment 1 (m1) = (Y Y )1 y
Moment 2 (m2) = (Y Y ) 2 y 2
Dan seterusnya
Product moment adalah hasil perkalian antara moment X dan moment Y yang
dirumuskan:
xy
N
Sx Sy
dimana, r
= koefisien korelasi
= product moment
Sx
= standar deviasi X
Sy
= standar deviasi Y
5
11
4
5
3
2
=30
X =
31
40
30
34
25
20
=180
Y =3
Sy
( X X ) x (Y Y ) y
0
+6
-1
0
-2
-3
xy 100
16,67
N
6
242 / 6
+1
+10
0
+4
-5
-10
xy
0
60
0
0
10
30
=100
( X X )2 x 2
0
36
1
0
4
9
=50
Sx
(Y Y ) 2 y 2
1
100
0
16
25
100
=242
50 / 6
8,33 2,89
40,33 6,35
Handout Statistik 2
Sx Sy
16,67
16,67
0,91
2,89(6,35)
18,35
N XY ( X )( Y )
N X 2 ( X ) 2
N Y 2 ( Y ) 2
Y
31
40
30
34
25
20
= 180
Y2
961
1600
900
1156
625
400
= 5642
N Y 2 ( Y ) 2
6(1000) (30)(180)
6( 200) (30) 2
6(5642) (180) 2
6000 5400
b.
N XY ( X )( Y )
N X 2 ( X ) 2
X2
36
121
16
25
9
4
= 200
XY
155
440
120
170
75
40
= 1000
600
300 1450
600
600
0,91
17,32 38,11 660
Handout Statistik 2
dan Y. Dengan kombinasi ini, maka bentuk tabel frekuensi menjadi tabel
frekuensi menurut bilangan yang bersifat ganda.
2.
N fydy 2 ( fydy ) 2
dimana:
r
= koefisien korelasi
N = jumlah frekuensi
fx = frekuensi X
fy = frekuensi Y
dx = deviasi X
dy = deviasi Y
3.
Y (Penjualan)
8
6
7
6
4
4
5
8
9
7
Handout Statistik 2
4.
Dari
tabel
frekuensi
tersebut
13
89
67
45
5.
79
2
1
89
67
45
fx
dx
fxdx
fxdx2
fxdydx
2
2
0
0
0
0
46
1
3
1
5
1
5
5
5
79
2
1
3
2
6
12
10
fy
3
4
3
10
3
11
17
15
dy
2
1
0
3
fydy
6
4
0
10
fydy2
12
4
0
16
fydxdy
10
5
0
15
Penentuan deviasi (d) dilakukan sebagaimana dalam tabel frekuensi biasa untuk
variabel X maupun Y hanya perlu diperhatikan arah deviasi. Semakin besar arah
kelasnya semakin besar deviasinya. Nilai deviasi = 0 untuk variabel X maupun Y
harus sama letaknya, yang selanjutnya nilai deviasi akan tergantung arah kelas
masing-masing variabel.
6.
10(15) (11)(10)
10(17) (11)
10(16) (10)
7.
40
0,74
54,25
89
67
45
fx
dx
fxdx
2
2
-1
-2
46
1
3
1
5
0
0
79
2
1
3
1
3
fy
3
4
3
10
0
1
dy
1
0
-1
3
fydy
3
0
-3
0
fydy2
3
0
3
6
fydxdy
2
0
2
4
Handout Statistik 2
fxdx2
fxdydx
2
2
0
0
3
2
5
4
8.
10(6) (0)
9.
40
0,74
54,25
1.
2.
3.
4.
5.
Handout Statistik 2
2.
3.
6 D2
r 1
N ( N 2 1)
dimana:
= koefisien korelasi
= jumlah
D = Perbedaan (difference)
N = jumlah frekuensi
6
= Bilangan konstan
4.
5.
Ranking
Statistik (X)
1
2
3
4
5
Ekonomi (Y)
1
2
3
4
5
r 1
D (X-Y)
D2
0
0
0
0
0
0
0
0
0
0
=0
6( 0)
1 0 1
5( 25 1)
Caranya:
1. susun data berdasarkan ranking, apabila ada ranking yang sama, maka ranking
ditentukan berdasar rata-ratanya.
Contoh, ranking 6,5 untuk ranking 6 dan 7 yang sama nilainya.
2. Hitung perbedaan ranking untuk masing-masing data (D)
3. Kuadratkan hasilnya (D2) dan jumlahkan hasilnya
4. Gunakan rumus Spearman
6.
Contoh:
Data berikut menunjukkan data penjualan televisi (X) dan video recorder (Y):
X
115
134
120
130
124
128
Y
130
132
128
130
127
125
Hal 122 dari 148
Handout Statistik 2
Video
Ranking
Ranking
(X)
115
134
120
130
124
128
(Y)
130
132
128
130
127
125
(X)
6
1
5
2
4
3
(Y)
2,5
1
4
2,5
5
6
D (X-Y)
D2
3,5
0
1
-0,5
-1
-3
12,25
0
1
0,25
1
9
=23,50
6(23,50)
r 1
1 141 / 210 69 / 210 0,33
6(36 1)
7.
Kendalls
Rank
Correlation
S
1 / 2 N ( N 1)
= koefisien korelasi
N = jumlah frekuensi
Contoh:
Nilai X
115
134
120
130
124
128
Nilai Y
130
132
128
130
127
125
Ranking X
6
1
5
2
4
3
Ranking Y
2,5
1
4
2,5
5
6
S
(-1) + (+3) = +2
(0) + (+4) = +4
(-1) + (+2) = +1
(0) + (+2) = +2
(0) + (+1) = +1
(0) + (0) = 0
= 10
10
10 / 15 0,67
1 / 2(6)(6 1)
Handout Statistik 2
8.
2.
3.
4.
Pada data bukan ranking, dapat dihitung pula dengan metode ini.
9.
2.
3.
4.
Handout Statistik 2
Yang dimaksud dengan koefisien regresi adalah koefisien regresi penaksir yaitu a
dan b. Persoalan yang muncul adalah seberapa jauh atau dekat garis regresi (Y = a
+bX) menyimpang dari garis regresi populasinya.
Dari persamaan regresi estimasi Y = a + bX, koefisien yang regresi yang kita
estimasi adalah a dan b. Dari kedua koefisien ini nilai estimasi b seringkali dianggap
lebih penting artinya daripada a. Hal ini disebabkan karena b menunjukkan rasio
perolehan Y dan X. Atau dengan kata lain, melalui koefisien b kita dapat melihat pola
hubungan ketergantungan antara variabel Y dan variabel X.
Dinyatakan bahwa:
E(b) =
Var (b) = 2/xi2
Hal ini dimaksudkan bahwa nilai harapan b adalah dari populasi atau dengan kata
lain bahwa koefisien estimator (penduga) b tidak bias (menyimpang) dari koefisien
regresi populasi .
Untuk mengetahui apakah koefisien b tidak bias dari koefisien regresi populasi
maka kita harus melihat bagaimana bentuk distribusi probabilitas b. Karena secara
Handout Statistik 2
Ini berarti bahwa setiap variabel random Y tersebut secara normal dengan (Y) =
+ X sebagai nilai harapan atau nilai rata-rata hitungnya dan 2 sebagai
variansnya. Karena b merupakan kombinasi linear dari Y maka nilai b terdistribusi
secara normal juga. Dapat digambarkan sebagai berikut:
Dari gambar di atas terlihat bahawa statistik b tersebar secara normal dengan nilai
harapan dan varians sebesar 2/xi2.
Apabila kita menghendaki agar nilai distribusi normal dapat dimanfaatkan maka
distribusi normal perlu diterjemahkan ke dalam distribusi norrmal yang memiliki
rata-rata hitung sama dengan nol dan standar deviasi sama dengan satu.
z
b
b
x
i 1
2
i
Nilai 2 adalah varians faktor gangguan ei atau varians variabel random Yi dalam
populasi (dan adalah standar deviasi) yang nilainya tidak dapat diketahui. Oleh
karena itu nilai 2 yaitu nilai varians Yi atau varians (ei) perlu diestimasi dengan
memakai varians ei sebagai penaksirnya, yaitu varians yang terdapat dalam sampel
atau sering ditulis:
S2
1 n
(Yi Yi ' ) 2
n 2 i 1
Handout Statistik 2
b
S
n
x
i 1
2
i
Distribusi t inilah yang untuk selanjutnya akan digunakan dalam penentuan interval
kepercayaan bagi parameter dan dalam penyajian hipotesa mengenai parameter
ini.
Misalkan sekarang kita gunakan t0,025 sebagai nilai t yang membatasi 2,5 persen
dari luas areal di bawah distribusi t pada ujung sebelah kanan distribusi tersebut.
Oleh karena sifat simetris distribusi tersebut maka luas daerah yang terletak di
sebelah kiri t0,025 adalah 2,5 persen juga. Dengan demikian luas areal antara t 0,025
sampai dengan t0,025 adalah 95 persen dari keseluruhan wilayah distribusi t tersebut.
Dengan kata lain, probabilitas nilai t berada di antara -t 0,025 dengan t0,025 adalah 0,95
atau:
Pr (t0,025 < t < t0,025 ) = 0,95
b t 0 , 025
x
i i
2
i
a t 0,025
Contoh:
Apabila kita memiliki data penggunaan pupuk dan hasil panen sebagai berikut:
Pemakain Pupuk (X)
60
80
100
120
140
Handout Statistik 2
Yi
24
26
30
32
33
=145
Y =29
Xi
-40
-20
0
20
40
=0
xi2
1600
400
0
400
1600
=4000
yi
24,2
26,6
29,0
31,4
33,8
(yi-Y)
-0,2
-0,6
1,0
0,6
-0,8
= 0
(yi Y)2
0,04
0,36
1,00
0,36
0,64
=2,4
S2
1 n
(Yi Yi ' ) 2 1 / 3(2,40) 0,8
n 2 i 1
a t 0 ,025
= 29 3,182 (0,9/5)
= 29 1,21
sebagai interval kepercayaan 95% bagi parameter
Jadi apabila ditulis secara lain, interval keyakinan 95% bagi adalah:
27,79 < < 30,21
n
X
i 1
2
1
Handout Statistik 2
Uji hipoteses yang paling perlu dilakukan dalam analisa regresi bertujuan
menunjukkan ada tidaknya hubungaan linear yang signifikan antara variabel X dan
Y. Ada tidaknya hubungan linear yang nyata (signifikan) antara variabel X dan Y
adalah ditentukan oleh ada tidaknya secara signifikan parameter yaitu bergantung
pada ada tidaknya perbedaan yang nyata (signifikan) antara nilai parameter
dengan nol.
Hipotesis diterima apabila nilai t yang dihitung dari sampel ternyata lebih kecil
(secara absolut) daripada t tabel. Demikian pula sebaliknya, hipotesa ditolak
(menerima hipotesa alternatif) apabila t hitung lebih besar (secara absolut) dari t
tabel.
Dengan menggunakan soal di atas, kita dapat hitung nilai t sebagai berikut:
b
S
n
x
i 1
0,12
8,433
0,9
4000
Nilai t hitung tersebut lebih besar daripada t tabel (3,182). Oleh karena itu
berdasarkan tingkat kesalahan 5% kita menolak hipotesa nol dan menerima hipotesa
alternatif. Ini berarti bahwa b =0,12 adalah berbeda secara nyata dengan nol.
Sehingga dapat dikatakan bahwa parameter regresi yang ditaksir itu tidak sama
dengan nol. Atau ada hubungan regresi linear yang nyata antara X dan Y.
Dalam beberapa hal kita dapat juga memakai uji t satu sisi. Hal ini dilakukan
apabila hubungan yang diperkirakan sudah jelas arahnya. Sebagai contoh, apabila
kita menghubungkan antara tingkat konsumsi C dengan penghasilan Y dengan
menggunakan model:
C = a + bY
Handout Statistik 2
H1 : > 0
Dengan menggunakan hipotesa di atas kriteria penolakan hipotesa nol tersebut juga
akan berubah. Kita akan menolak hipotesa nol dan menerima hipotesa alternatif
dengan derajat kepercayaan 5% jika nilai t hitung lebih besar daripada t tabel. Jika
tidak lebih besar maka kita akan menerima hipotesa nol.
Handout Statistik 2
(independent variabel) untuk menaksir variabel dependen, maka taksiran kita akan
menjadi lebih akurat. Proses ini disebut analisis regresi ganda.
A. Pengertian Regresi Ganda dan Korelasi Ganda
Contoh:
Apabila kita ingin mengetahui hubungan antara jumlah rumah yang terjual dengan
jumlah pengeluaran iklan F maka analisis ini disebut regresi sederhana. Jika kita
ingin meningkatkan akurasinya, maka kita dapat menambah variabel lain, misalnya
jumlah agen penjualan, analisis ini disebut regresi berganda.
Keuntungan analisis regresi ganda ialah kita dapat menggunakan informasi lebih
banyak sebagai variabel, guna menduga variabel dependen. Dengan demikian hasil
estimasi kita menjadi lebih akurat.
Dengan demikian kita dapat mendifinisikan regresi ganda adalah regresi yang
yaitu:
1.
2.
3.
= intersep
X1 dan X2
b dan c
Handout Statistik 2
Y Na b X 1 c X 2
2
X 1Y a X 1 b X 1 c X 1 X 2
X 2Y a X 2 b X 1 X 2 c X 2
Contoh:
Penjualan (Y)
7
12
17
20
Iklan TV (X2)
1
2
5
8
X1
4
7
9
12
=32
X2
1
2
5
8
=16
X1Y
X2Y
28
7
84
24
153
85
240
160
=505 =276
X1X2
4
14
45
96
=159
X12
16
49
81
144
=290
X22
1
4
25
64
=94
Y2
49
144
289
400
=882
56 = 4a + 32b +16c
2.
3.
Penyelesaian:
Persamaan 1 dan 2 menghasilkan persamaan 4
Persamaan 1 x 8
..
Handout Statistik 2
Persamaan 2 x 1
..
Persamaan (4)
57 =
34b + 31c
..
Persamaan 3 x 1
..
Persamaan (5)
52 =
31b + 30c
Persamaan 5 x 34 ..
Persamaan (5)
1=
59c
c = 0,017
Nilai c disubstitusikan pada persamaan 4 diperoleh konstanta b:
57 = 34b + 31(0,017)
57 = 34b + 0,527
56,473 = 34b
b = 1,66
Nilai c dan b disubstitusikan pada persaman 1 diperoleh konstanta a:
56= 4a + (32)(1,66) + (16)(0,017)
56 = 4a + 53,12 + 0,272
4a = 2,608
a = 0,652
Persamaan regresi ganda adalah:
Y = 0,652 + 1,66X1 + 0,017 X2
D. Interpretasi Konstanta A, B dan C
Konstanta a adalah intersep dari Y. Sedang b dan c adalah lereng garis regresi
ganda. Konstanta a, b dan c disebut koefisien regresi ganda (the estimated
regression coeficients).
Handout Statistik 2
Persamaan garis regresi ganda dapat digunakan untuk peramalan atau proyeksi.
tingka korelasi antar variabel independen meningkat. Apabila tingkat korelasi antar
variabel independen tinggi maka kita menjumpai masalah multikolinearitas
(multicolinearity).
Contoh: apabila kita menduga penjualan berdasarkan variabel independen
jumlah penjual dan gajinya. Kedua variabel ini mempunyai hubungan yang erat.
Variabel tambahan justru akan memberika penyimpangan besar pada nilai koefisien
regresinya.
Agar multikolinearitas dapat seminimum mungkin, maka sebelum menggunakan
semakin akurat apabila penyimpangan terhadap garis regresi semakin kecil. Hal
demikian juga berlaku pada regresi ganda.
Penyimpangan terhadap garis regresi ganda dapat dirumuskan sebagai berikut:
Se
Contoh, nilai penjualan (Y= 17,456) dan penyimpangan standar terhadap regresi
ganda (Se) = 1,58. Dengan menggunakan 96% batas kepercayaan tabel t dengan
derajat kebebasan (4-3) = 1 adalah 12,706. Interval keyakinan dapat dihitung sebagai
berikut:
Handout Statistik 2
Y + t(Se)
dan
Y + t(Se)
Dengan kepercayaan 95%, maka jumlah penjualan akan terletak antara -2,619 dan
37,53.
I. Koefisien Determinasi Ganda
Dalam analisis regresi sederhana telah dijelaskan ukuran tingkat hubungan
yang dijelaskan oleh garis regresi. Demikian pula pada regresi ganda,koefisien ini
disebut koefisien determinasi ganda (R2) yaitu bagian dari variabel total dari Y yang
dijelaskan oleh bidang regresi.
Rumus koefisien determinasi ganda adalah:
a Y b X 1Y c X nY 2
R
Y 2 nY 2
2
= variabel dependen
Interpretasi koefisien determinasi ganda adalah sebagai berikut: misalkan R 2 =
lampiran