Anda di halaman 1dari 126

ANALISA DAN

PENGOLAHAN DATA
ALI ALTWAY
1. Bhattacharyya, Couri K., Richard A. Johnson. Statistical
concepts and methods , John Wileye & Sono, New York, 1977.
2. G.E.P. BOX, W.G. Hunter, J.S. Hunter, Statistics for
experimenters ,John Willy & Sono, New York, 1978.
3. R.E.Walpole and R.H.Myers,Probability and Statistics for
Engineers and Scientist,4
th
ed.,Macmillan Publishing Co., 1989
4. R.E. Walpole and R.H. Myers,Ilmu Peluang dan Statistika untuk
Insinyur dan Ilmuwan,edisi ke-4, penerjemah: RK Sembiring,
Penerbit ITB, 1995
5. Bowker,A.H., and G.J.Lieberman,Engineering
Statistics,Prentice-Hall, Englewood, 1959
PUSTAKA
1. Pendahuluan
2. Dasar-dasar statistik deskriptif
3. Dasar-dasar statistik inferensia
4. Analisa regresi
5. Pengantar experimental design
6. Aplikasi statistik dalam industri
MATERI
EVALUASI
1. TUGAS 20%
2. SHORT TEST 10%
3. QUIZ 30%
4. UJIAN 40%
Statistik = Kumpulan metode dan konsep yang digunakan untuk
mengumpulkan dan meng-interpretasikan data yang berhubungan
dengan suatu daerah penelitian tertentu dan untuk menarik kesimpulan
dalam situasi dimana ketidakpastian dan fluktuasi terjadi.
Statistik berhubungan dengan keadaan dalam mana terjadinya suatu
peristiwa tak dapat diramalkan dengan pasti. Kesimpulan kita sering-
sering tidak pasti karena kesimpulan ini didasarkan pada data yang
tidak lengkap. Contoh : Menyimpulkan besar laju pengangguran
disuatu daerah didasarkan pada suatu survey dari beberapa ribu
penduduk.
PENGERTIAN STATISTIK
1. PENDAHULUAN
populasi
Sampel
Populasi : Suatu kumpulan komplit dari pada pengukuran-
pengukuran (pengamatan-pengamatan) yang mungkin dalam suatu
daerah penelitian tertentu.
Populasi menyajikan target (tujuan) suatu penelitian dan tujuan
proses pengumpulan data adalah menarik kesimpulan tentang
populasi ini.
Sampel dari suatu populasi adalah suatu kumpulan pengukuran-
pengukuran yang sesungguhnya dilakukan dalam suatu
penyelidikan.
Contoh : Daerah polusi udara di kota Surabaya.
Populasi : Kumpulan pengukuran-pengukuran kadar polutan di
seluruh bagian udara di kota Surabaya.
POPULASI DAN SAMPEL
Sampel : Kumpulan
pengukuran-pengukuran kadar
polutan yang benar-benar
dilakukan di beberapa bagian
udara di kota Surabaya.
63
64 65
66
67 68 69
70
Cara grafis menyajikan data antara lain :
- Dot diagram
- Histogram
Dot Diagram :( Digunakan untuk data sedikit)
Dibuat garis lurus horizontal dengan dilengkapi skala yang
mencakup rauge harga pengukuran-pengukuran. Tiap
data pengukuran diplot pada garis ini sebagai titik.

Contoh 2.1
Buat Dot diagram dari data berikut :
66.7 64.3 67.1 66.1 65.5 67.1 69.1
67.2 67.1 66.7 68.1 65.7 66.4
Penyelesaian :
PENYAJIAN DATA
2. STATISTIK DESKRIPTIF
Tahapan-tahapan pembuatan distribusi frekuensi
-Tentukan harga minimum dan maksimum dalam kumpulan data.
-Pilih sejumlah sub interval atau sel-sel dengan lebar sama yang
meliputi range diantara harga minimum dan maksimum tanpa
menimbulkan overlapping. Sel-sel ini disebut class intervals, dan
titik-titik ujungnya disebut class boundary.
-Hitung banyak pengamatan dalam data yang termasuk dalam
masing-masing class interval. Banyak data dalam tiap-tiap kelas ini
disebut class frekuency atau cell frequency.
-Tentukan relative frequency untuk tiap kelas, yaitu :
DISTRIBUSI FREKUENSI
total data Banyak
frequency Class
Relative Frequency=
Banyak kelas yang dianjurkan = 1 + 3,3 log n
n = banyak data keseluruhan
Histogram Relative Frequency :
-Class interval diplot pada sumbu horizontal.
-Pada tiap class interval dibuat sebuah segi empat dengan luas sama
dengan relative frequencynya.
erval class Lebar
kelas frequency lative
int
Re
HISTOGRAM RELATIVE FREQUENCY
Tinggi tiap segi empat =
Data berikut menyatakan 78 pengukuran konsentrasi ozom
diatmosfer suatu kota 1 dalam 1/100 ppm. Tiap pengukuran
adalah rata-rata pembacaan tiap jam selama 4 hari. Buat
tabel distribusi frekwensi untuk 11 class interval dan buat
pula histogram relative frequencynya.
3.5 1.4 6.6 6.0 4.2 4.4 5.3 5.6
6.8 2.5 5.4 4.4 5.4 4.7 3.5 4.0
2.4 3.0 5.6 4.7 6.5 3.0 4.1 3.4
6.8 1.7 5.3 4.7 7.4 6.0 6.7 11.7
5.5 1.1 5.1 5.6 5.5 1.4 3.9 6.6
6.2 7.5 6.2 6.0 5.8 2.8 6.1 4.1
5.7 5.8 3.1 5.8 1.6 2.5 8.1 6.6
9.4 3.4 5.8 7.6 1.4 3.7 2.0 3.7
6.8 3.1 4.7 3.8 5.9 3.3 6.2 7.6
6.6 4.4 5.7 4.5 3.7 9.4
CONTOH 2.2
Harga minimal = 1,1
Harga maksimal = 11,7
0 . 1
11
1 . 1 7 . 11
=

PENYELESAIAN
Lebar kelas=
Distribusi Frekwensi :

Kelas Interval Frekwensi Relative Frekwensi
1.05 2.05 7 0.090
2.05 3.05 6 0.077
3.05 - 4.05 13 0.167
4.05 - 5.05 11 0.141
5.05 - 6.05 20 0.256
6.05 - 7.05 13 0.167
7.05 - 8.05 4 0.051
8.05 - 9.05 1 0.013
9.05 - 10.05 2 0.026
10.05 - 11.05 0 -
11.05 - 12.05 1 0.013
Histogram relative frekwensi
1 2 3 4 5 6 7 8 9 10 11 12
0.1
0.2
0.3
CLASS INTERVAL
Luas segi empt=
relative frequency
Ukuran Pusat
Gambaran grafik yang telah dibahas membantu kita untuk
membayangkan bagaimana pola dari data set. Dari kumpulan data
berbentuk angka-angka, kita sering ingin mengetahui nilai-nilai
tertentu. Salah satu dari nilai yang demikian ialah nilai disekitar
mana data berupa angka-angka atau tersebar, nilai tersebut
dinamakan nilai rata-rata (average) dari pada angka-angka.
Nilai rata-rata dari pada sekumpulan data : X1, X2, .., Xn
adalah :
= x
) 1 2 ( ..........
.. ..........
1 2 1
=
+ + +

=
N
x
N
x x x
N
i
i
N
) 2 2 ( .......... .......... .......... .......... ..........
1

=
i
n
i
i i
f
x f
= x
N = Banyak data total
f
i
= Frekwensi kelas ke-I
x
i
= Harga tengah kelas
ke-I
n = Banyak kelas
UKURAN SEBARAN
Selain harga rata-rata aspek penting lainnya adalah pengukuran
secara numerik bagaimana penyebaran bilangan dari data set
disekitar harga rata-rata. Sebagai ukuran penyebaran ini adalah
variance (sebaran). Variance dari sekumpulan data X1, X2,
.., XN adalah
) 3 2 ( .......... .......... ..........
) (
2
2
2


I N
x N x
I N
x x
i i
S
2
=
) 4 2 .......( .......... ..........
1 1 ) (
) (
2 2
2

N
x N x f
f
x x f
i i
i
i i
S
2
=
S S Variance = =
2
Standard deviasi =
Tentukan nilai rata-rata dan variance untuk kumpulan data
berikut : 92, 64, 105, 81, 78
CONTOH 2.3
PENYELESAIAN
= x
84
5
78 81 105 64 92
=
+ + + +
S
2
=
1 5
) 84 78 ( ) 84 81 ( ) 84 105 ( ) 84 64 ( ) 84 92 (
2 2 2 2 2

+ + + +
= 237,5
Class Interval Titik Tengah Frequency f
i
x
i
f
i
x
i
2

Kelas, x
i
f
i
14.5- 19.5 17 18 306 5202
19.5-24.5 22 74 1628 35816
24.5-29.5 27 62 1674 45198
29.5-34.5 32 26 832 26624
34.5-39.5 37 20 740 27380
5180 140220

CONTOH 2.4
Diketahui data berikut:
Class Interval Frekuensi, f
i
14.5- 19.5 18
19.5-24.5 74
24.5-29.5 62
29.5-34.5 26
34.5-39.5 20
PENYELESAIAN:
Hitung rata-rata hitung,
variance dan standard
deviasi
9 , 25
200
5180
=
44 . 30
1 200
) 9 . 25 ( 200 140220
2
=

517 . 5 44 . 30 =
= x
S
2
=
S =
Ada beberapa ukuran letak :
Median
Quartile
Desil
Persentil
UKURAN LETAK
Medium dari pada sekumpulan data :x
1
,x
2
, , x
N

adalah harga tengah bila data disusun dari kecil ke besar.
Bila N ganjil, maka ada satu harga tengah
Bila N genap, ada dua harga tengah, maka:
median = rata-ratanya
MEDIAN
MEDIAN
Contoh 2.5
Tentukan median dari kumpulan data berikut :
a). 7, 1, 3, 5, 8
b). 8, 1, 2, 7, 9, 5
Penyelesaian :
a). Data diurut : 1, 3, 5, 7, 8
median = 5
b). Data di-urut : 1, 2, 5, 7, 8, 9
median =
6
2
7 5
=
+
Median
L = Batas bawah kelas median
fsm = Jumlah frekwensi-frekwensi kelas sebelum kelas median
fm = Frekwensi kelas median
h = Lebar kelas
Untuk data yang dikelompokkan, median diperoleh dari
) 5 2 .......( .......... .
2

+ = h
f
f
N
L Me
m
sm
QUARTILE
Quartile ke-k sekumpulan data adalah data ke-
4
) 1 ( k N +
sebelum data diurut dari kecil ke besar. N = banyak data total,
4
) 1 ( k N +
Bila Bukan integer, maka dilakukan interpolasi linear
Untuk data yang dikelompokkan, quartile ke-k (Qk) diperoleh dari,
) 6 2 ........( .......... .
4

+ = h
f
f
Nk
L Qk
q
sq
Dimana :
L = Batas bawah kelas quartile
fsg = Jumlah frekwensi kelas-kelas sebelum kelas quartile
fq = Frekwensi kelas quartile
h = Lebar kelas
DESIL
Desil ke-k sekumpulan data adalah data ke-
10
) 1 ( k N +
setelah data diurut dari kecil ke besar.
Bila
10
) 1 ( k N +
bukan integral, dilakukan interpolasi linear
Untuk data yang dikelompokkan, desil ke-k (D
k
) diperoleh dari,
) 7 2 .....( .......... .
10

+ = h
f
f
Nk
L D
d
sd
k
Dimana :
L = Batas bawah kelas desil
fsd = Jumlah frekwensi kelas-kelas sebelum kelas desil
fd = Frekwensi kelas desil
h = Lebar kelas
PERSENTILE
100
) 1 ( k N +
) 7 2 .....( .......... .
100

+ = h
f
f
Nk
L P
p
sp
k
Dimana :
L = Batas bawah kelas persentile
fsp = Jumlah frekwensi kelas-kelas sebelum kelas persentile
fp = Frekwensi kelas persentile
h = Lebar kelas
Persentil ke-k sekumpulan data adalah data ke-
setelah data diurut dari kecil ke besar.
Bila bukan integral, dilakukan interpolasi linear
Untuk data yang dikelompokkan, desil ke-k (P
k
) diperoleh dari,
100
) 1 ( k N +
CONTOH SOAL UKURAN LETAK
Contoh 2.6 :
Untuk data pada contoh-4, tentukan :
a). Median
b). Q1 dan Q3
c). D3 dan P15
Penyelesaian :
Dibuat tabel berikut :
Class internal Frekwensi Frekwensi Kumulatif
14.5-19.5 18 18
19.5-24.5 74 92
24.5-29.5 62 154
29.5-34.5 26 180
34.5-39.5 20 200
-------------
200
PENYELESAIAN (LANJUT)
a). Median
Kelas median = class internal ke-3
=

+ = ) 5 .(
62
92
2
200
5 . 24 Me
b). Q1 :
Kelas quatile ke-1 = class interval ke-2
=

+ = ) 5 .(
74
18
4
200
5 . 19 1 Q
Q3 :
Kelas quartile ke-3 = class interval ke-3
=

+ = ) 5 .(
62
92 )
4
3
)( 200 (
5 . 24 3 Q
D3 :
Kelas desil ke-3 = class interval ke-2
=

+ = ) 5 .(
74
18 10 / ) 3 )( 200 (
5 . 19 3 D
P15 :
Kelas persentile ke-15 = class interval ke-2
=

+ = ) 5 .(
74
18 100 / ) 15 )( 200 (
5 . 19 15 P
PENYELESAIAN (LANJUT)
MODUS
Untuk menyatakan fenomena yang paling banyak terjadi atau paling banyak
terdapat digunakan ukuran Modus
L
h
h
f f
f
L M
O
2 1
1
+
+ =
L= batas bawah kelas modus
h=lebar kelas interval
1
f = Frekuensi kelas modus dikurangi
frekuensi kelas interval terdekat
sebelumnya
= Frekuensi kelas modus dikurangi
frekuensi kelas interval terdekat
berikutnya
2
f
3. DASAR-DASAR STATISTIK INFERENSIA
Teori Probabilitas
Probabilitas suatu kejadian yang tak pasti adalah ukuran numerik mengenai
besarnya peluang kejadian ini akan terjadi. Konsep probabilitas adalah relevant
terhadap eksperimen-eksperimen yang mempunyai ketidak pastian.
Experimen : Proses mengumpulkan data yang relevant dengan suatu fenomena
yang menunjukkan variasi hasil pengamatannya.
Kumpulan seluruh hasil pengamatannya mungkin untuk suatu eksperiment disebut
sample space dari pada hasil pengamatan. Sample space dinyatakan dengan S .
Contoh :
Akan ada 2 anak lahir esok hari disuatu kampung, yang diamati adalah
apakah anak ini pria atau wanita. Tentukan elemen-elemen sample space nya.
Jawab : S { pp, wp, pw, ww }
Kumpulan hasil pengamatan eksperimen (outcome) yang dikarakterisasikan
oleh beberapa batasan-batasan tetentu disebut event ( kejadian ).
Outcome elementer dari pada suatu sample space adalah elemen-elemen
yang mempunyai peluang sama untuk terpilih sebagai hasil pengamatan
eksperimen yang berhubungan dengan sample space ini.
Bila suatu sample space terdiri atas k outcome elementen (e1,e2, .., ek )
yang mempunyai peluang sama untuk terjadi dan kejadian A terdiri atas m dari
pada elemen-elemen ini, maka :
P (A) = m/k
DASAR-DASAR STATISTIK INFERENSIA
Teori Probabilitas
Tiga dasar operasi kejadian yaitu :
UNION
INTERSECTION
COMPLEMENTATION
Operasi-operasi Kejadian:
Union Intersection Complementation
A U B AB A
C

P(AUB)=P(A)+P(B)-P(AB)
P(A
C
)=1-P(A)
HUKUM PERMUTASI
Jumlah susunan berbeda yang dapat dibentuk dengan r benda yang dipilih dari satu
kelompok n benda dinyatakan dengan:
yang dibaca : jumlah permutasi r dari n
n
r
P
( )!
!
r n
n
P
n
r

=
Hukum Kombinasi
Hampir sama dengan permutasi hanya saja urutan yang berbeda tak
menyebabkan susunan berbeda. Kombinasi dinyatakan dengan
|
|
.
|

\
|
r
n
)! ( !
!
r n r
n
r
n

=
|
|
.
|

\
|
DASAR-DASAR STATISTIK INFERENSIA
Teori Probabilitas
Probabilitas bersyarat ( Canditional Probability ) :
Probabilitas suatu kejadian A sering berubah sesudah informasi diperoleh
mengenai apakah suatu kejadian B terjadi atau tidak. Proabilitas ini disebut
probabilitas bersyarat dari pada A asal B terjadi, simbolnya P [ A/B ].
) (
) (
) / (
B P
AB P
B A P =
DASAR-DASAR STATISTIK INFERENSIA
Teori Probabilitas
atau
P ( AB ) = P ( A/B ) P ( B )
Untuk 3 kejadian A, B, C, :
P ( ABC ) = P ( A) P ( B/A ) P ( C/AB )
Kejadian A dan B tak bergantung satu sama lain ( independent ) bila :
P ( A/B ) = P ( A ) dan
P ( B/A ) = P ( B ) , berarti:
P ( AB ) = P ( A ) P ( B )
Kejadian A terjadi berhubungan dengan satu dan hanya satu dari pada kejadian-
kejadian B
1
, ,B
K
yang membentuk suatu partisi dari pada ruang sampel
menjadi himpunan-himpunan yang disjoint, dimana P(B
1
),.,P(B
k
), P (A/B1 ),
,P(A/B
K
) diketahui, akan dicari P (B
1
/A) menurut teorema bayes :
DASAR-DASAR STATISTIK INFERENSIA
Teori Probabilitas

=
) / ( ) (
) / ( ) (
) / (
1
1
1
j j
B A P B P
B A P B P
A B P
B
1
B
2

B
3

A
TEOREMA BAYES
Contoh 3.1
Satu unit barang diproduksi oleh 5 karyawan yang mengerjakan bagian-bagian yang
berbeda, karyawan-karyawan ini mengerjakan tugasnya tak bergantung atu sama
lain. Hasil pekerjaan karyawan-karyawan ini ada cacatnya, yaitu berturut-turut 1%,
2%, 3%, 2%, dan 1% untuk karyawan I, II, III, IV, dan V.
Tentukan % produk :
a). Prima ( yaitu produk yang seluruh bagin nya tidak cacat)
b). Buangan ( yaitu produk yang seluruh bagiannya cacat ).
Penyelesaian :
A = Kejadian dimana karyawan I bekerja tampa cacat
B = Kejadian dimana karyawan II bekerja tampa cacat
C = Kejadian dimana karyawan III bekerja tampa cacat
D = Kejadian dimana karyawan IV bekerja tampa cacat
E = Kejadian dimana karyawan V bekerja tampa cacat
a). P ( ABCDE ) = P ( A ) P ( B ) P ( C ) P ( D ) P ( E )
= ( 0,99 ) ( 0,98 ) ( 0,97 ) ( 0,98 ) ( 0,99 )
b). P ( A
C
B
C
C
C
D
C
E
C
) = ( 0,01 ) ( 0,02 ) ( 0,03 ) ( 0, 02 ) ( 0,01 )
= 12 x 10
-10

DASAR-DASAR STATISTIK INFERENSIA
Teori Probabilitas
Teori Probabilitas
DASAR-DASAR STATISTIK INFERENSIA
Contoh 3.2
Probabilitas suatu penerbangan berangkat tepat pada waktunya P ( D ) adalah
0,83, probabilitas datang tepat pada waktunya P ( A ) adalah 0.92, dan probabilitas
berangkat dan datang tepat pada waktunya P ( DA )adalah 0.78.
(a)Tentukan probabilitas pada suatu penerbangan pesawat datang ( mendarat )
tepat pada waktunya, bila pesawat tersebut, berangkat tepat pada waktunya.
(b)Tentukan probabilitas bahwa pada suatu penerbangan, sebuah pesawat
berangkat tepat pada waktunya, bila diketahui pesawat tersebut mendarat tepat
pada waktunya.
(c)Tentukan probabilitas bahwa pada suatu penerbangan, sebuah pesawat
berangkat dan mendarat terlambat.
Teori Probabilitas
DASAR-DASAR STATISTIK INFERENSIA
94 . 0
83 . 0
78 . 0
) (
) (
) / ( = = =
D P
DA P
D A P
c). P ( D
C
A
C
) = ?
P (D) = P ( DA ) + P ( DA
C
)
0.83 = 0.78 + P ( DA
C
)
P (DA
C
) = 0.83 0.78 = 0.05
P(A
C
) = P ( DA
C
) + P ( D
C
A
C
)
P(A
C
) = 1- D(A) =1-0.92 = 0.08
P(D
C
A
C
) = 0.08 0.05 = 0.03
85 . 0
92 . 0
78 . 0
) (
) (
) / ( = = =
A P
DA P
A D P
Penyelesaian:
a)
b)
Teori Probabilitas
DASAR-DASAR STATISTIK INFERENSIA
Contoh 3.3
4 pembunuh hama a, b, c, dan d akan diuji dengan
memberikan masing-masing pembunuh hama pada sebuah
tanaman, dan 4 tanaman dipilih dari sederetan 10 tanaman.
Ada berapa kemungkinan pemberian ke-4 pembunuh hama
ini ?
Penyelesaian :
Salah satu dari ke-10 tanaman dapat dipilih untuk
membunuh hama a. Untuk setiap pilihan a, terdapat 9
tanaman yang sisa. Masing-masing tanaman ini bisa dipilih
untuk b, demikian seterusnya.
Menurut Product Rule : Jumlah kemungkinan pemberian ke-
4 pembunuh hama ini adalah = 10 x 9 x 8 x 7 = 5040
DASAR-DASAR STATISTIK INFERENSIA
Teori Probabilitas
Contoh 3.4 :
Komite penasehat mengenai tindak pidana terdiri atas 15 anggota. Dari ke 15
anggota ini, 9 diantaranya setuju, 4 diantaranya tidak setuju dan 2 diantaranya
abstain. Seorang reporter ingin memilih secara acak 3 orang dari komite ini dan
mencatat pandangan-pandangannya pada suatu siaran TV.
Tentukan probabilitas bahwa paling sedikit 2 dari orang dipilih setuju dengan
program tersebut.
Tentukan probabilitas bahwa dua orang pertama dari orang-orang yang dipilih
setuju dengan program, dan orang ketiga tidak setuju.
Penyelesaian :
Definisikan :
A2 = Kejadian dimana 2 orang setuju program
A3 = Kejadian dimana 3 orang setuju program
P (A2 UA3 ) = P(A2) + P(A3)
DASAR-DASAR STATISTIK INFERENSIA
Teori Probabilitas
455
216
2
15
1
6
2
9
) ( 2 =
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
= A P
455
84
3
15
0
6
3
9
) ( 3 =
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
= A P
b). Dalam hal ini urutan perlu diperhatikan.
P [ dua orang pertama setuju, orang ketiga tak setujui ] =
k
m
m = P
2
9
x P
1
4
= ( 9x8) ( 4 ) = 288
k = P
3
15
= 15 x 14 x 13 = 2730
P [ 2 orang pertama setuju, orang ke-3 tak setuju ]
455
300
455
84
455
216
) ( 3 2 = + = UA A P
Penyelesaian :
a) Definisikan :
A
2
= Kejadian dimana 2 orang setuju program
A
3
= Kejadian dimana 3 orang setuju program
P (A
2
UA
3
) = P(A
2
) + P(A
3
)
2730
288
=
Variabel Acak dan Distribusi Probabilitas
DASAR-DASAR STATISTIK INFERENSIA
Variabel acak adalah suatu fungsi yang harganya merupakan bilangan real yang
ditentukan oleh masing-masing elemen didalam sample space. Variabel acak
dinyatakan dengan simbol x.
e
1

e
2

e
3

1
2 3 4
Kenapa dikatakan random variabel ? dikatakan random (acak) karena kita tak
mengetahui sebelumnya elemen (simple event) mana yang terjadi dan harga x
berapa yang diberikan.Yang perlu diperhatikan lagi adalah x disebut variabel,
walaupun pada hakekatnya merupakan fungsi yang didefinisikan pada suatu sample
space. Tabel yang menghubungkan harga variabel acak dan probabilitasnya disebut
Tabel Distribusi Probabilitas.
DASAR-DASAR STATISTIK INFERENSIA
Dua produk A dan B diuji oleh 4 pelanggan yang kemudian menyatakan lebih
menyukai A atau lebih menyukai B.
(a)Tentukan elemen-elemen sample spacenya.
(b)Difefinisikan variabel acak x sebagai jumlah orang lebih menyukai A dari pada B.
tentukan tabel distribusi probabilitasnya.
COONTOH 3.5
Penyelesaian :
a). Elemen-elemen sample space :
A A A A A A A B A A B B A B B B B B B B
A A B A A B A B B A B B
A B A A A B B A B B A B
B A A A B A A B B B B A
B B A A
B A B A
16
1
) 0 ( = = X P
16
4
) 1 ( = = X P
16
6
) 2 ( = = X P
16
4
) 3 ( = = X P
16
1
) 4 ( = = X P b)




16
1
16
4
16
6
16
4
16
1
x
P(X=x)
1 0 2 3 4
DASAR-DASAR STATISTIK INFERENSIA
JENIS VARIABEL ACAK
Ada dua jenis variabel acak yaitu:
Variabel Acak Diskrit
Yang harganya berupa bilangan bulat (integer)
seperti: banyak orang, banyak kali perlakuan
Variabel Acak Kontinue
Yang harganya bisa bulat atau pecahan
seperti: berat badan, suhu, tekanan, pH, Komposisi

DISTRIBUSI PROBABILITAS UNTUK VARIABEL ACAK YANG KONTINUE.
DASAR-DASAR STATISTIK INFERENSIA
Distribusi probabilitas untuk variabel acak kontinue tak dapat dinyatakan dalam
bentuk tabel, tapi dalam bentuk grafik atau formula f ( x ) yang disebut fungsi
probabilitas densitan.
Sifat-sifat fungsi densitas adalah :
1. f ( x ) 0 untuk seluruh harga x


=1 ) ( dx x f
2.

=
b
a
dx x f ) (
3. P( a<X<b)=
Luas diabwah kurva
a b
f(x)
x
DASAR-DASAR STATISTIK INFERENSIA
Ekspektansi merupakan ukuran pusat untuk suatu distribusi
probabilitas suatu variabel acak.
Ekspektansi didefinisikan sbb :
EKSPEKTANSI
) ( ) (
i i
x f x X E

= = u
Sifat-sifat Ekspektansi :
E (a ) = a
E ( bx ) = b E ( x )
E ( x + a ) = E (x ) + a
E ( a + bx ) = a + b E ( x )
E ( a + bx + cx
2
) = a + b E ( x ) + c E ( x
2
)
( )

+

= = dx x f x X E ) ( u
Untuk variabel acak diskrit
Untuk variabel acak kontinue
DASAR-DASAR STATISTIK INFERENSIA
Variance merupakan ukuran untuk suatu distribusi probabilitas variabel acak.
Variabel didefinisikan :
VARIANCE
( ) | | | |
2 2
2
2
) ( u u o = = = X E X E X Var
) (X Var = o
Standard Deviasi=
Sifat-sifat variance :
Var ( x ) tak boleh negatif
Var ( x + a ) = Var ( x )
Var ( b x ) = b
2
Var ( x )
Var ( a + bx ) = b
2
Var ( x )
Seorang pengusaha alat-alat listrik dapat membeli komponen listrik yang
dibutuhkan dari dua supplier ( supplier A dan B ). Komponen-komponen ini
dijual dalam kemasan kotak adalah $ 500,- dari supplier A dan $ 510,- dari
supplier B. Bila ada komponen yang rusak biaya perbaikannya $ 7 =
perkomponen. Dari pengalaman diketahui data distribusi probabilitas berikut.
0.4 0.4 0.2
Jumlah rusak per
kotak,x
Prob(X=x)
0 1 2
Suplier B
Jumlah rusak per
kotak,x
Prob(X=x)
0 1 2 3 4
0.1 0.2 0.3 0.3 0.1
Suplier A
DASAR-DASAR STATISTIK INFERENSIA
CONTOH 3.6
Dari supplier mana, pengusaha ini harus membeli komponen listrik yang
dibutuhkan ?
DASAR-DASAR STATISTIK INFERENSIA
Penyelesaian :
X = Jumlah komponen rusak perkotak
CA = Biaya total perrkotak dari supplier A
CB = Biaya total perrkotak dari supplier B
CA = 500 + 7 x
CB = 510 + 7x
E ( CA ) = 500 + 7 E ( X )
= 500 + 7 [ ( 0 ) ( 0.1 ) + ( 1 ) ( 0.2 ) + ( 2 ) ( 0.3 ) + ( 3 ) ( 0.3 ) + ( 4 )( 0.1) ] =
= $ 514.7
E ( CB ) = 510 + 7 E (X)
= 510 + 7 [ ( 0 ) ( 0.4 ) + ( 1 ) ( 0.4 ) + ( 2 ) ( 0.2 ) ]
= $ 515.6
Pengusaha ini harus membeli dari supplier A
DASAR-DASAR STATISTIK INFERENSIA
Contoh 3-7 :
Untuk distribusi probabilitas berikut :
x
f(x)
0 1 2 3
0.3 0.4 0.2 0.1
Tentukan :
a. Prob [ x 2 ]
b. Prob [ 0 < x 2 ]
c. Var ( x ) ; sd ( x )
Penyelesaian :
a). Prob [ x 2 ] = Prob [ x = 2 ] + Prob [ x = 3 ]
= 0.2 + 0.1 = 0.3
b). Prob [ 0< x 2 ] = Prob [ x = 1 ] + Prob [ x = 2 ]
= 0.4 + 0.2 = 0.6
c).Var(X)=E(X
2
)-
2

E(X
2
) = ( 0 )2 ( 0.3 ) + ( 1 )2 ( 0.4 ) + ( 2 )2 ( 0.2 ) + ( 3 )2 ( 0.1 )
= 0 + 0.4 + 0.8 + 0.9 =2.1
1 . 2 ) ( = x Var
Sd (x)=
DASAR-DASAR STATISTIK INFERENSIA
0 > x
Contoh soal 3-8
Masa pakai, dinyatakan dengan x, untuk semacam alat dapat dinyatakan oleh fungsi
densitas ekspormensial dengan persamaan:
Tentukan peluang sebuah alat demikian yang dapat dipakai selama :
a)Antara 3 dan 31/2 bulan
b)Lebih dari 3 bulan
c)Tentukan pula rata-rata masa pakainya.
( )
x
e x f
5 . 0
5 . 0

=
Dimana:
dalam bulan
Penyelesaian :
5 . 3
3
5 . 0
5 . 0
5 . 3
3
5 . 0 ) 5 . 3 3 Pr(
x
x
e dx x

= = s s


a.
0493 . 0
5 , 1 75 . 1
= + =

e e
2231 . 0 0 5 . 0 ) 3 Pr(
5 . 1
3
5 . 0
3
5 . 0
= + = = = s s

e e dx e x
x x
b.
=

= = =

0
5 . 0
0
5 . 0 5 . 0
0 0
2 / 1
5 . 0 dx e e x de x dx xe
x x x x
u
2 2
0
5 . 0
=

x
e
c.
DASAR-DASAR STATISTIK INFERENSIA
DISTRIBUSI PROBABILITAS TEORITIS
Distribusi probabilitas teoritis ( model probabilitas) untuk suatu variabel acak x
adalah suatu bentuk tertentu dari pada distribusi probabilitas yang dianggap
mencerminkan kelakuan daripada x. dalam hal ini probabilitas dinyatakan dalam
parameter-parameter yang tak diketahui yang berhubungan dengan karakteristik
populasi.
Ada persyaratan mengenai model probabilitas ini yaitu : - Kesesuaian dengan
populasi
- Sederhana
Akan dipelajari model probabilitas untuk variabel acak diskrit dan kontinue.
DASAR-DASAR STATISTIK INFERENSIA
DISTRIBUSI PROBABILITAS TEORITIS UNTUK VARIABEL ACAK
DISKRIT.
Distribusi Binomial :
A Perhatikan sebuah eksperimen yang hanya menghasilkan dua peristiwa A dan bukan A, atau
, dimana P ( A ) = . Bila tetap harganya, maka percobaan yang berulang-ulang dari
eksperimen itu dinamakan percobaan Bernoulli.
Sekarang lakukan percobaan Bernoulli sebanyak N kali secara independent, dimana x
diantaranya menghasilkan kejadian A dan sisanya N x kejadian bukan A
.
x N x
x
N
x X

|
|
.
|

\
|
= = ) 1 ( ) Pr( t t
Ekspektensi dan variance untuk distribusi ini yang disebut distribusi binomial adalah :
= N

= N ( 1- )
2
o
DASAR-DASAR STATISTIK INFERENSIA
Distribusi Multinominal
Misal sebuah eksperimen menghasilkan peristiwa-peristiwa E1, E2, ., Ek
dengan peluang 1 = P (E1 ), 2 = P (E2 ), k = P (Ek ).
Terhadap eksperimen ini kita lakukan percobaan sebanyak N kali. Maka peluang
akan terdapat x1 peristiwa E1, 2 peristiwa E2 , .., k peristiwa Ek diantara N
ditentukan oleh distribusi multinominal berikut.
K
X
X X
K
k k
N
x X x X x X t t t
; ; ;
.....
! ..... !......... !
!
) Pr(
2 1
2 1
2 1
...... , 2 2 , 1 1 = = = =
Dengan 1+ 2+ ..+ k = N dan 1 + 2 + .. + k = 1
Ekspektansi terjadinya tiap peristiwa E1, E2, .., Ek berturut-turut adalah N1,
N2, .,Nk. Sedang variancenya masing-masing N1 ( 1- 1 ), N2 ( 1- 2
), ., Nk ( 1- k ).
DASAR-DASAR STATISTIK INFERENSIA
Distribusi Hipergeometrik :
Misal ada sebuah populasi erukuran N diantaranya terdapat D buah termasuk
katagori tertentu. Dari populasi ini, sebuah sampel acak diambil berukuran n.
Pertanyaan yang timbul : berapa peluang dalam sampel itu terdapat buah
termasuk katagori tertentu itu ? jawabannya ditentukan oleh distribusi
hipergeometrik berikut.
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
= =
n
N
n
D N
x
D
x X
;
) Pr(
Ekspektunsi distribusi hipergeometrik adalah = E (x ) = n D/N
DASAR-DASAR STATISTIK INFERENSIA
Distribusi Geometrik :
Eksperiman E menghasilkan peristiwa A dengan peluang
dan bukan A dengan peluang ( 1- ). Misal variabel acak x
adalah jumlah percobaan ( ondependent ) yang harus
dilakukan untuk mendapatkan peristiwa A pertama kali.
Probabilitas
P [ X=x ] = ( 1- )
x-1
, x = 1,2,3,
DASAR-DASAR STATISTIK INFERENSIA
Distribusi Poisson :
Distribusi poisson digunakan untuk menentukan peluang sebuah kejadian yang
terjadinya sangat jarang. Distribusi poisson dinyatakan dengan,
!
) Pr(
x
m e
x X
x m
= =
m X E = = ) ( u
m X Var = = ) (
2
o
Untuk N besar kecil, dan m besarnya sedang, distribusi Binomial mendekati distribusi Poisson
DASAR-DASAR STATISTIK INFERENSIA
DISTRIBUSI PROBABILITAS TEORITIS UNTUK VARIABEL ACAK KONTINUE
Distribusi Normal :
Salah satu distribusi probabilitas teoritis yang berlaku untuk variabel acak
kontinue adalah distribusi normal yang diusulkan oleh pierre-Laylace dan Carl
Gauss yang bentuk matematiknya adalah :
2
2
2
) (
2
1
) (
o
u
o t

=
x
e x f
Dimana : f ( x ) = fungsi densitas
= harga rata-rata
= standard deviasi
Distribusi normal dengan mean dan standard deviasi diberi simbol N(,)
o
u
=
x
Z
Didefinisikan variabel standard Normal:
Dalam hal ini distribusinya disebut distribusi standard normal yang mempunyai
mean = 0 dan standard deviasi = 1 atau diberi simbol N ( 0,1 ). Telah dibuat tabel
normal yang didasarkan pada variabel standard normal Z.
DASAR-DASAR STATISTIK INFERENSIA
Pendekatan normal untuk distribusi binomial
Bila x mengikuti distribusi binomial b ( n,p ) dimana n besar dan b tak terlalu dekat
dengan 0 atau 1, maka distribusi daripada variabel standard :
nPq
nP x
Z

=
adalah mendekati N ( 0,1 ).
( ) ( )

s s

= s s
p np
np b
Z
p np
np a
ob b x a ob
1 1
Pr ) ( Pr
Berarti:
( ) ( )

+
s s


= s s
p np
np b
Z
p np
np a
ob b x a ob
1
5 . 0
1
5 . 0
Pr ) ( Pr
Dengan koreksi, perhitungan lebih teliti:
Menguji asumsi distribusi normal :
DASAR-DASAR STATISTIK INFERENSIA
Metode I :
Menghitung proporsi pengamatan-pengamatan disekitar mean.
Bila distribusi Normal :
| |
3
1
, Pr = + > < o u o u x x ob
| |
20
1
2 , 2 Pr = + > < o u o u x x ob
| |
300
1
3 , 3 Pr = + > < o u o u x x ob
o u s x ,
Untuk sampel
besar:
1. Hitung jumlah pengamatan-pengamatan di luar interval :
2. Bagi dengan jumlah total pengamatan. Bandingkan dengan harga-harga teoritas
3
) 1 (
/ >

n
p p
p p
3. Bila: Tidak normal
( ) ( ) ( ) s x s x s x s x s x s x 3 , 3 , 2 , 2 , , + + +
DASAR-DASAR STATISTIK INFERENSIA
Metode II :
Menggunakan normal protability paper
1. Urutkan n pengamatan-pengamatan dari kecil ke besar.
2. Pilih skala pada sb. horizontal untuk mengakomodasi seluruh
pengamatan- pengamatan.
3. Plot modified cumulative relative frequency ( i 1 )/n pada sb. Vertikal
versus harga pengamatan urutan ke-i pada sb.horizontal.
4. Bila plot menyimpang dari garis lurus tak normal
Bila plot menuruti garis lurus normal
Menguji asumsi distribusi normal :
DASAR-DASAR STATISTIK INFERENSIA
Normal Probability Paper (Kertas Peluang Normal)
DASAR-DASAR STATISTIK INFERENSIA
Normal Probability Paper (Kertas Peluang Normal)
Bila pengujian menghasilkan kesimpulan bahwa distribusi tak normal. Maka bisa
dilakukan transformasi pengamatan-pengamatan untuk memperoleh distribusi yang
hampir normal yaitu :
Membuat harga menjadi lebih besar : x
2
, x
3
, ..
Membuat harga menjadi lebih kecil : ,........
1
, log , ,
4
x
x x x

TRANSFORMASI VARIABEL
DASAR-DASAR STATISTIK INFERENSIA
,........
1
, log , ,
4
x
x x x
Contoh soal 3-9
Setiap partai barang kiriman terdiri dari 100 unit. Pembeli setuju untuk
membeli kiriman partai barang tersebut jika dalam sebuah sample acak
terdiri dari 10 unit, paling banyak berisi satu unit rusak. Partai barang berisi
10% unit rusak. Tentukan peluang bahwa pembelian akan terjadi.
Penyelesaian :
Digunakan distribusi hipergeometrik.
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
= =
n
N
n
D N
x
D
x X ob
;
) ( Pr
N = 100, D = ( 0.1 ) ( 100 ) = 10
n = 10
Akan dicari P [ x 1 ]
P [ x 1 ] = P [ x = 0 ] + P [ x = 1 ]
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
+
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=
10
100
1 10
10 100
1
10
10
100
0 10
10 100
0
10
=
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
+
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
=
10
100
9
90
1
10
10
100
10
90
0
10
DASAR-DASAR STATISTIK INFERENSIA
7385 . 0 4080 . 0 3305 . 0
10 7310309 . 1
10 0625252 . 7 10
10 7310309 . 1
10 7206454 . 5 1
! 90 ! 10
! 100
! 81 ! 9
! 90
! 9 ! 1
! 10
! 90 ! 10
! 100
! 80 ! 10
! 90
! 10 ! 0
! 10
13
11
13
12
= + = + = + =
x
x x
x
x x
DASAR-DASAR STATISTIK INFERENSIA
Contoh 3-10
Jumlah permintaan nomor telepon melalui operator dari jam 10.00 s/d 10.15
teristribusi poisson dengan rata-rata 3.
Tentukan peluang bahwa pada suatu hari dalam waktu tersebut operator.
a.Tak menerima permintaan
b.Menerima kurang dari 3 permintaan
c.Menerima lebih dari 3 permintaan
Penyelesaian
Distribusi Poisson :
! / ) ( Pr ;
x
e x X ob

= =
0498 . 0 ! 0 / 3 ) 0 ( Pr )
3 0 3
= = = =

e e X ob a
b) P [ x < 3 ] = P [ x = 0 ] + P [ x = 1 ] + P [ x = 2 ]
! 2
3 .
! 1
3 .
! 0
3 .
2 3 1 3 3
+ + =
e e e
c) P [ x > 3 ] = 1 P [ x 3 ]
= 1 - { P [ x = 0 ] + P [ x = 1 ] + P [ x = 2 ] + P [ x = 3 ] } =
= 0.0498 + 0.1494 + 0.2241 = 0.4233
}
! 3
3
! 2
3 .
! 1
3 .
! 0
3 .
{ 1
3 3 2 3 1 3 0 3
+ + + =
e e e e
=1-(0.0498 + 0.1494 + 0.2241+ ) =
Contoh 3-11
Suatu survey yang dilaksanakan 5 tahun yang lalu menunjukkan 30 % populasi
orang dewasa disuatu kota adalah penderita penyakit tekana darah tinggi. Bila
keadaan ini berlalu sampai sekarang, berapa probabilitas bahwa dalam sampel
acak yang terdiri dari 1000 orang dewasa dari kota lain, jumlah penderita penyakit
tekanan darah tingginya adalah :
a). Kurang dari 280
b). 316 atau lebih
DASAR-DASAR STATISTIK INFERENSIA
Penyelesaian :
Didefinisikan : variabel acak x adalah jumlah penderita penyakit tekanan darah
tinggi dalam sampel acak yang terdiri dari 1000 orang dewasa.
N = 1000 = 0.3
= N = ( 1000 ) ( 0.3 )= 300
5 . 14 ) 3 . 0 1 )( 3 . 0 )( 1000 ( ) 1 ( = = t t N
a). P [ x < 280 ] = P [ x 279 ] =

< = )
5 . 14
300 279
( Pr Z ob P [ Z - 1.45 ] = 0.074
dengan koreksi :
P ( x 279 ) =
)
5 , 14
300 5 , 279
(

< Z P
= P ( Z - 1,414 ) = 0,079
b). P ( x 316 )
)
5 , 14
300 316
(

> = Z P
= P ( Z 1,103 ) = 1-0,865 = 0,135
dengan koreksi :
P ( x 316 )
=

> = )
5 , 14
300 5 , 315
(Z P
P ( Z 1.069 ) =
DASAR-DASAR STATISTIK INFERENSIA
Contoh 3-12
Disuatu daerah, peluang akan terjadi banjir pada sebarang hari antara 1
Oktober 31 Desember sama dengan 0,30. misalkan terjadinya banjir dari hari
ke hari independent. Tentukan besarnya peluang akan terjadi banjir pertama kali
pada tanggal 29 Nopember ?
Penyelesaian :
Digunakan distribusi geometrik :
P ( x = ) = ( 1- ) x-1
= 0,3
1 Oktober 29 Nopember 60 hari = 60
P ( x = 60 ) = 0,3 ( 1-0,3 ) 60-1 = ..
DASAR-DASAR STATISTIK INFERENSIA
Contoh soal 3-13
Daya tahan setiap gulung tali ( masing-masing 10 m ) dinyatakan dalam
kilogram ternyata terdistribusi normal dengan rata-rata 50 kg dan dengan baku 4
kg. Untuk gulungan tali dengan daya tahan kurang dari 48 kg diperkirakan
mendapat keuntungan Rp. 5,-/ gulung. Untuk yang lebih dari 52 kg
keuntunganya Rp. 35,-/gulung . sisanya mendapat keuntungan Rp. 15,-/gulung.
Tentukan keuntungan yang diharapkan untuk tiap gulung.
Penyelesaian :
( ) ( ) 3085 . 0 5 . 0 Pr
4
50 48
Pr 48 Pr = s =
|
.
|

\
|

s = s Z ob Z ob X ob
Prob ( x 52 ) = 1 Prob ( x 52 )
3085 . 0 6915 . 0 1
4
50 52
Pr 1 = =
|
.
|

\
|

s = Z ob
Prob ( 48 x 52 ) = Prob ( x 52 ) Prob ( x 48 )
DASAR-DASAR STATISTIK INFERENSIA
( ) ( ) = s s =
|
.
|

\
|
s
|
.
|

\
|
s = 5 . 0 Pr 5 . 0 Pr
4
50 48
Pr
4
50 52
Pr Z ob Z ob Z ob Z ob
= 0,6915 0,3085 = 0,383
Keuntungan per gulung =Prob( x 52)(35)+Prob(48 x 52 )(15)+Prob(x5)(5)=
DISTRIBUSI SAMPLING
Sampel Acak :
Sampel acak dengan ukuran n dari suatu populasi yang mempunyai distribusi f (x)
adalah kumpulan n variabel random ( variabel acak ) yang independent x
1
, x
2
,
x
n
. masing-masing mempunyai distribusi f ( x ).
Sampel acak bisa diperoleh bila setiap anggota populasi mempunyai peluang
sama untuk terpilih sebagai anggota sampel.
Adalah suatu fungsi dari pada pengamatan-pengamatan sampel.
Contoh : Sampel mean
Statistic :
Sampel median Me
Sampel variance S
2

x
DASAR-DASAR STATISTIK INFERENSIA
Distribusi Sampling :

Sebagai fungsi dari pada variabel-variabel acak x1, x2, xn. Statistik juga
sebagai variabel acak dan mempunyai distribuisi. Distribusinya disebut distribusi
sampling dari pada statistic tersebut.
Contoh : distribusi sampling untuk rata-rata sampel
Ekspektansi dan variance untuk distribusi ini bisa diperoleh sebagai berikut :
( )
( ) ( ) ( )
u
u u u
=
+ + +
=
+ + +
= |
.
|

\
|
+ + +
=
n n
X E X E X E
n
X X X
E X E
n n
.... ... ....
2 1 2 1
( )
( ) ( ) ( )
n n n
X Var X Var X Var
n
X X X
Var X Var
n n
2
2
2 2 2
2
2 1 2 1
... ... ... o o o o
=
+ + +
=
+ + +
= |
.
|

\
| + + +
=
DASAR-DASAR STATISTIK INFERENSIA
Central Limit Theoreme :
Walaupun distribusi populasi tidak normal distribusi sampling untuk
x
akan mendekati normal bilamana ukuran sampel cukup besar.
x
x
DASAR-DASAR STATISTIK INFERENSIA

Contoh 3-14 :
Sebuah perusahaan susu bubuk memproduksi susu dalam kemasan kantong
plastik dengan berat rata-rata 400 gram dan standard deviasi 4 gram. Berat
kantong plastik ini terdistribusi normal. Bila diambil 5 kantong dan dihitung rata-
ratanya, berapa probabilitasnya rata-rata ini terletak pada 400 dan 405 gram.
Penyelesaian :
= 400 = 4
n
x
Z
/ o
u
=
( ) ( ) = s s =
|
|
.
|

\
|
s s = s s 79 . 2 0 Pr
5 / 4
400 405
0 Pr 405 400 Pr Z ob Z ob X ob
( ) ( ) 4974 . 0 5 . 0 9974 . 0 0 Pr 79 . 2 Pr = = s s = Z ob Z ob
DASAR-DASAR STATISTIK INFERENSIA
DASAR-DASAR STATISTIK INFERENSIA
KONSEP DASAR PENGUJIAN HIPOTESA
Hipotesa Statistik adalah pernyataan tentang parameter populasi. Kebenarannya
akan dianalisa (dievaluasi) berdasar informasi yang diperoleh dari data sampel
populasi ini.
Karena pernyataan ini mungkin benar atau salah, maka terdapat dua hipotesa
yang paling mengisi (komplemen) yaitu :
Hipotesa null : H
0

Hipotesa alternatif : H
1

Kesimpulan suatu hipotesa statistik belum tentu benar. Ada peluang bahwa
kesimpulan ini salah.
Dalam hal ini dikenal dua type kesalahan yaitu :
Kesalahan type I :
Kesalahan dalam hal menyalahkan hipotesa Ho yang seharusnya benar.
Kesalahan type II :
Kesalahan dalam hal membenarkan hipotesa Ho yang seharusnya salah.
DASAR-DASAR STATISTIK INFERENSIA

Kesimpulan pengujian
hipotesa
Kenyataan sebenarnya
H
o
benar
Kenyataan sebenarnya
H
o
salah
H
o
di terima Kesimpulan benar Kesimpulan salah
(kesalahan type II)
H
o
di tolak Kesimpulan salah
(kesalahan type I)
Kesimpulan benar
DASAR-DASAR STATISTIK INFERENSIA
o
o
o
o
Didefinisikan :

Didefinisikan :
=Prob (terjadinya kesalahan type I)
= Prob (terjadinya kesalahan typr II)
o

Diharapkan harga o
dan Kedua nya kecil.
Namun hal ini tak mungkin.
Karena bila o makin kecil, makin besar
Dalam pengujian hipotesa, kesalahan type I lebih diperhatikan dari pada
kesalahan type II. Oleh karena distribusi harga batas (harga kritis) untuk
kesalahan type I yang di sebut significance level
SIGNIFICANT LEVEL
o = 0.01 - 0.05
DASAR-DASAR STATISTIK INFERENSIA
Perumusan Hipotesa :
Misal adalah parametca populasi yang akan dibuat pernyataan dalam hipotesanya.
Ada beberapa jenis perumusan hipotesa :

\
|
=
=
0 1
0 0
:
:
u u
u u
H
H

\
|
>
s
0 1
0 0
:
:
u u
u u
H
H

<
>
0 1
0 0
:
:
u u
u u
H
H
Two tail test atau
Two Sided Test

One tail test atau


One sided test
DASAR-DASAR STATISTIK INFERENSIA
Langkah-langkah umum dalam pengujian Hipotesis
1. Buat prumusan hipotesa
2. Pilih statistik pengujian
3. Tentukan distribusi sampling untuk statistik pengujian
4. Tentukan harga standard statistik pengujian dengan anggapan Ho
benar.
5. Pilih harga significance level . Dan berdasar harga ini, tentukan
daerah penolakan dan penerimaa nya.
6. Buat kesimpulan.
DASAR-DASAR STATISTIK INFERENSIA
Pengujian Hipotesa terhadap Mean Populasi
Jenis-jenis rumusan hipotesa:

=
=
0 1
0 0
:
:
u u
u u
H
H
I

>
s
0 1
0 0
:
:
u u
u u
H
H
II

<
>
0 1
0 0
:
:
u u
u u
H
H
III
Staistik pengujian:
X
Ditinjau beberapa kasus:
A. diketahui
Distribusi sampling untuk
X
mengikuti distribusi Normal
( )
( )
n
X
n
X
X Var
X E X
Z
/
/
2
o
u
o
u
=

=
Harga Z dihitung dengan anggapan H0 benar, atau dihitung Z0
n
X
Z
/
0
0
o
u
=
DASAR-DASAR STATISTIK INFERENSIA
Daerah penolakan untuk significance level :
Hipotesa Jenis I:
/2
/2
Z
/2
= - Z
(1-/2)
Z
(1-/2)

ditolak H
Z Z
atau
Z Z
0
) 2 / 1 ( 0
) 2 / 1 ( 0

<
>

o
o
Bila: - Z(1-/2) Z0 Z(1-/2) H0 tak dapat ditolak
DASAR-DASAR STATISTIK INFERENSIA
Hipotesa Jenis II:

Z
(1-)

Bila: Z0 > Z(1-) H0 ditolak
Z(1-) H0 tak dapat ditolak
Hipotesa Jenis III:

Z

= - Z
(1-)

Bila: Z0 < - Z(1-) H0 ditolak
-Z(1-) H0 tak dapat ditolak
DASAR-DASAR STATISTIK INFERENSIA
tak diketahui
Dalam hal ini distribusi sampling untuk
X
mengikuti distribusi student-t dengan derajat kebebasan n-1
n S
X
t
/
0
0
u
=
Daerah penolakan untuk taraf nyata (significance level) adalah:
Hipotesa Jenis I:
/2
/2
- t
(/2,n-1)
t
(/2,n-1)

ditolak H
t Z
atau
t t
n
n
0
) 1 , 2 / ( 0
) 1 , 2 / ( 0

<
>

o
o
Bila: - t(/2,n-1) t0 t(/2,n-1) H0 tak dapat ditolak
DASAR-DASAR STATISTIK INFERENSIA
Hipotesa Jenis II:

t
(,n-1)

Bila: t0 > t(,n-1) H0 ditolak
t(,n-1) H0 tak dapat ditolak
Hipotesa Jenis III:

- t
(,n-1)

Bila: t0 < - t(,n-1) H0 ditolak
-t(,n-1) H0 tak dapat ditolak
DASAR-DASAR STATISTIK INFERENSIA
Pengujian Hipotesa terhadap proporsi
Jenis-jenis rumusan hipotesa:

=
=
0 1
0 0
:
:
t t
t t
H
H
I

>
s
0 1
0 0
:
:
t t
t t
H
H
II

<
>
0 1
0 0
:
:
t t
t t
H
H
III
Statistik pengujian: p=proporsi sampel
n
X
p =
Asalkan n besar, distribusi sampling untuk proporsi sampel p mengikuti distribusi normal.
( )
( )
n
p
p Var
p E p
Z
) 1 ( t t
t

=
Untuk uji hipotesa, harga Z dihitung dengan anggapan H0 benar, yaitu:
n
p
Z
) 1 (
0 0
0
t t
t

=
Daerah penolakan untuk significance level , lihat II.4.1
DASAR-DASAR STATISTIK INFERENSIA
Pengujian Hipotesa terhadap variance
Jenis-jenis rumusan hipotesa:

=
=
2
0
2
1
2
0
2
0
:
:
o o
o o
H
H
I

>
s
2
0
2
1
2
0
2
0
:
:
o o
o o
H
H
II

<
>
2
0
2
1
2
0
2
0
:
:
o o
o o
H
H
III
Statistik pengujian: S
2

Asalkan distribusi populasi adalah normal,
( )
2
2
1
o
S n
akan mengikuti distribusi Chi Square dengan derajat kebebasan n-1.
2
x
dengan anggapan H0 benar, Untuk pengujian hipotesa, dihitung harga
yaitu dihitung,
( )
2
0
2
2
0
1
o
S n
x

=
DASAR-DASAR STATISTIK INFERENSIA
Daerah penolakan untuk taraf nyata :
Hipotesa jenis I:
2 / o
2
1 ,
2
1 |
.
|

\
|
n
x
o
2
x
2
1 ,
2
n
x
o
2 / o
2
1 ,
2
2
0

>
n
x x
o
2
1 ,
2
1
2
0

<
n
x x
o
H0 ditolak
Bila:
atau
Hipotesa jenis II:
Hipotesa jenis III:
2
1 , n
x
o
o
2
x
( )
2
1 , 1 n
x
o
2
x

2
1 , 1
2
0
<
n
x x
o
2
1 ,
2
0
>
n
x x
o
Bila: H0 ditolak
H0 ditolak
Bila:
DASAR-DASAR STATISTIK INFERENSIA
Pengujian Hipotesa untuk membandingkan mean dua populasi
Ditinjau dua kasus: Pengamatan tak berpasangan dan pengamatan berpasangan.
A. Pengamatan tak berpasangan
Populasi A
Populasi B
A
u
B
u
Asaumsi: Populasi A dan B terdistribusi Normal, dan pengambilan sampel
secara acak.
Jenis-jenis rumusan hipotesa:

=
=
B A
B A
H
H
I
u u
u u
:
:
1
0

>
s
B A
B A
H
H
II
u u
u u
:
:
1
0

<
>
B A
B A
H
H
III
u u
u u
:
:
1
0
Statistik pengujian
B A
X X
DASAR-DASAR STATISTIK INFERENSIA
Ditinjau beberapa kasus.
2 2 2
o o o = =
B A
A1.
o
diketahui
Dalam hal ini distribusi sampling untuk
B A
X X
mengikuti distribusi Normal yaitu:
( )
B A
B A B A
n n
X X
Z
1 1
+

=
o
u u
Untuk menguji hipotesa dihitung,
B A
B A
n n
X X
Z
1 1
0
+

=
o
Daerah penolakan untuk significance level , lihat II.4.1
DASAR-DASAR STATISTIK INFERENSIA
A2.
2 2 2
o o o = =
B A
o
tak diketahui
Dalam hal ini distribusi sampling untuk
B A
X X
mengikuti distribusi Student-t dengan derajat kebebasan 2 +
B A
n n yaitu:
( )
B A
P
B A B A
n n
S
X X
t
1 1
+

=
u u
Dimana
P
S adalah estimasi sampel untuk harga
o
yaitu,
( ) ( )
2
1 1
2 2
+
+
=
B A
B B A A
P
n n
S n S n
S
Untuk menguji hipotesa dihitung,
B A
P
B A
n n
S
X X
t
1 1
0
+

=
DASAR-DASAR STATISTIK INFERENSIA
Daerah penolakan untuk taraf nyata (significance level) adalah:
Hipotesa Jenis I:
/2
/2
|
.
|

\
|
+

2 ,
2
B A
n n
t
o
|
.
|

\
|
+ 2 ,
2
B A
n n
t
o
Bila:
ditolak H
t t
atau
t t
B A
B A
n n
n n
0
) 2 ,
2
(
0
) 2 ,
2
(
0

<
>
+
+
o
o
Hipotesa Jenis II:


Hipotesa Jenis III:
( ) 2 , +
B A
n n
t
o
( ) 2 , +

B A
n n
t
o
( ) 2 , 0 +
>
B A
n n
t t
o
( ) 2 , 0 +
<
B A
n n
t t
o
Bila H
0
ditolak
Bila
H
0
ditolak
DASAR-DASAR STATISTIK INFERENSIA
A3.
2 2
B A
o o =
,
A
o
B
o
diketahui
Dalam hal ini distribusi sampling untuk
B A
X X
mengikuti distribusi Normal yaitu:
( )
B
B
A
A
B A B A
n n
X X
Z
2 2
o o
u u
+

=
Untuk menguji hipotesa dihitung,
B
B
A
A
B A
n n
X X
Z
2 2
0
o o
+

=
Daerah penolakan untuk significance level , lihat II.4.1
DASAR-DASAR STATISTIK INFERENSIA
A4.
2 2
B A
o o =
,
A
o
B
o
Tak diketahui
Dalam hal ini distribusi sampling untuk
B A
X X
mengikuti distribusi Student-t yaitu:
( )
B
B
A
A
B A B A
n
S
n
S
X X
t
2 2
+

=
u u
Untuk menguji hipotesa dihitung,
B
B
A
A
B A
n
S
n
S
X X
t
2 2
0
+

=
Daerah penolakan untuk significance level lihat III.4.4.A2
DASAR-DASAR STATISTIK INFERENSIA
B. Pengamatan berpasangan
Statistik pengujian:
d
(rata-rata dari masing-masing beda pasangan)
Rumusan hipotesa:
0 :
0 :
1
0
=
=
o
o
H
H
0 :
0 :
1
0
>
s
o
o
H
H
0 :
0 :
1
0
<
>
o
o
H
H
Untuk menguji hipotesa, dihitung:
n S
d
t
d
/
0
= n = banyak pasangan
( )
1
2

=

n
d d
S
i
d
Daerah penolakan, lihat III.4.1 B.
DASAR-DASAR STATISTIK INFERENSIA
Pengujian Hipotesa untuk membandingkan proporsi dua populasi
Rumusan hipotesa:
B A
B A
H
H
t t
t t
=
=
:
:
1
0
B A
B A
H
H
t t
t t
>
s
:
:
1
0
B A
B A
H
H
t t
t t
<
>
:
:
1
0
Statistik pengujian: B A
P P
Distribusi sampling untuk B A
P P
mengikuti distribusi Normal asal ukuran sampel besar
( )
( )
( )
( ) ( )
B
B B
A
A A
B A B A
B A
B A B A
n n
P P
P P Var
P P E P P
Z
t t t t
t t


=
1 1
Untuk menguji hipotesa, harga Z dihitung fdengan anggapan H0 benar, yaoitu dihitung:
( ) ( )
|
|
.
|

\
|
+

=
|
|
.
|

\
|
+

=
B A
B A
B A
B A
n n
P P
P P
n n
P P
Z
1 1
1
1 1
1
0
t t
B A
B a
B
B
B
A
A
A
n n
x x
P
n
x
P
n
x
P
+
+
= = = , ,
Daerah penolakan: lihat III.4-1
DASAR-DASAR STATISTIK INFERENSIA
Pengujian Hipotesa untuk membandingkan variance dua populasi
Rumusan hipotesa:
2 2
1
2 2
0
:
:
B A
B A
H
H
o o
o o
=
=
2 2
1
2 2
0
:
:
B A
B A
H
H
o o
o o
>
s
2 2
1
2 2
0
:
:
B A
B A
H
H
o o
o o
<
>
Statistik pengujian:
2
2
B
A
S
S
Asalkan distribusi populasi A dan B adalah Normal, distribusi sampling untuk
2 2
2 2
/
/
B B
A A
S
S
o
o
mengikuti distribusi F dengan derajat kebebasan pembilang
( ) 1
A
n
dan derajat kebebasan penyebut
( ) 1
B
n
Untuk pengujian hipotesa, dihitung harga F dengan anggapan H0 benar, yaitu dihitung:
2
2
0
B
A
S
S
F =
DASAR-DASAR STATISTIK INFERENSIA
1 , 1 ,
2

B A
n n
F
o
|
.
|

\
|
1 , 1 ,
2
1
b A
n n
F
o
2 / o
2 / o
F
2
1 , 1 ,
2
0

>
B A
n n
F F
o
1 , 1 ,
2
1
0

<
B A
n n
F F
o
H0 ditolak
( ) 1 , 1 ,
B A
n n
F
o
o
( ) 1 , 1 , 0
>
B A
n n
F F
o
H0 ditolak
H0 ditolak

( ) 1 , 1 , 1 0
<
B A
n n
F F
o
TEORI MENAKSIR
Ada dua taksiran yaitu: Taksiran titik (point estimate) dan
Taksiran interval (interval estimate).
Tujuan: Menaksir harga parameter-parameter populasi.
Taksiran titik:
Ada dua taksiran titik:Unbiased estimate dan biased estimate
Unbiased estimate:
merupakan unbiased estimate untuk
merupakan biased estimate untuk
u

u
u
( ) u u =

E
( ) u u =

E
bila
bila
unbiased estimate untuk
unbiased estimate untuk
X
P
S
biased estimate untuk
u
t
( ) u = X E
( ) t = P E
( ) o = S E
o
karena
karena
karena
Taksiran interval
TEORI MENAKSIR
Taksiran interval untuk u dengan koefisien kepercayaan

atau dikatakan
%
confidence interval untuk u
adalah:
A B s su
dimana,
| | u = s s A B ob Pr
Atau dikatakan kita percaya dengan kepercayaan

% bahwa harga
u
berada diantara B dan A.
TEORI MENAKSIR
Confidence Interval untuk Mean Populasi dengan koefisien kepercayaan

Bila diketahui
( ) ( ) 2 / 1 2 / 1
o
u
o
+ +
+ s s Z
n
X Z
n
X
|
.
|

\
|

|
.
|

\
|

+ s s
1 ,
2
1
1 ,
2
1
n n
t
n
s
X t
n
s
X

u
Bila tak diketahui
( ) ( )
2
1
2
1
1 1

t
+ +

+ s s

Z
n
P P
P Z
n
P P
P
Confidence Interval untuk Variance Populasi dengan koefisien kepercayaan
Confidence Interval untuk Proporsi Populasi dengan koefisien kepercayaan
( ) ( )
2
1 ,
2
1
2
2
2
1 ,
2
1
2
1 1
|
.
|

\
|

+
|
.
|

\
|

s s

n n
x
s n
x
s n

o
TEORI MENAKSIR
Confidence Interval untuk Beda Rata-rata (mean) dua Populasi dengan
koefisien kepercayaan
|
.
|

\
| +
|
.
|

\
| +
+ + s s +
2
1
2
1
1 1 1 1

o u u o Z
n n
X X Z
n n
X X
B A
B A
B A
B A
B A
|
.
|

\
|
+

|
.
|

\
|
+

+ + s s +
2 ,
2
1
2 ,
2
1
1 1 1 1
B A B A
n n
B A
P
B A
B A
n n
B A
P
B A t
n n
s X X t
n n
s X X

u u
|
.
|

\
| +
|
.
|

\
| +
+ + s s +
2
1
2 2
2
1
2 2

o o
u u
o o
Z
n n
X X Z
n n
X X
B
B
A
A
B A
B A
B
B
A
A
B A
|
.
|

\
| +
|
.
|

\
| +
+ + s s +
2
1
2 2
2
1
2 2

u u Z
n
s
n
s
X X Z
n
s
n
s
X X
B
B
A
A
B A
B A
B
B
A
A
B A
2 2 2
o o o = =
B A
o
diketahui
2 2 2
o o o = =
B A
o
tak diketahui
2 2
B A
o o =
,
A
o
B
o
diketahui
tak diketahui
2 2
B A
o o = ,
A
o
A
o
TEORI MENAKSIR
Confidence Interval untuk Rata-rata Beda dengan koefisien kepercayaan
|
.
|

\
|

|
.
|

\
|

+ s s
1 ,
2
1
1 ,
2
1
n
d
n
d
t
n
s
d t
n
s
d

o
Confidence Interval untuk Beda Proporsi dua Populasi dengan koefisien
kepercayaan
( ) ( ) ( ) ( )
2
1
2
1
1 1 1 1

t t
+ +

+

+ s s

Z
n
P P
n
P P
P P Z
n
P P
n
P P
P P
B
B B
A
A A
B A B A
B
B B
A
A A
B A
Confidence Interval untuk Perbandingan Variance dua Populasi dengan
koefisien kepercayaa
|
.
|

\
|

+
|
.
|

\
|

s s
1 , 1 ,
2
1
2 2
2
2
1 , 1 ,
2
1
2 2
/ /
B A B A
n n
B A
B
A
n n
B A
F
S S
F
S S

o
o
CONTOH-CONTOH SOAL
Suatu model fisik mensyaratkan bahwa rata-rata kenaikan suhu air pendingin
dalam ruang kompressor tak boleh lebih dari 50C. Kenaikan suhu air
pendingin pada unit kompressor ini diukur dalam 8 run percobaan yang
independen dan diperolewh data berikut: 6.4, 4.3, 5.7, 4.9, 6.5, 5.9, 6.4, 5.1
Apakah data ini menunjukkan bahwa persyaratan model fisik
dilampaui? (=0.05)
Tentukan 95% confidence interval untuk rata-rata kenaikan suhu air
pendingin.
CONTOH 1
Penyelesaian:
Hipotesa yang diuji:
5 :
5 :
1
0
>
s
u
u
H
H
Statistik pengujian:
X
Karena tak diketahui, distribusi sampling untuk
X
mengikuti distribusi student-t dengan derajat kebebasan 8-1=7.
n s
X
t
/
u
=
0
t
:
Untuk menguji hipotesa dihitung
0
t
:
n s
X
t
/
0
0
u
=
65 . 5
8
1 . 5 4 . 6 9 . 5 5 . 6 9 . 4 7 . 5 3 . 4 4 . 6
=
+ + + + + + +
= X
( )
8106 . 0
1 8
65 . 5 8 1 . 5 ..... 3 . 4 4 . 6
1
2 2 2 2
1
2
2
=

+ + +
=

=

=
n
X n x
s
n
i
i
265 . 2
8 / 8106 . 0
5 65 . 5
0
=

= t
( )
895 . 1
7 , 05 . 0
= t
895 . 1 265 . 2
0
> = t
Karena H0 ditolak.
Jadi data menunjukkan bahwa persyaratan model fisik dilampaui.
b) 95% confidence interval untuk adalah:
|
.
|

\
|

|
.
|

\
|

+ s s
1 ,
2
1
1 ,
2
1
n n
t
n
s
X t
n
s
X

u
( )
365 . 2
7 , 025 . 0
1 8 ,
2
95 . 0 1
1 ,
2
1
= = =
|
.
|

\
|

|
.
|

\
|

t t t
n

CONTOH-CONTOH SOAL
( ) ( ) 365 . 2
8
8106 . 0
65 . 5 365 . 2
8
8106 . 0
65 . 5 + s s u
328 . 6 972 . 4 s s u
CONTOH-CONTOH SOAL
CONTOH 2
Suatu penelitian yang dilakukan pemerintah menunjukkan bahwa laju
oengangguran tingkat nasional adalah 7.8%. Suatu group peneliti mengambil
sampel acak yang terdiri dari 1600 orang angkatan kerja dalam suatu daerah.
Ternyata 96 diantaranya menganggur. A) Apakah ini menunjukkan bahwa angka
pengangguran di daerah ini lebih kecil dari pada angka pengangguran skala
nasional (=0.05). B) Tentukan 95% confidence interval untuk laju pengangguran
didaerah ini.
Penyelesaian:
Hipotesa yang diuji:
H
0
: 0.078
H
1
: < 0.078
06 . 0
1600
96
= = p
Untuk menguji hipotesa ini dihitung:
( ) ( )
686 . 2
1600
078 . 0 1 078 . 0
078 . 0 06 . 0
1
0 0
0
0
=

=
n
p
Z
t t
t
645 . 1
05 . 0
= Z
<
05 . 0 0
Z Z H0 ditolak
Jadi data menunjukkan bahwa angka pengangguran didaerah ini lebih kecil
dari pada angka pengangguran skala nasional
CONTOH-CONTOH SOAL
b) 95% confidence interval untuk adalah:
( ) ( )
|
.
|

\
| +
|
.
|

\
| +

+ s s

2
1
2
1
1 1

t Z
n
p p
p Z
n
p p
p
( ) ( )
|
.
|

\
| +
|
.
|

\
| +

+ s s

2
95 . 0 1
2
95 . 0 1
1600
06 . 0 1 06 . 0
06 . 0
1600
06 . 0 1 06 . 0
06 . 0 Z Z t
1.96
0716 . 0 048 . 0 s st
Lembaran-lembaran plastic yang dihasilkan suatu mesin secara periodik dimonitor
untuk melihat adanya fluktuasi ketebalan. Ketidak seragaman viskositas liquida
bahan baku membut fluktuasi ketebalan ini tak dapat dihindari. Tapi bila simpangan
baku sesungguhnya untuk ketebalan plastic ini melebihi 1.5 mm, kualitas produk
dikatakan jelek. Pada suatu shift diukur ketebalan 10 contoh plastic yang dihasilkan
mesin ini dan diperoleh data berikut: 226, 228, 226, 225, 232, 228, 227, 229, 225,
230.
a) apakah data ini menunjukkan bahwa variability proses sudah melebihi tingkat
yang diijinkan? (=0.05)
b) tentukan 95% confidence interval untuk
CONTOH-CONTOH SOAL
Penyelesaian:
Hipotesa yang diuji:
H0 : 2 2.25
H1 : 2 > 2.25
6 . 227
10
230 225 229 227 228 232 225 226 228 226
=
+ + + + + + + + +
= X
( ) ( )
04 . 5
1 10
6 . 227 10 230 ......... 226 228 226
1
2 2 2 2 2
1
2
2
2
=

+ + + +
=

=

=
n
X n X
S
n
i
i
Contoh 3
Untuk menguji hopotesa ini dihitung:
( ) ( )
16 . 20
25 . 2
04 . 5 1 10 1
2
0
2
2
0
=

=
o
;
S n
( )
919 . 16
2
9 , 05 . 0
= ;
> 919 . 16
2
0
;
H0 ditolak
Variabilitas proses sudah melebihi batas yang diijinkan.
b) 95% confidence interval untuk
2
adalah:
( ) ( )
2
1 ,
2
1
2
2
2
1 ,
2
1
2
1 1
|
.
|

\
|

+
|
.
|

\
|

s s

n n
S n S n

;
o
;
( )
( )
70039 . 2
0228 . 19
2
9 , 975 . 0
2
1 ,
2
1
2
9 , 025 . 0
2
1 ,
2
1
= =
= =
|
.
|

\
|

+
|
.
|

\
|

; ;
; ;

n
n
( ) ( )
70039 . 2
04 . 5 1 10
0228 . 19
04 . 5 1 10
2

s s

o 795 . 16 3845 . 2
2
s s o
098 . 4 544 . 1 s so
CONTOH-CONTOH SOAL
CONTOH-CONTOH SOAL
Sepuluh orang pasien melakukan diet. Berat badan sebelum dan sesudah diet
ditimbang untuk mengetahui apakah diet ini berhasil atau tidak. Hasilnya
dalam kg diberikan berikut ini,
CONTOH 4
Pasien Berat sebelum diet, kg Berat sesudah diet, kg
1
2
3
4
5
6
7
8
9
10
78.3
84.7
77.4
95.6
82.0
69.4
79.7
85.6
92.8
99.2
77.4
83.2
75.7
92.4
80.2
68.1
76.9
83.9
90.4
95.2
CONTOH-CONTOH SOAL
a) dapatkah disimpulkan bahwa diet yang dilakukan berhasil (=0.05)
b) tentukan 95% confidence interval untuk rata-rata beda berat badan sebelum
dan sesudah diet
Penyelesaian
Hipotesa yang diuji:
H0 : 0
H1 : > 0
Dari data dapat dihitung beda berat badan sebelum dan sesudah diet yaitu:
Pasien 1 2 3 4 5 6 7 8 9 10
beda 0.9 1.5 1.7 3.2 1.8 1.3 2.8 1.7 2.4 4
13 . 2
10
4 .. .......... 7 . 1 5 . 1 9 . 0
=
+ + + +
= d
( ) ( )
166 . 0
1 10
13 . 2 10 4 ... 5 . 1 9 . 0
1
2 2 2 2
2
2
=

+ + +
=

=

n
d n d
s
i
d
58 . 40
10 / 166 . 0
13 . 2
/
0
= = =
n s
d
t
d
( )
833 . 1
9 , 05 . 0
= t
( )
>
9 , 05 . 0 0
t t H0 ditolak atau dapat disimpulkan bahwa diet yang telah
dilakukan berhasil
CONTOH-CONTOH SOAL
b) 95% confidence interval untuk adalah
( ) ( ) 9 , 025 . 0 9 , 025 . 0
t
n
s
d t
n
s
d
d d
+ s s o
262 . 2
10
166 . 0
13 . 2 262 . 2
10
166 . 0
13 . 2 + s s o
249 . 2 011 . 2 s so
CONTOH-CONTOH SOAL
Disuatu daerah 158 dari 496 wajib pajak ternyata lalai untuk melunasi pajaknya.
Didaerah lain kelalaian ini terdapat sebanyak 147 dari 509.Selidiki apakah
kelalaian pelunasan pajak dikedua daerah tersebut berbeda secara nyata atau
tidak?
Penyelesaian:
Hipotesa yang diuji:
H0 : 1 = 2
H1 : 1 2
Untuk menguji hipotesa ini dihitung,
Contoh 5
( )
|
|
.
|

\
|
+

=
2 1
2 1
0
1 1
1
n n
p p
p p
Z
303 . 0
509 496
147 158
2 1
2 1
=
+
+
=
+
+
=
n n
x x
p
289 . 0
509
147
318 . 0
496
158
2 1
= = = = p p
( )
996 . 0
509
1
496
1
303 . 0 1 303 . 0
289 . 0 318 . 0
0
=
|
.
|

\
|
+

= Z
96 . 1 96 . 1
2
975 . 0
2
1
= = =
|
.
|

\
|

o o
Z Z Z
Karena:
96 . 1 96 . 1
0
< < Z
H0 tak dapat ditolak. Jadi kelalaian pelunasan pajak
dikedua daerah tersebut tak berbeda nyata.
CONTOH-CONTOH SOAL
Contoh 6
Sembilan sampel diambil dari dua sungai, empat dari sungai A dan 5 dari sungai B.
Kadar polutan dikesembilan sampel tersebut diukur dan diperoleh data berikut,
Kadar polutan sungai A (ppm) Kadar polutan sungai B, ppm
16
12
14
11
9
10
8
6
5
a)Diklaim bahwa sungai B lebih bersih dari pada sungai A. Apakah klaim ini
didukung oleh data?
b)Tentukan 95% confidence interval untuk beda rata-rata kadar polutan
dikedua sungai.
CONTOH-CONTOH SOAL
Penyelesaian:
Hipotesa yang diuji:
H0 : A B
H1 : A > B
Untuk menguji hipotesa ini dihitung,
B A
p
B A
n n
S
X X
t
1 1
0
+

=
( ) ( )
2
1 1
2 2
+
+
=
B A
B B A A
p
n n
S n S n
S
6 . 7
5
5 6 8 10 9
25 . 13
4
11 14 12 16
=
+ + + +
=
=
+ + +
=
B
A
X
X
( )
92 . 4
1 4
25 . 13 4 11 14 12 16
2 2 2 2 2
2
=

+ + +
=
A
S
( )
3 . 4
1 5
6 . 7 5 5 6 8 10 9
2 2 2 2 2 2
2
=

+ + + +
=
B
S
( ) ( )
14 . 2
2 5 4
3 . 4 1 5 92 . 4 1 4
=
+
+
=
p
S
92 . 3
5
1
4
1
14 . 2
6 . 7 25 . 13
0
=
+

= t
( )
895 . 1
7 , 05 . 0
= t
Karena
895 . 1 92 . 3
0
> = t
H0 ditolak
Berarti klaim bahwa sungai B lebih bersih dari pada sungai A didukung oleh data
CONTOH-CONTOH SOAL
a)95% confidence interval untuk A-B adalah,
|
.
|

\
|
+ |
.
|

\
|
+
+ + s s +
2 ,
2
2 ,
2
1 1 1 1
B A B A
n n
B A
p B A B A
n n
B A
p B A
t
n n
S X X t
n n
S X X
o o
u u
( ) ( ) 7 , 025 . 0 7 , 025 . 0
5
1
4
1
14 . 2 6 . 7 25 . 13
5
1
4
1
14 . 2 6 . 7 25 . 13 t t
B A
+ + s s + u u
325 . 2
5
1
4
1
14 . 2 6 . 7 25 . 13 325 . 2
5
1
4
1
14 . 2 6 . 7 25 . 13 + + s s +
B A
u u
045 . 9 255 . 2 s s
B A
u u
ANALISA REGRESI
Dibedakan dua jenis variabel
Variabel bebas
Variabel tak bebas atau variabel respon
Variabel bebas dinyatakan dengan x1 , x2 , x3
Variabel tak bebas dinyatakan dengan y
Dalam analisa Regresi, akan dicari hubungan fungsional antara variabel tak
bebas y dan variabel bebas. Persamaan ini dinyatakan dalam bentuk matematik
sebagai berikut :

y = f (x1 , x2 , . . . , xk, 0 , 1 , 2 , . . . , m ) (3 1)

Untuk suatu populasi, dimana 0, 1 , 2 , . . . , m, adalah parameter. Untuk
suatu sample yang ditarik dari populasi tersebut, bentuk matematik dari
persamaan regresi adalah :

y = f (x1 , x2 , . . . , xk, b0 , b1 , b2 , . . . , bm ) (3 2)

Perhatikan bahwa bi adalah estimate dari i ( i = 0 , 1, 2 , .. m )
Persamaan regresi linier untuk satu variabel bebas
Untuk populasi :
y = O + 1 x
Untuk sample :
y = bo + b1 x

Persamaan regresi linier untuk 2 variabel bebas :
Untuk populasi :
y = O + 1x1 + 2x2
Untuk sample :
y = bO + b1x1 + b2 x2

Persoalan dari analisa regresi adalah menentukan bentuk persamaan dan
mencari parameter-parameternya.
ANALISA REGRESI
ANALISA REGRESI
Regresi Linier ;
y = bo + b1x ( 3 7 )
Akan dicari bo dan b1 dengan metode least square dari data dalam bentuk :
REGRESI UNTUK SATU VARIABEL BEBAS
x y
x
1

x
2

.
.
.
x
n

y
1

y
2

.
.
.
y
n

Dalam hal ini bo dan b1 di hitung dari persamaan normal :

= =
= +
N
1 i
N
1 i
i i i
0 ) x b (bo - y

= =
= +
N
1 i
N
1 i
i i 1 0
y x b b n

= =
= +
N
1 i
N
1 i
i i i i i
0 x ) x b (bo - x y
= = =
=
N
1 i
N
1 i
N
1 i
i i
2
i 1 i 0
y x x b - x b
ANALISA REGRESI
2
1 1
2
1 1 1
2
1
0
|
.
|

\
|

=


= =
= = = =
n
i
i
n
i
i
n
i
n
i
i i i
n
i
i
n
i
i
x x n
x y x x y
b
x
yx
n
i
i
n
i
i
n
i
n
i
i i
n
i
i i
S
S
x x n
y x x y n
b =
|
.
|

\
|

=


= =
= = =
2
1 1
2
1 1 1
1 n
x y
x y S
n
i
n
i
i i
n
i
i i yx

= =
=
=
1 1
1
n
x
x S
n
i
i
n
i
i x
2
1
1
2
|
.
|

\
|
=

=
=
x b y b
1 0
=
Koefisien regressi
y x
yx
yx
S S
S
r =
Koefisien korelasi
y
x
yx
S
S
b r
1
=
n
y
y S
n
i
i
n
i
i y
2
1
1
2
|
.
|

\
|
=

=
=
Koefisien korelasi menyatakan kuat nya korelasi antara y dan x. Nilai nya
adalah antara -1 dan +1. Tanda menunjukkan bahwa korelasi antara y dan x
adalah berlawanan arah, artinya y makin kecil dengan kenaikan harga x.
ANALISA REGRESI

=
=
k
1 i
2 2
/ k s s
i E

=
=
r
1 u
2
i iu
2
) 1 - r ( / ) y - (y
i
s
p n
S
s
R
E

=
2
( )
2
1

=
=
n
i
i i R
y y S
2
1 1
2
n
1
2
i
2
E
0
x s
|
.
|

\
|

= =
=
n
i
i
n
i
i
i
b
x x n
S
2
1 1
2
2
E
1
n s
|
.
|

\
|

=

= =
n
i
i
n
i
i
b
x x n
S
bj
j
j
S
b
t =
Chek kebermaknaan parameter:
1) Menentukan Variance kesalahan
Untuk percobaan tampa pengulangan
2) Menentukan standar kesalahan koefisien regressi
3) Menentukan t
0

= n k untuk percobaan dengan di ulang
= n p untuk percobaan tanpa di ulang
Bila t
j
> t
(,)
b
j
bermakna
ANALISA REGRESI
2
s
1
2 RT
RT
S
s =
2
2
1
E
RT
s
s
F =
1
2 LN
LN
S
s =
2
2
2
E
LN
s
s
F =
2
2

=
n
S
s
R
R
2
2

=
k
S
s
TC
TC
2
2
3
E
TC
s
s
F =
k n
S
s
E
E

=
2
Sumber
Variasi

Derajat
Kebebas
an
S
Jumlah
Kwadrat
Kwadrat
Rata-rata
F
Model 2 S
M

Rata-rata 1 S
RT

Suku linier 1 S
LN

Residual n 2 S
R

Tuna cocok k-2 S
TC

Kesalahan n-k S
E

Total n S
T

Uji dengan analisa variance
F
1
>F
(,1,n-k)

F
2
>F
(,1,n-k)

F
3
>F
(,k-2,n-k)

b
0
bermakna
b
1
bermakna
Model linear
tidak cocok

=
=
N
i
i M
y S
1
2

2
y n S
RT
=

=
=
n
i
i
y
n
y
1
1
SLN=SM-SRT

=
=
N
i
i T
y S
1
2

= =
=
r
u
i iu
k
i
E
y y S
1
2
1
) (
SR=STSM
STC=SR-SE
keterangan
R
2
= SM / ST
Koef.determinasi
ANALISA REGRESI



= = = =
= = = =
= = =
= + +
= + +
= + +
n
i
n
i
n
i
i i
n
i
i i i
n
i
n
i
i i i
n
i
i
n
i
i o
n
i
n
i
i
n
i
i i
x y x b x b x b
x y x b x b x b
y x b x b n b
1 1 1
2
1
4
2
3
1
2
0
1 1
3
2
1
2
1
1
1 1 1
2
2 1 0
Y = b
0
+ b
1
x + b
2
x
2

MODEL KWADRATIK
Penentuan koefsien regressi:
ANALISA REGRESI
2
s
1
2 RT
RT
S
s =
2
2
1
E
RT
s
s
F =
1
2 LN
LN
S
s =
2
2
2
E
LN
s
s
F =
1
2 KW
KW
S
s =
2
2
3
E
KW
s
s
F =
3
2

=
n
S
s
R
R
3
2

=
k
S
s
TC
TC
2
2
4
E
TC
s
s
F =
k n
S
s
E
E

=
2
Sumber
varian

Derajat
kebebas
an
S
Jumlah
kwadrat
Kwadrat
Rata-rata
F
Model 3 S
M

Rata-rata 1 S
RT

Suku linier 1 S
LN

suku
kwadrat
1 S
KW

Residual n-3 S
R

Tuna Cocok k-3 S
TC

Kesalahan n-k S
E

Total n S
T

ANOVA

=
=
N
i
i M
y S
1
2

2
y N S
RT
=
n
y
y
n
i
i
=
=
1
( ) k n k
F F

>
, 3 , 4 o
( ) k n
F F

>
, 1 , 1 o
( ) k n
F F

>
, 1 , 2 o
( ) k n
F F

>
, 1 , 3 o
bo bermakna
b1 bermakna
b2 bermakna
model tak cocok
MODEL YANG LAIN
ANALISA REGRESI
x
b b y
1 0
. 1 =
1 0
log log log b x b y + =
x a a Y
1 0
+ =
1
0
. 2
b
x b y =
x b b y log log log
1 0
+ =
X b a Y
1 0
+ =
ANALISA REGRESI
REGRESSI UNTUK LEBIH DARI SATU VARIABEL BEBAS
(REGRESSI GANDA)
MODEL LINEAR
Misal untuk dua variable bebas
c | | | + + + =
2 2 1 1 0
x x y
r x b x b b y + + + =
2 2 1 1 0
Populasi:
Sampel:
2 1 0
, , b b b



= = = =
= = = =
= = =
= + +
= + +
= + +
n
i
n
i
n
i
n
i
i i i i i i
n
i
n
i
n
i
n
i
i i i i i i
n
i
n
i
n
i
i i i
x y x b x x b x b
x y x x b x b x b
y x b x b nb
1 1 1 1
2
2
2 2 2 1 1 2 0
1 1 1 1
1 2 1 2
2
1 1 1 0
1 1 1
2 2 1 1 0
penentuan
2
2 1 1 0
2
2 1
2 1
2 2 2 1
1 2 1 1
x b x b y b
S S b S b
S S b S b
y x x x x
y x x x x
=
= +
= +
n
x
x S
n
i
i
n
i
i x
2
1
1
1
2
1
1
|
.
|

\
|
=

=
=
n
x x
x x S
n
i
i
n
i
i
n
i
i i x x
|
.
|

\
|
|
.
|

\
|
=

= =
=
1
2
1
1
1
2 1
2 1
n
y x
y x S
n
i
i
n
i
i
n
i
i i y x
|
.
|

\
|
|
.
|

\
|
=

= =
=
1 1
1
1
1
1
n
x
x S
n
i
i
n
i
i x
2
1
2
1
2
2
2
|
.
|

\
|
=

=
=
n
y x
y x S
n
i
i
n
i
i
n
i
i i y x
|
.
|

\
|
|
.
|

\
|
=

= =
=
1 1
2
1
2
2
ANALISA REGRESI
Uji Regressi Linear Ganda
) 1 /(
1
0

=
k n S
S
F
E
y x
( ) ) 1 /
/
0

=
k n S
k S
F
E
M
( ) i k n
F F |
o
>
1 , 1 , 0

=
i
y x i M
i
S b S
( )
>
1 , , 0 k n k
F F
o
nyata harganya
regressi linear ganda y atas x1 dan x2 bersifat nyata.
Uji koefisien regressi
Uji regressi keseluruhan:
ANALISA REGRESI
Koefisien Korelasi Ganda dan Parsial
T
M
S
S
R =
2
y T
S S =
2
12
12 2 1
2
2
2
1
12 .
1
2
r
r r r r r
R
y y y y
y

+
=
( ) ( ) 1 / 1
/
2
2
0

=
k n R
k R
F
( )
>
1 , , 0 k n k
F F
o
korelasi antara y dan x1 , dan x2 nyata.
( )( )
2
12
2
2
12 2 1
2 . 1
1 1 r r
r r r
r
y
y y
y


=
Koefisien Determinasi:
Koefisien korelasi ganda
Bila
Uji korelasi ganda:
( )( )
2
12
2
1
12 1 2
1 . 2
1 1 r r
r r r
r
y
y y
y


=
( )( )
2
2 . 13
2
2 . 3
2 . 13 2 . 3 2 . 1
23 . 1
1 1 r r
r r r
r
y
y y
y


=
Koefisien korelasi parsial:
Dua variabel
Tiga variabel
( ) ( )( )
2
1 . 2
2
1
2
12 .
1 1 1
y y y
r r R =
( ) ( )( )( )
2
12 . 3
2
1 . 2
2
1
2
123 .
1 1 1 1
y y y y
r r r R =
Hubungan antara korelasi parsial
dan ganda
ANALISA REGRESI

ANALISA REGRESI

ANALISA REGRESI

ANALISA REGRESI

ANALISA REGRESI

Anda mungkin juga menyukai