Anda di halaman 1dari 14

Inferensi Statistika

1. Inferensi Statistika untuk Proporsi Satu Populasi


banyak sukses X
Proporsi populasi: p   .
populasi N
banyak sukses dalam sampel x
Proporsi sampel: pˆ   .
sampel n
Estimasi titik untuk p adalah p̂ .
Estimasi interval untuk p adalah interval konfidensi (1-)100%
pˆ 1  pˆ  pˆ 1  pˆ 
pˆ  Z 2  p  pˆ  Z 2 .
n n
Uji hipotesis
a. Hipotesis
A. H0: p  p0
H1: p  p0
B. H0: p  p0
H1: p  p0
C. H0: p  p0
H1: p  p0
b. Tingkat signifikansi 
pˆ  p0
c. Statistik uji: Z  , dengan Z berdistribusi normal standar
p0 1  p0 
n
d. Daerah kritik: H0 ditolak bila
A. Z  Z 2
B. Z  Z
C. Z  Z
e. Kesimpulan.

Contoh
1. Jika 610 dari 900 sampel random petani di suatu daerah adalah buruh tani, hitunglah
interval konfidensi 90% untuk proporsi buruh tani di daerah itu!

2. A marketing expert for a pasta-making company believes that 40% of pasta lovers prefer
lasagna. If 9 out of 20 pasta lovers choose lasagna over other pastas, what can be
concluded about the expert’s claim? Use a 0.05 level of significance.

3. Suatu survei menyatakan bahwa dalam suatu daerah tertentu 20 % rumah tangga berada
di bawah garis kemiskinan. Suatu program pengentasan kemiskinan dilaksanakan pada
daerah tersebut. Untuk mengetahui apakah program tersebut berhasil, sampel sebesar 400
rumah tangga diambil dari daerah tersebut, 68 rumah tangga dinyatakan berada di bawah
garis kemiskinan. Berhasilkah program ini ? (α = 0.05)

4. Diperkirakan banyaknya pemuda di suatu kota yang lulusan perguruan tinggi lebih dari
60%. Untuk menguji perkiraan tersebut diambil sampel 150 pemuda dan diperoleh 103
diantaranya adalah lulusan perguruan tinggi.
a. Pada tingkat signifikansi 5% ujilah apakah perkiraan tersebut didukung oleh data.
b. Tentukan interval konfidensi untuk proporsi pemuda di kota tersebut yang lulusan
perguruan tinggi.

2. Inferensi Statistika untuk Proporsi Dua Populasi


X x
Proporsi populasi 1: p1  1  proporsi sampel 1: pˆ1  1 .
N1 n1
X2 x
Proporsi populasi 2: p2   proporsi sampel 2: pˆ 2  2 .
N2 n2
Estimasi titik untuk p1  p2 adalah pˆ1  pˆ 2 .
Estimasi interval untuk p1  p2 adalah interval konfidensi (1-)100%:
pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  pˆ1 1  pˆ1  pˆ 2 1  pˆ 2 
 pˆ1  pˆ 2   Z 2   p1  p2   pˆ1  pˆ 2   Z 2 
n1 n2 n1 n2
Uji hipotesis
a. Hipotesis
Jika p0  0 maka
A. H0: p1  p2  p0 A. H0: p1  p2
H1: p1  p2  p0 H1: p1  p2
B. H0: p1  p2  p0 B. H0: p1  p2
H1: p1  p2  p0 H1: p1  p2
C. H0: p1  p2  p0 C. H0: p1  p2
H1: p1  p2  p0 H1: p1  p2

b. Tingkat signifikansi 

c. Statistik uji: Z 
 pˆ1  pˆ 2   p0 , dengan Z berdistribusi normal standar
pˆ1 1  pˆ1  pˆ 2 1  pˆ 2 

n1 n2
d. Daerah kritik: H0 ditolak bila
A. Z  Z 2
B. Z  Z
C. Z  Z
e. Kesimpulan.
Contoh
1. A survey of 1000 students found that 274 chose professional baseball team A as their
favorite team. In a similar survey involving 760 students, 240 of them chose team A as
their favorite. Compute a 95% confidence interval for the difference between the
proportions of students favoring team A in the two surveys.

2. Ingin diketahui tingkat keberhasilan operasi di dua rumah sakit yang berbeda yaitu
rumah sakit A dan B. Dari 480 operasi di rumah sakit A, 408 diantaranya berhasil dan
dari 360 operasi di rumah sakit B, 330 diantaranya berhasil. Apakah dapat disimpulkan
tingkat keberhasilan operasi di kedua rumah sakit tersebut sama? ( = 0,05)

3. Dilakukan survey tentang hobi berolahraga. Dari 200 mahasiswa fakultas A, 56


diantaranya hobi berolahraga, dan dari 150 mahasiswa fakultas B, 29 diantaranya hobi
berolahraga. Pada tingkat signifikansi 6%, dapatkah disimpulkan bahwa proporsi
mahasiswa di fakultas A yang hobi berolahraga lebih banyak dibandingkan fakultas B?

3. Inferensi Statistika untuk Rata-rata Satu Populasi Normal


N

X i
Rata-rata populasi:   i 1
dengan N adalah banyak populasi.
N
n

x i
Rata-rata sampel: ˆ  x  i 1
dengan n adalah banyak sampel.
n
Estimasi titik untuk  adalah x .
Estimasi interval untuk  adalah interval konfidensi (1-)100% (jika populasi berdistribusi
normal dengan  2 tidak diketahui)
s s
x  t n1; 2    x  t n1; 2
n n

 x  x 
2
i
dengan s  i 1
adalah standar deviasi sampel.
n 1

Uji hipotesis
a. Hipotesis
A. H0:   0
H1:   0
B. H0:   0
H1:   0
C. H0:   0
H1:   0
b. Tingkat signifikansi 
c. Statistik uji:
x  0
t , dengan t berdistribusi t dengan derajad bebas n-1
sD
n

d. Daerah kritik: H0 ditolak bila


A. t  t n1; 2
B. t  t n1; 
C. t  t n1; 
e. Kesimpulan.

Contoh

1. Diamati panjang tunas dari 25 tanaman yang ditanam bersamaan. Diperoleh rata-rata
panjang tunas adalah 74 mm dengan standar deviasi 2,34 mm. Tentukan interval
konfidensi 95% untuk rata-rata panjang tunas tanaman.

2. Akan diteliti kualitas pengalengan pada sebuah pabrik perekat/lem. Pabrik tersebut
memproduksi lem yang dikemas dalam sebuah kaleng. Pada kaleng tertera label berat
bersih = 32 ons. Diambil sampel 10 kaleng kemudian diukur berat bersih lem dari
masing-masing kaleng, dan diperoleh rata-ratanya 31,55 ons dengan standar deviasi 0,48
ons. Apakah dapat disimpulkan bahwa kualitas pengalengan di pabrik tersebut sudah
baik? (diasumsikan berat bersih lem berdistribusi normal) (α = 0,05)

3. Pada sebuah kebun jeruk, akan diteliti rata-rata hasil panen per pohon. Diambil sampel
20 pohon jeruk dan diperoleh rata-rata hasil panen per pohon adalah 42 kg dengan
deviasi standar 12 kg. Dengan tingkat signifikansi 5%, apakah dapat disimpulkan bahwa
rata-rata hasil panen per pohon lebih dari 40 kg? (hasil panen diasumsikan berdistribusi
normal)

4. Seorang peneliti ingin mengetahui apakah rata-rata banyaknya bakteri pada suatu air
danau masih berada di bawah batas aman, yaitu 200 bakteri/unit volume. Dari sampel
sebanyak 10 diperoleh rata-rata 190,8 bakteri/unit volume dengan deviasi standar 3,14
bakteri/unit volume. Dengan asumsi data berasal dari populasi normal, apakah dapat
disimpulkan bahwa banyaknya bakteri masih di bawah batas aman? (α = 0,01)
4. Inferensi Statistika untuk Rata-rata Dua Populasi Normal
N1 n1

 X1i x 1i
Rata-rata populasi 1: 1  i 1
 rata-rata sampel 1: ˆ1  x1  i 1
.
N1 n1
N2 n2

 X 2i x 2i
Rata-rata populasi 2: 2  i 1
 rata-rata sampel 2: ˆ 2  x2  i 1
.
N2 n2

Estimasi titik untuk 1  2 adalah x1  x2 .


Estimasi interval untuk 1  2 adalah interval konfidensi (1-)100% (jika kedua populasi
berdistribusi normal dengan  12 dan  22 tidak diketahui, serta diasumsikan 12   22 )

1 1 1 1
 x1  x2   t k ; 2 S p2     1  2   x1  x2   t k ; 2 S p2   
 n1 n2   n1 n2 

dengan k  n1  n2  2 dan S 2

 n1  1 s12   n2  1 s22
.
n1  n2  2
p

Uji hipotesis
a. Hipotesis
Jika 0  0 maka
A. H0: 1  2  0 A. H0: 1  2
H1: 1  2  0 H1: 1  2
B. H0: 1  2  0 B. H0: 1  2
H1: 1  2  0 H1: 1  2
C. H0: 1  2  0 C. H0: 1  2
H1: 1  2  0 H1: 1  2

b. Tingkat signifikansi 
c. Statistik uji:

t 1 2
 x  x   0 , dengan t berdistribusi t dengan derajad bebas k
1 1
S p2   
 n1 n2 

d. Daerah kritik: H0 ditolak bila


A. t  t k ; 2
B. t  t k ; 
C. t  t k ; 
e. Kesimpulan.
Contoh
1. Diambil sampel suatu jenis kadal yang hidup di pulau A dan B. Dari 10 sampel kadal di
pulau A rata-rata memiliki panjang 35,33 mm dan standar deviasi 7,124 mm. Dari 12
sampel kadal di pulau B rata-rata memiliki panjang 56,5 mm dan standar deviasi 7,714
mm. Tentukan interval konfidensi 95% untuk selisih rata-rata panjang kadal di kedua
pulau, kemudian ujilah (dengan α = 5%) apakah kadal di pulau A cenderung lebih
pendek dari pada kadal di pulau B (diasumsikan panjang kadal berdistribusi normal
dengan variansi sama).

2. Terdapat dugaan bahwa tidur yang cukup dapat meningkatkan konsentrasi sehingga
prestasi belajar menjadi lebih baik. Diambil sampel nilai ujian 16 siswa yang cukup
tidur, diperoleh rata-rata 80,5 dengan deviasi standar 5, diambil sampel juga nilai ujian
14 siswa yang kurang tidur, diperoleh rata-rata 74 dengan deviasi standar 6. Berdasarkan
data tersebut, dan pada tingkat siginifikansi α = 5%, apakah dugaan di atas terbukti?
(diasumsikan nilai ujian berdistribusi normal dengan variansi sama)

3. Sebuah metode diet A diberikan kepada 4 remaja dan metode diet B diberikan kepada 5
remaja. Setelah satu bulan, remaja yang menjalani metode diet A rata-rata mengalami
penurunan berat badan sebesar 3,5 kg dengan deviasi standar 2,5 kg, sedangkan untuk
metode diet B rata-rata 4,8 kg dengan deviasi standar 2,3 kg. Pada tingkat signifikansi
5%, apakah metode diet B lebih efektif dibandingkan metode diet A? (diasumsikan
penurunan berat badan berdistribusi Normal dengan variansi sama)

4. Sebuah percobaan dilakukan pada 20 ekor tikus, dengan 10 ekor diberi makanan A dan
10 ekor diberi makanan B. Rata-rata berat tikus yang diberi makanan A adalah 84 gram
dengan deviasi standar 17 gram sedangkan tikus yang diberi makanan B rata-rata
beratnya 78 gram dengan deviasi standar 20 gram. Apakah dapat disimpulkan bahwa tipe
makanan mempengaruhi berat badan tikus? (α = 5%, diasumsikan penurunan berat badan
berdistribusi Normal dengan variansi sama)

5. Inferensi Statistik untuk Sampel Berpasangan


Sampel diamati dua kali (sebelum-sesudah, pre-post) atau secara alamiah memang
berpasang-pasangan (contoh: suami-istri, orang kembar). Populasi berdistribusi normal.
 D : rata-rata selisih pengamatan pada populasi.

No. Sampel Pengamatan 1 (X) Pengamatan 2 (Y) Selisih (D)


1 X1 Y1 D1 = X1 – Y1
2 X2 Y2 D2 = X2 – Y2
: : : :
n Xn Yn Dn = Xn – Yn

D
D1  D2   Dn i
Estimasi titik untuk  D adalah D  i 1

, yaitu rata-rata dari Di.
n n
Estimasi interval untuk  D adalah interval konfidensi (1-)100%:
sD s
D  t n1; 2    D  t n1; 2 D
n n
dengan
n

 D  D
2

 D  D   D  D    Dn  D 
2 2 2
i
sD  i 1

1 2

n 1 n 1

adalah standar deviasi dari Di.

Uji hipotesis
a. Hipotesis
A. H0: D  0
H1: D  0
B. H0: D  0
H1: D  0
C. H0: D  0
H1: D  0
b. Tingkat signifikansi 
c. Statistik uji:
D  0
t , dengan t berdistribusi t dengan derajad bebas n-1
sD
n

d. Daerah kritik: H0 ditolak bila


A. t  t n1; 2
B. t  t n1; 
C. t  t n1; 
e. Kesimpulan.
Contoh
1. Sebuah iklan menyatakan bahwa obat pelangsing merek XZ mampu menurunkan berat
badan sebesar 5 kg dalam waktu 1 bulan. Sebuah survey dilakukan untuk menguji
kebenaran iklan tersebut dan diperoleh data 10 wanita yang telah menggunakan obat
pelangsing XZ sebagai berikut:
Wanita 1 2 3 4 5 6 7 8 9 10
Sebelum 78 77 73 65 59 53 61 62 62 60
Sesudah 72 73 69 61 53 49 55 56 57 53
a. Tentukan interval konfidensi 95% untuk rata-rata penurunan berat badan dalam 1 bulan.
b. Dengan α = 5% dan populasi diasumsikan berdistribusi normal, apakah dapat
disimpulkan bahwa pernyataan iklan tersebut benar?

2. Suatu sampel random dengan 10 pasang bayi kembar mempunyai berat badan waktu
lahir (kg) sebagai berikut.
Pasang 1 2 3 4 5 6 7 8 9 10
Berat I 2,81 2,13 2,31 2,22 2,27 3,27 2,31 2,59 2,81 2,13
Berat II 2,68 1,91 2,40 1,81 2,45 2,40 2,49 2,22 2,63 1,72
Apakah bayi yang lahir pertama cenderung lebih berat dari pada bayi yang lahir ke dua?
(α = 0,1)

3. Sampel random sebanyak 5 orang pengendara mobil dipilih untuk mengetahui apakah
alkohol mempengaruhi lama reaksi pengendara. Lama reaksi masing-masing pengendara
diukur sebelum dan sesudah meminum minuman beralkohol. Lama reaksi dalam detik
dapat dilihat pada tabel berikut.
Pengendara ke - 1 2 3 4 5
Sebelum 0,68 0,64 0,68 0,82 0,58
Sesudah 0,73 0,63 0,69 0,92 0,68
Apakah alkohol menyebabkan waktu reaksi menjadi lebih lama? (α = 0,05)
6. Analisis Variansi (ANAVA) Satu Arah
Bertujuan membandingkan rata-rata dari k populasi normal (k > 2).
Sampel dari populasi ke-
1 2 ... k
X 11 X 21 X k1
X 12 X 22 Xk2
: : :
X 1n1 X 2n2 X knk
Notasi:
k: banyak populasi yang dibandingkan
X ij : pengamatan pada sampel populasi ke-i perulangan ke-j
ni : banyak sampel untuk populasi ke-i
N: total sampel = n1  n2   nk
ni

X
j 1
ij
X i1  X i 2   X ini
Xi   adalah rata-rata sampel dari populasi ke-i
ni ni
ni

 X  Xi 
2

X  Xi    X i2  X i    
2 2 2
j 1
ij
i1  X ini  X i
S 2
 adalah variansi
ni  1 ni  1
i

sampel dari populasi ke-i


k ni

 X
i 1 j 1
ij
X 11   X 1n1   X knk
X  adalah rata-rata seluruh sampel.
N N

Tabel ANAVA
Sumber Derajad Jumlah kuadrat/ Rata-rata kuadrat/ Rasio F
variansi bebas Sum of Square Mean of Square
Perlakuan k-1 SST MST
F
Eror N-k SSE MSE

Keterangan:
SST: Sum of Square Treatment/ Jumlah Kuadrat Perlakuan
SSE: Sum of Square Error/ Jumlah Kuadrat Eror
MST: Mean of Square Treatment/ Rata-rata Kuadrat Perlakuan
MSE: Mean of Square Error/ Rata-rata Kuadrat Eror
k

n  X  X   n1  X1  X   n2  X 2  X    nk  X k  X 
2 2 2 2
SST = i i
i 1
k
SSE =   n 1 S   n  1 S   n
i 1
i i
2
1
2
1 2  1 S22    nk  1 Sk2
SST SSE MST
MST = MSE = F .
k 1 N k MSE

Uji hipotesis
a. Hipotesis
H0: 1  2   k (tidak ada pengaruh perlakuan)
H1: ada i yang berbeda (ada pengaruh perlakuan)
b. Tingkat signifikansi 
c. Statistik uji: F, dengan F berdistribusi F k 1, N k 
d. Daerah kritik: H0 ditolak bila F > F k 1, N k , 
e. Kesimpulan.

Contoh
1. Dipunyai empat varitas padi yang akan kita uji produktivitasnya. Dua puluh empat petak
tanah yang kira-kira mempunyai kesuburan yang sama dipilih. Kemudian 24 petak itu
dibagi secara random menjadi empat kelompok, masing-masing 6 petak yang selanjutnya
tiap kelompok ditanami satu varitas padi. Apakah rata-rata produktivitas 4 varitas padi
tersebut sama? (α = 0,05)
Varitas
A B C D
24 13 21 27
13 21 13 30
18 11 26 24
24 23 23 29
16 28 16 26
23 18 12 34

2. Diteliti rata-rata berat burung jalak (dalam gram) di empat lokasi yang berbeda.
Diperoleh sampel sebagai berikut.
Lokasi
A B C D
78 78 79 77
87 78 73 69
88 83 79 75
83 81 75 70
81 78 77 74
89 81 83
80 80
Apakah rata-rata berat burung jalak di keempat lokasi tersebut sama? (α = 0,05)
3. Suatu perusahaan tekstil mempunyai 5 mesin pintal A, B, C, D, dan E yang
diharapkan dapat menghasilkan benang dengan kekuatan yang sama. Untuk
menyelidiki harapan ini, dilakukan studi dengan mengambil sampel random
masing-masing 6 potong benang dari hasil produksi tiap-tiap mesin itu, setelah
diselidiki kekuatannya, diperoleh data sebagai berikut.
Mesin
A B C D E
4,2 3,9 4,1 3,6 3,8
4,1 3,8 4,0 3,9 3,6
4,2 3,7 4,2 3,5 3,9
4,3 3,8 4,0 4,0 3,5
4,4 3,6 4,1 3,8 3,7
4,0 3,5 3,8 3,7 3,6
Dengan α = 0,05, kesimpulan apa yang diperoleh?

7. Analisis Korelasi
Analisis korelasi bertujuan untuk mengetahui ada tidaknya hubungan linear yang signifikan
antara dua variabel. Hubungan linear tersebut dapat dilihat dari scatter plot atau koefisien
korelasi. Jika scatter plot membentuk trend linear naik atau turun berarti terdapat hubungan
linear antara kedua variabel.

Trend linear naik (korelasi positif) Trend linear turun (korelasi negatif)

Koefisien korelasi linear menunjukkan hubungan linear antara dua variabel misalnya X dan Y,
dan dilambangkan dengan r. Koefisien korelasi dapat bernilai positif atau negatif, yaitu antara
-1 ≤ r ≤ 1. Jika nilainya sama dengan nol berarti tidak ada hubungan linear antara X dan Y.
Jika nilai r mendekati -1 atau 1 berarti hubungan linear antara X dan Y cukup kuat. Nilai
koefisien korelasi Pearson dapat dihitung dengan rumus berikut
n
 n  n 
n xi yi    xi   yi 
r i 1  i 1  i 1  .
 n  n

2
  n
 n

2

 n xi2    xi    n yi2    yi  
 i 1  i 1    i 1  i 1  

Koefisien korelasi populasi dilambangkan dengan simbol ρ. Untuk menguji apakah ada
hubungan yang signifikan antara dua variabel, dapat dilakukan uji hipotesis berikut.
1. Hipotesis: H0: ρ = 0 (tidak ada hubungan signifikan antara kedua variabel)
H1: ρ ≠ 0 (ada hubungan signifikan antara kedua variabel)
2. Tingkat signifikansi α

r n2
3. Statistik penguji: t  dengan t berdistribusi t(n-2).
1 r2
4. Daerah kritis: H0 ditolak jika t  t n2; 2

5. Kesimpulan

Contoh
1. Diteliti hubungan antara banyaknya pupuk (g/m2) dengan berat rumput yang dihasilkan
(g/m2). Berdasarkan data berikut, ujilah dengan α = 0,05.
Berat pupuk 25 50 75 100 125 150 175 200 225 250
Berat rumput 84 80 90 154 148 169 206 244 212 248

2. Ingin diketahui apakah ada hubungan linear yang signifikan antara tekanan darah bayi
yang baru lahir dengan usianya. Berikut adalah data dari 16 bayi. Ujilah dengan α = 0,05.
No 1 2 3 4 5 6 7 8
Usia (hari) 3 4 3 2 4 5 2 3
Tekanan darah sistolik (mmHg) 89 90 83 77 92 98 82 85

No 9 10 11 12 13 14 15 16
Usia (hari) 5 4 2 3 3 4 3 3
Tekanan darah sistolik (mmHg) 96 95 80 79 86 97 92 88

8. Analisis Regresi Linear Sederhana


Analisis regresi bertujuan untuk mengetahui hubungan linear antara variabel dependen Y
(terikat, respon, outcome) dengan satu atau lebih variabel independen X (bebas, prediktor,
explanatory). Selain itu, analisis regresi juga bertujuan untuk memprediksi nilai variabel
dependen melalui variabel independen.
Pada regresi linear sederhana, hanya terdapat satu variabel dependen Y dan satu variabel
independen X, misalnya tinggi badan (Y) dan usia (X), atau tekanan darah (Y) dan kebiasaan
merokok (X), dan lain sebagainya. Hubungan Y dengan X dapat diketahui dari persamaan
regresi linear sederhana berikut
ŷ  a  bx
dengan
a: konstanta (intersep)
b: koefisien variabel independen (slope).
Nilai a dan b dapat dihitung dengan cara berikut
n n n n n
n xi yi   xi  yi  y  b x
i i
b i 1 i 1 i 1
2
a i 1 i 1
 y  bx .
 n 
n n
n x    xi 
2
i
i 1  i 1 

9. Analisis Data Kategorik


Analisis ini bertujuan untuk mengetahui ada tidaknya hubungan antara variabel O (outcome)
dan E (exposure). Data hasil pengukuran berupa data kategorik yang diringkaskan dalam
tabel kontingensi berikut

Outcome
Exposure Total
O1 O2
E1 a b n3
E2 c d n4
Total n1 n2 n

Uji hipotesis :
1. H0: tidak terdapat hubungan antara exposure dan outcome
H1: terdaat hubungan antara exposure dan outcome
2. Tingkat signifikansi: α = 0,05
3. Statistik uji
(𝑎𝑑 − 𝑏𝑐)2 𝑛
𝜒2 =
𝑛1 𝑛2 𝑛3 𝑛4
4. Daerah kritis: H0 ditolak jika 𝜒2 > 𝜒2(1, α)
5. Kesimpulan
Contoh
1. Dua tipe kutu kayu dikumpulkan dari sampah dedaunan di dua daerah yang berbeda
yaitu daerah bertanah liat dan daerah bertanah kapur, diperoleh hasil sebagai berikut.
Kutu kayu
Tipe tanah Total
Tipe 1 Tipe 2
Liat 14 6 20
Kapur 22 46 68
Total 36 52 88

Pada tingkat signifikansi 5% ujilah apakah terdapat hubungan antara tipe tanah dengan
keberadaan kutu kayu.

2. Peneliti mengumpulkan kepompong dari dua jenis serangga yang hidup di permukaan air
di dua daerah yang berbeda suhunya, diperoleh hasil sebagai berikut.
Kepompong
Daerah Total
Serangga 1 Serangga 2
I 12 7 19
II 14 6 20
Total 26 13 39

Pada tingkat signifikansi 5% ujilah apakah terdapat hubungan antara suhu suatu daerah
dengan keberadaan serangga.

Anda mungkin juga menyukai