STATISTIK INFERENSIA Gerambang
STATISTIK INFERENSIA Gerambang
BAB II
TEORI DASAR
A. Defenisi Statistik Inferensia
Ruang lingkup dari statistic inferensial yaitu meliputi proses pengambilan
keputusan/kesimpulan mengenai parameter populasi (biasanya adalah kuantitas yang tidak
diketahui nilainya) berdasarkan informasi yang diperoleh dari statistic sampel (kuantitas yang
diketahui nilainya).
Suatu distribusi binomial dibentuk oleh suatu eksperimen binomial. Eksperimen ini
merupakan n kali percobaan Bernoulli, sehingga harus mememnuhi kondisi berikut:
1. Jumlah percobaan n adalah konstanata yang telah ditentukan sebelumnya.
2. Setiap eksperimen, biasa disebut dengan percobaan (trial), hanya dapat menghasilkan 1 dari2
keluaran yang mungkin, sukses atau gagal.
3. Probabilitas sukses p, demikian juga probabilitas gagal q=1 p selalu konstan pada setiap
percobaan.
4. Setiap percobaan saling bebas secara statistic, yang berarti keluaran percobaan lainnya.
Ruf = ftest =
Perhitungan untuk bagian pembilang dan penyebut dari rumus rasio uji adalah :
a. Pembilang
Dimana,
x=
n1 = banyaknya anggota sampel ke 1
x1 = mean dari sampel ke 1
b. Penyebut.
2 dalam =
Dimana :
Analisis varians (analysis of variance, ANOVA) adalah suatu metode analisis statistika yang
termasuk ke dalam cabang statistika inferensi. Dalam literatur Indonesia metode ini dikenal
dengan berbagai nama lain, seperti analisis ragam, sidik ragam, dan analisis variansi. Ia
merupakan pengembangan dari masalah Behrens-Fisher, sehingga uji-F juga dipakai dalam
pengambilan keputusan. Analisis varians pertama kali diperkenalkan oleh Sir Ronald Fisher,
bapak statistika modern. Dalam praktek, analisis varians dapat merupakan uji hipotesis (lebih
sering dipakai) maupun pendugaan (estimation, khususnya di bidang genetika terapan).
Secara umum, analisis varians menguji dua varians (atau ragam) berdasarkan hipotesis nol
bahwa kedua varians itu sama. Varians pertama adalah varians antarcontoh (among samples) dan
varians kedua adalah varians di dalam masing-masing contoh (within samples). Dengan ide
semacam ini, analisis varians dengan dua contoh akan memberikan hasil yang sama dengan uji-t
untuk dua rerata (mean).
Analisis varians relatif mudah dimodifikasi dan dapat dikembangkan untuk berbagai bentuk
percobaan yang lebih rumit. Selain itu, analisis ini juga masih memiliki keterkaitan dengan
analisis regresi. Akibatnya, penggunaannya sangat luas di berbagai bidang, mulai dari
eksperimen laboratorium hingga eksperimen periklanan, psikologi, dan kemasyarakatan
Sesuai dengan kebutuhannya Anova dibedakan menjadi 2 yaitu Anova satu arah dan Anova dua
arah. Anova satu arah hanya memperhitungkan 1 faktor yang menimbulkan variasi, sedangkan
Anova dua arah memperhitungkan dua faktor yang menimbulkan variasi.
Pada dasarnya pola sampel dapat dikelompokan menjadi dua kelompok, yaitu:
1. Seluruh sampel, baik yang berada pada kelompok pertama sampai dengan yang ada di
kelompok lain, berasal dari populasiyang sama. Untuk kondisi ini hipotesis nol terbatas pada
tidak ada efek dari treatment (perlakuan)
2. Sampel yang ada di kelompok satu berasal dari populasi yang bebeda dengan populasi sampel
dengan populasi sampel yang ada di kelompok lainnya.
Mengingat Anova berkaitan dengan pengujian hipotesis multipel (ganda). Pada saat melakukan
pengujian hipotesis (perbedaan dua rata-rata) dengan menggunakan t tes selalu menanggung
kesalahan tipe 1 sebesar alpha. Untuk ANOVA kesalahan tipe 1 disebut dengan experiment wise
alpha level yang besarnya:
1-(1-)N
N Merupakan banyaknya tes jika menggunakan t tes (dilakukan satu per satu)
Misalnya: Untuk pengujian perbedaan rata-rata dari 5 kelompok sampel. Jika dimbil alpha
sebesar 0,005 maka dengan penggunaan t tes besarnya resiko kesalahan tipe 1 untuk sekali
pengujian adalah 0,05 dan untuk 10 kali pengujian berarti menanggung kesalahan tipe 1 sebesar
0,5. Apabila kita menggunakan ANOVA kesalahan tipe 1 yang harus ditanggung adalah :
1-(1-0,05)10 = 0,40
Mengapa N berjumlah 10 untuk 5 kelompok sampel? Untuk menjawab pertanyaan tersebut
marilah kita telusuri satu per satu pengujian yang dilakukan dengan t tes.
1 = 2
1 = 3
1 = 4
1 = 5
2 = 3
2 = 4
2 = 5
3 = 4
3 = 5
4 = 5
Melalui perbandingan sederhana adalah teknik analisis statistik yang dapat memberi jawaban
atas ada tidaknya perbedaan skor pada masing-masing kelompok (khususnya untuk kelompok
yang banyak), dengan suatu risiko kesalahan yang sekecil mungkin. Anova mempunyai
kemampuan membedakan antar banyak kelompok dengan risiko kesalahan yang kecil, juga dapat
memberi informasi tentang ada tidaknya interaksi antar variabel bebas sehubungan dengan
variabel terikat.
Pada dasarnya ANOVA dapat dibagi menjadi 2 kelompok besar, yaitu:
1. Beberapa kelompok yang dihadapi merupakan pembagian dari satu independen varibel
(variabel bebas)
2. Beberapa kelompok yang dihadapi merupakan pembagian dari beberapa independen varibel
(variabel bebas)
2. Kesamaan Variansi
Masing-masing kelompok hendaknya berasal dari populasi yang mempunyai variansi yang sama.
Untuk sampel yang sama pada setiap kelompok, kesamaan variansi dapat diabaikan. Tetapi, jika
banyaknya sampel pada masing-masimg kelompok tidak sama, maka kesamaan variansi populasi
memang sangat diperlukan.
3. Penamatan Bebas
Sampel hendaknya diambil secara acak (random), sehingga setiap pengamatan merupakan
informasi yang bebas.
Sebenarnya analisis ANOVA satu arah dapat dipakai untuk menghadapi kasus variabel bebas
lebih dari satu. Hanya saja analisisnya dilakukan satu per satu, sehingga akan menghadapi
banyak kasus ( N semakin banyak ).
Dengan melakukan Anova dua arah akan dihindari pula pula terjadinya noise (suatu
kemungkinan yantg menyatakan terdapat suatu efek karena bercampurnya suatu analisis data).
Noise ini dapat dihindari pada ANOVA dua arah karena analis disini melibatkan kontor terhadap
perbedaan(katagorikal) variabel bebas.
Interaksi suatu kebersamaanantar fektor dalam mempengaruhi variabel bebas, dengan
sendirinyapengaruh faktor-faktor secara mandiri telah dihilangkan. Jika terdapat interaksi berarti
efek faktor satu terhadap variabel terikatakan mempunyai garis yang tidak sejajar dengan efek
faktor lain terhadap variabel terikatsejajar (saling berpotongan), maka antara faktor tidak
mempunyai interaksi.
Anova dua arah digunakan peneliti untuk mengatasi perbedaan nilai variabel terikat yang
dikategorikan berdasarkan variasi bebas yang banyak dan masing-masing variabel terdiri dari
beberapa kelompok. Anova dua arah merupakan penyempurnaan Anova satu arah.
Anova dua arah lebih efisien daripada anova satu arah, karena:
kasus yang dihadapi lebih sedikit yaitu sejumlah sampel .
noise dapat dihilangkan.
dapat diketahui unsur kebersamaan variabel bebas dalam mempengaruhi variabel terikat.
Contoh :
Seorang dosen bahasa Indonesia hendak melakukan penelitian berkenaan dengan efektifitas
empat macam tekhnik membaca yang bisa dipergunakan mahasiswanya. Untuk keperluan itu,
dipilih masing-masing di pilih 10 mahasiswa untuk menerapkan teknik membaca tersebut. Dari
penelitian tersebut, data skor kecepatan efektif membaca (KEM) tertera pada tabel berikut ini.
Teknik membaca
ABCD
90 70 40 50
80 50 60 30
70 60 50 60
50 70 50 40
60 50 70 50
80 70 60 40
80 70 60 50
70 80 60 60
90 60 40 40
80 70 60 30
1. Merumuskan Hipotesis
Ho menyatakan tidak ada perbedaan di anatara rata-rata beberapa populasi yaitu Ho: 1 = 2 =
3 = ...
H1 menyatakan satu atau lebih rata-rata populasi tidak sama dengan rata-rata populasinya yaitu:
H1 : 1 2 = 3 = ... = n atau
H1 : 1 2 3 ... n atau
H1 : 1 = 2 = 3 ... n atau
H1 : 1 2 3 ... n atau
Pada contoh di atas, hipotesisnya dirumuskan :
H1 : efektivitas keempat teknik membaca tersebut tidak berbeda satu sama lain.
H1 : efektivitas keempat teknik membaca tersebut tidak berbeda satu sama lain (paling sedikit
anatar dua teknik membaca)
Atau : Ho : A = B = C = D
Ho : A B C D
Sumber Varians (SV) Jumlah Kuadrat (JK) Derajat Kebebasan (DK) Renta Kuadrat (RK) F
Antar Kolom(a) Jka dba RKa RKa
Residu (d) JKd dbd RKd RKd
Total (T) JKT
c) Menentukan F tabel
F tabel = F(@) (dba/dbd)
Untuk = 0,05 dan @= 0,01
Dba= derajat kebebasan pembilang = 3
Dbd= derajat kebebasan penyebut = 36
Maka F tabel = F (0,05) (3/36) = 2.8
F tabel = F (0,05) (3/36) = 4.38
d) Menguji hipotesis
Kriteria pengujian:
Jika Fhitung > F tabel, Ho di tolak danjika Fhitung
Contoh :
Seorang guru matematika ingin mengetahui efektivitas pemberian latihan soal dengan
menggunakan perangkat dan buku paket terhadap dua kelompok siswa, yaitu dengan pengujian
efektivitasnya berdasarkan hasil/skor latihan yang telah dibuat untuk siswa. Untuk kepentingan
penelitiannya guru mengambil/memilih masing-masing 10 pandai untuk diberi dua perlakuan
yang berbeda dan 10 siswa yang kurang pandai untuk keperluan berbeda pula
Hasil penelitiannya ditunjukkan oleh data berikut ini:
Homogenitas pasangan LKS Siswa Pandai, LKS-Siswa Lemah, Buku Paket- Siswa Pandai,
Buku Paket- Siswa Lemah.
LKS Siswa Pandai : 82, 82, 73, 73, 82, 60, 60, 73, 85 , 75 (1)
LKS Siswa Lemah : 45, 50 , 60, 50, 45, 50, 45, 60, 45, 60 (2)
B. Paket Siswa Pandai : 63, 63, 63, 55, 65, 73, 55, 55, 65, 55 (3)
B. Paket Siswa Lemah : 40, 50, 60, 50, 42, 53, 43, 62, 35, 50 (4)
1. Varians varians:
V1 = 78.5
V2 = 43.3
V3 = 36.8
V4 = 74.3
2. Varians Gabungan :
Uji Binomial
Distribusi binomial adalah distribusi yang menghasilkan salah satu dari dua hasil yang saling mutually
exclusive, seperti sakit-sehat, hidup-mati, sukses-gagal dan dilakukan pada percobaan yang saling
independen, artinya hasil percobaan satu tidak mempengaruhi hasil percobaan lainnya (Bisma Murti,
1996). Uji binomial digunakan untuk menguji hipotesis tentang suatu proporsi populasi. Data yang cocok
untuk melakukan pengujian adalah berbentuk nominal dengan dua kategori. Dalam hal ini semua nilai
pengamatan yang ada di dalam populasi akan masuk dalam klasifikasi tersebut. Bila proporsi
pengamatan yang masuk dalam kategori pertama adalah sukses = p, maka proporsi yang masuk dalam
kategori kedua gagal adalah 1-p = q. Uji binomial memungkinkan kita untuk menghitung peluang atau
probabilitas untuk memperoleh k objek dalam suatu kategori dan n-k objek dari kategori lain. (Wahid
Siulaiman, 2003).
Jika jumlah kategori pertama (P) dari satu seri pengamatan dengan n sampel adalah k, maka probabilitas
untuk memperoleh P adalah:
Distribusi binomial disebut juga percobaan Bernouli, dimana percobaan Bernouli dapat dilakukan pada
keadaan :
1. Setiap percobaan menghasilkan salah satu dari dua kemungkinan hasil yang saling terpisah
(mutually exclusive).
2. Probabilitas sukses (p) adalah tetap dari satu percobaan ke percobaan lainnya.
3. Percobaan-percobaan bersifat independen, dimana hasil dari satu perobaan tidak
mempengaruhi hasil percobaan lainnya.
Dengan uji binomial, pertanyaan penelitian yang akan dicari jawabannya adalah apakah kita mempunyai
alasan yang cukup kuat untuk mempercayai bahwa proporsi elemen pada sampel kita sama dengan
proporsi pada populasi asal sampel. Dalam prosedur uji hipoesa, distribusi binomial kita gunakan
sebagai acuan dalam menetapkan besarnya probabiitas untuk memperoleh suatu nilai kategori
pertama sebesar yang teramati dan yang lebih ekstrim dari nilai itu, dari sebuah sampel yang berasal
dari populasi binomial.
Satu Sisi :
Contoh Soal :
Sebuah studi berminat melakukan uji fluorescent antibody guna meneliti adanya reaksi serum setelah
pengobatan pada penderita malaria falcifarum. Dari 25 subjek yang telah disembuhkan, 15 subjek
ditemukan bereaksi positif. Jika sampel itu memenuhi semua asumsi yang mendasari uji binomial,
dapatkah kita menyimpulkan dari data itu bahwa proporsi reaksi positif dalam populasi yang
bersangkutan adalah lebih besar dari 0,5? Misalkan = 0,05 (Wayne W.Daniel, 2003, hal 67).
HIPOTESA
Ho : p 0,5 dan Ha: p > 0,5
PERHITUNGAN
Dari tabel binomial, dengan n=25, x-1=14 dan Po=0,5, untuk uji satu sisi dengan P = 15/25 = 0,6 > po
=0,5, diperoleh nilai p :
14 25!
= 1 0,7878 = 0,2122
Karena p = 0,2122 > 0,05. maka Ho gagal ditolak, sehingga kita dapat menyimpulkan bahwa proporsi
reaksi serum di antara populasi yang telah mendapat pengobatan malaria tidak dapat dikatakan lebih
besar secara bermakna dari 0,5.
Uji Binomial menguji hipotesis tentang suatu proporsi populasi. Ciri dari binomial adalah data berupa
dua (bi) macam unsur.
Kelebihannya antara lain adalah :
Tingkat kesalahan penggunaan prosedur statistika nonparametrik relatif kecil karena statistik jenis ini
tidak memerlukan banyak asumsi.
Perhitungan yang harus dilakukan pada umumnya sederhana dan mudah,khususnya untuk data yang
kecil.
Konsep dalam statistika nonparametrik mudah untuk dimengerti.
Dapat digunakan untuk menganalisa data yang berbentuk hitungan maupun peringkat (rank).
1. Soal Anova
Duabelas orang karyawan yang di bagi dalam empat kelompok, di ikutkan dalam pelatihan untuk menyelesaikan satu unit barang.
Masing- masing kelompok diberikan pelatihan yang berbeda.
Hasil akhir dalam menyelesaian satu unit barang (jam) sebagai berikut :
A B C D
6 8 7 9
5 6 7 8
7 6 8 7
Apakah ada perbedaan waktu dalam menyelesaikan satu unit barang diantara empat kelompok yang diberikan pelatihan berbeda?
Bila ada kelompok mana yang berbeda? (Alfa = 0,05)
Penyelesaian :
A B C D
6 8 7 9
5 6 7 8
7 6 8 7
Yi+ 18 20 22 24 84
I. Ho: 1 = 2 = 3= 4= 5
Ha: 1 2 3 4 5
II. SST = 62 + 52 + 72 + 82 + 62 + 62 + 72 + 72 + 82 + 92 + 82 + 72 (84)2 = 14
12
III. SSB = 182 + 202 + 222 + 242 - 842 = 6,66
3 3 3 3 12
F = 6.66 = 0,90
7,34
Tabel Anova
__________________________________
_Sumber df SS MS F
Between 3 6,66 2,22 2,03
Within 8 7,34 1,09________
Total 11 14