Anda di halaman 1dari 102

CITY HUNTER IT'S THE BEST

MATA KULIAH : STATISTIKA PROBABILITAS (3 SKS)

TUJUAN :
 Memberikan pengertian tentang dasar-dasar Statistika dan
Probabilitas
 Memberikan pengertian macam-macam distribusi (Binomial,
Hipergeometrik, Poisson, Normal standar, T test, F test, Chi-
Square test) dan cara pembacaan Tabel masing-masing distribusi

SASARAN :
     Mahasiswa memahami pengertian Statistika dan Probabilitas dan
mampu mengaplikasikan dalam menyelesaikan masalah
     Mahasiswa memahami pengertian distribusi, berbagai bentuk
distribusi, cara pembacaan Tabel, serta mampu mengaplikasikan
dalam menyelesaikan masalah

ISI :

Minggu ke Cakupan isi Sasaran pembelajaran


1 Pendahuluan, Silabus (tujuan, Memahami silabus / isi materi dari
sasaran, isi, daftar pustaka), mata kuliah dan memotivasi
mahasiswa
Pengertian dasar Statistika dan Memahami pengertian dasar
Probabilitas Statistika dan Probabilitas
Notasi dasar Statistika Memahami notasi dasar Statistika

2 Pengertian Data Memahami pengertian Data


Distribusi data (Distribusi Memahami distribusi data dan
Frekuensi : Histogram dan mampu mengaplikasikan dalam
Poligon) menyelesaikan masalah
Memahami pemusatan data dan
Pemusatan data (Mean (average), mampu mengaplikasikan dalam
Median, Modus) menyelesaikan masalah
Memahami dispersi data dan
Dispersi data (Range, Variansi mampu mengaplikasikan dalam
(Variance), Simpangan baku menyelesaikan masalah
(Standard Deviation), Koefisien
Variansi (Coefficient of
Variance))
3 Regresi linier dan Least Square Memahami Regresi linier dan Least
Method Square Method
Pembacaan Tabel Memahami cara pembacaan Tabel
Mampu mengaplikasikan dalam
menyelesaikan masalah
4 Ruang sampel (sample space)  Memahami pengertian ruang
Probabilitas sampel 
Memahami pengertian probabilitas
dan mampu mengaplikasikan
dalam menyelesaikan masalah

5 Distribusi Binomial Memahami pengertian distribusi


Pembacaan Tabel Binomial dan cara pembacaan
Latihan soal Tabel
Mampu mengaplikasikan dalam
menyelesaikan masalah
6 Distribusi Hipergeometris Memahami pengertian distribusi
Latihan soal Hipergeometris dan
mampumengaplikasikan dalam
menyelesaikan masalah

7 Resume sebelum UTS, tanya Memahami semua materi yang telah


jawab dan pembahasan soal-soal diajarkan
Mampu mengaplikasikan dalam
menyelesaikan masalah

8 UTS

9 Distribusi Poisson  Memahami pengertian distribusi


Pembacaan Tabel Poisson dan cara pembacaan
Latihan soal Tabel
Mampu mengaplikasikan dalam
menyelesaikan masalah

10 Distribusi Normal Standar Memahami pengertian distribusi


Pembacaan Tabel Normal Standar dan cara
Latihan soal pembacaan Tabel
Mampu mengaplikasikan dalam
menyelesaikan masalah

11 Distribusi T (T Test) dan Memahami pengertian distribusi T


Distribusi F (F Test) (T Test) dan Distribusi F (F Test)
Pembacaan Tabel serta cara pembacaan Tabel
Latihan soal Mampu mengaplikasikan dalam
menyelesaikan masalah

12 Distribusi Chi-Square (2 Test) Memahami pengertian distribusi


Pembacaan Tabel Chi-Square (2 Test) dan cara
Latihan soal pembacaan Tabel
Mampu mengaplikasikan dalam
menyelesaikan masalah

13 Angka Indeks (Index Value) Memahami pengertian Angka


Latihan soal Indeks (Index Value) dan
Mengenal beberapa Software mampumengaplikasikan dalam
dalam Statistika (SPSS, menyelesaikan masalah
MiniTab, MacroStat) Mengenal beberapa Software dalam
Statistika dan
mampumengaplikasikannya
14 Resume sebelum UAS, tanya Memahami semua materi yang telah
jawab dan pembahasan soal-soal diajarkan
Mampu mengaplikasikan dalam
menyelesaikan masalah

15 UAS

DAFTAR PUSTAKA : 

1.    R.E. Walpole and R.H. Myers, "Probability and Statistics for


Engineers and Scientists", Macmillan Publishing Co., 2002
2.    Ross, "Introduction to Probability and Statistics for Engineers
and Scientists", John Wiley, USA, 1998
3.    Rosenkrantz, W.A., "Introduction to Probability and Statistics
for Scientists and Engineers ", The McGraw-Hill Inc., Singapore,
1997
4.    J.S. Milton, Jesso Arnold, "Introduction to Probability and
Statistics. Principles and Application  for engineering and
computing sciences", The McGraw-Hill Inc., New York, 1995
5.    Neter, Waserman, Whitmore, "Applied Statistics", Prenctice Hall,
USA, 1998
6.    Donald H. Sanders, "Statistics", McGraw-Hill, Int.ed., 1990
7.    Chase, Brown, "General Statistics", John Wiley, USA, 1998
8.    Wonnacot, "Statistics : Discovery its Power", John Wiley, 1996
9.    Wonnacot, "Introductory Statistics", John Wiley, 1990
10. Greeneville, Richard A., "Introductory Statistics", Paws-Kent
Publishing Co., 1988
11. Kreyszig, "Introduction to Mathematical Statistics : Principles
and Methods ", John Wiley, USA, 1990
Kisi-kisi Statistika Probabilitas :

Statistika ?
Probabilitas ?
Ruang sample (Sample space)? Probabilitas ?

Manfaat belajar statistika ?


Notasi dasar statistika

Data ?
Distribusi data :
Tabel Frekuensi : - Histogram
                             - Poligon
Pemusatan data : 
- Mean (average)
- Median
- Modus
Dispersi data :
- Range
- Nilai tengah simpangan (mean deviation)
- Variansi (Variance)
- Simpangan baku (standard deviation)
- Koefisien Variasi (Coefficient of Variation)

Regresi linier, least square method ?

Distribusi Binomial ? Kombinasi ? Pembacaan Tabel !


Distribusi Hipergeometris ?
Distribusi Poisson ? Pembacaan Tabel !
Distribusi Normal Standar ? Pembacaan Tabel !

Distribusi T (T Test) ? Pembacaan Tabel !


Distribusi F (F Test) ? Pembacaan Tabel !
Distribusi Chi-Square (2 Test) ? Pembacaan Tabel !
Angka index (Index value)
Ruang sampel (Sample space)

Definisi 1. Informasi yang dicatat dan dikumpulkan dalam bentuk


aslinya, baik dalam bentuk hitungan maupun pengukuran,
disebut data mentah.

Misal :
        Banyaknya orang yang meninggal karena penyakit demam berdarah
dari bulan ke bulan selama setahun terakhir pada suatu provinsi
( 18, 12, 10, 78, 90, 100, 9, 2, 5, 3, 2, 3 )
        Banyaknya kecelakaan di suatu jalan tol dalam 3 tahun terakhir
(100, 172, 80 )

Dalam statistika digunakan istilah percobaan untuk menyatakan tiap


proses yang menghasilkan data mentah.

Definisi 2. Gugus semua hasil yang mungkin dari suatu percobaan


statistika disebutruang sampel dan dinyatakan dengan lambang S.

Tiap hasil dalam ruang sampel disebut unsur atau anggota ruang


sampel tersebut, atau dengan singkat disebut titik sampel.

Misal :
        Pada suatu percobaan melantunkan sebuah dadu dan diamati nomor
yang muncul di muka sebelah atas, maka ruang sampelnya :
S =  1, 2, 3, 4, 5, 6 
        Pada suatu percobaan melantunkan sebuah mata uang dan diamati
sisi yang menghadap ke atas, maka ruang sampelnya :
S =  A, G   bila kita menyebut sisi kesatu adalah Angka (A) dan
sisi
                          lainnya Gambar (G)
atau
S =  M, B   bila kita menyebut sisi kesatu adalah Muka (M) dan
sisi
                          lainnya Belakang (B)
        Pada suatu percobaan melantunkan sebuah dadu dan sebuah mata
uang sekaligus, dan diamati nomor yang muncul di muka sebelah atas
sisi yang menghadap ke atas, maka ruang sampelnya :
S =  1M, 1B, 2M, 2B, 3M, 3B, 4M, 4B, 5M, 5B, 6M, 6B 

Bila ruang sampel mempunyai unsur yang hingga banyaknya, maka


anggotanya dapat didaftar / ditulis dengan menuliskannya diantara
2 akolade, masing-masing unsur dipisah oleh koma. (seperti contoh
diatas)
Bila ruang sampel anggota tak hingga banyaknya lebih mudah ditulis
dengan suatu pernyataan atau aturan.
Misal : S = x  x  adalah penduduk Indonesia orang berumur lebih
dari 60 tahun

Soal :

Tuliskan anggota tiap ruang sampel berikut :


a. himpunan bilangan bulat antara 1 dan 50 yang habis dibagi 7
b. himpunan S= x  x2 + x - 6 = 0  
c. himpunan hasil bila dua buah dadu dilantunkan sekaligus
d. himpunan hasil bila dua buah uang logam dilantunkan sekaligus
e. himpunan S= x  x adalah benua 
f. himpunan S= x  2x - 4 = 0 dan x > 5 
g. himpunan hasil bila dua buah uang logam dan sebuah dadu
dilantunkan sekaligus
h. himpunan bila 3 ibu rumah tangga dipilih secara acak ditanya
apakah mereka mencuci menggunakan sabun merk Rinso ?

Probabilitas (Probability)

Probabilitas adalah suatu ukuran seberapa besar suatu kejadian


akan terjadi terhadap semua kejadian yang ada.

Bila :
n  = ukuran besarnya kejadian A akan terjadi
N = ukuran besarnya semua kejadian yang ada
Maka probabilitas kejadian A adalah :
               n
P(A) = 
               N 

Contoh :
Bila kartu bridge (berisi 52 kartu) dikocok dan diambil satu :
  Probabilitas yang terambil kartu warna merah :
P(merah) = 26/52 = 1/2
  Probabilitas yang terambil kartu diamond :
P(diamond) = 13/52 = 1/4
  Probabilitas yang terambil kartu As
P(As) = 4/52 = 1/13
  Berapa besar Probabilitas yang terambil kartu As warna merah ?
  Berapa besar Probabilitas yang terambil kartu dengan angka 10
diamond ?

Soal :
1.      Bila dua buah dadu dilantunkan sekaligus, berapa besar
probabilitasnya kedua sisi dadu yang menghadap keatas masing-
masing lebih besar dari 4 ?
2.      Bila dua buah dadu dan sebuah uang logam dilantunkan sekaligus,
berapa besar probabilitasnya kedua sisi dadu yang menghadap
keatas masing-masing merupakan angka ganjil ?
3.      Tiga ibu rumah tangga dipilih secara acak untuk ditanya apakah
mereka menggunakan sabun merk Rinso untuk mencuci pakaian.
a. Tuliskanlah anggota ruang sampel S dengan menggunakan huruf Y
untuk jawaban ‘ya’ dan T untuk ‘tidak’ ?
b. Berapa besar probabilitas kejadian A bahwa paling sedikit dua ibu
rumah tangga menggunakan sabun merk Rinso ?
c. Berapa besar probabilitas kejadian B bahwa tidak ada satupun ibu
rumah tangga yang menggunakan sabun merk Rinso ?
Statistika ?

  Dalam arti sempit : Statistika adalah ringkasan berbentuk angka


  Dalam arti luas : Statistika adalah ilmu yang mempelajari cara
pengumpulan, pengolahan, penyajian dan analisis data serta cara
pengambilan keputusan secara umum berdasarkan hasil penelitian
yang tidak menyeluruh

                      dianalis /
      Data       Hasil / keluaran     Diambil
keputusan
                 diolah

Setiap organisasi (lembaga, institut, perusahaan) berusaha


untuk menghasilkan produk (barang, jasa). Untuk menghasilkan suatu
produk diperlukan masukan (input).

Masukan melalui suatu proses dalam organisasi diubah menjadi


keluaran (out put).

  

            masuka
n                                organisasi                              keluaran

            Tugas pokok pimpinan suatu organisasi adalah mengatur atau


mengelola masukan secara efisien dan efektif untuk memperoleh
keluaran yang terbaik.
           
Pimpinan suatu organisasi memerlukan data untuk membuat
keputusan serta menyusun kebijakan atau strategi dalam rangka
mencapai tujuan organisasi.
Apa itu data ?

Webster’s New World Dictionary :


datum  something known / assumed
Secara singkat, data (bentuk jamak dari datum) adalah sesuatu yang
diketahui / diasumsikan.
Secara lebih rinci, data adalah hasil pengukuran atau pengamatan
yang dikumpulkan, berupa angka-angka atau besaran-besaran atau
fakta-fakta atau pernyataan-pernyataan yang menggambarkan
perbedaan atau persamaan suatu individu atau obyek dengan yang
lain pada karakteristik yang sama.

Manfaat orang belajar Statistika ?

Orang dengan cepat / sistematis dapat :


  Mengolah data & mengatasi permasalahan
  Menampilkan keluaran untuk diambil keputusan
  Berpikir logis
Distribusi data 
Tabel Frekuensi : - Histogram
                             - Poligon
Kita bisa menyusun data yang kita miliki ke dalam suatu tabel yang
disebut : Tabel Frekuensi.
Tabel Frekuensi : adalah merupakan tabel yang menunjukkan
sebaran atau distribusi frekuensi data yang kita miliki, yang
tersusun atas frekuensi tiap-tiap kelas atau kategori. Frekuensi
tiap kelas / kategori menunjukkan banyaknya pengamatan di dalam
kelas / kategori yang bersangkutan.

Misal diketahui data nilai Kimia Dasar mahasiswa Teknik


Informatika semester ganjil 2007 / 2008 :

Mahasiswa (Xi) Nilai


1 60
2 50
3 80
4 70
5 85
6 80
7 85
8 70
9 90
10 70

Data nilai Kimia Dasar mahasiswa Teknik Informatika semester


ganjil 2006/2007 tersebut bisa dibuat Tabel Frekuensi sebagai
berikut :

Interval kelas (nilai) Frekuensi (f)


40 - < 50 0
50 - < 60 1
60 - < 70 1
70 - < 80 3
80 - < 90 4
90 - 100 1
Ada 2 cara penyajian data dalam bentuk gambar yang umum
digunakan :
-         Histogram (diagram Balok)
-         Poligon (diagram Garis, merupakan gambar dalam bentuk garis
patah-patah yang berhubungan satu dengan yang lain )
Pemusatan data :
- Mean (average)
- Median
- Modus

Kita lihat kembali data nilai Kimia Dasar mahasiswa Teknik


Informatika semester ganjil 2007 / 2008 :

Mahasiswa (Xi) Nilai


1 60
2 50
3 80
4 70
5 85
6 80
7 85
8 70
9 90
10 70

1. Mean (rata-rata hitung, average) : 


adalah suatu nilai yang diperoleh dengan jalan membagi seluruh nilai
pengamatan dengan banyaknya pengamatan

                 Xi          740
       =  =  = 74
                 N             10

2. Median : Md
adalah suatu nilai pengamatan yang terletak ditengah-tengah bila
data yang dimiliki diurut / disusun dari terkecil ke terbesar (atau
sebaliknya, dari terbesar ke terkecil).
Median mempunyai sifat sedemikian rupa sehingga setengah dari
data pengamatan mempunyai nilai  (lebih besar atau sama dengan)
sedangkan setengah lainnya mempunyai nilai  (lebih kecil atau sama
dengan) nilai median tersebut.
Untuk mencari nilai Median (setelah data disusun / diurut) :

- untuk n = ganjil    Md = Xk+1                                            (k =


( n-1 ) / 2)
- untuk n = genap   Md = ( Xk  + Xk+1 ) / 2                          (k = n /
2)

Bila data diatas kita urut :


Xi = 50, 60, 70, 70, 70, 80, 80, 85, 85, 90

N = 10  Md = (X5 + X6) / 2 = (70 + 80) / 2 = 75

3. Modus (Mode)
adalah nilai pengamatan dengan frekuensi terbesar.

Modus = Xi , bila fi terbesar

Dari data diatas :

Xi fi
50 1
60 1
70 3
80 2
85 2
90 1

Modus = 70

Modus tidak selalu berarti bilangan. Misalnya dalam riset


pemasaran, persoalan modus ini sangat penting. Sebagai contoh hasil
penjualan sepatu menunjukkan hasil sebagai berikut :

Jenis sepatu (Xi) Banyaknya yang terjual (fi)


A 100
B 150
C 50
D 30
E 20

Dalam hal ini sepatu jenis B merupakan modus, yaitu model / jenis
sepatu yang paling banyak disenangi masyarakat (yang paling laku).

Apa artinya bila Median sama dengan atau lebih besar atau lebih
dari  .

                                                                      

  

 
                                                             Md

Median = Mean (Md =  )  artinya setengah dari data


pengamatan  atau  nilai rata-
                                                 rata

Median > Mean (Md >  )  artinya lebih dari setengah data
pengamatan berada diatas
                                                 ( > ) nilai rata-rata

Median < Mean (Md <  )  artinya lebih dari setengah data
pengamatan berada
                                                 dibawah ( < ) nilai rata-rata

Dispersi data :
- Range
- Nilai tengah simpangan (mean deviation)
- Variansi (Variance)
- Simpangan baku (standard deviation)
- Koefisien Variansi (Coefficient of Variance)

Misalkan mahasiswa tingkat I suatu jurusan pada suatu Perguruan


Tinggi terdiri dari 10 orang berasal dari SLTA umum dan 10 orang
dari SLTA kejuruan dan nilai akhir mata kuliah Matematika
memberikan hasil sebagai berikut :

No. SLTA umum SLTA kejuruan


1 54 60
2 57 64
3 71 51
4 60 79
5 80 42
6 68 77
7 85 80
8 90 60
9 72 96
10 63 86
Jumlah 700 700

Kita dapat melihat bahwa nilai rata-rata (mean) dari keduanya


adalah sama yaitu 700/10 = 70.
Dari gambaran diatas tampak bahwa ukuran pemusatan data (dalam
hal ini nilai rata-rata) belum memberikan keterangan yang lengkap
tentang data yang kita miliki. Untuk melengkapi informasi yang
diberikan oleh ukuran pemusatan data, diperlukan ukuran yang lain,
misalnya ukuran penyebaran data. Dengan dapat ditentukannya
ukuran ini, bila kita ingin menggambarkan dua gugus data (atau
lebih), maka gambaran yang kita berikan lebih lengkap.
Ada beberapa ukuran penyebaran data, diantaranya : Range
(kisaran, rentang), Nilai tengah simpangan (mean deviation) dan
Ragam (Variance, Varians).

1. Range (kisaran, rentang) :


yaitu nilai pengamatan tertinggi dengan nilai pengamatan terendah.
Range = Xmaks - Xmin
Bila range (sangat) besar  data pengamatan tersebar /
terdistribusi (sangat) tidak
                                              merata.
                                                 Dikatakan : keragaman (variansi)nya
tinggi
Bila range (sangat) kecil   data pengamatan tersebar /
terdistribusi (cukup) merata.
                                                  Dikatakan : keragaman (variansi)nya
rendah

Dari data diatas :


Untuk SLTA umum  range = 90 - 54 = 36
Untuk SLTA kejuruan  range = 96 - 42 = 54
Terlihat, bahwa keragaman (variansi) data SLTA kejuruan lebih
tinggi dibandingkan SLTA umum.

2. Nilai tengah simpangan (mean deviation) :


adalah rata-rata dari jumlah harga mutlak selisih antara nilai data
terhadap nilai rata-ratanya.

                     Xi  -   
      = 
                            n

      adalah nilai tengah simpangan.

Dari data diatas :


Untuk SLTA umum       = 96/10 = 9.6
Untuk SLTA kejuruan    = 136/10 = 13.6
Penggunaan nilai tengah simpangan sebagai ukuran penyebaran data,
tidak begitu banyak digunakan.

3. Ragam (Variance, Varians)


Ukuran penyebaran data yang terpenting dan sangat memegang
peranan di dalam pengujian statistik adalah ragam (variance) yang
diberi lambang 2 (sigma kuadrat) untuk populasi berukuran besar
atau tak terbatas dan S2 untuk populasi terbatas

                 (Xi  -   )2
    S2 = 
                   ( n-1 )

Dari data diatas :


Untuk SLTA umum     S2 = 1308/9 = 145.3
Untuk SLTA kejuruan  S2 = 2468/9 = 274.2
Dalam hubungannya dengan ragam (variance) ini dapat diturunkan 2
ukuran penyebaran lain yaitu simpangan baku dan koefisien
keragaman / koefisien variansi

4. Simpangan baku (standard deviation)


yaitu akar pangkat dua dari ragam. Simpangan baku diberi notasi Sd

                   

5. Koefisien Keragaman (KK) atau Koefisien Variasi (KV)


(coefficient of variation, CV)
                          Sd
     KV = CV =  x 100 %
                           

Dari data diatas :


Untuk SLTA umum     Sd =  145.3 = 12.05
                                         CV = 12.05/70 x 100% = 17.2 %

  

Untuk SLTA kejuruan  Sd


=  274.2 = 16.56
                                          CV = 16.56/70 x 100% = 23.7 %
KOMBINASI
Kombinasi : adalah cara memilih r benda dari sejumlah n tanpa
memperdulikan urutannya. ( r < n )
Suatu kombinasi sesungguhnya merupakan sekatan dengan 2 sel, sel
pertama berisi r unsur yang dipilih sedangkan sel lainnya berisi (n-r)
unsur sisanya.

Teorema yang berkaitan dengan kombinasi :

Teorema. Jumlah kombinasi dari n benda yang berlainan bila diambil


sebanyak r adalah :

                                     n                 n!
             nCr  = Cn, r =            = 
                                     r           r! ( n - r )!

Soal :
a.    Bila ada 4 mahasiswa melamar untuk mendapatkan beasiswa,
sedangkan beasiswa yang tersedia untuk 2 orang, berapa kombinasi
yang mungkin ? (2 mahasiswa yang mendapatkan beasiswa dari 4
mahasiswa yang melamar) !

Jawab :
Banyaknya kombinasi yang mungkin :
                    4!         4x3x2x1
      C4,2  =  =  = 6
                 2! 2!     (2x1) (2x1)

      Misal 4 mahasiswa yang melamar beasiswa : A, B, C, D


      Kombinasi yang mungkin (ada 6) : A dan B, A dan C, A dan D, B
dan C, B dan D, C dan D

b.   Bila ada 3 fisikawan, berapa cara untuk memilih 1 fisikawan dari 3


fisikawan tersebut !
     Jawab :
     Banyaknya cara memilih 1 dari 3 fisikawan adalah :
                  3!           3x2x1
     C3,1 =  =  = 3
               1! 2!     (1x1) (2x1)

c.    Bila ada 4 kimiawan dan 3 fisikawan, ada berapa cara untuk


membentuk panitia terdiri dari 3 orang yang beranggotakan 2
kimiawan dan 1 fisikawan !

     Jawab :
     Banyaknya cara memilih 2 dari 4 kimiawan adalah :
                  4!         4x3x2x1
     C4,2  =  =  = 6
                2! 2!     (2x1) (2x1)
    
     Banyaknya cara memilih 1 dari 3 fisikawan adalah :
                  3!           3x2x1
     C3,1  =  =  = 3
               1! 2!     (1x1) (2x1)
     Banyaknya cara untuk membentuk panitia terdiri dari 3 orang
yang beranggotakan 2
     kimiawan dan 1 fisikawan = (6) (3) = 18
 
 
Distribusi Binomial

Definisi : Satu atau serangkaian eksperimen dinamakan eksperimen


Binomial bila dan hanya bila eksperimen yang bersangkutan terdiri
dari percobaan-percobaan Bernoulli (percobaan-percobaan
Binomial ).

Definisi : Suatu percobaan dinamakan percobaan Bernoulli


(Bernoulli trial) bila dan hanya bila memiliki ciri-ciri sebagai
berikut :
1.      Tiap percobaan dirumuskan dengan ruang sampel { S, G }. Dengan
kata lain, tiap percobaan hanya memiliki 2 hasil : sukses (S) dan
gagal (G)
2.      Probabilitas sukses pada tiap-tiap percobaan haruslah sama dan
dinyatakan dengan p
3.      Setiap percobaan harus bersifat independen
4.      Jumlah percobaan yang merupakan komponen eksperimen binomial
harus tertentu

Teorema : Bila sebuah eksperimen terdiri dari n percobaan


Bernoulli dengan probabilitas p bagi sukses dan q bagi gagal pada
tiap-tiap percobaan, maka fungsi probabilitas variabel random x
dapat dinyatakan sebagai berikut :
                         
P ( S = x ) =  C n,x  px  qn-x      dimana x = 0,1,2,……,n
                         
Untuk nilai n dan p tertentu  maka fungsi probabilitas yang
dirumuskan dengan persamaan diatas dinamakan fungsi probabilitas
binomial f(x) atau fungsi kepadatan binomial (binomial density
function).

            Untuk lebih memahami konsep Distribusi Binomial, dibawah


ini dilakukan percobaan terhadap kotak berisi 10 buah pingpong.
            Suatu kotak berisi 10 buah bola pingpong, 3 diantaranya
berwarna merah (selainnya berwarna bukan merah). Terhadap bola
pingpong yang terdapat dalam kotak tadi, dilakukan percobaan sbb :
Diambil sebuah bola pingpong dari kotak tersebut dan dilihat
warnanya, kemudian bola pingpong tadi dikembalikan ke kotak
semula. Pengambilan ini dilakukan sebanyak 4 kali. Dari ke 4
pengambilan bola tersebut, berapa besar probabilitas 3 bola merah
yang terambil ?

Percobaan ini memenuhi kriteria Distribusi Binomial (termasuk


percobaan Bernoulli) karena memiliki ciri-ciri diantaranya :
probabilitas sukses (terambilnya bola merah) pada tiap-tiap
percobaan (pengambilan bola) adalah sama (p=3/10).
Probabilitas 3 bola merah terambil  dapat dicari dengan
menggunakan rumus fungsi Probabilitas Binomial :

P ( S = x ) =  C n,x  px  qn-x    

n = 4                 p=3/10                             
x = 3                 q=1-p=7/10
       
P(S=3)= C 4,3   (3/10)3  (7/10)
            
           4x3x2x1
      =   (3/10)3  (7/10) = 0,0756
             3x2x1
 

Soal :
Suatu kotak berisi 8 buah bola pingpong, 3 diantaranya berwarna
merah.
a. Satu buah diambil secara random dari kotak tersebut, berapa besar
probabilitas yang terambil bola berwarna merah ?
b. Satu buah diambil secara random dari kotak tersebut, dilihat
warnanya dan dikembalikan lagi ke dalam kotak. Pengambilan ini
dilakukan 5 kali. Dari 5 kali pengambilan ini :
        Berapa besar probabilitas yang terambil 2 bola merah ?
        Berapa besar probabilitas yang terambil 4 bola merah ?

Jawab :
a. Probabilitas bola merah yang terambil : p = 3/8
b. Percobaan ini termasuk percobaan Bernoulli  fungsi probabilitas
dapat dicari menggunakan fungsi probabilitas binomial :

      P ( S = x ) =  C n,x  px  qn-x    

         n = 5
         p = P(merah) = 3/8
         q = P(bukan merah) = 5/8
           
         Probabilitas yang terambil 2 bola merah ( x = 2 ) :
                                                          5!
        P(S=2) = C 5,2 (3/8)2 (5/8)3 =   (3/8)2 (5/8)3 = 0,3433
                                                       2! 3!
   
        Probabilitas yang terambil 4 bola merah ( x = 4 ) :
                                                        5!
       P(S=4) = C 5,4  (3/8)4 (5/8) =   (3/8)4 (5/8) = 0,0618
                                              4! 1!
Distribusi Hipergeometris

            Suatu kotak berisi 10 buah bola pingpong, 3 diantaranya


berwarna merah (selainnya berwarna bukan merah). Terhadap bola
pingpong yang terdapat dalam kotak tadi, dilakukan percobaab sbb :
Diambil sebuah bola pingpong dari kotak tersebut dan dilihat
warnanya, tapi bola tersebut tidak dikembalikan ke kotak semula.
Pengambilan ini dilakukan sebanyak 4 kali. Dari ke 4 pengambilan
bola tersebut, berapa besar probabilitas 2 bola merah yang
terambil.
           
Percobaan ini tidak termasuk percobaan Bernoulli
Percobaan ini sama dengan kita mengambil 4 bola dari 10
bola  maka pengambilan 4 bola dari 10 bola memiliki kemungkinan
kombinasi sebanyak :
 
= C10,4
  
Bila kita menginginkan 2 bola merah yang terambil dari 3 bola merah
yang ada dalam kotak, maka kemungkinan kombinasinya :
 
= C3,2

Kemungkinan kombinasi 2 bola bukan merah yang terpilih dari 7 bola


bukan merah yang berada dalam kotak :
 
= C7,2

Kemungkinan kombinasi kita mengambil 4 bola dalam kotak dan


terambil 2 bola merah :

= C3,2 x C7,2
Jadi probabilitas 2 bola merah terambil bila kita mengambil 4 bola
dari kotak tersebut :

     C3,2 x C7,2
= 
          C10,4

        3!           7!               (3x2x1)             (7x6x5x4x3x2x1
)
        x            x 
       2! 1!       2! 5!          (2x1) (1x1)         (2x1) (5x4x3x2x1)
 =  = 
                 10!                    (10x9x8x7x6x5x4x3x2x1)
                          
                4! 6!                   (4x3x2x1) (6x5x4x3x2x1)

         (3x2x1)             (7x6x5x4x3x2x1)
      x 
        (2x1) (1x1)         (2x1) (5x4x3x2x1)
 =  
         (10x9x8x7x6x5x4x3x2x1)
      
         (4x3x2x1) (6x5x4x3x2x1)

       (3) x (24)           1
=  =  = 0,05
      (2) x (720)         20

Pada percobaan ini, percobaan dilakukan tanpa pemulihan /


pengembalian (without replacement)  artinya secara random dan
sekaligus kita mengambil 4 bola dari sebuah kotak yang berisi 10
bola (terdiri dari 3 bola merah dan 7 bola bukan merah).

Dalam hal ini, kita sebetulnya memiliki sebuah populasi N=10 dan
random sampel n=4 yang dipilih sekaligus tanpa pengembalian.
Secara singkat, percobaan diatas dapat dinyatakan dalam sebuah
teorema mengenai distribusi probabilitas hipergeometris dengan
parameter n, N, k dan K.

Teorema : Bila sebuah populasi N memiliki sejumlah K unsur yang


sama dan (N-K) unsur lain, dan bila sejumlah n unsur dipilih secara
random tanpa pemulihan, maka probabilitas unsur yang terpilih
terdapat k unsur K adalah :

                  CK,k x CN-K,n-k
P (S = k) = 
                         CN,n

Perumusan diatas berlaku untuk k < K atau k < n.


Bila k > K atau k > n maka rumus diatas = 0
SOAL :

I.   Sebuah pabrik mainan anak-anak (robot) memproduksi 20 buah


produk per hari. Dari 20 buah robot yang diproduksi per hari, rata-
rata 2 buah tidak memenuhi standar kualitas (cacat). Jika setiap
hari pengawas kualitas mengambil 3 buah produk robot secara
random untuk diperiksa, berapa probabilitas dari produk robot yang
diambil pengawas tersebut terdapat 1 yang cacat ?

II. Suatu kotak berisi 8 buah bola pingpong, dua diantaranya berwarna
merah. Dari kotak tersebut diambil 1 bola dan dilihat warnanya,
kemudian bola dikembalikan ke kotak semula. Pengambilan bola ini
dilakukan 6 kali. Jika bola yang terambil tersebut berwarna merah
kita katakan sukses. Dari 6 kali percobaan Bernoulli tsb.
tentukanlah probabilitas untuk s = 0, s = 1, s = 2, s = 3, s = 4, s = 5
dan s = 6, dan buat grafik distribusinya !

III. Dari hasil survey menunjukkan bahwa 20 % dari populasi di suatu


kecamatan di kota Tangerang berada di bawah garis kemiskinan.
Jika diambil sampel 6 orang dari populasi tersebut, berapa besar
probabilitas :
a. Paling banyak 3 orang dari sampel tersebut berada di bawah garis
kemiskinan
b. Paling sedikit 4 orang dari sampel tersebut tidak berada di bawah
garis kemiskinan

IV. Sebuah pabrik barang keramik memproduksi 24 buah produk per


hari. Dari 24 buah barang keramik yang diproduksi per hari, rata-
rata 2 buah tidak memenuhi standar kualitas (cacat). Jika setiap
hari pengawas kualitas mengambil 3 buah barang keramik secara
random untuk diperiksa, berapa probabilitas dari barang keramik
yang diambil pengawas tersebut terdapat 1 yang cacat ?

V. Suatu kotak berisi 3 bola pingpong berwarna merah, putih dan


kuning. Dari kotak tersebut diambil 1 bola dan dilihat warnannya,
kemudian bola dikembalikan ke kotak semula. Pengambilan bola ini
dilakukan 4 kali. Jika bola yang terambil tersebut berwarna merah
kita katakan sukses. Dari 4 kali percobaan Bernoulli tsb.
tentukanlah probabilitas untuk s=0, s=1, s=2, s=3 dan s=4, dan buat
grafik distribusinya !

VI. Satu mata uang dilemparkan 10 kali. Berapa probabilitas sisi M


(muka) akan muncul 3 kali ?

VII. Bila sebutir dadu dilempar 4 kali, berilah distribusi binomial f(x)
dimana x merupakan jumlah timbulnya mata dadu 6 !

VIII. Sebutir dadu dilemparkan 12 kali. Bila angka 6 yang muncul /


menghadap keatas kita sebut sukses, berapa besar probabilitas 5
kali sukses ?

IX. Dari setumpukan kartu bridge diambil 1 kartu kemudian dilihat dan
dikembalikan ke tumpukan semula. Dilakukan sebanyak 8 kali.
a.    Dari 8 kali pengambilan kartu tsb., kita mengharapkan mendapat
kartu diamond sebanyak 5 kali, berapa besar probabilitasnya ?
b.   Bila dari 8 kali pengambilan kartu tsb., setiap kali kita
mengharapkan mendapat kartu as, berapa besar probabilitasnya ?

X. Setelah diadakan pengamatan bertahun-tahun terhadap hasil


cetakan kertas pada mesin “X”, diketahui bahwa pada cetakan
kertas sebanyak 500 helai terjadi kerusakan sebanyak 50 helai.
Pada hasil cetakan 5 helai kertas, berapakah probabilitas untuk
menemukan 0, 1, 2, 3, 4 dan 5 helai kerusakan ?

XI. Bila kemungkinan melahirkan anak laki-laki dan anak perempuan


adalah sama, berapa probabilitas suatu keluarga dengan 6 anak akan
terdiri dari 0, 1, 2, 3, 4, 5, 6 anak laki-laki ? Buat grafik
distribusinya !

XII. Sekumpulan kartu bridge / remi dikocok lalu diambil satu dan
dilihat jenis kartu yang terambil. Kartu yang diambil tidak
dikembalikan lagi ke tumpukan kartu semula. Tumpukan kartu
dikocok lagi dan diambil satu lalu dilihat jenis kartu yang terambil.
Setiap kartu yang diambil tidak dikembalikan lagi ke tumpukan kartu
semula Percobaan ini dilakukan sebanyak 6 kali. Buat grafik
distribusi probabilitas kartu As yang terambil !

XIII. Suatu kotak berisi 5 bola pingpong, 2 buah berwarna merah dan
1 buah masing-masing berwarna putih, hijau dan kuning. Dari kotak
tersebut diambil 1 bola dan dilihat warnannya. Setiap bola yang
diambil tidak dikembalikan ke kotak semula.Pengambilan bola ini
dilakukan 4 kali. Jika bola yang terambil tersebut berwarna merah
kita katakan sukses. Dari 4 kali percobaan tersebut, tentukanlah
probabilitas untuk k=0, k=1, k=2, k=3 dan k=4, dan buat grafik
distribusinya !
Distribusi Poisson

Distribusi Binomial (yang telah dipelajari terdahulu)


memiliki peranan yang penting dalam analisis statistik.

Bila : n besar sekali (n>50)


          p kecil sekali (p<1/10)

Maka perhitungan P(S=x) pada Distribusi Binomial sulit


dilakukan.
Hasil perkalian n.p menjadi moderat

Misal : n=100
            p=1/100     
            x=4                  
                       
 P ( S = x ) =  Cn,x  px  qn-x    
            = (C100,4) (1/100)4 (99/100)96      ←   sulit dihitung

Dalam hal demikian, pemecahan P(S=x) akan lebih mudah


diperoleh dengan menggunakan pendekatan Poisson (Poisson
Approximation). Bila kita tulis n.p= , maka distribusi Poisson
yang approksimatif tersebut dapat diberikan sebagai berikut :

           x   e-
f(x) =               ( e = 2,71828 )
    x !

e merupakan nilai batas dari (1+1/k)k


Bila k   maka hasilnya dapat dinyatakan sebagai :
e = 1 + (1/1!) + (1/2!) + (1/3!) + .................

Penurunan rumus fungsi Poisson :


Pada distribusi Binomial :
             
P(S=x) =  Cn,x . px . qn-x
   
           n!
             =  px (1-p)n-x  .................................... (1)
        x! (n-x)!
                                             n (n-1) (n-2) ....(n-x+1)
Cn,x  dapat ditulis sebagai : 
                                                        x!
maka rumus (1) dapat ditulis :

                n (n-1) (n-2) ....(n-x+1)


P(S=x) =  px (1- p)n-x  ....................... (2)
                               x!
Bila :  = n.p  p = /n, maka rumus (2) menjadi :

                n (n-1) (n-2) ....(n-x+1)


P(S=x) =  (/n)x (1- /n )n-x  , sehingga :
                              x!

                n    (n-1)   (n-2)       (n-x+1)   x
P(S=x) =  .  .  ...... .  . (1- /n )n . (1- /n )-x
                n      n         n              n         x!

Bila kita mengkonstantir x dan , dan bila n  , maka setiap


suku

  n    (n-1)   (n-2)          (n-x+1) 
  ,  ,  , .....,   dan (1- /n )-x
  n      n         n                  n        

akan memiliki nilai sama dengan 1 sebagai nilai batas.

Alhasil kita akan memperoleh :


                x
P(S=x) =   (1- /n )n
                x!
Kita tulis : (1- /n )n =  (1- /n )n/  

Bila : n/ = k, maka  (1- /n )n/    =  (1- 1/k )k  


Bila n >>  k >> dan  (1- 1/k )k  akan memiliki nilai e-1 sebagai
nilai batasnya.
Jadi :
                x
P(S=x) =   (1- /n ) n
               x!
                x                          x
            =   ( e-1 )   =   ( e- )
                x!                  x!
                x     e-
            = 
                   x!    

Bila n diperbesar sehingga   dan n.p =  tertentu, maka p


harus  0        

Distribusi Poisson :
                  x  . e-
P(S=x)  =  
                     x!    
merupakan suatu pendekatan bagi distribusi binomial yang n-
nya besar dan p-nya kecil.

Teorema :
Bila P(S=x) = Cn,x  . px  . (1- p)n-x dimana x = 0, 1, 2, ...... , n dan
bila p relatif kecil dibandingkan dengan n, maka :
                x  . e-
P(S=x) = 
                   x!    

Contoh soal:
Menurut data statistik, rata-rata seorang dari 100 petani yang
berdiam di desa-desa  di Indonesia akan meminta berlangganan
majalah “Cara Bercocok Tanam”. Penerbit majalah tersebut
mengadakan sales promotion dengan jalan mengirim masing-
masing 50 surat untuk berlangganan yang telah dibubuhi
perangko kepada petani yang berdiam di desa-desa tertentu.
Berapa probabilitas penerbit akan menerima kembali surat
permintaan berlangganan sebanyak 5 dari masing-masing desa
yang bersangkutan ?

Jawab :
n = 50
p = 1/100
 = n.p = 50 (1/100) = ½
x=5
           x     e-         (1/2)5  (e-1/2)
f(x) =  = 
               x!                5!
           (1/32)  (e-1/2)
        =  = (1/3840) (0.6066) = 0.00016
                 120

Bila dihitung menggunakan Distribusi Binomial :

P(S=x) = Cn,x . px . qn-x

            = C50,5 (1/100)5 (99/100)45 = 0.00013

Teorema :
Bagi distribusi Poisson yang dinyatakan dengan rumus :
                x     e-
P(S=x) =  ,
                   x!    
rata-rata (mean) dari variansnya dapat diberikan sebagai
berikut :
 = n.p = σ 2
  = rata-rata (mean)
σ 2 = varians
Deviasi standar adalah akar dari varians :

σ = √   = √ n.p

Penyelarasan distribusi Poisson


pada distribusi-distribusi frekuensi
sampling
Bila parameter n dan p diketahui   = n.p mudah dihitung.
Pada persoalan dimana  atau n.p tidak diketahui, maka nilainya
harus ditaksir secara eksperimen. Dalam hal ini kita harus
memperoleh distribusi frekuensi nilai-nilai x hasil pengukuran
sampling kemudian menyelaraskan distribsui Poisson pada
distribusi frekuensi relatifnya dengan mempersamakan x pada
distribusi sampling dengan  pada distribusi Poisson.
x (distribusi sampling) =  (distribusi Poisson)

Contoh Soal :
Sebuah perusahaan import nasional telah melakukan sampling
terhadap kiriman beras dari luar negeri. Sampel terdiri dari 1
kg beras guna memeriksa jumlah butiran kerikil yang terdapat
dalam beras kiriman tersebut. Telah dilakukan pengambilan 50
sampel yang terdiri dari 1 kg beras dipilih secara random dan
jumlah butiran kerikil yang terdapat didalamnya ditabelkan
sebagai betikut :

X frekuensi        x = jumlah butiran kerikil


0 42
1 3
2 0
3 4
4 1

a.     Buat distribusi Poissonnya


b.     Gambarkan grafiknya
c.      Carilah rata-rata dan deviasi standarnya

Jawab :

              xi fi          (0x42) + (1x3) + (2x0) + (3x4) + (4x1)


a.  x =  = 
               fi                           (42+3+0+4+1)       
        =  19/50 = 0,38 = 

     Distribusi Poisson yang telah diselaraskan :


                     (0,38)x     e-0,38
     P(S=x) =  
                            x!    

X P(S=x)
0 0,68386
1 0,25987
2 0,04937
3 0,00625
4 0,00059

b.
             

c.      Rata-rata : x = 0,38 = 

Deviasi standar : σ = √    = √ 0,38 = 0,62


Notasi dasar Statistika

 xi              xi 2            (  xi )2             (xi 
- x )2     

 xi yi                xi2 yi           (xi yi)2         ( xi yi 
)2     

xi = 2, 3, 5, 6. 4
yi = 5, 6, 3, 2, 1

xi yi xi 2 xi – x (xi - xi yi (xi yi)2 xi2 yi


x )2
2 5 4 -2 4 10 100 20
3 6 9 -1 1 18 324 54
5 3 25 1 1 15 225 75
6 2 36 2 4 12 144 72
4 1 16 0 0 4 16 16

20 17 90 0 10 59 809 237

            xi           20
   x =  =  = 4
            n          5

Soal :
Diketahui :
xi = 3, 3, 7, 6, 4, 2
yi = 11, 4, 3, 2, 3, 9
Hitung :
 xi              xi 2            (  xi )2             (xi - x )2     
 xi yi                xi2 yi           (xi yi)2         ( xi yi )2     

         xi2 yi   -  (xi yi)2
a = 
              ( xi yi )2
Tugas :
 Pelajari lebih lanjut dari  buku-buku referensi :
 Distribusi t (t Test)
 Distribusi F (F Test)
 Distribusi Chi-Kuadrat (Chi-Square Test)
 Perhatikan penjelasan Dosen di kelas

Distribusi Poisson

Distribusi Binomial (yang telah dipelajari terdahulu)


memiliki peranan yang penting dalam analisis statistik.

Bila : n besar sekali (n>50)


          p kecil sekali (p<1/10)

Maka perhitungan P(S=x) pada Distribusi Binomial sulit


dilakukan.
Hasil perkalian n.p menjadi moderat

Misal : n=100
            p=1/100     
            x=4                  
                       
 P ( S = x ) =  Cn,x  px  qn-x    
            = (C100,4) (1/100)4 (99/100)96      ←   sulit dihitung

Dalam hal demikian, pemecahan P(S=x) akan lebih mudah


diperoleh dengan menggunakan pendekatan Poisson (Poisson
Approximation). Bila kita tulis n.p= , maka distribusi Poisson
yang approksimatif tersebut dapat diberikan sebagai berikut :

           x   e-
f(x) =               ( e = 2,71828 )
    x !
e merupakan nilai batas dari (1+1/k)k
Bila k   maka hasilnya dapat dinyatakan sebagai :
e = 1 + (1/1!) + (1/2!) + (1/3!) + .................

Penurunan rumus fungsi Poisson :


Pada distribusi Binomial :
             
P(S=x) =  Cn,x . px . qn-x
   
           n!
             =  px (1-p)n-x  .................................... (1)
        x! (n-x)!
                                             n (n-1) (n-2) ....(n-x+1)
Cn,x  dapat ditulis sebagai : 
                                                        x!
maka rumus (1) dapat ditulis :

                n (n-1) (n-2) ....(n-x+1)


P(S=x) =  px (1- p)n-x  ....................... (2)
                               x!
Bila :  = n.p  p = /n, maka rumus (2) menjadi :

                n (n-1) (n-2) ....(n-x+1)


P(S=x) =  (/n)x (1- /n )n-x  , sehingga :
                              x!

                n    (n-1)   (n-2)       (n-x+1)   x
P(S=x) =  .  .  ...... .  . (1- /n )n . (1- /n )-x
                n      n         n              n         x!

Bila kita mengkonstantir x dan , dan bila n  , maka setiap


suku
  n    (n-1)   (n-2)          (n-x+1) 
  ,  ,  , .....,   dan (1- /n )-x
  n      n         n                  n        

akan memiliki nilai sama dengan 1 sebagai nilai batas.

Alhasil kita akan memperoleh :


                x
P(S=x) =   (1- /n )n
                x!
Kita tulis : (1- /n )n =  (1- /n )n/  

Bila : n/ = k, maka  (1- /n )n/    =  (1- 1/k )k  


Bila n >>  k >> dan  (1- 1/k )k  akan memiliki nilai e-1 sebagai
nilai batasnya.
Jadi :
                x
P(S=x) =   (1- /n ) n
               x!
                x                          x
            =   ( e-1 )   =   ( e- )
                x!                  x!
                x     e-
            = 
                   x!    

Bila n diperbesar sehingga   dan n.p =  tertentu, maka p


harus  0        

Distribusi Poisson :
                  x  . e-
P(S=x)  =  
                     x!    
merupakan suatu pendekatan bagi distribusi binomial yang n-
nya besar dan p-nya kecil.

Teorema :
Bila P(S=x) = Cn,x  . px  . (1- p)n-x dimana x = 0, 1, 2, ...... , n dan
bila p relatif kecil dibandingkan dengan n, maka :
                x  . e-
P(S=x) = 
                   x!    

Contoh soal:
Menurut data statistik, rata-rata seorang dari 100 petani yang
berdiam di desa-desa  di Indonesia akan meminta berlangganan
majalah “Cara Bercocok Tanam”. Penerbit majalah tersebut
mengadakan sales promotion dengan jalan mengirim masing-
masing 50 surat untuk berlangganan yang telah dibubuhi
perangko kepada petani yang berdiam di desa-desa tertentu.
Berapa probabilitas penerbit akan menerima kembali surat
permintaan berlangganan sebanyak 5 dari masing-masing desa
yang bersangkutan ?

Jawab :
n = 50
p = 1/100
 = n.p = 50 (1/100) = ½
x=5
           x     e-         (1/2)5  (e-1/2)
f(x) =  = 
               x!                5!
           (1/32)  (e-1/2)
        =  = (1/3840) (0.6066) = 0.00016
                 120

Bila dihitung menggunakan Distribusi Binomial :


P(S=x) = Cn,x . px . qn-x

            = C50,5 (1/100)5 (99/100)45 = 0.00013

Teorema :

Bagi distribusi Poisson yang dinyatakan dengan rumus :


                x     e-
P(S=x) =  ,
                   x!    
rata-rata (mean) dari variansnya dapat diberikan sebagai
berikut :
 = n.p = σ 2
  = rata-rata (mean)
σ 2 = varians
Deviasi standar adalah akar dari varians :

σ = √   = √ n.p

Soal :
Suatu obat baru diperkirakan dapat menurunkan kadar glukosa
darah (untuk menyembuhkan penyakit diabetes). Untuk
meneliti ini dipakai hewan percobaan yang sebagian diberi obat
tersebut dan sebagian tidak diberi (sebagai kontrol). Kemudian
kadar glukosa dalam darah hewan tadi ditentukan, dengan hasil
sebagai berikut :

Hewan kontrol ( mg/mL ) Hewan yang diberi obat ( mg/mL )


2,22 1,69
1,92 2,02
1,78 1,71
2,04 2,04
2,15 1,50
1,98 1,83
2,05 1,69

Pertanyaan : Apakah obat baru tersebut berkhasiat sebagai


obat yang dapat menurunkan kadar glukosa darah ?
Distribus F ( F Test)

Bila kita ingin membandingkan nilai rata-rata dua kelompok seri


hasil pengamatan digunakan uji t (t Test)
Ada kalanya kita ingin membandingkan variansi / keragaman
kedua kelompok seri hasil pengamatan  untuk ini digunakan
uji F (diciptakan oleh R.A. Fisher). Uji F ini dikenal pula dengan
nama ANOVA (Analysis of Variance).

Untuk melakukan uji F, kita harus menghitung angka banding


kedua variansi yang bersangkutan.
Dalam hal ini variansi (S 2) yang besar ditaruh pada pembilang
(numerator) dan variansi (S2) yang kecil ditaruh pada penyebut
(denominator), seperti terlihat pada rumus dibawah ini :

        S12 (besar)                                                ( xi -   ) 


2
            
F =                     Ingat : S2 = 
        S22 (kecil)                                                     N - 1

Kemudian dibandingkan antara F hasil hitungan dengan F dari tabel


(pada  dan df tertentu kelompok 1 dan 2).

Apabila F hitung < F tabel  maka hipotesa nol benar, artinya tidak


ada perbedaan yang nyata dalam hal variansi / keragaman
antara kedua kelompok pengukuran tersebut.
Sebaliknya, bila F hitung > F hitung l  maka hipotesa nol salah,
artinya ada perbedaa yang nyata dalam hal variansi /
keragaman antara kedua kelompok pengukuran tersebut.

Catatan : Simak penjelasan dosen tentang cara pembacaan Tabel


Distribusi F.

Contoh soal :
Suatu pengukuran analisis dilakukan dengan metode A dan
metode B, dengan hasil sbb :

Metode A Metode B
95.6 93.3
94.9 92.1
96.2 94.7
95.1 90.1
95.8 95.6
96.3 90.0
94.7

Ditanyakan : dengan metode ANOVA (F Test) apakah ada


perbedaan yang nyata dalam hal variansi (pada  = 0.01 ) antara
ke 2 metode diatas ?

Jawab :
Setelah dihitung maka didapat (simak penjelasan Dosen) :

  
A = 95.65                   NA  =  6       SA2  = 0.323          dfA  = 6
–1=5
= 92.93          NB  =  7       SB2  = 5.14            dfB  = 7 – 1 = 6
B  

                 SB2       5.14

F hitung =  =  = 15,9
                 SA2       0.324

Dari tabel (pada  = 0.01 & dfB  = 6 dan dfA  = 5 ) didapat :


F tabel = 10,67
Karena F hitung (15,9) F tabel (10,67) maka hipotesis nol salah,
artinya ada perbedaan dalam hal variansi antara metode A dan
metode B tersebut.
Soal :
      Pada suatu test kecerdasan (IQ Test) di suatu SMU di
Serpong dilakukan pengujian 
     terhadap 12 siswa wanita dan 10 siswa pria dengan hasil
sebagai berikut :

Wanita Hasil Test Pria Nilai


1 108 1 118
2 104 2 110
3 118 3 112
4 107 4 116
5 104 5 111
6 120 6 118
7 109 7 112
8 105 8 116
9 106 9 119
10 118 10 116
11 104
12 112

a. Berdasarkan “T Test” (pada α = 0.01) apakah ada perbedaan


yang signifikan antara kecerdasan rata-rata kelompok pria dan
wanita ?
b. Berdasarkan “F Test” (Analysis of Variance, ANOVA pada α =
0.01) apakah ada perbedaan yang signifikan dalam hal variansi
antara kecerdasan kelompok pria dan wanita pada SMU
tersebut ?
UJI KHI KUADRAT ( 2 )

Uji t dan Uji F   mengenai populasi yang tersebar normal


Uji 2  cara analisis statistika tanpa anggapan bahwa populasi
yang dihadapi
                tersebar normal  (cara non-parametrik).

Pada Uji 2 ini kita membandingkan suatu perangkat nilai yang


diperoleh dari eksperimen (data pengamatan) dengan nilai yang
kita harapkan.
Nilai 2 yang dihitung dibandingkan dengan nilai 2 dari tabel
(pada  dan df tertentu).

0,99 ….. 0,05 ….. 0,01

           P

    DB
1 ….. ….. ….. ….. …..
2 ….. ….. ….. ….. …..
… ….. ….. ….. ….. …..

df = (jumlah baris – 1) (jumlah kolom – 1)

Bila : 2 hitung > 2 tabel  ada perbedaan yang nyata


(signifikan)
          2 hitung < 2 tabel  tidak ada perbedaan yang nyata
(tidak signifikan)
Rumus dasar :

                       ( O – E )2
     2 =         
                           E
O = Observed Value (Nilai pengamatan)
E = Expected Value (Nilai yang diharapkan)

Contoh permasalahan :
Untuk menyelidiki apakah kafein dapat menyebabkan orang
sukar tidur, maka diberikan obat kepada 72 orang, tanpa
mereka mengetahui bahan yang diberikan itu mengandung
kafein. Disamping itu sebagai kontrol diberikan "plasebo"
kepada 73 orang, sesuatu yang sebenarnya tidak mengandung
kafein. Penggunaan "plasebo" dimaksudkan untuk menghindari
efek psikologi.

Data pengamatan ditabelkan sebagai berikut :

Sukar tidur Mudah tidur


Jumlah
Plasebo 8 65 73
Kafein 30 42 72
Jumlah 38 107 145

Pertanyaan : Apakah benar kafein menyebabkan orang sukar


tidur ?
Persoalan ini dapat dipecahkan dengan Uji Khi Kuadrat (Uji 2),
artinya apakah perbedaan ini memang nyata (signifikan).

Secara umum tabel untuk Uji 2 :

Reaksi  Reaksi 
Jumlah
Kelompok I a b a+b
Kelompok II c d c+d
Jumlah a+c b+d a+b+c+d

O (Observed Value, Nilai pengamatan) dapat dilihat langsung


dari data pengamatan.
E (Expected Value, Nilai yang diharapkan) untuk tiap-tiap sel
didasarkan anggapan bahwa antara Kelompok I dan Kelompok
II tidak ada perbedaan yang nyata (Hipotesis nol).

Nilai yang diharapkan (E) untuk tiap-tiap sel adalah sebagai


berikut :

Sel Nilai yang Rumus


diharapkan
A Ea            (a+c) x (a+b)       
   Ea = 
            (a+b+c+d)              

B Eb            (a+b) x (b+d)       
   Eb = 
            (a+b+c+d)              

C Ec            (a+c) x (c+d)       
   Ec = 
            (a+b+c+d)              

D Ed            (c+d) x (b+d)       
   Ea = 
            (a+b+c+d)              

Untuk data dari eksperimen diatas, O dapat dibuat tabel


sebagi berikut :

Sukar tidur Mudah tidur


Jumlah
Plasebo 8 65 73
(a) (b) (a+b)
Kafein 30 42 72
(c) (d) (c+d)
Jumlah 38 107 145
(a+c) (b+d) (a+b+c+d)
E untuk tiap-tiap sel :

Sel
Nilai yang diharapkan
(a+c) x (a+b)        38  x 73
a    Ea =  =  = 19,13
(a+b+c+d)                145

(a+b) x (b+d)       73 x 107


b       Eb =  =  = 53,87
(a+b+c+d)                145

(a+c) x (c+d)       38 x 72
c     Ec =  =  = 18,87
(a+b+c+d)                145

(c+d) x (b+d)        72 x 107


d      Ed =  =  = 53,13
(a+b+c+d)                145

Nilai yang diharapkan (Ea, Eb, Ec dan Ed) dimasukkan kedalam


Tabel sebagai berikut :
         

Sukar tidur Mudah tidur


Jumlah
Plasebo 19,13 53,87 73
Kafein 18,87 53,13 72
Jumlah 38 107 145

2 dapat dihitung dengan rumus :

                       ( O – E )2
     2 =         
                           E

O = Observed value (nilai pengamatan)


E = Expected value (nilai yang diharapkan)

                     (8-19,13)2        (65-53,87)2           (30-18,87)2             (42
-53,13)2
2 hitung
=  +  +  + 
                       19,13                53,87                18,87                  
53,13
                = 6,48 + 2,30 + 6,56 + 2,33 = 17,67

Dari tabel, pada  = 0,05 dan df = (2-1) (2-1) =1 didapat :


2 tabel = 3,84

2 hitung (17,67) > 2 tabel (3,84)  berarti antara Kelompok I


(Plasebo) dan Kelompok II (Kafein) ada perbedaan yang nyata
(signifikan). Jadi dapat dikatakan bahwa kafein secara nyata
(signifikan) menghambat rasa ngantuk (membuat sukar tidur).

Soal 1 :
Pada sebuah pabrik kacamata, pekerja produksi dibagi dalam 3 shift
setiap hari. Kacamata yang diproduksi masing-masing shift dalam
satu bulan dicatat berapa buah yang baik dan cacat, didapat data
sebagai berikut :

Shift 1 : terdapat 5 kacamata yang cacat dari 100 yang diproduksi


Shift 2 : terdapat 80 kacamata yang baik dari 90 yang diproduksi
Shift 3 : terdapat 8 kacamata yang cacat dan 85 kacamata yang
baik

Berdasarkan uji khi-kuadrat (pada level of significance 0.01) apakah


ada perbedaan yang nyata (signifikan) antara ketiga shift pekerja
diatas terhadap hasil kacamata yang diproduksi !
Soal 2 :
Pada sebuah pabrik pakaian (garment), pekerja produksi dibagi
dalam 4 shift setiap hari. Pakaian yang diproduksi masing-masing
shift dalam satu bulan terakhir dicatat berapa buah yang baik dan
cacat, didapat data sebagai berikut :

Shift pagi       : terdapat 114 pakaian yang baik dari 118


yang diproduksi
Shift siang     : terdapat 5 pakaian yang cacat dan 110 pakaian yang
baik
Shift sore       : terdapat 6 pakaian yang cacat dari 116 pakaian yang
diproduksi
Shift malam   : terdapat 10 pakaian yang baik dan 15 pakaian yang
cacat

Berdasarkan “Chi-Square Test” apakah ada perbedaan yang


signifikan antara ke-empat shift pekerja diatas terhadap hasil
pakaian yang diproduksi !
REGRESI

Perubahan nilai suatu variabel tidak selalu terjadi dengan


sendirinya, namun perubahan nilai variabel itu disebabkan oleh
berubahnya variabel lain yang berhubungan dengan variabel
tersebut.

y= f(x)  jika nilai x berubah, maka nilai y juga akan berubah

y = variabel dependen  nilainya tergantung dari nilai variabel


lain
x = variabel independen  nilainya tak tergantung dari nilai
variabel lain

Bentuk hubungan antara 2 variabel :


-         searah (direct relationship)  artinya perubahan nilai yang
satu dengan nilai yang lain adalah searah
-         berlawanan arah (inverse relationship)  artinya perubahan
nilai yang satu dengan nilai yang lain adalah berlawanan arah

Misal :
-         Bila promosi (x) meningkat  nilai penjualan (y) akan
meningkat
     Bila promosi (x) berkurang  nilai penjualan (y) akan
menurun

-         Bila harga barang naik


(q) naik  jumlah
barang yang diminta
(p) akan berkurang
     Bila harga barang naik
(q) turun  jumlah barang yang diminta (p) akan
                                                              bertambah

Analisis Korelasi :
adalah alat statistik yang
dapat digunakan untuk
mengetahui derajat
hubungan linier antara
suatu variabel dengan variabel lain.
Ukuran statistik yang dapat menggambarkan hubungan linier
antara suatu variabel dengan variabel lain adalah Koefisien
Determinasi (r2) dan Koefisien Korelasi (r).  

y = nilai penjualan dan x =


biaya promosi
y = f(x) = a + bx

Bila r2 = 0,74 atau r2 = 74


%, artinya : besarnya pengaruh variabel independen (x)
terhadap variabel dependen (y) yang dapat dijelaskan oleh
garis regresi adalah 74 % dan sisanya pengaruh yang tidak
dapat dijelaskan oleh garis regresi tersebut.
Dengan kata lain : perubahan nilai penjualan (y) adalah 74 %
dipengaruhi oleh biaya promosi (x) dan sisanya sebesar 26 %
dipengaruhi oleh faktor lain selain biaya promosi.
Koefisien Korelasi (linier) : sebagai ukuran hubungan
(korelasi) linier antara 2 peubah x dan y, dan dilambangkan
dengan r.

Nilai r terletak antara : -1 < r < +1

 Bila titik-titik pengamatan ( data ) mengikuti sebuah garis lurus


dengan kemiringan +  maka ada korelasi positif antara kedua
peubah.

Bila r = +1  artinya semua titik


pengamatan tepat berada pada suatu
garis lurus dengan kemiringan +

 Bila titik-titik pengamatan ( data ) mengikuti sebuah garis lurus


dengan kemiringan -  maka ada korelasi negatif antara kedua
peubah.

Bila r = -1  artinya semua titik


pengamatan tepat berada pada
suatu garis lurus dengan
kemiringan -

Bila r mendekati nol  korelasi linier antara kedua peubah ( x


dan y ) sangat lemah atau mungkin tidak ada hubungan linier
sama sekali.

Untuk memastikan apakah ada korelasi linier antara kedua


peubah, maka r hasil hitungan dibandingkan dengan r tabel
( pada P tertentu ).
Bila  r hitung  > r tabel  berarti ada korelasi linier antara
kedua peubah

Soal :
      Pada suatu percobaan membuat senyawa baru (X) di salah satu
laboratorium di lingkungan DEP.PERINDUSTRIAN, dilakukan dengan
menjalankan percobaan tersebut pada berbagai suhu. Diperoleh
data sebagai berikut :

Suhu ( C ) Senyawa X yang terbentuk ( g )


40 5.6
50 6.6
60 7.5
70 8.6
80 9.1

a.      Persamaan regresi linier dapat dinyatakan dengan : y = a x + b. Apa


artinya nilai a dan b tersebut ?
b.      Pada kumpulan data di atas, apakah ada korelasi linier antara
senyawa X yang terbentuk dan suhu pada percobaan diatas?
c.      Bila ada korelasi linier :  tentukan garis regresinya dan perkirakan
senyawa X yang terbentuk bila percobaan dilakukan pada suhu 56 C
!
d.      Berapa persen pengaruh suhu terhadap pembentukan senyawa X
yang dapat dijelaskan oleh garis regresi ?
(Simak penjelasan Dosen di Kelas)

                                      Distribusi Normal

Distribusi normal merupakan distribusi teoritis dari


variabel random yang kontinu. Distribusi normal sering
dinamakan distribusi GAUSS. Secara praktis, sebagian besar
dari variabel random yang kontinu di berbagai bidang aplikasi
pada umumnya memiliki distribusi yang dapat didekati dengan
distribusi normal atau dapat menggunakannya sebagai model.
Distribusi normal merupakan distribusi yang simetris
berbentuk genta dan kontinu serta memiliki fungsi :

                             
f(x) =  e

Fungsi di atas juga dinamakan fungsi kepadatan normal (normal


density function). Dari rumus diatas terlihat, distribusi normal
tergantung pada 2 parameter yaitu :  (rata-rata)
dan      (varians).
Fungsi kepadatan normal sering dinyatakan sebagai :

n (x,    ) = f(x) =  e

Dengan demikian, suatu distribusi normal dapat dibedakan dari


distribusi normal lainnya atas dasar perbedaan rata-ratanya
dan atau variansnya.

Jika  tertentu  (tanpa melihat   )  maka akan diperoleh


serangkaian distribusi normal yang memiliki rata-rata yang
sama dengan varians yang berbeda.
 

Jika     tertentu (tanpa melihat )  maka akan diperoleh


serangkaian distribusi normal yang memiliki bentuk yang sama
dengan lokasi yang berbeda sepanjang sumbu x.

 
Karena distribusinya kontinu, cara menghitung probabilitasnya
dilakukan dengan jalan menentukan luas di bawah kurvanya.
Tapi fungsi frekuensi normal ini tak memiliki integral yang
sederhana sehingga probabilitas umumnya dihitung dengan
menggunakan distribusi normal standar dimana variabel
randomnya ialah z dengan  = 0 dan    = 1.

Definisi :
Bila z merupakan variabel random yang kemungkinan harga-
harganya menyatakan bilangan-bilangan riil antara - dan +,
maka z dinamakan variabel normal standar bila dan hanya bila
probabilitas interval dari a ke b menyatakan luas dari a ke b
antara sumbu z, dan kurva normal dari persamaannya diberikan
sebagai :

f(z) =  e                           dinamakan fungsi kepadatan


                                                        normal standar

     f(z) dz =1

z = 0  f(z) maksimal = 0,399


 

Probabilitas z yang merupakan nilai pada interval antara z = a


hingga z = b sama dengan luas yang dibatasi oleh kurva
normalnya, sumbu z dan garis vertikal z = a dan z = b.

Luas kurva normal A(z) dilakukan dengan bantuan tabel.

Contoh Soal :
Berapa probabilitas variabel random normal yang standar
merupakan nilai
antara:                                                                                       
                                                         
a.     0 dan 1
b.     -1 dan 2
c.      1 dan 2

Jawab :

(Simak penjelasan Dosen di Kelas)

Pada hakekatnya kurva normal merupakan keluarga kurva


normal yang dapat memiliki rata-rata () dan varians (σ2) yang
berbeda dan tidak usah  = 0 dan σ2 = 1 seperti halnya kurva
normal standar.
Luas kurva normal dengan  dan σ2 yang berbeda dapat dicari
dengan mengubah variabel random x ke variabel random z.
         x -  
 z = 
            σ

Soal :
Bila x merupakan variabel random yang memiliki distribusi
normal dengan rata-rata  = 24 dan deviasi standar (σ)  =12,
berapa probabilitas 17,4 ≤ x ≤ 58,8 ?

Jawab :

(Simak penjelasan Dosen di Kelas)

Soal :
Nilai ujian fisika dasar mahasiswa tingkat 1 memiliki nilai rata-
rata () = 65 dan deviasi standar (σ) = 11. Distribusi nilai ujian
tersebut menyerupai distribusi normal.
a.     Jika batas nilai lulus adalah  ≥ 55, berapa persen mahasiswa
yang diperkirakan tidak lulus ?
b.     Jika kita menginginkan mahasiswa yang lulus sekitar 90 %,
berapa batas minimum nilai lulus yang harus diberikan ?

Jawab :

(Simak penjelasan Dosen di Kelas)

Soal :
(Gunakan Tabel luas kurva normal standar)

1.   Nilai ujian kimia dasar mahasiswa tingkat 1 memiliki nilai rata-


rata () = 66 dan deviasi standar (σ) = 11. Distribusi nilai-nilai
ujian tersebut menyerupai distribusi normal.
a.    Jika batas nilai lulus adalah ≥ 60, berapa persen mahasiswa
yang diperkira-kan tidak lulus ?
b.   Jika diinginkan bahwa mahasiswa yang lulus sekitar 85 %,
berapa batas nilai minimum nilai lulus yang harus diberikan ?

2.   Dalam suatu tes kecerdasan (IQ test) murid SMU di Serpong


didapatkan hasil rata-rata kuosien kecerdasan 105 dan deviasi
strandar 10. Distribusi hasil IQ test ini mengikuti distribusi
normal. Berapa persen siwa diatas yang memiliki kuosien
kecerdasan antara 100 dan 110 ?

3.   Perusahaan Lampu OSRAM menghasilkan bola lampu jenis


tertentu yang umurnya (life time) berdistribusi normal dengan
rata-rata (mean) 750 jam dan simpangan baku (standard
deviation) 80 jam. Hitunglah (dan gambarkan kurva grafiknya)
probabilitas suatu bola lampu :
a.     Dapat menyala antara 730 dan 850 jam.
b.     Dapat menyala lebih dari 810 jam.
c.      Dapat menyala antara 790 dan 870 jam.
d.     Dapat menyala kurang dari 790 jam.
e.      Dapat menyala lebih dari 700 jam.

Uji hipotesis adalah metode pengambilan keputusan yang didasarkan


dari analisis data, baik dari percobaan yang terkontrol, maupun
dari observasi (tidak terkontrol). Dalam statistik sebuah hasil bisa
dikatakan signifikan secara statistik jika kejadian tersebut hampir tidak
mungkin disebabkan oleh faktor yang kebetulan, sesuai dengan
batas probabilitas yang sudah ditentukan sebelumnya.[1]

Uji hipotesis kadang disebut juga "konfirmasi analisis data". Keputusan


dari uji hipotesis hampir selalu dibuat berdasarkan pengujian hipotesis
nol. Ini adalah pengujian untuk menjawab pertanyaan yang
mengasumsikan hipotesis nol adalah benar.[2]

Daerah kritis (bahasa Inggris: critical region) dari uji hipotesis adalah


serangkaian hasil yang bisa menolak hipotesis nol, untuk menerima
hipotesis alternatif. Daerah kritis ini biasanya disimbolkan dengan huruf
C.

Definisi berikut diambil dari buku karangan Lehmann dan Romano:[3]

Hipotesis statistik
Sebuah pernyataan tentang parameter yang menjelaskan
sebuah populasi (bukan sampel).
Statistik
Angka yang dihitung dari sekumpulan sampel.
Hipotesis nol (H0)
Sebuah hipotesis yang berlawanan dengan teori yang akan
dibuktikan.
Hipotesis alternatif (H1) atau hipotesis kerja (Ha)
Sebuah hipotesis (kadang gabungan) yang berhubungan dengan
teori yang akan dibuktikan.
Tes Statistik
Sebuah prosedur yang masukannya adalah sampel dan hasilnya
adalah hipotesis.

Daerah penerimaan
Nilai dari tes statistik yang menggagalkan untuk penolakan
hipotesis nol.
Daerah penolakan
Nilai dari tes statistik untuk penolakan hipotesis nol.
Kekuatan Statistik (1 − β)
Probabilitas kebenaran pada saat menolak hipotesis nol.
Tingkat signifikan test (α)
Probabilitas kesalahan pada saat menolak hipotesis nol.
Nilai P (P-value)
Probabilitas, mengasumsikan hipotesis nol benar.

Interpretasi[sunting | sunting
sumber]

Jika nilai p lebih kecil dari tingkat


signifikan tes yang diharapkan, maka
hipotesis nol bisa ditolak. Jika nilai p
tidak lebih kecil dari tingkat signifikan
tes yang diharapkan bisa disimpulkan
bahwa tidak cukup bukti untuk
menolak hipotesa nol, dan bisa
disimpulkan bahwa hipotesa alternatif
yang benar.

Prosedur uji hipotesis]


1. Tentukan parameter yang akan
diuji
2. Tentukan Hipotesis nol (H0)
3. Tentukan Hipotesis
alternatif (H1)
4. Tentukan (α)
5. Pilih statistik yang tepat
6. Tentukan daerah penolakan
7. Hitung statistik uji
8. Putuskan apakah Hipotesis
nol (H0) ditolak atau tidak

Contoh uji hipotesis


Seorang yang dituduh pencuri
dihadapkan kepada seorang hakim.
Seorang hakim akan menganggap
orang tersebut tidak bersalah, sampai
kesalahannya bisa dibuktikan.
Seorang jaksa akan berusaha
membuktikan kesalahan orang
tersebut.

Dalam kasus ini, hipotesis nol (H0)


adalah: "Orang tersebut tidak
bersalah", dan hipotesis alternatif (H1)
adalah: "Orang tersebut bersalah".
Hipotesis alternatif (H1) inilah yang
akan dibuktikan.

Ada dua kondisi yang mungkin terjadi


terhadap orang tersebut:

1. Orang tersebut tidak bersalah.


2. Orang tersebut bersalah.
Dan ada dua keputusan yang bisa
diambil hakim:

1. Melepaskan orang tersebut.


2. Memenjarakan orang tersebut.

Hipotesis
Hipotesis
nol (H0)
alternatif
benar
(H1) benar
(Orang
(Orang
tersebut
tersebut
tidak
bersalah)
bersalah)

Menerima
Keputusan
hipotesis nol
Keputusan yang salah
(Orang
yang benar (Kesalahan
tersebut
Tipe II)
dibebaskan)

Menolak
Keputusan
hipotesis nol
yang salah Keputusan
(Orang
(Kesalahan yang benar.
tersebut
Tipe I)
dipenjara)

Dalam kasus ini, ada dua


kemungkinan kesalahan yang
dilakukan hakim:

1. Memenjarakan orang yang


benar (Kesalahan Tipe I)
2. Melepaskan orang yang
bersalah (Kesalahan Tipe II)

Rumus[
Ada banyak jenis uji hipotesis yang
dikenal. Tabel berikut menjelaskan
rumus untuk masing-masing uji
hipotesis tersebut.

Asumsi /
Nama Rumus
Catatan

(Populasi
normal atau n 
> 30) dan σ
diketahui.

(z adalah jarak
dari rata-rata
sehubungan
dengan simpa
Satu ngan
sampel z baku rata-
-test rata).
(En=One Untuk distribu
-sample si non-
z-test) normal memu
ngkinkan
untuk
dihitung
proporsi
terkecil dalam
sebuahpopula
si yang berada
di
dalam k simpa
ngan baku
untuk setiap k.

Dua Populasi
sampel normal dan o
z-test bservasi
(En=Two independen d
-sample an σ1 dn
z-test) σ2 diketahui
Satu
(Populasi
sampel t-
normal atau n 
test
> 30) dan   
(En=One
tidak
-sample
diketahui
t-test)
(Populasi
Pasangan normal dari
t-test perbedaan ata
(En=Pair u n >
ed t-test) 30) dan   tid
ak diktahui
Dua
sampel t- (Populasi
test normal atau n
digabung 1 + n2 > 40) d
(En=Two an observasi
-sample independen d
pooled t- an σ1 =
test) σ2 idak
varians y [4] diketahui
ang sama

Dua
sampel t-
(Populasi
test
normal atau n
terpisah
1 + n2 > 40) d
(En=Two
an observasi
-sample
independen d
unpooled
an kedua σ1 ≠
t-test)
σ2 diketahui
varians ti
[4]
dak sama

Satu
proporsi 
z-test n .p0 >
(En=One 10 dan n (1 − 
- p0) > 10.
proportio
n z-test)
Dua
proporsi n1 p1 >
z-test 5 dan n1(1 − p
(En=Two 1) >
- 5 dan n2 p2 > 
proportio 5 dan n2(1 − p
n z-test) 2) >
  5 dan observa
digabung si independen.
kan
Dua
proporsi
n1 p1 >
z-test
5 dan n1(1 − p
(En=Two
1) >
-
5 dan n2 p2 > 
proportio
5 dan n2(1 − p
n z-
2) >
test) 
5 dan observa
si independen.
tidak
digabung
Chi-
squared
Populasi
test
normal
untuk
varians
Chi- df = k - 1 - #
squared parameter
test terestimasi
untuk • Semua
goodness jumlah yang
of fit diharapkan
paling tidak 5.
[5]

• Semua
jumlah yang
diharapkan
> 1 dan tidak
lebih dari
20% dari
jumlah yang
diharapkan
lebih kecil
dari 5[6]

Dua
sampel F
test untu Populasi
k normal
persamaa
Diurutkan   
nvarians
(En=Two >   dan
-sample H0 ditolak
F test for jika 
equality
[7]
of
variances
)
Definisi simbol:
  = Varia   = x/n 
 , cs sampel =
probabil   = Propors
itas Simpanga i
melakuk n baku sampel,
an sampe 1 (kecuali
kesalaha   = ditentuk
n tipe I Simpanga an
(menola n baku sebelu
k sampe 2 mnya)
hipotesis   = t   =
nol pada statistik Dugaan
saat propors
hipotesis   = deraj
at i
nol populas
benar) kebebasan 
(En=Degr i
  =   =
ee of
Jumlah propors
freedom)
sampel i1
  = Rata-
  =   =
rata
Jumlah propors
perbedaan
sampel i2
sampel
1
  =   =
  = Dugaan
Jumlah Dugaan
rata-rata perbeda
sampel
2 perbedaan an
  = populasi propors
Rata-   = i
rata Simpanga 
sampel n baku  
  = perbedaan =
Dugaan   = Chi- minimu
rata-rata squared m
populasi statistik of n1 an
  = d n2
Rata- 
rata
populasi 
1
  =   = F
Rata- statistik
rata
populasi
2
  = Sim
pangan
baku po
pulasi
  = Va
rians po
pulasi
  = Sim
pangan
baku sa
mpel

  =
Penjuml
ahan(dar
i angka
sejumla
k k)

Referensi[sunting | sunting sumber]
1. ^ R. A. Fisher (1925). Statistical
Methods for Research Workers,
Edinburgh: Oliver and Boyd,
1925, p.43.
2. ^ Cramer, Duncan; Dennis Howitt
(2004). The Sage Dictionary of
Statistics.
p. 76. ISBN 076194138X.
3. ^ Lehmann, E.L.; Romano,
Joseph P. (2005). Testing
Statistical Hypotheses (3E ed.).
New York:
4. ^ Weiss, Neil A.
(1999). Introductory Statistics (5th
ed.). p. 802. ISBN 0-201-59877-9

Perbedaan p-value dengan alpha

Dalam proses penelitian, nilai alpha ditentukan sebelum nilai p-value


diketahui. Berdasarkan konvensi, nilai alpha yang biasa digunakan adalah
sebesar 0,05. Nilai alpha yang kecil menunjukkan semakin ketatnya aturan
dalam suatu penelitian.  Nilaialpha menunjukkan seberapa ekstrim suatu
data seharusnya (data ideal), sehingga  dapat menunjukkan adanya
perbedaan dengan data lainnya (tolak H0).

Setelah nilai alpha ditentukan, maka nilai statistik (misal r) ditentukan.


Masing-masing nilai statistik memiliki tingkat probabilita tertentu yang disebut
p-value. Nilai p-value menunjukkan seberapa ekstrim data yang kita temui di
lapangan (data aktual).

Peneliti membandingkan nilai alpha dengan nilai p-value untuk mengetahui


apakah data yang diobservasi berbeda secara signifikan dibandingkan
dengan apa yang ditetapkan dalam hipotesis nol (null hypothesis). Jika nilai
p-value lebih kecil (<) atau sama dengan (=) alpha, maka kita menolak
hipotesis nol, yang berarti bahwa hasil penelitian secara statistik adalah
signifikan.  Jika nilai p-value lebih kecil dari alpha, maka kita gagal menolak
hipotesis nol, yang berarti penelitian secara statistik tidak signifikan.

Referensi:

What is the difference between alpha level and a p-value? (n.d.). Retrieved
December 27, 2009, from website: http://docs.google.com/viewer?
a=v&q=cache:GEihe37N2_sJ:courses.washington.edu/p209s07/
lecturenotes/

Pengambilan Keputusan dengan P-Value


This entry was posted on 2 Desember 2011, in Belajar Statistik and tagged P-Value, Pengujian
Hipotesis. Bookmark the permalink. 4 Komentar

Dalam ilmu statistika, para peneliti harus menggunakan kriteria uji untuk
memutuskan apakah menolak H0 atau menerima  H0. Dalam perkembangannya,
banyak peneliti yang sering menggunakan P-Value untuk  kriteria ujinya. P-
value lebih disukai dibandingkan kriteria uji lain seperti tabel distribusi dan selang
kepercayaan. Hal ini disebabkan karena p-value memberikan 2 informasi sekaligus,
yaitu disamping petunjuk apakah H0 pantas ditolak, p-value juga memberikan
informasi mengenai peluang terjadinya kejadian yang disebutkan di dalam H0(dengan
asumsi H0 dianggap benar). Definisi p-value adalah tingkat keberartian terkecil
sehingga nilai suatu uji statistik yang sedang diamati masih berarti (Kurniawan,
2008).
P-value dapat pula diartikan sebagai besarnya peluang melakukan kesalahan apabila
kita memutuskan untuk menolak H0 (Kurniawan, 2008). Pada umumnya, p-
value dibandingkan dengan suatu taraf nyata α tertentu, biasanya 0.05 atau 5%. Taraf
nyata α diartikan sebagai peluang kita melakukan kesalahan untuk menyimpulkan
bahwa H0 salah, padahal sebenarnyastatement H0 yang benar. Kesalahan semacam ini
biasa dikenal dengan galat/kesalahan jenis I (type I error, baca = type one error).
Misal α yang digunakan adalah 0.05, jika p-value sebesar 0.021 (< 0.05), maka kita
berani memutuskan menolak H0 . Hal ini disebabkan karena jika kita memutuskan
menolak H0 (menganggap statement H0 salah), kemungkinan kita melakukan
kesalahan masih lebih kecil daripada α = 0.05, dimana 0.05 merupakan ambang batas
maksimal dimungkinkannya kita salah dalam membuat keputusan.

Cara menghitung p–value adalah mendapatkan luasan daerah di bawah kurva normal.


Misalkan dalam pengujian satu sisi, H0 : µ < 0.10 dan H1 : 0.10 dan nilai uji statistik
Z sampel = 1.41. Dengan demikian nilai p-value untuk pengujian ini adalah
probabilitas observasi suatu nilai Z yang lebih dari 1.41. Nilai ini merupakan luas
daerah di bawah kurva normal di sebelah kanan Z = 1. 41. Dari tabel nilai Z kita
dapatkan bahwa luas daerah di bawah kurva normal di antara Z = 0 dan Z = 1.41
adalah 0.4207. Dengan demikian luas daerah di bawah kurva normal di sebelah
kanan Z = 1.41, yaitu p-value = 0.5 – 0.4207 = 0.0793 (E-Learning Gunadarma,
2011).
(rezamubarak)

Daftar Pustaka:

1. Kurniawan, Deny. 2008. Regresi Linier (Linear Regression): Forum Statistika.


2. E-Learning Gunadarma, 2011. Bagian 4 Uji
Hipotesis. http://elearning.gunadarma.ac.id. Diakses Kamis, 27 Okteber 2011
pukul 22.10.
Convidence Interval adalah salah satu parameter lain untuk mengukur
seberapa akurat Mean sebuah sample mewakili (mencakup) nilai Mean
Populasi sesungguhnya.
Dalam posting tentang Standard Error sebelumnya, sudah saya sampaikan
bahwa: Standard Error (SE) dapat digunakan sebagai suatu parameter seberapa
akurat sample-sample yang kita ukur mewakili Population Mean (  ).
Semakin Besar SEsemakin Gemuk diagram Sampling Distribution-nya semakin
Tidak Akurat sample-sample kita mewakili Populasi (dalam hal ini diwakili
Population Mean), semakin Kecil SE semakin Kurus diagram Sampling
Distribution-nya (nilai-nilai Samples Mean mengumpul sekitar Population Mean)
semakin Akurat sample-sample kita mewakili Populasi.
Nah, cara ke dua untuk mengukur seberapa akurat sebuah Sample
Mean terhadapMean Populasi (dalam hal ini karena populasinya sangat besar
sehingga kita Tidak Dapat mengakses dan mengukur semua item, sehingga kita
ingin mengambil kesimpulan Mean Populasi dengan satu buah Sample Mean):
yakni dengan menggunakan Confidence Interval.
Confidence Interval adalah rentang antara dua nilai di mana nilai suatu
Sample Mean tepat berada di tengah-tengahnya.
Nilai sebuah confidence interval dapat dinyatakan dengan Kemungkinan
(Probability)berapa sample dalam 100 kali pengambilan
samples nilai Population Mean sesungguhnya akan masuk dalam sebuah
rentang sample mean.
Contoh: 95% of confidence interval artinya jika saya mengambil 100 samples
maka kemungkinan 95 sample saya akan mencakup nilai Population Mean
sesungguhnya.
Bagaimana menghitung Batas Rentang sebuah Sample Mean untuk %
confidence interval tertentu?
Untuk menghitungnya, kembali kita ke konsep perhitungan nilai z yakni
hubungan antara nilai sebenarnya dalam distribusi frequency dengan nilai z
dalam distribusi normal.
Dalam statistics, telah ditemukan jika sample kita besar, yakni lebih dari 30
samples, maka ditemukan distribusi samples nya “pasti” NORMAL, sehingga kita
dapat menggunakan rumus perhitungan z dan tabel distribusi normal.
Jika 30 samples atau kurang maka menggunakan t-distribution.
Anggap samples kita lebih dari 30, maka kita telah tahu bahwa
z adalah perbandingan antara {selisih nilai x (yang akan dicari
probabilitas kemunculannya) dan Mean } dengan standard deviation-
nya
z = (X – SampleMean)/s
Question: saya pengin mengetahui interval sebuah Sample Mean agar
Confidence Intervalnya mencapai 95%
maka agar area dibawah kurva normal sebesar 95% atau 0.095 maka dua batas
vertical are tersebut adalah 5%/2 = 2,5% (0.025) smaller area atas dan 2,5%
(0.025)smaller area bawah, atau dari Table conversi luas area (probabilitas) dan
nilai z diketahui nilai z dari probabilitas 0.025 adalah 1.96.
Jadi ada dua nilai batas z, nilai batas z bawah – 1.96, nilai batas z atas 1.96.
jadi untuk mencari nilai rentang (X) batas bawah dan atas:

– 1.96 = (X – SampleMean)/s
1.96 = (X – SampleMean)/s
sehingga nilai X dapat diketahui:

X batas bawah = Sample Mean – 1.96s


X batas atas = Sample Mean + 1.96s
Ketemu dech nilai rentangnya (antara X batas bawah sampai dengan X batas
atas), disini pasti Sample Mean berada tepat di tengah-tengah rentang ini!.
Di mana s adalah Standard Deviation dalam hal ini adalah Standard Error (SE)
Jika rumus perhitungan batas rentang tadi digeneralisasi untuk penelitian
dengan lebih dari 30 samples:

X batas bawah = Sample Mean – (z dari {(1-probabilitas yang


dicari)/2}) s
X batas atas = Sample Mean + (z dari {(1-probabilitas yang dicari)/2})
s
ingat luas seluruh area di bawah kurva normal=1

****

Contoh question: jika saya punya Sample Mean=10 dengan standard error=2,


maka berapa rentang untuk nilai Sample Mean saya ini agar Confidence
Intervalnya mencapai 99%.
Jawab:

X batas bawah = Sample Mean – (z dari {(1-probabilitas yang


dicari)/2}) s
X batas bawah = 10 – ( z dari (1-99%)/2)s
= 10 – ( z dari (0.01/2))s  = 10 – ( z dari 0.005)s = 10 – 2.58*2 = 10 – 5.16 =
4.84

X batas atas = 10 + ( z dari (1-99%)/2)s


= 10 + 5.16 = 15.16

Jadi agar nilai Sample Mean 10 kemungkinan 95% mencakup Population Mean
sebenarnya maka harus diberi rentang antara 4.84 – 15.16

—–

Bagaimana jika banyaknya sample 30 atau kurang dari 30 samples??


Ahli statistics telah menemukan bahwa sampling distribution-nya akan Tidak
Normal sehingga tidak bisa memakai nilai z dan kurva normal, namun sebagai
gantinya memakai t-distribution, dengan rumus mencari nilai X batas bawah &
X batas atas:
X batas bawah = Sample Mean – (t dari n-1) s
X batas bawah = Sample Mean + (t dari n-1) s
—————————————————————–

Nah point lain yang penting dari Confidence Interval kaitannya dengan
ukuran keakuratannya terhadap nilai Population Mean sesunggunya
adalah:
Semakin LEBAR rentang suatu nilai Sample Mean –> Semakin TIDAK AKURAT
nilai Sample Mean itu mewakili/mencakup Population Mean sesungguhnya.
Semakin SEMPIT rentang suatu nilai Sample Mean –> Semakin AKURAT nilai
Sample Mean itu mewakili/mencakup Population Mean sesungguhnya.
Naaah..Alhamdulillaah sekarang kita paham, kita sudah bisa menggunakan 2
parameter untuk mengukur keakuratan sebuah Sample
Mean terhadap Population Mean, yakni dengan melihat
* Standard Error nya?
* Rentang Confidence Intervalnya?

 
 
 
Rate This
BAB VSTATISTIK UNTUK YANG NON AHLI
STATISTK  5.1Bagaimana yang non ahli statistik
mengevaluasi uji statistik?Pada saat ini dimana pengobatan
sangat bergantung pada keahlian matematika, tidak ada
seorang dokter pun dapat mengupayakan sesuatu dengan
mengabaikan aspek statistik dari sebuah tulisan secara
keseluruhan untuk menjadi seorang yang”ahli”. Jika, sama
seperti saya, anda percaya bahwa diri anda bukanlah orang
yang ahli dalam perhitungan, ingatlah bahwa anda tidak akan
pernah sanggup untuk membuat sebuah mobil hanya karena
ingin mengemudi.  Apa yang anda ingin ketahui mengenai
suatu uji statistik  adalah uji apa yang tepat untuk digunakan
untuk permasalahan-permasalahan yang umum. Anda mesti
sanggup untuk menggambarkan dengan kata-kata apa fungsi
dari uji tersebut dan pada kondisi apa uji tersebut tidak valid
atau tidak layak. Kotak 5.1 memperlihatkan “trik-trik penjualan”
yang seringkali digunakan, yang kita butuhkan untuk perlu
diingat (untuk kita praktekkan maupun orang lain). Saya telah
menemukan satu cara yang terbaik untuk menarik kolegaku
yaitu memberikan komentar misalnya: “Ah, saya tahu
pengarang ini menggunakan uji F one tailed. Saya tiba-tiba
berpikir bahwa uji two tailed lebih sesuai untuk kondisi ini”.
Sebagaimana engkau mengetahui dari catatan di bawah, kamu
tidak harus melakukan uji F sendiri untuk setelah mengeluarkan
komentar seperti ini, tetapi kamu perlu memahami apa yang
dimaksud dengan tail (ekor).Daftar ringkasan pada lampiran 1,
dijelaskan secara detail pada bagian di bawah ini,
menghasilkan caraku tersendiri untuk mengukur adekuat
analisa statistic, dimana beberapa pembaca menganggap ini
begitu simple (mudah). Jika anda juga menganggap demikian,
lewatkan saja bagian ini dan lanjutkan ke presentasi yang lebih
komprehensif untuk para ahli dari non-statistik, “Statistik Dasar
untuk Dokter” seri dalam Jurnal Canada Medical Association, atau
lanjutkan ke buku text yang lebih mengarah ke statistic. Jika
sebaliknya, anda menemukan bahwa statistic sangat sulit,
turutilah poin ini sekali waktu dan lanjutkan membaca poin
selanjutnya hanya pada saat engkau merasa telah memahami
yang lalu. Tidak ada satupun poin yang menjelaskan secara
detail dari kalkulasi yang sebenarnya.        
Kotak 5.1. 10 cara memanipulasi uji statistic ketika menuliskan
hasil·         Masukkan semua datamu kedalam computer dan laporkan bermakna
(signifikan) untuk semua hubungan dimana “p<0,05” (lihat bagian 5.5a). ·         Jika
data dasar berbeda antara kelompok pada kelompok yang berbeda-beda, ingatlah
jangan menyesuaikannya (lihat bagian 5.2a).·        Jangan menguji datamu untuk
mengetahui apakah mereka telah terdistribusi normal. Jika engkau melakukannya,
kamu mungkin akan terhalang dengan uji non-parametrik, yang tidak menarik
sama sekali (lihat bagian 5.2b).·         Abaikan semua data yang hilang (“drop-out”)
dan tanpa respon, jadi analisis hanya terkonsentrasi pada subjek yang benar-benar
lengkap datanya (lihat bagian 4.6c).·         Selalu asumsikan bahwa engkau bisa
membuat plot pada satu set data terhadap data lainnya dan kalkulasikan
sebuah  “nilai r” (Pearson correlation coefficient) (lihat bagian 5.4a), dan sebuah
nilai r yang “bermakna” membuktikan sebab akibat (lihat bagian 5.4b).·         Jika
outliers (nilai ekstrim) mengacaukan perhitunganmu, hilangkan saja. Tetapi jika
outliers atau nilai ekstrim ini membantu kasusmu, meskipun nampak bukan hasil
yang sebenarnya, tetap masukkan ke dalam laporanmu (lihat bagian 5.3c).·         Jika
confidence interval dari hasilmu menunjukkan tidak ada perbedaan yang tumpang
tindih di antara kelompok, jangan masukkan ke dalam laporanmu. Lebih baik,
sebutkan dengan singkat dalam laporanmu tetapi jangan gambarkan dalam grafik
dan jangan masukkan ketika mengambil kesimpulan (lihat bagian 5.5b).·         Jika
perbedaan dua kelompok menjadi bermakna dari empat setengah bulan sampai
enam bulan percobaan, hentikan percobaan dan mulailah menulis. Alternatifnya
jika dalam enam bulan hasilnya “mendekati bermakna”, perpanjang percobaan
untuk tiga minggu lagi (lihat bagian 5.2d)·         Jika hasilmu terlihat kurang menarik,
cek kembali di komputermu dan lihat jika ada sub grup yang kelihatan berbeda.
Engkau mungkin menemukan intervensimu berjalan sampai semua wanita China
berumur 52 sampai 61 tahun (lihat bagian 5.2d).·         Jika dalam analisa datamu
caramu merencanakan tidak memperlihatkan hasil yang engkau inginkan, buatlah
pola melalui seleksi uji lainnya (lihat bagian 5.2c).
 Pertanyaan pertama yang dipertanyakan adalah, “Pernahkan
penulis menggunakan uji statistic?”. Jika mereka menyebutkan
angka dan mengklaim bahwa angka ini memiliki sebuah arti,
tanpa menggunakan metode statistic untuk membuktikannya,
sama artinya dengan bermain ski diatas es yang sangat
tipis.  5.2 Sudahkah pengarang meletakkan posisi yang
benar?Apakah mereka telah menentukan apakah kelompok
mereka dapatdibandingkan dan, jika perlu, menyesuaikan diri
pada latar belakang yang berbeda-beda?Kebanyakan pada
percobaan klinik perbandingan mencakup tabel atau paragraph
pada teks yang menunjukkan ciri dasar kelompok yang diteliti.
Misalnya sebuah tabel menggambarkan bahwa kedua
kelompok baik kelompok intervensi maupun kontrol sama
dalam hal distribusi umur dan jenis kelamin dan
mengindikasikan variabel kunci (misalnya besar rata-rata
gumpalan kanker). Jika ada perbedaan penting di antara
karakteristik dasar, meskipun ini terjadi karena tidak sengaja, ini
akan membuka tantangan baru pada interpretasi hasilmu. Pada
situasi ini, engkau dapat melakukan penyesuaian untuk
mencoba memasukkan perbedaan ini dan kemudian
memperkuat argumenmu. Untuk mengetahui bagaimana
membuat suatu penyesuaian, lihatlah bagian dari topik ini
dalam buku Douglas Altman Practical statistics for medical
research. Jenis data apa yang telah mereka peroleh dan apakah
mereka telah menggunakan uji stattistik yang relevan?Nomor
sering digunakan untuk melabel karakteristik sesuatu hal. Kita
dapat menggunakan nomor untuk menandai tinggi badan, berat
badan, dan sebagainya. Untuk karakteristik semacam ini,
pengukuran dapat diberlakukan sebagai nomor yang
sebenarnya. Kita dapat, misalnya, mengkalkulasi rata-rata berat
badan dan tinggi badan sekelompok orang dengan merata-
ratakan pengukuran. Tetapi menimbang contoh yang berbeda,
dimana kita menggunakan nomor untuk melabel karakter
sesuatu hal “kota asal”, dimana 1=London, 2=Manchester,
3=Birmingham, dan sebagainya. Kita masih bisa mengkalkulasi
rata-rata dari nomor ini untuk sampel tertentu dari kasus-kasus
tetapi kita tidak bisa menginterpretasi hasil secara komplit. Hal
yang sama terjadi dimana kita melabel suatu ciri “menyukai x”,
dengan 1=tidak sama sekali, 2=sedikit, 3=banyak. Selain itu,
kita bisa mengkalkulasi “rata-rata kesukaan” tetapi hasil
numerik tidak dapat diinterpretasikan kecuali kita mengetahui
bahwa perbedaan antara “tidak sama sekali” dan “sedikit”
persis sama dengan perbedaan antara “sedikit” dan
“banyak”.Semua uji statistik baik parametrik (misalnya mereka
mengasumsikan bahwa data sampel diambil dari bentuk
tertentu distribusi, misalnya distribusi normal) atau non-
parametrik (misalnya mereka tidak mengasumsikan bahwa data
sampel diambil  dari tipe tertentu distribusi). Umumnya, uji
parametrik lebih kuat dari uji non-parametrik dan mestinya
digunakan jika memungkinkan. Uji non-parametrik
melihat ranking atau urutan nilai (yang mana yang terkeci, yang
mana data berikutnya, dan sebagainya), dan mengabaikan
perbedaan yang absolut diantara mereka. Seperti yang
mungkin engkau perkirakan, kemaknaan statistik lebih sulit
untuk mendemonstrasikan uji non-parametrik dan ini membuat
para peneliti untuk menggunakan statistik seperti nilai r (lihat
bagian 5.4) secara tidak relevan. Bukan hanya karena
nilai r (parametrik) lebih mudah untuk mengkalkulasi
dibandingkan menggunakan salah satu uji non-parametrik
misalnya σ Spearman, tetapi kecendrungan itu terjadi karena
memberikan hasil yang bermakna atau signifikan. Sayangnya
hal itu juga akan menghasilkan yang palsu dan salah terhadap
kemaknaan hasil, kecuali data layak terhadap uji yang
digunakan. Beberapa contoh persamaan antara uji parametrik
dan non-parametrik diperlihatkan pada Tabel 5.1.Pertimbangan
lain adalah bentuk distribusi dimana data diambil sebagai
sampel. Ketika saya di sekolah, kelasku membuat garis plot
jumlah uang saku yang diterima dan jumlah anak yang
menerima jumlah uang tersebut. Hasilnya membentuk suatu
histogram yang sama bentuknya dengan Gambar 5.1 – suatu
distribusi “normal”. (Istilah “normal” merujuk ke bentuk grafik
dan digunakan karena banyak finomena biologis menunjukkan
pola distribusi ini.) Beberapa variabel biologis misalnya berat
badan menunjukkan distribusi skew/miring, seperti yang terlihat
pada gambar 5.2. (Gambar 5.2 sebenarnya menunjukkan
kemiringan negatif, dimana berat badan kemiringannya akan
positif. Rata-rata berat badan orang dewasa laki-laki adalah 70
kg dan adapula orang yang beratnya 140 kg tetapi tidak ada
orang yang berat badannya kurang dari tidak ada, oleh karena
itu grafik tidak mungkin simetris. Data yang tidak-normal
(miring) kadang dapat ditransformasi untuk memberikan bentuk
grafik yang normal dengan membuat plot logaritma kemiringan
variabel ke pola yang halus dan kemaknaannya didiskusikan di
bawah ini. Selanjutnya, diskusi yang sangat jelas tentang
distribusi normal, lihat Bab 7 dari buku Martin Bland An
introduction to medical statistics.Menentukan kapan data
berdistribusi normal bukanlah latihan akademik, sejak hal itu
akan menentukan uji statistik yang digunakan. Misalnya, regresi
linear (lihat bagian 5.4) akan menghasilkan hasil yang salah
kecuali titik-titik pada grafik scatter membentuk distribusi
tertentu yaitu garis regresi, misalnya residual (jarak tegak lurus
dari tiap titik ke garis) harus secara normal terdistribusi.
Mentransformasi data untuk mencapai distribusi normal (jika ini
bisa dilakukan) bukan memanipulasi; ini hanya memastikan
bahwa nilai-nilai data memberikan penekanan dalam menilai
total efek. Menggunakan uji yang berdasarkan pada distribusi
normal untuk menganalisa data yang tidak berdistribusi normal
adalah jelas-jelas memanipulasi.  Jika uji statistik pada artikel
tidak jelas, mengapa para penulis memilih untuk
menggunakannya dan apakah mereka telah memasukkan
sebuah rujukan/referensi?Kadang nampak seperti jumlah yang
tak terbatas dari uji statistik yang memungkinkan. Sebenarnya,
kebanyakan ahli statistik dapat bertahan dengan satu lusin
rumus. Sisanya adalah hal-hal yang kecil yang sulit
dimengerti  dan hanya digunakan untuk indikasi-indikasi
khusus. Jika artikel yang kamu baca seperti menggambarkan
satu set data yang standar yang telah dikumpulkan dengan
cara yang standar, tetapi uji yang digunakan tidak jelas dan
tidak tercantum pada buku teks statistik dasar, engkau harus
mencium hal ini seperti seekor tikus. Pengarangnya harus,
pada kondisi ini, menyebutkan mengapa dia harus
menggunakan uji ini dan memberikan referensi (dengan nomor
halaman) untuk deskripsi yang pasti tentang itu.  Apakah data
sudah dianalisa menurut protokol studi yang asli?Meskipun
engkau tidak tertarik pada pembuktian secara statistik, akal
sehat mesti mengatakan mengapa poin 8 dan 9 pada Kotak 5.1
sama dengan manipulasi yang serius. Jika engkau lama
mencari engkau pasti menemukan beberapa kategori
pemahaman yang nampak telah dilakukan secara khusus
dengan baik atau buruk. Meskipun demikian, setiap waktu
engkau melihat jika subgrup tertentu berbeda dari yang
seharusnya engkau mungkin meningkatkan kecendrungan yang
mungkin engkau temukan pada akhirnya satu yang muncul
seperti itu, meskipun perbedaan terjadi secara tidak
sengaja. Sama halnya jika engkau mengundi koin dengan
seseorang, tidak peduli sejauh mana engkau kalah, akan ada
suatu waktu dimana aengkau menang. Kebanyakan orang akan
setuju bahwa menghentikan permainan tidaklah adil untuk
bermain. Demikian juga dengan penelitian. Jika engkau
membuat hasil akhirmu positif juga akan membuat kesalahan
pada dirimu sendiri tentang kebenaran dari kasusmu.
Mengakhiri sebuah percobaan intervensi secara prematur untuk
alasan etis ketika subyek berada pada satu sisi yang sedang
berubah buruk adalah berbeda, dan didiskusikan di lain
kesempatan. Kembali dan cek datamu untuk menemukan “hasil
yang menarik” (analisis sub grup retrospektif atau, lebih
informal) dapat mengarah ke kesimpulan yang salah. Pada
studi pendahuluan pada penggunaan aspirin untuk mencegah
strok pada pasien yang terpengaruh, hasil menunjukkan efek
yang signifikan pada kedua kombinasi jenis kelamin dan analisa
sub grup retrospektif nampak menunjukkan bahwa dampak
terbatas pada laki-laki. Kesimpulan ini mengarah pada tidak
diberikannya aspirin pada wanita untuk beberapa tahun hingga
hasil dari penelitian lainnya menunjukkan bahwa dampak dari
sub grup ini terdapat kesalahan. Ini dan contoh lainnya
diberikan dalam sebuah artike oleh Oxman dan Guyatt, “Suatu
petunjuk konsumer untuk analisa sub grup”, yang menghasilkan
ceklist yang bermanfaat untuk menentukan apakah perbedaan
pada respon sub grup adalah nyata.  5.3 Data yang
berpasangan, tails dan outliersApakah uji berpasangan
dilakukan untuk data yang berpasangan? Siswa sering
kesulitan dalam menentukan kapan menggunakan uji statistik
yang berpasangan atau yang tidak berpasangan untuk
menganalisa data. Sebenarnya tidak ada yang misteri dari ini.
Jika engkau mengukur sesuatu dua kali untuk satu subyek
(misalnya tekanan darah pada saat berbaring dan berdiri),
engkau mungkin tidak hanya tertarik pada rata-rata perbedaan
antara tekanan darah pada saat berbaring dan pada saat berdiri
pada keseluruhan sampel, tetapi juga pada berapa banyak
tekanan darah individu berubah disebabkan oleh posisinya.
Pada situasi ini, engkau memiliki apa yang disebut dengan data
yang “berpasangan”, karena tiap pengukuran sebelumnya
berpasangan dengan satu pengukuran setelah itu. Pada contoh
ini, memiliki orang yang sama pada dua kesempatan yang
membuatnya berpasangan tetapi ada kemungkinan lainnya
(contoh, dua pengukuran pada pengisian tempat tidur dibuat
oleh rumah sakit yang sama). Pada situasi ini, dua set nilai
cenderung berhubungan secara bermakna (contoh, tekanan
darahku minggu depan akan lebih mendekati tekanan darahku
minggu lalu dibandingkan dengan tekanan darah orang dewasa
yang dipilih secara random minggu lalu). Dengan kata lain, kita
memperkirakan dua nilai “berpasangan” yang terpilih secara
random lebih dekat satu sama lain dibandingkan dua nilai yang
“tidak berpasangan” yang dipilih secara random. Jika kita tidak
menggunakan ini, dengan melakukan uji sampel “yang
berpasangan” yang relevan, kita akan berakhir dengan estimasi
bias dari kemaknaan hasil kita.  Apakah uji dua sisi digunakan
meskipun dampak dari intervensi diperkirakan negatif?Konsep
uji dengan tails (ekor/sisi) membuatku selalu berpikir tentang
hantu dan ular, yang saya perkirakan hanya dampak dari
kebencianku terhadap statistik. Sebenarnya, istilah “tail”
merujuk kepada distribusi yang ekstrim- area hitam pada
Gambar 5.1. Katakan saja bahwa grafik menunjukkan tekanan
darah diastolik pada sekelompok individu yang merupakan
sampel random untuk diberi diet sodium rendah. Jika diet
sodium rendah secara signifikan menurunkan tekanan darah,
selanjutnya pengukuran tekanan darah pada subyek ini akan
cendrung ke “sisi/tail” bagian kiri grafik. Oleh karena itu kita
dapat menganalisa data dengan uji statistik yang didesain untuk
menunjukkan apakah tekanan darah yang rendah pasien dari
sampel cendrung meningkat secara kebetulan. Tetapi atas
dasar apa kita mengasumsikan bahwa diet rendah sodium
hanya dapat menurunkan tekanan darah, tetapi tidak pernah
menaikkan? Meskipun terdapat alasan fisiologis yang valid
pada contoh kasus tersebut, tidaklah ilmiah jika selalu
mengasumsikan bahwa engkau mengetahui arah dampak dari
intervensimu. Suatu obat yang bertujuan untuk menghilangkan
sakit kepala mungkin sebenarnya malah memperburuk dan
sebuah leaflet penyuluhan untuk menurunkan kecemasan,
malah meningkatkan. Oleh karena itu, analisa statistikmu
harusnya, secara umum, menguji hipotesis apakah tinggi atau
rendahnya nilai pada data meningkat secara kebetulan. Dalam
bahasa ahli statistik, artinya engkau membutuhkan uji dua
sisi/tail kecuali engkau mempunyai bukti yang kuat bahwa
perbedaan hanya dapat terjadi pada satu arah.  Apakah
“outliers (nilai ekstrim)” dianalisa dengan akal sehat dan statistik
yang sesuai?Hasil yang tidak diharapkan mungkin cerminan
dari sifat dari subyek (misalnya, metabolisme yang tidak
biasanya), kesalahan pada saat interpretasi (misalnya, salah
membaca dalam membaca meteran), atau kesalahan dalam
menghitung (misalnya, salah menempatkan poin desimal).
Hanya yang pertama dari ini semua yang merupakan hasil yang
“sebenarnya” yang dimasukkan dalam analisa. Hasil yang
posisinya jauh dari yang lain nampaknya kurang asli atau
kurang benar, tapi mungkin saja benar. Beberapa tahun yang
lalu, ketika melakukan suatu proyek penelitian, saya mengukur
sejumlah level hormon yang berbeda pada kurang lebih 30
subyek. Satu subyek mempunyai level hormon kira-kira 100 kali
lebih tinggi dari yang lainnya. Saya berasumsi bahwa ini suatu
kesalahan, oleh karena itu saya memindahkan nilainya dua
desimal ke kiri. Beberapa minggu kemudian, saya bertemu ahli
yang telah menganalisa spesimen itu dan dia bertanya “Apapun
juga terjadi pada lelaki itu dengan acromegaly?Secara statistik
outlier itu dibenarkan (misalnya, untuk memodifikasi
dampaknya pada hasil secara keseluruhan) adalah suatu
manuver statistik yang canggih. Jika engkau tertarik, cobalah
bagian yang relevan pada buku Douglas Altman. 5.4 Korelasi,
regresi, dan sebab akibatApakah korelasi telah dibedakan
dengan regresi dan apakah koefisien korelasi (nilai r) telah
dihitung dan diinterpretasikan secara benar?Untuk kebanyakan ahli
non-statistik, istilah “korelasi” dan “regresi” adalah sinonim, dan
sedikit merujuk seakan-akan ke grafik scatter dengan titik-titik
yang menyebar secara tidak teratur mengikuti garis diagonal
yang muncul pada sumbu intercept. Engkau mungkin benar
dalam mengasumsikan bahwa jika dua hal tidak berkorelasi,
sudah tidak ada artinya untuk mencari regresinya. Tetapi
regresi dan korelasi merupakan dua istilah statistik yang
memiliki fungsi yang sangat berbeda.Nilai r (koefisien korelasi
Pearson’s product moment) merupakan pengukuran statistik
yang terlalu banyak digunakan dalam buku. Pada hakekatnya,
nilai r  tidak valid kecuali memenuhi kriteria berikut:·         Data
(populasi dimana data diambil) harus berdistribusi normal. Jika
tidak, uji non-parametrik dari korelasi  harus digunakan sebagai
gantinya (lihat Tabel 5.1).·         Dua variabel harus independen
secara terstruktur (yang satu tidak boleh dipaksakan untuk
membedakan dengan yang lain). Jika tidak, uji t berpasangan
atau uji berpasangan lainnya harus digunakan sebagai
gantinya. ·         Hanya satu pasang pengukuran yang harus dibuat
pada tiap subyek, karena pengukuran yang dibuat pada subyek
berikutnya harus independen secara statistik satu sama lain jika
kita bertujuan untuk memperoleh estimasi yang tidak bias dari
parameter populasi yang diteliti.·         Setiap nilai r harus disertai
dengan nilai p, yang melihat sejauh mana kecendrungan suatu
hubungan pada kekuatan ini terjadi secara kebetulan (lihat
bagian 5.5), atau sebuah confidence interval, yang
menggambarkan rentang dimana nilai R “sebenarnya” cendrung
muncul. (Catat bahwa kasus bawah “r” menggambarkan
koefisien korelasi sampel, dimana kasus
atas “R”menggambarkan koefisien korelasi seluruh
populasi.)Ingat juga bahwa, meskipun jika nilai r sesuai dengan
perhitungan sekelompok data, itu tidak menggambarkan
bagaimana hubungannya, tetapi kekuatannya, adalah sebab
akibat (lihat penjelasan dibawah ini).Kemudian apa yang
dimaksud dengan regresi? Istilah “regresi” mengarah pada
persamaan metamatika  dimana satu variabel (variabel target)
diprediksi dengan variabel yang lain (variabel independen).
Regresi, kemudian, mengindikasikan arah pengaruh, meskipun
pada bagian berikutnya membantah, bahwa itu tidak
membuktikan sebab akibat. Pada kasus regresi berganda,
persamaan matematika yang lebih kompleks (yang masih
menjadi rahasia komputer yang menghitungnya) dimana
variabel target diprediksi dari dua atau lebih variabel
independen (yang sering dikenal dengan co-
variabel).Persamaan regresi yang paling sederhana, yang
mungkin masih anda ingat   ketika masih bersekolah,
adalahy  = a + bx, diman y  adalah variabel ndependen ( yang
diplot pada horizontal axis )            Tabel 5.1 Beberapa uji
statistik yang umumnya digunakan
Contoh uji
Parametrik
Uji Parametrik yang sama Tujuan Uji Contoh
Untuk
membandingkan
Membandingkan dua sampel berat badan
Uji t dua yang independen yang anak perempuan
sampel Uji Mann- diambil dari populasi yang dan berat badan
(berpasangan) Whitney U sama. anak laki-laki
Membandingkan dua set Untuk
data observasi pada satu membandingkan
Uji t satu Uji macam sampel (uji hipotesis berat badan bayi
sampel berpasangan perbedaan rata-rata antara sebelum dan
(berpasangan) Wilcoxon dua pengukuran adalah nol) setelah disusui
Untuk
menentukan
Variansi Analisis kapan tingkat
analisis satu variansi Secara efektif, generalisasi glukosa plasma
arah dengan dari tberpasangan atau uji lebih tinggi dari
menggunakan mengurutkan berpasangan Wilcoxon satu jam, dua
jumlah kuadrat (misalnya uji dimana tiga atau lebih set jam atau tiga
total (misalnya Kruskall- data observasi yang terdiri jam setelah
uji F) Wallis) dari satu jenis sampel makan.
Untuk
membandingkan
sensitifitas dan
pengkategorian
dari dua uji
diagnosis yang
Tidak Menguji hipotesis nol bahwa berbeda ketika
kesamaan proporsi estimasi dari diaplikasikan
secara sampel yang berpasangan pada sampel
langsung Uji  McNemar adalah sama yang sama
Product Spearmen’s Mengukurkekuatanhubunga Untuk menilai
momen rank korelasi n garis lurus antara dua kapan dan
korelasi koefisien (σ) variabel kontinyu bagaimana
koefisien tingkat plasma
HbA1
berhubungan
dengan tingkat
trigliserid
plasma pada
(Pearson’s r) pasien diabetes
Untuk melihat
Menggambarkan hubungan bagaimana
Tidak ada numerik antara dua variabel puncak angka
Regresi kesamaan kuantitatif, satu nilai arus pernafasan
dengan metode secara diprediksi diantara nilai dengan tinggi
least square langsung lainnya badan
Untuk
menentukan
kapan dan
bagaimana umur
seseorang,
lemak tubuh dan
Menggambarkan hubungan konsumsi
Multiple Tidak ada numerik antara satu variabel sodium
regresi dengan kesamaan dependen dengan beberapa menentukan
metode least secara variabel prediktor (co- tekanan darah
square langsung variates) mereka
  x adalah variabel independen (yang diplot pada vertical axis),
dan a adalahy-intercept. Tidak banyak variabel biologis yang
dapat diprediksi dengan persamaan sederhana tersebut. Berat
badan sekelompok orang, misalnya, bervariasi dengan tinggi
badannya tapi tidak secara linear. Saya dua kali lebih tinggi dari
anakku dan tiga kali dari berat badannya dan meskipun saya
empat kali lebih tinggi dari keponakanku yang baru lahir saya
lebih enam kali dari berat badannya. Berat badan, pada
dasarnya, mungkin bervariasi lebih dekat dengan akar kuadrat
tinggi seseorang dibandingkan dengan tinggi badan itu sendiri
(jadi mungkin lebih sesuai jika dikuadratkan dibandingkan
dengan regresi linear).Tentu saja, meskipun engkau telah
memasukkan data tinggi badan-berat badan yang memadai ke
dalam komputer untuk menghitung persamaan regresi yang
sangat baik untuk memprediksi berat badan seseorang dari
tinggi badannya, perkiraanmu masih nampak sangat kurang
karena berat badan dan tinggi badan sama sekali tidak
berkorelasi. Ada hal-hal lain yang mempengaruhi berat badan
sebagai tambahan terhadap tinggi badan dan kita dapat,
menggambarkan prinsip regresi berganda, masukkan data
umur, jenis kelamin, masukan kalori per hari, dan tingkat
aktivitas fisik ke dalam komputer dan hubungkan sejauh mana
dari tiap co-variabel ini berkontribusi terhadap persamaan
secara keseluruhan (atau model).Prinsip dasar telah
digambarkan disini, khususnya poin pada halaman
sebelumnya, harus membantumu untuk menentukan apakah
korelasi dan regresi digunakan secara benar pada artikel yang
engkau baca. Diskusi yang lebih detail mengenai hal ini dapat
ditemukan pada buku teks Martin Bland dan artikel ke empat
pada seri “Statistik dasar untuk kedokteran”.    
Kotak 5.2 Uji untuk hubungan sebab akibat·         Apakah terbukti dari eksperimen
sebenarnya pada manusia?·         Apakah hubungannya kuat?·        Apakah hubungan
konsisten dari satu penelitian ke penelitian lainnya?·        Apakah layak hubungan
yang sementara (misalnya apakah dampak yang dipostulatkan lebih mengikuti
penyebab yang dipostulatkan?)·         Apakah hubungan menimbulkan pemahaman
epidemiologi?·         Apakah hubungan menimbulkan pemahaman biologis?
·         Apakah hubungan spesifik?·        Apakah hubungan sama dengan hubungan
sebab akibat yang pernah terbukti?
 Apakah telah dibuat asumsi mengenai karakter dan arah dari
hubungan sebab akibat?Ingatlah kesalahan ekologis: hanya
karena sebuah kota memiliki jumlah pengangguran yang
banyak dan angka kejahatan yang sangat tinggi, tidak berarti
bahwa para pengangguran melakukan kejahatan! Dengan kata
lain, keberadaan hubungan antara A dan B tidak memberikan
penjelasan apa-apa mengenai keberadaan maupun arah dari
hubungan sebab akibat. Untuk mendemonstrasikan bahwa A
telah menyebabkan B (dibandingkan dengan B yang
menyebabkan A atau A dan B keduanya disebabkan oleh C),
engkau membutuhkan lebih dari satu koefisien korelasi. Kotak
5.2 memberikan beberapa kriteria, yang aslinya dikembangkan
oleh Sir Austen Bradford Hill, yang harus disesuaikan sebelum
memperkirakan hubungan sebab akibat.   5.5  Peluang dan
kepercayaanApakah “nilai p” telah dikalkulasi dan
diinterpretasikan dengan benar?Satu dari nilai pertama yang
dipelajari oleh mahasiswa statistik adalah nilai p; yaitu peluang
suatu outcome terjadi secara kebetulan. Praktek sains yang
standar, yang semuanya acak, umumnya menganggap suatu
nilai p yang kurang dari satu dari 100 (p< 0,01) sebagai “sangat
bermakna secara statistik”.Dengan definisi ini, kemudian, satu
kesempatan berhubungan dalam 20 (ini mestinya satu dari hasil
publikasi utama per isu jurnal) akan nampak bermakna ketika
sebenarnya tidak, dan satu dari 100 akan nampak sangat
bermakna dimana sebenarnya apa yang anakku sebut sebagai
“beruntung”. Karena jika engkau mesti menganalisa outcome
berganda dari kelompok datamu, engkau mesti mengoreksi
untuk melakukan hal ini (beberapa pengarang
merekomendasikan metode Bonferoni).Hasil dalam rentang
kemaknaan statistik (p<0,05 atau p<0,01 tergantung yang mana
yang engkau pilih sebagai batasannya) mengatakan bahwa
penulis harus menolak hipotesis nol (misalnya hipotesisnya
mengatakan bahwa tidak ada perbedaan yang nyata antara dua
kelompok). Tetapi sebagaimana yang saya kemukakan
sebelumnya (lihat bagian 4.6), suatu nilai p pada rentang yang
tidak bermakna menjelaskan kepadamu keduanya tidak ada
perbedaan diantara grup atau terlalu sedikit subyek untuk
mendemonstrasikan perbedaan jika ada. Itu tidak
memberitahukanmu yang mana.Nilai p mempunyai
keterbatasan lainnya. Gordon Guyatt dkk, pada artikelnya yang
pertama pada seri “Statistik dasar untuk kedokteran” mengenai
uji hipotesis yang menggunakan
nilai p,menyimpulkan:“Mengapa menggunakan satu point
pembatas (untuk pemaknaan statistik) jika pilihan tersebut
bebas? Mengapa membuat pertanyaan apakah sebuah
perlakuan itu efektif dalam bentuk dikotomi (pilihan ya-tidak) jika
lebih layak melihatnya sebagai suatu hal yang kontinyu?”Untuk
ini kita membutuhkan confidence interval, yang akan
dibicarakan selanjutnya. Apakah confidence interval telah
dihitung dan apakah tercermin pada kesimpulan penulis?Suatu
confidence interval, yang seorang ahli statistik yang baik dapat
mengkalkulasikannya pada hasil yang berkaitan dengan uji
statistik apa saja (uji t, nilai r, penurunan resiko absolut, jumlah
yang dibutuhkan untuk diobati, sensitivitas, spesifisitas dan
gambaran kunci lainnya dari suatu uji diagnosa), membuat
kamu mengestimasi keduanya yaitu percobaan “positif” (yang
menunjukkan perbedaan bermaksa secara statistik antara dua
sisi percobaan) dan percobaan “negatif” (yang nampak
menunjukkan tidak ada perbedaan), apakah kekuatan dari bukti
adalah kuat atau lemah dan apakah penelitian tersebut jelas
(misalnya tidak dibutuhkan lagi penelitian yang sama).
Perhitungan confidence interval telah tercakup dengan jelas
dalam buku Gardner dan Altman Statistics with confidence dan
interpretasinya telah tercakup oleh Guyatt dkk. Jika engkau
mengulang percobaan klinis sebanyak seratus kali, kamu tidak
akan persis memperoleh hasil yang sama setiap waktu.
Tetapi, rata-rata, engkau bisa membuat perbedaan level
tertentu (atau kurang berbeda!) diantara dua sisi percobaan.
Pada 90% percobaan perbedaan dua sisi akan berada dalam
batasan luas tertentu dan dalam 95% dari percobaan akan
berada pada batas tertentu, bahkan batasan yang lebih
luas. Sekarang jika, sebagaimana kasus biasanya, engkau
hanya melakukan satu percobaan bagaimana engkau
mengetahui seberapa dekat hasilnya ke perbedaan yang “riil”
diantara kelompok-kelompok tersebut? Jawabannya adalah
kamu tidak bisa. Tetapi dengan mengkalkulasi, katakanlah,
hasilmu berada pada 95% confidence interval, engkau bisa
mengatakan bahwa 95% peluang perbedaan yang “riil” berada
diantara dua batas. Kata-kata pada artikel harus dibaca seperti
ini:“Pada percobaan pengobatan kegagalan jantung, 33% dari
pasien yang diambil secara random untuk inhibitor ACE
meninggal, sedangkan 38% mereka yang diambil secara
random untuk hydralazine dan nitrat meninggal. Point estimasi
perbedaan di antara kelompok (satu estimasi terbaik dari
manfaat dalam melindungi hidup dengan menggunakan
inhibitor ACE) adalah 5%. 95% confidence interval berada pada
perbedaan ini adalah -1,2% sampai +12%.”Hasilnya akan
disebutkan seperti cara berikut ini:“Kelompok inhibitor ACE
memiliki 5% (95% CI -1,2  +12) lebih tinggi untuk bertahan
hidup”.Pada contoh khusus ini, 95% confidence interval
tumpang tindih dengan nol perbedaan dan, jika kita menuliskan
hasil sebagai suatu dikotomi (misalnya apakah hipotesis
“terbukti” atau “tidak terbukti”?), kita akan
mengklasifikasikannya sebagai percobaan negatif. Sebelumnya
sebagaimana Guyatt dkk berargumen, kemungkinan ada
perbedaan yang nyata dan kemungkinan berada lebih dekat
pada 5% dibandingkan keduanya -1,2% atau +12%.
Kesimpulan yang paling berguna dari hasil ini adalah “Segala
sesuatunya sama, sebuah inhibitor ACE adalah pilihan yang
cocok untuk pasien dengan kegagalan jantung, tetapi kekuatan
dari asumsi itu lemah”.Sebagaimana argumen pada bagian 8.3,
semakin luas percobaan (atau semakin luas hasil dari beberapa
percobaan), semakin sempit confidence interval dan oleh
karena itu hasil semakin mendekati kepastian.Dalam
menginterpretasi percobaan “negatif”, satu hal yang perlu
engkau ketahui adalah “apakah percobaan yang sangat besar
akan cenderung memperlihatkan manfaat yang bermakna?”.
Untuk menjawab pertanyaan ini, lihatlah batas atas 95%
confidence interval dari hasilnya. Hanya ada satu peluang di
dalam 40 (misalnya peluang 2½% jika 2½% dari hasil ekstrim
akan berada di bawah batas bawah 95% confidence interval)
bahwa hasil yang sebenarnya akan cenderung seperti ini atau
lebih dari ini. Sekarang tanyakan pada dirimu “apakah level
perbedaan ini akan bermakna secara klinis?” dan jika tidak,
engkau dapat mengklasifikasikan percobaan tidak hanya
negatif tetapi juga pasti. Jika sebaliknya, batas atas 95%
confidence interval menunjukkan level perbedaan kemaknaan
secara klinis diantara kelompok tersebut, percobaan mungkin
negatif tetapi tidak pasti. Hingga saat ini, penggunaan
confidence interval masih terbilang kurang umum di jurnal
kedokteran. Dalam suatu survei terhadap seratus artikel dari
tiga jurnal utama (The New England Journal of Medicine, Annals of
Internal Medicine, dan Canadian Medical Association Journal),
hanya 43% yang melaporkan confidence interval, sedangkan
66% memberikan nilai p. Gambaran ini mungkin saja agak
tinggi tetapi meskipun demikian banyak penulis tidak
menginterpretasikan confidence interval secara benar. Engkau
harus memeriksa secara hati-hati pada bagian diskusi untuk
melihat apakah penulis telah memasukkan secara benar (a)
apakah dan untuk apakah percobaan mereka menunjang
hipotesis mereka dan (b) apakah penelitian lebih lanjut perlu
dilaksanakan.  5.6 Garis bawah (menghitung resiko manfaat
dan kerugian)Apakah penulis mengemukakan dampak dari
sebuah intervensi atas dasar manfaat atau kerugian yang orang
harapkan?Memang baik untuk mengatakan bahwa suatu
intervensi khusus menghasilkan outcome yang memiliki
“perbedaan bermakna secara statistik” tetapi jika saya diminta
untuk meminum suatu obat baru saya ingin mengetahui sejauh
mana perubahan yang lebih baik (outcome) dibandingkan jika
saya tidak meminumnya. Empat kalkulasi sederhana (dan saya
menjanjikanmu ini sangat sederhana: jika engkau dapat
menambah, mengurangi, mengalikan, dan membagi engkau
akan dapat mengikuti bagian ini) yang membuat kamu dapat
menjawab pertanyaan ini secara obyektif dan dengan cara yang
berarti sesuatu untuk ahli non statistik. Kalkulasi ini adalah
pengurangan resiko relatif, pengurangan resiko absolut, dan
jumlah yang dibutuhkan untuk suatu perlakuan, dan odd
ratio.Untuk menggambarkan konsep ini, dan untuk membujuk
kamu untuk mengetahui ini, saya akan menceritakanmu tentang
suatu survei yang dilaksanakan oleh Tom Fahey dkk pada
tahun 1995. Mereka menulis kepada 182 pejabat kesehatan
pemerintahan di England (yang semuanya memiliki tanggung
jawab yang sama dalam membuat keputusan penting
pelayanan kesehatan) dan memberikan data berikut kepada
mereka mengenai empat program rehabilitasi yang berbeda
untuk korban serangan jantung. Mereka ditanya yang mana
yang lebih cenderung mereka danai.·         Program A – yang
menurunkan angka kematian sebesar 20%.·         Program B –
yang menghasilkan pengurangan absolut kematian sebesar
3%.·         Program C – yang meningkatkan angka kelangsungan
hidup pasien dari 84% ke 87%.·        Program D – yang bertujuan
untuk memasukkan 30 orang ke dalam program untuk
menghindari satu kematian. Dari 140 anggota yang merespon
hanya tiga yang mengatakan bahwa keempat “program”
sebenarnya berkaitan dengan hasil yang sama. 137 lainnya
memilih satu dari program dari yang lainnya, sehingga
mengungkapkan (dan juga yang mereka abaikan) kebutuhan
untuk memperoleh pelatihan dasar yang lebih baik mengenai
epidemiologi untuk pejabat kesehatan.  Tabel 5.2 Dampak
pencangkokan jantung koroner untuk kelangsungan hidup
Dampaknya selama 10 tahun Jumlah pasien yang
dirandom dari tiap
 Pengobatan Meninggal Hidup kelompok
 Mari kita lanjutkan dengan contoh pada tabel 5.2, yang diambil
Fahey dkk dari suatu penelitian oleh Salim Yusuf dkk. Saya
telah menggambarkan tabel 2×2 yang memberikan detail
pengobatan macam apa yang diterima oleh pasien pada
percobaan yang diambil secara random dan apakah mereka
meninggal atau hidup 10 tahun kemudian. Matematika
sederhana menjelaskan bahwa pasien pada terapi medis
mempunyai 404/1324=0,305 atau 30,5% peluang untuk
meninggal pada 10 tahun kemudian (dan 0,695 atau 69,5%
peluang yang masih hidup). Kita sebut ini sebagai resiko
kematian CER (control event rate). Pasien yang secara random
diambil untuk CABG memiliki 350/1325=0,264 atau 26,4%
peluang untuk meninggal 10 tahun kemudian (dan 0,736 atau
73,6% peluang untuk tetap hidup). Kita sebut resiko kematian
ini dengan EER (experimental event rate). Relative
riskkematian, misalnya resiko pasien CABG dibandingkan
dengan kontrol, adalah CER/EER atau 0,264/0,305=0,87
(87%).Relative risk reduction, misalnya jumlah dimana resiko
kematian berkurang   oleh CABG, (CER-EER)/CER=(0,305-
0,264)/0,305=0,041/0,305=13%.Absolute risk reduction (atau
perbedaan resiko), misalnya jumlah absolut dimana CABG
mengurangi resiko kematian pada 10 tahun kemudian, yaitu
0,305-0,264=0,041 (41%).Number needed to  treat, misalnya
berapa banyak pasien membutuhkan CABG untuk mencegah,
dengan rata-rata, satu kematian bertambah selama 10 tahun,
adalah pengurangan resiko absolut (absolute risk reduction) yang
saling berkaitan, 1/ARR=1/0,041=24.Cara yang terakhir untuk
menggambarkan dampak dari pengobatan yang ingin saya
perkenalkan adalah odd ratio. Lihat kembali pada tabel 5.2
engkau akan melihat bahwa “odd” yang meninggal
dibandingkan dengan “odd” yang hidup untuk pasien pada
kelompok pengobatan medis adalah 404/921=0,44, dan untuk
pasien pada kelompok CABG adalah 350/974=0,36. Ratio dari
odd ini adalah menjadi 0,44/0,36=1,22, yang merupakan cara
lain dalam mengungkapkan fakta penelitian ini, pasien pada
kelompok CABG melakukan hal yang lebih baik.Rumus umum
untuk mengkalkulasi dampak “garis bawah” dari sebuah
intervensi dijelaskan di Lampiran 4 dan untuk mendiskusikan
apakah nilai sangat bermanfaat dan pada situasi yang mana,
lihatlah artikel Jaenschke dkk dalam seri “Statistik Dasar untuk
Kedokteran” atau Bab 7 (Menentukan terapi yang terbaik) dari
buku teks epidemiologi klinik Sackett
dkk.   5.7RingkasanKemungkinan terjadi kesalahan yang serius
dengan mengambil kemampuan (dan/atau kejujuran intelektual)
statistik pengarang sebagai jaminan. Statistik dapat menjadi
sains yang mengintimidasi dan pemahaman terhadap point
terbenarnya selalu membutuhkan bantuan para ahli. Tetapi
saya berharap bahwa bab ini menunjukkan kamu bahwa
statistik yang digunakan dalam sebagian besar artikel penelitian
medis dapat dievaluasi oleh non ahli dengan menggunakan
checklist yang sederhana seperti yang terdapat pada Lampiran
1. Terlebih lagi, engkau sebaiknya mengecek kembali artikel
yang engkau baca (atau yang engkau tulis) untuk mengetahui
kesalahan umum yang diberikan pada kotak 5.1.   

Anda mungkin juga menyukai