Anda di halaman 1dari 97

STATISTIK FARMASI

BAB 1 KONSEP DASAR DAN DEFINISI

1.1 Variasi Dalam Studi Ilmiah


1.2 Tipe-Tipe Dalam Variabel
1.3 Sampel dan Populasi Statistik
1.4 Sampel dan Teknik Pengambilan Sampel

BAB 2 PENGUKURAN KECENDERUNGAN MEMUSAT DAN VARIASI DATA

2.1 Pengukuran Kecenderungan Memusat


2.2 Pengukuran Variasi Data
2.3 Akurasi dan Presisi

BAB 3 PENYAJIAN DATA

3.1 Aturan-Aturan Dasar Dalam Pembentukan Grafik


3.2 Tipe-Tipe Grafik dan Plot

BAB 4 PROBABILITAS DAN DISTRIBUSI PROBABILITAS

4.1 Teori Probabilitas Dasar


4.2 Distribusi Probabilitas

BAB 5 PENGUJIAN HIPOTESIS STATISTIK

5.1 Teori Dasar dari Pengujian Hipotesis Statistik


5.2 Kesalan Dalam Pembuatan Keputusan (Kesalahan Tipe I dan Tipe II)
5.3 Kekurangan Suatu Uji Statistik
5.4 Pemilihan Uji Statistik

BAB 6 PERKIRAAN STATISTIK MENGGUNAKAN INTERVAL KEPERCAYAAN

6.1 Konsep Interval Kepercayaan


6.2 Interval Kepercayaan untuk Rerata Populasi dan Distribusi Normal
6.3 Interval Kepercayaan untuk Perbedaan antar Rerata
6.4 Interval Kepercayaan untuk Simpangan Baku
6.5 Interval Kepercayaan untuk Proporsi
6.6 Interval Kepercayaan untuk Perbedaan antar Proporsi
6.7 Interval Kepercayaan dan Distribusi t

BAB 7 PENGUJIAN HIPOTESIS STATISTIK SATU SAMPEL

7.1 Uji-Uji Statistik satu Sampel Parametrik


7.2 Uji Statistik Satu Sampel Nonparametrik
BAB 8 PENGUJIAN HIPOTESIS STATISTIK UNTUK DUA SAMPEL BEBAS

8.1 Uji Statistik Parametrik untuk Dua Sampel Bebas


8.2 Uji Statistik NonParametrik untuk Dua Sampel

Daftar Pustaka

1.David S. Jones, Alih Bahasa, Hesti Utami Ramadaniati, M.Clin.Pharm.Apt. dan Drs. H.
Harrizul Rival, M.S., Statistik Farmasi
2.Handoko Riwidikdo, Statistik Kesehatan
3.Sudjana, Metode statistika.
Bab 1 Konsep Dasar dan Definisi
Istilah Statistika dapat diuraikan sebagai ilmu pengetahuan dalam pengumpulan, analisis,
dan interpretasi data yang berhubungan dengan sekumpulan individu (Kendall dan Bucland,
1982)
Statistik dapat dibagi dua sub-kategori, yaitu Deskriptif dan Inferensial.
Statistik Deskriptif memberikan informasi umum mengenai sifat-sifat statistik yang
mendasar dari suatu data, contohnya rerata, median, simpangan baku, koefisien
variasi.
Statistik Inferensial terlibat dalam pembuatan kesimpulan-kesimpulan berdasarkan
informasi yang diperoleh dari prosedur-prosedur percobaan, misalnya efek anti
hipertensi suatu obet A secara nyata lebih besar dari pada obat B, dan lain-lain
Dalam kajian ilmiah, sattistika sangat berguna untuk digunakan dalam beberapa hal,
meliputi:
1) Pengumpulan data
2) Pendeskripsian numerik data
3) Pembuatan sebuah hipotesis yang berkenaan dengan sifat data
4) Pemahaman relevansi data dengan menggunakan metode-metode statistik yang
sesuai
5) Perancangan percobaan untuk menguji hipotesis atau untuk konsolidasi lebih jauh
atau menolak sebuah hipotesis.
Mahasiswa Farmasi strata satu dan pascasarjana sering menanyakan, kenapa mereka perlu
mempelajari ilmu statistik karena sudah ada ahli statistik yang sangat terlatih ? Jawabnya
perlu pelatihan baik teorinya maupun alat programnya memerlukan pelatihan yang sangat
lama untuk diketahui oleh bidang farmasi.
Contohnya
Sifat dan tingkat variasi dari data kimia dan biologi
Relevansi dan pengertian istilah istilah kunci statistika (misalnya, signifikansi,nilai-p,
simpangan baku, variabel)
Interpretasi yang sesuai dengan data yang diperoleh selama kajian penelitian.
Rancangan ilmiah yang sebenarnya

1.1 Variasi Dalam Studi Ilmiah

Suatu variabel dapat dijelaskan sebagai suatu sifat yang dimiliki individu-individu dalam
suatu sampel yang membuatnya berbeda dalam beberapa cara yang dapat diketahui (Sokal
dan Rohlf, 1981). Contohnya variabel meliputi:
1) Tinggi pria pada suatu daerah tertentu
2) Berat tablet-tablet yang berasal dari satu bets
3) Konsentrasi obat dalam plasma subyek-subyek klinis setelah pemberian obat dengan
pemberian dosis tertentu
4) Konsentrasi kolesterol dalam plasma subyek laki-laki
Istilah variabilitas terkait dengan proses penampilan ukuran biologi dan kimia, yaitu
ukuran berulang suatu sifat tertentu akan menunjukkan hasil numerik yang berbeda.
Kehadiran variabilitas tersebut merupakan alasan utama akan perlunya statistik
inverensial. Sebagai contoh, anggaplah ada dua analis farmasi melakukan uji
spektrofotometri untuk menetukan konsentrasi suatu obat dalam suatu larutan
tertentu. Hasil uji akan bervariasi karena beberapa alasan, meliputi:
Keterampilan analisis relatif kedua analis tersebut
Peralatan yang digunakan untuk analis
Kualitas (dan kebersihan) kuvet
Ketidakakuratan dalam pengenceran larutan awal

1.2 Tipe-Tipe Variabel

Sebelum melakukan statistika, baik deskriptif maupun inferensial, sifat variabel yang
dipertanyakan harus dikarakterisasi karena akan berhubungan langsung dengan pilihan
teknik statistik yang paling sesuai. Secara khusus, variabel dapat dijelaskan sebagai berikut:
Variabel pengukuran (kontinu dan diskrit)
Variabel berperingkat
Sifat-sifat

1.2.1 Variabel Pengukuran


Variabel pengukuran adalah variabel yang dapat dituliskan dalam bentuk urutan numerik.
Ada dua tipe variabel pengukuran, yaitu variabel kontinu dan variabel diskrit.

1.2.1.1 Variabel Kontinu


Variabel-variabel kontinu dapat memiliki nilai numerik yang tak terhingga antara titik
terendah dan tertinggi pada skala. Contohnya, konsentrasi obat dalam sebuah produk
farmasetik. Biasanya, produk farmasetik dipersyaratkan oleh pihak berwewenang pemberi
lisensi untuk mengandung antara 90 dan 105% jumlah nominal selama priode penyimpanan.
Karena itu sebuah tablet yang secara nominal mengandung 100 mg senyawa aktif, batas
spesifikasinya adalah 90 105 mg. Kandungan obat dalam tablet-tablet dari bets ini
dianggap sebagai sebuah variabel kontinu karena tablet-tablet dari bets ini dapat menerima
sejumlah tak terhingga kemungkinan dalam batas-batas yang ditentukan.

1.2.1.2 variabel Berperingkat


Skala-skala berperingkat juga merupakan contoh variabel kontinu karena meskipun skala ini
tidak menunjukkan ukuran fisik, skala-skala tersebut melambangkan sistem urutan numerik.
Contohnya digambarkan dalam tulisan ilmiah oleh Keane dkk. (1994) yang memeriksa
jumlah garam-garam anorganik (pembentukan kerak) yang tersimpan dalam sten ureter in
vivo secara visual setelah pengambilan sten melalui pembedahan. Peringkat berikut
digunakan:
0 tidak ada pembentukan kerak
1 endapan mikroskopis pada < 50% dari sten
2 endapan mikroskopis pada > 50% dari sten
3 endapan makroskopis kecil pada < 50% dari sten
4 endapan makroskopis kecil pada > 50% dari sten
5 endapan makroskopis berat

Jadi, walaupun nilai-nilai yang digunakan tidak memberikan ukuran pasti dapat diamati
bahwa seiring peningkatan pembentukan kerak, nilai numeriknya juga akan meningkat.
1.2.1.3 Variabel Diskrit (tidak kontinu, meristik)
Variabel diskrit adalah variabel-variabel yang mempunyai jumlah nilai yang tetap.
Contohnya meliputi:
Jumlah serangan asma yang tercatat dalam suatu kelompok
Jumlah koloni mikroorganisme
Jumlah kematian yang berhubungan dengan operasi tertentu
Variabel-variabel diskrit selalu mempunyai nilai yang utuh (bilangan bulat)

1.2.1.4 Variabel Nominal (sifat-sifat)


Variabel nominal tidak dapat diukur karena sifatnya yang kualitatif. Contohnya meliputi jenis
kelamin, kelompok usia, kelompok agama, efek samping dari penggunaan suatu obat, efek
klinis dari pengobatan dan plasebo. Secara khusus, sifat-sifat yang digabungkan disebut
sebagai data pencacahan (Tabel 1.1)

Tabel 1.1 Kejadin kandidosis oral pada sebuah rumah sakit daerah dalam satu bulan
Variabel nominal (jenis kelamin) Kejadian yang dilaporkan
Pria 59
Wanita 82
Jumlah total kasus 141

1.3 Sampel dan Populasi Statistik

Dua hal penting yang harus dipahami, yaitu sampel dan populasi
Populasi dapat didefinisikan sebagai jumlah keseluruhan dari pengamatan yang
menyusun kelompok tertentu; setiap sifat khusus yang berhubungan dengan sebuah
populasi disebut sebagai parameter
Sampel umumnya merupakan kelompok pengamatan yang relatif kecil yang diambil
dari populasi yang ditetapkan.
Contohnya disajikan dalam Tabel 1.2

Tabel 1.2 Contoh contoh Populasi dan Sampel


Contoh (Tugas) Parameter Populasi Sampel
Karakterisasi berat tablet Semua tablet dalam 100 tablet yang disisihkan
dalam suatu bets tertentu bets tersebut dalam penimbangan

Pengukuran kejadian penyakit Semua penduduk 300 pasien yang mendatangi


jantung di Skotlandia pada Skotlandia yang berusia klinik dokter umum pada lokasi
pasien yang berusia di atas 45 di atas 45 tahun geografis tertentu di Skotlandia
tahun

Evaluasi Nilai IQ anak-anak Semua anak sekolah 100 anak kelas 7 yang studi di
sekolah kelas 7 di Irlandia Utara kelas 7 di Irlandia Uara sekolah tersebut

Evaluasi kejadian asma dalam Semua pekerja 50 pekerja pada perusahaan


perusahaan kimia tertentu yang perusahaan tersebut tersebut
mempekerjakan 500 pekerja
1.4 Sampel dan Teknik Pengambilan Sampel

Penggunaan data sampel untuk memberikan informasi mengenai parameter populasi yang
telah diperkenalkan. Salah satu komponen terpenting dari setiap percobaan adalah proses
pengambilan sampel. Karena salah memilih metode pengambilan sampel yang paling sesuai
akan menyebabkan bias dan mungkin pembuatan kesimpulan statistik tidak tepat. Beberapa
metode pemilihan sampel diantaranya adalah pengambilan sampel acak dan pengambilan
sampel bertingkat.

1.4.1 Pengambilan Sampel Acak


Pengambilan sampel acak adalah suatu cara di mana semua anggota mempunyai
kesempatan yang sama untuk dipilih tanpa interfensi siapapun. Contoh sehari-hari tentang
pengambil sampel acak dengan pilihan angka-angka (dalam bola) pada permainan bingo dan
lotere. Untuk menjamin tidak adanya bias, dan akibat estimasi parameter-parameter
populasi dari statistik sampel akan akurat telah dikemukakan oleh (Snedecor dan Cochran,
1980) bahwa efikasi dari prosedur pengambilan sampel acak akan meningkat jika variabilitas
populasi kecil dan homogen.

1.4.2 Pengambilan Sampel Bertingkat


Pengambilan sampel bertingkat merupakan prosedur yang lebih kompleks karena populasi
yang diperiksa dibagi lagi dalam tingkatan (kelompok-kelompok) dan kemudian sampel
diambil secara acak dari tiap tingkatan yang ditentukan. Tujuannya untuk mengurangi
kesalahan pengambilan sampel atau bias alami. Teknik pengambilan sampel bertingkat telah
digunakan dengan baik dalam ilmu farmasi dan kedokteran. Contoh, dalam penyelidikan
efek pengganti saliva pada lubrisitas rongga mulut pada pasien xerostomia, pasien dapat
dipisahkan ke dalam tingkatan yang berbeda berdasarkan etiologi, yaitu sindrom Syogren,
radioterapi kepala dan leher, pasien yang diresepkan antidepresan trisiklik, dan sebagainya.
Pasien-pasien dalam kategori ini menderita xerostomia, tetapi etiologinya berbeda-beda,
sehingga jika tidak menggunakan pengambilan sampel bertingkat, kesalahan yang
berhubungan dengan prosedur percobaan akan meningkat.
Dalam percobaan farmasi, pengambilan sampel bertingkat digunakan pada titik-titik
tertentu pada berbagai tahahapan dalam proses pembuatan. Contoh, dalam pembuatan
suatu formulasi cairan, sampel-sampel produk diambil dari bagian atas, tengah dan bawah
dari bejana pengisian sebelum dilakukan proses pengisian.
BAB 2 PENGUKURAN KECENDERUNGAN MEMUSAT DAN VARIASI
DATA
Dua sifat yang paling sering digunakan untuk menjelaskan sifat dari rangkaian data adalah
sifat memusat (kecenderungan) dan variabilitas

2.1 Pengukuran Kecenderungan Memusat

Estimasi sifat memusat dari data mungkin merupakan perhitungan statistik yang paling
umum digunakan oleh sebagian besar mahasiswa. Khususnya, sifat memusat dari data dapat
dijelaskan dengan mudah melalui sejumlah metode dan istilah, meliputi rerata (misalnya,
rerata aritmetika, rerata berbobot), median dan modus.

2.1.1 Rerata Aritmetika

Istilah rerata (average atau mean) merupakan metode yang paling terkenal untuk
menjelaskan sifat memusat data, dan berkenaan dengan pusat dari distribusi data.
Penggunaan rerata paling sesuai ketika data terdistribusi secara simetris disekitar nilai
rerata, yaitu distribusi Gaussian. Rerata aritmetika digambarkan dengan rumus matematika
sebagai berikut:

=1

di mana = notasi jumlah
= semua data dari j = 1 sampai j = N.
N = jumlah data yang masuk dalam perhitungan

Contoh 2.1
Penurunan tekanan darah (mmHg) dari 6 pasien 4 jam setelah pemberian satu dosis baku
suatu obat anti hipertensi baru ditunjukkan pada tabel 2.1. Hitunglah rerata penurunan
tekanan darah dari 6 pasien tersebut.

Tabel 2.1 Efek suatu obat anti hipertensi terhadap penurunan tekanan darah dari 6 pasien
Nomor Pasien Penurunan tekanan darah (mmHg)
1 20
2 25
3 21
4 34
5 41
6 37

6=1 20+25+21+34+41+37 178


Rerata Sampel () = = = = 29,67
6 6 6

2.1.2 Rerata (Aritmetika) Berbobot

Rerata berbobot sering digunakan ketika data dibagi ke dalam kelompok-kelompok, tiap
kelompok memiliki bobot (yaitu, kepentingan) yang berbeda. Rumus matematikanya dari
rerata berbobot adalah sebagai berikut:

=1
=
di mana = notasi jumlah
= semua data dari j = 1 sampai j = N.
N = jumlah data yang masuk dalam perhitungan
= pemberatan (frekuensi) dari tiap kelompok atau rangkaian.

Contoh 2.2
Efek suatu dosis tertentu dari obat analgesik yang tersedia dipasaran untuk menekan rasa
nyeri setelah pemberian rangsangan nyeri dievaluasi pada 20 sukarelawan menggunakan
skala analog visual. Hasilnya disajikan dalam tabel 2.2. Hitunglah rerata penilaian rasa nyeri
menurut 20 sukarelawan.

Tabel 2.2 Penilaian rasa sakit yang dicatat dari 20 sukarelawan setelah pemberian analgesik
yang ada dipasaran dan pemaparan pada rangsangan nyeri
Jumlah Sukarelawan Pemberian rasa sakit menurut para sukarelawan
2 3 (sangat nyeri)
12 2 (cukup nyeri)
6 1 (sedikit nyeri)

Penyelesaian:
3=1 (23)+(122)+(61) 36
Rerata berbobot Sampel () = = = 20 = 1,8
20 20

Contoh lain
Misalkan seorang mahasiswa telah memperoleh masing-masing 75% dan 70% dalam
komponen ujian dan tugas dalam sebuah hasil, mata kuliah ini tidak memberikan kontribusi
yang sama terhadap nilai akhir, misalnya masing-masing berbobot 80% dan 20%. Berapakah
nilai akhir (rerata berbobot) yang diperoleh mahaswiswa tersebut.
Jawabnya:
2=1 (8075)+(2070)
Rerata berbobot mahasiswa () = = = 74%
100 100

2.1.3 Median

Median merupakan metode alternatif untuk menjelaskan sifat memusat dari data tidak
terpengaruh oleh sifat dari sebaran data. Jadi median merupakan nilai tengah, atau rerata dari
dua nilai tengah, dari serangkaian data yang diatur berurutan besarnya. Perhitungan median
dan perbandingan dengan rerata dari satu rangkaian data asimetris ( data tidak terdistribusi
secara tidak merata) disekitar rerata.
Contoh 2.3
Perlekatan patogen Candida albicans oportunistik pada 10 sel epitelial bukal (BEC) secara in
vitro diperiksa dan datanya ditunjukkan dalam Tabel 2.3. Hitunglah nilai rerata dan median
untuk profil perlekatan patogen ini.
Tabel 2.3 Jumlah blastospora Candida albicans yang melekat pada sejumlah tertentu sel epitel
bukal yang diperiksa menggunakan metode in vitro
Nomor sel epitel Jumlah C, albicans yang melekat
1. 2
2. 0
3. 0
4. 6
5. 4
6. 24
7. 9
8. 6
9. 1
10. 0
Jawab:
Tahap 1
1 2+0+0+6+4+24+9+6+1+0
Rerata 10
=1 = = 5,2 blastospora dari C, albicans pada tiap sel
10
epitel bukal.

Tahap 2
Data disususn dari terkecil, yaitu; 0, 0, 0, 1, 2, 4, 6, 6, 9, 24
2+4
Kita tentukan nilai tengah ada pada posisi 5 dan 6. Jadi median = 2 = 3 blastospora dari C,
albicans pada tiap sel epitel bukal.

Tahap 3 Kesimpulan
Deskripsi sifat memusat data menggunakan rerata dan median dapat menghasilkan hasil
numerik yang berbeda. Hal ini disebabkan oleh nilai-nilai ekstrim dalam satu rangkaian data
tertentu, misalnya nilai 24 dalam kasus di atas, mempunyai efek yang lebih besar terhadap
nilai rerata dibandingkan median. Oleh karena itu, median lebih sesuai dalam menjelaskan
sifat memusat data yang mempunyai nilai-nilai ekstrim.

2.1.3.1 Pemilihan Rerata atau Median untuk Menjelaskan Kecenderungan Memusat

Untuk data yang berdistribusi normal, nilai numerik dari rerata dan median akan sama
dan keduanya dapat digunakan dengan baik untuk menjelaskan titik pusat dari distribusi
secara akurat. Namun, pemilihan parameter mana yang akan digunakan menjadi lebih sulit
ketika data menunjukkan ketidaknormalan. Kesalah pahaman yang umum terjadi dikalangan
mahasiswa statistik adalah bahwa rerata hanya digunakan untuk menjelaskan sifat memusat
data yang terdistribusi secara normal, sementara median hanya digunakan untuk menjelaskan
sifat memusat data yang tidak terdistribusi secara normal. Sebenarnya baik rerata maupun
median dapat digunakan untuk menjelaskan sifat-sifat memusat dari data yang terdistribusi
agak condong (yaitu non-normal). Pada kondisi ini, nilai rerata dan median akan berbeda dan
lebih beragam bila kecondongan distribusi meningkat. Jika data condong secara positif (yaitu
terdistrbusi kearah sumbu y), secara numerik rerata akan lebih besar dari median; sebaliknya
juga berlaku pada distribusi yang condong secara negatif. Penggunaan median lebih disukai
dari pada rerata untuk deskripsi distribusi-distribusi yang mempunyai nilai-nilai ekstrim.

2.1.4 Modus
Modus dapat digambarkan sebagai ukuran yang paling sering terjadi dalam satu rangkaian
data.
Contoh 2.5
Konsentrasi obat (mg/ml) dalam 10 vial produk parenteral yang tersedia di pasaran telah
ditetapkan menggunakan metode kromatografi. Hitunglah modus dari konsentrasi teramati
pada Tabel 2.5 di bawah

Tabel 2.5 Konsentrasi suatu obat dalam 10 vial produk yang tersedia secara komersial
Nomor vial Konsentrasi obat (mg/ml)
1 200
2 205
3 205
4 201
5 199
6 195
7 202
8 205
9 205
10 207

Peny:
Nilai yang paling sering muncul dari rangkaian data di atas adalah 205 mg/ml (empat)
sehingga nilai nilai ini disebut modus.

Dengan mengacu pada distribusi frekuensi, modus secara numerik sama dengan rerata dan
median dalam distribusi simetris. Dalam distribusi simetris, sebuah hubungan empiris antara
rerata, median dan modus:
= 3( )

2.2 Pengukuran Variasi Data

Metode-metode yang diperkenalkan sebelumnya mengenai sifat memusat data, metode-


metode tersebut tidak memberikan informasi mengenai variabilitas data, yang merupakan
asal perolehan ukuran-ukuran memusat tersebut, sehingga diperlukan adanya pengukuran
variabilitas atau dispersi data.

2.2.1 Kisaran
Kisaran dapat didefinisikan sebagai perbedaan antara nilai terbesar dan terkecil dari satu
rangkaian hasil pengukuran. Kisaran dari rangkaian data A dan B dalam Tabel 2.6 adalah
sebagai berikut:

Tabel 2.6 Nilai-nilai individu yang berhubungan dengan dua rangkaian data yang memiliki
rerata yang identik
Rangkaian data A Rangkaian data B
10 28
20 29
30 30
20 29
10 28
Nilai tengah = 30 Nilai tengah = 30
Rangkaian data A: kisaran = 30 10 = 20
Rangkaian data B: kisaran = 30 28 = 2

Penggunaan kisaran untuk menjelaskan variasi data secara akurat sangatlah terbatas
karena perhitungannya hanya melibatkan dua ukuran dari rangkaian data (yaitu titik tertinggi
dan terendah dari data). Karena itu, kisaran tidak benar-benar menjelaskan variasi dari
keseluruhan rangkaian data. Selanjutnya untuk estimasi variabilitas populasi dari data sampel,
kisaran dianggap tidak sesuai karena kecil kemungkinan suatu sampel akan mengandung nilai
tertinggi dan juga nilai terendah dalam suatu populasi. Jadi, kisaran sampel dianggap sebagai
estimasi yang lemah (yaitu penaksiran rendah) dari kisaran suatu populasi. Penggunaan
utama dari kisaran adalah untuk mendefinisikan variabilitas yang berhubungan dengan data
yang tidak terdistribusi secara normal.

2.2.2 Simpangan Rerata

Simpangan rerata (mean deviation, MD), umumnya diistilahkan momen mutlak pertama,
adalah suatu ukuran variasi data yang dihitung sebagai simpangan rata-rata dari rerata. Rerata
digunakan sebagai ukuran kecenderungan memusat, suatu istilah yang menjelskan simpangan
disekitar parameter pusat.
Dalam istilah matematis, simpangan rerata ditulis sebagai
( )
=
di mana ( ) adalah nilai mutlak dari simpangan (perbedaan) nilai-nilai dalam rangkaian
data dari rerata rangkaian data dan N adalah jumlah pengamatan dalam rangkaian data.

Contoh 2.6
Suatu larutan tetrasiklin hidroklorida telah dikirim ke laboratorium pengendalian mutu pada
sebuah perusahaan farmasi untuk dianalisis. Kandungan obat dari alikuot larutan ini diukur
menggunakan spektroskopi ultraviolet dan hasilnya disajikan dalam Tabel 2.7. Hitunglah
simpangan rerata kandungan obat larutan.

Tabel 2.7 Kandungan tetrasiklin hidroklorida dalam enam alikuot suatu larutan
Nomor alikuot Kandungan tetrasiklin hidroklorida (mg/ml)
1 100,6
2 98,3
3 98,9
4 95,1
5 104,5
6 105,5

Peny:
Tahap 1 Menghitung rerata
6=1 (100,6 + 98,3 + 98,9 + 95,1 + 104,5 + 105,5)

= = = 100,5 /
6
Tahap 2 Menghitung perbedaan rerata

( ) (100,6100,5)+(98,3100,5)+(98,9100,5)+(95,1100,5)+(104,5100,5)+(105,5100,5)
= =
6
= 3,1 /
2.2.3 Varians

Dalam perhitungan simpangan rerata untuk menghindari dari tanda minus dari hasil
pengukuran tertentu adalah dengan mengkuadratkan perbedaan (simpangan) tersebut.
Penjumlahan perbedaan yang dikuadratkan secara berturut-turut menghasilkan suatu istilah
statistik dasar, yaitu jumlah kuadrat. Secara matematiss, jumlah kuadrat (sum of square,SS)
diuraikan sebagai berikut:
= ( )2
dengan dan mempunyai definisi yang sama seperti sebelumnya.
Varians sering disebut sebagai rerata jumlah kuadrat dan dituliskan sebagai
( )2

2 =
dengan 2 adalah varians dari suatu populasi, adalah nilai numerik dari tiap hasil
pengukuran, adalah nilai rerata populasi dan N adalah jumlah pengamatan.
Selanjutnya untuk varians sampel ( 2 ), yaitu estimasi varians populasi ( 2 ), yang
paling sesuai digambarkan dengan
( )2

2 = 1
dengan adalah rerata data sampel dan N jumlah pengamatan dalam sampel.
Pengertian dari persamaan yang menyatakan varians harus diperhatikan.
Pertama, penulisan varians 2 atau 2 tergantung dari apakah data populasi atau
sampel yang sedang digunakan
Ke dua, persamaan-persamaan yang menggambarkan varians data populasi dan
sampel pada dasarnya berbeda pada penyebutnya, yakni N untuk varian populasi dan
N - 1 untuk varians sampel
Alasan utama adanya perbedaan antara kedua persamaan ini berhubungan dengan
ketidakakuratan relatif terhadap estimasi varians populasi dari varians sampel ketika
persamaan untuk sampel hanya meliputi N, jumlah pengamatan, sebagai penyebut. Dalam
situasi ini, varians sampel dianggap menjadi perkiraan yang bias dari varians populasi, dan
penulisan (N-1) digunakan untuk menghilangkan bias ini.
Tahap ini disarankan untuk memperhatikan hubungan antara variansi sampel dan
variansi populasi. Tidak seperti variansi populasi, variansi sampel adalah ukuran variabel.
Karena itu, jika suatu sampel acak diambil dari suatu populasi, misalnya jika 100 tablet
diambil suatu bets berisi 1000000 tablet (populasi) dan berat tiap tablet ditimbang, variansi
sampel (100 tablet) tidak akan tepat sama dengan variansi populasi. Mengapa demikian ?
Karena, jika sampel berulang diambil dari bets berisi 1000000 tablet dan variansi berat dari
tiap rangkaian sampel diukur, variansi dari tiap-tiap sampel yang berbeda ini akan sedikit
berbeda. Perbedaan ini merupakan akibat langsung dari sifat variabel dari variansi sampel,
yang disebabkan oleh faktor-faktor yang dijelaskan dalam bab pertama. Contohnya,
perbedaan dalam berat tiap bets, variabilitas yang disebabkan ketidakakuratan timbangan,
ketidakakuran operator dll. Akan tetapi, jika sampel-sampel sebanyak N diambil secara acak
berulang dari populasi dan variansi-variansi ditentukan (menggunakan N 1 sebagai Konsep
penting penggunaan N 1 sebagai penyebut untuk perhitungan variansi sampel dijelaskan di
bawah ini.
Andaikan suatu populasi tersusun dari tiga titik data, yaitu 3, 5 dan 7. Dari informasi
ini, variansi populasi dapat diperoleh menggunakan persamaan berikut:
( )2
2 =
Peny:
Nilai nilai individu ( ) - ( )2
3 -2 4
5 0 0
7 2 4
Sehingga
( )2
(4+0+4)
2 = = 3 = 2,67

Dari populasi di atas sembilan sampel individu, masing-masing tersusun dari dua nilai
dengan cara pengambilan sampel berulang dan tiap pengambilan sampel, sampel
dikembalikan sehingga setiap mempunyai kesempatan yang sama untuk diambil. Hasil dari
pengambilan sampel, yaitu berbagai pasangan data diperoleh sebagai berikut:

( )2
Sampel Nilai ( )2 2
1
1 (3,3) (3 3)2 = 0 (0 + 0)/1 0
(3 3)2 = 0
2 (5,5) (5 5)2 = 0 (0 + 0))/1 0
(5 5)2 = 0
3 (7,7) (7 7)2 = 0 (0 + 0)/1 0
(7 7)2 = 0
4 (3,5) (3 4)2 = 1 (1 + 1)/1 2
(5 4)2 = 1
5 (5,7) (5 6)2 = 1 (1 + 1)/1 2
(7 6)2 = 1
6 (5,3) (5 4)2 = 1 (1 + 1)/1 2
(3 4)2 = 1
7 (7,5) (7 6)2 = 1 (1+1)/1 2
(5 6)2 = 1
8 (3,7) (3 5)2 = 4 (4+4)/1 8
(7 5)2 = 4
9 (7,3) (7 5)2 = 4 (4+4)/1 8
(3 5)2 = 4

Variansi sampel rerata dapat dihitung menjadi:


0+0+0+2+2+2+2+8+8
2 = = 2,67
9
Latihan numerik ini menegaskan hal-hal sebagai berikut:
Variansi-variansi sampel dari kelompok sampel acak yang diambil dari suatu populasi
mungkin tidak tepat sama dengan yang lain karena sifat variabel variansi sampel
Variansi dari sampel pengukuran acak tunggal tidak memberikan estimasi yang baik
untuk variansi populasi tempat sampel didapat
Suatu estimasi variansi populasi yang baik dapat diperoleh dari data sampel dengan
mengetahui bahwa penyebut pada persamaan yang digunakan untuk menghitung
variansi sampel dimodifikasi menjadi N 1 dan selanjutnya rerata dari beberapa
variansi sampel dihitung.
2.2.4 Simpangan Baku

Simpangan baku merupakan suatu ukuran dispersi data yang umum digunakan dari
definisi akar kuadrat positif dari variansi dan ditulis dengan rumus sebagai berikut:
Simpangan baku populasi
( )2
=
Simpangan baku Sampel
( )2
= 1

Contoh 2.7
Suatu bets tablet bolus telah diolah dan sedang menunggu pelulusan dari laboratorium
pengendalian mutu pada sebuah perusahaan Farmasi. Salah satu sifat tablet bolus yang
harus diukur adalah waktu yang dibutuhkan untuk pelepasan 50% muatan awal obat
dalam bolus (50% ) menggunakan uji disolusi yang dijelaskan dalam the British
Pharmacopoeia (1998). Tabel 2.8 menunjukkan nilai 50% dari 15 bolus yang disampel
secara acak dari bets tersebut. Hitung rerata dan simpangan baku dari waktu yang
dibutuhkan untuk pelepasan 50% muatan awal obat dari bolus.

Tabel 2.8 Waktu yang dibutuhkan untuk disolusi 50% massa awal obat dari 15 tablet
bolus yang berasal dari satu bets tunggal
Nomor bolus 50% (jam)
1 20,2
2 21,6
3 24,5
4 28,6
5 22,6
6 24,0
7 21,9
8 22,0
9 26,1
10 25,3
11 23,4
12 20,1
13 23,5
14 24,0
15 25,9

Peny:
Tahap 1 Menghitung rerata (), yaitu
15
=1 20,2 + 21,6 + 24,5 + + 25,9 353,7

= = = = 23,6
15 15
Tahap 2 menghitung simpangan baku sampel (s)

)2 (20,2 23,6)2 + (21,6 23,6)2 + + (25,9 23,6)2


= =
1 15 1
= 5,361 = 2,3 jam
Jadi rerata dan simpangan baku dari 50% sampel yang diambil dari suatu bets tablet
bolus berturut-turut adalah 23,6 jam dan 2,3 jam.

2.2.4.1 Uraian Umum Mengenai Simpangan Baku

Simpangan baku merupakan ukuran dispersi data yang paling sering digunakan karena
dapat berhubungan dengan probabilitas dari ukuran yang terjadi dalam wilayah tertentu
pada distribusi frekuensi. Jadi, dalam distribusi normal (simetris) dan tentunya dalam
distribusi cukup condong (asimetris).
68,27% dari semua nilai tercakup dalam kisaran numerik yang dinyatakan dengan
+ dan , yaitu satu simpangan baku disekitar rerata.
95,45% dari semua nilai tercakup dalam kisaran numerik yang dinyatakan dengan
+ 2 dan 2, yaitu satu simpangan baku disekitar rerata.
99,73% dari semua nilai tercakup dalam kisaran numerik yang dinyatakan dengan
+ 3 dan 3, yaitu satu simpangan baku disekitar rerata.

Dalam contoh yang digambarkan di atas mengenai waktu yang dibutuhkan untuk
pelepasan 50% muatan awal obat, rerata dan simpangan baku dihitung sebesar 23,6 2,3
jam. Oleh karena itu
68,27% dari semua nilai yang tercakup dalam kisaran numerik yang dinyatakan
dengan 21,3 jam (23,6-2,3 jam) sampai 25,9 jam (23,6+2,3 jam). Maka, pada contoh
ini 10 dari15 nilai terdistribusi dalam kisaran ini.
95,45% dari semua nilai yang tercakup dalam kisaran numerik yang dinyatakan
dengan 19,0 jam (23,6-2,6 jam) sampai 28,2 jam (23,6+2,6 jam). Maka, pada contoh
ini 14 dari15 nilai terdistribusi dalam kisaran ini.
99,73% dari semua nilai yang tercakup dalam kisaran numerik yang dinyatakan
dengan 16,7 jam (23,6-6,9 jam) sampai 30,5 jam (23,6+6,9 jam). Maka, pada contoh
ini semua nilai terdistribusi dalam kisaran ini.

Contoh 2.9
Konsentrasi antibiotik penisilin (mg/5 ml) dalam lima botol suspensi untuk anak-anak
telah diperiksa menggunakan teknik iodometri. Hitunglah rerata dan simpangan baku
serta pertimbangkan kontribusi tiap pengamatan terhadap varians sampel.

Tabel 2.9 Konsentrasi antibiotik penisilin dari masing-masing lima botol suspensi untuk
anak-anak
Nomor botol Konsentrasi penisilin
1 125
2 124
3 121
4 123
5 16

Tahap 1 Menghitung rerata


5=1 125 + 124 + 121 + 123 + 16

= = = 101,8
5

Tahap 2 Menghitung varians


5=1( )2 (125 101,8)2 + (124 101,8)2 + + (16 101,8)2
2
= =
1
4
= 2302,7 ( 5 )2

Tahap 3 Menghitung simpangan baku


Simpangan baku dapat dihitung dengan = 2302,7 = 48,0 mg/5 ml

Tahap 4 Mempertimbangkan kontribusi tiap pengamatan terhadap varians sampel


Kontribusi tiap pengamatan terhadap varians adalah sbb:
(125101,8)2
12 = = 134,56 ( )2 dan seterusnya, diperoleh dalam Tabel 2.10
4 5

Tabel 2.10 Konsentrasi antibiotik dari masing-masing lima botol suspensi untuk anak-anak,
menjelaskan kontribusi masing-masing vial terhadap varians total
Nomor botol Konsentrasi penisilin Kontribusi terhdp varians
(mg/5 ml) keseluruhan
1 125 134,5
2 124 123,2
3 121 92,2
4 123 112,4
5 16 1840,4

= 2302,7 ( 5 )2
2

2.2.5 Simpangan Baku (kesalahan) rerata

Simpangan baku rerata, sering disebut kesalahan baku rerata ( Standar error of the mean,
SEM) merupakan istilah yang umum digunakan dan sayangnya sering disalahgunakan dalam
statistik.

Contoh 2.10
Suatu bets suspensi amoksilin trihidrat untuk anak-anak telah diproduksi. Sebelum pengisian,
pabrikan ingin memastikan keseragaman konsentrasi yang tersuspensi dalam bets. Untuk
memeriksanya, lima alikuot individual (100 ml) diambil dan konsentrasi tiap alikuot
ditentukan lima kali menggunakan metode kromatografi. Hasilnya ditampilkan dalam Tabel
2.11. Hitunglah kesalahan baku rerata dari rangkaian data ini

Tabel 2.11 Konsentrasi amoksilin dalam lima alikuot yang diambil dari sebuah bets untuk
tujuan pengendalian mutu
Konsentrasi amokslin trihidrat (mg/ml)
Alikuot 1 Alikuot 2 Alikuot 3 Alikuot 4 Alikuot 5
25,1 27,6 24,3 23,9 25,7
25,4 25,5 26,4 24,9 23,5
21,9 25,6 25,1 26,1 24,2
24,5 25,0 27,1 27,0 25,7
23,1 24,2 25,0 25,2 24,3
1 = 24,0 = 24,2 = 24,3 = 23,9 = 23,5
S1 = 1,5 s2 = 1,3 s = 1,1 s = 1,2 s = 1,0
Dari data di atas dapat diambil alikuot 1 sebagai berikut:

2 ( )2 / 2888,64(120)2 /5 2888,642880
= = = = 1,5 dst
1 51 4
Jika diperhatikan bahwa besarnya simpangan baku rerata lebih kecil dari simpangan baku
individu yang berhubungan dengan tiap alikuot. Ini dapat dijelaskan dengan pertimbangan
sifat pengamatan yang dilibatkan dalam perhitungan masing-masing istilah simpangan ini.
Ingatlah bahwa simpangan baku secara khusus rentan terhadap nilai nilai ekstrim. Oleh
karena itu, nilai-nilai tersebut ada dalam rangkaian data individu, simpangan baku rangkaian
tersebut akan meningkat. Sebaliknya, besarnya rerata secara relatif tidak dipengaruhi oleh
masuknya data ekstrim. Kedua efek ini ditunjukkan dalam tabel 2.12

Tabel 2.12 Rangkaian data hipotesis, menggambarkan efek darai nilai-nilai ekstrim pada
simpangan baku dan rerata
Rangkaian data A Rangkaian data B Rangkaian data C
5 5 5
7 7 7
8 8 8
9 9 9
15 21 51
= 8,8 = 10 = 16
s=

Kita dapat melihat bahwa rerata menekan efek nilai ekstrim dan akibatnya simpangan baku
dari suatu rangkaian dengan rerata tersebut akan menjadi lebih rendah:

2 ( )2 / 433,44(34,8)2 /3 433,44403,68
= = = = 3,86
1 31 2
Simpangan rerata dapat dihitung dengan mengambil rerata masing-masing rangkaian. Oleh
karena itu, meskipun variasi dari populasi tidak diketahui, simpangan baku dari suatu
rangkaian data individu (sampel) dapat digunakan untuk memperkirakan parameter ini. Teori
statisti menyatakan bahwa SEM dapat dihitung dengan membagi simpangan baku rangkaian
data dengan akar kuadrat jumlah pengamatan dalam rangkaian data (N):

=

Persamaan di atas memungkinkan kita untuk memperkirakan variasi rerata dari populasi;
yaitu jika banyak rerata diperoleh dari pengambilan sampel acak dari rangkaian data,
variasinya akan berbeda-beda dari nilai yang diperkirakan menggunakan persamaan di atas.
Ini karena nilai simpangan baku rerata yang dihitung menggunakan simpangan baku sampel
dari suatu populasi tidak akan tepat sama dengan simpangan baku rerata yang sebenarnya.
Karena simpangan baku dari satu sampel merupakan varriabel acak dan akan berbeda dari
satu sampel ke sanpel yang lain.

2.2.5.1 Uraian Umum Mengenai Simpangan Baku dan Kesalahan Baku Rerata

Pada tahap ini, kita seharusnya telah mengidentifikasi perbedaan-perbedaan utama antara
simpangan baku dan simpangan (kesalahan) baku rerata. Tanpa bermaksud untuk melakukan
pengulangan, bagian berikut ini dimaksudkan sebagai ringkasan karateristik-karateristik
utama dari istilah.
Simpangan baku sampel yang berasal dari populasi digunakan sebagai suatu perkiraan
variabilitas populasi. Akibatnya, nilai dari simpangan baku tidak diharapkan menurun
jika jumlah pengamatan dalam sampel meningkat. Namun kepercayaan yang lebih
besar terhadapa variabilitas dapat diperoleh dengan membuat jmlah pengamatan yang
lebih besar terhadap simpangan baku sampel-sampel.
Simpangan baku rerata merupakan ukuran variabilitas (presisi) dari perkiraan suatu
parameter populasi yang ditentukan, yaitu rerata. Nilai numerik dari kesalahan baku
rerata tergantung pada jumlah pengamatan yang dimasukkan dalam perhitungannya.
Secara khusus, jika ukuran sampel meningkat untuk meningkatkan presisi
pengukuran, besarnya kesalahan baku rerata menurun. Hal ini ditunjukkan dengan
penggunaan notasi dalam penyebut pada persamaan untuk menghitung parameter
ini.

2.2.6 Koefisien Variasi

Koefisien variasi (coefficient of variation, CV) adalah suatu istilah statistik yang
menunjukkan variabilitas suatu rangkaian data dan didefinisikan sebagai perbandingan antara
simpangan baku (s) dengan rerata rangkaian data ().

(%) = 100

Istilah ini memungkinkan kita untuk membandingkan variasi dari rangkaian data yang
besarnya berbeda secara langsung. Jadi, jika rerata simpangan baku dari dua rangkaian data
adalah (A) 2500 125 dan (B) 50 35, sekilas kita dapat salah mengira bahwa variasi dari
rangkaian data B (simpangan baku = 35) kurang dari dari rangkaian data A (simpangan baku
=125). Akan tetapi, perbandingan tersebut tidak berarti dan menyesatkan karena besarnya
nilai rerata dari kedua kelompok belum dipertimbangkan. Untuk mengevaluasi variabilitas
kedua rangkaian data dengan benar kedua koefisien variasi harus dihitung dan dibandingkan.
Koefisien variasi dari kedua rangkaian itu adalah:
125
Rangkaian data A: (%) = 100 = 2500 100 = 5%

35
Rangkaian data B: (%) = 100 = 50 100 = 70%
Dari kedua rangkaian ini dapat disimpulkan bahwa koefisien variasi dari rangkaian data A
lebih kecil dari data B, yang berarti menggambarkan variabilitas yang lebih besar pada data
B.
Besarnya koefisien variasi tergantung pada sifat data terkait. Khususnya dalam
percobaan analisis farmasi koefisien variasi rendah (< 3%) karena variabilitas yang
berhubungan dengan pengukurann tersebut biasanya rendah. Sebaliknya, koefisien variasi
dalam percobaan biologis, misalnya pengukuran konsentrasi plasma suatu obat dari
sukarelawan, bisa jadi cukup besar (sampai 100%) karena variabilitas pengukuran seperti itu
sering kali sangat tinggi.

2.3 Akurasi dan Presisi

Istilah akurasi dan presisi sering digunakan untuk menjelaskan sifat variabilitas data. Dengan
penggunaan khusus istilah tersebut dalam aspek-aspek tertentu dalam ilmu farmasi, misalnya
analisis farmasi, pada tahap ini, istilah-istilah ini akan dibandingkan dan dibedakan serta
dijelaskan penerapan-penerapannya yang paling sesuai.
2.3.1 Akurasi

Akurasi dapat didefinisikan dengan tepat sebagai kedekatan suatu nilai terukur dengan nilai
sebenarnya, yaitu nilai yang diharapkan tanpa adanya kesalahan. Dalam analisis farmasi,
akurasi dari suatu metode analitis umumnjya dijelaskan sebagai kedekatan nilai yang diamati
(dianalisis) dengan nilai yang diharapkan. Sejumlah metode dapat digunakan untuk
menjelaskan perbedaan antara nilai yang diamati dan nilai yang diharapkan, dan beberapa
diantaranya dijelaskan di bawah ini.

Secara matematik kesalahan mutlak dihitung menggunakan rumus;


=
dengan adalah kesalahan mutlak, O adalah nilai yang diamati atau rerata teramati
dari rangkaian nilai dan E adalah nilai yang diharapkan (sebenarnya).

Contoh
Larutan kuinin sulfat telah dianalisis menggunakan tiga metode analisis dan hasilnya
ditunjukkan dalam Tabel 2.13. Hitunglah kesalahan mutlak yang berhubungan dengan
metode-metode ini.

Metode yang paling akurat dapat diartikan sebagai metode yang memiliki nilai kesalahan
mutlak yang paling rendah, yaitu HPLC dengan deteksi ultraviolet (kesalahan mutlak = +0,01
mg/ml). Metode yang paling tidak akurat, spektroskopi ultraviolet, berhubungan dengan
kesalahan mutlak yang paling besar.

Tabel 2.13 Konsentrasi kuinin sulfat dalam larutan yang ditentukan menggunakan tiga
metode analisis
Metode analisis Nilai yang diamati Nilai yang diharapkan Kesalahan mutlak
(mg/ml) (mg/ml) (mg/ml)
KCKT dengan 2,51 2,50 +0,01
deteksi ultraviolet

Spektroskopi 3,53 2,50 +1,03


ultraviolet

Spektroskopi 2,19 2,50 -0,31


fluoresens

Kesalahan mutlak adalah suatu metode yang berguna karena akurasi suatu pengukuran dapat
ditentukan, tetapi sayangnya kesalahan mutlak dipengaruhi oleh besarnya pengukuran. Jadi
dalam metode spektroskopi fluoresens dapat dianggap relatif akurat (2,19 dibandingkan
dengan 2,50 mg/ml) dengan nilai kesalahan mutlak sebesar -0,31 mg/ml. Namun
pertimbangan contoh dengan konsentrasi kuinin sulfat dalam larutan ke dua adalah 0,5 mg/ml
dan konsentrasi larutan yang diukur dengan spetroskopi fluoresens adalah 0,19 mg/ml. Dalam
contoh ini kesalahan mutlak adalah -0,31 mg/ml identik dengan kesalahan mutlak pada
penggunaan deteksi fluoresens untuk penentuan konsentrasi larutan kuinin sulfat yang lebih
pekat (2,50 mg/ml). Akan tetapi, sangat jelas bagi kita bahwa walaupun kesalahan mutlak
terhitung ke dua metode ini identik, nilai terukur (0,19 mg/ml) bukan merupan hasil yang
akurat dari nilai sebenarnya (0,5 mg/ml). Ini kerugian utama yang berhubungan dengan
penggunaan kesalahan mutlak.

2.3.1.2 Kesalahan Relatif

Istilah ini dikembangkan untuk mengatasi masalah yang dijelaskan dalam paragraf
sebelumnya dan menggambarkan kesalahan sebagai bagian dari nilai sebenarnya
(diharapkan). Dalam perhitungan tanda perbedaan (positif dan negatif) diabaikan sehingga;

= =

Kesalahan relatif (relative error) juga dapat dinyatakan sebagai nilai persentase:

100 ()100
% = =

Keuntungan penggunaan kesalahan relatif dapat diamati dengan memperhatikan contoh


sebelumnya.Dari kolom terakhir dalam Tabel 2.14 kita dapat melihat bahwa akurasi dari
suatu pengukuran dapat dengan mudah ditentukan melalui perhitungan kesalahan relatif.
Sebagai tambahan, kesalahan relatif dapat digunakan untuk membandingkan akurasi dari
pengukuran nilai-nilai yang berbeda. Maka akurasi dari perbandingan ke dua analisis
fluoresens dari dua larutan kuinin sulfat yang memiliki kesalahan mutlak identik dapat
dibandingkan (Tabel 2.14)

Tabel 2.13 Konsentrasi kuinin sulfat dalam larutan yang ditentukan menggunakan tiga
metode analisis
Metode analisis Nilai yang di- Nilai yang di- Kesalahan Kesalahan
amati (mg/ml) harapkan(mg/ml) mutlak (mg/ml) relatif (%)
KCKT dengan 2,51 2,50 +0,01 0,40
deteksi ultraviolet

Spektroskopi 3,53 2,50 +1,03 42,20


ultraviolet

Spektroskopi 2,19 2,50 -0,31 12,40


Fluoresens

Spektroskopi 0,19 0,50 -0,31 62,00


fluoresens

2.3.2 Presisi

Presisi adalah suatu istilah statistik yang menjelaskan sebaran (variabilitas) dari satu
rangkaian pengukuran. Akan tetapi, tidak seperti akurasi, presisi tidak memberikan indikasi
kedekatan suatu pengamatan dengan kuantitas tertentu yang diharapkan. Secara khusus,
presisi yang tinggi berhubungan dengan sebaran yang rendah. Perbedaan antara presisi dan
akurasi dapat dijelaskan dalam contoh berikut yang menggambarkan volume pengisian akhir
dari suatu suspensi antasida (volume nominal, yaitu yang diharapkan, sebesar 50ml).

Contoh 2.12
Dalam laboratorium pengendalian mutu, volume pengisian dari tiga sampel suatu suspensi
antasida telah diukur dan dicatat (dalam Tabel 2.15). Berilah uraian mengenai akurasi dan
presisi volume pengisian ketiga sampel tersebut.

Tabel 2.15 Volume pengisisan sampel-sampel yang dipilih dari suatu formulasi antasida
Volume pengisian Volume pengisian Volume pengisian
sampel A (ml) sampel B (ml) sampel C (ml)
47 27 28
48 39 26
49 49 27
50 59 30
51 69 30

= 49,0
= 49,0 = 28,2
= 1,6 = 15,8 = 1,80
Kesalahan relatif dari kesalahan relatif dari Kesalahan relatif dari
rerata = 2,0% rerata = 2,0% rerata = 43,6%

Kesalahan relatif sampel A identik dengan kesalahan relatif sampel B dan karenanya kedua
sampel dianggap sebagai pengukuran yang sama akurat terhadap volume pengisian
sebenarnya (diharapkan). Sebaliknya akurasi dari rerata volume pengisian sampel C tidak
baik (kesalahan relatif 43,6%), oleh karena itu, ini dianggap menjadi gambaran yang jelek
dari volume pengisian yang sebenarnya.
Pertimbangan mengenai simpangan baku yang berhubungan dengan data yang
memberikan nilai-nilai rerata dari tiap sampel dapat digunakan untuk mengevaluasi presisi
hasil-hasil pengukuran. Rangkaian data yang berhubungan dengan sampel A mempunyai
simpangan baku yang rendah ( dan juga koefisien variasi yang rendah, yaitu 3,3), sehingga
menunjukkan tingkat penyebaran yang kecil dari rangkaian data rerata dan rangkaian data ini
dikatakan presisi. Demikian pula data yang berhubungan dengan sampel C, data ini
mempunyai simpangan baku yang rendah (dan koefisien variasi yang rendah, yaitu 6,4%) dan
juga dianggap presisi. Sebaliknya simpangan baku data yang terdapat dalam sampel B tinggi,
menunjukkan variabilitas yang besar disekitar rerata (koefisien variasi sebesar 32,2%),
sehingga rangkaian data ini dianggap tidak presisi atau menunjukkan presisi yang rendah.
Kesimpulannya:
Sampel A menunjukkan akurasi tinggi dan presisi tinggi
Sampel B menunjukkan akurasi tinggi dan presisi rendah
Sampel C menunjukkan akurasi rendah dan presisi tinggi.
BAB 3 PENYAJIAN DATA
3.1 Aturan-Aturan Dasar Dalam Pembentukan Grafik

Pembentukan grafik merupakan suatu proses yang relatif sederhana jika beberapa aturan
diingat.

3.1.1 Judul dan Kunci

Judul harus memberi informasi kepada pembaca mengenai sifat data yang dijelaskan: judul
harus ringkas, informatif, dan berkaitan dengan informasi yang terkandung dalam grafik.
Untuk grafik yang mengandung dua plot atau lebih, kunci yang menjelaskan simbol dari tiap
plot tersebut harus diberikan.

3.1.2 Sumbu

Sumbu merupakan komponen penting dalam pembentukan grafik, karena sumbu menjelaskan
dasar ruang (gambar) dari penyajian data. Grafik tersusun dari berbagai rangkaian data yang
menjelaskan hubungan antara suatu variabel tetap dan suatu variabel acak. Untuk menjamin
penyajian data grafik yang optimal, pemilihan kisaran nilai-nilai numerik pada tiap sumbu
merupakan suatu hal yang penting. Pemilihan ditunjukkan dalam contoh pustaka ilmiah,
secara grafik menyajikan efek cairan biologis terhadap pelekatan patogen saluran kemih
Staphylococcus epidermidis pada kateter dianalisis ambulatori berkelanjutan dari poliuretan
dan silikon. Ada dua hal utama yang harus diketahui dari grafik-grafik ini:
Pertama, informasi yang ditampilkan pada sumbu harus ringkas dan jelas, serta cukup
untuk membuat pembaca mengerti sifat percobaan.
Kedua, karena salah satu tujuan investigasi tersebut adalah untuk membandingkan
efek cairan biologis pada pelekatan S. Epidermidis pada kateter dengan komposisi
polimer yang berbeda, pemilihan kisaran numerik harus sama pada sumbu-sumbu dari
grafik yang berbeda.

3.1.3 Estimasi Variabilitas

Dalam kondisi tertentu, misalnya ketika penulis ingin menampilkan perbedaan-perbedaan


statistik dalam dua rangkaian data, estimasi variabilitas data penting untuk dimasukkan dalam
grafik. Dalam melakukan hal tersebut, pertama-tama dokumentasikan dasar matematik dari
simpangan baku, kesalahan baku, dan kedua pastikan bahwa garis kesalahan tidak tumpang
tindih satu sama lain, karena dapat membingungkan pembaca.

Tabel 3.1 Biaya bulanan praktek dokter umum untuk tiga tipe bentuk sediaan yang
mengandung suatu obat yang dirancang untuk pengobatan penyakit kardiovaskular
Tipe bentuk sediaan Biaya bulanan rerata ()
Lepas lambat 3000
Koyo transdermal 6500
Tablet konvensional 3800
Biaya bulanan rerata ()

8000

6000

4000

2000

0
Lepas berkelanjutan Koyo transdermal Tablet konvensional Tipe bentuk sediaan

Gambar 3.2 Biaya bulanan praktek dokter umum untuk tiga tipe bentuk sediaan yang
mengandung suatu obat yang dirancang untuk pengobatan penyakit kardiovaskular (Tabel
3.1).

3.2 Tipe Tipe Grafik dan Plot

Ada beberapa tipe grafik atau plot yang umum digunakan untuk menampilkan data ilmiah,
dan tipe-tipe ini dibagi lagi menjadi beberapa kategori utama, yaitu:
Grafik atau plot yang digunakan untuk menjelaskan hubungan antara suatu variabel
tetap (bebas) dan suatu variabel terikat (dependen)
Grafik-grafik yang digunakan untuk menyajikan distribusi data dalam bentuk gambar

3.2.1 Grafik dan Plot yang Digunakan untuk Menggambarkan Hubungan antara
Variabel Bebas dan Variabel Terikat

Kategori umum yang digunakan dalam ilmu farmasi dan ilmu pengetahuan terkait: contohnya
ditunjukkan dalam Tabel 3.2. Ada beberapa variasi format yang digunakan untuk memplot
hubungan antara data, termasuk grafik garis, grafik pencar dan grafik batang dan lain-lain.

Kerja yg dibutuhkan untuk pengeluaran spuit (N mm) Kerja yg dibutuhkan untuk pengeluaran spuit (N mm)
400 400

300 300

200 200

100 100

0 0
0 5 10 15 20 0 5 10 15 20
Konsentrasi HEC (%b/b) Konsentrasi HEC (%b/b)

(a) (b)
Kerja yg dibutuhkan untuk pengeluaran spuit (N mm)
400

300

200

100

0 5 10 20
Konsentrasi HEC (%b/b)

Gambar 3.3 Efek konsentrasi hidroksietilselulosa (hydroxyethycellulose, HEC) terhadap


kerja yang dibutuhkan unttuk mengeluarkan formulasi periodontal bioadhesif dari sebuah
spuit : (a) grafik pencar, (b) grafik garis, (c) grafik batang.

Sering kali, data ilmiah menggambarkan suatu distribusi, misalnya tinggi pria di suatu daerah
geografis tertentu. Prosedur yang berbeda untuk penyajian grafik dari data ini, prosedur yang
paling umum adalah distribusi frekuensi dan distribusi frekuensi kumulatif, histogram dan
tampilan batang dan daun.

Kekuatan regangan akhir (MPa)


22

21

20

19

18

17

16
0 10 20 30
Waktu tinggal sten dalam tubuh pasien (minggu)
Gambar 3.4 Efek waktu tinggal dalam tubuh pasien terhadap kekuatan regangan akhir dari
sten ureter poliuretan (data diambil dari Gorman et al., 1997b)

3.2.2.1 Distribusi Frekuensi

Misalkan sekitar 210 tablet telah disisihkan secara acak dari sebuah bets produksi tablet dan
ditimbang (dalam desimal). Berat yang tercatat ditampilkan dalam Tabel 3.3. Berat tablet-
tablet ini dikelompokkan dalam interval pada Tabel 3.4, kemudian disajikan dalam bentuk
grafik.
Tabel 3.4 menyajikan distribusi frekuensi untuk sebuah variabel kuantitatif, yaitu berat
tablet. Berat tablet merupakan suatu variabel kontinu dan secara teoritis dapat memiliki nilai
numerik yang tidak terbatas antara titik terendah dan tertinggi pada suatu skala, dalam hal ini
290-309 mg. Pemilihan pengelompokan yang ditunjukkan dalam Tabel 3.4 dapat berubah dan
dipilih oleh orang yang bertanggung jawab atas pemeriksaan data. Berdasarkan tujuan studi
dari sensitivitas timbangan, persyaratan pengendalian mutu dsb, telah diputuskan bahwa 19
kelompok dipilih untuk mewakili kenaikan berat 900 g. Dalam statistik tentang penyusunan
distribusi frekuensi dikenal dengan cara sebagai berikut:
1. Tentukan rentang, di mana rentang = data terbesar dikurangi data terkecil
2. Tentukan banyak kelas interval, di mana banyak kelas interval dapat diambil dari 5
sampai dengan 15 interval atau dengan rumus:
Banyak kelas interval = 1 + 3,3 log n, di mana n adalah jumlah data
3. Tentukan panjang kelas interval dan disingkat p, di mana

=

4. Pilih ujung bawah kelas pertama dari batas bawah kelas interval

Contoh
Tabel 3.3 Berat 210 tablet yang disisihkan dari suatu bets produksi sbb:
290,2 294,1 296,4 297,5 298,5 298,4 299,5 299,5 300,2 303,5
290,5 295,4 296,5 297,6 298,6 298,5 299,5 299,8 300,4 303,8
291,5 295,4 296,8 297,4 298,5 298,6 299,6 299,9 300,4 304,1
291,8 295,4 296,5 297,5 298,7 298,4 299,3 300,1 300,5 304,5
292,4 295,8 296,4 297,1 298,3 298,1 299,8 300,1 300,5 304,6
292,8 295,6 296,8 297,4 298,4 298,6 299,4 300,2 300,8 305,1
292,6 295,1 296,1 297,5 298,6 298,3 299,8 300,5 301,2 305,9
292,7 295,3 296,1 297,6 298,4 298,4 299,1 300,4 301,5 305,6
293,4 295,8 296,5 297,1 298,6 298,5 299,2 300,5 301,4 305,4
293,5 295,5 296,4 297,1 298,2 299,1 299,6 300,5 300,5 306,9
293,6 296,5 297,2 297,4 298,2 299,2 299,5 300,9 301,5 306,8
293,8 296,1 297,5 297,7 298,1 299,8 299,6 300,8 301,8 307,1
293,7 296,5 297,7 297,8 298,4 299,5 299,4 300,9 301,6 307,6
293,8 296,4 297,8 297,6 298,2 299,6 299,5 300,8 301,5 308,5
294,1 296,8 297,6 297,4 298,6 299,8 299,4 300,5 301,6 302,1
294,5 296,9 297,4 297,8 298,5 299,4 299,3 300,9 303,1 302,5
294,6 296,9 297,1 297,5 298,5 299,8 299,5 300,9 303,2 302,5
294,8 296,9 297,3 297,5 298,3 299,3 299,8 300,8 303,6 302,7
294,6 296,2 297,6 297,3 298,3 299,3 299,4 300,8 303,5 302,8
294,8 296,5 297,4 298,4 298,3 299,6 299,5 300,4 303,5 302,2
294,3 296,8 297,1 298,3 298,1 299,4 299,1 300,2 303,4 302,7

Untuk menentukan distribusi frekuensi dapat diselesaikan sebagai berikut:


1. Data terbesar = 308,5 dan data terkecil = 290,2
Jadi rentang = 308,5 290,2 = 18,3
2. Banyak kelas interval, dipilih 19
18,3
3. = 19 = 0,97 1,
Tabel 3.4 Berat tablet dalam Tabel 3.3 dikelompokkan ke dalam interval berikut:
Berat tablet (mg) Jumlah (frekuensi)
(Interval) ( )
290,1 291,0 2
291,1 292,0 2
292,1 293,0 4
293,1 294,0 6
294,1 295,0 8
295,1 296,0 9
296,1 297,0 21
297,1 298,0 30
298,1 299,0 32
299,1 300,0 36
300,1 301,0 24
301,1 302,0 9
302,1 303,0 7
303,1 304,0 8
304,1 305,0 3
305,1 306,0 4
306,1 307,0 2
307,1 308,0 2
308,1 309,0 1
Jumlah 210=n

Dari tabel 3.4 ini dapat dibuat histogram dan poligon sebagai Gambar 3.6 dan Gambar 37

40 frekuensi ( )

30

20

10

290,5 291,5 292,5 293,5


Berat tablet (mg)
Gambar 3.6 Histogram berat 210 tablet yang disisihkan dari sebuah bets produksi Tabel 3.4

Untuk menentukan grafik poligon maka hubungkan titik titik tengah dari setiap diagram
batang pada Gambar 3.6 di atas. Selanjutnya kita buat grafik ozaiv dengan cara sebagai
berikut:
Tabel 3.5 Berat 210 tablet untuk Menggambar Ozaiv

Berat Tablet Berat Tablet


Kurang dari 290,1 0 Lebih dari 290.1 210
Kurang dari 291,1 2 Lebih dari 291,1 208
Kurang dari 292,1 4 Lebih dari 292,1 206
Kurang dari 293,1 8 Lebih dari 293,1 202
Kurang dari 294,1 14 Lebih dari 294,1 196
Kurang dari 295,1 22 Lebih dari 295,1 188
. .
. .
.Kurang dari 309,1 210 Lebih dari 309,1 0

Untuk menggambar grafik poligon dan Ozaiv (gambar sendiri atau Tugas)

Selanjutnya kita menghitung Rata rata () dari data yang telah disusun dalam daftar
frekuensi dengan rumus ditimbang adalah


=1

= =1
=
=1
dengan
adalah frekuensi interval ke i atau jumlah data dalam interval ke i
adalah nilai tengah dari interval ke i

Atau rumus rata rata ini dapat diselesaikan dengan rata rata kodinng dengan rumus sebagai
berikut:



= 0 + ( =1
)
=1

di mana
0
=
0 adalah nilai tengah pada koding 0
P adalah panjang kelas interval

Contoh
Dari tabel 3.4 Berat tablet dalam Tabel 3.3 adalah Tabel 3.6 sebagai berikut
Berat tablet (mg) Jumlah (frekuensi)
(Interval) ( ) xi fixi ci fici
290,1 291,0 2 290,55 581,1 -8 - 16
291,1 292,0 2 291,55 -7 - 14
292,1 293,0 4 292,55 -6 - 24
293,1 294,0 6 293,55 -5 - 30
294,1 295,0 8 294,55 -4 - 32
295,1 296,0 9 295,55 -3 - 27
296,1 297,0 21 -2 - 42
297,1 298,0 30 -1 - 30
298,1 299,0 32 0 0
299,1 300,0 36 1 36
300,1 301,0 24 2 48
301,1 302,0 9 3 27
302,1 303,0 7 4 28
303,1 304,0 8 5 40
304,1 305,0 3 6 18
305,1 306,0 4 7 28
306,1 307,0 2 8 16
307,1 308,0 2 9 18
308,1 309,0 1 308,55 10 10
Jumlah 210=n

Dari perhitungan dalam Tabel 3.6, hitunglah rata rata ditimbang dan rata rata koding
(latihan/ tugas)!

Selanjutnya kita menentukan pula Modus (Mo), Median (Me) dan Variansi ( 2 ) dan
simpangan baku (s) dalam data yang telah disusun dalam daftar distribusi frekuensi. Adapun
rumus dari Modus adalah

1
0 = + ( )
1 +2

dengan
b adalah batas bawah interval kelas modus
1 adalah selisih frekuensi kelas modus dengan kelas sebelumnya
2 adalah selisih frekunsi kelas modus dengan kelas sesudahnya
P adalah panjang kelas interval.

Kemudian untuk menentukan nilai median dalam data yang telah disusun dalam
daftar distribusi frekuensi dapat diselasaikan dengan rumus sebagai berikut
1

2
= + ( )

di mana
b adalah batas bawah interval kelas median
n adalah jumlah data atau jumlah frekuensi
F adalah jumlah frekuensi sebelum kelas median
f adalah frekuensi kelas median
p adalah panjang kelas interval

Unruk menentukan variansi sampel 2 pada data yang disusun dalam distribusi
frekuensi ini dapat diselesaikan dengan rumus sebagai berikut


=1 ( )
2
2 = 1

atau dengan rumus lain adalah

2
=1 (=1 )
2
2 = (1)

Juga ke dua rumus rumus di atas dapat pula diselesaiakn dengan koding terhadap data yang
disususn dalam daftar distribusi frekuensi adalah sebagai berikut:

2
=1 (=1 )
2
2 = 2 [ ]
(1)
Contoh
Dari Contoh pada Tabel 3.4 kita sajikan dalam Tabel 3.7 dapat menyelesaikan modus,
median variansi dan simpangan baku sebagai berikut:

Berat tablet (mg) Jumlah


(Interval) ( ) xi fixi ci fici 2 2 ( )2
290,1 291,0 2 290,55 581,1 - 8 - 16
291,1 292,0 2 291,55 - 7 - 14
292,1 293,0 4 292,55 - 6 - 24
293,1 294,0 6 293,55 - 5 - 30
294,1 295,0 8 294,55 - 4 - 32
295,1 296,0 9 295,55 - 3 - 27
296,1 297,0 21 - 2 - 42
297,1 298,0 30 - 1 - 30
298,1 299,0 32 0 0
299,1 300,0 36 1 36
300,1 301,0 24 2 48
301,1 302,0 9 3 27
302,1 303,0 7 4 28
303,1 304,0 8 5 40
304,1 305,0 3 6 18
305,1 306,0 4 7 28
306,1 307,0 2 8 16
307,1 308,0 2 9 18
308,1 309,0 1 308,55 10 10
Jumlah 210=n

Kita dapat mengisi nilai nilai pada tabel ini dan selanjutnya kita jumlahkan dan sesudah itu
kita masukan pada ketiga rumus variansi dan sesuai dengan rumusnya. Untuk mentukan
simpangan baku sama dengan menentukan simpangan pada data yang belum disususn
sebelumbya, yaitu = 2 dan semuanya anda selesaiakan sebagai latihan (tugas).
3.2.3 Plot batang dan daun.

Walaupun histogram dan distribusi frekuensi umumnya digunakan untuk penyajian data,
metode - metode ini juga mempunyai beberapa kekurangan. Misalnya, kualitas informasi
yang ditampilkan tergantung pada pemilihan interval kelas pelaksananya. Pemilihan interval
yang kurang tepat ini dapat berakibat terbentuknya ringkasan data yang tidak mencukupi.
Selain itu, dalam histogram tempat data dikelompokkan, nilai nilai numerik individual dari
tiap data akan hilang. Suatu metode yang tidak memiliki kekurangan ini adalah plot batang
dan daun. Dalam pendekatan ini tiap data secara numerik dibagi menjadi dua bagian, disebut
batang dan daun. Batang tersusun dari bilangan bulat yang di atur secara vertikal, sedangkan
daun daun dibentuk dengan menambahkan suatu unit pada bilangan bulat. Berlawanan
dengan pengaturan batang secara vertikal, sedangkan daun daun diatur diatur secara
horizontal, melekat pada bilangan induk. Pembentukan plot batang dan daun dapat disajikan
dalam Tabel 3.8, yang menampilkan tekanan darah sistolik dari suatu kelompok yang terdiri
atas 30 pria yang berusia antara 40 dan 50 tahun.

Tabel 3.8. Tekanan darah sistolik (mmhg) dari 30 pria berusia 40 50 tahun

145 148 133 171 144 158


165 156 138 154 140 146
124 158 150 178 157 138
149 160 142 125 164 175
154 161 168 131 120 162

Langkah pertama dalam pembentukan plot batang dan daun melibatkan pemilihan
batang, yang merupakan struktur utama plot. Bilangan bilangan bulat yang dipilih untuk
batang biasanya terdiri dari angka angka pertama data. Contohnya, untuk nilai pertama
dalam Tabel 3.8 (145 mmhg), batang yang sesuai adalah 14 dan untuk data terakhir dalam
tabel yang sama (162 mmhg) batangnya menjadi 16. Nilai nilai batang kemudian diatur
secara vertikal dengan meningkat. Untuk data yang diberikan dalam Tabel 3.8, batangnya
adalah sebagai berikut.

12
13
14
15
16
17

Untuk melengkapi plot batang dan daun, angka terakhir dari tiap nomor (daun) ditempatkan
secara horizontal melekat pada pengelompokkan batang yang terkait. Plot batang telah
dilengkapi untuk data dalam Tabel 3.8 ditunjukkan dalam Gambar 3.7. Plot batang telah
memberikan gambaran visual dari rangkaian data. Tentu saja dapat diamati bahwa data
tersebut agak simetris. Memperkirakan mentuk (simetrik) dari rangkaian data adalah salah
satu kegunaan utama dari plot batang dan daun.
`sebelum menyelesaikan konsep plot batang dan daun, ada dua hal yang perlu
dijelskan lebih jauh:
Pemilihan nilai numerik untuk batang tergantung pada kisaran ukuran kelompok data.
Dalam contoh yang berhubungan dengan Tabel 3.8, pemilihan batang telah
memastikan bahwa inteeval adalah 10 mmhg. Dalam kondisi tertentu, interval kelas
dapat dibagi lagi untuk mendapatkan suatu pemahaman yang lebih baik terhadap
distribusi data dalam batas batas data yang lebih kecil.

Untuk menggunakan data yang disajikan dalam Tabel 3.8 plot batang dan daun dapat
digambarkan kemali dengan mencakupinterval kelas yang lebih kecil, misalnya5 mmhg
(Gambar 3.7)

Batang Daun
12 0 4 5
13 1 3 8 8
14 0 2 4 5 6 8 9
15 0 4 4 6 7 8 8
16 0 1 2 4 5 8
17 1 5 8

Gaambar 3.7 Plot batang dan daun untuk data yang diberikan dalam Tabel 3.8 mengenai
tekanan darah sistolik 30 pria yang berusia 40 50 tahun. Gambar ini menggunakan interval
kelas sebesar 10 mmhg.

3.2.4 Morfologi Umum dari Kurva Frekuensi

Apabila distribusi berasal dari ukuran sampel yang besar dan diplotkan menggunakan
interval yang yang terbatas, sejumlah morfologi yang berbeda dapat terbentuk. Bentuk
bentuk distribusi dapat dikelompokkan dengan cara cara berikut:

Bentuk distribusi dapat berupa unimodal (satu puncak), bimodal (dua puncak) atau
multimodal
Utuk distribusi unimodal, apakah simetrik (distribusi miring)? Suatu penting dari
yang simetrik, distribusi unimodal adalah distribusi normal akan dijelskan dalam bab
berikutnya.
Untuk distribusi distribusi simetrik, apakah distribusi miring ke kiri (positif) atau ke
kanan (negatif) ?

Ada distribusi distribusi lain yang tidak sesuai dengan klasifiksi di atas, misalnya distribusi
bentuk J dan distribusi bentuk J terbalik yang memiliki maksimum pada salah satu ujung
distribusi. Suatu contoh yang menarik dari distribusi bentuk J (miring) diperkenalkan oleh
Gorman at al (1996). Dalam studi ini, para penulis memeriksa efek dari agen antimikroba non
- anti biotik, klorheksidin glukonat, pada pelekatan patogen oportunistik Candida albicans
pada sel sel epitelial bukal, suatu sifat virulensiyang penting.

3.2.4.1 Kecondongan dan Kurtosis

Dua lagi istilah penting yang digunakan untuk menjelaskan berbagai distribusi frekuensi
adalah kecondongan dan kurtosis. Kecondongan digunakan untuk mengukur derajat asimetri
suatu distribusi. Ada beberapa metode yang dapat digunakan untuk menghitung
kecondongan. Metode pertama dikenal koefisien kecondongan pertama Pearson adalah
sebagai berikut

Kecondongan = (rata-rata modus)/simpangan baku


Karena rara rata dan modus sama dalam distribusi normal, koefisien kecondongan distribusi
normal sama dengan nol.
Metode lain untuk memperkirakan asimetri (kecondongan) yang menghindari
penggunaan modus, dikenal dengan istilah koefisien kecondongan ke dua Pearson, dan
dinyatakan sebagai berikut:

Kecondongsn = 3((rata rata) median)/simpangan baku

Ukuran lain dari kecondongan, meliputi koefisien momen dari kecondongan, juga digunakan
dalam statistik, tetapi ukuran ini lebih kompleks dan diluar dari cakupan dari buku ini.
Kurtosis adalah karakterisasi dari kerapatan pengamatan pengamatan yang terdapat
dalam daerah daerah berbeda dari suatu distribusi
Distribusi normal standar adalah suatu distribusi frekuensi terdefinisi dan dijelaskan
sebagai mesokurtik. Sifat sifat dari distribusi ini dijelaskan lebih rinci dalam bab
berikutnya.
Jika bentuk puncak dari kurva normal adalah datar, yaitu data telah digeser dari pusat
da ekor ke daerah bahu kurva, distribusi disebut platikurtik
Kurva leptokurtik adalah kurva dengan daerah pusat diperpanjang dan kerapatan ekor
ekor menigkat.
Bab 4 Probabilitas dan Distribusi Probabilitas

Probabilitas dapat didefinisikan secara umum sebagai bagian ilmu matematika mengenai
perhitungan kemungkinan terjadinya suatu peristiwa. Meskipun probabilitas memiliki sifat
dasar matematik, penggunaan istilah ini telah menjadi suatu bagian terpadu dari pembicaraan
masa kini. Akibatnya, kita biasa mendengar atau menggunakan kata kata saya mempunyai
kesempatan 50% untuk lulus ujian ini dan lain sebagainya. Kebanyakan orang mempunyai
beberapa pemahaman dasar mengenai prinsip prinsip yang terlibat. Salah satu aplikasi teori
probabilitas yang paling umum dalam yang tidak ilmiah adalah dalam perjudian, dan
sesungguhnya, aplikasi ini memiliki pengaruh yang sangat besar pada perkembangan ilmu
probabilitas.
Pentingnya teori probabilitas pada analisis statistik tidak dapat diabaikan. Dalam ilmu
statistik yang dikenal sebagai statistik inferensial merupakan hal penting karena dapat
memberikan bebagai metode yang dapat digunakan untuk melakukan analisis komparatif dari
rangkaian rangkaian data. Statistik inferensial memungkinkan kita untuk memperkirakan
informasi mengenai suatu populasi besar berdasarkan analisis statistik terhadap sampel yang
lebih kecil dari populasi. Inti dari pelaksanaan statistik inferensial adalah pengetahuan
mengenai probabilitas.

4.1 Teori Probabilitas Dasar

Kebanyakan orang mempunyai kemampuan untuk menghitung beberapa aspek dasar dari
probabilitas; misalnya, misalnya sebuah koin dilempar, hanya ada dua hasilnya, kepala atau
ekor (muka atau belakang). Oleh karena itu, kemungkinan mendapatkan kepala pada satu kali
lemparan koin adalah 50%. Contoh contoh lain yang sering digunakan untuk
menggambarkan teori probabilitas termasuk probabilitas untuk mendapatkan suatu nomor
tetentu setelah pelemparan sebuah dadu, kemungkinan mengambil kartu tertentu dari
setumpuk kartu.
Teori probabilitas juga digunakan dalam bidang kefarmasian. Sebagai contoh, kinerja
suatu mesin pengisian injeksi yang baru dapat dipastikan dengan menyisihkan 500 vial berisi
produk dari bets produksi pertama suatu produk dan mengukur volume pengisian vial vial
tersebut untuk memeriksa apakah volume akhir berada dalam spesifikasi produk atau tidak.
Jika sejumlah 496 vial, yaitu 0,992 atau 99,2%, dibuktikan masuk dalam spesifikasi,
probabilitas volume pengisian memenuhi spesifikasi akhir adalah 0,992. Ini bukan
merupakan suatu nilai tetap melainkan hanya berupa suatu perkiraan probabilitas kinerja
pengisisan mesin baru tersebut.

4.1.1 Aturan Dasar Probabilitas

Setelah mendapatkan penjelasan mengenai beberapa contoh sederhana, kita sekarang dapat
menyatakan beberapa aturan dasar yang digunakan untuk menghitung probabilitas.

4.1.1.1 Kisaran Nilai

Probabilitas terjadinya peristiwa harus berada antara 0 dan 1. Oleh karena itu, probabilitas
dengan nilai 1 mengindikasikan bahwa suatu peristiwa akan terjadi, sedangkan probabilitas 0
berarti suatu peristiwa tidak akan terjadi.
4.1.1.2 Perhitungan probabilitas

Probabilitas suatu peristiwa dihitung dengan membagi banyaknya cara atau jumlah terjadinya
suatu peristiwa dengan kemungkinan yang dapat terjadi. Jadi probabilitas dari munculnya
nilai 2, 3 dan 6 dalam satu lemparan dadu adalah 3/6 = 0,5.

4.1.1.3 Peristiwa Yang Saling Terpisah

Probabilitas terjadinya dua atau lebih oeristiwa yang saling terpisah dapat dihitung dengan
menjumlahkan probabilitas tiap peristiwa, Jadi, dalam keadaan ada dua peristiwa A dan B,
probabilitas (P) dari tiap peristiwa yang terjadi dapat ditulis dengan rumus

P(A atau B) = P(A) + P(B)

Atau rumus ini dapat juga diruilis dengan

( ) = () + ()

Istilah saling terpisah berarti bahwa jika satu peristiwa terjadi, kejadian kejadian lainnya
tidak terjadi. Untuk menggambarkan prinsip ini, bayangkan sebuah skenaryo ketika 10 manik
manik berwarna ( 5 berwarna merah, 4 hijau dan 1 biru) ditempatkan dalam sebuah kotak
buram. Probabilitas pengambilan secara acak sebuah manik merah atau hijau dari kotak
tersebut dapat dihitung dengan menambahkan semua probabilitas individu untuk penarikan
tiap manik berwarna. Jadi,

P(merah atau hijau) = P(merah) + P(hijau)

= 5/10 + 4/10 = 9/10 = 0,9.

Jadi kemungkinan mengambil salah satu dari manik berwarna merah atau hijau dari kotak
tersebut ada 90%. Ini merupakan situasi yang saling terpisah. Jika sebuah manik merah
dipilih, manik tersebut tidak dapat berwarna hijau atau biru waktu yang sama. Pemilihan
peristiwa peristiwa saling terpisah jangan sampei diabaikan; perincian percobaan harus
diperhatikan dengan hati hati.

4.1.1.4 Peristiwa Peristiwa Bebas

Probabilitas terjadinya dua peristiwa bebas sekaligus dapat dijelaskan secara matematik
menggunakan aturan perkalian:

P(A dan B) = P(A) P(B)

atau dapat pula rumus di atas dinyatakan dengan

( ) = ()()

Penggunanaan aturan ini dapat dengan mudah ditunjukkan, menggunakan contoh tentang
pemilihan manik manik berwarna dari sebuah kotak buram di atas. Berapa probabilitas
pengambilan sebuah manik hijau dan biru dari kotak ? Dalam skenario pertama, manik
pertama diambil, warnanya dicatat, kemudian manik tersebut dikembalikan ke dalam kotak.
Untuk menghitung probabilitas gunakan rumus, yaitu

P(hijau dan biru) = P(hijau) P(biru) = (4/10)(1/10) = 4/100 = 0,004

Contoh lain.

Bayangkan suatu hipotesis sampel apabila permainan lotere tersusun dari 40 nomor dan
penarikan dilakukan dengan mengambil 6 nomor secara acak tanpa pengembalian. Anda
mungkin berpikir untuk menghitung probabilitas dari penarikan 6 nomor dalam urutan
tertentu. Jawabannya cukup sederhana dan dihitung seperti dalam Tabel 4.1. Di sni Lotere
hanya memerlukan pemilihan 6 nomor tanpa persyaratan urutan tertentu.

Peristiwa Jumlah hasil pemilihan yang mungkin Probabilitas


P(nomor pertama) 40 1/40 = 0,0250
P(nomor ke dua) 39 1/39 = 0,0256
P(nomor ke tiga) 38 1/38 = 0,0263
P(nomor ke empat) 37 1/37 = 0,0270
P(nomor ke lima) 36 1/36 = 0,0278
P(nomor ke enam) 35 1/35 = 0,0286

Jadi Probabilitass (I dan II dan III dan IV dan V dan VI) =

(0, 0250)(0,0256)(0,0263)(0,0270)(0,0278)(0,0286) = 3,61 1010

Untuk menghitung probabilitas memenangkan lotere, probabilitas peristiwa di atas dikalikan


dengan jumlah semua cara yang berbeda untuk menarik ke enam nomor, yaitu 6! = 720. Oleh
karena itu, probabilitas memenangkan hadiah utama dalam lotere 50 bola adalah (2,6
107 )(3,61 1010 )(720).

4.1.1.5 Peristiwa yang Tidak Saling Terpisah

Untuk menghitung probabilitas dua peristiwa yang tidak saling terpisah, kaidah penambahan
probabilitas yang dijelskan bagian 4.1.1.3 daapat digunakan, tetapi kaidah ini harus
diterapkan dalam bentuk yang dikoreksi untuk menerangkan tumpang tindih ke dua peristiwa
tersebut. Sebuah contoh, tenttang skenario ketika dua peristiwa tidak saling terpisah adalah
perhitungan probabilitas terhadap penarikan kartu raja maupun kartu wajik dari suatu
tumpukan kartu. Secara matematik rumus probabilitas yang tidak saling terpisah adalah

P(A atau B) = P(A) + P(B) P(A dan B)

atau dalam rumus matematik sebenarnya adalah

( ) = () + () ( )

dengan P(A) adalah probabilitas penarikan sebuah kartu raja, yaitu 4/52 = 0,077; P(B) adalah
probabilitas penarikan sebuah kartu wajik, yaitu 13/52 = 0,25; dan ( ) adalah
probabilitas penarikan raja wajik, merupakan peristiwa yang tidak saling terpisah.
Probabilitas kartu raja wajik adalah 1/52 = 0,019. Jadi probabilitas yang tidak saling terpisah
adalah

( ) = () + () ( )

= 0,077 + 0,25 0,019 = 0,308.

Contoh 4.1

Pelabelan produk farmasi merupakan suatu komponen penting dari spesifikasi produk akhir
karena isi label memberikan informasi mengenai komposisi kimia dari produk, serta
penggunaan (dan keamanan) dan akuntabilitas produk. Misalkan anda bertanggung jawab
pada bagian pengendalian mutu dari sebuah perusahaan besar farmasi dan anda baru saja
diminta untuk menilai kualitas label suatu produk baru yang disediakan oleh sumber luar.
Untuk menilai kualitas sumber baru label, 1000 label telah disisihkan dari area karantina dan
penampakannya dicatat. Hasil temuan ditampilkan dalam Tabel 4.2. Hitunglah probabilitas
ditemukannya sebuah label yang cacat, baik karena kata kata yang tidak terbaca (karena
pencetakan) maupun pelekatan yang buruk.

Tabel 4.2 Penilaian pengendalian mutu dari suatu sampel label yang berasal dari suatu bets.

Kecacatan (jika ada) Jumlah pengamatan (frekuensi)


Tidak ada 905
Kata kata tidak terbaca 45
Logo perusahaan tidak terbaca 25
Pelekatan yang buruk 15
Kata kata yang tidak terbaca dan pelekatan yang buruk 10

Misalkan A : kata kata yang tidak terbaca

B : pelekatan Yang buruk

Jadi probabilitas yang tidak saling terpisah adalah

( ) = () + () ( )
45 15 10
= 1000 + 1000 1000 = 0,05.

4.2 Ditribusi Probabilitas

Statistik inferensial menggunakan teori probabilitas untuk membuat anggapan anggapan


mengenai sifat sifat populasi berdasarkan data yang dicatat dari sampel sampel yang lebih
kecil yang dari suatu populasi. Dalam contoh bila variabel bersiat diskret, hubungan antara
serangkaian variabel dan probabilitasnya disebut distribusi probabilitas diskret; jika variabel
bersifat kontinu, distribusi yang dihasilkan disebut distribusi probabilitas kontinu. Dalam
banyak disiplin ilmu, misalnya ilmu farmasi, fisika, kimia atau biologi, terkadang mungkin
untuk memrediksi hasil percobaan secara teoritis berdasarkan pengetahuan prinsip prinsip
ilmiah yang melandasi percobaan. Sebagai contoh, probabilitas untuk sifat genetik tertentu
dapat diprediksi. Dalam ilmu atau rekayasa kefarmasian, teknik teknik pemodelan
matematik dapat digunakan untuk memberikan perkiraan hasil suatu percoabaan. Jika hasil
percobaan berbeda dari distribusi yang diharapkan, sering seorang peneliti akan
menyimpulkan bahwa anggapan awal tidak tepat sehingga memerlukan perbaikan.

Tabel 4.3 Probabilitas untuk nilai nilai numerik yang diperoleh dari pelemparan satu atau
dua dadu

Satu dadu Dua dadu


Variabel Probabilitas Variabel Probabilitas
(hasil numerik) (hasil numerik)
1 1/6 = 0,167 2 0,038
2 0,167 3 0,056
3 0,167 4 0,083
4 0,167 5 0,111
5 0,167 6 0,139
6 0,167 7 0,167
8 0,139
9 0,111
10 0,083
11 0,056
12 0,038

4.2.1 Distribusi Probabilitas Diskret

Distribusi Probabilitas Diskret adalah distribusi yang menghitung dan menggambarkan secara
grafik probabilitas terjadinya peristiwa diskret. Untuk menjelaskan hal ini, pertama tama
pertimbangkan hasil numerik setelah pelemparan satu dadu dan dua dadu (tabel 4.3).
Distribusi probabilitas diskret yang akan dibahas disini adalah Distribusi binomial dan
distribusi Poisson.

4.2.2 Distribusi Binomial

Salah satu distribusi yang paling umum digunakan dalam ilmu kefarmasian dan biologi
adalah distribusi binomial. Distribusi ini digunakan bila hasil dari satu peristiwahanya terdiri
dari dua kategori. Suatu contoh dari peristiwa binomial telah dijelaskan sebelumnya, yaitu
pelemparan sebuah koin. Contoh lain dari data binomial meliputi:

Hasil dari penilaian pengendalian mutu, yaitu lulus atau tidak lulus
Sebuah formulasi baru dapat menghasilkan efek samping : menghasilkan efek positif
atau efek negatif
Distribusi jenis kelamin dalam satu populasi, hanya dua hasil, pria atau wanita
Prevalensi penyakit dalam suatu populassi: penyakitnya bisa ada atau tidak ada
Suatu obat baru dapat manjur atau tidak manjur secara klinis.
Selain persyaratan bahwa hanya ada dua hasil yang mungkin, tiap percobaan binomial
harus bebas, yaitu terjadinya satu peristiwa harus tidak mempengaruhi peristiwa peristiwa
selanjutnya.

Tabel 4.4. Kejadian efek samping pada 8500 pasien karena penggunaan klinis sebuah obat
anti hipertensi baru

Jumlah efek samping jumlah (frekuensi) pasien Probabilitas


1 1200 0,15
2 2000 0,25
3 2400 0,30
4 1700 0,20
5 1200 0,15

Dalam menghasilkan distribusi binomial, proporsi pengamatan (individual) dalam


satu kategori adalah p sehingga proporsi pengamatan pengamatan dalam kategori lain
adalah 1 p = q. Untuk memberi gambaran tentang prinsip ini, perhatikan contoh beri9kut:

Contoh 4.2

Dalam pembuatan produk farmasi, tablet tablet dari suatu bets dapat dikategorikan ke
dalam tablet yang lulus atau gagal melewati pengendalian mutu. Sebagai bagian dari proses
pengendalian mutu untuk suatu bets tablet, probabilitas untuk kategori lulus adalah 0,95
sedangkan probabilitas untuk kategori gagal adalah o,05. Hitunglah probabilitas pemilihan

a) Dua tablet yang cacat !


b) Dua tablet yang tidak cacat (lulus) !
c) Satu tablet cacat dan satu tablet tidak cacat, masing masing dalam satu sampel yang
tetdiri dari dua tablet.

Penyelesaian

a) Probabilitas pemilihan dua tablet cacat dalam satu sampel dapat dihitung dengan
menggunakan perkalian, yaitu (0,05)(0,05) = 0,0025
b) Probabilitas pemilihan dua tablet yang telah lulus pengendalian mutu adalah
(0,95)(0,95) = 0,9025.
c) Sedangkan untuk probabilitas pemilihan dua peristiwa yang tidak sama, yaitu satu
cacat dan satu lulus adalah 2(pq) = 2(0,05)(0,95) = 0,095.

Pprobabilitas keseluruhan adalah ( + )2 = 2 + 2 + 2

Dapat diperluas pula probabilitas keseluruhan adalah ( + )3 = 3 + 32 + 3 2 + 3

Karena contoh ini telah digambarkan, kompleksitas perhitungan prbabilitas peristiwa


menggunakan data binomial meningkat seiring jumlah sampel meningkat, dan perhitungan
peristiwa tersebut menggunakan metode perhitungan perhitungan di atas menjadi sulit.
Namun kesulitan dapat diatsi dengan pengembangan suku binomial ( + ) , dengan n
ukuran sampel, p adalah probabilitas terjadinya peristiwa pertama, yaitu pemilihan satu tablet
cacat dalam contoh di atas, dan q adalah probabilitas terjadinya peristiwa ke dua, yaitu
pemilihan satu tablet yang tdak cacat.

Probabilitas pengamatan x (dalam suatu kategori tertentu) dalam suatu sampel yang
berukuran n yang telah diambil dari suatu distribusi binomial dapat ditulis secara matematik
sebgai berikut:

() = ( ) , x = 0,1, 2, ... , n

dengn merupakan probabilitas dari suatu sampel yang tersusun dari x pengamatan yang
memiliki probabilitas p, dan merupakan probabilitas dari suatu sampel yang terdiri

Persamaan di atas dapat pula ditulis menjadi


!
( ) = !()!

Sehingga penulisan rumus di atas menjadi


!
() = !()!

Contoh 4.3

Dengan menggunakan penguraian binomial dan mengacu pada Contoh 4.2, hitunglah
probabilitas pemilihan tiga tablet cacat dalam suatu sampel yang berisi tiga tablet.

Penyelesaian:

Dari Contoh 4.2 diketahui bahwa p (cacat) = 0,05, q (tidak cacat) = 0,95, n = 3 dan x = 3,
sehingga

3
( = 3) = ( ) (0,05)3 (0,95)33
3
3!
= 3!(33)! (0,05)3 (0,95)0

= 0, 000125

Soal Latihan (Tugas)

Pada soal yang sama, hitung probabilitas pemilihan empat tablet cacat dalam suatu sampel
yang berisi

1) Satu tablet
2) Dua tablet
Sebuah metode sederhana untuk membangun suku binomial adalah dengan
menggunakan segitiga pascal Tabel 4.5. Metode ini memberikan koefisien koefisien yang
membentuk suatu komponen terpadu dari penguraian binomial.

Tabel 4.5 Sebuah kutipan dari segitiga Pascal

n Segitiga Pascal (koefisien untuk penguraian binomial)


1 1 1
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 58 70 56 28 8 1
dst

Tabel 4.6 Penguraian suku binomial, ( + ) , untuk nilai nilai tertentu dari eksponen, n

n Pengembangan dari ( + )
1 p+q
2 2 + 2 + 2
3 3 + 32 + 4 2 + 3
4 4 + 43 + 62 2 + 4 3 + 2
5 5 + 54 + 103 3 + 102 3 + 5 4 + 5
6 6 + 65 + 154 2 + 203 3 + 152 4 + 6 5 + 6
7 7 + 76 + 215 2 + 354 3 + 353 4 + 212 5 + 7 6 + 7
8 8 + 87 + 286 2 + 585 3 + 704 4 + 583 5 + 282 6 + 8 7 + 8
9

Tabel 4.6 menampilkan berbagai pengembangan binomial dari n = 1 sampai n = 8,


berdasarkan pada koefisien yang disajikan dalam Tabel 4.5. Menggunakan pengembangan di
atas, kita dapat menghitung, contohnya, probabilitas pemilihan empat tablet yang tidak cacat
dalam suatu sampel yang beranggota empat tablet.

4.2.2.1 Ringkasan Karateristik Bistribusi Binomial

Dua hasil yang mungkin

Distribusi binomial adalah suatu distribusi probabilitas yang menjelaskan probabilitas


terjadinya suatu peristiwa bila hanya ada dua hasil yang munfkin.

Efek dari ukuran sampel

Probabilitas keberhasilan tergantung pada probabilitas peristiwa (p) dan ukuran sampel (n).
Kedua parameter ini yang menentukan distribusi binomial dan sebagai tambahan yang dapat
digunakan untuk menghitung probabilitas suatu hasil tertentu dari sejumlah percobaan
binomial.

Jumlah probabilitas

Jumlah semua probabilitas dari suatu percobaan binomial adalah sama dengan 1, seperti
dalam semua perhitungan probabilitas.

Nilai teoritis dan nilai yang diamati

Distribusi binomial merupakan suatu distribusi probabilitas yang dihitung secara teoritis.
Probabilitas keberhasilan terhitung dari suatu peristiwa disebut sebagai rata rata hakiki.
Nilai nilai yang diamati diperoleh setelah percobaan adalah proporsi (rata rata sampel dan
merupakan perkiraan dari rata rata hakiki.

Variabilitas dan simpangan baku

Variabilitas dari suatu variabel acak dalam suatu peristiwa binomial dapat dihitung dan
biasanya digambarkan sebagai simpangan baku. Pertama tama perhatikan perhitungan
simpangan baku untuk jumlah gambar kepala yang diamati setelah dua kali pelemparan
sebuah koin yang tidak bias. Hasil hasil yang mungkin adalah sebagai berikut:

0 kepala: probabilitas 0,25


1 kepala: probablitas 0,5
2 kepala: probabilitas 0,25

Untuk menghitung rata rata, jumlah keberhasilan dikalikan dengan probabilitas semua
komponen di tambahkan:

(0 0,25) + (1 0,5) + (2 0,25) = 1

Oleh karena itu, jumlah rata rata munculnya gambar kepala pada setiap pelemparan satu
koin adalah 1 gambar kepala.

Variansi dihitung dengan mengalikan probabilitas dari tiap peristiwa dengan kuadrat
dari selisih suatu peristiwa dengan rata rata dan kemudian menambahkan semua komponen
secara bersamaan. Jadi,

[{(0 1)2 0,25} + [{(1 1)2 0,5} + [{(2 1)2 0,25}] = 0,5 = 2

Simpangan baku adalah akar kuadrat dari variansi, 2 = 0,5 = 0,71

Secara matematik dapat ditulis:

(a) Rata rata = np


dengan n adalah ukuran sampel dan p adalah probabilitas dari suatu peristiwa
binomial. Dari contoh pelemparan koin di atas, n = 2 dan p = 0,5, jadi
rata rata = 2 x 0,5 = 1
(b) Variansi = npq
dengan q adalah probabiltas dari peristiwa binomial yang lain (1 p). Dalam cintoh
pelemparan koin di atas dengan n = 2, p = 0,5, dan q = 0,5, jadi
variansi = 2 x 0,5 xs 0,5 = 0,5
(c) Simpangan baku =
Dengan contoh di atas,
Simpangan baku = = 2 0,5 0,5 = 0,71

Meminimalkan variansi

Variansi suatu distribusi binomial akan diminimalkan, jika perbedaan antara p dan q
mempunyai nilai yang besar, yaitu 0,6. Untuk menunjukkan ini, misalkan suatu percobaan
binomial mempunyai probabilitas (a) p = 0,1, q = 0,9 dan (b) p = 0,5, q = 0,5 dan ada 10
sampel dalam tiap percobaan. Simpangan baku untuk tiap percobaan dapat dihitung
menggunakan persamaan di atas:

(a) Simpangan baku = = 10 0,1 0,9 = 0,95


(b) Simpangan baku = = 10 0,5 0,5 = 1,58

Penggunaan proporsi

Simpangan baku (dan variansi) dapat juga dihitung menggunakan proporsi dengan persamaan
berikut:

istilah matematik yang digunakan ini mempunyai pengertian yang sama dari sebelumnya.
Dengan menggunakan contoh yang sama, simpangan baku dapat dihitung:

0,50,5
(a) = = = 0,158
10

0,10,9
(b) = = = 0,095
10

Contoh 4.4

Suatu injeksi telah diformulasikan mengandung sulfametoksazol dan trimetoprim.


Probabilitas pengendapan dalam formulasi diketahui sebesar 1%. Hitunglah kemungkinan
mengamati 2, atau kurang dari 2, vial yang mengandung endapan dalam suatu sampel yang
berjumlah 100 vial.

Penyelesaian

Pertama kita perhatikan bahwa kemungkinan untuk mengamati 2, berarti kita menghitung
probabilitas dengan cara [P(0), P(1) dan P(2)], dan selanjutnya dijumlahkan, yaitu:
100
( = 0) = ( ) = ( ) (0,01)0 (0,99)1000
0
100! 100!
= 0!(1000)! (0,366) = 0!100! (0,366) = (1)(1)(0,366) = 0,366
100
( = 1) = ( ) = ( ) (0,01)1 (0,99)1001
1
100! 100!
= 1!(1001)! (0,366) = 1!99! (0,01)(0,37) = (100)(0,01)(0,37) = 0,37
100
( = 2) = ( ) = ( ) (0,01)2 (0,99)1002
2
100! 100!
= 2!(1002)! (0,001)(0,373) = 2!98! (0,0001)(0,373) =
= (4950)(0,0001)(0,373) = 0,185
Jadi probabilitas keseluruhan adalah
() = (0) + (1) + (2) = 0,366 + 0,370 + 0,185 = 0,921

Soal Latihan (Tugas)

Dari soal di atas, hitunglah kemungkinan mengamati antara 2 samapai dengan 4 vial (2
4) dari suatu sampel yang berjumlah100 vial !

4.2.3 Distribusi Poisson

Distribusi Poisson merupakan distribusi data diskret lain yang digunakan untuk
menjelaskan kejadian acak bila probabilitas untuk mengamati suatu peristiwa bernilai
kecil. Distribusi Poisson mendekati distribusi binomial bila ukuran sampel besar dan
probabilitas dari suatu peristiwa tertentu bernilai kecil. Secara matematik, distribusi
Poisson rumusnya dapat ditulis dengan

() = = !
!

dengan P(x) adalah probabilitas terjadinya suatu peristiwa dalam suatu pengamatan
tunggal dan adalah bilangan rata rata kejadian ( = ).

Persamaan di atas dapat diperluas untuk memungkinkan perhitungan probabilitas


kejadian sebuah peristiwa atau banyak banyak peristiwa (Tabel 4.7).

Tabel 4.7 Pengembangan persamaan yang mendefinisikan distribusi Poisson

Jumlah kejadian Pengembangan


0 (0) =
1 (1) =
2 (2) = 2 /2!
3 (3) = 3 /3!
4 (4) = 4 /4!

Dalam sistem biologis, distribusi Poisson khususnya digunakan untuk menjelaskan


terjadinya peristiwa peristiwa yang langka baik dalam suatu bentuk spasial (misalnya
distribusi mikrorganisme pada daerah tertentu atau dalam sejumlah sel epitelial), maupun
dalam suatu bentuk temporal (yaitu sebagai fungsi waktu). Variabel tersebut harus
menunjukkan dua karateristik utama:

Rata rata harus relatif kecil terhadap jumlah peristiwa yang mungkin terjadi per unit
pengambilan sampel (ruang atau waktu), artinya peristiwa peristiwa harus langka.
Peristiwa harus bebas.

Untuk menjelaskan penggunaan distribusi Poisson, perhatikan data yang disajikan Dalam
Tabel 4.10 mengenai perlekatan blastospora Candida albicans pada sel epitelial vagina secara
in vitro. Suatu distribusi Poisson cukup menjelaskan frekuensi pelekatan mikrobial pada sel
sel epitelial untuk sejumlah alasaan:

Bilangan rata rata blastospora yang melekat pada tiap sel epitelial rendah meskipun
sel epitelial memiliki suatu daerah permukaan yang jauh lebih besar dari pada sel ragi.
Diameter rata rata sebuah sel ragi adalah 4, sedangkan diameter rata rata
sebual sel epitelial vagina adalah sekitar 70.
Pelekatan blastospora pada sel epitelial adalah suatu peristiwa bebas, artinya
pelekatan ini tidak tergantung pada adanya blastospora lain. Selain itu, pelekatan
blastospora pada sel epitelial tidak dihambat oleh adanya blastospora yang melekat
sebelumnya.

Pertama tama, bilangan rata rata blastospora tiap sel epitelial dihitung
344
= 172 = 2,0

Tabel 4.8. Pelekatan blastospora Caandida albicans pada sel sel epitelial vagina, seperti
yang ditentukan menggunakan distribusi Poisson

Jumlah blastospora Frekuensi Probabilitas Frekuensi yang


Yang melekat tiap yang teoritis diharapkan ( )
Sel epitelial tercatat
0 21 = (0) = = 0,135 = 0,135 172 = 23,22
1 50 (1) = = 0,271 = 0,271 172 = 46,61
2
2 51 (2) = = 0,271 = 0,271 172 = 46,61
2!
3
3 28 (3) = = 0,180 = 0,180 172 = 30,96
3!
4
4 14 (4) = = 0,090 = 0,090 172 = 15,40
4!
5
5 5 (5) = = 0,036 = 0,036 172 = 6,13
5!
6
6 2 (6) = = 0,011 = 0,011 172 = 2,03
6!
7
7 1 (7) = = 0,003 = 0,003 172 = 0,58
7!

Dalam persamaan Poisson, nilai rata rata (2,0) dilambangkan dengan suku dan ini
digunakan untuk menghitung prbabilitas teoritis dan frekuensi yang diharapkan (Tabel 4.8).
Frekuensi yang diamati sesuai dengan frekuensi yang diharapkan, dihitung menggunakan
persamaan Poisson. Untuk menjadi tepat secara statistik, frekuensi yang diamati harus
dipastikan sesuai dengan frekuensi yang diharapkan menggunakan uji goodness-of-fit
(kesesuaian) yang akaan dijelaskan dalam Bab 7. Dengan menganggap bahwa ada kesesuaian
yang baik antara frekuensi frekuensi yang diamati dan yang diharapkan, seseorang dapat
menyimpulkan bahwa perlekatan C. albicans pada sel sel epitelial vagina merupakan suatu
peristiwa yang bebas.

Oleh karena itu, distribusi Poisson berguna untuk menghitung probabilitas kejadian
suatu peristiwa yang langka. Banyak dari peristiwa ini terjadi dalam konteks kefarmasian,
misalnya pemilihan barang yang rusak dari suatu bets produksi produk farmasi, kematian
yang disebabkan oleh obat, atau patahnyaa keteter medis yang ditanam (misalnya sten ureter).

Contoh 4.5

Kecenderungan sten ureter untuk patah secara in vivo dilaporkan sebesar 0,5%. Hitunglah
probabilitas untuk satu sten ureter akan patah secara in vivo dalam suatu percobaan klinis 500
pasien.

Penyelesaian

Pertama menghitung nilai rata rata = , yaitu

= = 500 0,005 = 2,5

Dengan menggunakan distribusin Poisson, probabilitas kejadian satu peristiwa ditentukan

(1) = = 2,5 2,5 = 0,205

Jadi, pobabilitas bahwa satu sten ureter akan patah dalam suatu percobaan klinis pada 500
pasien adalah 20,5%.

Menariknya, perhitungan ini dapat juga dilakukan menggunakan distribusi binomial


atau biasa disebut hampiran binomial terhadapa distribusi Poisson dan dapat diperoleh hasil
yang sama sebagai berikut
500
() = ( ) = ( ) (0,005)1 (0,995)499
1
500! 500!
= (0,005)(0,995)499 = (0,0005)(0,995)499
1!(5001)! 498!

(500)(0,005)(0,082) = 0,205.

Perhitungan perhitungan ini menegaskan hubungan yang erat antara distribusi binomial dan
distribusi Poisson.

Soal Latihan (Tugas)

Dari soal diatas, hitunglah probabilitas untuk lebih kecil atau sama dengan 2 sten ureter akan
patah secara in vivo dalam suatu percobaan klinis 500 pasien !
4.2.3.1 Ringkasan Karateristik Karateristik dari Distribusi Poisson

Karateristik utama dari distribusi Poisson adalah sebagai berikut.

Rata rata =
Variansi 2 =
Simpangan baku =

Perlu diketahui bahwa distribusi Poisson rata rata identik dengan variansi 2 .

4.2.4 Distribusi Probabilitas Kontinu

Banyak distribusi tidak dapat dijelaskan dengan cara distribusi probabilitas diskret karena
variabelnya bersifat kontinu. Dalam contoh contoh tersebut, variabel dapat memiliki hasil
yang tidak terbatas dan akibatnya, probabilitas kejadian tiap peristiwa tunggal adalah nol.
Lebih jauh, karena sifat distribusi yang kontinu, probabilitas tidak mungkin ditetapkan pada
suatu nilai variabel yang pasti. Contohnya, dalam distribusi kontinu yang diberikan dalam
Tabel 3.3, tidak mungkin untuk menghitung probabilitas sebuah tablet akan mempunyai berat
300,9 mg karena nilai probabilitas ini sangat kecil. Namun, probabilitas suatu peristiwa yang
terjadi dalam suatu kisaran memungkinkan untuk dihitung. Jadi, dalam Tabel 3.3. dan 3.4
probabilitas untuk menemukan sebuah tablet dengan berat dalam kisaran 300,1 302,0 mg
mungkin untuk dihitung.

Ada bnyak contoh distribusi probabilitas kontinu dalam bidang farmasi dan biomedis.
Contoh berikut menjelaskan penurunan berat badan pada 11700 pasien setelah periode
pengobatan 12 bulan dengan sebuah obat baru (Tabel 4.11 dan Tabel 4.12).

Contoh 4.6

Sebuah cara baru dalam penanganan obesitas telah dikembangkan dan telah dievaluasi secara
klinik pada 11700 pasien. Penurunan berat badan pada tiap pasien setelah penanganan selama
12 bulan dengan cara penanganan ini telah dicatat dan ditabulasikan dalam Tabel 4.11 dan
4.12. Tampilan data dalam Tabel 4.11 dan 4.12 secara grafik sebagai distribusi frekuensi dan
sebagai fungsi kerapatan probabilitas.

Informasi yang ditampilkan dalam kedua tabel ini diperoleh dari studi klinik yang sama,
tetapi dengan diskripsi data yang berbeda, dalam hal ini interval kelas yang berbeda telah
dipilih dalam ke dua tabel: 6 kg dalam Tabel 4.11 dan 2 kg dalam Tabel 4.12.

Tabel 4.1.1 Distribusi data frekuensi penurunan berat badan pada 11700subjek, 12 bulan
setelah pemberian suatu obat baru

Titik tengah kisaran Pengamatan Frekuensi relatif kerapatan frekuensi relatif


(kg)
4,5 806 0,0689 0,0115
10,5 6682 0,5711 0,0952
16,5 4143 0,3541 0,0590
22,5 69 0,0059 0,0010
Tabel 4.1.2 Distribusi data frekuensi penurunan berat badan pada 11700 pasien, 12 bulan
setelah pembeian suatu obat baru

Titik tengah kisaran Pengamatan Frekuensi relatif kerapatan frekuensi relatif


(kg)
2,5 15 0,0013 0,0006
4,5 101 0,0086 0,0043
6,5 690 0,0600 0,0300
8,5 1621 0,1385 0,0692
10,5 2411 0,2061 0,1030
12,5 2650 0,2265 0,1132
14,5 2129 0,1820 0,0910
16,5 1193 0,1020 0,0510
18,5 821 0,0702 0,0351
20,5 65 0,0056 0,0028
22,5 4 0,0002 0,0002
24,5 0 0,0000 0,0000

Kerapatan frekuensi relatif dapat didefinisikan sebagai frekuensi relatif tiap unit nilai ordinat
x. Sebagai contoh, dalam Tabel 4.1.1, kerapatan frekuensi relatif dapat diperoleh dengan
membagi frekuensi dengan 6 sehingga menunjukkan frekuensi relatif per kilogram.
Sebaliknya, frekuensi relatif dapat diperoleh dengan mengalikan kerapatan frekuensi relatif
dengan interval kelas.

Data yang ditampilkan dalam Tabel 4.11 dan Tabel 4.12 berasal dari studi klinis yang
sama, tetapi diatur dalam interval interval kelas yang berbeda untuk menggambarkan
pengaruh interval kelas, dan juga ukuran sampel pada bentuk distribusi yang dihasilkan.

4.2.4.1 Sifat Umum Fungsi Kerapatan Probabilitas

Karena ini merupakan suatu fungsi probabilitas, total daerah di bawah kurva harus
sama dengan 1.
Fungsi kerapatan probabilitas memiliki rata rata, variansi dan simpangan baku.
Pada umumnya, rata rata terletak dalam daerah pusat umum. Daerah di bawah kurva
antara dua batas tertentu dapat dihitung dengan mengetahui rata rata dan simpangan
baku.
Meskipun beberapa fungsi kerapatan probabilitas dapat diperoleh dari perhitungan
probabilitas teoritis, secara umum variabel variabel yang dipelajari dalam ilmu
kefarmasian dan ilmu pengetahuan yang berkaitan bukan merupakan hasil dari situasi
situasi probabilitas yang sederhana. Oleh karena itu, bentuk pasti dari kurva
probabilitas diperoleh hanya setelah memplotkan data yang diperoleh dari percobaan.
Dengan meningkatnya jumlah pengamatan percobaan (yaitu ukuran sampel
meningkat), bentuk fungsi kerapatan probabilitas dan besarnya parameter parameter
kunci, misalnya rata rata, menjadi tidak bergantung pada ukuran sampel. Pada tahap
ini, pengamatan mempunyai karateristik dari suatu fungsi kerapatan probabilitas
tertent, yaitu distribusi normal.

4.2.4.2 Distribusi Normal

Distribusi normal, sering disebut juga sebagai distribusi Gaussian, diperdebatkan sebagai
distribusi teoritis yang paling penting dalam statistika, dan mengakibatkan distribusi ini
digunakan dalam banyak uji statistik inferensial. Lebih jauh, banyak variabel yang ditemui
dalam ilmu kefarmasian dan ilmu pengetahuan yang berkaitan dianggap menampilkan suatu
distribusi normal, misalnya berat tablet dalam suatu bets, konsentarasi bahan aktif dalam
obat, berat atau tinggi orang orang. Jika seluruh populasi diperiksa dengan memperhatikan
suatu sifat (variabel) tertentu, distribusi yang dihasilkan akan normal. Banyak dari sifat sifat
di atas terdapat dalam teorema limit pusat, salah satu hasil mendasar dari statistik. Secara
singkat, teorema pusat menyatakan bahwa jika sejumlah besar sampel disisihkan dari
distribusi apa saja (yaitu variabel) dengan variansi dan rata rata yang terbatas, distribusi
variabel ntersebut cenderung normal. Dengan kata lain, jika ukuran sampel cukup besar , data
akan terdistribusi secara normal, tidak tergantung pada sifat dari distribusi tempat sampel
sampel yang disisihkan berasal.

Sifat sifat distribusi Normal

Distribusi normal (diillustrasikan dalam Gambar 4.1) memiliki bentuk tersendiri dan
mempunyai ciri ciri berikut;

Berbentuk simetris
Berbentuk lonceng

X=

Gambar 4.1 Distribusi Normal

Memanjang dari
Mempunyai jumlah pengamatan yang tidak terbatas
Bentuknya ditentukan oleh rata rata dan simpangan baku
Rata rata, median dan modus secara numerik sebanding

Ada dua hal penting lainnya yang perlu diperhatikan mengenai distribusi normal.
Distribusi normal menrupakan suatu distribusi teoritis, yakni data percobaan tidak
akan benar benar memenuhi semua kriteria di atas, tetapi data tersebut akan sesuai
dengan deskripsi kenormalan. Sebagai contoh, data percobaan bersifat terbatas, bukan
tak terbatas.
Setiap distribusi normal unik secara numerik. Karenanya, distribusi normal tinggi pria
dalam suatu populasi akan berbeda dengan distribusi normal berat tablet dalam suatu
bets tablet. Akan tetapi, meskipun nilai rata rata dan simpangan baku akan berbeda
dari satu percobaan yang lain, bentuk kurva akan tetap sama, yaitu kurava akan
berbentuk lonceng dan simetrik.

Hal hal tersebut diillustrasikan dalam Gambar 4.2 dan Gambar 4.3.

Gambar 4.2 menampilkan tiga distribusi yang memiliki karateristik karateristik


normal, yaitu berbentuk lonceng dan simetris. Rata rata ke tiga distribusi tersebut identik,
seperti yang ditandai oleh garis vertikal. Namun sebaran pada tiap ujung distribusi
distribusi ini berbeda, yaitu simpangan baku dari tiap distribusi tidak sama. Distribusi (a)
mempunyai simpangan baku tertinggi dan (c) mempunyai simpangan baku terrendah.

Sebaliknya, Gambar 4.3 menampilkan tiga distribusi normal yang memiliki


variabilitas (simpangan baku)yang identik tetapi memiliki rata rata yang berbeda. Distribusi

(a)

(c) (b)

Gambar 4.2 Distribusi distribusi normal dengan nilai rata rata yang sama tetapi berbeda
nilai simpangan baku
Gambar 4.3 Distribusi distribusi normal dengan simpangan baku yang sama tetapi nilai rata
rata berbeda.

(a) mempunyai nilai rata rata terendah dan (c) mempunyai nilai rata rata tertinggi.

Secara matematik, distribusi normal dinyatakan dengan persamaan berikut

1 2
1
() = 2 2(
)
< <

dengan adalah rata rata, adalah simpangan baku dan e = 2,78128. Oleh karena itu,
persamaan ini menyatakan bahwa distribusi normal dapat mengadopsi kurva dalam jumlah
yang tidak terbatas, semuanya berbentuk lonceng dan simetris karena ada sejumlah nilai rata
rata dan simpangan baku yang tidak terbatas baku yang dapat dimiliki. Selain itu,
persamaan ini juga menegaskan bahwa dengan mengetahui rata rata dan simpangan baku
dari suatu distribusi, ordinat f(x) dapat dihitung untuk setiap nilai x. Dengan cara ini, plot
distribusi normal dapat dihasilkan. Niali nilai untuk hubungan antara simpangan baku dan
daerah di bawah kurva berikut sangat bermanfaatuntuk diingat:

Rata rata satu simpangan baku mencakup 68,27% dari semua nilai
Rata rata satu simpangan baku mencakup 95,45% dari semua nilai
Rata rata satu simpangan baku mencakup 99,73% dari semua nilai

Sebaliknya, mungkin lebih mudah untuk mengingat hal berikut :

50% dari semua nilai terletak antara rata rata 0,67 simpanga baku
95% dari semua nilai terletak antara rata rata 1,96 simpanga baku
99% dari semua nilai terletak antara rata rata 2,57 simpanga baku

4.2.4.3 Distribusi Normal Baku

Suatu hal yang ditekankan dalam bagian sebelumnya adalah kekhususan tiap distribusi
normal, masing masing memiliki rata rata dan simpangan baku yang khas. Oleh karena
itu, untuk menghitung probabilitas suatu peristiwa yang terjadi menggunakan masing
masing distribusi khas akan dibutuhkan perhitungan fungsi kerapatan probabilitas untuk
vaariabel tersebut, sebuah tugas yang sulit. Distribusi normal baku, suatu distribusi
umumyang memiliki nilai rata rata 0 dan simpangan baku 1, digunakan untuk mengatasi
kesulitan ini. Daerah di bawah kurva pada distribusi ini telah dihitung dan dapat digunakan
untuk memperkirakan probabilitas kejadian suatu peristiwa yang distribusi normal
lengkapnya belum dihitung. Metode untuk melakukan ini umumnya disebut sebagai
tranformasi z. Contoh contoh berikut menjelaskan mekanisme penggunaan transformasi z
untuk menetapkan jarak distribusi probabilitas normal dari suatu variabel x. Dengan angka
baku

=
Contoh 4.7

Suatu bets berisi 5000 tablet telah diproduksi dan konsentrasi bahan aktifnya diukur dalam
semua tablet. Rata rata () bets adalah 200 10 mg dan distribusi konsentrasi bahan aktif
terdistribusi secara normal. Hitunglah proporsi bets yang mengandung bahan aktif

a) 180 mg atau kurang.


b) Antara 185 sampai 212 mg
c) Lebih dari 214 mg

Penyelesaian:

a) Diketahui x = 180 mg, = 200 dan =10, sehingg

180200
= = = 2,00
10

Dari Tabel distribusi normal baku diperoleh proporsi tablet tablet yang mengandung
180 mg bahan aktif adalah z = - 2,00, sehingga luas daerah di bawah distribusi
normal baku (dari Lampiran Distribusi normal baku) dan probabilitasnya, yaitu 0,
0228. Ini merupakan probabilitas suatu tablet yang disampel secara acak dari bets
akan mengandung 180 mg atau kurang bahan aktif swbesar 2,28%.

b) 1 = 185 2 = 212, maka


1 185200 2 212200
1 = = = 1,5 dan 2 = = = 1,2, sehingga
10 10
Luas daerah antara 185 sampai 212 = P(-1,5 < z < 1,2) = 0,4332 + 0,3849 = 0,8181
Jadi probabilitas 0,8181 merupakan probabilitas suatu tablet yang disampel secara
acak dari bets akan mengandung antara 185 sampai 212 mg bahan aktif.
c) Untuk x = 214, maka
214200
= = = 1,4, sehingga
10
Probabilitas lebih dari 214 mg = P(z > 1,4) = 1 - 0,9192 = 0,0808.
Jadi probabilitas 0.0808 adalah probabilitas suatu tablet yang disampel secara acak
dari bets akan mengandung lebih dari 214 mg bahan aktif.

4.2.4.4 Distribusi Student (Distribusi t)

Distribusi Student biasa disebut distribusi t, petama kali dijelaskan oleh William Sealy Gosset
tahun 1908 (yang menggunakan nama samaran Student) dan sejak saat itu telah digunakan
secara luas dalam analisis statistik. Distribusi t umumnya digunakan dalam analisis statistik
bila sampel berukuran kecil karena distribusi rata rata setelah pengambilan sampel tidak
benar benar sesuai dengan distribusi normal. Distribusi t dapat dihitung dengan mengambil
sampel dengan ukuran tertentu n dan diterapkan dengan persamaan sebagai berikut:

= /

dengan adalah rata rata sampel, adalah rata populasi, s adalah simpangan baku sampel
dan n adalah ukuran sampel

Karateristik karateristik utama distribusi

Berbentuk simetris (seperti distribusi normal)


Ekor ekor (daerah yang ditempati oleh nilai nilai ekstrim distribusi) lebih panjang
dari pada untuk distribusi normal terbakukan.
Bentuk distribusinya tergantung pada ukuran sampel. Sampel sampel yang
berukuran kecil dapat menghasilkan suatu kisaran simpangan baku sampel. Variasi
dari sampel ke sampel menurun seiring meningkatnya ukuran sampel dan karenanya,
nilai nilai ekstrim statistik t menjadi makin jarang kurang mungkin. Hal ini
menghasilkan penurunan dalam daerah daerah yang ditempati oleh ekor ekor
distribusi.
Dengan meningkatnya ukuran sampel, bentuk distribusi t menjadi lebih menyerupai
bentuk distribusi normal terbakukan.
Sebuah parameter yang berhubungan dengan ukuran sampel yang umumnya
digunakan dalam statistik mengenai distribusi t adalah derajat kebebasan (db atau df).
Dalam kasus uji satu sampel, misalnya perhitungan statistik t setelah pengambilan
sampel acak dari suatu populasi dengan v = db = n 1.
Karena efek efek ukuran sampel terhadap bentuk distribusi t, pelaporan daerah di
bawah tiap distribusi t untuk probabilitas probabilitas yang berbeda untuk tiap db
akan menyita waktu. Oleh karena itu, distribusi t normalnya dilaporkan sebagai
statistik t yang berkaitan dengan probabilitas probabilitas tertentu dan derajat
kebebasan yang berbeda (lampiran distribusi t)

Kurva Distrusi t adalah sebagai berikut

Kurva distribusi t

Contoh 4.8

Misalkan ukuran suatu sampel dengan n = 13 dengan p = 0,95. Hitung


Penyelesaian

Dengan n = 13, maka db = n 1 = 13 1 =12, sehingga

= (0,05)12 = 1,782 (diperoleh dari lampiran distribusi t).

4.2.4.5 Distribusi Chi Kuadrat ( )

Distribusi 2 di baca Chi Kuadrat) merupakan distribusi penting lainnya yang membentuk
suatu bagian terpadu dari beberapa prosedur statistik, misalnya uji 2 , uji kecocokan.
Distribusi ini dapat didefinisikan secara matematik sebagai
2 2
= 0 ( 2 )0,5(2) 0,5 = 0 2 0,5

dengan v adalah jumlah derajat bebas (db = v = n 1), 0 adalah konstanta yang tergantung
pada v dan 2 adalah statistik chi kuadrat. Luas daerah di bawah kurva sama dengan 1

Bentuk kurva Chi Kuadrat adalah sebagai berikut:

Gambar Distribusi 2

Contoh 4.9.

Misalkan ukuran sampel n = 10 dengan p = 0,95. Hitung 2 !

Penyelesaian

Untuk n = 10, maka v = db = n 1 = 10 1 = 9, sehingga


2
2 = (0,95)9 = 16,919.

Nilai Z dan distribusi 2

Yang menarik, nilai z yang berasal dari suatu distribusi normal berhubungan dengan nilai
2 . Jika sebuah sampel (n = 1) diambil dari suatu distribusi normal, nilai 2 dapat dihitung
seperti
()2
2 = 2

dengan x adalah nilai numerik sampel, adalah rata rata populasi dan 2 adalah variansi
populasi. Jika proses ini diulangi berkali kali, sebuah plot kerapatan probabilitas nilai 2
dapat dihasilkan. Bentuk plot ini identik dengan distribusi 2 (db = 1) dan biasa ditulis 2 =
12 .

4.2.4.6 Distribusi F

Distribusi F merupakan distribusi penting lainnya dalam statistik inferensial. Distribusi ini
berasal dari distribusi pengambilan sampel dengan rasio dua perkiraan bebas variansi yang
berasal dari distribusi normal. Secara khusus, misalkan dua sampel dengan ukuran yang yang
diketahui telah diambil dari dua distribusi normal dengan variansi variansi tertent; statisti F
dapat dinyatakan sebagai

2 /( 1)2
= 1 12 /(1 1)12
2 2 2 2

dengan 1 dan 2 melambangkan ukuran sampel 1 dan 2, 12 dan 22 melambangkan variansi


dari ke dua sampel dan 12 dan 22 melambangkan variansi dari ke dua populasi.

Bentuk kurva distrbusi F sebagai berikut:

(1 ,2)

dengan = 0,05 = 0,01, sedangkan 1 = 1 1 dan 2 = 2 1

Contoh 4.10

Misalkan ukuran sampel 1 = 7 dan 2 = 10 serta = 0,05. Hitunglah (1 ,2 ) !

Penyelesaian

Untuk 1 = 7, maka 1 = 1 1 = 7 1 = 6 dan 1 = 1 1 = 10 1 = 9, dengan =


0,05, maka

(1 ,2) = 0,05(6,9) = 3,37


BAB 5 PENGUJIAN HIPOTESIS STATISTIK

Jika suatu studi dari suatu bets pilot (bets percontohan) berisi tablet (N = 5000) telah dibuat
dan berat tiap tablet diperiksa setelah pengempaan menggunakan timbangan otomatis.
Selanjutnya, analis mengambil dua sampel tablet (n = 10) dari bets pilot dan sekali lagi tiap
tablet ditimbang. Statistik deskriptif untuk tiap kelompok disajikan dalam Tabel 5.1.

Perbedaan dalam besarnya statistik populasi dan statistik sampel dapat disebabkan
oleh variabilitas. Statistik populasi bersifat pasti (tetap) karena ditentukan dengan mengacu
pada tiap anggota populasi secara keseluruhan. Sebaliknya, statistik sampel bersifat khas
untuk sampel itu, yaitu kelompok yang terdidri dari 10 tablet dalam contoh di atas. Ketidak
sesuaian yang diamati antara statistik sampel dan statistik populasi merupakan akibat
variabilitas yang disebabkan oleh kebetulan dan ini disebut sebagai kesalahan pengambilan
sampel (sampling error). Dalam konteks ini, kesalahan tidak berarti teknik pengambilan
sampel yang tidak tepat atau teknik percobaan yang kurang baik, tetapi seringkali
menggambarkan efek dari hasil individual pada statisti deskriptif yang berkaitan dengan
suatu sampel.

5.1 Teori Dasar dari Pengujian Hipotesis Statistik

Dalam pengujian hipotesis statistik, anggapan ditetapkan mengenai kemungkinan suatu


peristiwa dan selanjutnya, dengan menggunakan metodologi yang sesuai, validitas anggapan
anggapan ini diperiksa. Contohnya, bayangkan suatu proses pembuatan sebuah produk
farmasi yang telah beroperasi beberapa tahun dan telah divalidasi sesuai dengan panduan US
Food and Drug Administration (FDA). Ini merupakan suatu proses pembuatan yang
terkendali dengan baik yang memproduksi suatu bentuk sediaan farmasi dengan spesifikasi
yang dipersyaratkan. Sebagai contoh, proses produksi otomatis dapat mempunyai masalah
yang berkaitan dengan teknologi informasi, sehingga menyebabkan waktu pencampuran,
pengeringan menjadi tidak tepat, dan sebagainya. Contoh ini telah dikutip untuk menjelaskan
dasar pengujian hipotesis statistik. Prtama tama suatu anggapan ditetapkan dan kemudian
data dikumpulkan untuk dapat membuat kesimpulan kesimpulan yang berkenaan dengan
validitas dari anggapan awal.

Untuk menjelaskan prisip prinsip ini lebih jauh, kita dapat menggunakan contoh
berat dua sampel tablet yang berasal dari suatu bets dan juga juga berat semua tabletdalam
Tabel 5.1. Tampak jelas dari data bahwa rata rata dan simpangan baku sampel tidak identik
dengan rata rata dan simpangan baku populasi, yaitu parameter parameter populasi
sebenarnya. Akibatnya, satu pertanyaan dapat muncul berkenaan dengan validitas data
sampel, misalnya apakah nilai rata rata yang berkaitan dengan sampel sampel berbeda
dengan rata rata populasi ? Sebagai alternatif, sesearang dapat beranggapan bahwa rata
rata sampel adalah perwakilan dari rata rata populasi dan oleh karena itu perbedaan yang
diamati antara rata rata sampel dan rata rata populasi dapat dikatakan sebagai kesalahan.
Untuk memperkuat (menolak) anggapan ini, distribusi pengambilan sampel dari rata rata
sebaiknya diperiksa. Statistik populasi menyatakan bahwa rata rata dan simpangan baku
masing masing adalah 250,0 dan 4,5 mg. Distribusi pengambilan sampel dari rata rata
ditetapkan dengan mengambil sejumlah besar sampel dari populasi, tiap sampel mengandung
10 anggota (tablet). Rata rata tiap sampel dihitung dan distribusi frekuensi ditetapkan
dengan memplotkan frekuensi terhadap variabel kontinu seperti Gambar 5.1

Tabel 5.1 Statistik deskriptif untuk berat tablet dalam suatu bets (populasi) keseluruhan dan
dua sampel yang berasal dari bets populasi

Kelompok Rata rata (mg) Simpangan baku (mg)


Populasi (N=5000) 250,0 4,5
Sampel 1 (n = 10) 253,6 4,9
Sampel 2 (n = 10) 252,6 4,1

Distribusi frekuensi di atas memberikan informasi mengenai probabilitas untuk


mengambil sampel suatu berat tablet rata rata tertentu dan karenanya digunakan untuk

236,5 241,0 245,5 250,0 254,5 259,0 263,5

Rata rata berat tablet (mg)

Gambar 5.1 Distribusi pengambilan sampel dari berat tablet

menentukan probabilitas pengambilan suatu sampel dari populasi dengan rata rata sampel
tertentu. Persamaan yang digunakan untuk menghitung statistik z adalah

=

dengan adalah rata rata sampel, adalah rata = rata populasi dan adalah simpangan
baku populasi. Kesalahan pengambilan sampel dalam trnsformasi z, ( ), dibagi dengan
simpangan baku populasi karena hal ini menghubungkan kesalahan pada variabilitas.

Kembali ke contoh tentang berat tablet, pertanyaan yang muncul mengenai


pentingnya perbedaan antara rata rata populasi dari tiap rata rata sampel sekarang dapat
dinilai menggunakan transformasi z. Jadi, probabilitas untuk mengamati rata rata sampel
sebesar 253,6 mg dan 252,mg adalah sebagai berikut:

Untuk sampel 1,
253,6250,0
= = = 0,8
4,5

Dari tabel distribsi normal mempunyai probabilitas sebesar 0,7881. Karena probabilitas
pengamatan suatu rata rata sampel sebesar 253,6 mg atau kurang adalah 78,81%, sehingga
disimpulkan bahwa ini merupakan suatu peristiwa yang mungkin terjadi atau kita
menganggap bahwa rata rata sampel adalah perwakilan dari rata rata populasi.

Demikian pula, untuk sampel 2


252,6250,0
= = = 0,58
4,5

Dari distribusi normal terbakukan, nilai z = 0,58 berhubungan dengan probabilitas sebesar
0,7190. Ini melambangkan probabilitas pengamatan suatu rata rata sampel sebesar 252,6
mg atau kurang.

Jika kita mengambil sampel ke tiga dari tablet tablet tersebut diambil pada tahap
tahap akhir proses pentabletan dan berat tablet dalam sampel tersebut ditentukan seperti
sebelumnya, yaitu rata rata berat tablet adalah 235,7 mg. Apakah rata rata sampel
merupakan perwakilan dari rata rata populasi ? Pertanyaan ini dapat dijawab dengan yang
sama, yaitu
235.7250,0
= = = 3,18
4,5

Dari distribusi normal terbakukan dapat dilihat statistik z dengan hubungan suatu probabilitas
sebesar 0,0007. Hal ini menyatakan bahwa kemungkinan suatu sampel berisi 10 tablet yang
memiliki berat rata rata 235,7 mg yang diambil dari suatu populasi dengan sebenarnya
250,0 4,5 mg sebesar 0,07%. Berkaitan dengan rendahnya probabilitas peristiwa ini, dapat
disimpulkan bahwa sampel ini bukan merupakan perwakilan dari rata rata bets tablet
tablet populasi, atau secara alternatif, sampel ternyata berasal dari populasi lain.

5.1.1 Anggapan Anggapan Dalam Pengujian Hipotesis Statistik

Skenario yang dijelskan di atas mengenai persamaan dan perbedaan antara statistik sampel
dan populasi membawa kita ke dalam mekanisme pengujian hipotesis statistik. Sebelum
pengumpulan ke tiga sampel dari bets tablet tersebut, dianggap bahwa rata rata dari ke tiga
sampel tersebut seharusnya mewakili rata rata populasi. Anggapan ini umumnya disebut
sebagai hipotesis nol dan merupakan posisi awa2l dalam pengujian hipotesis statistik. Alasan
untuk posisi ini ada dua:

Pertama sangat sulit untuk membuktikan bahwa sesuatu itu benar, tetapi lebih mudah
untuk membuktikan bahwa sesuatu itu salah. Contohnya, seseorang dapat
beranggapan bahwa, dalam suatu peristiwa olahraga, suatu tim tertentu akan selalu
menang, karena tim ini belum terkalahkan dalam kurun waktu 5 tahun. Namun,
mungkin saja tim ini akan tampil buruk pada hari tertentu dan kemudian kalah,
sehingga membuat anggapan awal menjadi tidak valid.
Ke dua untuk menggunakan suatu hipotesis nol, yang merupakan titik awal untuk
memudahkan analisis selanjutnya yang merupakan suatu hipotesis yang ditetapkan
untuk satu tujuan, yaitu ditolak. Karenanya, lebih mudah anggapan bahwa rata rata
sampel merupakan perwakilan rata rata populasi, dan oleh karena itu secara statistik
sama dengan rata rata populasi, dari pada untuk beranggapan bahwa rata rata tidak
mewakili dan berbeda dari rata rata populasi pada suatu jumlah tertentu.

Pengujian hipotesis statistik merupakan suatu ukuran apakah hipotesis nol diterima
atau ditolak. Jika hipotesis nol ditolak, hipotesis alternatif diterima. Hipotesis altenatif
umumnya merupakan dasar operasional dari hipotesis penelitian. Kembali ke contoh
berkenaan dengan berat tablet, kita telah diminta untuk mengidentifikasi apakah rata rata
sampel berbeda dari rata rata populasi. Oleh karena itu, hipotesis nol dan hipotesis alternatif
dapat dinyatakan sebagai berikut.

Hipotesis nol (0 ): tidak ada perbedaan antara rata rata sampel dan rata rata
populasi (0 : = 0 )
Hipotesis altenatif ( 1 ): ada perbedaan antara rata rata sampel dan rata
rata populasi ( : 0 )

Setelah analisis statistik lengkap (sesuai dengan desain percobaan), hasil hasilnya lalu
dinyatakan sebagai penerimaan dan penolakan hipotesisi nol.

5.1.2 Mendefinisikan aras nyata (level of significance) atau taraf arti dan daerah
kritis penerimaan dan penolakan hipotesis nol

Langkah uji hipotesis sebagai berikut

a) Pasangan hipotesis terdiri dari


Untuk dua arah
0 : tidak ada perbedaan antara rata rata sampel dan rata rata populasi
( 1 ): ada perbedaan antara rata rata sampel dan rata rata populasi
Untuk satu arah kanan terdiri dari
0 : rata rata sampel lebih kecil atau sama dengan rata rata populasi
: rata rata sampel lebih besar dari rata rata populasi
Untuk satu arah kiri
0 : rata rata sampel lebih besar atau sama dengan rata rata populasi
: rata rata sampel lebih kecil dari rata rata populasi

b) Tentukan taraf arti (atau aras nyata )


c) Tentukan daerah kritis
d) Hitung statistik uji
e) Kesimpulan;
Jika nilai statistik uji lebih besar dari nilai tabel ( diperoleh dari Tabel distribusi
normal z atau tabel distribusi t atau tabel distribusi 2 atau distribusi F dan lain
lain) maka 0 ditolak.

5.1.3 Uji (hasil) satu arah dan dua arah

Bagian pengendalian mutu dari suatu perusahaan farmasi telah menyatakan bahwa
beberapa bets sediaan antasida perusahaan tersebut gagal melewati uji kemanfaatan
pengawet, seperti yang ditetapkan oleh British Pharmacopoeia. Bagian formulasi telah
disarankan untuk memformulasi kembali produknya, sedemikian sehingga produk yang baru
mengandung kurang dari 1` 102 mikroorganisme/ml setelah penyimpanan pada suhu 20
selama 2 minggu. Berdasarkan hal tersebut bagian formulasi telah memproduksi formulasi
baru untuk dinilai kemanjuran pengawetnya. Hasil hasilnya, ditampilkan sebagai jumlah
mikroorganisme yang bertahan hidup dalam 10 botol, ditunjukkan dalam Tabel 5.2.

Tabel 5.2 Kandungan mikroorganisme (jumlah mikroorganisme/ml) dalam masing masing


dari 10 botol sediaan antasida

Nomor botol Jumlah mikroorganisme yang bertahan hidup/ml


1 75
2 80
3 101
4 82
5 84
6 98
7 93
8 100
9 78
10 89

Dalam situasi ini, hipotesis nol ditetapkan sebelum pengumpulan data, dan dapat
dinyatakan sebagai berikut: tidak ada perbedaan antara rata rata yang diharapkan (100
mikroorganisme /ml) dan rata sampel, artinya 0 : = 100. Sebaliknya, hipotesis alternatif
menyatakan bahwa ada suatu perbedaan negatif antara rata rata sampel yang diamati dan
rata rata yang diharapkan, dan produk baru tersebut memenuhi spesifikasi British
Pharmacopoeia, artinya : < 100 mikroorganisme/ml.

Satu satunya hal yang diinginkan penyidik dalam analisis ini adalah untuk
mengetahui apakah kandungan mikroba rata rata dari formulasi baru lebih rendah daripada
rata rata yang ditentukan (diharapkan). Karena hanya ada satu hasil yang diinginkan, uji ini
disebut uji satu arah.

Sebagai alternatif, ahli formulasi dalam percobaan di atas mungkin ingin mengetahui
lebih banyak mengenai kinerja formulasi tersebut. Dalam kasus ini, penting untuk
mengetahui apakah formulasi baru lulus atau gagal memenuhi rekomendasi farmakope. Jelas,
jika kandungan mikroba lebih besar daripada baku, produk tersebut telah gagal memenuhi
spesifikasi yang disetujui. Hal ini akan tetap memberikan informasi yang berguna mengenai
arah dari program formulasi ulang, kemungkinan besar mengidentifikasi pengawet
pengawet yang tidak efektif. Hipotesis nol dalam situasi ini identik dengan contoh
sebelumnya, yaitu tidak ada perbedaan antara rata rata yang diharapkan (100
mikroorganisme/ml) dan rata sampel, dalam hal ini, 0 : = 100 mikroorganisme/ml.
Namun, hipotesis alternatif telah berubah, dan sekarang ditetapkan sebagai: ada perbedaan
antara rata rata yang diharapkan (100 mikroorganisme/ml) dan rata rata yang diamati,
yaitu : 100 mikroorganisme/ml. Sumber perbedaan ini ada dua, yaitu perbedaan
mungkin disebabkan oleh rata rata sampel yang lebih besar atau kurang dari rata rata yang
diharapkan. Pada kondisi ini hasil dari analisis memiliki dua arah karena ada dua
kemyngkinan hasil yang akan berakibat pada penolakan hipotesis nol.

Kepututusan mengenai apakah sattistik uji harus dievaluasi sebagai uji satu arah atau
dua arah merupakan hal yang sangat penting. Pemilihang yang tidak tepat akan berakibat
pada penafsiran analisis statistik yang tidak tepat karena suatu perbedaan yang nyata antara
pengobatan dapat dinyatakan tidak nyata dan sebaliknya.

5.1.4 Menentukan daerah kritis untuk suatu metode statistik

Pada gamabar gambar di bawah ini akan kita dapat tentukan daerah - daerah kritis suatu uji
hipotesis, yaitu

/2 1 = /2

/2 /2

Gambar 5.2 Distribusi normal terbakukan menunjukkan daerah kritis (diarsir) statistik z
untuk uji dua arah

Gambar 5.3 Distribusi normal terbakukan menunjukkan daerah kritis (diarsir) statistik z
untuk uji satu arah positif
1-

Gambar 5.4 Distribusi normal terbakukan menunjukkan daerah kritis (diarsir) statistik z
untuk uji dua arah

Pada daerah 1 disebut daerah tidak nyata, yaitu suatu daerah penerimaan
hipotesis, di mana dalam daerah ini nanti apabila kita mendapatkan nilai statistik uji terletak
pada daerah penerimaan (1 ) di bandingkan dengan nilai tabel maka 0 diterima yang
berarti ditolak. Sebaliknya, jika nilai statistik daerah disebut daerah nyata, yaitu suatu
daerah penolakan hipotesis, di mana dalam daerah ini nanti apabila kita mendapatkan nilai
statistik uji terletak pada daerah peolakan ( ) di bandingkan dengan nilai tabel maka 0
ditolak yang berarti diterima.

Pada uji hipotesis dua arah aras nyata (taraf nyata), yaitu dibagi 2 menjadi dua
bagian, /2 pada kiri dan /2 pada bagian kanan Gambar 5.2. Sebaliknya uji uji satu arah
dapat dilihat pada Gambar 5.3 dan Gambar 5.4 dengan taraf nyata .

5.2 Kesalahan Dalam Pembuatan Keputusan (Kesalahan Tipe I dan Tipe II)

Ada dua tipe kesalahan, kesalahan tipe I dan kesalahan tipe II dapat terjadi ketika
menentukan hasil dari percoabaan statistik. Perbedaan antara ke dua kategori kesalahan ini
dan kepentingannya dapat dijelaskan dengan menacu pada situasi hipotesis berikut. Dalam
suatu studi klinis, efek suatu -bloker terhadap penurunan tekanan darah sistolik pada 100
pasien diperiksa. Penurunan (SD) didapat sebesar 30 3 mmhg dan distribusi
pengambilan sampel penururnan tekanan darah ditunjukkan dalam Gambar 5.5. Dalam
gambar ini hipotesis nol ditunjukkan daerah yang tidak diaarsir. Daerah yang diarsir
melambangkan 5% distribusi atas. Biasanya, dalam pengujian hipotesis statistis, setiap
sampel yang dicatat dalam daerah ini akan mengarah pada penolakan hipotesis nol.
Namun, hal ini agak aneh, karena ini diketahui sebagai suatu respon yang normal, yaitu
setiap distribusi dari suatu variabel tertentu akan mempunyai arah atas dan bawah.
Probabilitas melakukan kesalahan tipe I dilambangkandengan . Oleh karena itu,
probabilitas melakukan kesalahan tipe I sebenarnya merupakan probabilitas penolakan
hipotesis nol.

Sebaliknya, jika hipotesis nol diterima, padahal sebenarnya salah, sebuah


kesaalahan tipe II telah dilakukan. Maka umumnya probabilitas membuat suatu
kesalahan tipe II dihitung jika hipotesis nol diterima. Suatu hubungan timbal balik
terjadi antara kesalahan tipe I dan II. Jadi, probabilitas melakukan kesalahan tipe I
dikurangi (dengan meningkatkan nilai ), probabilitas melakukan kesalahan tipe II
akan meningkat. Hubungan ini digambarkan dalam Gambar 5.6 a menggamarkan
distribusi pengambilan sampel dari rata rata penurunan tekanan darah setelah
pemberian suatu -boker. Ini merupakan suatu distribusi normal yang memiliki suatu
rata rata dan simpangan baku (30 3 mmhg). Dengan aras nyata = 0,05 (satu arah)
nilai kritis statistik z yang menetapkan penolakan hipotesis nol dapat dihitung dengan

34,95mmhg

Penurunan tekanan darah (mmhg)

Gambar 5.5 Distribusi pengambilan sampel pada penurunan tekanan darah distolik ( = 30
mmhg, =3 mmhg)
30
= maka 1,65 = , sehingga x 30 = (1,65)(3) = 4,95
3

Jadi x = 30 + 4,95 = 34,95 mmhg.

Karena itu, pada taraf nyata tertentu, setiap nilai yang diamati bernilai 34,95 mmhg akan
berakibat pada penolakan hipotesis nol.

Jika selanjutnya, dianggap bahwa hipotesis nol tersebut salah dan, sesuai dengan
hipotesis alternatif diterima, masalah masalah yang berkaitan dengan kesalahan kesalahan
tipe II dapat dijelaskan. Dalam Gambar 56 b kita dapat melihat distribusi pengambilan
sampel yang menggambarkan hipotesis alternatif dengan rata rata dan simpangan baku
sebesar 37 3 mmhg

(a)

=0,05

Penurunan tekanan darah (mmhg)


(b)

= 0,25

Penurunan tekanan darah (mmhg)

Gambar 6 Distribusi pengambilan sampel dari rata rata penurunan tekanan darah setelah
pemberian -boker (a) Penurunan tekanan darah untuk hipotesis nol, daerah yang diarsir
menunjukkan probabilitas melakuakan kesalahan tipe I ( = 0,05). (b) Penurunan tekanan
darah untuk hipotesis alternatif, daerah yang diarsir menunjukkan probabilitas kesalahan tipe
II (b). Kembali ke contoh, hipotesis alternatif tersebut normal, mempunyai ekor pada tiap
distribusi. Dalam Gambar 5.6 a, probabilitas untuk membuat kesalahan tipe I, yaitu
penolakan hipotesis nol bila hipotesis nol benar, dilambangkan dengan daerah yang diarsir.
Daerah yang dirsir dalam Gambar 5.6 b melambangkan probabilitas untuk melakukan
kesalahan tipe II, yaitu menerima hipotesis nol padahal hipotesis ini seharusnya ditolak.
Akibatnya, dalam distribusi pengambilan sampel yang berkaitan dengan hipotesis nol, daerah
yang diarsir menunjukkan probabilitas pemilihan suatu nilai rata rata penurunan tekanan
darah yang akan terletak dalam daerah bukan penolakan hipotesis nol, ditetapkan sebesar <
34,95 mmhg. Oleh karena itu, daerah yang diarsir dalam Gambar 5.6 b mendefinisikan
daerah distribusi pengambilan sampel sampel (untuk hipotesis alternatif) yang berada di
bawah 34,95 mmhg. Daerah dari daerah ini dapaat dihitung menggunakan suatu trensformasi
z, sebagai berikut.
34,9537
= , maka = = = 0,68
3

Mengacu pada distribusi normal terbakukan, dapat dilihat bahwa probabilitas yang
berhubungan dengan nilai z hitung adalah 0,2514, karena itu, dalam contoh di atas =0,05
dan = 0,25

Suatu ringkasan dari hubungan saling mempengaruhi antara kesalahan tipe I dan tipe
II, serta peranan keduanya dalam proses pembuatan keputusan statistik ditunjukkan dalam
Tabel 5.3.

Ada beberapa konsekuensi berbeda dari kesalahan tipe I dan tipe II yang
mencerminkan hasil hasil yang berbeda bila hipotesis nol diterima atau ditolak. Jika
hipotesis nol ditolak, hipotesis penelitian diterima dan akibatnya sebuah usulan telah diubah
dari pemikiran menjaadi pengamatan. Namun, jika hipotesis nol telah ditolak padahal
kenyataannya benar, kesalahan tipe I telah dilakukan dan mengakibatkan suatu kesimpulan
yang tidak tepat telah dibuat. Sebaliknya penerimaan hipotesis nol bila sebenarnya salah akan
berakibat pada penolakan suatu hipotesis penelitian yang dapat diterima secara sempurna.
Keadaan ini menyoroti bahaya bahaya potensial dari kesalahan statistik dalam pembuatan
keputusan.

Tabel 5.3 Ringkasan hubungan antara hasil statistik dan kesalahan statistik

Hasil statistik Hasil sebenarnya


(keputusan) Hipotesis nol benar Hipotesis nol salah
(yaitu 0 : = 100 mmhg) (yaitu 0 : > 30 mmhg)
Bukan penolakan Keputusan benar Kesalahan tipe II ()
terhadap hipotesis nol
Menolak hipotesis nol/ Kesalahan tipe I () Keputusan yang benar
Menerima hipotesis
alternatif

Sebuah perusahaan pembuat antibiotik telah mengembangkan suatu antibiotik -


laktam baru yang telah dipatenkan dan telah dirancang untuk pengobatan pneumonia bagi
pasien dalam unit gawat darurat rumah sakit. Sebuah uji klinis telah dirancang untuk menilai
apakah antibiotik tersebut lebih berhasiat dari dapa antibiotik tepilih untuk pengobatan
pneumonia yang adasaat ini. Hipotesis nol dari studi ini adalah tidak ada perbedaan antara
kemanfaatan klinis dari antibiotik tersebut; sedangkan hipotesis alternatif menyatakan bahwa
antibiotik yang baru lebih bermanfaat dari antibiotik sebelumnya. Tabel 5.3 ada dua hasil
sebenarnya yang mungkin: hipotesis mungkin benara atau salah. Jika hipotesis nol benar, ini
menandakan bahwa tidak ada perbedaan kemampuan dari ke dua antibiotik tersebut untuk
mengobati pneumonia. Tetapi setelah penyelesaian studi dan analisis statistik setelahnya, ada
dua keputusan statistik yang mungkin.

Pertama, analis mungkin telah menerima (tidak menolak) hipotesis nol dan karenanya,
keputusan yang benar telah didapatkan.
Sebaliknya, analis mungkin telah menyimpulkan bahwa hipotesis nol harus ditolak
sehingga membuat kesalahan tipe I ().

Kesalahan kesalah terdapat dalam semua pengujian hipotesis statistik, dan dengan
berusaha untuk mengurangi satu jenis kesalahan, kemungkinan jenis kesalahan yang lain
akan meningkat. Maka tepat kiranya untuk memberikan saran mengenai batas tiap jenis
kesalahan yang dapat diterima dalam pengujian hipotesis statistik Biasanya, kesaalahan tipe I
() dipilih sebesar 0,05, karena nilai ini dianggap sebagai probabilitas yang cukup kecil untuk
melakukan kesalahan tipe ini, sementara tidak terlalu kecil sehingga dengan keliru justru
meningkatkan probabilitas terjadinya kesalahan tipe II ().

5.3 Kekuatan Suatu Uji Statistik

Dalam statistik, hubungan antara pembuatan keputusan statistik dan kesalahan sering disebut
dengan istilah kekuatan dari suatu studi. Khususnya, kekuatan suatu uji statistik dapat
didefinisikan sebagai probabilitas ditolaknya hipotesis nol bila hipotesis tersebut sebenarnya
salah. Dengan mengingat kesalahan tipe II () dapat didefinisikan sebagai probabilitas untuk
tidak menolak hipotesis nol bila seharusnya ditolak, kekuatan dinyatakan sebagai 1 . Jadi
dalam contoh mengenai penurunan tekanan darah, kekuatan uji statistik adalah sebesar 1
0,25, atau 75%. Kekuatan uji statistik, probabilitas untuk menhindari suatu kesalahan tipe II,
meningkat jika perbedaan antara hipotesis nol dan hipotesis alternatif meningkat.

5.3.1 Faktor Faktor Rancangan Percobaan yang mempengaruhi Kekuatan uji


Statistik

Kekuatan suatu uji statistik merupakan suatu pertimbangan penting dalam setiap rancangan
percobaan. Memaksimalkan kekuatan dari uji statistik akan menghasilkan kepercayaan yang
lebih besar terhadap ketepatan suatu hasil statistik. Besarnya kekuatan suatu studi
dipengaruhi beberapa faktor

Probabilitas terpilih untuk kesalahan tipe I ()


Besarnya perbedaan antara rata rata hakiki (hipotesis alternatif) dan rata rata yang
berhubungan dengan hipotesis nol
Ukuran sampel
Sifat dari uji statistik

Suatu pemahaman tentang sifat sifat dari pengaruh variabel di atas terhadap kekuatan suatu
uji statistik ini penting untuk menjamin bahwa rancangan percobaan mampu dilaksanakan.

5.3.1.1 Pemilihan Tingkat Probabilitas dari Suatu Kesalahan Tipe I

Jika probabilitas melakukan kesalahan tipe I () sengaja dikurangi, misalnya untuk menjamin
kendali yang lebih besar terhadapa nilai kritis yang berhubungan dengan penolakan hipotesis
nol, probabilitas melakukan suatu kesalahan tipe II meningkat. Pengaruh dari besarnya
pada hasil akhir probabilitas pembuatan kesalahan tipe II dapat digambarkan dengan
mengacu pada Gambar 5.6. Seperti dalam contoh ini distribusi pengambilan sampel yang
berhubungan dengan penurunan tekanan darah setelah pemberian suatu -bloker bersifat
normal dan mempunyai rata rata dan simpangan baku tertentu (30 3 mmhg). Dalam
gambar ini kesalahan tipe I dipilih sebesar 0,05 (satu arah) dan nilai kritis statistik z yang
menetapkan penolakan hipotesis nol dihitung sebesar 34,95 mmhg. Oleh karena itu, nilai
nilai yang disampel yang sama atau lebih besar dari nilai kritis ini dianggap berasal dari
distribusi normal yang berbeda dengan yang dijeaskan oleh hipotesis nol.

Jika kita memilih nilai nilai sebesar 0,10 dan 0,01, nilai nilai kritis dari
penurunan tekanan darah yang menegaskan penolakan masing masing hipotesis nol
dihitung sebgai berikut

Kesalah tipe I ( =0,10)

Diketahui dari lampiran tabel distribusi normal bahwa z = 1,28, sehingga nilai kritis dari
penurunan tekanan darah dapat dihitung menggunakan statisti z ini
30
= atau 1,28 =
3
Jadi x = 33,84 mmhg

Kesalan Tipe I ( = 0,01)

Dengan cara yang sama bahwa dari lampiran tabel distribusi normal bahwa z = 2,33,
sehingga nilai kritis dari penurunan tekanan darah dapat dihitung menggunakan statisti z ini
30
= atau 2,33 =
3

Jadi x = 36,99 mmhg.

Seperti sebelumnya, dengan menganggap hipotesis nol ditolak dengan rata rata dan
simpangan baku distribusi pengambilan saampel untuk hipotesis alternatif secara berurutan
adalah 37 3 mmhg, probabilitas pengamatan suatu kesalahan tipe II dapat dihitung
(Gambar 57 dan 5.8). Seperti sebelumnya, menurunkan besarnya kesalahan tipe I akan
menurun, akan tetapi kesalahan tipe II dapat meningkat. Nilai dapat dihitung menggunakan
taransformasi z.

Perhitungan jika = 0,10



=

33,8437,00
= = 1,05
3

Nilai z ini mengacu pada probabilitas pengamatan rata rata penurunan tekanan darah yang
kurang atau sama dengan 33,84 mmhg, yaitu 0,1469. Ini merupakan probabilitas melakukan
suatu kesalahan tipe II. Maka kekuatan uji ini adalah 1 0,1469 = 0,8531

(a) = 0,10

Penurunan tekanan darah (mmhg)

(b) = 0,14

Penurunan tekanan darah (mmhg)


Gambar 5.7 distribusi pengambilan sampel dari rata rata penurunan tekanan darah setelah
pemberian suatu -bloker : (a) Penurunan tekanan darah untuk hipotesis nol, daerah yang
diarsir mengambarkan probabilitas yang berhubungan dengan kesalahn tipe I ( = 0,10). (b)
Penurunan tekanan darah untuk hipotesis alternatif 37 3 mmhg (rata rata simpangan
baku), daerah yang diarsir menggambarkan probabilitas kesalahan tipe II ().

Perhitungan jika =0,01



=

36,9937,00
= = 0,0003
3

Nilai z ini mengacu pada probabilitas pengamatan rata rata penurunan tekanan darah yang
kurang atau sama dengan 36,99 mmhg, yaitu 0,50. Ini merupakan probabilitas melakukan
suatu kesalahan tipe II. Maka kekuatan uji ini adalah 1 0,50 = 0,50.

Pengaruh pengaruh pemilihan suatu nilai terhadap probabilitas melakukan


kesalahan tipe II dan terhadap kekuatan studi diringkas dalam Tabel 5.4.

(a)

= 0,01

Penurunan tekanan darah (mmhg)

(c) = 0,50

Penurunan tekanan darah (mmhg)

Gambar 5.8 distribusi pengambilan sampel dari rata rata penurunan tekanan darah setelah
pemberian suatu -bloker : (a) Penurunan tekanan darah untuk hipotesis nol, daerah yang
diarsir mengambarkan probabilitas yang berhubungan dengan kesalahn tipe I ( = 0,01). (b)
Penurunan tekanan darah untuk hipotesis alternatif 37 3 mmhg (rata rata simpangan
baku), daerah yang diarsir menggambarkan probabilitas kesalahan tipe II ().
5.3.1.2 Besarnya Perbedaan Antara Rata Rata Hakiki (Hipotesis Alternatif) dan
Rata rata pada Hipotesis Nol

Kekuatan yang didefinisikan sebagai probabilitas ditolaknya hipotesis nol bila hipotesis ini
memang salah. Oleh karena itu, kekuatan studi berbanding lurus dengan perbedaan antara
rata rata hipotesis alternatif dan rata hipotesis nol. Meningkatnya perbdedaan antara ke
dua parameter ini akan meningkatkan suatu studi. Pengaruh dari peningkatan perbedaan
antara nilai rata rata untuk hipotesis altenatif dan hipotesis nol terhadap kekuatan yang

Tabel 5.4 Ringkasan pengaruh tingkat terpilih terhadap probabilitas melakukan kesalahan
tipe II dan kekuatan studi yang dihasilkan untuk contoh yang digambarkan dalam Gambar 5.6
6.8

Kesalahan tipe I () Kesalahan tipe II () Kekuatan


0,01 0,50 0,50
0,05 0,25 0,75
0,10 0,14 0,86

hihasilkan ditampilkan dalam Gambar 5.9 5.11. Dalam gambar gambar ini aras nyata
yang dipilih, yaitu probabilitas melakukan kesalahan tipe I, dipertahankan pada nilai 0,05.
Berdasrkan nilai yang dipilih ini, hipotesis nol dapat ditolak jika nilai yang diamati sama
atau lebih besar dari nilai kritis penurunan tekanan darah, yaitu 34,95 mmhg. Dalam Gambar
5.9 a, 5.10 a, dan 5.11 a daerah ini diarsir. Selanjutnya, probabilitas melakukan suatu
kesalahan tipe II dapat dihitung menggunakan suatu teransformasi z, seperti sebelumnya.

(a)

= 0,05

Penurunana tekanan darah (mmhg)

(b)

= 0,63

Penurunan tekanan darah (mmhg)

Gambar 5.9 distribusi pengambilan sampel dari rata rata penurunan tekanan darah setelah
pemberian suatu -bloker : (a) Penurunan tekanan darah untuk hipotesis nol, daerah yang
diarsir mengambarkan probabilitas yang berhubungan dengan kesalahn tipe I ( = 0,05). (b)
Penurunan tekanan darah untuk hipotesis alternatif, daerah yang diarsir menunjukkan
probabilitas kesalahan tipe II (). Nilai rata rata SD masing maing adalah 30 3 dan
34 3 mmhg.

(a)

= 0,05

Penurunan tekanan darah (mmhg)

(b) = 0,25

Penurunan tekanan darah (mmhg)

Gambar 5.10 distribusi pengambilan sampel dari rata rata penurunan tekanan darah
setelah pemberian suatu -bloker : (a) Penurunan tekanan darah untuk hipotesis nol, daerah
yang diarsir mengambarkan probabilitas yang berhubungan dengan kesalahn tipe I ( =
0,05). (b) Penurunan tekanan darah untuk hipotesis alternatif, seperti yang didefinisikan oleh
hipotesis alternatif, daerah yang diarsir menggambarkan probabilitas kesalahan tipe II ().
Nilai rata rata SD masing maing adalah 30 3 dan 37 3 mmhg.

Perhitungan jika = 0,05 dan nilai nilai rata rata SD pada hipotesis nol dan
hipotesis alternatif secara berurutan adalah 30 3 dan 34 3

=

34,9534
= = 0,32
3

Karena itu, probabilitas melakukan suatu kesalahan tipe II adalah 0,63 (Lampiran Distribusi
normal atau Gambar 5.9). Kekuatan dari studi tersebut adalah 1 = 1 0,63 = 0,37

Perhitungan jika = 0,05 dan nilai nilai rata rata SD pada hipotesis nol dan
hipotesis alternatif secara berurutan adalah 30 3 dan 37 3

=

34,9537
= = 0,68
3

Karena itu, probabilitas melakukan suatu kesalahan tipe II adalah 0,25 (Lampiran Distribusi
normal atau Gambar 5.9). Kekuatan dari studi menjadi 75, yaitu 1 = 1 0,75.
Perhitungan jika = 0,05 dan nilai nilai rata rata SD pada hipotesis nol dan
hipotesis alternatif secara berurutan adalah 30 3 dan 40 3

=

34,9540
= = 1,68
3

Probabilitas melakukan kesalahan tipe II menjadi 0,05 (Lampiran Distribusi normal atau
Gambar 5.9) dan karena itu kekuatan studi adalah 1 = 1 0,05 = 0,95

Oleh karena itu, dapat disimpulkan bahwa bila ada perbedaan yang besar antara
hipotesis nol dan hipotesis alternatif, kekuatan suatu studi statistik akan menjadi besar. Hal
ini seharusnya tidak mengejutkan karena pernyataan ini menguraikan suatu konsep dasar
statistik, yaitu probabilitas bahwa sebuah perbedaan yang akan diamati tergantung pada
besarnya perbedaan.

5.3.1.3 Ukuran Sampel

Disamping yang telah dijelaskan di atas, dalam skenario mengenai penurunan tekanan darah,
hipotesis nol dan hipotesis alternatif mengacu pada persamaan maupun perbedaan nilai rata
rata. Jadi, distribusi untuk hipotesis hipotesis inimerupakan distribusi pengambilan sampel
nilai rata rata. Simpangan baku dari distribusi pengambilan sampel rata rata disebut
sebagai kesalahan baku sebagaimana yang telah dijelaskan sebelumnya dengan

=

(a)

= 0,05

Penurunan tekanan darah (mmhg)

(b)

= 0,05

Penurunan tekanan darah (mmhg)

Ahli Statistik yang berhubungan dengan rancangan percobaan, khususnya uji uji
klinis, sering diminta untuk memperkirakan jumlah subyek (sampel) yang dibutuhkan untuk
menjamin kekuatan statistik yang memadai dan selanjutnya meyakinkan bahwa kesimpulan
kesimpulan dari studi tersebut bersifat valid. Untuk melakukan perkiraan ini, membutuhkan
informasi berikut:

Spesifikasi melakukan probabilitas suatu kesalahan tipe I ()


Spesifikasi melakukan suatu kesalahan tipe II ()
Simpangan baku dari metode atau percobaan
Perbedaan antara rata rata hipotesis nol danhipotesis alternatif yang dianggap
praktis berkaitan.

5.4 Pemilihan Uji Statistik

Dalam prosesn pengujian hipotesis statistik, beberapa tahap kunci telah diidentifikasi:

Pernyataan hipotesis nol dan hipotesis alternatif


Pemilihan aras nyata () daan pertimbangan probabilitas melakukan kesalahan tipe II
Identifikasi sifat hasil percobaan, yaitu apakah hasilnya adalah satu arah atau dua
aarah
Identifikasi daerah kritis yang menentukan area penolakan hipotesis nol

5.4.1 Analisis Parametrik dan Nonparametrik

Analisis analisis statistik parametrik dan nonparametrik terutama dalam perbedaan


sifat yang berkaitan dengan penggunaannya. Uji uji parametrik (yaitu uji z, uji t, dan uji F)
hanya dapaat digunakan bila sejumlah anggapan telah sesuai. Jika anggapan anggapan ini
valid, penggunaan uji parametrik dibutuhkan karena menjamin kualitas keluaran analisis
statistik yang optimal. Dalam keadaan ini, kekuatan anaalisis meningkat disebabkan oleh
probabilitas yang tinggi untuk menolak hipotesis nol bila sebenarnya salah. Keadaan
percoabaan selanjutnya harus ditetapkan sebelum sebuah metode statistik parametrik dipilih
dan digunakan:

Sampel haarus diambil dari suatu populasi yang berdistribusi normal


Sampel harus bebas, yaaitu proses pengambilan sampel tidak boleh mempengaruhi
proses pengambilan sampel lainnya.
Variabel populasi yang diperiksa seragam. Ini disebut homoskedastisita
Variabel yang diperiksa harus diukur pada suatu interval ataau skala rasio dan nilai
nilai yang diperoleh dapat dengan mudah dimanipulasi menggunakan aritmetika
konvensional.

Satu anggapan tentang uji parametrik yang terdefinisi dengan baik adalah sifat data.
Dalam analisis parametrik, data (variabel) bersifat kontinu dapat dimanipulasi secara
matematik untuk menghasilkan statistik deskriptif (rata rata, variansi, simpangan baku).
Akan tetapi, seperti yang dijelaskan sebelumnya, data dapat dibagi ke dalam kategori -
kategori lain, yang paling nyata adalah skala nominal dan ordinal. Data tersebut tidak dapat
dianalisis secara statistik menggunakan uji parametrik dan analisis nonparametrik harus
digunakan. Pada tahap ini, tepat kiranya untuk meringkas sifat dari dat nominaal, ordinal dan
interval atau rasio.

5.4.1.1 Data Nominal

Data nominal ke dalam kelompok kelompok yang diberi sebuah nama atau judul. Contoh
contohnya meliputi:

Pengelompokan pasien pasien yang mengikuti suatu studi klinis berdasarkan usia
Pengelompokan pasien pasien yang mengikuti suatu studi klinis berdasarkan jenis
kelamin
Kategorisasi kerusakan tablet, misalnya retak-lepas (capping), berkeping (chipped),
berceruk (pitting)
Kategorisasi penyakit, misalnya kanker usus, kolitis ulseratif, penyakit Crohns,
divertikulitis
Efek samping yang berkaitan dengan pengobatan, misalnya mual, muntah,diare dan
sakit kepala

Data nominal biasanya dinyatakan dalam frekuensi frekuensi pengamatan yang berkaitan
dengan tiap kategori. Analisis statistik terhadap data tersebut dapat dilakukanmenggunakan
suatu analisis 2 atau suatu uji berdasarkan binomial.

5.4.1.2 Data Ordinal

Data ordinal dianggap mewakili tingkat pengaturan yang lebih tinggi dibandingkan data
nominal. Ada persamaan yang nyata antara ke dua tipe data ini, yaitu ke duanya tersusun atas
kategori kategori; namun kaategori kategori dalam data ordinal tidak bebas, tetapi
berbeda satu sama lain dalam hal besarnya. Sifat data ordinal dapat dijelaskan dengan
memperhatikan contoh contoh berikut:

Kategorisasi nyeri menggunakan skala analog (0 = tidak ada rasa nyeri, 10 = nyeri
luar biasa)
Kategorisasi peradangan (misalnya, peradangan gusi, artitis reumatoid, osteoarritis)
menggunakan indeks
Kategorisasi rasa (tidak pahit,agak pahit, sangat pahit)

Karakterisasi hubungan dalaam data ordinal umumnya dilakukan menggunakan koefisien


korelasi Spearman ( ) (Bab 12).

5.4.1.3 data Interval dan Rasio

Data interval dan rasio mewakili suatu tingkat pengaturan yang lebih tinggi dibandingkan
data nominal atau ordinal. Ke duanya dapat dikarakterisasi dengan mengetahui jarak antara
dua nilai pada tiap skala tertentu, yaitu jarak numerik antara dua nilai telah ditetapkan dalam
suatu unit pengukuran. Dalam suatu skala interval tidak ada nol kakiki, tetapi data rasio
memiliki suatu titik nol tertentu. Sebuah contoh klasik tentang skala interval adalah
pengukuran suhu (dalam Celciu maupun Fahrenheit)

Skala rasio juga merupakan suatu skala kuantitatif , tetapi berbeda dari skala interval
dalam satu sifat yang penting: skala rasio ini memiliki titik nol hakiki. Sebagian besar
percobaan dalam ilmu kefarmasian menghasilkan data yang bersifaat rasio. Contohnya
meliputi massa, tinggi, konsentrasi, tekanan darah kecepatan penyaringanglomerulus, daerah
di bawah kurva dan sebagainya. Contoh contoh ini nol melambangkan ketiadaan suatu nilai
yang dapat diukur.

Data interval atau data rasio yang distribusinya miring (tidak normaal) dapat
dijelaskan dengan baik menggunakan frekuensi relatif atau persentase, sementara median dan
kisaran secara berturut turut digunakan untuk menggambarkan kecenderungan memusat
dan variabilitas. Data interval atau rasio yang berdistribusi normal dijelaskan menggunakan
frekuensi relatif, persentase atau angka z, sedangkan rata rata dan simpangan baku (atau
variansi) digunakan untuk menjelaskan masing - masing kecenderungan memusat dan
variabilitas.Karakterisasi hubungan dalam data intervaal atau rasio yang berdistribusi secara
normal umumnya dilakukan menggunakan koefisien korelasi (r)
BAB 6 PERKIRAAN STATISTIK MENGGUNAKAN INTERVAL KEPERCAYAAN

Sebagaimana dijelaskan sebelumnya, salah satu tujuan utama dari perhitungan sifat memusat
(rata rata) dan variabilitas (simpangan baku) suatu rangkaian data sampel ialah untuk
mendapatkan suatu pemahaman tentang statistik populasi yang berkaitan. Dengan kata lain,
Rata rata ( ) dan simpangan baku (s) dari data sampel digunakan untuk memperkirakan rata
rata populasi () hakiki dan simpangaan baku populassi () hakiki.

6.1 Konsep Interval Kepercayaan

Setelah menghitung rata rata dan simpangan sampel, sebagaimana pendekatan normal
dalam ilmu farmasi dan ilmu pengetahuan terkait, kita perlu menyediakan suatu indikasi
keterandalan data. Contohnya, suatu uji klinik ( n = 20 pasien) volume urine yang dihasilkan
setelah pemberian suatu diuretik baru telah dihitung sebesar 5,2 1,9 l. Berkenaan dengan
ukuran sampel yang kecil, tidak masuk akal untuk memprediksi bahwa rata rata dan
simpangan baku populasi akan identik dengan nilai nilai sampel yang diamati ini karena
tiap sampel akan menghasilkan nilai rata rata dan simpangan baku yang berbeda beda.
Karena itu, bila kita melaporkan rata rata data sampel, sebaiknya kita juga menyajikan
beberapa indikasi keterandalan dat, kualitas perkiraan rata rata hakiki dari rata rata
sampel. Hal ini dilakukan menggunakan interval kepercayaan. Interval kepercayaan
dikatakan sebagai suatu rata rata dan kisaran (interval), yang disebut mewakili probabilitas
pengamatan rata rata hakiki. Probabilitas yang dtetapkan dipilih oleh orang yang
bertanggung jawab terhadap manipulasi data secara statistik; namun interval kepercayaan
yang paling seringa digunakan adalah 90%, 95% dan 99%

Interval kepercayaan disajikan secara grafik dalam Gambar 6.1. Dalam gambar ini 10
sampel, tiap sampel terdiri dari 10 pengamatan, dipilih dari suatu distribusi normal yang rata
ratanya diketahui sebear 50. Rata rata dan interval kepercayaan 90% untuk tiap tiap dari
10 sampel dihitung

Kisaran interval kepercayaan 90%


untuk sampel individual

Bawah Atas

Rata rata sampel ( n = 10)

Gambar 6.1 Rtata rata dan Interval kepercayaan.

Oleh karena itu, interval kepercayaan dihitung untuk memberikan probabilitas suatu sampel
tunggal akan mengandung rata rata dan simpangan baku hakiki bagi pengguna. Jiak suatu
sampel diambil dan rata rata 95% interval kepercayaan yang dihitung, masih mungkin
bahwa rata rata hakiki tidak akan terletak dalam kisaran yang dihitung. Namun, benar
bahwa jika 19 sampel yang lain diambil dan rata rata interval kepercayaan yang dihitung,
rata rata hakiki akan terletak dalam interval kepercayaan yang didambarkan oleh 19 sampel
ini.

Perhitungan interval kepercayaan dilakukan dengan mengacu pada suatu distribusi


probabilitas, contohnya distribusi normal, distribusi t, atau distribusi Chi Kuadrat ( 2 ).

6.2 Interval Kepercayaan Untuk Rata Rata Populasi dan Distribusi Normal

Salah satu dari metode yang paling sering digunakan untuk menghitung interval kepercayaan
melibatkan penggunaan distribusi normal. Jika data tersebut merupakan distribusi normal,
interval kepercayaan dua arah dapat dihitung menggunakan persamaan
/2
% =

dengan

% adalah interval kepercayaan yang dipilih

adalah rata rata yang diamati

/2 adalah nilai z dari lampiran Tabel distribusi normal



melambangkan kesalahan baku dari rata rata dengan diketahui dan

n ukuran sampel

Contoh 6. 1

Suatu uji klinis (n = 30 pasien) telah dilakukan, volume distribusi dari suatu obat anti
diabetes baru telah dihitung sebesar 10,2 1,9 l. Hitung batas kepercayaan 95% , 90% dan
99% dari nilai rata rata ( dengan menganggap bahwa data berasal dari suatu distribusi
normal.

Penyelesaian

a) Untuk (1 = 95%), maka /2 = 0,0250 = 1,96. Di mana = 0,05


/2 (1,96)(1,9)
% = = 10,2 = 10,2 0,68
30
Dalam contoh klinis yang diuraikan ini, interval kepercayaan 95% adalah sebesar 10,2
0,68 l, yaitu 9,52 sampai 10,88 l. Nilai rata yang diamati (10,2 l) tidak mungkin
identik dengan nilai rata rata populasi. Akan tetapi, interval kepercayaan terhitung
memberikian suatu perkiraan keterandalan rata rata terukur. Jadi kita yakin 95%
bahwa rata rata hakiki akan terletak dalam kisaran yang ditentukan oleh batas
kepercayaan nilai rata raata obat anti-diabetes adalah 9, 52 sampai 10,88 L .
b) Untuk 90% (tugas)
c) Untuk 99% (Latihan ataau Tugas)
Contoh 6.2

Kandungan aluminium dari 1000 sampel cairan intravena bervolume l liter dianalisis dengan rata
rata dan simpangan baku dihitung sebesar 50 3 ppm. Hitunglah batas batas kepercayaan 99%,
90% dan 95% untuk memperkirakan rata rata konsentrasi aluminium sebenarnya.

Penyelesaian:

a) Untuk (1 ) = 99% adalah


/2
99% =

dengan

/2 melambangkan nilai Tabel z yang berkaitan dengan probabilitas 99% dengan nilai 2,58
= 3 ppm
Rata rata sampel ( ) = 50
Ukuran sampen n = 1000

(2,58)(3)
99% = 50
= 50 0,24
1000

Batas batas kepercayaan 99% adalah antara 49,7 dan 50,24 ppm, dengan kata lain ada kemungkinan
sebesar 99% bahwa rata rata populasi hakiki akan terletak dalam daerah ini

b) Untuk (1 ) = 90% adalah


c) Untuk (1 ) = 95% adalah

6.3 Iterval Kepercayaan untuk Perbedaan antar Rata Rata

Iterval kepercayang paling sering dihitung untuk memberikan perkiraan rata rata suatu populasi,
seperti yang dijelaskan dalam bagian 6.2. Namun, dalam banyak kasus, interval kepercayaan ini
berguna untuk menggambarkan perbedaan antar rata rata. Sekali lagi, distribusi normal dapat
digunakan untuk tujuan ini (rata rata dianggap berasal dari suatu distribusi normal). Persamaan
yang digunakan di sini berdasarkan pada persamaan yang digunakan untuk perhitungan interval
kepercayaan dari suatu rata rata tunggal, dengan dua pengecualian:

Perbedaan antar rata rata mengantikan nilai rata rata


Kesalahan baku dari perbedaan perbedaan antar rata rata digunakan menggantikan
kesalahan baku rata rata.

Persamaan yang dimodifikasi adalah

2 2
% = (1 2 ) /2 1 + 2
1 2

Dengan

1 dan 2 masing masing adalah rata rata sampel 1 dan 2.


12 dan 22 masing masing adalah variansi sampel 1 dan 2.
/2 adalah nilai tabel distribusi normal yang berhubungan dengan tingkat probabilitas yang
dipilih
1 dan 2 masing masing adalah ukuran sampel 1 dan 2

Contoh 6.3

Suatu laboratorium pengendalian mutu ingin memeriksa dan membandingkan sifat sifat mekanis
dua pembalut luka menggunakan analisis tarik. Selanjutnya, rata rata ( simpangan baku))
ketahanan tarik dari suatu pembalut luka bermerek diperiksa (n = 250) dan tercatat sebesar 10,35
0,57 MPa). Rata rata ( simpangan baku) ketahanan tarik suatu pembalut luka generik diperiksa
ditemukan dan tercatat sebesar 8,99 0,73 MPa (n =150). Hitunglah interval kepercayaan 90%, 95%
dan 99% dari perbedaan antara ketahanan tarik dari ke dua pembalut luka tersebut !

Penyelesaian:

a) Dengan 1 = 10,35, 2 = 8,99 MPa; 1 = 0,57 dan 2 = 0,73 MPa serta 1 = 250 dan
1 = 150, sehingga interval taksiran untuk 90% dapat dihitung dengan = 1 + 2 2

12 22 (0,57)2 (0,73)2
90% ( )
= 1 2 + = (10,35 8,99) (0,0500) +
2 1 2 250 150
= 1,36 1,645(0,0697)
= 1,36 0,14 MPa.
Jadi, interval 90% untuk perbedaan antara rata rata ketahanan tarik dari ke dua pembalut
luka ini adalah 1,24 samapi 1,48 MPa, sehingga ada 90% probabilitas bahwa perbedaan rata
rata hakiki dalam ketahanan tarik antara ke dua pembalut dalam kisaran 1,24 sampai 1,48
MPa.

b) Untuk 95% (Tugas/Latihan)


c) Untuk 99% (latihan/Tugas)

6.4 Interval Kepercayaan untuk Simpangan Baku

Interval kepercayaan untuk simpangan baku paling sering digunakan untuk memeriksa
variabilitas data, misalnya bila ada variasi tinggi yang tidak diharapkan dalam suatu sampel.
Untuk tujuan ini, distribusi ini, distribusi 2 digunakan untuk menghitung interval
kepercayaan simpangan baku populasi. Dari Tabel 2 dapat diperoleh nilai yang
memberikan informasi tentang daerah di bawah kurva probabilitas.Jadi, untuk menghitung
interval 95% dari simpangan baku populasi, derah di bawah distribusi 2 yang sebanding
2 2
dengan 95% didapatkan antara 0,025 dan 0,975 . Oleh karena itu, 2,5% pengamatan terletak
2 2
di bawah 0,025 dan di atas 0,975 . Dari sini, interval kepercayaan 95% di hitung
menggunakan persamaan berikut.
2 (1)2 2
0,975 < < 0,025
2

dengan

n 1 adalah derjat bebas, yang merupakan ukuran sampel dikurangi 1


s adalah simpangan baku sampel
adalah simpangan baku populasi

Persamaan ini dengan mudah diatur kembali untuk memberikan persamaan dalam
menghitung interval kepercayaan menjadi

1 1
2
<< 2
1
2 2

Contoh 6.4

Sebelum memulai suatu uji klinis, berat dari 20 sukarelawan pria sehat (berusia 21 30
tahun) ditimbang dengan rata rata dan simpangan baku nya dicatat sebesar 76,1 9,4 kg.
Hitunglah interval kepercayaan 95%, 90% dan 99% untuk simpangan baku

Penyelelesaian:

a) Interval kepercayaan 95% dengan menggunakan persamaan

1 1
<< dengan db = n 1
2
0,025 2
0,975

dengan n = 20, s = 9,4 dan db = 19, maka interval kepercayaan 95% adalah

9,419 9,419
<<
32,852 8,907

40,97 40,97
<<
5,74 2,98

7,14 < < 13,75

Jadi ada 95% kemungkinan bahwa simpangan baku populasi akan terletak di antara batas
batas 7, 14 dan 13,75 kg.

b) Untuk 90% (Latihan/Tugas)


c) Untuk 99% (Latihan/Tugas)
6.5 Interval Kepercayaan untuk Proporsi

Interval kepercayaan proporsi juga dapat dihitung menggunakan hampiran distribusi normal
dan simpangan baku. Interval kepercayaan untuk proporsi populasi dapat dihitung
menggunakan persamaan


% =

di mana

= dan = 1 serta x adalah suatu kejadian tertentu dan x adalah suatu kejadian

n = ukuran sampel

Contoh 6.5

Suatu perusahaan pelayanan kesehatan yang menghususkan diri dalam pengemasan steril
sarung tangan sekali pakai telah memutuskan untuk melakukan suatu audit kualitas
ketahanan satu bets sarung tangan sekali pakai dalam kemasan terhadap masuknya udara
yang tidak steril. Dari sebuah bets yang terdiri dari 2500 kemasan, 200 kemasan diambil dan
sterilitasnya diperiksa menggunakan uji sterilitas British Pharmacopoeia. Hasilnya
menunjukkan bahwa 35 kemasan tidak memenuhi uji sterilitas. Berdasarkan pengamatan
ini, hitunglah batas kepercayaan 95%, 99% dan 90% untuk proporsi sarung tangan yang
rusak dalam bets (populasi).

Penyelesaian:

Dari persamaan


% =

35
Dengan x = 35, n = 200, sehingga = 200 = 0,175 dan = 0,825 serta dari lampiran
distribusi normal baku untuk 1 = 0,05 maka nilai /2 = 1,96.

Jadi,

(0,175)(0,875)
% = = 0,175 (1,96) 200

= 0,175 0,053

Oleh karena itu, batas kepercayaan 95% untuk proporsi populasi berada antara 0,122 dan
0,228, yaitu ada kemungkinan 95% bahwa proporsi hakiki dari sarung tangan yang rusak
akan terletak dalam kisaran ini.
6.6 Interval Kepercayaan untuk Perbedaan antara Proporsi

Interval proporsi untuk perbedaan dalam proporsi dapat diperkirakan menggunakan suatu
pendekatan yang serupa dengan yang dijelaskan pada bagian 6.3, dengan menganggap
bahwa proporsi didapatkan dari suatu distribusi normal. Perbedaan utama antara
pendekatan yang diuraikan dalam bagian 6.3 dan yang dibutuhkan untuk perhitungan
interval kepercayaan untuk perbedaan dalam proporsi adalah definisi dari simpangan baku
perbedaan antara rata rata dengan proporsi. Pada bagian 6.3, diketahui kesalahan baku
perbedaan antara dua rata rata, dihitung menggunakan rumus:

2 2
(1 2 ) = 1 + 2
1 2

Sebaliknya, kesalahan baku perbedaan antar proporsi dapat didefinisikan sebagai

1 1 2 2
(1 2 ) = +
1 2

di mana 1 = 1 1 dan 2 = 1 2 , serta 1 dan 2 masing masing adalah ukuran


sampel 1 dari populasi 1 dan ukuran sampel 2 dari populasi 2. Interval kepercayaan untuk
perbedaan antara dua proporsi dapat ditulis sebagai berikut

% = (1 2 ) /2 (1 2 )

1 1 2 2
% = (1 2 ) /2 +
1 2


1 = 1 dan 2 = 2
1 2

dengan 1 dan 2 adalah ke dua proporsi yang diperiksa, /2 adalah nilai Tabel z (Lampiran)
distribusi normal baku dan (1 2 ) adalah kesalahan baku dari perbedaan antara proporsi.

Contoh 6.6

Kemanfaatan relatif dari dua antibiotik oral untuk pengobatan pneumonia bronkial telah
dinilai dalam suatu uji klinik. Subjek penderita pneumonia bronkial pada sebuah rumah sakit
dibagi menjadi dua kelompok, tiap kelompok menerima salah satu antibiotik. Hasil uji klinik
ini ditunjukkan dalam Tabel 6.1. Hitunglah interval kepercayaan 99%, 90% dan 95% untuk
perbedaan antara proporsi dari pasien yang sembuh dalam ke dua kelompok.

Tabel 6.1 Kemanfaatan dua antibiotik untuk pengobatan pneumonia bronkial

Kesembuhan Jumlah Pasien


Antibiotik 1 Antibiotik 2
Ya 575 425
Tidak 45 200
Penyelesaian:

Persamaan yang digunakan untuk menghitung interval kepercayaan perbedaan antara dua
proporsi adalah

1 1 2 2
a) % = (1 2 ) /2 +
1 2

dengan
575
1 = 1 = 575+45 = 0,927
1

2 425
2 = = = 0,68
2 425+200

Untuk (1 ) = = 0,005, sehingga /2 = 2,33

1 = 575 + 45 = 620 dan 2 = 425 + 200 = 625.

Bila nilai nilai ini dimasukkan ke dalam persamaan di atas, interval kepercayaan untuk
perbedaan antara proporsi kesembuhan yang merupakan hasil dari pengobatan dengan ke
dua antibiotik dapat dihitung:

(0,927)(0,073) (0,680)(0,320)
99% = (0,927 0,680) 2,57 +
620 625

= 0,247 0,042.

Jadi batas kepercayaan untuk perbedaan antara proporsi kesembuhan yang merupakan
hasil pengobatan dengan ke dua antibiotik untuk 99% berada antara 0,205 dan 0,289.

b) Untuk 90% (latihan/tugas) !


c) Untuk 95% (latihan/tugas) !

6.7 Interval Kepercayaan Untuk Rata Rata

Jika variansi populasi 2 tidak diketahui, maka distribusi t yang digunakan untuk
menghitung interval kepercayaan, menggunakan strategi yang sama dengan yang digunakan
untuk menghitung interval kepercayaan rata rata hakiki untuk sampel yang berukuran
besar. Jadi,

% = /2

dengan

% adalah probabilitas yang dipilih


adalah rata rata sampel

/2 adalah nilai Tabel distribusi t

s adalah simpangan baku sampel

n adalah ukuran sampel

Contoh 6.7

Tabel 6.1 menunjukkan konsentrasi klorheksidin (mg) dalam 15 sampel bervolume l ml yang
telah diambil dari suatu larutan stok (5 l) dan diukur dengan spektroskopi ultraviolet.
Hitunglah interval kepercayaan 90%, 95% dan 99% dari rata populasi.

Tabel 6.1 Konsentrasi klorheksidin (mg/ml) dalam 15 sampel yang diambil dari suatu larutan
stok

No. urut Konsentrasi klorheksidin (x)


1. 0,201
2. 0,212
3. 0,209
4. 0,205
5 0,210
6 0,211
7. 0,203
8. 0,211
9. 0,215
10. 0,205
11. 0,209
12. 0,216
13. 0,200
14. 0,199
15. 0,205

Penyelesaian

a) Untuk 90%, maka interval kepercayaan dari data pada Tabel 6.2 dapat kita gunakan
persamaan

% = /2

kemudian kita dan s dengan cara sebagai berikut


No. urut Konsentrasi klorheksidin (x) 2
1. 0,201 0,040401
2. 0,212 0,044944
3. 0,209 0,043681
4. 0,205 0,042025
5 0,210 0,044100
6 0,211 0,044521
7. 0,203 0,041209
8. 0,211 0,044521
9. 0,215 0,046225
10. 0,205 0,042025
11. 0,209 0,043681
12. 0,216 0,046656
13. 0,200 0,040000
14. 0,199 0,039601
15. 0,205 0,042025
Jumlah 2,733 0,645615

Dari Tabel 6.2 ini kita hitung rata rata sampel dengan n = 15 mempunyai rumus:
1 1
= =1 = 15 (2,733) = 0,1822 (mg/ml) dan

2
=1 (=1 ) 15(0,645615)(2,733)2 2,214936
2 = = = = 0,0105 (mg/ml)
(1) 15(151) 210

= 2 = 0,103

Jadi interval kepercayaan untuk 90% dengan /2 = 0,05 = 1,761 dan db = 15-1 = 14 adalah

0,103
90% = /2 = 0,1822 (1,761) ( ) = 0,1822 0,0469
15

Oleh karena itu interval kepercayaan 90% konsentrasi klorheksidin terletak antara 0,1353
dan 0,2291 ml

b) Untuk 95% dan 99% (latihan/tugas) !


BAB 7 PENGUJIAN HIPOTESIS STATISTIK SATU SAMPEL

Pengujian satu sampel meliputi perkiraan apakah data sampel yang dihasilkan dari
suatu percobaan berasal dari suatu populasi tertentu atau tidak. Khususnya, banyak uji satu
sampel mengevaluasi apakah rata rata sampel dan rata rata populsi berbeda, atau
kemungkinan lainnya apakah ada suatu perbedaan antara nilai - nilai yang diamati dari
sampel dan nilai nilai yang diharapkan jika suatu sampel benar berasal dari populasi yang
dipertanyakan. Sebelum suatu uji satu sampel dapat dilakukan, beberapa pertanyaan harus
dijawab.

Apa hipotesis nolnya ?


Apa hipotesis alternatifnya ?
Apa daerah penolakan hipotesis nolnya
Apa rancangan percobaan tersebut memiliki satu arah atau dua arah ?
Apakah metode statistik yang sesuai (statistik uji) baik parametrik maupun
noparametrik ?

Uji satu sampel parametrik maupun nonparametrik akan digunakan untuk analisis
data percobaan. Dua uji satu sampel parametrik akan dijelaskan dalam bab ini, yaitu uji z
satu sampel dan uji t satu sampel. Juga akan diuraikan penggunaan uji uji nonparametrik,
uji 2 satu sampel dan uji Kolmogorov-Smirnov satu sampel, masing masing untuk analisis
data nominal dan ordinal satu sampel.

7.1 Uji Statistik Satu Sampel Parametrik

Dengan menganggap bahwa kondisi kondisi percobaan sesuai dengan model statistik, ada
dua uji parametrik utama yang dapat digunakan untuk mengevaluasi uji uji satu sampel
secara statistik, yaitu uji z dan uji t. Penggunaan uji uji ini akan dibahas masing masing
pada bagian selanjutnya.

7.1.1 Uji z Satu Sampel

* Uji satu rata - rata

Uji z satu sampel digunakan untuk analisis hipotesis satu sampel jika ukuran sampel besar
dan selain itu, ada informasi yang cukup mengenai sifat sifat populasi yang sedang
dibandingkan dengan sampel yang diperoleh dari percobaan. Secara khusus, uji z ( juga uji t)
membandingkan apakah rata rata sampel berbeda dari rata rata suatu populasi tertentu.
Selain itu, uji z juga dapat digunakan untuk membandingkan suatu proporsi tunggal (sampel)
dengan suatu nilai yang dihipotesiskan. Penggunaan uji z dapat diterapkan dalam contoh
contoh berikut. Perhitungan dari analisis ini dapat kita gunakan persamaan berikut
0
= /

Contoh 7.1

Sebuah perusahaan farmasi telah membeli sebuah mesin pengisi cairan baru untuk
digunakan pada divisi pembuatan parenteral perusahaan tersebut. Hasil pengisian dari
mesin pengisi yang telah ada, berkaitan dengan proses pembuatan saat ini, adalah 5,01
0,21 ml per vial injeksi . Suatu penelitian pendahuluan telah dilakukan untuk mengevaluasi
apakah kinerja pengisian dari mesin yang baru sama (atau tidak) dengan mesin sebelumnya
dalam kondisi proses yang identik. Oleh karena itu, 100 vial produk diambil dari sebuah bets
pendahuluan dan rata rata volume pengisian ditentukan secara gravimetri sebesar 5,12
ml. Apakah ada perbedaan antara kinerja mesin pengisian yang baru dan mesian yang telah
ada ? (taraf arti = 0,05)

Penyelesaian:

(i) Menyatakan hipotesis nol


0 : = 5,01 ml (Tidak ada perbedaan antara rata rata sampel dengan rarata
populasi)
(ii) Menyatakan hipotesis alternatif

1 : 5,01 ml (Ada perbedaan antara rata rata sampel dengan rarata populasi)

(iii) Menyatakan aras nyata (daerah penolakan) = 0,05

Terima 0

Tolak 0 tolak 0

/2 1/2

(iv) Melakukan analisis statistik


Menghitung statistik uji
Statistik uji z dihitung menggunakan rumsu
0 5,125,01 0,11
= / = 0,21/100 = 0,021 = 5,24

Menentukan statistik z dengan tabel distribusi normal baku dengan aras nyata =
0,05, sehingga /2 = 0,0250 = 1,96
(v) Kesimpulan
Karena = 5,24 > 0,0250 = 1,96, maka 0 ditolak yang berarti 1 diterima,
sehingga disimpulkan bahwa ada perbedaan yang bermakna antara kinerja mesin
pengisian yang baru dan yang telah ada dalam hal volume pengisian.
Soal (Tugas)

Suatu perusahaan medis mengkhususkan diri dalam pembuatan kateter uriner silikon
melalui injeksi cetak. Modulus Young (elastisitas) dari kateter merupakan penentu kinerja
kateter yang penting karena hal ini dapat dihubungkan dengan kemudahan penyisipan
kateter ke dalam uretra. Biasanya, rata rata dan simpangan baku dari modulus Young
kateter silikon ketika dibuat menggunakan proses konvensional adaalah 51,6 4,1 MPa.
Secara historis, perusahaan pembuat peralatan medis ini telah membeli penaut silang untuk
reaksi pematangan silikondari satu penyalur; namun penyalur ini sekarang telah
mengumumkan bahwa mereka tidak terlibat lagi dalam sntesis material ini. Pabrikan
peralatan medis telah mendapatkan penyalur penaut silang lain dan telah mendapatkan
sampel material ini untuk pembuatan satu bets pendahuluan kateter dan juga penilaian sifat
sifat mekanisnya. Untuk menyelidiki keterpakaian dari penyalur baru ini, 50 kateter telah
dibuat menggunakan sumber baru penaut silang ini menggunakan parameter injeksi cetak
yang sama dengan yang digunakan pada bets bets sebelumnya. Rata rata modulus
Young dari 50 kateter tersebut kemudian ditentukan menggunakan analisis regangan dan
diamati sebesar 49,7 MPa. Apakah ada suatu perbedaan antara sifat mekanis dari kateter
silikon yang dibuat menggunakan penaut silang dari penyalur lama dan baru dengan taraf
nyata = 0,01

Uji Proporsi

Jika data terdapat dua kategori berbeda dan karenanya data tersebut terdistribusi secara
binomial. Namun penggunaan statistik z untuk menafsirkan data (berbeda), suatu perkiraan
distribusi normal.

Statistik z dihitung menggunakan rumus sebagai berikut


0
= ()0 =
0 0

dengan

0 = 1 0 dan = , x adalah suatu kejadian tertentu dan n adalah ukuran
sampel.

Contoh 7.2

Dalam suatu panel konsumen, 100 sukarelawan dimintai pendapat mengenai keberterimaan
visual dua formulasi tablet, satu formulasi berbentuk oval dan lainnya berbentuk
heksagonal. Sebelum memperkenalkan bentuk tablet yang baru (oval), perusahaan tersebut
berharap mengetahui apakah ada suatu preferensi untuk hal tersebut. Setelah
pengumpulan data diketahui bahwa 78% dari anggota panel yang ditanyai memilih tablet
oval. Apakah ada suatu preferensi yang valid secara statistik untuk bentuk oval ? dengan
taraf arti = 0,05

Penyelesaian

1) Pasangan hipotesis, yaitu


0 : = 0,5 ( tidak ada perbedaan preferensi yang valid secara statistik untuk bentuk
oval)
1 : 0,5 (ada perbedaan preferensi yang valid secara statistik untuk bentuk oval)
2) Ambil = 0,05
3) Statistik uji adalah
0 0,780,5 0,28
= = = = 5,6
(0,5)(0,5) 0,05
0 0
100

4) Kesimpulan
Karena z hitung = 5,6 > z tabel = 1,96, maka 0 ditolak yang berarti 1 diterima,
sehingga dapat disimpulkan bahwa ada perbedaan preferensi yang valid secara statistik
untuk bentuk oval.

7.1.2 Uji t Satu Sampel

Dalam banyak yang relevan dengan ilmu farmasi, tidak mungkin untuk mendapatkan
pengetahuan mengenai statistik populasi yang relevan dan karena itu, perkiraan yang
tersedia mengenai kecenderungan memusat dan variabilitas populasi hanyalah rata rata
dan variansi untuk data sampel. Dalam keadaan seperti ini, uji t satu sampel dapat
digunakan untuk menghitung statistik t dan relevansi statistik ini ditafsirkan menggunakan
distribusi t dengan derajat kebebasan (db = n - 1). Sekali lagi, penting untuk
mengulangkembali anggapan anggapan uji t satu sampel, yang dalam kenyataannya,
merupakan statistik parametrikyang lain. Anggapan anggapan ini adalah:

Data sampel dipilih secara acak


Data sampel memiliki format interval atau rasio
Populasi tempat data sampel berasal terdistribusi secara normal
Rata rata dan simpangan baku dari data sampel merupakan perkiraan yang andal
dari kecenderungan memusat dan variabilitas populasi tempat data berasal

Statistik yang digunakan dalam perhitungan uji t ini adalah


0
() = /

Contoh 7.3

Sebuah perusahaan farmasi telah mengembangkan suatu benzodiazepin baru untuk


pengobatan gangguan tidur dan ingin mengevaluasi apakah jumlah jam tidur tanpa
gangguan yang dialami oleh pasien yang ditangani dengan obat ini berbeda dengan rata
rata nasional sebesar 7,3 jam (atau tidak). Dalam studi klinis berikutnya, efek benzodiazepin
baru ini terhadap jumlah jam tidur tanpa gangguan yang dialami oleh 20 pasien dimonitor.
Hasilnya ditunjukkan dalam Tabel 7.1. Dengan menggunakan suatu metode statistik yang
sesuai, periksa apakah benzodiazepin baru meningkatkan jumlah jam tidur tanpa gangguan
jika dibandingkan dengan rata rata nasional.

Tabel 7.1 Jumlah jam tidur tanpa gangguan yang dialami oleh pasien yang menerima satu
dosis tunggal benzodiazepin baru

6,6 6,8 6,6 7,1 7,4


6,7 6,9 7,6 7,0 6,4
6,9 6,9 7,3 6,7 6,9
6,2 7,2 6,7 7,1 6,8

Penyelesaian:

Pasangan hipotesis

1) Pasangan hipotesis, yaitu


0 : = 7,3 jam ( rata rata jam tidur benzodiazepin baru lebih kecil atau sama dengan
rata rata benzodiazepin lama)
1 : > 7,3 ( rata rata jam tidur benzodiazepin baru lebih bersar dari rata rata
benzodiazepin lama)
2) Ambil = 0,05
3) Statistik uji yang digunakan adalah
0
= /
Dengan perhitungan dalam Tabel 7.2 sebagai berikut

1 2
6,6 43,56
6,7 44,89
6,9 47,61
6,2 38,44
6,8 46,24
6,9 47,61
6,9 47,61
7,2 51,84
6,6 43,56
7,6 57,76
7,3 53,29
6,7 44,89
7,1 50,41
7,0 49,00
6,7 44,89
7,1 50,41
7,4 54,76
6,4 40,96
6,9 47,61
6,8 46,24
137,8 951,58

1 1
= =1 = 20 (137,8) = 6,89 dan

2
=1 (=1 ) 20(951,52)(137,8)2
2 = = = 0,11
(1) 20(19)

Jadi
0 6,897,3 0,41
= = = 0,07416 = 5,29
0,11/20

.dan

()=1 = (0,05)19 = 1,729.

4) Kesimpulan
Karena = 16,27 < ()=1 = 1,729, maka 0 diterima yang berarti bahwa
berdasarkan studi klinis, jumlah jam tidur tanpa gangguan yang dialami oleh pasien
pasien yang menerima satu dosis tunggal benzodiazepin baru tidak berbeda dari rata
rata nasional.

7.1.3 Ukuran dan Kekuatan Sampel dalam Uji Stattistik Parametrik Satu Sampel

Ukuran sampel merupakan suatu pertimbangan penting dalam rancangan percobaan


statistik. Pemilihan ukuran sampel yang tidak tepat dapat mempunyai sejumlah akibat,
termasuk hasil studi yang tidak valid dan pengeluaran yang besar. Besarnya pengeluaran
telah membuat permasalahan ukuran sampel menjadi masalah utama pada setiap
rancangan percobaan karena biaya studi klinis terus meningkat.

Untuk menghitung ukuran sampel yang diperlukan suatu percobaan, empat


parameter harus diketahui atau diperkirakan.

Aras nyata (). Ini merupakan probabilitas penolakan hipotesis nol bila hipotesis nol
sesungguhnya benar, umumnya dipilih nilai sebesar 0,05.
Variabilitas percobaan. Bila berurusan dengan statistik populasi, simpangan baku
populasi (historikal) digunakan. Namun dalam percobaan percobaan bila
variabilitas populasi yang ditaksir, maka kita menggunakan data sampel melalui
simpangan baku sampel.
Probabilitas membuat kesalahan tipe II.
Perbedaan antara rangkaian data dan nilai yang dihipotesiskan (antara dua rangkaian
data) yang dinyatakan valid secara eksperimental.

Contoh 7.4

Volume pengisian nominal dari suatu suspensi antasida adalah sebesar 50 ml. 10 botol
disisihkan dari suatu bets yang telah diisi dan volume pengisian diukur secara gravimetri
sebesar 48,8 2,1 ml (rata rata dan simpangan baku). Dengan menggunakan metode
statistik yang sesuai, hitunglah apakah volume penggisian yang diukur berbeda dari volume
pengisian nominal dan probabilitas mendeteksi suatu perbedaan hakiki sebesar 2,5 ml
antara rata rata sampel dan rata rata nominal.

Penyelesaian

Apakah volume pengisian yang diukur berbeda dari volume pengisian nominal ?

(i) Menyatakan hipotesis nol


(tidak ada perbedaan antara rata rata sampel, yaitu 48,8 ml dengan rata rata
hipotesis nol, yaitu 0 = 50,0 )
0 : = 50 ml
(ii) Menyatakan hipotesis alternatih
(ada perbedaan antara rata rata sampel, yaitu 48,8 ml dengan rata rata hipotesis
nol, yaitu 0 = 50,0 )
1 : 50 ml

(iii) Menyatakan aras nyata (daerah penolakan)


Dengan aras nyata = 0,05
(iv) Statistik uji
0 48,8 50 1,2
= = = = 1,81
/ 2,1/10 0,66
(v) Kesimpulan
Karena (0,025)9 = 2,26 < = 1,81 < (0,025)9 = 2,26, sehingga 0
diterima yang berarti rata rata volume pengisian bets pendahuluan sama secara
statistik dengan volume pengisian nominal.

Berapa probabilitas mendeteksi suatu perbedaan hakiki sebesar 2,5 ml antara rata rata
sampel dan rata rata nominal ?

Untuk menjawab pertanyaan ini dibutuhkan perhitungan probabilitas penolakan hipotesis


nol bila kenyataannya salah: dengan kata lain, perhitungan kekuatan studi. Rumus yang
digunakan adalah

() = ()
2 /

dengan s adalah simpangan baku sampel, n adalah ukuran sampel, adalah perbedaan
yang diperkirakan antara rata rata sampel dan nilai hipotesis yang diterima untuk mewakili
perbedaan praktis, () adalah nilai t untuk kesalahan tipe II pada suatu jumlah db dan
() adalah nilai t untuk aras nyata yang diinginkan pada suatu db tertentu. Dari
parameter parameter yang dijelaskan Contoh 7.4, = 2,5 ml, n = 10, s = 2,1 ml, () =
2,26 ( = 0,05, dua arah, db = 9). Bila nilai nilai ini dimasukkan ke dalam persamaan di
atas, statistik t yang berkaitan dengan melakukan suatu kesalahan tipe II dapat dihitung:
2,50 2,50
() = () = 2,26 = 0,66 2,226 = 1,53.
2 / (2,1)2 /10

Probabilitas perkiraan untuk suatu nilai t sebesar + 1,53 dapat dihitung menggunakan
distribusi t. Nilai t hitung untuk kesalahan bersifat satu arah karena mewakili tumpang
tindih distribusi yang dihipotesiskan bila hipotesis nol tidak ditolak padahal seharusnya
ditolak. Dengan alasan ini, sehingga hanya ada satu hasil yang sesuai, yakni hasil satu arah.

Jika probabilitas yang tepat tidak dapat ditentukan dari distribusi t, misalnya dalam
contoh di atas, nilai t sebesar 5,55 (db = 9, hasil satu arah) berhubungan dengan suatu
probabilitas yang terletak dalam jarak 0,05 0,10. Harus diingat bahwa untuk menghitung
probabilitas yang tepat, dibutuhkan pengetahuan yang lengkap mengenai distribusi t
dengan db = 9. Ini umumnya tidak tersedia dan harus dihitung aleh analis. Untuk mengatasi
hal ini, biasanya digunakan distribusi normal terbakukan untuk menafsirkan probabilitas
yang berkaitan dengan kesalahan . Jadi, dengan menganggap bahwa 1,53 berkaitan
dengan suatu nilai z, probabilitas membuat suatu kesalahan adalah sebesar 0,07 (satu
arah, = 0,05). Selanjutnya kita menyimpulkan bahwa kekuatan uji (1 ) adalah 0,93.
Dengan kata lain, ada kemungkinan 93% perbedaannya sebesar 2,5 ml, yakni perbedaan
kritis yang ditentukan akan diamati antara rata rata sampel dan rata nominal.

Suatu pertimbangan selanjutnya dalam rancangan percobaan adalah penggunaan


suatu ukuran sampel yang sesuai, yakni ukuran yang akan memungkinkan penolakan suatu
hipotesis nol tertentu. Ukuran sampel yang dibutuhkan untuk memenuhi kriteria di atas
dihitung menggunakan persamaan berikut.

= (/)2 (() + () )2

dengan n ukuran sampel, s simpangan baku sampel, adalah perbedaan yang dapat
dideteksi antara rata rata sampel dan nilai yang dihipotesiskan, () adalah statistik t
yang berkaitan dengan membuat kesalahan tipe I ( = 0,05), () adalah statistik t yang
berkaitan dengan membuat kesalahan tipe II (satu arah) pada jumlah db tertentu.
Contoh 7.5

Volume pengisian nominal suspensi antasida adalah sebesar 50 ml. Hitunglah jumlah botol
yang harus diuji untuk menolak hipotesis nol yang menyatakan bahwa volume pengisian
hakiki dari bets pendahuluan sebanding dengan volume pengisian nominal.

Penyelesaian:

Jika kita menganggap bahwa ukuran sampel yang dibutuhkan adalah 20, sehingga n = 20, s =
2,1 ml, = 2,5 ml, = 0,05 dan 0,025(19) = 2,09 serta =0, 10, sehingga 0,10(19) = 1,33.
Jadi

= (/)2 (() + () )2

= (2,1/2,5)2 (2,09 + 1,33)2 = 8,25

Nilai n yang diperkirakan (20) tidak sama dengan nilai n yang dihitung (8) maka ini
merupakan suatu perkiraan yang tidak tepat. Ukuran sampel diperkirakan kembali (n = 15)
danperhitungan dilakukan sekali lagi menggunakan nilai yang diperkirakan kembali: n = 15, s
= 2,1 ml, = 2,5 ml, = 0,05 dan 0,025(14) = 2,14 serta =0, 10, sehingga 0,10(14) = 1,35.
Jadi

= (/)2 (() + () )2

= (2,1/2,5)2 (2,14 + 1,35)2 = 8,59

Perbedaan besarnya ukuran sampel yang diperkirakan dan yang dihitung menjadi lebih kecil.
Perbedaan ini dapat dikurangi dengan menggunakan suatu perkiraan ukuran sampel yang
lebih jauh (n = 10), s = 2,1 ml, = 2,5 ml, = 0,05 dan 0,025(9) = 2,26 serta =0,10,
sehingga 0,10(9) = 1,38. Jadi

= (/)2 (() + () )2

= (2,1/2,5)2 (2,26 + 1,38)2 = 9,35

Nilai ukuran sampel yang dihitung dan yang diperkirakan sekarang serupa sehingga kita
mengetahui bahwa dibutuhkan ukuran sampel paling sedikit 10 untuk memenuhi
permintaan tertentu dari uji tersebut.

Proses pengulangan menghabiskan waktu jika statistik t digunakan untuk


menghitung ukuran sampel. Malasah ini tidak muncul apabila penggunaan statistik z valid,
misalnya jika variabilitas populasi dikehui atau secara alternatif, bila kekuatan studi akan
dihitung, jika ukuran sampel besar ( > 30). Pada kondisi ini, suku () dan () masing
masing diganti oleh dan , sehingga persamaannya dapat ditulis sebagai berikut.
= (/)2 ( + )2 + 0,5( )2

Kembali pada Contoh 7.5, bahwa untuk menghitung jumlah botol yang harus diperiksa
untuk menolak hipotesis nol yang menyatakan bahwa volume pengisian yang sebenarnya
dari bets pendahuluan sama dengan volume pengisian nominal. Dalam kasus ini = 2,1 ml,
= 2,5 ml, = 0,05 dan 0,0250 = 1,96 serta = 0,1 sehingga 0,1 = 1,28. Jadi uji satu
arah

= (/)2 ( + )2 + 0,5( )2

= (2,1/2,5)2 (1,96 + 1,28)2 + 0,5(1,96)2 = 9,4

Nilai n in, dihitung menggunakan statisti z, sesuai dengan nilai yang ditentukan
menggunakan proses penggulangan dengan distribusi t.

7.2 Uji Statistik Satu Sampel Nonparametrik

Uji satun sampel nonparametrik umumnya digunakan untuk analisis data yang
diukur baik berdasarkan skala nominal maupun skala ordinal. Dalam bab ini, cara cara dan
penerapan data nominal serta uji Kolmogorov Smirnov satu sampel untuk analisis data
ordinal akan dijelaskan.

7.2.1 Uji Satu Sampel

Dalam uji 2 satu sampel, data (nominal) dikumpulkan dua atau lebih kategori yang berbeda
dari satu variabel tunggal dan hubungan antara frekuensi frekuensi dalam kategori
kategori yang berbeda ini diperiksa secara statistik. Ini merupakan suatu uji kesesuaian yang
memeriksa perbedaan antara frekuensi yang diamati dan frekunsi yang diharapkan dalam
tiap kategori. Tipe data yang dapat dianalisis dan mekanisme melakukan uji 2 dalam
contoh contoh berikut. Rumus yang kita unakan dalam uji ini adalah

( )2
2
= =1 ,

dengan adalah nilai pengamatan, adalah nilai yang diharapkan dan =

Contoh 7.7

Sebuah perusahaan farmasi telah mengembangkan suatu formulasi obat kumur untuk
pengobatan dan pencegahan infeksi dalam rongga mulut. Seksi pemasaran perusahaan
tersebut meyakini bahwa warna larutan merupakan pertimbangan penting dalam
keberterimaan pasien terhadap produk. Untuk mengevaluasi prinsip ini, empat formulasi
yang hanya berbeda dalam jenis bahan pewarna yang ditambahkan telah disiapkan. Dua
ratus sukarelawan diminta untuk memilih warna yang mereka sukai, dan hasilnya
ditampilkan dalam Tabel 7.3. Dengan menggunakan metode statistik yang sesuai, berikan
uraian mengenai ada tidaknya preferensi di antara berbagai warna obat kumur.
Tabel 7.3 Jumlah sukarelawan yang memilih berbagai warna obat kumur

Merah 55
Hijau 73
Biru 36
Kuning 36

Penyelesaian

1) Menyatakan hipotesis
0 : Sukarelawan tidak menunjukkan preferensi warna formulasi obat kumur
1 : Sukarelawan ada suatu preferensi warna formulasi obat kumur
2) Menyatakan aras nyata
Ambil aras nyata sebesar = 0,05
3) Menghitung statistik 2
( )2
2
= =1

dengan adalah nilai pengamatan (data), adalah nilai yang diharapkan, serta
diperoleh dari rumus
=
1
Jadi dengan n = 200 dap k = 4, maka = = (200) (4) = 50, sehingga
( )2
2
= =1
(5550)2 (7350)2 (3650)2 (3650)2
= + + + = 18,9
50 50 50 50

2 2 2
= (1) = (0,05)3 = 7,815.
4) Kesimpulan
2 2 2 2
Karena = 18,9 > = (1) = (0,05)3 = 7,815, sehingga 0 ditolak
yang berarti dapat disimpulkan bahwa tidak mungkin frekuensi yang diamati dapat
berasal dari populasi yang dijelaskan oleh hipotesis nol.

Contoh 7.8

Dalam suatu survei yang dilakukan oleh sebuah badan kesehatan lokal dilaporkan bahwa
penggunaan obat obat yang diresepkan untuk pengobatan gangguan lambung adalah
seperti yang ditunjukkan dalam Tabel 7.5. Sebagai bagian dari proses pemeriksaan, dokter
dokter umum pada suatu tempat praktek kota telah menginstruksikan manajer praktek
untuk melakukan suatu survei yang serupa mengenai pola peresepan yang mereka berikan
untuk pengobatan gangguan lambung. Data yang diperoleh dari 200 pasien yang diresepkan
obat obatan untuk pengobatan gangguan lambung, ditunjukkan dalam Tabel 7.6. Apakah
ada suatu perbedaan dalam pola peresepan dokter dokter umum dalam suatu tempat
praktek kota dan pengobatan yang dijelaskan dalam survei yang dilakukan oleh badan
kesehatan ?

Tabel 7.5 Hasil dari suatu survei lokal tentang obat obat yang diresepkan untuk
pengobatan gangguan lambung oleh dokter umum

Kategori obat Persentase peresepan


Antasida 15
Antagonis reseptor 2 30
Antibiotik 18
Penghambat pompa proton 37

Tabel 7.6 Hasil dari suatu survei tentan peresepan obat untuk pengobatan gangguan
lambung oleh dokter umum yang berpraktek dalam suatu kota

Kategori obat Persentase peresepan


Antasida 18
Antagonis reseptor 2 40
Antibiotik 2
Penghambat pompa proton 40

Penyelesaian:

(i) Menyatakan hipotesis


0 : tidak ada perbedaan pola peresepan dalam praktek perkotaan dan dicatat oleh
badan kesehatan
1 : ada perbedaan pola peresepan dalam praktek perkotaan dan dicatat oleh badan
kesehatan
(ii) Ambil aras nyata = 0,05
(iii) Daerha kritis
2 2 2
= (1) = (0,05)3 = 7,815
(iv) Statistik uji (rumus yang digunakan)
( )2
2
= =1

(1518)2 (3040)2 (182)2 (3740)2


= + + + = 131,225
18 40 2 40

(v) Kesimpulan
2
Karena = 131,225, maka 0 ditolak yang berarti bahwa ada perbedaan pola
peresepan dalam praktek perkotaan dan dicatat oleh badan kesehatan

7.2.2 Uji Binomial


7.2.2.1 Penggunaan Uji Binomial untuk Ukuran Sampel yang Besar

Salah satu keuntungan dari uji binomial untuk analisis data dikotomi diskret nominal adalah
kegunaannya untuk analisis studi studi yang melibatkan ukuran sampel yang kecil. Penting
untuk dingat bahwa uji binomial juga dapat diterapkan ketinka sampel berukuran besar.
Untuk menggunakan persamaan binomial pada kondisi ini sangat rumitdan menghabiskan
waktu dan akibatnya, digunakan suatu perkiraan (pendekatan) normal untuk binomial.
Dalam pendekatan ini, dari pengetahuan mengenai jumlah sampel, probabilitas harapan
dan jumlah pengamatan yang dicatat, suatu statistik z dapat dihitung dan probabilitas untuk
sejumlah pengamatan tercatat diterjemahkan menggunakan distribusi normal terbakukan.
Dalam perhitungan kita gunakan persaman berikut
0
= atau
0 0

Kitamnggunakan statistik uji 2 sebagai berikut

2 ( )2
= 2=1

Contoh 7.9

Menutupi rasa larutan penisilin untuk pemberian secara oral merupakan suatu
permasalahan bagi formulator farmasetik. Sebuah perusahaan farmasi telah
mengembangkan suatu larutan penisilin (125 mg per5ml) untuk pemberian secara oral dan
telah menggunakan sorbitol dalam formulasi untuk mengurangi rasa pahit dari obat. Akan
tetapi, setelah berkonsultasi dengan sebuah perusahaan penghasil zat perasa berkualitas
makanan, perusahaan farmasi tersebut telah disarankan untuk menambahkan suatu zat
perasa dalam formulasi untuk meningkatkan sifat menutupi rasa dari sorbitol. Oleh karena
itu, formulasi ke dua dikembangkan dengan mengandung perasa jeruk. Panel yang terdiri
dari 50 sukarelawan diminta untuk memberikan pilihannya apakah memilih formulasi yang
mengandung perasa jeruk atau formulasi tanpa perasa ini. Hasil dari studi ini ditunjukkan
dalam Tabel 7.7. Dengan menggunakan suatu metode statistik yang sesuai, tentukan apakah
keberterimaan larutan penisilin meningkat dengan penggunaan perasa jeruk ? (taraf arti =
0,05).

Tabel 7.7 Jumlah preferensi yang dicatat untuk dua formualsi penisilin dalam suatu studi
keberterimaan rasa yang melibatkan 50 sukarelawan.

Formulasi rasa jeruk 35


Formulasi tanpa rasa jeruk 15

Penyelesaian:
(i) Menyatakan hipotesis
0 : 0,5 (Tidak ada preferensi untuk salah satu formulasi)
1 : > 0,5 (Ada preferensi untuk salah satu formulasi)
(ii) Ambil aras nyata = 0,05
(iii) Daerah Kritis untuk = 0,05, k = 2, sehingga db = k 1 = 2 1 = 1, maka
= = 0,0500 = 1,65 atau
2 2
() = (0,05)1 = 3,841
(iv) Perhitungan
0 3550(0,5)
= = = 2,83
0 0 50(0,5)(0,5)
Atau
2 ( )2 (3525)2 (1525)2
= 2=1 = + = 8,00 dengan =
25 25
(v) Kesimpulan
2 2
Karena = 2,83 > = 1,65 atau = 8,00 > (0,05)1 = 3,841,
sehingga 0 ditolak yang berarti bahwa ada preferensi untuk salah satu formulasi di
mana larutan penisilin meningkat dengan penggunaan perasa jeruk.