Daftar Pustaka
1.David S. Jones, Alih Bahasa, Hesti Utami Ramadaniati, M.Clin.Pharm.Apt. dan Drs. H.
Harrizul Rival, M.S., Statistik Farmasi
2.Handoko Riwidikdo, Statistik Kesehatan
3.Sudjana, Metode statistika.
Bab 1 Konsep Dasar dan Definisi
Istilah Statistika dapat diuraikan sebagai ilmu pengetahuan dalam pengumpulan, analisis,
dan interpretasi data yang berhubungan dengan sekumpulan individu (Kendall dan Bucland,
1982)
Statistik dapat dibagi dua sub-kategori, yaitu Deskriptif dan Inferensial.
Statistik Deskriptif memberikan informasi umum mengenai sifat-sifat statistik yang
mendasar dari suatu data, contohnya rerata, median, simpangan baku, koefisien
variasi.
Statistik Inferensial terlibat dalam pembuatan kesimpulan-kesimpulan berdasarkan
informasi yang diperoleh dari prosedur-prosedur percobaan, misalnya efek anti
hipertensi suatu obet A secara nyata lebih besar dari pada obat B, dan lain-lain
Dalam kajian ilmiah, sattistika sangat berguna untuk digunakan dalam beberapa hal,
meliputi:
1) Pengumpulan data
2) Pendeskripsian numerik data
3) Pembuatan sebuah hipotesis yang berkenaan dengan sifat data
4) Pemahaman relevansi data dengan menggunakan metode-metode statistik yang
sesuai
5) Perancangan percobaan untuk menguji hipotesis atau untuk konsolidasi lebih jauh
atau menolak sebuah hipotesis.
Mahasiswa Farmasi strata satu dan pascasarjana sering menanyakan, kenapa mereka perlu
mempelajari ilmu statistik karena sudah ada ahli statistik yang sangat terlatih ? Jawabnya
perlu pelatihan baik teorinya maupun alat programnya memerlukan pelatihan yang sangat
lama untuk diketahui oleh bidang farmasi.
Contohnya
Sifat dan tingkat variasi dari data kimia dan biologi
Relevansi dan pengertian istilah istilah kunci statistika (misalnya, signifikansi,nilai-p,
simpangan baku, variabel)
Interpretasi yang sesuai dengan data yang diperoleh selama kajian penelitian.
Rancangan ilmiah yang sebenarnya
Suatu variabel dapat dijelaskan sebagai suatu sifat yang dimiliki individu-individu dalam
suatu sampel yang membuatnya berbeda dalam beberapa cara yang dapat diketahui (Sokal
dan Rohlf, 1981). Contohnya variabel meliputi:
1) Tinggi pria pada suatu daerah tertentu
2) Berat tablet-tablet yang berasal dari satu bets
3) Konsentrasi obat dalam plasma subyek-subyek klinis setelah pemberian obat dengan
pemberian dosis tertentu
4) Konsentrasi kolesterol dalam plasma subyek laki-laki
Istilah variabilitas terkait dengan proses penampilan ukuran biologi dan kimia, yaitu
ukuran berulang suatu sifat tertentu akan menunjukkan hasil numerik yang berbeda.
Kehadiran variabilitas tersebut merupakan alasan utama akan perlunya statistik
inverensial. Sebagai contoh, anggaplah ada dua analis farmasi melakukan uji
spektrofotometri untuk menetukan konsentrasi suatu obat dalam suatu larutan
tertentu. Hasil uji akan bervariasi karena beberapa alasan, meliputi:
Keterampilan analisis relatif kedua analis tersebut
Peralatan yang digunakan untuk analis
Kualitas (dan kebersihan) kuvet
Ketidakakuratan dalam pengenceran larutan awal
Sebelum melakukan statistika, baik deskriptif maupun inferensial, sifat variabel yang
dipertanyakan harus dikarakterisasi karena akan berhubungan langsung dengan pilihan
teknik statistik yang paling sesuai. Secara khusus, variabel dapat dijelaskan sebagai berikut:
Variabel pengukuran (kontinu dan diskrit)
Variabel berperingkat
Sifat-sifat
Jadi, walaupun nilai-nilai yang digunakan tidak memberikan ukuran pasti dapat diamati
bahwa seiring peningkatan pembentukan kerak, nilai numeriknya juga akan meningkat.
1.2.1.3 Variabel Diskrit (tidak kontinu, meristik)
Variabel diskrit adalah variabel-variabel yang mempunyai jumlah nilai yang tetap.
Contohnya meliputi:
Jumlah serangan asma yang tercatat dalam suatu kelompok
Jumlah koloni mikroorganisme
Jumlah kematian yang berhubungan dengan operasi tertentu
Variabel-variabel diskrit selalu mempunyai nilai yang utuh (bilangan bulat)
Tabel 1.1 Kejadin kandidosis oral pada sebuah rumah sakit daerah dalam satu bulan
Variabel nominal (jenis kelamin) Kejadian yang dilaporkan
Pria 59
Wanita 82
Jumlah total kasus 141
Dua hal penting yang harus dipahami, yaitu sampel dan populasi
Populasi dapat didefinisikan sebagai jumlah keseluruhan dari pengamatan yang
menyusun kelompok tertentu; setiap sifat khusus yang berhubungan dengan sebuah
populasi disebut sebagai parameter
Sampel umumnya merupakan kelompok pengamatan yang relatif kecil yang diambil
dari populasi yang ditetapkan.
Contohnya disajikan dalam Tabel 1.2
Evaluasi Nilai IQ anak-anak Semua anak sekolah 100 anak kelas 7 yang studi di
sekolah kelas 7 di Irlandia Utara kelas 7 di Irlandia Uara sekolah tersebut
Penggunaan data sampel untuk memberikan informasi mengenai parameter populasi yang
telah diperkenalkan. Salah satu komponen terpenting dari setiap percobaan adalah proses
pengambilan sampel. Karena salah memilih metode pengambilan sampel yang paling sesuai
akan menyebabkan bias dan mungkin pembuatan kesimpulan statistik tidak tepat. Beberapa
metode pemilihan sampel diantaranya adalah pengambilan sampel acak dan pengambilan
sampel bertingkat.
Estimasi sifat memusat dari data mungkin merupakan perhitungan statistik yang paling
umum digunakan oleh sebagian besar mahasiswa. Khususnya, sifat memusat dari data dapat
dijelaskan dengan mudah melalui sejumlah metode dan istilah, meliputi rerata (misalnya,
rerata aritmetika, rerata berbobot), median dan modus.
Istilah rerata (average atau mean) merupakan metode yang paling terkenal untuk
menjelaskan sifat memusat data, dan berkenaan dengan pusat dari distribusi data.
Penggunaan rerata paling sesuai ketika data terdistribusi secara simetris disekitar nilai
rerata, yaitu distribusi Gaussian. Rerata aritmetika digambarkan dengan rumus matematika
sebagai berikut:
=1
di mana = notasi jumlah
= semua data dari j = 1 sampai j = N.
N = jumlah data yang masuk dalam perhitungan
Contoh 2.1
Penurunan tekanan darah (mmHg) dari 6 pasien 4 jam setelah pemberian satu dosis baku
suatu obat anti hipertensi baru ditunjukkan pada tabel 2.1. Hitunglah rerata penurunan
tekanan darah dari 6 pasien tersebut.
Tabel 2.1 Efek suatu obat anti hipertensi terhadap penurunan tekanan darah dari 6 pasien
Nomor Pasien Penurunan tekanan darah (mmHg)
1 20
2 25
3 21
4 34
5 41
6 37
Rerata berbobot sering digunakan ketika data dibagi ke dalam kelompok-kelompok, tiap
kelompok memiliki bobot (yaitu, kepentingan) yang berbeda. Rumus matematikanya dari
rerata berbobot adalah sebagai berikut:
=1
=
di mana = notasi jumlah
= semua data dari j = 1 sampai j = N.
N = jumlah data yang masuk dalam perhitungan
= pemberatan (frekuensi) dari tiap kelompok atau rangkaian.
Contoh 2.2
Efek suatu dosis tertentu dari obat analgesik yang tersedia dipasaran untuk menekan rasa
nyeri setelah pemberian rangsangan nyeri dievaluasi pada 20 sukarelawan menggunakan
skala analog visual. Hasilnya disajikan dalam tabel 2.2. Hitunglah rerata penilaian rasa nyeri
menurut 20 sukarelawan.
Tabel 2.2 Penilaian rasa sakit yang dicatat dari 20 sukarelawan setelah pemberian analgesik
yang ada dipasaran dan pemaparan pada rangsangan nyeri
Jumlah Sukarelawan Pemberian rasa sakit menurut para sukarelawan
2 3 (sangat nyeri)
12 2 (cukup nyeri)
6 1 (sedikit nyeri)
Penyelesaian:
3=1 (23)+(122)+(61) 36
Rerata berbobot Sampel () = = = 20 = 1,8
20 20
Contoh lain
Misalkan seorang mahasiswa telah memperoleh masing-masing 75% dan 70% dalam
komponen ujian dan tugas dalam sebuah hasil, mata kuliah ini tidak memberikan kontribusi
yang sama terhadap nilai akhir, misalnya masing-masing berbobot 80% dan 20%. Berapakah
nilai akhir (rerata berbobot) yang diperoleh mahaswiswa tersebut.
Jawabnya:
2=1 (8075)+(2070)
Rerata berbobot mahasiswa () = = = 74%
100 100
2.1.3 Median
Median merupakan metode alternatif untuk menjelaskan sifat memusat dari data tidak
terpengaruh oleh sifat dari sebaran data. Jadi median merupakan nilai tengah, atau rerata dari
dua nilai tengah, dari serangkaian data yang diatur berurutan besarnya. Perhitungan median
dan perbandingan dengan rerata dari satu rangkaian data asimetris ( data tidak terdistribusi
secara tidak merata) disekitar rerata.
Contoh 2.3
Perlekatan patogen Candida albicans oportunistik pada 10 sel epitelial bukal (BEC) secara in
vitro diperiksa dan datanya ditunjukkan dalam Tabel 2.3. Hitunglah nilai rerata dan median
untuk profil perlekatan patogen ini.
Tabel 2.3 Jumlah blastospora Candida albicans yang melekat pada sejumlah tertentu sel epitel
bukal yang diperiksa menggunakan metode in vitro
Nomor sel epitel Jumlah C, albicans yang melekat
1. 2
2. 0
3. 0
4. 6
5. 4
6. 24
7. 9
8. 6
9. 1
10. 0
Jawab:
Tahap 1
1 2+0+0+6+4+24+9+6+1+0
Rerata 10
=1 = = 5,2 blastospora dari C, albicans pada tiap sel
10
epitel bukal.
Tahap 2
Data disususn dari terkecil, yaitu; 0, 0, 0, 1, 2, 4, 6, 6, 9, 24
2+4
Kita tentukan nilai tengah ada pada posisi 5 dan 6. Jadi median = 2 = 3 blastospora dari C,
albicans pada tiap sel epitel bukal.
Tahap 3 Kesimpulan
Deskripsi sifat memusat data menggunakan rerata dan median dapat menghasilkan hasil
numerik yang berbeda. Hal ini disebabkan oleh nilai-nilai ekstrim dalam satu rangkaian data
tertentu, misalnya nilai 24 dalam kasus di atas, mempunyai efek yang lebih besar terhadap
nilai rerata dibandingkan median. Oleh karena itu, median lebih sesuai dalam menjelaskan
sifat memusat data yang mempunyai nilai-nilai ekstrim.
Untuk data yang berdistribusi normal, nilai numerik dari rerata dan median akan sama
dan keduanya dapat digunakan dengan baik untuk menjelaskan titik pusat dari distribusi
secara akurat. Namun, pemilihan parameter mana yang akan digunakan menjadi lebih sulit
ketika data menunjukkan ketidaknormalan. Kesalah pahaman yang umum terjadi dikalangan
mahasiswa statistik adalah bahwa rerata hanya digunakan untuk menjelaskan sifat memusat
data yang terdistribusi secara normal, sementara median hanya digunakan untuk menjelaskan
sifat memusat data yang tidak terdistribusi secara normal. Sebenarnya baik rerata maupun
median dapat digunakan untuk menjelaskan sifat-sifat memusat dari data yang terdistribusi
agak condong (yaitu non-normal). Pada kondisi ini, nilai rerata dan median akan berbeda dan
lebih beragam bila kecondongan distribusi meningkat. Jika data condong secara positif (yaitu
terdistrbusi kearah sumbu y), secara numerik rerata akan lebih besar dari median; sebaliknya
juga berlaku pada distribusi yang condong secara negatif. Penggunaan median lebih disukai
dari pada rerata untuk deskripsi distribusi-distribusi yang mempunyai nilai-nilai ekstrim.
2.1.4 Modus
Modus dapat digambarkan sebagai ukuran yang paling sering terjadi dalam satu rangkaian
data.
Contoh 2.5
Konsentrasi obat (mg/ml) dalam 10 vial produk parenteral yang tersedia di pasaran telah
ditetapkan menggunakan metode kromatografi. Hitunglah modus dari konsentrasi teramati
pada Tabel 2.5 di bawah
Tabel 2.5 Konsentrasi suatu obat dalam 10 vial produk yang tersedia secara komersial
Nomor vial Konsentrasi obat (mg/ml)
1 200
2 205
3 205
4 201
5 199
6 195
7 202
8 205
9 205
10 207
Peny:
Nilai yang paling sering muncul dari rangkaian data di atas adalah 205 mg/ml (empat)
sehingga nilai nilai ini disebut modus.
Dengan mengacu pada distribusi frekuensi, modus secara numerik sama dengan rerata dan
median dalam distribusi simetris. Dalam distribusi simetris, sebuah hubungan empiris antara
rerata, median dan modus:
= 3( )
2.2.1 Kisaran
Kisaran dapat didefinisikan sebagai perbedaan antara nilai terbesar dan terkecil dari satu
rangkaian hasil pengukuran. Kisaran dari rangkaian data A dan B dalam Tabel 2.6 adalah
sebagai berikut:
Tabel 2.6 Nilai-nilai individu yang berhubungan dengan dua rangkaian data yang memiliki
rerata yang identik
Rangkaian data A Rangkaian data B
10 28
20 29
30 30
20 29
10 28
Nilai tengah = 30 Nilai tengah = 30
Rangkaian data A: kisaran = 30 10 = 20
Rangkaian data B: kisaran = 30 28 = 2
Penggunaan kisaran untuk menjelaskan variasi data secara akurat sangatlah terbatas
karena perhitungannya hanya melibatkan dua ukuran dari rangkaian data (yaitu titik tertinggi
dan terendah dari data). Karena itu, kisaran tidak benar-benar menjelaskan variasi dari
keseluruhan rangkaian data. Selanjutnya untuk estimasi variabilitas populasi dari data sampel,
kisaran dianggap tidak sesuai karena kecil kemungkinan suatu sampel akan mengandung nilai
tertinggi dan juga nilai terendah dalam suatu populasi. Jadi, kisaran sampel dianggap sebagai
estimasi yang lemah (yaitu penaksiran rendah) dari kisaran suatu populasi. Penggunaan
utama dari kisaran adalah untuk mendefinisikan variabilitas yang berhubungan dengan data
yang tidak terdistribusi secara normal.
Simpangan rerata (mean deviation, MD), umumnya diistilahkan momen mutlak pertama,
adalah suatu ukuran variasi data yang dihitung sebagai simpangan rata-rata dari rerata. Rerata
digunakan sebagai ukuran kecenderungan memusat, suatu istilah yang menjelskan simpangan
disekitar parameter pusat.
Dalam istilah matematis, simpangan rerata ditulis sebagai
( )
=
di mana ( ) adalah nilai mutlak dari simpangan (perbedaan) nilai-nilai dalam rangkaian
data dari rerata rangkaian data dan N adalah jumlah pengamatan dalam rangkaian data.
Contoh 2.6
Suatu larutan tetrasiklin hidroklorida telah dikirim ke laboratorium pengendalian mutu pada
sebuah perusahaan farmasi untuk dianalisis. Kandungan obat dari alikuot larutan ini diukur
menggunakan spektroskopi ultraviolet dan hasilnya disajikan dalam Tabel 2.7. Hitunglah
simpangan rerata kandungan obat larutan.
Tabel 2.7 Kandungan tetrasiklin hidroklorida dalam enam alikuot suatu larutan
Nomor alikuot Kandungan tetrasiklin hidroklorida (mg/ml)
1 100,6
2 98,3
3 98,9
4 95,1
5 104,5
6 105,5
Peny:
Tahap 1 Menghitung rerata
6=1 (100,6 + 98,3 + 98,9 + 95,1 + 104,5 + 105,5)
= = = 100,5 /
6
Tahap 2 Menghitung perbedaan rerata
( ) (100,6100,5)+(98,3100,5)+(98,9100,5)+(95,1100,5)+(104,5100,5)+(105,5100,5)
= =
6
= 3,1 /
2.2.3 Varians
Dalam perhitungan simpangan rerata untuk menghindari dari tanda minus dari hasil
pengukuran tertentu adalah dengan mengkuadratkan perbedaan (simpangan) tersebut.
Penjumlahan perbedaan yang dikuadratkan secara berturut-turut menghasilkan suatu istilah
statistik dasar, yaitu jumlah kuadrat. Secara matematiss, jumlah kuadrat (sum of square,SS)
diuraikan sebagai berikut:
= ( )2
dengan dan mempunyai definisi yang sama seperti sebelumnya.
Varians sering disebut sebagai rerata jumlah kuadrat dan dituliskan sebagai
( )2
2 =
dengan 2 adalah varians dari suatu populasi, adalah nilai numerik dari tiap hasil
pengukuran, adalah nilai rerata populasi dan N adalah jumlah pengamatan.
Selanjutnya untuk varians sampel ( 2 ), yaitu estimasi varians populasi ( 2 ), yang
paling sesuai digambarkan dengan
( )2
2 = 1
dengan adalah rerata data sampel dan N jumlah pengamatan dalam sampel.
Pengertian dari persamaan yang menyatakan varians harus diperhatikan.
Pertama, penulisan varians 2 atau 2 tergantung dari apakah data populasi atau
sampel yang sedang digunakan
Ke dua, persamaan-persamaan yang menggambarkan varians data populasi dan
sampel pada dasarnya berbeda pada penyebutnya, yakni N untuk varian populasi dan
N - 1 untuk varians sampel
Alasan utama adanya perbedaan antara kedua persamaan ini berhubungan dengan
ketidakakuratan relatif terhadap estimasi varians populasi dari varians sampel ketika
persamaan untuk sampel hanya meliputi N, jumlah pengamatan, sebagai penyebut. Dalam
situasi ini, varians sampel dianggap menjadi perkiraan yang bias dari varians populasi, dan
penulisan (N-1) digunakan untuk menghilangkan bias ini.
Tahap ini disarankan untuk memperhatikan hubungan antara variansi sampel dan
variansi populasi. Tidak seperti variansi populasi, variansi sampel adalah ukuran variabel.
Karena itu, jika suatu sampel acak diambil dari suatu populasi, misalnya jika 100 tablet
diambil suatu bets berisi 1000000 tablet (populasi) dan berat tiap tablet ditimbang, variansi
sampel (100 tablet) tidak akan tepat sama dengan variansi populasi. Mengapa demikian ?
Karena, jika sampel berulang diambil dari bets berisi 1000000 tablet dan variansi berat dari
tiap rangkaian sampel diukur, variansi dari tiap-tiap sampel yang berbeda ini akan sedikit
berbeda. Perbedaan ini merupakan akibat langsung dari sifat variabel dari variansi sampel,
yang disebabkan oleh faktor-faktor yang dijelaskan dalam bab pertama. Contohnya,
perbedaan dalam berat tiap bets, variabilitas yang disebabkan ketidakakuratan timbangan,
ketidakakuran operator dll. Akan tetapi, jika sampel-sampel sebanyak N diambil secara acak
berulang dari populasi dan variansi-variansi ditentukan (menggunakan N 1 sebagai Konsep
penting penggunaan N 1 sebagai penyebut untuk perhitungan variansi sampel dijelaskan di
bawah ini.
Andaikan suatu populasi tersusun dari tiga titik data, yaitu 3, 5 dan 7. Dari informasi
ini, variansi populasi dapat diperoleh menggunakan persamaan berikut:
( )2
2 =
Peny:
Nilai nilai individu ( ) - ( )2
3 -2 4
5 0 0
7 2 4
Sehingga
( )2
(4+0+4)
2 = = 3 = 2,67
Dari populasi di atas sembilan sampel individu, masing-masing tersusun dari dua nilai
dengan cara pengambilan sampel berulang dan tiap pengambilan sampel, sampel
dikembalikan sehingga setiap mempunyai kesempatan yang sama untuk diambil. Hasil dari
pengambilan sampel, yaitu berbagai pasangan data diperoleh sebagai berikut:
( )2
Sampel Nilai ( )2 2
1
1 (3,3) (3 3)2 = 0 (0 + 0)/1 0
(3 3)2 = 0
2 (5,5) (5 5)2 = 0 (0 + 0))/1 0
(5 5)2 = 0
3 (7,7) (7 7)2 = 0 (0 + 0)/1 0
(7 7)2 = 0
4 (3,5) (3 4)2 = 1 (1 + 1)/1 2
(5 4)2 = 1
5 (5,7) (5 6)2 = 1 (1 + 1)/1 2
(7 6)2 = 1
6 (5,3) (5 4)2 = 1 (1 + 1)/1 2
(3 4)2 = 1
7 (7,5) (7 6)2 = 1 (1+1)/1 2
(5 6)2 = 1
8 (3,7) (3 5)2 = 4 (4+4)/1 8
(7 5)2 = 4
9 (7,3) (7 5)2 = 4 (4+4)/1 8
(3 5)2 = 4
Simpangan baku merupakan suatu ukuran dispersi data yang umum digunakan dari
definisi akar kuadrat positif dari variansi dan ditulis dengan rumus sebagai berikut:
Simpangan baku populasi
( )2
=
Simpangan baku Sampel
( )2
= 1
Contoh 2.7
Suatu bets tablet bolus telah diolah dan sedang menunggu pelulusan dari laboratorium
pengendalian mutu pada sebuah perusahaan Farmasi. Salah satu sifat tablet bolus yang
harus diukur adalah waktu yang dibutuhkan untuk pelepasan 50% muatan awal obat
dalam bolus (50% ) menggunakan uji disolusi yang dijelaskan dalam the British
Pharmacopoeia (1998). Tabel 2.8 menunjukkan nilai 50% dari 15 bolus yang disampel
secara acak dari bets tersebut. Hitung rerata dan simpangan baku dari waktu yang
dibutuhkan untuk pelepasan 50% muatan awal obat dari bolus.
Tabel 2.8 Waktu yang dibutuhkan untuk disolusi 50% massa awal obat dari 15 tablet
bolus yang berasal dari satu bets tunggal
Nomor bolus 50% (jam)
1 20,2
2 21,6
3 24,5
4 28,6
5 22,6
6 24,0
7 21,9
8 22,0
9 26,1
10 25,3
11 23,4
12 20,1
13 23,5
14 24,0
15 25,9
Peny:
Tahap 1 Menghitung rerata (), yaitu
15
=1 20,2 + 21,6 + 24,5 + + 25,9 353,7
= = = = 23,6
15 15
Tahap 2 menghitung simpangan baku sampel (s)
Simpangan baku merupakan ukuran dispersi data yang paling sering digunakan karena
dapat berhubungan dengan probabilitas dari ukuran yang terjadi dalam wilayah tertentu
pada distribusi frekuensi. Jadi, dalam distribusi normal (simetris) dan tentunya dalam
distribusi cukup condong (asimetris).
68,27% dari semua nilai tercakup dalam kisaran numerik yang dinyatakan dengan
+ dan , yaitu satu simpangan baku disekitar rerata.
95,45% dari semua nilai tercakup dalam kisaran numerik yang dinyatakan dengan
+ 2 dan 2, yaitu satu simpangan baku disekitar rerata.
99,73% dari semua nilai tercakup dalam kisaran numerik yang dinyatakan dengan
+ 3 dan 3, yaitu satu simpangan baku disekitar rerata.
Dalam contoh yang digambarkan di atas mengenai waktu yang dibutuhkan untuk
pelepasan 50% muatan awal obat, rerata dan simpangan baku dihitung sebesar 23,6 2,3
jam. Oleh karena itu
68,27% dari semua nilai yang tercakup dalam kisaran numerik yang dinyatakan
dengan 21,3 jam (23,6-2,3 jam) sampai 25,9 jam (23,6+2,3 jam). Maka, pada contoh
ini 10 dari15 nilai terdistribusi dalam kisaran ini.
95,45% dari semua nilai yang tercakup dalam kisaran numerik yang dinyatakan
dengan 19,0 jam (23,6-2,6 jam) sampai 28,2 jam (23,6+2,6 jam). Maka, pada contoh
ini 14 dari15 nilai terdistribusi dalam kisaran ini.
99,73% dari semua nilai yang tercakup dalam kisaran numerik yang dinyatakan
dengan 16,7 jam (23,6-6,9 jam) sampai 30,5 jam (23,6+6,9 jam). Maka, pada contoh
ini semua nilai terdistribusi dalam kisaran ini.
Contoh 2.9
Konsentrasi antibiotik penisilin (mg/5 ml) dalam lima botol suspensi untuk anak-anak
telah diperiksa menggunakan teknik iodometri. Hitunglah rerata dan simpangan baku
serta pertimbangkan kontribusi tiap pengamatan terhadap varians sampel.
Tabel 2.9 Konsentrasi antibiotik penisilin dari masing-masing lima botol suspensi untuk
anak-anak
Nomor botol Konsentrasi penisilin
1 125
2 124
3 121
4 123
5 16
= = = 101,8
5
Tabel 2.10 Konsentrasi antibiotik dari masing-masing lima botol suspensi untuk anak-anak,
menjelaskan kontribusi masing-masing vial terhadap varians total
Nomor botol Konsentrasi penisilin Kontribusi terhdp varians
(mg/5 ml) keseluruhan
1 125 134,5
2 124 123,2
3 121 92,2
4 123 112,4
5 16 1840,4
= 2302,7 ( 5 )2
2
Simpangan baku rerata, sering disebut kesalahan baku rerata ( Standar error of the mean,
SEM) merupakan istilah yang umum digunakan dan sayangnya sering disalahgunakan dalam
statistik.
Contoh 2.10
Suatu bets suspensi amoksilin trihidrat untuk anak-anak telah diproduksi. Sebelum pengisian,
pabrikan ingin memastikan keseragaman konsentrasi yang tersuspensi dalam bets. Untuk
memeriksanya, lima alikuot individual (100 ml) diambil dan konsentrasi tiap alikuot
ditentukan lima kali menggunakan metode kromatografi. Hasilnya ditampilkan dalam Tabel
2.11. Hitunglah kesalahan baku rerata dari rangkaian data ini
Tabel 2.11 Konsentrasi amoksilin dalam lima alikuot yang diambil dari sebuah bets untuk
tujuan pengendalian mutu
Konsentrasi amokslin trihidrat (mg/ml)
Alikuot 1 Alikuot 2 Alikuot 3 Alikuot 4 Alikuot 5
25,1 27,6 24,3 23,9 25,7
25,4 25,5 26,4 24,9 23,5
21,9 25,6 25,1 26,1 24,2
24,5 25,0 27,1 27,0 25,7
23,1 24,2 25,0 25,2 24,3
1 = 24,0 = 24,2 = 24,3 = 23,9 = 23,5
S1 = 1,5 s2 = 1,3 s = 1,1 s = 1,2 s = 1,0
Dari data di atas dapat diambil alikuot 1 sebagai berikut:
2 ( )2 / 2888,64(120)2 /5 2888,642880
= = = = 1,5 dst
1 51 4
Jika diperhatikan bahwa besarnya simpangan baku rerata lebih kecil dari simpangan baku
individu yang berhubungan dengan tiap alikuot. Ini dapat dijelaskan dengan pertimbangan
sifat pengamatan yang dilibatkan dalam perhitungan masing-masing istilah simpangan ini.
Ingatlah bahwa simpangan baku secara khusus rentan terhadap nilai nilai ekstrim. Oleh
karena itu, nilai-nilai tersebut ada dalam rangkaian data individu, simpangan baku rangkaian
tersebut akan meningkat. Sebaliknya, besarnya rerata secara relatif tidak dipengaruhi oleh
masuknya data ekstrim. Kedua efek ini ditunjukkan dalam tabel 2.12
Tabel 2.12 Rangkaian data hipotesis, menggambarkan efek darai nilai-nilai ekstrim pada
simpangan baku dan rerata
Rangkaian data A Rangkaian data B Rangkaian data C
5 5 5
7 7 7
8 8 8
9 9 9
15 21 51
= 8,8 = 10 = 16
s=
Kita dapat melihat bahwa rerata menekan efek nilai ekstrim dan akibatnya simpangan baku
dari suatu rangkaian dengan rerata tersebut akan menjadi lebih rendah:
2 ( )2 / 433,44(34,8)2 /3 433,44403,68
= = = = 3,86
1 31 2
Simpangan rerata dapat dihitung dengan mengambil rerata masing-masing rangkaian. Oleh
karena itu, meskipun variasi dari populasi tidak diketahui, simpangan baku dari suatu
rangkaian data individu (sampel) dapat digunakan untuk memperkirakan parameter ini. Teori
statisti menyatakan bahwa SEM dapat dihitung dengan membagi simpangan baku rangkaian
data dengan akar kuadrat jumlah pengamatan dalam rangkaian data (N):
=
Persamaan di atas memungkinkan kita untuk memperkirakan variasi rerata dari populasi;
yaitu jika banyak rerata diperoleh dari pengambilan sampel acak dari rangkaian data,
variasinya akan berbeda-beda dari nilai yang diperkirakan menggunakan persamaan di atas.
Ini karena nilai simpangan baku rerata yang dihitung menggunakan simpangan baku sampel
dari suatu populasi tidak akan tepat sama dengan simpangan baku rerata yang sebenarnya.
Karena simpangan baku dari satu sampel merupakan varriabel acak dan akan berbeda dari
satu sampel ke sanpel yang lain.
2.2.5.1 Uraian Umum Mengenai Simpangan Baku dan Kesalahan Baku Rerata
Pada tahap ini, kita seharusnya telah mengidentifikasi perbedaan-perbedaan utama antara
simpangan baku dan simpangan (kesalahan) baku rerata. Tanpa bermaksud untuk melakukan
pengulangan, bagian berikut ini dimaksudkan sebagai ringkasan karateristik-karateristik
utama dari istilah.
Simpangan baku sampel yang berasal dari populasi digunakan sebagai suatu perkiraan
variabilitas populasi. Akibatnya, nilai dari simpangan baku tidak diharapkan menurun
jika jumlah pengamatan dalam sampel meningkat. Namun kepercayaan yang lebih
besar terhadapa variabilitas dapat diperoleh dengan membuat jmlah pengamatan yang
lebih besar terhadap simpangan baku sampel-sampel.
Simpangan baku rerata merupakan ukuran variabilitas (presisi) dari perkiraan suatu
parameter populasi yang ditentukan, yaitu rerata. Nilai numerik dari kesalahan baku
rerata tergantung pada jumlah pengamatan yang dimasukkan dalam perhitungannya.
Secara khusus, jika ukuran sampel meningkat untuk meningkatkan presisi
pengukuran, besarnya kesalahan baku rerata menurun. Hal ini ditunjukkan dengan
penggunaan notasi dalam penyebut pada persamaan untuk menghitung parameter
ini.
Koefisien variasi (coefficient of variation, CV) adalah suatu istilah statistik yang
menunjukkan variabilitas suatu rangkaian data dan didefinisikan sebagai perbandingan antara
simpangan baku (s) dengan rerata rangkaian data ().
(%) = 100
Istilah ini memungkinkan kita untuk membandingkan variasi dari rangkaian data yang
besarnya berbeda secara langsung. Jadi, jika rerata simpangan baku dari dua rangkaian data
adalah (A) 2500 125 dan (B) 50 35, sekilas kita dapat salah mengira bahwa variasi dari
rangkaian data B (simpangan baku = 35) kurang dari dari rangkaian data A (simpangan baku
=125). Akan tetapi, perbandingan tersebut tidak berarti dan menyesatkan karena besarnya
nilai rerata dari kedua kelompok belum dipertimbangkan. Untuk mengevaluasi variabilitas
kedua rangkaian data dengan benar kedua koefisien variasi harus dihitung dan dibandingkan.
Koefisien variasi dari kedua rangkaian itu adalah:
125
Rangkaian data A: (%) = 100 = 2500 100 = 5%
35
Rangkaian data B: (%) = 100 = 50 100 = 70%
Dari kedua rangkaian ini dapat disimpulkan bahwa koefisien variasi dari rangkaian data A
lebih kecil dari data B, yang berarti menggambarkan variabilitas yang lebih besar pada data
B.
Besarnya koefisien variasi tergantung pada sifat data terkait. Khususnya dalam
percobaan analisis farmasi koefisien variasi rendah (< 3%) karena variabilitas yang
berhubungan dengan pengukurann tersebut biasanya rendah. Sebaliknya, koefisien variasi
dalam percobaan biologis, misalnya pengukuran konsentrasi plasma suatu obat dari
sukarelawan, bisa jadi cukup besar (sampai 100%) karena variabilitas pengukuran seperti itu
sering kali sangat tinggi.
Istilah akurasi dan presisi sering digunakan untuk menjelaskan sifat variabilitas data. Dengan
penggunaan khusus istilah tersebut dalam aspek-aspek tertentu dalam ilmu farmasi, misalnya
analisis farmasi, pada tahap ini, istilah-istilah ini akan dibandingkan dan dibedakan serta
dijelaskan penerapan-penerapannya yang paling sesuai.
2.3.1 Akurasi
Akurasi dapat didefinisikan dengan tepat sebagai kedekatan suatu nilai terukur dengan nilai
sebenarnya, yaitu nilai yang diharapkan tanpa adanya kesalahan. Dalam analisis farmasi,
akurasi dari suatu metode analitis umumnjya dijelaskan sebagai kedekatan nilai yang diamati
(dianalisis) dengan nilai yang diharapkan. Sejumlah metode dapat digunakan untuk
menjelaskan perbedaan antara nilai yang diamati dan nilai yang diharapkan, dan beberapa
diantaranya dijelaskan di bawah ini.
Contoh
Larutan kuinin sulfat telah dianalisis menggunakan tiga metode analisis dan hasilnya
ditunjukkan dalam Tabel 2.13. Hitunglah kesalahan mutlak yang berhubungan dengan
metode-metode ini.
Metode yang paling akurat dapat diartikan sebagai metode yang memiliki nilai kesalahan
mutlak yang paling rendah, yaitu HPLC dengan deteksi ultraviolet (kesalahan mutlak = +0,01
mg/ml). Metode yang paling tidak akurat, spektroskopi ultraviolet, berhubungan dengan
kesalahan mutlak yang paling besar.
Tabel 2.13 Konsentrasi kuinin sulfat dalam larutan yang ditentukan menggunakan tiga
metode analisis
Metode analisis Nilai yang diamati Nilai yang diharapkan Kesalahan mutlak
(mg/ml) (mg/ml) (mg/ml)
KCKT dengan 2,51 2,50 +0,01
deteksi ultraviolet
Kesalahan mutlak adalah suatu metode yang berguna karena akurasi suatu pengukuran dapat
ditentukan, tetapi sayangnya kesalahan mutlak dipengaruhi oleh besarnya pengukuran. Jadi
dalam metode spektroskopi fluoresens dapat dianggap relatif akurat (2,19 dibandingkan
dengan 2,50 mg/ml) dengan nilai kesalahan mutlak sebesar -0,31 mg/ml. Namun
pertimbangan contoh dengan konsentrasi kuinin sulfat dalam larutan ke dua adalah 0,5 mg/ml
dan konsentrasi larutan yang diukur dengan spetroskopi fluoresens adalah 0,19 mg/ml. Dalam
contoh ini kesalahan mutlak adalah -0,31 mg/ml identik dengan kesalahan mutlak pada
penggunaan deteksi fluoresens untuk penentuan konsentrasi larutan kuinin sulfat yang lebih
pekat (2,50 mg/ml). Akan tetapi, sangat jelas bagi kita bahwa walaupun kesalahan mutlak
terhitung ke dua metode ini identik, nilai terukur (0,19 mg/ml) bukan merupan hasil yang
akurat dari nilai sebenarnya (0,5 mg/ml). Ini kerugian utama yang berhubungan dengan
penggunaan kesalahan mutlak.
Istilah ini dikembangkan untuk mengatasi masalah yang dijelaskan dalam paragraf
sebelumnya dan menggambarkan kesalahan sebagai bagian dari nilai sebenarnya
(diharapkan). Dalam perhitungan tanda perbedaan (positif dan negatif) diabaikan sehingga;
= =
Kesalahan relatif (relative error) juga dapat dinyatakan sebagai nilai persentase:
100 ()100
% = =
Tabel 2.13 Konsentrasi kuinin sulfat dalam larutan yang ditentukan menggunakan tiga
metode analisis
Metode analisis Nilai yang di- Nilai yang di- Kesalahan Kesalahan
amati (mg/ml) harapkan(mg/ml) mutlak (mg/ml) relatif (%)
KCKT dengan 2,51 2,50 +0,01 0,40
deteksi ultraviolet
2.3.2 Presisi
Presisi adalah suatu istilah statistik yang menjelaskan sebaran (variabilitas) dari satu
rangkaian pengukuran. Akan tetapi, tidak seperti akurasi, presisi tidak memberikan indikasi
kedekatan suatu pengamatan dengan kuantitas tertentu yang diharapkan. Secara khusus,
presisi yang tinggi berhubungan dengan sebaran yang rendah. Perbedaan antara presisi dan
akurasi dapat dijelaskan dalam contoh berikut yang menggambarkan volume pengisian akhir
dari suatu suspensi antasida (volume nominal, yaitu yang diharapkan, sebesar 50ml).
Contoh 2.12
Dalam laboratorium pengendalian mutu, volume pengisian dari tiga sampel suatu suspensi
antasida telah diukur dan dicatat (dalam Tabel 2.15). Berilah uraian mengenai akurasi dan
presisi volume pengisian ketiga sampel tersebut.
Tabel 2.15 Volume pengisisan sampel-sampel yang dipilih dari suatu formulasi antasida
Volume pengisian Volume pengisian Volume pengisian
sampel A (ml) sampel B (ml) sampel C (ml)
47 27 28
48 39 26
49 49 27
50 59 30
51 69 30
= 49,0
= 49,0 = 28,2
= 1,6 = 15,8 = 1,80
Kesalahan relatif dari kesalahan relatif dari Kesalahan relatif dari
rerata = 2,0% rerata = 2,0% rerata = 43,6%
Kesalahan relatif sampel A identik dengan kesalahan relatif sampel B dan karenanya kedua
sampel dianggap sebagai pengukuran yang sama akurat terhadap volume pengisian
sebenarnya (diharapkan). Sebaliknya akurasi dari rerata volume pengisian sampel C tidak
baik (kesalahan relatif 43,6%), oleh karena itu, ini dianggap menjadi gambaran yang jelek
dari volume pengisian yang sebenarnya.
Pertimbangan mengenai simpangan baku yang berhubungan dengan data yang
memberikan nilai-nilai rerata dari tiap sampel dapat digunakan untuk mengevaluasi presisi
hasil-hasil pengukuran. Rangkaian data yang berhubungan dengan sampel A mempunyai
simpangan baku yang rendah ( dan juga koefisien variasi yang rendah, yaitu 3,3), sehingga
menunjukkan tingkat penyebaran yang kecil dari rangkaian data rerata dan rangkaian data ini
dikatakan presisi. Demikian pula data yang berhubungan dengan sampel C, data ini
mempunyai simpangan baku yang rendah (dan koefisien variasi yang rendah, yaitu 6,4%) dan
juga dianggap presisi. Sebaliknya simpangan baku data yang terdapat dalam sampel B tinggi,
menunjukkan variabilitas yang besar disekitar rerata (koefisien variasi sebesar 32,2%),
sehingga rangkaian data ini dianggap tidak presisi atau menunjukkan presisi yang rendah.
Kesimpulannya:
Sampel A menunjukkan akurasi tinggi dan presisi tinggi
Sampel B menunjukkan akurasi tinggi dan presisi rendah
Sampel C menunjukkan akurasi rendah dan presisi tinggi.
BAB 3 PENYAJIAN DATA
3.1 Aturan-Aturan Dasar Dalam Pembentukan Grafik
Pembentukan grafik merupakan suatu proses yang relatif sederhana jika beberapa aturan
diingat.
Judul harus memberi informasi kepada pembaca mengenai sifat data yang dijelaskan: judul
harus ringkas, informatif, dan berkaitan dengan informasi yang terkandung dalam grafik.
Untuk grafik yang mengandung dua plot atau lebih, kunci yang menjelaskan simbol dari tiap
plot tersebut harus diberikan.
3.1.2 Sumbu
Sumbu merupakan komponen penting dalam pembentukan grafik, karena sumbu menjelaskan
dasar ruang (gambar) dari penyajian data. Grafik tersusun dari berbagai rangkaian data yang
menjelaskan hubungan antara suatu variabel tetap dan suatu variabel acak. Untuk menjamin
penyajian data grafik yang optimal, pemilihan kisaran nilai-nilai numerik pada tiap sumbu
merupakan suatu hal yang penting. Pemilihan ditunjukkan dalam contoh pustaka ilmiah,
secara grafik menyajikan efek cairan biologis terhadap pelekatan patogen saluran kemih
Staphylococcus epidermidis pada kateter dianalisis ambulatori berkelanjutan dari poliuretan
dan silikon. Ada dua hal utama yang harus diketahui dari grafik-grafik ini:
Pertama, informasi yang ditampilkan pada sumbu harus ringkas dan jelas, serta cukup
untuk membuat pembaca mengerti sifat percobaan.
Kedua, karena salah satu tujuan investigasi tersebut adalah untuk membandingkan
efek cairan biologis pada pelekatan S. Epidermidis pada kateter dengan komposisi
polimer yang berbeda, pemilihan kisaran numerik harus sama pada sumbu-sumbu dari
grafik yang berbeda.
Tabel 3.1 Biaya bulanan praktek dokter umum untuk tiga tipe bentuk sediaan yang
mengandung suatu obat yang dirancang untuk pengobatan penyakit kardiovaskular
Tipe bentuk sediaan Biaya bulanan rerata ()
Lepas lambat 3000
Koyo transdermal 6500
Tablet konvensional 3800
Biaya bulanan rerata ()
8000
6000
4000
2000
0
Lepas berkelanjutan Koyo transdermal Tablet konvensional Tipe bentuk sediaan
Gambar 3.2 Biaya bulanan praktek dokter umum untuk tiga tipe bentuk sediaan yang
mengandung suatu obat yang dirancang untuk pengobatan penyakit kardiovaskular (Tabel
3.1).
Ada beberapa tipe grafik atau plot yang umum digunakan untuk menampilkan data ilmiah,
dan tipe-tipe ini dibagi lagi menjadi beberapa kategori utama, yaitu:
Grafik atau plot yang digunakan untuk menjelaskan hubungan antara suatu variabel
tetap (bebas) dan suatu variabel terikat (dependen)
Grafik-grafik yang digunakan untuk menyajikan distribusi data dalam bentuk gambar
3.2.1 Grafik dan Plot yang Digunakan untuk Menggambarkan Hubungan antara
Variabel Bebas dan Variabel Terikat
Kategori umum yang digunakan dalam ilmu farmasi dan ilmu pengetahuan terkait: contohnya
ditunjukkan dalam Tabel 3.2. Ada beberapa variasi format yang digunakan untuk memplot
hubungan antara data, termasuk grafik garis, grafik pencar dan grafik batang dan lain-lain.
Kerja yg dibutuhkan untuk pengeluaran spuit (N mm) Kerja yg dibutuhkan untuk pengeluaran spuit (N mm)
400 400
300 300
200 200
100 100
0 0
0 5 10 15 20 0 5 10 15 20
Konsentrasi HEC (%b/b) Konsentrasi HEC (%b/b)
(a) (b)
Kerja yg dibutuhkan untuk pengeluaran spuit (N mm)
400
300
200
100
0 5 10 20
Konsentrasi HEC (%b/b)
Sering kali, data ilmiah menggambarkan suatu distribusi, misalnya tinggi pria di suatu daerah
geografis tertentu. Prosedur yang berbeda untuk penyajian grafik dari data ini, prosedur yang
paling umum adalah distribusi frekuensi dan distribusi frekuensi kumulatif, histogram dan
tampilan batang dan daun.
16
0 10 20 30
Waktu tinggal sten dalam tubuh pasien (minggu)
Gambar 3.4 Efek waktu tinggal dalam tubuh pasien terhadap kekuatan regangan akhir dari
sten ureter poliuretan (data diambil dari Gorman et al., 1997b)
Misalkan sekitar 210 tablet telah disisihkan secara acak dari sebuah bets produksi tablet dan
ditimbang (dalam desimal). Berat yang tercatat ditampilkan dalam Tabel 3.3. Berat tablet-
tablet ini dikelompokkan dalam interval pada Tabel 3.4, kemudian disajikan dalam bentuk
grafik.
Tabel 3.4 menyajikan distribusi frekuensi untuk sebuah variabel kuantitatif, yaitu berat
tablet. Berat tablet merupakan suatu variabel kontinu dan secara teoritis dapat memiliki nilai
numerik yang tidak terbatas antara titik terendah dan tertinggi pada suatu skala, dalam hal ini
290-309 mg. Pemilihan pengelompokan yang ditunjukkan dalam Tabel 3.4 dapat berubah dan
dipilih oleh orang yang bertanggung jawab atas pemeriksaan data. Berdasarkan tujuan studi
dari sensitivitas timbangan, persyaratan pengendalian mutu dsb, telah diputuskan bahwa 19
kelompok dipilih untuk mewakili kenaikan berat 900 g. Dalam statistik tentang penyusunan
distribusi frekuensi dikenal dengan cara sebagai berikut:
1. Tentukan rentang, di mana rentang = data terbesar dikurangi data terkecil
2. Tentukan banyak kelas interval, di mana banyak kelas interval dapat diambil dari 5
sampai dengan 15 interval atau dengan rumus:
Banyak kelas interval = 1 + 3,3 log n, di mana n adalah jumlah data
3. Tentukan panjang kelas interval dan disingkat p, di mana
=
4. Pilih ujung bawah kelas pertama dari batas bawah kelas interval
Contoh
Tabel 3.3 Berat 210 tablet yang disisihkan dari suatu bets produksi sbb:
290,2 294,1 296,4 297,5 298,5 298,4 299,5 299,5 300,2 303,5
290,5 295,4 296,5 297,6 298,6 298,5 299,5 299,8 300,4 303,8
291,5 295,4 296,8 297,4 298,5 298,6 299,6 299,9 300,4 304,1
291,8 295,4 296,5 297,5 298,7 298,4 299,3 300,1 300,5 304,5
292,4 295,8 296,4 297,1 298,3 298,1 299,8 300,1 300,5 304,6
292,8 295,6 296,8 297,4 298,4 298,6 299,4 300,2 300,8 305,1
292,6 295,1 296,1 297,5 298,6 298,3 299,8 300,5 301,2 305,9
292,7 295,3 296,1 297,6 298,4 298,4 299,1 300,4 301,5 305,6
293,4 295,8 296,5 297,1 298,6 298,5 299,2 300,5 301,4 305,4
293,5 295,5 296,4 297,1 298,2 299,1 299,6 300,5 300,5 306,9
293,6 296,5 297,2 297,4 298,2 299,2 299,5 300,9 301,5 306,8
293,8 296,1 297,5 297,7 298,1 299,8 299,6 300,8 301,8 307,1
293,7 296,5 297,7 297,8 298,4 299,5 299,4 300,9 301,6 307,6
293,8 296,4 297,8 297,6 298,2 299,6 299,5 300,8 301,5 308,5
294,1 296,8 297,6 297,4 298,6 299,8 299,4 300,5 301,6 302,1
294,5 296,9 297,4 297,8 298,5 299,4 299,3 300,9 303,1 302,5
294,6 296,9 297,1 297,5 298,5 299,8 299,5 300,9 303,2 302,5
294,8 296,9 297,3 297,5 298,3 299,3 299,8 300,8 303,6 302,7
294,6 296,2 297,6 297,3 298,3 299,3 299,4 300,8 303,5 302,8
294,8 296,5 297,4 298,4 298,3 299,6 299,5 300,4 303,5 302,2
294,3 296,8 297,1 298,3 298,1 299,4 299,1 300,2 303,4 302,7
Dari tabel 3.4 ini dapat dibuat histogram dan poligon sebagai Gambar 3.6 dan Gambar 37
40 frekuensi ( )
30
20
10
Untuk menentukan grafik poligon maka hubungkan titik titik tengah dari setiap diagram
batang pada Gambar 3.6 di atas. Selanjutnya kita buat grafik ozaiv dengan cara sebagai
berikut:
Tabel 3.5 Berat 210 tablet untuk Menggambar Ozaiv
Untuk menggambar grafik poligon dan Ozaiv (gambar sendiri atau Tugas)
Selanjutnya kita menghitung Rata rata () dari data yang telah disusun dalam daftar
frekuensi dengan rumus ditimbang adalah
=1
= =1
=
=1
dengan
adalah frekuensi interval ke i atau jumlah data dalam interval ke i
adalah nilai tengah dari interval ke i
Atau rumus rata rata ini dapat diselesaikan dengan rata rata kodinng dengan rumus sebagai
berikut:
= 0 + ( =1
)
=1
di mana
0
=
0 adalah nilai tengah pada koding 0
P adalah panjang kelas interval
Contoh
Dari tabel 3.4 Berat tablet dalam Tabel 3.3 adalah Tabel 3.6 sebagai berikut
Berat tablet (mg) Jumlah (frekuensi)
(Interval) ( ) xi fixi ci fici
290,1 291,0 2 290,55 581,1 -8 - 16
291,1 292,0 2 291,55 -7 - 14
292,1 293,0 4 292,55 -6 - 24
293,1 294,0 6 293,55 -5 - 30
294,1 295,0 8 294,55 -4 - 32
295,1 296,0 9 295,55 -3 - 27
296,1 297,0 21 -2 - 42
297,1 298,0 30 -1 - 30
298,1 299,0 32 0 0
299,1 300,0 36 1 36
300,1 301,0 24 2 48
301,1 302,0 9 3 27
302,1 303,0 7 4 28
303,1 304,0 8 5 40
304,1 305,0 3 6 18
305,1 306,0 4 7 28
306,1 307,0 2 8 16
307,1 308,0 2 9 18
308,1 309,0 1 308,55 10 10
Jumlah 210=n
Dari perhitungan dalam Tabel 3.6, hitunglah rata rata ditimbang dan rata rata koding
(latihan/ tugas)!
Selanjutnya kita menentukan pula Modus (Mo), Median (Me) dan Variansi ( 2 ) dan
simpangan baku (s) dalam data yang telah disusun dalam daftar distribusi frekuensi. Adapun
rumus dari Modus adalah
1
0 = + ( )
1 +2
dengan
b adalah batas bawah interval kelas modus
1 adalah selisih frekuensi kelas modus dengan kelas sebelumnya
2 adalah selisih frekunsi kelas modus dengan kelas sesudahnya
P adalah panjang kelas interval.
Kemudian untuk menentukan nilai median dalam data yang telah disusun dalam
daftar distribusi frekuensi dapat diselasaikan dengan rumus sebagai berikut
1
2
= + ( )
di mana
b adalah batas bawah interval kelas median
n adalah jumlah data atau jumlah frekuensi
F adalah jumlah frekuensi sebelum kelas median
f adalah frekuensi kelas median
p adalah panjang kelas interval
Unruk menentukan variansi sampel 2 pada data yang disusun dalam distribusi
frekuensi ini dapat diselesaikan dengan rumus sebagai berikut
=1 ( )
2
2 = 1
2
=1 (=1 )
2
2 = (1)
Juga ke dua rumus rumus di atas dapat pula diselesaiakn dengan koding terhadap data yang
disususn dalam daftar distribusi frekuensi adalah sebagai berikut:
2
=1 (=1 )
2
2 = 2 [ ]
(1)
Contoh
Dari Contoh pada Tabel 3.4 kita sajikan dalam Tabel 3.7 dapat menyelesaikan modus,
median variansi dan simpangan baku sebagai berikut:
Kita dapat mengisi nilai nilai pada tabel ini dan selanjutnya kita jumlahkan dan sesudah itu
kita masukan pada ketiga rumus variansi dan sesuai dengan rumusnya. Untuk mentukan
simpangan baku sama dengan menentukan simpangan pada data yang belum disususn
sebelumbya, yaitu = 2 dan semuanya anda selesaiakan sebagai latihan (tugas).
3.2.3 Plot batang dan daun.
Walaupun histogram dan distribusi frekuensi umumnya digunakan untuk penyajian data,
metode - metode ini juga mempunyai beberapa kekurangan. Misalnya, kualitas informasi
yang ditampilkan tergantung pada pemilihan interval kelas pelaksananya. Pemilihan interval
yang kurang tepat ini dapat berakibat terbentuknya ringkasan data yang tidak mencukupi.
Selain itu, dalam histogram tempat data dikelompokkan, nilai nilai numerik individual dari
tiap data akan hilang. Suatu metode yang tidak memiliki kekurangan ini adalah plot batang
dan daun. Dalam pendekatan ini tiap data secara numerik dibagi menjadi dua bagian, disebut
batang dan daun. Batang tersusun dari bilangan bulat yang di atur secara vertikal, sedangkan
daun daun dibentuk dengan menambahkan suatu unit pada bilangan bulat. Berlawanan
dengan pengaturan batang secara vertikal, sedangkan daun daun diatur diatur secara
horizontal, melekat pada bilangan induk. Pembentukan plot batang dan daun dapat disajikan
dalam Tabel 3.8, yang menampilkan tekanan darah sistolik dari suatu kelompok yang terdiri
atas 30 pria yang berusia antara 40 dan 50 tahun.
Tabel 3.8. Tekanan darah sistolik (mmhg) dari 30 pria berusia 40 50 tahun
Langkah pertama dalam pembentukan plot batang dan daun melibatkan pemilihan
batang, yang merupakan struktur utama plot. Bilangan bilangan bulat yang dipilih untuk
batang biasanya terdiri dari angka angka pertama data. Contohnya, untuk nilai pertama
dalam Tabel 3.8 (145 mmhg), batang yang sesuai adalah 14 dan untuk data terakhir dalam
tabel yang sama (162 mmhg) batangnya menjadi 16. Nilai nilai batang kemudian diatur
secara vertikal dengan meningkat. Untuk data yang diberikan dalam Tabel 3.8, batangnya
adalah sebagai berikut.
12
13
14
15
16
17
Untuk melengkapi plot batang dan daun, angka terakhir dari tiap nomor (daun) ditempatkan
secara horizontal melekat pada pengelompokkan batang yang terkait. Plot batang telah
dilengkapi untuk data dalam Tabel 3.8 ditunjukkan dalam Gambar 3.7. Plot batang telah
memberikan gambaran visual dari rangkaian data. Tentu saja dapat diamati bahwa data
tersebut agak simetris. Memperkirakan mentuk (simetrik) dari rangkaian data adalah salah
satu kegunaan utama dari plot batang dan daun.
`sebelum menyelesaikan konsep plot batang dan daun, ada dua hal yang perlu
dijelskan lebih jauh:
Pemilihan nilai numerik untuk batang tergantung pada kisaran ukuran kelompok data.
Dalam contoh yang berhubungan dengan Tabel 3.8, pemilihan batang telah
memastikan bahwa inteeval adalah 10 mmhg. Dalam kondisi tertentu, interval kelas
dapat dibagi lagi untuk mendapatkan suatu pemahaman yang lebih baik terhadap
distribusi data dalam batas batas data yang lebih kecil.
Untuk menggunakan data yang disajikan dalam Tabel 3.8 plot batang dan daun dapat
digambarkan kemali dengan mencakupinterval kelas yang lebih kecil, misalnya5 mmhg
(Gambar 3.7)
Batang Daun
12 0 4 5
13 1 3 8 8
14 0 2 4 5 6 8 9
15 0 4 4 6 7 8 8
16 0 1 2 4 5 8
17 1 5 8
Gaambar 3.7 Plot batang dan daun untuk data yang diberikan dalam Tabel 3.8 mengenai
tekanan darah sistolik 30 pria yang berusia 40 50 tahun. Gambar ini menggunakan interval
kelas sebesar 10 mmhg.
Apabila distribusi berasal dari ukuran sampel yang besar dan diplotkan menggunakan
interval yang yang terbatas, sejumlah morfologi yang berbeda dapat terbentuk. Bentuk
bentuk distribusi dapat dikelompokkan dengan cara cara berikut:
Bentuk distribusi dapat berupa unimodal (satu puncak), bimodal (dua puncak) atau
multimodal
Utuk distribusi unimodal, apakah simetrik (distribusi miring)? Suatu penting dari
yang simetrik, distribusi unimodal adalah distribusi normal akan dijelskan dalam bab
berikutnya.
Untuk distribusi distribusi simetrik, apakah distribusi miring ke kiri (positif) atau ke
kanan (negatif) ?
Ada distribusi distribusi lain yang tidak sesuai dengan klasifiksi di atas, misalnya distribusi
bentuk J dan distribusi bentuk J terbalik yang memiliki maksimum pada salah satu ujung
distribusi. Suatu contoh yang menarik dari distribusi bentuk J (miring) diperkenalkan oleh
Gorman at al (1996). Dalam studi ini, para penulis memeriksa efek dari agen antimikroba non
- anti biotik, klorheksidin glukonat, pada pelekatan patogen oportunistik Candida albicans
pada sel sel epitelial bukal, suatu sifat virulensiyang penting.
Dua lagi istilah penting yang digunakan untuk menjelaskan berbagai distribusi frekuensi
adalah kecondongan dan kurtosis. Kecondongan digunakan untuk mengukur derajat asimetri
suatu distribusi. Ada beberapa metode yang dapat digunakan untuk menghitung
kecondongan. Metode pertama dikenal koefisien kecondongan pertama Pearson adalah
sebagai berikut
Ukuran lain dari kecondongan, meliputi koefisien momen dari kecondongan, juga digunakan
dalam statistik, tetapi ukuran ini lebih kompleks dan diluar dari cakupan dari buku ini.
Kurtosis adalah karakterisasi dari kerapatan pengamatan pengamatan yang terdapat
dalam daerah daerah berbeda dari suatu distribusi
Distribusi normal standar adalah suatu distribusi frekuensi terdefinisi dan dijelaskan
sebagai mesokurtik. Sifat sifat dari distribusi ini dijelaskan lebih rinci dalam bab
berikutnya.
Jika bentuk puncak dari kurva normal adalah datar, yaitu data telah digeser dari pusat
da ekor ke daerah bahu kurva, distribusi disebut platikurtik
Kurva leptokurtik adalah kurva dengan daerah pusat diperpanjang dan kerapatan ekor
ekor menigkat.
Bab 4 Probabilitas dan Distribusi Probabilitas
Probabilitas dapat didefinisikan secara umum sebagai bagian ilmu matematika mengenai
perhitungan kemungkinan terjadinya suatu peristiwa. Meskipun probabilitas memiliki sifat
dasar matematik, penggunaan istilah ini telah menjadi suatu bagian terpadu dari pembicaraan
masa kini. Akibatnya, kita biasa mendengar atau menggunakan kata kata saya mempunyai
kesempatan 50% untuk lulus ujian ini dan lain sebagainya. Kebanyakan orang mempunyai
beberapa pemahaman dasar mengenai prinsip prinsip yang terlibat. Salah satu aplikasi teori
probabilitas yang paling umum dalam yang tidak ilmiah adalah dalam perjudian, dan
sesungguhnya, aplikasi ini memiliki pengaruh yang sangat besar pada perkembangan ilmu
probabilitas.
Pentingnya teori probabilitas pada analisis statistik tidak dapat diabaikan. Dalam ilmu
statistik yang dikenal sebagai statistik inferensial merupakan hal penting karena dapat
memberikan bebagai metode yang dapat digunakan untuk melakukan analisis komparatif dari
rangkaian rangkaian data. Statistik inferensial memungkinkan kita untuk memperkirakan
informasi mengenai suatu populasi besar berdasarkan analisis statistik terhadap sampel yang
lebih kecil dari populasi. Inti dari pelaksanaan statistik inferensial adalah pengetahuan
mengenai probabilitas.
Kebanyakan orang mempunyai kemampuan untuk menghitung beberapa aspek dasar dari
probabilitas; misalnya, misalnya sebuah koin dilempar, hanya ada dua hasilnya, kepala atau
ekor (muka atau belakang). Oleh karena itu, kemungkinan mendapatkan kepala pada satu kali
lemparan koin adalah 50%. Contoh contoh lain yang sering digunakan untuk
menggambarkan teori probabilitas termasuk probabilitas untuk mendapatkan suatu nomor
tetentu setelah pelemparan sebuah dadu, kemungkinan mengambil kartu tertentu dari
setumpuk kartu.
Teori probabilitas juga digunakan dalam bidang kefarmasian. Sebagai contoh, kinerja
suatu mesin pengisian injeksi yang baru dapat dipastikan dengan menyisihkan 500 vial berisi
produk dari bets produksi pertama suatu produk dan mengukur volume pengisian vial vial
tersebut untuk memeriksa apakah volume akhir berada dalam spesifikasi produk atau tidak.
Jika sejumlah 496 vial, yaitu 0,992 atau 99,2%, dibuktikan masuk dalam spesifikasi,
probabilitas volume pengisian memenuhi spesifikasi akhir adalah 0,992. Ini bukan
merupakan suatu nilai tetap melainkan hanya berupa suatu perkiraan probabilitas kinerja
pengisisan mesin baru tersebut.
Setelah mendapatkan penjelasan mengenai beberapa contoh sederhana, kita sekarang dapat
menyatakan beberapa aturan dasar yang digunakan untuk menghitung probabilitas.
Probabilitas terjadinya peristiwa harus berada antara 0 dan 1. Oleh karena itu, probabilitas
dengan nilai 1 mengindikasikan bahwa suatu peristiwa akan terjadi, sedangkan probabilitas 0
berarti suatu peristiwa tidak akan terjadi.
4.1.1.2 Perhitungan probabilitas
Probabilitas suatu peristiwa dihitung dengan membagi banyaknya cara atau jumlah terjadinya
suatu peristiwa dengan kemungkinan yang dapat terjadi. Jadi probabilitas dari munculnya
nilai 2, 3 dan 6 dalam satu lemparan dadu adalah 3/6 = 0,5.
Probabilitas terjadinya dua atau lebih oeristiwa yang saling terpisah dapat dihitung dengan
menjumlahkan probabilitas tiap peristiwa, Jadi, dalam keadaan ada dua peristiwa A dan B,
probabilitas (P) dari tiap peristiwa yang terjadi dapat ditulis dengan rumus
( ) = () + ()
Istilah saling terpisah berarti bahwa jika satu peristiwa terjadi, kejadian kejadian lainnya
tidak terjadi. Untuk menggambarkan prinsip ini, bayangkan sebuah skenaryo ketika 10 manik
manik berwarna ( 5 berwarna merah, 4 hijau dan 1 biru) ditempatkan dalam sebuah kotak
buram. Probabilitas pengambilan secara acak sebuah manik merah atau hijau dari kotak
tersebut dapat dihitung dengan menambahkan semua probabilitas individu untuk penarikan
tiap manik berwarna. Jadi,
Jadi kemungkinan mengambil salah satu dari manik berwarna merah atau hijau dari kotak
tersebut ada 90%. Ini merupakan situasi yang saling terpisah. Jika sebuah manik merah
dipilih, manik tersebut tidak dapat berwarna hijau atau biru waktu yang sama. Pemilihan
peristiwa peristiwa saling terpisah jangan sampei diabaikan; perincian percobaan harus
diperhatikan dengan hati hati.
Probabilitas terjadinya dua peristiwa bebas sekaligus dapat dijelaskan secara matematik
menggunakan aturan perkalian:
( ) = ()()
Penggunanaan aturan ini dapat dengan mudah ditunjukkan, menggunakan contoh tentang
pemilihan manik manik berwarna dari sebuah kotak buram di atas. Berapa probabilitas
pengambilan sebuah manik hijau dan biru dari kotak ? Dalam skenario pertama, manik
pertama diambil, warnanya dicatat, kemudian manik tersebut dikembalikan ke dalam kotak.
Untuk menghitung probabilitas gunakan rumus, yaitu
Contoh lain.
Bayangkan suatu hipotesis sampel apabila permainan lotere tersusun dari 40 nomor dan
penarikan dilakukan dengan mengambil 6 nomor secara acak tanpa pengembalian. Anda
mungkin berpikir untuk menghitung probabilitas dari penarikan 6 nomor dalam urutan
tertentu. Jawabannya cukup sederhana dan dihitung seperti dalam Tabel 4.1. Di sni Lotere
hanya memerlukan pemilihan 6 nomor tanpa persyaratan urutan tertentu.
Untuk menghitung probabilitas dua peristiwa yang tidak saling terpisah, kaidah penambahan
probabilitas yang dijelskan bagian 4.1.1.3 daapat digunakan, tetapi kaidah ini harus
diterapkan dalam bentuk yang dikoreksi untuk menerangkan tumpang tindih ke dua peristiwa
tersebut. Sebuah contoh, tenttang skenario ketika dua peristiwa tidak saling terpisah adalah
perhitungan probabilitas terhadap penarikan kartu raja maupun kartu wajik dari suatu
tumpukan kartu. Secara matematik rumus probabilitas yang tidak saling terpisah adalah
( ) = () + () ( )
dengan P(A) adalah probabilitas penarikan sebuah kartu raja, yaitu 4/52 = 0,077; P(B) adalah
probabilitas penarikan sebuah kartu wajik, yaitu 13/52 = 0,25; dan ( ) adalah
probabilitas penarikan raja wajik, merupakan peristiwa yang tidak saling terpisah.
Probabilitas kartu raja wajik adalah 1/52 = 0,019. Jadi probabilitas yang tidak saling terpisah
adalah
( ) = () + () ( )
Contoh 4.1
Pelabelan produk farmasi merupakan suatu komponen penting dari spesifikasi produk akhir
karena isi label memberikan informasi mengenai komposisi kimia dari produk, serta
penggunaan (dan keamanan) dan akuntabilitas produk. Misalkan anda bertanggung jawab
pada bagian pengendalian mutu dari sebuah perusahaan besar farmasi dan anda baru saja
diminta untuk menilai kualitas label suatu produk baru yang disediakan oleh sumber luar.
Untuk menilai kualitas sumber baru label, 1000 label telah disisihkan dari area karantina dan
penampakannya dicatat. Hasil temuan ditampilkan dalam Tabel 4.2. Hitunglah probabilitas
ditemukannya sebuah label yang cacat, baik karena kata kata yang tidak terbaca (karena
pencetakan) maupun pelekatan yang buruk.
Tabel 4.2 Penilaian pengendalian mutu dari suatu sampel label yang berasal dari suatu bets.
( ) = () + () ( )
45 15 10
= 1000 + 1000 1000 = 0,05.
Tabel 4.3 Probabilitas untuk nilai nilai numerik yang diperoleh dari pelemparan satu atau
dua dadu
Distribusi Probabilitas Diskret adalah distribusi yang menghitung dan menggambarkan secara
grafik probabilitas terjadinya peristiwa diskret. Untuk menjelaskan hal ini, pertama tama
pertimbangkan hasil numerik setelah pelemparan satu dadu dan dua dadu (tabel 4.3).
Distribusi probabilitas diskret yang akan dibahas disini adalah Distribusi binomial dan
distribusi Poisson.
Salah satu distribusi yang paling umum digunakan dalam ilmu kefarmasian dan biologi
adalah distribusi binomial. Distribusi ini digunakan bila hasil dari satu peristiwahanya terdiri
dari dua kategori. Suatu contoh dari peristiwa binomial telah dijelaskan sebelumnya, yaitu
pelemparan sebuah koin. Contoh lain dari data binomial meliputi:
Hasil dari penilaian pengendalian mutu, yaitu lulus atau tidak lulus
Sebuah formulasi baru dapat menghasilkan efek samping : menghasilkan efek positif
atau efek negatif
Distribusi jenis kelamin dalam satu populasi, hanya dua hasil, pria atau wanita
Prevalensi penyakit dalam suatu populassi: penyakitnya bisa ada atau tidak ada
Suatu obat baru dapat manjur atau tidak manjur secara klinis.
Selain persyaratan bahwa hanya ada dua hasil yang mungkin, tiap percobaan binomial
harus bebas, yaitu terjadinya satu peristiwa harus tidak mempengaruhi peristiwa peristiwa
selanjutnya.
Tabel 4.4. Kejadian efek samping pada 8500 pasien karena penggunaan klinis sebuah obat
anti hipertensi baru
Contoh 4.2
Dalam pembuatan produk farmasi, tablet tablet dari suatu bets dapat dikategorikan ke
dalam tablet yang lulus atau gagal melewati pengendalian mutu. Sebagai bagian dari proses
pengendalian mutu untuk suatu bets tablet, probabilitas untuk kategori lulus adalah 0,95
sedangkan probabilitas untuk kategori gagal adalah o,05. Hitunglah probabilitas pemilihan
Penyelesaian
a) Probabilitas pemilihan dua tablet cacat dalam satu sampel dapat dihitung dengan
menggunakan perkalian, yaitu (0,05)(0,05) = 0,0025
b) Probabilitas pemilihan dua tablet yang telah lulus pengendalian mutu adalah
(0,95)(0,95) = 0,9025.
c) Sedangkan untuk probabilitas pemilihan dua peristiwa yang tidak sama, yaitu satu
cacat dan satu lulus adalah 2(pq) = 2(0,05)(0,95) = 0,095.
Probabilitas pengamatan x (dalam suatu kategori tertentu) dalam suatu sampel yang
berukuran n yang telah diambil dari suatu distribusi binomial dapat ditulis secara matematik
sebgai berikut:
() = ( ) , x = 0,1, 2, ... , n
dengn merupakan probabilitas dari suatu sampel yang tersusun dari x pengamatan yang
memiliki probabilitas p, dan merupakan probabilitas dari suatu sampel yang terdiri
Contoh 4.3
Dengan menggunakan penguraian binomial dan mengacu pada Contoh 4.2, hitunglah
probabilitas pemilihan tiga tablet cacat dalam suatu sampel yang berisi tiga tablet.
Penyelesaian:
Dari Contoh 4.2 diketahui bahwa p (cacat) = 0,05, q (tidak cacat) = 0,95, n = 3 dan x = 3,
sehingga
3
( = 3) = ( ) (0,05)3 (0,95)33
3
3!
= 3!(33)! (0,05)3 (0,95)0
= 0, 000125
Pada soal yang sama, hitung probabilitas pemilihan empat tablet cacat dalam suatu sampel
yang berisi
1) Satu tablet
2) Dua tablet
Sebuah metode sederhana untuk membangun suku binomial adalah dengan
menggunakan segitiga pascal Tabel 4.5. Metode ini memberikan koefisien koefisien yang
membentuk suatu komponen terpadu dari penguraian binomial.
Tabel 4.6 Penguraian suku binomial, ( + ) , untuk nilai nilai tertentu dari eksponen, n
n Pengembangan dari ( + )
1 p+q
2 2 + 2 + 2
3 3 + 32 + 4 2 + 3
4 4 + 43 + 62 2 + 4 3 + 2
5 5 + 54 + 103 3 + 102 3 + 5 4 + 5
6 6 + 65 + 154 2 + 203 3 + 152 4 + 6 5 + 6
7 7 + 76 + 215 2 + 354 3 + 353 4 + 212 5 + 7 6 + 7
8 8 + 87 + 286 2 + 585 3 + 704 4 + 583 5 + 282 6 + 8 7 + 8
9
Probabilitas keberhasilan tergantung pada probabilitas peristiwa (p) dan ukuran sampel (n).
Kedua parameter ini yang menentukan distribusi binomial dan sebagai tambahan yang dapat
digunakan untuk menghitung probabilitas suatu hasil tertentu dari sejumlah percobaan
binomial.
Jumlah probabilitas
Jumlah semua probabilitas dari suatu percobaan binomial adalah sama dengan 1, seperti
dalam semua perhitungan probabilitas.
Distribusi binomial merupakan suatu distribusi probabilitas yang dihitung secara teoritis.
Probabilitas keberhasilan terhitung dari suatu peristiwa disebut sebagai rata rata hakiki.
Nilai nilai yang diamati diperoleh setelah percobaan adalah proporsi (rata rata sampel dan
merupakan perkiraan dari rata rata hakiki.
Variabilitas dari suatu variabel acak dalam suatu peristiwa binomial dapat dihitung dan
biasanya digambarkan sebagai simpangan baku. Pertama tama perhatikan perhitungan
simpangan baku untuk jumlah gambar kepala yang diamati setelah dua kali pelemparan
sebuah koin yang tidak bias. Hasil hasil yang mungkin adalah sebagai berikut:
Untuk menghitung rata rata, jumlah keberhasilan dikalikan dengan probabilitas semua
komponen di tambahkan:
Oleh karena itu, jumlah rata rata munculnya gambar kepala pada setiap pelemparan satu
koin adalah 1 gambar kepala.
Variansi dihitung dengan mengalikan probabilitas dari tiap peristiwa dengan kuadrat
dari selisih suatu peristiwa dengan rata rata dan kemudian menambahkan semua komponen
secara bersamaan. Jadi,
[{(0 1)2 0,25} + [{(1 1)2 0,5} + [{(2 1)2 0,25}] = 0,5 = 2
Meminimalkan variansi
Variansi suatu distribusi binomial akan diminimalkan, jika perbedaan antara p dan q
mempunyai nilai yang besar, yaitu 0,6. Untuk menunjukkan ini, misalkan suatu percobaan
binomial mempunyai probabilitas (a) p = 0,1, q = 0,9 dan (b) p = 0,5, q = 0,5 dan ada 10
sampel dalam tiap percobaan. Simpangan baku untuk tiap percobaan dapat dihitung
menggunakan persamaan di atas:
Penggunaan proporsi
Simpangan baku (dan variansi) dapat juga dihitung menggunakan proporsi dengan persamaan
berikut:
istilah matematik yang digunakan ini mempunyai pengertian yang sama dari sebelumnya.
Dengan menggunakan contoh yang sama, simpangan baku dapat dihitung:
0,50,5
(a) = = = 0,158
10
0,10,9
(b) = = = 0,095
10
Contoh 4.4
Penyelesaian
Pertama kita perhatikan bahwa kemungkinan untuk mengamati 2, berarti kita menghitung
probabilitas dengan cara [P(0), P(1) dan P(2)], dan selanjutnya dijumlahkan, yaitu:
100
( = 0) = ( ) = ( ) (0,01)0 (0,99)1000
0
100! 100!
= 0!(1000)! (0,366) = 0!100! (0,366) = (1)(1)(0,366) = 0,366
100
( = 1) = ( ) = ( ) (0,01)1 (0,99)1001
1
100! 100!
= 1!(1001)! (0,366) = 1!99! (0,01)(0,37) = (100)(0,01)(0,37) = 0,37
100
( = 2) = ( ) = ( ) (0,01)2 (0,99)1002
2
100! 100!
= 2!(1002)! (0,001)(0,373) = 2!98! (0,0001)(0,373) =
= (4950)(0,0001)(0,373) = 0,185
Jadi probabilitas keseluruhan adalah
() = (0) + (1) + (2) = 0,366 + 0,370 + 0,185 = 0,921
Dari soal di atas, hitunglah kemungkinan mengamati antara 2 samapai dengan 4 vial (2
4) dari suatu sampel yang berjumlah100 vial !
Distribusi Poisson merupakan distribusi data diskret lain yang digunakan untuk
menjelaskan kejadian acak bila probabilitas untuk mengamati suatu peristiwa bernilai
kecil. Distribusi Poisson mendekati distribusi binomial bila ukuran sampel besar dan
probabilitas dari suatu peristiwa tertentu bernilai kecil. Secara matematik, distribusi
Poisson rumusnya dapat ditulis dengan
() = = !
!
dengan P(x) adalah probabilitas terjadinya suatu peristiwa dalam suatu pengamatan
tunggal dan adalah bilangan rata rata kejadian ( = ).
Rata rata harus relatif kecil terhadap jumlah peristiwa yang mungkin terjadi per unit
pengambilan sampel (ruang atau waktu), artinya peristiwa peristiwa harus langka.
Peristiwa harus bebas.
Untuk menjelaskan penggunaan distribusi Poisson, perhatikan data yang disajikan Dalam
Tabel 4.10 mengenai perlekatan blastospora Candida albicans pada sel epitelial vagina secara
in vitro. Suatu distribusi Poisson cukup menjelaskan frekuensi pelekatan mikrobial pada sel
sel epitelial untuk sejumlah alasaan:
Bilangan rata rata blastospora yang melekat pada tiap sel epitelial rendah meskipun
sel epitelial memiliki suatu daerah permukaan yang jauh lebih besar dari pada sel ragi.
Diameter rata rata sebuah sel ragi adalah 4, sedangkan diameter rata rata
sebual sel epitelial vagina adalah sekitar 70.
Pelekatan blastospora pada sel epitelial adalah suatu peristiwa bebas, artinya
pelekatan ini tidak tergantung pada adanya blastospora lain. Selain itu, pelekatan
blastospora pada sel epitelial tidak dihambat oleh adanya blastospora yang melekat
sebelumnya.
Pertama tama, bilangan rata rata blastospora tiap sel epitelial dihitung
344
= 172 = 2,0
Tabel 4.8. Pelekatan blastospora Caandida albicans pada sel sel epitelial vagina, seperti
yang ditentukan menggunakan distribusi Poisson
Dalam persamaan Poisson, nilai rata rata (2,0) dilambangkan dengan suku dan ini
digunakan untuk menghitung prbabilitas teoritis dan frekuensi yang diharapkan (Tabel 4.8).
Frekuensi yang diamati sesuai dengan frekuensi yang diharapkan, dihitung menggunakan
persamaan Poisson. Untuk menjadi tepat secara statistik, frekuensi yang diamati harus
dipastikan sesuai dengan frekuensi yang diharapkan menggunakan uji goodness-of-fit
(kesesuaian) yang akaan dijelaskan dalam Bab 7. Dengan menganggap bahwa ada kesesuaian
yang baik antara frekuensi frekuensi yang diamati dan yang diharapkan, seseorang dapat
menyimpulkan bahwa perlekatan C. albicans pada sel sel epitelial vagina merupakan suatu
peristiwa yang bebas.
Oleh karena itu, distribusi Poisson berguna untuk menghitung probabilitas kejadian
suatu peristiwa yang langka. Banyak dari peristiwa ini terjadi dalam konteks kefarmasian,
misalnya pemilihan barang yang rusak dari suatu bets produksi produk farmasi, kematian
yang disebabkan oleh obat, atau patahnyaa keteter medis yang ditanam (misalnya sten ureter).
Contoh 4.5
Kecenderungan sten ureter untuk patah secara in vivo dilaporkan sebesar 0,5%. Hitunglah
probabilitas untuk satu sten ureter akan patah secara in vivo dalam suatu percobaan klinis 500
pasien.
Penyelesaian
Jadi, pobabilitas bahwa satu sten ureter akan patah dalam suatu percobaan klinis pada 500
pasien adalah 20,5%.
(500)(0,005)(0,082) = 0,205.
Perhitungan perhitungan ini menegaskan hubungan yang erat antara distribusi binomial dan
distribusi Poisson.
Dari soal diatas, hitunglah probabilitas untuk lebih kecil atau sama dengan 2 sten ureter akan
patah secara in vivo dalam suatu percobaan klinis 500 pasien !
4.2.3.1 Ringkasan Karateristik Karateristik dari Distribusi Poisson
Rata rata =
Variansi 2 =
Simpangan baku =
Perlu diketahui bahwa distribusi Poisson rata rata identik dengan variansi 2 .
Banyak distribusi tidak dapat dijelaskan dengan cara distribusi probabilitas diskret karena
variabelnya bersifat kontinu. Dalam contoh contoh tersebut, variabel dapat memiliki hasil
yang tidak terbatas dan akibatnya, probabilitas kejadian tiap peristiwa tunggal adalah nol.
Lebih jauh, karena sifat distribusi yang kontinu, probabilitas tidak mungkin ditetapkan pada
suatu nilai variabel yang pasti. Contohnya, dalam distribusi kontinu yang diberikan dalam
Tabel 3.3, tidak mungkin untuk menghitung probabilitas sebuah tablet akan mempunyai berat
300,9 mg karena nilai probabilitas ini sangat kecil. Namun, probabilitas suatu peristiwa yang
terjadi dalam suatu kisaran memungkinkan untuk dihitung. Jadi, dalam Tabel 3.3. dan 3.4
probabilitas untuk menemukan sebuah tablet dengan berat dalam kisaran 300,1 302,0 mg
mungkin untuk dihitung.
Ada bnyak contoh distribusi probabilitas kontinu dalam bidang farmasi dan biomedis.
Contoh berikut menjelaskan penurunan berat badan pada 11700 pasien setelah periode
pengobatan 12 bulan dengan sebuah obat baru (Tabel 4.11 dan Tabel 4.12).
Contoh 4.6
Sebuah cara baru dalam penanganan obesitas telah dikembangkan dan telah dievaluasi secara
klinik pada 11700 pasien. Penurunan berat badan pada tiap pasien setelah penanganan selama
12 bulan dengan cara penanganan ini telah dicatat dan ditabulasikan dalam Tabel 4.11 dan
4.12. Tampilan data dalam Tabel 4.11 dan 4.12 secara grafik sebagai distribusi frekuensi dan
sebagai fungsi kerapatan probabilitas.
Informasi yang ditampilkan dalam kedua tabel ini diperoleh dari studi klinik yang sama,
tetapi dengan diskripsi data yang berbeda, dalam hal ini interval kelas yang berbeda telah
dipilih dalam ke dua tabel: 6 kg dalam Tabel 4.11 dan 2 kg dalam Tabel 4.12.
Tabel 4.1.1 Distribusi data frekuensi penurunan berat badan pada 11700subjek, 12 bulan
setelah pemberian suatu obat baru
Kerapatan frekuensi relatif dapat didefinisikan sebagai frekuensi relatif tiap unit nilai ordinat
x. Sebagai contoh, dalam Tabel 4.1.1, kerapatan frekuensi relatif dapat diperoleh dengan
membagi frekuensi dengan 6 sehingga menunjukkan frekuensi relatif per kilogram.
Sebaliknya, frekuensi relatif dapat diperoleh dengan mengalikan kerapatan frekuensi relatif
dengan interval kelas.
Data yang ditampilkan dalam Tabel 4.11 dan Tabel 4.12 berasal dari studi klinis yang
sama, tetapi diatur dalam interval interval kelas yang berbeda untuk menggambarkan
pengaruh interval kelas, dan juga ukuran sampel pada bentuk distribusi yang dihasilkan.
Karena ini merupakan suatu fungsi probabilitas, total daerah di bawah kurva harus
sama dengan 1.
Fungsi kerapatan probabilitas memiliki rata rata, variansi dan simpangan baku.
Pada umumnya, rata rata terletak dalam daerah pusat umum. Daerah di bawah kurva
antara dua batas tertentu dapat dihitung dengan mengetahui rata rata dan simpangan
baku.
Meskipun beberapa fungsi kerapatan probabilitas dapat diperoleh dari perhitungan
probabilitas teoritis, secara umum variabel variabel yang dipelajari dalam ilmu
kefarmasian dan ilmu pengetahuan yang berkaitan bukan merupakan hasil dari situasi
situasi probabilitas yang sederhana. Oleh karena itu, bentuk pasti dari kurva
probabilitas diperoleh hanya setelah memplotkan data yang diperoleh dari percobaan.
Dengan meningkatnya jumlah pengamatan percobaan (yaitu ukuran sampel
meningkat), bentuk fungsi kerapatan probabilitas dan besarnya parameter parameter
kunci, misalnya rata rata, menjadi tidak bergantung pada ukuran sampel. Pada tahap
ini, pengamatan mempunyai karateristik dari suatu fungsi kerapatan probabilitas
tertent, yaitu distribusi normal.
Distribusi normal, sering disebut juga sebagai distribusi Gaussian, diperdebatkan sebagai
distribusi teoritis yang paling penting dalam statistika, dan mengakibatkan distribusi ini
digunakan dalam banyak uji statistik inferensial. Lebih jauh, banyak variabel yang ditemui
dalam ilmu kefarmasian dan ilmu pengetahuan yang berkaitan dianggap menampilkan suatu
distribusi normal, misalnya berat tablet dalam suatu bets, konsentarasi bahan aktif dalam
obat, berat atau tinggi orang orang. Jika seluruh populasi diperiksa dengan memperhatikan
suatu sifat (variabel) tertentu, distribusi yang dihasilkan akan normal. Banyak dari sifat sifat
di atas terdapat dalam teorema limit pusat, salah satu hasil mendasar dari statistik. Secara
singkat, teorema pusat menyatakan bahwa jika sejumlah besar sampel disisihkan dari
distribusi apa saja (yaitu variabel) dengan variansi dan rata rata yang terbatas, distribusi
variabel ntersebut cenderung normal. Dengan kata lain, jika ukuran sampel cukup besar , data
akan terdistribusi secara normal, tidak tergantung pada sifat dari distribusi tempat sampel
sampel yang disisihkan berasal.
Distribusi normal (diillustrasikan dalam Gambar 4.1) memiliki bentuk tersendiri dan
mempunyai ciri ciri berikut;
Berbentuk simetris
Berbentuk lonceng
X=
Memanjang dari
Mempunyai jumlah pengamatan yang tidak terbatas
Bentuknya ditentukan oleh rata rata dan simpangan baku
Rata rata, median dan modus secara numerik sebanding
Ada dua hal penting lainnya yang perlu diperhatikan mengenai distribusi normal.
Distribusi normal menrupakan suatu distribusi teoritis, yakni data percobaan tidak
akan benar benar memenuhi semua kriteria di atas, tetapi data tersebut akan sesuai
dengan deskripsi kenormalan. Sebagai contoh, data percobaan bersifat terbatas, bukan
tak terbatas.
Setiap distribusi normal unik secara numerik. Karenanya, distribusi normal tinggi pria
dalam suatu populasi akan berbeda dengan distribusi normal berat tablet dalam suatu
bets tablet. Akan tetapi, meskipun nilai rata rata dan simpangan baku akan berbeda
dari satu percobaan yang lain, bentuk kurva akan tetap sama, yaitu kurava akan
berbentuk lonceng dan simetrik.
Hal hal tersebut diillustrasikan dalam Gambar 4.2 dan Gambar 4.3.
(a)
(c) (b)
Gambar 4.2 Distribusi distribusi normal dengan nilai rata rata yang sama tetapi berbeda
nilai simpangan baku
Gambar 4.3 Distribusi distribusi normal dengan simpangan baku yang sama tetapi nilai rata
rata berbeda.
(a) mempunyai nilai rata rata terendah dan (c) mempunyai nilai rata rata tertinggi.
1 2
1
() = 2 2(
)
< <
dengan adalah rata rata, adalah simpangan baku dan e = 2,78128. Oleh karena itu,
persamaan ini menyatakan bahwa distribusi normal dapat mengadopsi kurva dalam jumlah
yang tidak terbatas, semuanya berbentuk lonceng dan simetris karena ada sejumlah nilai rata
rata dan simpangan baku yang tidak terbatas baku yang dapat dimiliki. Selain itu,
persamaan ini juga menegaskan bahwa dengan mengetahui rata rata dan simpangan baku
dari suatu distribusi, ordinat f(x) dapat dihitung untuk setiap nilai x. Dengan cara ini, plot
distribusi normal dapat dihasilkan. Niali nilai untuk hubungan antara simpangan baku dan
daerah di bawah kurva berikut sangat bermanfaatuntuk diingat:
Rata rata satu simpangan baku mencakup 68,27% dari semua nilai
Rata rata satu simpangan baku mencakup 95,45% dari semua nilai
Rata rata satu simpangan baku mencakup 99,73% dari semua nilai
50% dari semua nilai terletak antara rata rata 0,67 simpanga baku
95% dari semua nilai terletak antara rata rata 1,96 simpanga baku
99% dari semua nilai terletak antara rata rata 2,57 simpanga baku
Suatu hal yang ditekankan dalam bagian sebelumnya adalah kekhususan tiap distribusi
normal, masing masing memiliki rata rata dan simpangan baku yang khas. Oleh karena
itu, untuk menghitung probabilitas suatu peristiwa yang terjadi menggunakan masing
masing distribusi khas akan dibutuhkan perhitungan fungsi kerapatan probabilitas untuk
vaariabel tersebut, sebuah tugas yang sulit. Distribusi normal baku, suatu distribusi
umumyang memiliki nilai rata rata 0 dan simpangan baku 1, digunakan untuk mengatasi
kesulitan ini. Daerah di bawah kurva pada distribusi ini telah dihitung dan dapat digunakan
untuk memperkirakan probabilitas kejadian suatu peristiwa yang distribusi normal
lengkapnya belum dihitung. Metode untuk melakukan ini umumnya disebut sebagai
tranformasi z. Contoh contoh berikut menjelaskan mekanisme penggunaan transformasi z
untuk menetapkan jarak distribusi probabilitas normal dari suatu variabel x. Dengan angka
baku
=
Contoh 4.7
Suatu bets berisi 5000 tablet telah diproduksi dan konsentrasi bahan aktifnya diukur dalam
semua tablet. Rata rata () bets adalah 200 10 mg dan distribusi konsentrasi bahan aktif
terdistribusi secara normal. Hitunglah proporsi bets yang mengandung bahan aktif
Penyelesaian:
180200
= = = 2,00
10
Dari Tabel distribusi normal baku diperoleh proporsi tablet tablet yang mengandung
180 mg bahan aktif adalah z = - 2,00, sehingga luas daerah di bawah distribusi
normal baku (dari Lampiran Distribusi normal baku) dan probabilitasnya, yaitu 0,
0228. Ini merupakan probabilitas suatu tablet yang disampel secara acak dari bets
akan mengandung 180 mg atau kurang bahan aktif swbesar 2,28%.
Distribusi Student biasa disebut distribusi t, petama kali dijelaskan oleh William Sealy Gosset
tahun 1908 (yang menggunakan nama samaran Student) dan sejak saat itu telah digunakan
secara luas dalam analisis statistik. Distribusi t umumnya digunakan dalam analisis statistik
bila sampel berukuran kecil karena distribusi rata rata setelah pengambilan sampel tidak
benar benar sesuai dengan distribusi normal. Distribusi t dapat dihitung dengan mengambil
sampel dengan ukuran tertentu n dan diterapkan dengan persamaan sebagai berikut:
= /
dengan adalah rata rata sampel, adalah rata populasi, s adalah simpangan baku sampel
dan n adalah ukuran sampel
Kurva distribusi t
Contoh 4.8
Distribusi 2 di baca Chi Kuadrat) merupakan distribusi penting lainnya yang membentuk
suatu bagian terpadu dari beberapa prosedur statistik, misalnya uji 2 , uji kecocokan.
Distribusi ini dapat didefinisikan secara matematik sebagai
2 2
= 0 ( 2 )0,5(2) 0,5 = 0 2 0,5
dengan v adalah jumlah derajat bebas (db = v = n 1), 0 adalah konstanta yang tergantung
pada v dan 2 adalah statistik chi kuadrat. Luas daerah di bawah kurva sama dengan 1
Gambar Distribusi 2
Contoh 4.9.
Penyelesaian
Yang menarik, nilai z yang berasal dari suatu distribusi normal berhubungan dengan nilai
2 . Jika sebuah sampel (n = 1) diambil dari suatu distribusi normal, nilai 2 dapat dihitung
seperti
()2
2 = 2
dengan x adalah nilai numerik sampel, adalah rata rata populasi dan 2 adalah variansi
populasi. Jika proses ini diulangi berkali kali, sebuah plot kerapatan probabilitas nilai 2
dapat dihasilkan. Bentuk plot ini identik dengan distribusi 2 (db = 1) dan biasa ditulis 2 =
12 .
4.2.4.6 Distribusi F
Distribusi F merupakan distribusi penting lainnya dalam statistik inferensial. Distribusi ini
berasal dari distribusi pengambilan sampel dengan rasio dua perkiraan bebas variansi yang
berasal dari distribusi normal. Secara khusus, misalkan dua sampel dengan ukuran yang yang
diketahui telah diambil dari dua distribusi normal dengan variansi variansi tertent; statisti F
dapat dinyatakan sebagai
2 /( 1)2
= 1 12 /(1 1)12
2 2 2 2
(1 ,2)
Contoh 4.10
Penyelesaian
Jika suatu studi dari suatu bets pilot (bets percontohan) berisi tablet (N = 5000) telah dibuat
dan berat tiap tablet diperiksa setelah pengempaan menggunakan timbangan otomatis.
Selanjutnya, analis mengambil dua sampel tablet (n = 10) dari bets pilot dan sekali lagi tiap
tablet ditimbang. Statistik deskriptif untuk tiap kelompok disajikan dalam Tabel 5.1.
Perbedaan dalam besarnya statistik populasi dan statistik sampel dapat disebabkan
oleh variabilitas. Statistik populasi bersifat pasti (tetap) karena ditentukan dengan mengacu
pada tiap anggota populasi secara keseluruhan. Sebaliknya, statistik sampel bersifat khas
untuk sampel itu, yaitu kelompok yang terdidri dari 10 tablet dalam contoh di atas. Ketidak
sesuaian yang diamati antara statistik sampel dan statistik populasi merupakan akibat
variabilitas yang disebabkan oleh kebetulan dan ini disebut sebagai kesalahan pengambilan
sampel (sampling error). Dalam konteks ini, kesalahan tidak berarti teknik pengambilan
sampel yang tidak tepat atau teknik percobaan yang kurang baik, tetapi seringkali
menggambarkan efek dari hasil individual pada statisti deskriptif yang berkaitan dengan
suatu sampel.
Untuk menjelaskan prisip prinsip ini lebih jauh, kita dapat menggunakan contoh
berat dua sampel tablet yang berasal dari suatu bets dan juga juga berat semua tabletdalam
Tabel 5.1. Tampak jelas dari data bahwa rata rata dan simpangan baku sampel tidak identik
dengan rata rata dan simpangan baku populasi, yaitu parameter parameter populasi
sebenarnya. Akibatnya, satu pertanyaan dapat muncul berkenaan dengan validitas data
sampel, misalnya apakah nilai rata rata yang berkaitan dengan sampel sampel berbeda
dengan rata rata populasi ? Sebagai alternatif, sesearang dapat beranggapan bahwa rata
rata sampel adalah perwakilan dari rata rata populasi dan oleh karena itu perbedaan yang
diamati antara rata rata sampel dan rata rata populasi dapat dikatakan sebagai kesalahan.
Untuk memperkuat (menolak) anggapan ini, distribusi pengambilan sampel dari rata rata
sebaiknya diperiksa. Statistik populasi menyatakan bahwa rata rata dan simpangan baku
masing masing adalah 250,0 dan 4,5 mg. Distribusi pengambilan sampel dari rata rata
ditetapkan dengan mengambil sejumlah besar sampel dari populasi, tiap sampel mengandung
10 anggota (tablet). Rata rata tiap sampel dihitung dan distribusi frekuensi ditetapkan
dengan memplotkan frekuensi terhadap variabel kontinu seperti Gambar 5.1
Tabel 5.1 Statistik deskriptif untuk berat tablet dalam suatu bets (populasi) keseluruhan dan
dua sampel yang berasal dari bets populasi
menentukan probabilitas pengambilan suatu sampel dari populasi dengan rata rata sampel
tertentu. Persamaan yang digunakan untuk menghitung statistik z adalah
=
dengan adalah rata rata sampel, adalah rata = rata populasi dan adalah simpangan
baku populasi. Kesalahan pengambilan sampel dalam trnsformasi z, ( ), dibagi dengan
simpangan baku populasi karena hal ini menghubungkan kesalahan pada variabilitas.
Untuk sampel 1,
253,6250,0
= = = 0,8
4,5
Dari tabel distribsi normal mempunyai probabilitas sebesar 0,7881. Karena probabilitas
pengamatan suatu rata rata sampel sebesar 253,6 mg atau kurang adalah 78,81%, sehingga
disimpulkan bahwa ini merupakan suatu peristiwa yang mungkin terjadi atau kita
menganggap bahwa rata rata sampel adalah perwakilan dari rata rata populasi.
Dari distribusi normal terbakukan, nilai z = 0,58 berhubungan dengan probabilitas sebesar
0,7190. Ini melambangkan probabilitas pengamatan suatu rata rata sampel sebesar 252,6
mg atau kurang.
Jika kita mengambil sampel ke tiga dari tablet tablet tersebut diambil pada tahap
tahap akhir proses pentabletan dan berat tablet dalam sampel tersebut ditentukan seperti
sebelumnya, yaitu rata rata berat tablet adalah 235,7 mg. Apakah rata rata sampel
merupakan perwakilan dari rata rata populasi ? Pertanyaan ini dapat dijawab dengan yang
sama, yaitu
235.7250,0
= = = 3,18
4,5
Dari distribusi normal terbakukan dapat dilihat statistik z dengan hubungan suatu probabilitas
sebesar 0,0007. Hal ini menyatakan bahwa kemungkinan suatu sampel berisi 10 tablet yang
memiliki berat rata rata 235,7 mg yang diambil dari suatu populasi dengan sebenarnya
250,0 4,5 mg sebesar 0,07%. Berkaitan dengan rendahnya probabilitas peristiwa ini, dapat
disimpulkan bahwa sampel ini bukan merupakan perwakilan dari rata rata bets tablet
tablet populasi, atau secara alternatif, sampel ternyata berasal dari populasi lain.
Skenario yang dijelskan di atas mengenai persamaan dan perbedaan antara statistik sampel
dan populasi membawa kita ke dalam mekanisme pengujian hipotesis statistik. Sebelum
pengumpulan ke tiga sampel dari bets tablet tersebut, dianggap bahwa rata rata dari ke tiga
sampel tersebut seharusnya mewakili rata rata populasi. Anggapan ini umumnya disebut
sebagai hipotesis nol dan merupakan posisi awa2l dalam pengujian hipotesis statistik. Alasan
untuk posisi ini ada dua:
Pertama sangat sulit untuk membuktikan bahwa sesuatu itu benar, tetapi lebih mudah
untuk membuktikan bahwa sesuatu itu salah. Contohnya, seseorang dapat
beranggapan bahwa, dalam suatu peristiwa olahraga, suatu tim tertentu akan selalu
menang, karena tim ini belum terkalahkan dalam kurun waktu 5 tahun. Namun,
mungkin saja tim ini akan tampil buruk pada hari tertentu dan kemudian kalah,
sehingga membuat anggapan awal menjadi tidak valid.
Ke dua untuk menggunakan suatu hipotesis nol, yang merupakan titik awal untuk
memudahkan analisis selanjutnya yang merupakan suatu hipotesis yang ditetapkan
untuk satu tujuan, yaitu ditolak. Karenanya, lebih mudah anggapan bahwa rata rata
sampel merupakan perwakilan rata rata populasi, dan oleh karena itu secara statistik
sama dengan rata rata populasi, dari pada untuk beranggapan bahwa rata rata tidak
mewakili dan berbeda dari rata rata populasi pada suatu jumlah tertentu.
Pengujian hipotesis statistik merupakan suatu ukuran apakah hipotesis nol diterima
atau ditolak. Jika hipotesis nol ditolak, hipotesis alternatif diterima. Hipotesis altenatif
umumnya merupakan dasar operasional dari hipotesis penelitian. Kembali ke contoh
berkenaan dengan berat tablet, kita telah diminta untuk mengidentifikasi apakah rata rata
sampel berbeda dari rata rata populasi. Oleh karena itu, hipotesis nol dan hipotesis alternatif
dapat dinyatakan sebagai berikut.
Hipotesis nol (0 ): tidak ada perbedaan antara rata rata sampel dan rata rata
populasi (0 : = 0 )
Hipotesis altenatif ( 1 ): ada perbedaan antara rata rata sampel dan rata
rata populasi ( : 0 )
Setelah analisis statistik lengkap (sesuai dengan desain percobaan), hasil hasilnya lalu
dinyatakan sebagai penerimaan dan penolakan hipotesisi nol.
5.1.2 Mendefinisikan aras nyata (level of significance) atau taraf arti dan daerah
kritis penerimaan dan penolakan hipotesis nol
Bagian pengendalian mutu dari suatu perusahaan farmasi telah menyatakan bahwa
beberapa bets sediaan antasida perusahaan tersebut gagal melewati uji kemanfaatan
pengawet, seperti yang ditetapkan oleh British Pharmacopoeia. Bagian formulasi telah
disarankan untuk memformulasi kembali produknya, sedemikian sehingga produk yang baru
mengandung kurang dari 1` 102 mikroorganisme/ml setelah penyimpanan pada suhu 20
selama 2 minggu. Berdasarkan hal tersebut bagian formulasi telah memproduksi formulasi
baru untuk dinilai kemanjuran pengawetnya. Hasil hasilnya, ditampilkan sebagai jumlah
mikroorganisme yang bertahan hidup dalam 10 botol, ditunjukkan dalam Tabel 5.2.
Dalam situasi ini, hipotesis nol ditetapkan sebelum pengumpulan data, dan dapat
dinyatakan sebagai berikut: tidak ada perbedaan antara rata rata yang diharapkan (100
mikroorganisme /ml) dan rata sampel, artinya 0 : = 100. Sebaliknya, hipotesis alternatif
menyatakan bahwa ada suatu perbedaan negatif antara rata rata sampel yang diamati dan
rata rata yang diharapkan, dan produk baru tersebut memenuhi spesifikasi British
Pharmacopoeia, artinya : < 100 mikroorganisme/ml.
Satu satunya hal yang diinginkan penyidik dalam analisis ini adalah untuk
mengetahui apakah kandungan mikroba rata rata dari formulasi baru lebih rendah daripada
rata rata yang ditentukan (diharapkan). Karena hanya ada satu hasil yang diinginkan, uji ini
disebut uji satu arah.
Sebagai alternatif, ahli formulasi dalam percobaan di atas mungkin ingin mengetahui
lebih banyak mengenai kinerja formulasi tersebut. Dalam kasus ini, penting untuk
mengetahui apakah formulasi baru lulus atau gagal memenuhi rekomendasi farmakope. Jelas,
jika kandungan mikroba lebih besar daripada baku, produk tersebut telah gagal memenuhi
spesifikasi yang disetujui. Hal ini akan tetap memberikan informasi yang berguna mengenai
arah dari program formulasi ulang, kemungkinan besar mengidentifikasi pengawet
pengawet yang tidak efektif. Hipotesis nol dalam situasi ini identik dengan contoh
sebelumnya, yaitu tidak ada perbedaan antara rata rata yang diharapkan (100
mikroorganisme/ml) dan rata sampel, dalam hal ini, 0 : = 100 mikroorganisme/ml.
Namun, hipotesis alternatif telah berubah, dan sekarang ditetapkan sebagai: ada perbedaan
antara rata rata yang diharapkan (100 mikroorganisme/ml) dan rata rata yang diamati,
yaitu : 100 mikroorganisme/ml. Sumber perbedaan ini ada dua, yaitu perbedaan
mungkin disebabkan oleh rata rata sampel yang lebih besar atau kurang dari rata rata yang
diharapkan. Pada kondisi ini hasil dari analisis memiliki dua arah karena ada dua
kemyngkinan hasil yang akan berakibat pada penolakan hipotesis nol.
Kepututusan mengenai apakah sattistik uji harus dievaluasi sebagai uji satu arah atau
dua arah merupakan hal yang sangat penting. Pemilihang yang tidak tepat akan berakibat
pada penafsiran analisis statistik yang tidak tepat karena suatu perbedaan yang nyata antara
pengobatan dapat dinyatakan tidak nyata dan sebaliknya.
Pada gamabar gambar di bawah ini akan kita dapat tentukan daerah - daerah kritis suatu uji
hipotesis, yaitu
/2 1 = /2
/2 /2
Gambar 5.2 Distribusi normal terbakukan menunjukkan daerah kritis (diarsir) statistik z
untuk uji dua arah
Gambar 5.3 Distribusi normal terbakukan menunjukkan daerah kritis (diarsir) statistik z
untuk uji satu arah positif
1-
Gambar 5.4 Distribusi normal terbakukan menunjukkan daerah kritis (diarsir) statistik z
untuk uji dua arah
Pada daerah 1 disebut daerah tidak nyata, yaitu suatu daerah penerimaan
hipotesis, di mana dalam daerah ini nanti apabila kita mendapatkan nilai statistik uji terletak
pada daerah penerimaan (1 ) di bandingkan dengan nilai tabel maka 0 diterima yang
berarti ditolak. Sebaliknya, jika nilai statistik daerah disebut daerah nyata, yaitu suatu
daerah penolakan hipotesis, di mana dalam daerah ini nanti apabila kita mendapatkan nilai
statistik uji terletak pada daerah peolakan ( ) di bandingkan dengan nilai tabel maka 0
ditolak yang berarti diterima.
Pada uji hipotesis dua arah aras nyata (taraf nyata), yaitu dibagi 2 menjadi dua
bagian, /2 pada kiri dan /2 pada bagian kanan Gambar 5.2. Sebaliknya uji uji satu arah
dapat dilihat pada Gambar 5.3 dan Gambar 5.4 dengan taraf nyata .
5.2 Kesalahan Dalam Pembuatan Keputusan (Kesalahan Tipe I dan Tipe II)
Ada dua tipe kesalahan, kesalahan tipe I dan kesalahan tipe II dapat terjadi ketika
menentukan hasil dari percoabaan statistik. Perbedaan antara ke dua kategori kesalahan ini
dan kepentingannya dapat dijelaskan dengan menacu pada situasi hipotesis berikut. Dalam
suatu studi klinis, efek suatu -bloker terhadap penurunan tekanan darah sistolik pada 100
pasien diperiksa. Penurunan (SD) didapat sebesar 30 3 mmhg dan distribusi
pengambilan sampel penururnan tekanan darah ditunjukkan dalam Gambar 5.5. Dalam
gambar ini hipotesis nol ditunjukkan daerah yang tidak diaarsir. Daerah yang diarsir
melambangkan 5% distribusi atas. Biasanya, dalam pengujian hipotesis statistis, setiap
sampel yang dicatat dalam daerah ini akan mengarah pada penolakan hipotesis nol.
Namun, hal ini agak aneh, karena ini diketahui sebagai suatu respon yang normal, yaitu
setiap distribusi dari suatu variabel tertentu akan mempunyai arah atas dan bawah.
Probabilitas melakukan kesalahan tipe I dilambangkandengan . Oleh karena itu,
probabilitas melakukan kesalahan tipe I sebenarnya merupakan probabilitas penolakan
hipotesis nol.
34,95mmhg
Gambar 5.5 Distribusi pengambilan sampel pada penurunan tekanan darah distolik ( = 30
mmhg, =3 mmhg)
30
= maka 1,65 = , sehingga x 30 = (1,65)(3) = 4,95
3
Karena itu, pada taraf nyata tertentu, setiap nilai yang diamati bernilai 34,95 mmhg akan
berakibat pada penolakan hipotesis nol.
Jika selanjutnya, dianggap bahwa hipotesis nol tersebut salah dan, sesuai dengan
hipotesis alternatif diterima, masalah masalah yang berkaitan dengan kesalahan kesalahan
tipe II dapat dijelaskan. Dalam Gambar 56 b kita dapat melihat distribusi pengambilan
sampel yang menggambarkan hipotesis alternatif dengan rata rata dan simpangan baku
sebesar 37 3 mmhg
(a)
=0,05
= 0,25
Gambar 6 Distribusi pengambilan sampel dari rata rata penurunan tekanan darah setelah
pemberian -boker (a) Penurunan tekanan darah untuk hipotesis nol, daerah yang diarsir
menunjukkan probabilitas melakuakan kesalahan tipe I ( = 0,05). (b) Penurunan tekanan
darah untuk hipotesis alternatif, daerah yang diarsir menunjukkan probabilitas kesalahan tipe
II (b). Kembali ke contoh, hipotesis alternatif tersebut normal, mempunyai ekor pada tiap
distribusi. Dalam Gambar 5.6 a, probabilitas untuk membuat kesalahan tipe I, yaitu
penolakan hipotesis nol bila hipotesis nol benar, dilambangkan dengan daerah yang diarsir.
Daerah yang dirsir dalam Gambar 5.6 b melambangkan probabilitas untuk melakukan
kesalahan tipe II, yaitu menerima hipotesis nol padahal hipotesis ini seharusnya ditolak.
Akibatnya, dalam distribusi pengambilan sampel yang berkaitan dengan hipotesis nol, daerah
yang diarsir menunjukkan probabilitas pemilihan suatu nilai rata rata penurunan tekanan
darah yang akan terletak dalam daerah bukan penolakan hipotesis nol, ditetapkan sebesar <
34,95 mmhg. Oleh karena itu, daerah yang diarsir dalam Gambar 5.6 b mendefinisikan
daerah distribusi pengambilan sampel sampel (untuk hipotesis alternatif) yang berada di
bawah 34,95 mmhg. Daerah dari daerah ini dapaat dihitung menggunakan suatu trensformasi
z, sebagai berikut.
34,9537
= , maka = = = 0,68
3
Mengacu pada distribusi normal terbakukan, dapat dilihat bahwa probabilitas yang
berhubungan dengan nilai z hitung adalah 0,2514, karena itu, dalam contoh di atas =0,05
dan = 0,25
Suatu ringkasan dari hubungan saling mempengaruhi antara kesalahan tipe I dan tipe
II, serta peranan keduanya dalam proses pembuatan keputusan statistik ditunjukkan dalam
Tabel 5.3.
Ada beberapa konsekuensi berbeda dari kesalahan tipe I dan tipe II yang
mencerminkan hasil hasil yang berbeda bila hipotesis nol diterima atau ditolak. Jika
hipotesis nol ditolak, hipotesis penelitian diterima dan akibatnya sebuah usulan telah diubah
dari pemikiran menjaadi pengamatan. Namun, jika hipotesis nol telah ditolak padahal
kenyataannya benar, kesalahan tipe I telah dilakukan dan mengakibatkan suatu kesimpulan
yang tidak tepat telah dibuat. Sebaliknya penerimaan hipotesis nol bila sebenarnya salah akan
berakibat pada penolakan suatu hipotesis penelitian yang dapat diterima secara sempurna.
Keadaan ini menyoroti bahaya bahaya potensial dari kesalahan statistik dalam pembuatan
keputusan.
Tabel 5.3 Ringkasan hubungan antara hasil statistik dan kesalahan statistik
Pertama, analis mungkin telah menerima (tidak menolak) hipotesis nol dan karenanya,
keputusan yang benar telah didapatkan.
Sebaliknya, analis mungkin telah menyimpulkan bahwa hipotesis nol harus ditolak
sehingga membuat kesalahan tipe I ().
Kesalahan kesalah terdapat dalam semua pengujian hipotesis statistik, dan dengan
berusaha untuk mengurangi satu jenis kesalahan, kemungkinan jenis kesalahan yang lain
akan meningkat. Maka tepat kiranya untuk memberikan saran mengenai batas tiap jenis
kesalahan yang dapat diterima dalam pengujian hipotesis statistik Biasanya, kesaalahan tipe I
() dipilih sebesar 0,05, karena nilai ini dianggap sebagai probabilitas yang cukup kecil untuk
melakukan kesalahan tipe ini, sementara tidak terlalu kecil sehingga dengan keliru justru
meningkatkan probabilitas terjadinya kesalahan tipe II ().
Dalam statistik, hubungan antara pembuatan keputusan statistik dan kesalahan sering disebut
dengan istilah kekuatan dari suatu studi. Khususnya, kekuatan suatu uji statistik dapat
didefinisikan sebagai probabilitas ditolaknya hipotesis nol bila hipotesis tersebut sebenarnya
salah. Dengan mengingat kesalahan tipe II () dapat didefinisikan sebagai probabilitas untuk
tidak menolak hipotesis nol bila seharusnya ditolak, kekuatan dinyatakan sebagai 1 . Jadi
dalam contoh mengenai penurunan tekanan darah, kekuatan uji statistik adalah sebesar 1
0,25, atau 75%. Kekuatan uji statistik, probabilitas untuk menhindari suatu kesalahan tipe II,
meningkat jika perbedaan antara hipotesis nol dan hipotesis alternatif meningkat.
Kekuatan suatu uji statistik merupakan suatu pertimbangan penting dalam setiap rancangan
percobaan. Memaksimalkan kekuatan dari uji statistik akan menghasilkan kepercayaan yang
lebih besar terhadap ketepatan suatu hasil statistik. Besarnya kekuatan suatu studi
dipengaruhi beberapa faktor
Suatu pemahaman tentang sifat sifat dari pengaruh variabel di atas terhadap kekuatan suatu
uji statistik ini penting untuk menjamin bahwa rancangan percobaan mampu dilaksanakan.
Jika probabilitas melakukan kesalahan tipe I () sengaja dikurangi, misalnya untuk menjamin
kendali yang lebih besar terhadapa nilai kritis yang berhubungan dengan penolakan hipotesis
nol, probabilitas melakukan suatu kesalahan tipe II meningkat. Pengaruh dari besarnya
pada hasil akhir probabilitas pembuatan kesalahan tipe II dapat digambarkan dengan
mengacu pada Gambar 5.6. Seperti dalam contoh ini distribusi pengambilan sampel yang
berhubungan dengan penurunan tekanan darah setelah pemberian suatu -bloker bersifat
normal dan mempunyai rata rata dan simpangan baku tertentu (30 3 mmhg). Dalam
gambar ini kesalahan tipe I dipilih sebesar 0,05 (satu arah) dan nilai kritis statistik z yang
menetapkan penolakan hipotesis nol dihitung sebesar 34,95 mmhg. Oleh karena itu, nilai
nilai yang disampel yang sama atau lebih besar dari nilai kritis ini dianggap berasal dari
distribusi normal yang berbeda dengan yang dijeaskan oleh hipotesis nol.
Jika kita memilih nilai nilai sebesar 0,10 dan 0,01, nilai nilai kritis dari
penurunan tekanan darah yang menegaskan penolakan masing masing hipotesis nol
dihitung sebgai berikut
Diketahui dari lampiran tabel distribusi normal bahwa z = 1,28, sehingga nilai kritis dari
penurunan tekanan darah dapat dihitung menggunakan statisti z ini
30
= atau 1,28 =
3
Jadi x = 33,84 mmhg
Dengan cara yang sama bahwa dari lampiran tabel distribusi normal bahwa z = 2,33,
sehingga nilai kritis dari penurunan tekanan darah dapat dihitung menggunakan statisti z ini
30
= atau 2,33 =
3
Seperti sebelumnya, dengan menganggap hipotesis nol ditolak dengan rata rata dan
simpangan baku distribusi pengambilan saampel untuk hipotesis alternatif secara berurutan
adalah 37 3 mmhg, probabilitas pengamatan suatu kesalahan tipe II dapat dihitung
(Gambar 57 dan 5.8). Seperti sebelumnya, menurunkan besarnya kesalahan tipe I akan
menurun, akan tetapi kesalahan tipe II dapat meningkat. Nilai dapat dihitung menggunakan
taransformasi z.
33,8437,00
= = 1,05
3
Nilai z ini mengacu pada probabilitas pengamatan rata rata penurunan tekanan darah yang
kurang atau sama dengan 33,84 mmhg, yaitu 0,1469. Ini merupakan probabilitas melakukan
suatu kesalahan tipe II. Maka kekuatan uji ini adalah 1 0,1469 = 0,8531
(a) = 0,10
(b) = 0,14
36,9937,00
= = 0,0003
3
Nilai z ini mengacu pada probabilitas pengamatan rata rata penurunan tekanan darah yang
kurang atau sama dengan 36,99 mmhg, yaitu 0,50. Ini merupakan probabilitas melakukan
suatu kesalahan tipe II. Maka kekuatan uji ini adalah 1 0,50 = 0,50.
(a)
= 0,01
(c) = 0,50
Gambar 5.8 distribusi pengambilan sampel dari rata rata penurunan tekanan darah setelah
pemberian suatu -bloker : (a) Penurunan tekanan darah untuk hipotesis nol, daerah yang
diarsir mengambarkan probabilitas yang berhubungan dengan kesalahn tipe I ( = 0,01). (b)
Penurunan tekanan darah untuk hipotesis alternatif 37 3 mmhg (rata rata simpangan
baku), daerah yang diarsir menggambarkan probabilitas kesalahan tipe II ().
5.3.1.2 Besarnya Perbedaan Antara Rata Rata Hakiki (Hipotesis Alternatif) dan
Rata rata pada Hipotesis Nol
Kekuatan yang didefinisikan sebagai probabilitas ditolaknya hipotesis nol bila hipotesis ini
memang salah. Oleh karena itu, kekuatan studi berbanding lurus dengan perbedaan antara
rata rata hipotesis alternatif dan rata hipotesis nol. Meningkatnya perbdedaan antara ke
dua parameter ini akan meningkatkan suatu studi. Pengaruh dari peningkatan perbedaan
antara nilai rata rata untuk hipotesis altenatif dan hipotesis nol terhadap kekuatan yang
Tabel 5.4 Ringkasan pengaruh tingkat terpilih terhadap probabilitas melakukan kesalahan
tipe II dan kekuatan studi yang dihasilkan untuk contoh yang digambarkan dalam Gambar 5.6
6.8
hihasilkan ditampilkan dalam Gambar 5.9 5.11. Dalam gambar gambar ini aras nyata
yang dipilih, yaitu probabilitas melakukan kesalahan tipe I, dipertahankan pada nilai 0,05.
Berdasrkan nilai yang dipilih ini, hipotesis nol dapat ditolak jika nilai yang diamati sama
atau lebih besar dari nilai kritis penurunan tekanan darah, yaitu 34,95 mmhg. Dalam Gambar
5.9 a, 5.10 a, dan 5.11 a daerah ini diarsir. Selanjutnya, probabilitas melakukan suatu
kesalahan tipe II dapat dihitung menggunakan suatu teransformasi z, seperti sebelumnya.
(a)
= 0,05
(b)
= 0,63
Gambar 5.9 distribusi pengambilan sampel dari rata rata penurunan tekanan darah setelah
pemberian suatu -bloker : (a) Penurunan tekanan darah untuk hipotesis nol, daerah yang
diarsir mengambarkan probabilitas yang berhubungan dengan kesalahn tipe I ( = 0,05). (b)
Penurunan tekanan darah untuk hipotesis alternatif, daerah yang diarsir menunjukkan
probabilitas kesalahan tipe II (). Nilai rata rata SD masing maing adalah 30 3 dan
34 3 mmhg.
(a)
= 0,05
(b) = 0,25
Gambar 5.10 distribusi pengambilan sampel dari rata rata penurunan tekanan darah
setelah pemberian suatu -bloker : (a) Penurunan tekanan darah untuk hipotesis nol, daerah
yang diarsir mengambarkan probabilitas yang berhubungan dengan kesalahn tipe I ( =
0,05). (b) Penurunan tekanan darah untuk hipotesis alternatif, seperti yang didefinisikan oleh
hipotesis alternatif, daerah yang diarsir menggambarkan probabilitas kesalahan tipe II ().
Nilai rata rata SD masing maing adalah 30 3 dan 37 3 mmhg.
Perhitungan jika = 0,05 dan nilai nilai rata rata SD pada hipotesis nol dan
hipotesis alternatif secara berurutan adalah 30 3 dan 34 3
=
34,9534
= = 0,32
3
Karena itu, probabilitas melakukan suatu kesalahan tipe II adalah 0,63 (Lampiran Distribusi
normal atau Gambar 5.9). Kekuatan dari studi tersebut adalah 1 = 1 0,63 = 0,37
Perhitungan jika = 0,05 dan nilai nilai rata rata SD pada hipotesis nol dan
hipotesis alternatif secara berurutan adalah 30 3 dan 37 3
=
34,9537
= = 0,68
3
Karena itu, probabilitas melakukan suatu kesalahan tipe II adalah 0,25 (Lampiran Distribusi
normal atau Gambar 5.9). Kekuatan dari studi menjadi 75, yaitu 1 = 1 0,75.
Perhitungan jika = 0,05 dan nilai nilai rata rata SD pada hipotesis nol dan
hipotesis alternatif secara berurutan adalah 30 3 dan 40 3
=
34,9540
= = 1,68
3
Probabilitas melakukan kesalahan tipe II menjadi 0,05 (Lampiran Distribusi normal atau
Gambar 5.9) dan karena itu kekuatan studi adalah 1 = 1 0,05 = 0,95
Oleh karena itu, dapat disimpulkan bahwa bila ada perbedaan yang besar antara
hipotesis nol dan hipotesis alternatif, kekuatan suatu studi statistik akan menjadi besar. Hal
ini seharusnya tidak mengejutkan karena pernyataan ini menguraikan suatu konsep dasar
statistik, yaitu probabilitas bahwa sebuah perbedaan yang akan diamati tergantung pada
besarnya perbedaan.
Disamping yang telah dijelaskan di atas, dalam skenario mengenai penurunan tekanan darah,
hipotesis nol dan hipotesis alternatif mengacu pada persamaan maupun perbedaan nilai rata
rata. Jadi, distribusi untuk hipotesis hipotesis inimerupakan distribusi pengambilan sampel
nilai rata rata. Simpangan baku dari distribusi pengambilan sampel rata rata disebut
sebagai kesalahan baku sebagaimana yang telah dijelaskan sebelumnya dengan
=
(a)
= 0,05
(b)
= 0,05
Ahli Statistik yang berhubungan dengan rancangan percobaan, khususnya uji uji
klinis, sering diminta untuk memperkirakan jumlah subyek (sampel) yang dibutuhkan untuk
menjamin kekuatan statistik yang memadai dan selanjutnya meyakinkan bahwa kesimpulan
kesimpulan dari studi tersebut bersifat valid. Untuk melakukan perkiraan ini, membutuhkan
informasi berikut:
Dalam prosesn pengujian hipotesis statistik, beberapa tahap kunci telah diidentifikasi:
Satu anggapan tentang uji parametrik yang terdefinisi dengan baik adalah sifat data.
Dalam analisis parametrik, data (variabel) bersifat kontinu dapat dimanipulasi secara
matematik untuk menghasilkan statistik deskriptif (rata rata, variansi, simpangan baku).
Akan tetapi, seperti yang dijelaskan sebelumnya, data dapat dibagi ke dalam kategori -
kategori lain, yang paling nyata adalah skala nominal dan ordinal. Data tersebut tidak dapat
dianalisis secara statistik menggunakan uji parametrik dan analisis nonparametrik harus
digunakan. Pada tahap ini, tepat kiranya untuk meringkas sifat dari dat nominaal, ordinal dan
interval atau rasio.
Data nominal ke dalam kelompok kelompok yang diberi sebuah nama atau judul. Contoh
contohnya meliputi:
Pengelompokan pasien pasien yang mengikuti suatu studi klinis berdasarkan usia
Pengelompokan pasien pasien yang mengikuti suatu studi klinis berdasarkan jenis
kelamin
Kategorisasi kerusakan tablet, misalnya retak-lepas (capping), berkeping (chipped),
berceruk (pitting)
Kategorisasi penyakit, misalnya kanker usus, kolitis ulseratif, penyakit Crohns,
divertikulitis
Efek samping yang berkaitan dengan pengobatan, misalnya mual, muntah,diare dan
sakit kepala
Data nominal biasanya dinyatakan dalam frekuensi frekuensi pengamatan yang berkaitan
dengan tiap kategori. Analisis statistik terhadap data tersebut dapat dilakukanmenggunakan
suatu analisis 2 atau suatu uji berdasarkan binomial.
Data ordinal dianggap mewakili tingkat pengaturan yang lebih tinggi dibandingkan data
nominal. Ada persamaan yang nyata antara ke dua tipe data ini, yaitu ke duanya tersusun atas
kategori kategori; namun kaategori kategori dalam data ordinal tidak bebas, tetapi
berbeda satu sama lain dalam hal besarnya. Sifat data ordinal dapat dijelaskan dengan
memperhatikan contoh contoh berikut:
Kategorisasi nyeri menggunakan skala analog (0 = tidak ada rasa nyeri, 10 = nyeri
luar biasa)
Kategorisasi peradangan (misalnya, peradangan gusi, artitis reumatoid, osteoarritis)
menggunakan indeks
Kategorisasi rasa (tidak pahit,agak pahit, sangat pahit)
Data interval dan rasio mewakili suatu tingkat pengaturan yang lebih tinggi dibandingkan
data nominal atau ordinal. Ke duanya dapat dikarakterisasi dengan mengetahui jarak antara
dua nilai pada tiap skala tertentu, yaitu jarak numerik antara dua nilai telah ditetapkan dalam
suatu unit pengukuran. Dalam suatu skala interval tidak ada nol kakiki, tetapi data rasio
memiliki suatu titik nol tertentu. Sebuah contoh klasik tentang skala interval adalah
pengukuran suhu (dalam Celciu maupun Fahrenheit)
Skala rasio juga merupakan suatu skala kuantitatif , tetapi berbeda dari skala interval
dalam satu sifat yang penting: skala rasio ini memiliki titik nol hakiki. Sebagian besar
percobaan dalam ilmu kefarmasian menghasilkan data yang bersifaat rasio. Contohnya
meliputi massa, tinggi, konsentrasi, tekanan darah kecepatan penyaringanglomerulus, daerah
di bawah kurva dan sebagainya. Contoh contoh ini nol melambangkan ketiadaan suatu nilai
yang dapat diukur.
Data interval atau data rasio yang distribusinya miring (tidak normaal) dapat
dijelaskan dengan baik menggunakan frekuensi relatif atau persentase, sementara median dan
kisaran secara berturut turut digunakan untuk menggambarkan kecenderungan memusat
dan variabilitas. Data interval atau rasio yang berdistribusi normal dijelaskan menggunakan
frekuensi relatif, persentase atau angka z, sedangkan rata rata dan simpangan baku (atau
variansi) digunakan untuk menjelaskan masing - masing kecenderungan memusat dan
variabilitas.Karakterisasi hubungan dalam data intervaal atau rasio yang berdistribusi secara
normal umumnya dilakukan menggunakan koefisien korelasi (r)
BAB 6 PERKIRAAN STATISTIK MENGGUNAKAN INTERVAL KEPERCAYAAN
Sebagaimana dijelaskan sebelumnya, salah satu tujuan utama dari perhitungan sifat memusat
(rata rata) dan variabilitas (simpangan baku) suatu rangkaian data sampel ialah untuk
mendapatkan suatu pemahaman tentang statistik populasi yang berkaitan. Dengan kata lain,
Rata rata ( ) dan simpangan baku (s) dari data sampel digunakan untuk memperkirakan rata
rata populasi () hakiki dan simpangaan baku populassi () hakiki.
Setelah menghitung rata rata dan simpangan sampel, sebagaimana pendekatan normal
dalam ilmu farmasi dan ilmu pengetahuan terkait, kita perlu menyediakan suatu indikasi
keterandalan data. Contohnya, suatu uji klinik ( n = 20 pasien) volume urine yang dihasilkan
setelah pemberian suatu diuretik baru telah dihitung sebesar 5,2 1,9 l. Berkenaan dengan
ukuran sampel yang kecil, tidak masuk akal untuk memprediksi bahwa rata rata dan
simpangan baku populasi akan identik dengan nilai nilai sampel yang diamati ini karena
tiap sampel akan menghasilkan nilai rata rata dan simpangan baku yang berbeda beda.
Karena itu, bila kita melaporkan rata rata data sampel, sebaiknya kita juga menyajikan
beberapa indikasi keterandalan dat, kualitas perkiraan rata rata hakiki dari rata rata
sampel. Hal ini dilakukan menggunakan interval kepercayaan. Interval kepercayaan
dikatakan sebagai suatu rata rata dan kisaran (interval), yang disebut mewakili probabilitas
pengamatan rata rata hakiki. Probabilitas yang dtetapkan dipilih oleh orang yang
bertanggung jawab terhadap manipulasi data secara statistik; namun interval kepercayaan
yang paling seringa digunakan adalah 90%, 95% dan 99%
Interval kepercayaan disajikan secara grafik dalam Gambar 6.1. Dalam gambar ini 10
sampel, tiap sampel terdiri dari 10 pengamatan, dipilih dari suatu distribusi normal yang rata
ratanya diketahui sebear 50. Rata rata dan interval kepercayaan 90% untuk tiap tiap dari
10 sampel dihitung
Bawah Atas
Oleh karena itu, interval kepercayaan dihitung untuk memberikan probabilitas suatu sampel
tunggal akan mengandung rata rata dan simpangan baku hakiki bagi pengguna. Jiak suatu
sampel diambil dan rata rata 95% interval kepercayaan yang dihitung, masih mungkin
bahwa rata rata hakiki tidak akan terletak dalam kisaran yang dihitung. Namun, benar
bahwa jika 19 sampel yang lain diambil dan rata rata interval kepercayaan yang dihitung,
rata rata hakiki akan terletak dalam interval kepercayaan yang didambarkan oleh 19 sampel
ini.
6.2 Interval Kepercayaan Untuk Rata Rata Populasi dan Distribusi Normal
Salah satu dari metode yang paling sering digunakan untuk menghitung interval kepercayaan
melibatkan penggunaan distribusi normal. Jika data tersebut merupakan distribusi normal,
interval kepercayaan dua arah dapat dihitung menggunakan persamaan
/2
% =
dengan
n ukuran sampel
Contoh 6. 1
Suatu uji klinis (n = 30 pasien) telah dilakukan, volume distribusi dari suatu obat anti
diabetes baru telah dihitung sebesar 10,2 1,9 l. Hitung batas kepercayaan 95% , 90% dan
99% dari nilai rata rata ( dengan menganggap bahwa data berasal dari suatu distribusi
normal.
Penyelesaian
Kandungan aluminium dari 1000 sampel cairan intravena bervolume l liter dianalisis dengan rata
rata dan simpangan baku dihitung sebesar 50 3 ppm. Hitunglah batas batas kepercayaan 99%,
90% dan 95% untuk memperkirakan rata rata konsentrasi aluminium sebenarnya.
Penyelesaian:
dengan
/2 melambangkan nilai Tabel z yang berkaitan dengan probabilitas 99% dengan nilai 2,58
= 3 ppm
Rata rata sampel ( ) = 50
Ukuran sampen n = 1000
(2,58)(3)
99% = 50
= 50 0,24
1000
Batas batas kepercayaan 99% adalah antara 49,7 dan 50,24 ppm, dengan kata lain ada kemungkinan
sebesar 99% bahwa rata rata populasi hakiki akan terletak dalam daerah ini
Iterval kepercayang paling sering dihitung untuk memberikan perkiraan rata rata suatu populasi,
seperti yang dijelaskan dalam bagian 6.2. Namun, dalam banyak kasus, interval kepercayaan ini
berguna untuk menggambarkan perbedaan antar rata rata. Sekali lagi, distribusi normal dapat
digunakan untuk tujuan ini (rata rata dianggap berasal dari suatu distribusi normal). Persamaan
yang digunakan di sini berdasarkan pada persamaan yang digunakan untuk perhitungan interval
kepercayaan dari suatu rata rata tunggal, dengan dua pengecualian:
2 2
% = (1 2 ) /2 1 + 2
1 2
Dengan
Contoh 6.3
Suatu laboratorium pengendalian mutu ingin memeriksa dan membandingkan sifat sifat mekanis
dua pembalut luka menggunakan analisis tarik. Selanjutnya, rata rata ( simpangan baku))
ketahanan tarik dari suatu pembalut luka bermerek diperiksa (n = 250) dan tercatat sebesar 10,35
0,57 MPa). Rata rata ( simpangan baku) ketahanan tarik suatu pembalut luka generik diperiksa
ditemukan dan tercatat sebesar 8,99 0,73 MPa (n =150). Hitunglah interval kepercayaan 90%, 95%
dan 99% dari perbedaan antara ketahanan tarik dari ke dua pembalut luka tersebut !
Penyelesaian:
a) Dengan 1 = 10,35, 2 = 8,99 MPa; 1 = 0,57 dan 2 = 0,73 MPa serta 1 = 250 dan
1 = 150, sehingga interval taksiran untuk 90% dapat dihitung dengan = 1 + 2 2
12 22 (0,57)2 (0,73)2
90% ( )
= 1 2 + = (10,35 8,99) (0,0500) +
2 1 2 250 150
= 1,36 1,645(0,0697)
= 1,36 0,14 MPa.
Jadi, interval 90% untuk perbedaan antara rata rata ketahanan tarik dari ke dua pembalut
luka ini adalah 1,24 samapi 1,48 MPa, sehingga ada 90% probabilitas bahwa perbedaan rata
rata hakiki dalam ketahanan tarik antara ke dua pembalut dalam kisaran 1,24 sampai 1,48
MPa.
Interval kepercayaan untuk simpangan baku paling sering digunakan untuk memeriksa
variabilitas data, misalnya bila ada variasi tinggi yang tidak diharapkan dalam suatu sampel.
Untuk tujuan ini, distribusi ini, distribusi 2 digunakan untuk menghitung interval
kepercayaan simpangan baku populasi. Dari Tabel 2 dapat diperoleh nilai yang
memberikan informasi tentang daerah di bawah kurva probabilitas.Jadi, untuk menghitung
interval 95% dari simpangan baku populasi, derah di bawah distribusi 2 yang sebanding
2 2
dengan 95% didapatkan antara 0,025 dan 0,975 . Oleh karena itu, 2,5% pengamatan terletak
2 2
di bawah 0,025 dan di atas 0,975 . Dari sini, interval kepercayaan 95% di hitung
menggunakan persamaan berikut.
2 (1)2 2
0,975 < < 0,025
2
dengan
Persamaan ini dengan mudah diatur kembali untuk memberikan persamaan dalam
menghitung interval kepercayaan menjadi
1 1
2
<< 2
1
2 2
Contoh 6.4
Sebelum memulai suatu uji klinis, berat dari 20 sukarelawan pria sehat (berusia 21 30
tahun) ditimbang dengan rata rata dan simpangan baku nya dicatat sebesar 76,1 9,4 kg.
Hitunglah interval kepercayaan 95%, 90% dan 99% untuk simpangan baku
Penyelelesaian:
1 1
<< dengan db = n 1
2
0,025 2
0,975
dengan n = 20, s = 9,4 dan db = 19, maka interval kepercayaan 95% adalah
9,419 9,419
<<
32,852 8,907
40,97 40,97
<<
5,74 2,98
Jadi ada 95% kemungkinan bahwa simpangan baku populasi akan terletak di antara batas
batas 7, 14 dan 13,75 kg.
Interval kepercayaan proporsi juga dapat dihitung menggunakan hampiran distribusi normal
dan simpangan baku. Interval kepercayaan untuk proporsi populasi dapat dihitung
menggunakan persamaan
% =
di mana
= dan = 1 serta x adalah suatu kejadian tertentu dan x adalah suatu kejadian
n = ukuran sampel
Contoh 6.5
Suatu perusahaan pelayanan kesehatan yang menghususkan diri dalam pengemasan steril
sarung tangan sekali pakai telah memutuskan untuk melakukan suatu audit kualitas
ketahanan satu bets sarung tangan sekali pakai dalam kemasan terhadap masuknya udara
yang tidak steril. Dari sebuah bets yang terdiri dari 2500 kemasan, 200 kemasan diambil dan
sterilitasnya diperiksa menggunakan uji sterilitas British Pharmacopoeia. Hasilnya
menunjukkan bahwa 35 kemasan tidak memenuhi uji sterilitas. Berdasarkan pengamatan
ini, hitunglah batas kepercayaan 95%, 99% dan 90% untuk proporsi sarung tangan yang
rusak dalam bets (populasi).
Penyelesaian:
Dari persamaan
% =
35
Dengan x = 35, n = 200, sehingga = 200 = 0,175 dan = 0,825 serta dari lampiran
distribusi normal baku untuk 1 = 0,05 maka nilai /2 = 1,96.
Jadi,
(0,175)(0,875)
% = = 0,175 (1,96) 200
= 0,175 0,053
Oleh karena itu, batas kepercayaan 95% untuk proporsi populasi berada antara 0,122 dan
0,228, yaitu ada kemungkinan 95% bahwa proporsi hakiki dari sarung tangan yang rusak
akan terletak dalam kisaran ini.
6.6 Interval Kepercayaan untuk Perbedaan antara Proporsi
Interval proporsi untuk perbedaan dalam proporsi dapat diperkirakan menggunakan suatu
pendekatan yang serupa dengan yang dijelaskan pada bagian 6.3, dengan menganggap
bahwa proporsi didapatkan dari suatu distribusi normal. Perbedaan utama antara
pendekatan yang diuraikan dalam bagian 6.3 dan yang dibutuhkan untuk perhitungan
interval kepercayaan untuk perbedaan dalam proporsi adalah definisi dari simpangan baku
perbedaan antara rata rata dengan proporsi. Pada bagian 6.3, diketahui kesalahan baku
perbedaan antara dua rata rata, dihitung menggunakan rumus:
2 2
(1 2 ) = 1 + 2
1 2
1 1 2 2
(1 2 ) = +
1 2
% = (1 2 ) /2 (1 2 )
1 1 2 2
% = (1 2 ) /2 +
1 2
1 = 1 dan 2 = 2
1 2
dengan 1 dan 2 adalah ke dua proporsi yang diperiksa, /2 adalah nilai Tabel z (Lampiran)
distribusi normal baku dan (1 2 ) adalah kesalahan baku dari perbedaan antara proporsi.
Contoh 6.6
Kemanfaatan relatif dari dua antibiotik oral untuk pengobatan pneumonia bronkial telah
dinilai dalam suatu uji klinik. Subjek penderita pneumonia bronkial pada sebuah rumah sakit
dibagi menjadi dua kelompok, tiap kelompok menerima salah satu antibiotik. Hasil uji klinik
ini ditunjukkan dalam Tabel 6.1. Hitunglah interval kepercayaan 99%, 90% dan 95% untuk
perbedaan antara proporsi dari pasien yang sembuh dalam ke dua kelompok.
Persamaan yang digunakan untuk menghitung interval kepercayaan perbedaan antara dua
proporsi adalah
1 1 2 2
a) % = (1 2 ) /2 +
1 2
dengan
575
1 = 1 = 575+45 = 0,927
1
2 425
2 = = = 0,68
2 425+200
Bila nilai nilai ini dimasukkan ke dalam persamaan di atas, interval kepercayaan untuk
perbedaan antara proporsi kesembuhan yang merupakan hasil dari pengobatan dengan ke
dua antibiotik dapat dihitung:
(0,927)(0,073) (0,680)(0,320)
99% = (0,927 0,680) 2,57 +
620 625
= 0,247 0,042.
Jadi batas kepercayaan untuk perbedaan antara proporsi kesembuhan yang merupakan
hasil pengobatan dengan ke dua antibiotik untuk 99% berada antara 0,205 dan 0,289.
Jika variansi populasi 2 tidak diketahui, maka distribusi t yang digunakan untuk
menghitung interval kepercayaan, menggunakan strategi yang sama dengan yang digunakan
untuk menghitung interval kepercayaan rata rata hakiki untuk sampel yang berukuran
besar. Jadi,
% = /2
dengan
Contoh 6.7
Tabel 6.1 menunjukkan konsentrasi klorheksidin (mg) dalam 15 sampel bervolume l ml yang
telah diambil dari suatu larutan stok (5 l) dan diukur dengan spektroskopi ultraviolet.
Hitunglah interval kepercayaan 90%, 95% dan 99% dari rata populasi.
Tabel 6.1 Konsentrasi klorheksidin (mg/ml) dalam 15 sampel yang diambil dari suatu larutan
stok
Penyelesaian
a) Untuk 90%, maka interval kepercayaan dari data pada Tabel 6.2 dapat kita gunakan
persamaan
% = /2
Dari Tabel 6.2 ini kita hitung rata rata sampel dengan n = 15 mempunyai rumus:
1 1
= =1 = 15 (2,733) = 0,1822 (mg/ml) dan
2
=1 (=1 ) 15(0,645615)(2,733)2 2,214936
2 = = = = 0,0105 (mg/ml)
(1) 15(151) 210
= 2 = 0,103
Jadi interval kepercayaan untuk 90% dengan /2 = 0,05 = 1,761 dan db = 15-1 = 14 adalah
0,103
90% = /2 = 0,1822 (1,761) ( ) = 0,1822 0,0469
15
Oleh karena itu interval kepercayaan 90% konsentrasi klorheksidin terletak antara 0,1353
dan 0,2291 ml
Pengujian satu sampel meliputi perkiraan apakah data sampel yang dihasilkan dari
suatu percobaan berasal dari suatu populasi tertentu atau tidak. Khususnya, banyak uji satu
sampel mengevaluasi apakah rata rata sampel dan rata rata populsi berbeda, atau
kemungkinan lainnya apakah ada suatu perbedaan antara nilai - nilai yang diamati dari
sampel dan nilai nilai yang diharapkan jika suatu sampel benar berasal dari populasi yang
dipertanyakan. Sebelum suatu uji satu sampel dapat dilakukan, beberapa pertanyaan harus
dijawab.
Uji satu sampel parametrik maupun nonparametrik akan digunakan untuk analisis
data percobaan. Dua uji satu sampel parametrik akan dijelaskan dalam bab ini, yaitu uji z
satu sampel dan uji t satu sampel. Juga akan diuraikan penggunaan uji uji nonparametrik,
uji 2 satu sampel dan uji Kolmogorov-Smirnov satu sampel, masing masing untuk analisis
data nominal dan ordinal satu sampel.
Dengan menganggap bahwa kondisi kondisi percobaan sesuai dengan model statistik, ada
dua uji parametrik utama yang dapat digunakan untuk mengevaluasi uji uji satu sampel
secara statistik, yaitu uji z dan uji t. Penggunaan uji uji ini akan dibahas masing masing
pada bagian selanjutnya.
Uji z satu sampel digunakan untuk analisis hipotesis satu sampel jika ukuran sampel besar
dan selain itu, ada informasi yang cukup mengenai sifat sifat populasi yang sedang
dibandingkan dengan sampel yang diperoleh dari percobaan. Secara khusus, uji z ( juga uji t)
membandingkan apakah rata rata sampel berbeda dari rata rata suatu populasi tertentu.
Selain itu, uji z juga dapat digunakan untuk membandingkan suatu proporsi tunggal (sampel)
dengan suatu nilai yang dihipotesiskan. Penggunaan uji z dapat diterapkan dalam contoh
contoh berikut. Perhitungan dari analisis ini dapat kita gunakan persamaan berikut
0
= /
Contoh 7.1
Sebuah perusahaan farmasi telah membeli sebuah mesin pengisi cairan baru untuk
digunakan pada divisi pembuatan parenteral perusahaan tersebut. Hasil pengisian dari
mesin pengisi yang telah ada, berkaitan dengan proses pembuatan saat ini, adalah 5,01
0,21 ml per vial injeksi . Suatu penelitian pendahuluan telah dilakukan untuk mengevaluasi
apakah kinerja pengisian dari mesin yang baru sama (atau tidak) dengan mesin sebelumnya
dalam kondisi proses yang identik. Oleh karena itu, 100 vial produk diambil dari sebuah bets
pendahuluan dan rata rata volume pengisian ditentukan secara gravimetri sebesar 5,12
ml. Apakah ada perbedaan antara kinerja mesin pengisian yang baru dan mesian yang telah
ada ? (taraf arti = 0,05)
Penyelesaian:
1 : 5,01 ml (Ada perbedaan antara rata rata sampel dengan rarata populasi)
Terima 0
Tolak 0 tolak 0
/2 1/2
Suatu perusahaan medis mengkhususkan diri dalam pembuatan kateter uriner silikon
melalui injeksi cetak. Modulus Young (elastisitas) dari kateter merupakan penentu kinerja
kateter yang penting karena hal ini dapat dihubungkan dengan kemudahan penyisipan
kateter ke dalam uretra. Biasanya, rata rata dan simpangan baku dari modulus Young
kateter silikon ketika dibuat menggunakan proses konvensional adaalah 51,6 4,1 MPa.
Secara historis, perusahaan pembuat peralatan medis ini telah membeli penaut silang untuk
reaksi pematangan silikondari satu penyalur; namun penyalur ini sekarang telah
mengumumkan bahwa mereka tidak terlibat lagi dalam sntesis material ini. Pabrikan
peralatan medis telah mendapatkan penyalur penaut silang lain dan telah mendapatkan
sampel material ini untuk pembuatan satu bets pendahuluan kateter dan juga penilaian sifat
sifat mekanisnya. Untuk menyelidiki keterpakaian dari penyalur baru ini, 50 kateter telah
dibuat menggunakan sumber baru penaut silang ini menggunakan parameter injeksi cetak
yang sama dengan yang digunakan pada bets bets sebelumnya. Rata rata modulus
Young dari 50 kateter tersebut kemudian ditentukan menggunakan analisis regangan dan
diamati sebesar 49,7 MPa. Apakah ada suatu perbedaan antara sifat mekanis dari kateter
silikon yang dibuat menggunakan penaut silang dari penyalur lama dan baru dengan taraf
nyata = 0,01
Uji Proporsi
Jika data terdapat dua kategori berbeda dan karenanya data tersebut terdistribusi secara
binomial. Namun penggunaan statistik z untuk menafsirkan data (berbeda), suatu perkiraan
distribusi normal.
dengan
0 = 1 0 dan = , x adalah suatu kejadian tertentu dan n adalah ukuran
sampel.
Contoh 7.2
Dalam suatu panel konsumen, 100 sukarelawan dimintai pendapat mengenai keberterimaan
visual dua formulasi tablet, satu formulasi berbentuk oval dan lainnya berbentuk
heksagonal. Sebelum memperkenalkan bentuk tablet yang baru (oval), perusahaan tersebut
berharap mengetahui apakah ada suatu preferensi untuk hal tersebut. Setelah
pengumpulan data diketahui bahwa 78% dari anggota panel yang ditanyai memilih tablet
oval. Apakah ada suatu preferensi yang valid secara statistik untuk bentuk oval ? dengan
taraf arti = 0,05
Penyelesaian
4) Kesimpulan
Karena z hitung = 5,6 > z tabel = 1,96, maka 0 ditolak yang berarti 1 diterima,
sehingga dapat disimpulkan bahwa ada perbedaan preferensi yang valid secara statistik
untuk bentuk oval.
Dalam banyak yang relevan dengan ilmu farmasi, tidak mungkin untuk mendapatkan
pengetahuan mengenai statistik populasi yang relevan dan karena itu, perkiraan yang
tersedia mengenai kecenderungan memusat dan variabilitas populasi hanyalah rata rata
dan variansi untuk data sampel. Dalam keadaan seperti ini, uji t satu sampel dapat
digunakan untuk menghitung statistik t dan relevansi statistik ini ditafsirkan menggunakan
distribusi t dengan derajat kebebasan (db = n - 1). Sekali lagi, penting untuk
mengulangkembali anggapan anggapan uji t satu sampel, yang dalam kenyataannya,
merupakan statistik parametrikyang lain. Anggapan anggapan ini adalah:
Contoh 7.3
Tabel 7.1 Jumlah jam tidur tanpa gangguan yang dialami oleh pasien yang menerima satu
dosis tunggal benzodiazepin baru
Penyelesaian:
Pasangan hipotesis
1 2
6,6 43,56
6,7 44,89
6,9 47,61
6,2 38,44
6,8 46,24
6,9 47,61
6,9 47,61
7,2 51,84
6,6 43,56
7,6 57,76
7,3 53,29
6,7 44,89
7,1 50,41
7,0 49,00
6,7 44,89
7,1 50,41
7,4 54,76
6,4 40,96
6,9 47,61
6,8 46,24
137,8 951,58
1 1
= =1 = 20 (137,8) = 6,89 dan
2
=1 (=1 ) 20(951,52)(137,8)2
2 = = = 0,11
(1) 20(19)
Jadi
0 6,897,3 0,41
= = = 0,07416 = 5,29
0,11/20
.dan
4) Kesimpulan
Karena = 16,27 < ()=1 = 1,729, maka 0 diterima yang berarti bahwa
berdasarkan studi klinis, jumlah jam tidur tanpa gangguan yang dialami oleh pasien
pasien yang menerima satu dosis tunggal benzodiazepin baru tidak berbeda dari rata
rata nasional.
7.1.3 Ukuran dan Kekuatan Sampel dalam Uji Stattistik Parametrik Satu Sampel
Aras nyata (). Ini merupakan probabilitas penolakan hipotesis nol bila hipotesis nol
sesungguhnya benar, umumnya dipilih nilai sebesar 0,05.
Variabilitas percobaan. Bila berurusan dengan statistik populasi, simpangan baku
populasi (historikal) digunakan. Namun dalam percobaan percobaan bila
variabilitas populasi yang ditaksir, maka kita menggunakan data sampel melalui
simpangan baku sampel.
Probabilitas membuat kesalahan tipe II.
Perbedaan antara rangkaian data dan nilai yang dihipotesiskan (antara dua rangkaian
data) yang dinyatakan valid secara eksperimental.
Contoh 7.4
Volume pengisian nominal dari suatu suspensi antasida adalah sebesar 50 ml. 10 botol
disisihkan dari suatu bets yang telah diisi dan volume pengisian diukur secara gravimetri
sebesar 48,8 2,1 ml (rata rata dan simpangan baku). Dengan menggunakan metode
statistik yang sesuai, hitunglah apakah volume penggisian yang diukur berbeda dari volume
pengisian nominal dan probabilitas mendeteksi suatu perbedaan hakiki sebesar 2,5 ml
antara rata rata sampel dan rata rata nominal.
Penyelesaian
Apakah volume pengisian yang diukur berbeda dari volume pengisian nominal ?
Berapa probabilitas mendeteksi suatu perbedaan hakiki sebesar 2,5 ml antara rata rata
sampel dan rata rata nominal ?
dengan s adalah simpangan baku sampel, n adalah ukuran sampel, adalah perbedaan
yang diperkirakan antara rata rata sampel dan nilai hipotesis yang diterima untuk mewakili
perbedaan praktis, () adalah nilai t untuk kesalahan tipe II pada suatu jumlah db dan
() adalah nilai t untuk aras nyata yang diinginkan pada suatu db tertentu. Dari
parameter parameter yang dijelaskan Contoh 7.4, = 2,5 ml, n = 10, s = 2,1 ml, () =
2,26 ( = 0,05, dua arah, db = 9). Bila nilai nilai ini dimasukkan ke dalam persamaan di
atas, statistik t yang berkaitan dengan melakukan suatu kesalahan tipe II dapat dihitung:
2,50 2,50
() = () = 2,26 = 0,66 2,226 = 1,53.
2 / (2,1)2 /10
Probabilitas perkiraan untuk suatu nilai t sebesar + 1,53 dapat dihitung menggunakan
distribusi t. Nilai t hitung untuk kesalahan bersifat satu arah karena mewakili tumpang
tindih distribusi yang dihipotesiskan bila hipotesis nol tidak ditolak padahal seharusnya
ditolak. Dengan alasan ini, sehingga hanya ada satu hasil yang sesuai, yakni hasil satu arah.
Jika probabilitas yang tepat tidak dapat ditentukan dari distribusi t, misalnya dalam
contoh di atas, nilai t sebesar 5,55 (db = 9, hasil satu arah) berhubungan dengan suatu
probabilitas yang terletak dalam jarak 0,05 0,10. Harus diingat bahwa untuk menghitung
probabilitas yang tepat, dibutuhkan pengetahuan yang lengkap mengenai distribusi t
dengan db = 9. Ini umumnya tidak tersedia dan harus dihitung aleh analis. Untuk mengatasi
hal ini, biasanya digunakan distribusi normal terbakukan untuk menafsirkan probabilitas
yang berkaitan dengan kesalahan . Jadi, dengan menganggap bahwa 1,53 berkaitan
dengan suatu nilai z, probabilitas membuat suatu kesalahan adalah sebesar 0,07 (satu
arah, = 0,05). Selanjutnya kita menyimpulkan bahwa kekuatan uji (1 ) adalah 0,93.
Dengan kata lain, ada kemungkinan 93% perbedaannya sebesar 2,5 ml, yakni perbedaan
kritis yang ditentukan akan diamati antara rata rata sampel dan rata nominal.
= (/)2 (() + () )2
dengan n ukuran sampel, s simpangan baku sampel, adalah perbedaan yang dapat
dideteksi antara rata rata sampel dan nilai yang dihipotesiskan, () adalah statistik t
yang berkaitan dengan membuat kesalahan tipe I ( = 0,05), () adalah statistik t yang
berkaitan dengan membuat kesalahan tipe II (satu arah) pada jumlah db tertentu.
Contoh 7.5
Volume pengisian nominal suspensi antasida adalah sebesar 50 ml. Hitunglah jumlah botol
yang harus diuji untuk menolak hipotesis nol yang menyatakan bahwa volume pengisian
hakiki dari bets pendahuluan sebanding dengan volume pengisian nominal.
Penyelesaian:
Jika kita menganggap bahwa ukuran sampel yang dibutuhkan adalah 20, sehingga n = 20, s =
2,1 ml, = 2,5 ml, = 0,05 dan 0,025(19) = 2,09 serta =0, 10, sehingga 0,10(19) = 1,33.
Jadi
= (/)2 (() + () )2
Nilai n yang diperkirakan (20) tidak sama dengan nilai n yang dihitung (8) maka ini
merupakan suatu perkiraan yang tidak tepat. Ukuran sampel diperkirakan kembali (n = 15)
danperhitungan dilakukan sekali lagi menggunakan nilai yang diperkirakan kembali: n = 15, s
= 2,1 ml, = 2,5 ml, = 0,05 dan 0,025(14) = 2,14 serta =0, 10, sehingga 0,10(14) = 1,35.
Jadi
= (/)2 (() + () )2
Perbedaan besarnya ukuran sampel yang diperkirakan dan yang dihitung menjadi lebih kecil.
Perbedaan ini dapat dikurangi dengan menggunakan suatu perkiraan ukuran sampel yang
lebih jauh (n = 10), s = 2,1 ml, = 2,5 ml, = 0,05 dan 0,025(9) = 2,26 serta =0,10,
sehingga 0,10(9) = 1,38. Jadi
= (/)2 (() + () )2
Nilai ukuran sampel yang dihitung dan yang diperkirakan sekarang serupa sehingga kita
mengetahui bahwa dibutuhkan ukuran sampel paling sedikit 10 untuk memenuhi
permintaan tertentu dari uji tersebut.
Kembali pada Contoh 7.5, bahwa untuk menghitung jumlah botol yang harus diperiksa
untuk menolak hipotesis nol yang menyatakan bahwa volume pengisian yang sebenarnya
dari bets pendahuluan sama dengan volume pengisian nominal. Dalam kasus ini = 2,1 ml,
= 2,5 ml, = 0,05 dan 0,0250 = 1,96 serta = 0,1 sehingga 0,1 = 1,28. Jadi uji satu
arah
= (/)2 ( + )2 + 0,5( )2
Nilai n in, dihitung menggunakan statisti z, sesuai dengan nilai yang ditentukan
menggunakan proses penggulangan dengan distribusi t.
Uji satun sampel nonparametrik umumnya digunakan untuk analisis data yang
diukur baik berdasarkan skala nominal maupun skala ordinal. Dalam bab ini, cara cara dan
penerapan data nominal serta uji Kolmogorov Smirnov satu sampel untuk analisis data
ordinal akan dijelaskan.
Dalam uji 2 satu sampel, data (nominal) dikumpulkan dua atau lebih kategori yang berbeda
dari satu variabel tunggal dan hubungan antara frekuensi frekuensi dalam kategori
kategori yang berbeda ini diperiksa secara statistik. Ini merupakan suatu uji kesesuaian yang
memeriksa perbedaan antara frekuensi yang diamati dan frekunsi yang diharapkan dalam
tiap kategori. Tipe data yang dapat dianalisis dan mekanisme melakukan uji 2 dalam
contoh contoh berikut. Rumus yang kita unakan dalam uji ini adalah
( )2
2
= =1 ,
Contoh 7.7
Sebuah perusahaan farmasi telah mengembangkan suatu formulasi obat kumur untuk
pengobatan dan pencegahan infeksi dalam rongga mulut. Seksi pemasaran perusahaan
tersebut meyakini bahwa warna larutan merupakan pertimbangan penting dalam
keberterimaan pasien terhadap produk. Untuk mengevaluasi prinsip ini, empat formulasi
yang hanya berbeda dalam jenis bahan pewarna yang ditambahkan telah disiapkan. Dua
ratus sukarelawan diminta untuk memilih warna yang mereka sukai, dan hasilnya
ditampilkan dalam Tabel 7.3. Dengan menggunakan metode statistik yang sesuai, berikan
uraian mengenai ada tidaknya preferensi di antara berbagai warna obat kumur.
Tabel 7.3 Jumlah sukarelawan yang memilih berbagai warna obat kumur
Merah 55
Hijau 73
Biru 36
Kuning 36
Penyelesaian
1) Menyatakan hipotesis
0 : Sukarelawan tidak menunjukkan preferensi warna formulasi obat kumur
1 : Sukarelawan ada suatu preferensi warna formulasi obat kumur
2) Menyatakan aras nyata
Ambil aras nyata sebesar = 0,05
3) Menghitung statistik 2
( )2
2
= =1
dengan adalah nilai pengamatan (data), adalah nilai yang diharapkan, serta
diperoleh dari rumus
=
1
Jadi dengan n = 200 dap k = 4, maka = = (200) (4) = 50, sehingga
( )2
2
= =1
(5550)2 (7350)2 (3650)2 (3650)2
= + + + = 18,9
50 50 50 50
2 2 2
= (1) = (0,05)3 = 7,815.
4) Kesimpulan
2 2 2 2
Karena = 18,9 > = (1) = (0,05)3 = 7,815, sehingga 0 ditolak
yang berarti dapat disimpulkan bahwa tidak mungkin frekuensi yang diamati dapat
berasal dari populasi yang dijelaskan oleh hipotesis nol.
Contoh 7.8
Dalam suatu survei yang dilakukan oleh sebuah badan kesehatan lokal dilaporkan bahwa
penggunaan obat obat yang diresepkan untuk pengobatan gangguan lambung adalah
seperti yang ditunjukkan dalam Tabel 7.5. Sebagai bagian dari proses pemeriksaan, dokter
dokter umum pada suatu tempat praktek kota telah menginstruksikan manajer praktek
untuk melakukan suatu survei yang serupa mengenai pola peresepan yang mereka berikan
untuk pengobatan gangguan lambung. Data yang diperoleh dari 200 pasien yang diresepkan
obat obatan untuk pengobatan gangguan lambung, ditunjukkan dalam Tabel 7.6. Apakah
ada suatu perbedaan dalam pola peresepan dokter dokter umum dalam suatu tempat
praktek kota dan pengobatan yang dijelaskan dalam survei yang dilakukan oleh badan
kesehatan ?
Tabel 7.5 Hasil dari suatu survei lokal tentang obat obat yang diresepkan untuk
pengobatan gangguan lambung oleh dokter umum
Tabel 7.6 Hasil dari suatu survei tentan peresepan obat untuk pengobatan gangguan
lambung oleh dokter umum yang berpraktek dalam suatu kota
Penyelesaian:
(v) Kesimpulan
2
Karena = 131,225, maka 0 ditolak yang berarti bahwa ada perbedaan pola
peresepan dalam praktek perkotaan dan dicatat oleh badan kesehatan
Salah satu keuntungan dari uji binomial untuk analisis data dikotomi diskret nominal adalah
kegunaannya untuk analisis studi studi yang melibatkan ukuran sampel yang kecil. Penting
untuk dingat bahwa uji binomial juga dapat diterapkan ketinka sampel berukuran besar.
Untuk menggunakan persamaan binomial pada kondisi ini sangat rumitdan menghabiskan
waktu dan akibatnya, digunakan suatu perkiraan (pendekatan) normal untuk binomial.
Dalam pendekatan ini, dari pengetahuan mengenai jumlah sampel, probabilitas harapan
dan jumlah pengamatan yang dicatat, suatu statistik z dapat dihitung dan probabilitas untuk
sejumlah pengamatan tercatat diterjemahkan menggunakan distribusi normal terbakukan.
Dalam perhitungan kita gunakan persaman berikut
0
= atau
0 0
2 ( )2
= 2=1
Contoh 7.9
Menutupi rasa larutan penisilin untuk pemberian secara oral merupakan suatu
permasalahan bagi formulator farmasetik. Sebuah perusahaan farmasi telah
mengembangkan suatu larutan penisilin (125 mg per5ml) untuk pemberian secara oral dan
telah menggunakan sorbitol dalam formulasi untuk mengurangi rasa pahit dari obat. Akan
tetapi, setelah berkonsultasi dengan sebuah perusahaan penghasil zat perasa berkualitas
makanan, perusahaan farmasi tersebut telah disarankan untuk menambahkan suatu zat
perasa dalam formulasi untuk meningkatkan sifat menutupi rasa dari sorbitol. Oleh karena
itu, formulasi ke dua dikembangkan dengan mengandung perasa jeruk. Panel yang terdiri
dari 50 sukarelawan diminta untuk memberikan pilihannya apakah memilih formulasi yang
mengandung perasa jeruk atau formulasi tanpa perasa ini. Hasil dari studi ini ditunjukkan
dalam Tabel 7.7. Dengan menggunakan suatu metode statistik yang sesuai, tentukan apakah
keberterimaan larutan penisilin meningkat dengan penggunaan perasa jeruk ? (taraf arti =
0,05).
Tabel 7.7 Jumlah preferensi yang dicatat untuk dua formualsi penisilin dalam suatu studi
keberterimaan rasa yang melibatkan 50 sukarelawan.
Penyelesaian:
(i) Menyatakan hipotesis
0 : 0,5 (Tidak ada preferensi untuk salah satu formulasi)
1 : > 0,5 (Ada preferensi untuk salah satu formulasi)
(ii) Ambil aras nyata = 0,05
(iii) Daerah Kritis untuk = 0,05, k = 2, sehingga db = k 1 = 2 1 = 1, maka
= = 0,0500 = 1,65 atau
2 2
() = (0,05)1 = 3,841
(iv) Perhitungan
0 3550(0,5)
= = = 2,83
0 0 50(0,5)(0,5)
Atau
2 ( )2 (3525)2 (1525)2
= 2=1 = + = 8,00 dengan =
25 25
(v) Kesimpulan
2 2
Karena = 2,83 > = 1,65 atau = 8,00 > (0,05)1 = 3,841,
sehingga 0 ditolak yang berarti bahwa ada preferensi untuk salah satu formulasi di
mana larutan penisilin meningkat dengan penggunaan perasa jeruk.