Anda di halaman 1dari 16

Bab 9).

Contoh dari variabel kontinu adalah


berat binatang. Contoh dari variabel diskrit
adalah jumlah kasus penyakit. Dalam beberapa keadaan,
nilai-nilai numerik dari variabel disebut
variates.
Mempelajari variabel Setiap variabel yang sedang dipertimbangkan
dalam penyelidikan.
Respon dan variabel penjelas Tanggapan
variabel adalah salah satu yang dipengaruhi oleh yang lain (penjelasan)
variabel; Misalnya, berat badan hewan mungkin
variabel respon dan asupan makanan variabel penjelas,
karena berat badan diasumsikan tergantung pada
jumlah makanan yang dikonsumsi. Dalam penyelidikan epidemiologi,
penyakit yang sering dianggap sebagai respon
variabel; misalnya, ketika mempelajari efek kering
makanan kucing (variabel penjelas) terhadap kejadian
urolitiasis kucing. Mungkin juga ada situasi di
yang penyakit dianggap sebagai variabel penjelas,
misalnya ketika mempelajari efek penyakit
berat badan. variabel respon kadang-kadang disebut
variabel dependen dan variabel penjelas yang
disebut variabel independen.
Parameter Sebuah jumlah yang dapat berbeda dalam situasi yang
berbeda,

tapi konstan dalam kasus yang sedang


dipertimbangkan. Ini mungkin sebuah konstan dalam matematika
rumus atau model. Misalnya, survei mungkin
dirancang untuk mendeteksi prevalensi penyakit minimum, seperti
20%. Meskipun prevalensi dapat bervariasi, minimum
Prevalensi terdeteksi didefinisikan untuk tujuan
survei sebagai nilai sebangun tunggal, dan karena itu
parameter survei, yang dimasukkan
dalam rumus yang tepat untuk mendeteksi ditentukan
Prevalensi penyakit minimum (lihat Bab 13). SEBUAH
parameter juga dapat menjadi ciri khas terukur
populasi seperti produksi susu rata-rata kawanan
sapi susu.
Data set A pengumpulan data.
Data baku awal pengukuran yang membentuk dasar
dari analisis.
Beberapa statistik deskriptif
Tabel bobot 12.1 daftar sampel dari dua kelompok (A dan B)
babi, ketika disapih pada usia 3 minggu. ini bisa
dianggap sebagai sampel acak yang jauh lebih besar
sekelompok babi; yaitu, semua babi di 3 minggu usia.
Variabilitas yang melekat jelas. Jumlah
anak babi dengan bobot dalam interval yang ditetapkan (yaitu,

distribusi frekuensi kelompok bobot) untuk Grup B dicatat dalam Tabel 1 2


0,2 dan digambarkan dalam Ara. 1 2.1 diamati d distribusi i dari bobot
dari 49 anak babi i n
Grup B dep ditimpakan sebagai h i stogram (persegi panjang) d n
dipasang 'Normal'
kurva (kurva halus). (Data dari Tabel 72. 7.)
Measu res dari pos ition
Ukuran umum diadopsi dari posisi adalah mean
sampel, dilambangkan dengan i (diucapkan 'bar x-'). ini
dihitung dengan menggunakan:
i=L
Xn
di mana n adalah jumlah nilai dalam sampel acak.
Dalam Tabel 1 2. 1, n = 49 di masing-masing kelompok, dan i = 5,76 kg di
Grup A, dan 4,69 kg di Grup B.
Setiap sampel telah diasumsikan, secara implisit, memiliki
telah ditarik dari populasi yang jauh lebih besar; dengan demikian,
berarti sampel hanya perkiraan populasi benar
Maksudku, fl. Hanya jika semua populasi diteliti
dapat parameter fl diketahui. Sebagai sampel
Ukuran meningkat, saya akan menjadi estimator yang lebih baik dari fl; itu
adalah,
ketepatan i sebagai estimator dari fl akan meningkat.
Median dari sampel, kadang-kadang dilambangkan
oleh Q2 'adalah ukuran lain posisi. Ini adalah nilai
bawah yang setengah, dan karena itu di atas yang setengah, dari

pengamatan berbohong. Ini membagi distribusi menjadi


sama, memerintahkan subkelompok dan disebut kuantil a.
Quantiles yang membagi distribusi menjadi seratus
adalah persentil (persentil). Oleh karena itu median adalah
sentil 50 (persentil).
Nilai-nilai median pada Tabel 1 2. 1 untuk Grup A dan B,
masing-masing, ditandai dengan tanda bintang, '*'. Lagi,
median sampel adalah estimator dari populasi yang benar
median.
Bawah dan atas kuartil, Q1 dan Q3 'masing-masing,
didefinisikan sebagai dua nilai yang pertengahan jalan
antara bawah dan atas nilai-nilai ekstrim dan
median. Untuk Grup A dan B mereka ditandai dengan dua
tanda bintang, "* * '. Dengan demikian, 25% dari nilai jatuh di bawah Q
'dan
75% dari nilai berbaring di atasnya; Oleh karena itu Q1 adalah tanggal 25
sentil. Demikian pula, 75% dari nilai jatuh di bawah Q3 dan 25%
nilai-nilai berbaring di atasnya; Oleh karena itu Q3 adalah sentil ke-75.
Kuartil mungkin terletak di antara dua nilai;
Terutama, bila ada bahkan jumlah observasi.
Interpolasi kemudian diperlukan. Jika ada n
pengamatan, kuartil pertama (Q) adalah pengamatan di
Posisi (n + 1) / 4; kuartil kedua (median: Q) adalah
pengamatan pada posisi 2 (n + 1) / 4; dan yang ketiga

kuartil (Q3) adalah pengamatan pada posisi 3 (n + 1) / 4.


Misalnya, n = 10. Kemudian 00 + 1) / 4 = 2,75,
dan Q1 adalah antara pengamatan kedua dan ketiga
(Menyebut mereka x2 dan x3), tiga perempat jalan sampai.
Jadi, Q1 = x2 + 0,75 (x3 - x2). Demikian pula, 00 + 1) / 2 = 5,5,
dan Q2 adalah antara pengamatan kelima dan keenam,
setengah jalan. Dengan demikian, Q2 = Xs + 0.5 (x6 - xs) 'di mana Xs dan
X6 adalah pengamatan kelima dan keenam. Sekali lagi, karena
300 + 1) / 4 = 8.25, Q3 = Xs + 0,25 (x9 - xs) 'di mana Xs dan X9
adalah pengamatan kedelapan dan kesembilan.
Pertimbangkan set data ini, yang terdiri dari enam pengamatan:
9, 12, 16, 22, 27, 31.
Kuartil pertama (Q) adalah pengamatan pada posisi
(N + 1) / 4 = 7/4 = 1,75. Q1 adalah antara pertama dan kedua
pengamatan, tiga perempat jalan sampai:
9 + ,7502-9) = 9 + 2,25 = 11 .25.
Median (Q2) adalah pengamatan pada posisi
2 (n + 1) / 4 = 14/4 = 3,5. Q2 adalah antara ketiga dan
pengamatan keempat, setengah dari jalan sampai:
16 + 0,5 (22-16) = 16 + 3 = 19.
Kuartil ketiga (Q3) adalah pengamatan pada posisi
3 (n + 1) / 4 = 21/4 = 5,25. Q3 adalah antara kelima dan keenam
pengamatan, seperempat dari jalan sampai:
27 + 0,25 (31 - 27) = 27 + 1 = 28.

Measu res penyebaran


Langkah-langkah penyebaran yang sedikit lebih sulit untuk menghitung
dibandingkan posisi. Dua contoh sederhana
langkah-langkah penyebaran adalah jangkauan dan mean dari
penyimpangan absolut dari nilai-nilai individu dari
berarti. Namun, langkah ini sering tidak membedakan
set data yang berbeda.
Ukuran umum diadopsi adalah varians sampel,
S2, yang dihitung dengan:
52 = L (x - i) 2
n-l
Gambar 12.1. Angka ini, yang merangkum data, adalah
disebut histogram. Interval pada sumbu horisontal
adalah 0,5 kg lebar. Jumlah anak babi dalam setiap
Interval sebanding dengan area bar vertikal.
H interval pada sumbu horisontal yang sama, seperti di
contoh ini, maka jumlah anak babi dalam setiap
Interval juga sebanding dengan ketinggian bar.
Atau, plot vertikal dan pertengahan poin dari
interval horizontal dapat bergabung, daripada membangun
bar, di mana kasus poligon frekuensi
dibangun. Data ini dapat diringkas lebih lanjut dengan
penggunaan statistik deskriptif yang ukuran
posisi dan penyebaran histogram.

Formula ini dapat ditulis ulang dalam bentuk yang lebih


mudah dihitung dengan kalkulator kecil, yaitu:
S2 =
Saya x2 - I (I x) 2 / n)
n-l
Akar kuadrat dari varians sampel disebut
sampel standar deviasi. Menggunakan nilai dari
Tabel 12.1, Grup B, dan rumus untuk s2 di atas,
sampel standar deviasi, s, diberikan oleh:
Saya x2 - I (I x) 2 / n}
n-l
1 100,27 - (229,82 / 49)
48
= 21.62 / 48
= 0,67 kg.
Sama seperti mean sampel adalah perkiraan populasi
Maksudku, sehingga varians sampel dan sampel
standar deviasi merupakan perkiraan populasi
varians, 0 "2 dan deviasi standar populasi,
0 "(sigma).
Ketika ringkasan statistik disajikan, sampel
standar deviasi harus disajikan serta
sampel berarti dalam rangka untuk menunjukkan variabilitas dalam
populasi.

Ukuran spread yang sering menyertai


median adalah rentang semi-interkuartil (SIR). Ini adalah
setengah dari rentang antara kuartil, Q1 dan Q3:
SIR = Q3 -2 Q.
Ini merupakan estimator untuk interkuartil penduduk semi
jarak.
Atau, dan semakin, sampel mungkin
diringkas oleh ringkasan lima poin yang terdiri dari
minimum, kuartil bawah, median, kuartil atas
dan maksimal.
distribusi statistik
Normal i stribution d
Jika banyak anak babi ditimbang, bukan hanya 49 di
kumpulan data yang ditampilkan pada Tabel 12.1, dan jika interval
digunakan dalam histogram pada Gambar 12.1 berkurang, maka
bar akan menjadi sempit. Akhirnya, yang sesuai
frekuensi poligon akan melacak halus
melengkung. Satu kurva tersebut telah dipasang di atas bar di
Gambar 12.1, menggunakan program komputer, yang mengidentifikasi
kurva, menggunakan bobot pada Tabel 12.1. Itu
kurva memiliki satu puncak di tengah dan simetris. Ara. 1 2.2 Kurva
kepadatan normal yang menunjukkan hubungan antara
/ J, sebuah, z dan proporsi pengamatan Normal didistribusikan ly
data.

bentuk lonceng ini khas dari keluarga distribusi frekuensi


dikenal sebagai keluarga normal distribusi.
Hal ini lebih baik dieja dengan kasus N atas untuk menghindari
kebingungan
dengan arti lain dari kata itu. Lain
nama untuk distribusi ini adalah distribusi Gaussian.
Distribusi ini dijelaskan oleh dua parameter: nya
Maksudku, j1, dan deviasi standar, 0 ".
Kurva normal dapat digunakan sebagai pendekatan halus
untuk histogram berdasarkan sampel dari nilai-nilai,
seperti pada Gambar 12.1, atau sebagai paradigma penduduk
distribusi variabel. Yang terakhir ini dapat digambarkan
matematis sebagai fungsi kepadatan (Samuels, 1989),
dan diplot grafis sebagai kurva kepadatan, yang dapat
ditafsirkan secara kuantitatif dalam hal daerah di bawah
kurva (Gambar 12.2). Semua kurva normal dapat
dibuat setara dalam area di bawah mereka dengan
rescaling sumbu horisontal. variabel rescaled adalah
dilambangkan dengan z, yang standar menyimpang normal: dua standar
deviasi dari mean (tepatnya:
11-1 0,960 "untuk 11 + 1 0,960"; Z = -1 0,96 ke Z = 1 0,96) (Gambar 1 2
0,2).
Dalam banyak kasus, distribusi normal menyediakan
pendekatan yang bisa diterapkan untuk distribusi
variabel biologis; untuk alasan ini itu adalah sangat penting

distribusi. Namun, distribusi ini tidak bisa


diterapkan untuk semua variabel. Pengukuran yang
Normalitas tidak berlaku (meskipun dapat lakukan sebagai
pendekatan untuk sampel besar) adalah jumlah dan
Data ordinal yang hanya memiliki sejumlah kecil interval
pada skala (Gambar 9.1). pengukuran analog visual
juga tidak boleh didistribusikan Biasanya.
B i tidak m i a l d Istri bution
Distribusi ini berkaitan dengan data diskrit ketika ada
Hanya ada dua hasil yang mungkin pada setiap kesempatan; untuk
Misalnya, jenis kelamin anak sapi saat lahir hanya dapat berupa
laki-laki atau perempuan. Contoh diberikan dalam Tabel 12.3. Itu
dua hasil mungkin apapun tetapi, untuk kenyamanan,
di sini disebut 'sukses' dan 'gagal'. Pada n kesempatan,
probabilitas Pr (r) dari keberhasilan r dari n percobaan adalah
ditemukan:
n!
Pr (r) = pr (1 _ p) n-r [r = O, I, 2. . . n; O <p <l]
r! (n - r)!
di mana p = probabilitas keberhasilan dalam satu peristiwa
dengan asumsi tidak ada hubungan antara hasil yang terjadi
pada kesempatan yang berbeda. Dalam contoh ini, dua laki-laki
(Hasil, r = 2) dapat lahir selama tiga kehamilan
(Kesempatan, n = 3). Jika diasumsikan bahwa jenis kelamin

betis pertama tidak mempengaruhi jenis kelamin anak sapi di masa


depan, dan
p = 0,52, maka probabilitas, Pr (2), akan:
3!
Pr (2) = - (0,52) 2 (0.48) [N ote: n - r = 1]
2! 1!
= 0,39.
Nilai p dapat bervariasi antara 0 dan 1;
misalnya, dalam beberapa penyakit ditentukan secara genetik.
Poisson d i stribution
Poisson distributionl berkaitan dengan jumlah. Saya t
berlaku jika peristiwa terjadi secara acak dalam ruang atau
waktu. Beberapa contoh sering dikutip adalah distribusi
sel darah dalam haemositometer dan
distribusi partikel virus menginfeksi sel-sel dalam jaringan
budaya. Distribusi ini penting dalam epidemiologi
karena berkaitan dengan distribusi spasial dan temporal
penyakit. Terjadinya acak kasus penyakit
dalam satuan waktu atau dalam satuan luas dapat mengikuti Poisson
distribusi. Sebuah keberangkatan yang signifikan dari distribusi ini
Oleh karena itu menunjukkan temporal dan geografis
Keberangkatan dari keacakan (lihat Bab 8).
Distribusi ini ditandai dengan satu parameter,
A. (lambda): hitung rata-rata per satuan luas atau per unit

waktu.
Probabilitas tuduhan r = 0, I, 2, 3, 4, dan seterusnya,
diberikan oleh rumus:
e-AA.r
Pr (r) = - [A. > O, r = O, I, 2. . . ]
r!
dimana e adalah konstanta: dasar alami (Napierian)
logaritma = 2.71 8 28. Nilai dari e-A dapat ditemukan di
diterbitkan meja dan ditentukan pada banyak saku
kalkulator.
Misalnya, bahwa monolayer kultur jaringan
sedang terinfeksi partikel virus. Jika ada
1 x 106 sel yang ditambahkan 3 x 106 partikel virus,
maka jumlah rata-rata / sel (A.) adalah 3. Proporsi
Sel diharapkan akan terinfeksi, misalnya, dua
partikel dapat dihitung dengan menggunakan rumus di atas,
dengan A. = 3 dan r = 2. Mengganti dalam formula:
Pr (2) = e-332/2!
Dari tabel atau kalkulator, e-3 = 0,0498.
Demikian: Pr (2) = 0,0498 x 32/2!
= 0,2241.
Ini berarti bahwa proporsi yang diharapkan dari sel
terinfeksi dengan dua partikel virus adalah 22,41%.
stributions i d lainnya

Ada banyak distribusi statistik lainnya. Beberapa


menyimpang dari normalitas; beberapa penyimpangan ini
diilustrasikan pada Gambar 12.3. Mean dan median adalah
sama ketika suatu variabel simetris didistribusikan;
dan mean dan standar deviasi memberikan yang baik
langkah-langkah dari posisi dan menyebar. Namun, ketika
distribusi frekuensi menyimpang dari Normalitas, ini
1 distribusi ini eponymously dinamai 1 abad ke-9
matematikawan Perancis, Simeon-Denis Poisson.Table 1 2.3 seri
Kemungkinan anak sapi lahir dari d sapi u ri ng tiga
u berturut n kehamilan iparous (M = laki-laki; F = perempuan).
x-j1
Z = -.
0"
Nilai-nilai z = 0, 1, 2, 3 Oleh karena itu sesuai dengan x = j1,
j1 + 0 ", j1 + 20" dan j1 + 30 ", masing-masing, berasal demikian:
j1 - j1
jika x = j1, z = - = O;
0"
. j1 + 0 "- j1
Jika x = j1 + O ", z = 0" / 0 "= 1;
0"
j1 + 20 "- j1
jika x = j1 + 20 ", Z = 20" / 0 "= 2;

0"
j1 + 30 "- j1
jika x = j1 + 30 ", Z = 30" / 0 "= 3.
0"
Skala Z dapat digunakan untuk memastikan proporsi
dari pengamatan yang jatuh dalam kisaran tertentu dari
nilai-nilai. Sekitar 68% dari semua didistribusikan Biasanya
nilai-nilai terletak dalam satu standar deviasi dari mean dari
populasi dari mana mereka sampel (j1 - O "untuk
j1 + 0 "; Z = -1 ke Z = 1), dan 95% dalam waktu kurang lebih Gambar 1
distribusi 2 0,4 Dua non-Normal dibandingkan dengan normal.
distribusi.
--Distribusi normal; - - - - T-distribusi;
- - - - Distribusi lognormal.
mungkin tidak benar. Dengan demikian, dengan positif condong mean
terletak di sebelah kanan puncak frekuensi
distribusi. Dalam kasus tersebut, median dan semiinterquartile
Kisaran adalah langkah-langkah yang lebih baik dari posisi
dan lokasi. Beberapa distribusi yang tidak normal
atau binomial atau Poisson. Dua distro lain yang
dibandingkan dengan normal pada Gambar 1 2 0,4. Jika tidak biasa
distribusi dicurigai, maka ahli statistik
saran harus selalu diperoleh.
transformasi

sisik alami pengukuran tidak selalu


paling sederhana untuk menganalisis dan menginterpretasikan karena
mereka mungkin
menghasilkan distribusi non-normal. Namun, Gambar. 1 2.5 Contoh dari d
lognormal berubah i stribution.
Distribusi haemagglutination- i n h i menggigit titer anti body dari
kelompok 1 65 unggas domestik, 6 minggu setelah berada i noculated
dengan dosis tunggal i nactivated vaksin d virus isease Newcastle.
Rusak l i ne menunjukkan Norma l cu rve dipasang untuk hasil ini. (Dari
Herbert, 1 9 70.)
kadang-kadang mungkin untuk mengubah distribusi ini untuk
perkiraan Normalitas dengan mengubah cara di mana
variabel dinyatakan - biasanya dengan menaikkan
variabel untuk kekuatan sederhana atau dengan mengkonversi mereka
untuk
logaritma (Zar, 1996). Distribusi dimana
logaritma dari data yang Biasanya didistribusikan
disebut distribusi lognormal (Gambar 12 0,4). Ini
distribusi terjadi dalam biologi. Hal ini ditandai oleh
positif condong mirip dengan, tetapi tidak harus sama
sebagai, yang digambarkan pada Gambar 1 2 .3b. Contoh diberikan dalam
Gambar 12 0,5, yang menunjukkan distribusi frekuensi
titer antibodi terhadap virus penyakit Newcastle di divaksinasi
burung, diplot pada skala logaritmik. Pada kasus ini,
transformasi dilakukan dengan cara pengenceran serum

sampel logaritmis sebelum titrasi dilakukan,


awalnya mendasarkan 10 (10/01) dan selanjutnya ke
basis 2 (1/20, 1/40, 1/80, dll). Penerapan logaritmik
skala untuk penyelidikan serologis dibahas
dalam Bab 1 7. Wabah kurva (lihat Bab 8) dan
periode inkubasi sering lognormal (Sartwell,
1950, 1966; Armenia dan Lilienfeld, 1974). Dalam kasus ini
kurva epidemi, data (jumlah kasus baru)
diskrit, namun diperlakukan sebagai pengukuran kontinyu,
karena jumlahnya sering besar.
perkiraan normal terhadap binomial dan
distribusi Poisson
Ketika sampel besar, dan p tidak terlalu dekat dengan atau 1,
distribusi binomial dapat didekati dengan
Normal. pendekatan yang lebih baik ketika 'kontinuitas
koreksi 'yang diterapkan pada data binomial, untuk memungkinkan
sifat diskrit dari data, sedangkan distribusi normal
berhubungan dengan data kontinu. Demikian pula, ketika
sampel besar, distribusi normal menyediakan

Anda mungkin juga menyukai