Anda di halaman 1dari 96

STATISTIK DESKRIPTIF & INFERENSIAL

( DESCRIPTIVE & INFERENTIAL STATISTICS )


STATISTIK

DESKRIPTIF INFERENSIAL

ESTIMASI UJI HIPOTESIS

MEAN PROPORSI SATU DUA


SAMPEL SAMPEL
MEAN PROPORSI
POPULASI POPULASI
NUMERIK NUMERIK

BEDA 2 BEDA 2 KATEGORIK KATEGORIK


MEAN PROPORSI
POPULASI POPULASI
• Secara garis besar, statistik dibagi menjadi dua
komponen utama, yaitu Statistik Deskriptif dan
Statistik inferensial
• Statistik deskriptif menggunakan prosedur
numerik dan grafis dalam meringkas gugus data
dengan cara yang jelas dan dapat dimengerti
• Statistik inferensial menyediakan prosedur
untuk menarik kesimpulan tentang populasi
berdasarkan sampel yang kita amati
DESCRIPTIVE STATISTICS
• The goal is to organize and summarize data (Sorlie, 1995; p. 2)
• Descriptive statistics deals with the enumeration, organization, and
graphical representation of data (Kuzma, 2005; p.3)
• Example :
From Census of Indonesia we can arranged into tables and graphs that
describe the characteristics of the population at a given time (Kuzma,
2005; p. 3).

• Statistik Deskriptif membantu kita untuk menyederhanakan data dalam


jumlah besar dengan cara yang logis.
• Data yang banyak direduksi dan diringkas sehingga lebih sederhana dan
lebih mudah diinterpretasi.
dua metode dasar
dalam statistik deskriptif
• Pendekatan numerik
– Statistik ini memberikan informasi tentang rata-
rata dan informasi rinci tentang distribusi data

• Metode grafis
– lebih sesuai daripada metode numerik untuk
mengidentifikasi pola-pola tertentu dalam data
– pendekatan numerik lebih tepat dan objektif
– Saling melengkapi
Tiga karakteristik utama dari variabel
tunggal
• Distribusi data (distribusi frekuensi)
• Ukuran pemusatan/tendensi sentral (Central
Tendency)
• Ukuran penyebaran (Dispersion)
Distribusi Data
• Pengaturan, penyusunan, dan peringkasan
data dengan membuat tabel seringkali
membantu, terutama pada saat kita bekerja
dengan sejumlah data yang besar.
• Tabel tersebut berisi daftar nilai data yang
mungkin berbeda (baik data tunggal ataupun
data yang sudah dikelompok-kelompokan)
beserta nilai frekuensinya.
• Frekuensi menunjukkan banyaknya kejadian/kemunculan nilai
data dengan kategori tertentu.
• Distribusi data yang sudah diatur tersebut sering disebut
dengan distribusi frekuensi.
• Distribusi frekuensi dapat digambarkan dalam dua cara, yaitu
sebagai tabel atau sebagai grafik.

• Mengetahui distribusi data dari variabel yang kita ukur adalah


penting
• Distribusi data akan menentukan bagaimana data yang kita
miliki akan dianalisis
• Apakah data terlihat ok?
• Apakah variabel continuous bisa dibiarkan saja ataukah harus
dikelompokkan?
• Dari distribusi data kita bisa mendapatkan
ringkasan dari pengukuran statistik
• Untuk data yang bersifat continuous kita bisa
mendapatkan infromasi:
– Centrality: mean, median, modus
– Variability: range, percentiles, standard deviation
• Untuk data yang kategorikal kita bisa
mendapatkan:
– Frekuensi, persentase
Central tendency
• Setiap pengukuran aritmatika yang ditujukan
untuk menggambarkan suatu nilai yang mewakili
nilai pusat atau nilai sentral dari suatu gugus data
(himpunan pengamatan) dikenal sebagai ukuran
tendensi sentral
• Terdapat tiga jenis ukuran tendensi sentral yang
sering digunakan, yaitu:
– Mean
– Median
– Mode (modus)
Rata-rata hitung (Mean)
• Metode yang paling banyak digunakan untuk
menggambarkan ukuran tendensi sentral.
• Mean dihitung dengan menjumlahkan semua
nilai data pengamatan kemudian dibagi
dengan banyaknya data.
• Mean dipengaruhi oleh nilai ekstrem.
Median
• nilai yang membagi himpunan pengamatan
menjadi dua bagian yang sama besar, 50% dari
pengamatan terletak di bawah median dan 50%
lagi terletak di atas median.
• Apabila banyaknya pengamatan (n) ganjil,
median terletak tepat ditengah gugus data,
sedangkan bila n genap, median diperoleh
dengan cara interpolasi yaitu rata-rata dari dua
data yang berada di tengah gugus data.
• Median tidak dipengaruhi oleh nilai ekstrem.
Mode (Modus)
• data yang paling sering muncul/terjadi.
• Untuk menentukan modus, pertama susun
data dalam urutan meningkat atau sebaliknya,
kemudian hitung frekuensinya. Nilai yang
frekuensinya paling besar (sering muncul)
adalah modus.
• Modus digunakan baik untuk tipe data
numerik atau pun data kategorik.
• Modus tidak dipengaruhi oleh nilai ekstrem.
• Ukuran nilai pusat (average) merupakan nilai
pewakil dari suatu distribusi data, sehingga harus
memiliki sifat-sifat berikut:
– Harus mempertimbangkan semua gugus data
– Tidak boleh terpengaruh oleh nilai-nilai ekstrim.
– Harus stabil dari sampel ke sampel.
– Harus mampu digunakan untuk analisis statistik lebih
lanjut.

• Dari beberapa ukuran nilai pusat, Mean hampir


memenuhi semua persyaratan tersebut, kecuali
syarat pada point kedua, karena rata-rata
dipengaruhi oleh nilai ekstrem.
Kapan kita menggunakan mean,
median atau modus?
• Bila distribusi frekuensi data tidak normal
(tidak simetris), median atau modus
merupakan ukuran pusat yang tepat.
• Apabila terdapat nilai-nilai ekstrim, baik kecil
atau besar, lebih tepat menggunakan median
atau modus.
• Apabila distribusi data normal (simetris),
semua ukuran nilai pusat, baik mean, median,
atau modus dapat digunakan.
Namun, mean lebih sering digunakan
dibanding yang lainnya karena lebih memenuhi
persyaratan untuk ukuran pusat yang baik.
INFERENTIAL STATISTICS
• The goal is to draw inferences and reach
conclusions about data, when only a part of a
population, or sample, has been studied.
• A generalization is a principle deduced from
limited information (a sample) and extended
to a larger collection of observations (the
population)
• Example : polling pemilihan presiden

(Sorlie, 1995; p. 2)
STATISTIK INFERENSI
• Statistik inferensi bertujuan untuk menarik
kesimpulan karakteristik (Parameter) populasi
melalui perhitungan statistik sampel.
• Dasar : Teori Estimasi (pendugaan/penaksiran)
dan Teori Probabilitas ( peluang ).
• 2 bagian penting statistik inferensi : Estimasi
dan testing hipotesis
Statistik inferensial mempunyai dua fungsi:
 1) untuk estimasi,  2) menguji hipotesis.
Issue
• Berapakah rata rata ( rerata ) kadar gula darah
penderita Diabetes yang telah melaksanakan
pengobatan secara teratur selama 6 bulan ?
…..Estimasi
• Apakah ada hubungannya antara kadar gula darah
dengan keteraturan berobat penderita
Diabetes ? ...Estimasi dan test hipotesis
• Apakah ada perbedaan kadar gula darah antara
penderita Diabetes laki-laki dan perempuan yang
telah melaksanakan pengobatannya secara teratur
selama 6 bulan ? …..Estimasi dan test hipotesis
CONTOH - 1
• Seorang dokter anak ingin membuktikan bahwa pemberian
antipiretika parenteral disertai dengan kompres alkohol pada
anak febrile confulsion lebih cepat menghilangkan episode
kejang dibanding dengan diberi anti piretik parenteral saja
• Dari 100 penderita anak dengan febrile confulsion di bangsal
anak RS dibagi 2 kelompok masing-masing n1=50 dan n2=50.
Terhadap kelompok n1 diberikan injeksi parentral dengan
dosis sesuai berat badan dan umurnya dan disertai kompres
alkohol, sedang terhadap kelompok n2 diberikan antipiretika
parenteral sesuai standar . Hasil percobaan mengukur lama
sejak tindakan sampai hilangnya episode kejang selama 2 jam.
Hasilnya ternyata kelompok 1 rata-rata 30 menit sedang pd
kelompok 2 rata-rata 40 menit;
• APAKAH BENAR DUGAAN (HIPOTESIS) DOKTER ANAK TERSEBUT BAHWA
PEMBERIAN ANTIPIRETIK PARENTERAL DISERTAI KOMPRES ALKOHOL LEBIH
CEPAT MENGHENTIKAN KEJANG AKIBAT FEBRIS DIBANDING PEMBERIAN
ANTIPIRETIKA SAJA ?
Contoh - 2
• Seorang mahasiswa kedokteran mendapati konsep bahwa
beberapa titik akupunctur dapat menghentikan rasa mual
(nausea). Mhs tersebut mencoba efektifitas accupuncture
titik tersebut terhadap emesis gravidarum dibanding dengan
accupressure.
• 20 Ibu hamil dengan emesis gravidarum, dibagi menjadi dua
kelompok A dan B. Kelompok A, n1=10, diberikan
pengobatan akupunctur secara standar. Kelompok B, n2=10
diberi accupressure pada titik yang sama dengan waktu
yang sama. Hasilnya 4 dari 10 (40 % ) sampel kelompok A
menunjukkan tanda berhentinya emesis gravidarum ,
sedang dari kelompok B, hanya 3 dari 10 sampel ( 30 % )
• APAKAH BENAR DUGAAN (HIPOTESIS) MAHASISWA TERSEBUT BAHWA
PEMBERIAN AKUPUNCTURE LEBIH BERHASIL MENURUNKAN GEJALA
EMESIS DIBANDING AKUPRESSURE?
ESTIMASI…..?
• Proses menduga nilai PARAMETER dari nilai
STATISTICS
• Estimasi berhubungan dengan mendeskripsi
kan karakteristik (parameter) populasi
berdasarkan sampel.
• Statistik sampel (x,sd,p,r ) yang digunakan
untuk menduga parameter populasi (,,P,R )
disebut Estimator
• Nilai yang digunakan untuk menduga
parameter populasi disebut Estimit,rerata berat
badan 60 kg.
Prinsip dasar memilih estimator
• Untuk karakteristik kontinyu, estimasi dilakukan
dengan : Mean, simpangan baku atau koefisien
korelasi
• Untuk karakteristik katagori atau deskret , estimasi
pada umumnya dilakukan dengan proporsi
• Untuk karakteristik ordinal atau kontinyu yang tidak
terdistribusi secara normal, estimasi biasanya
dilakukan dengan Median atau Modus.
PRINSIP DASAR PENGEMBANGAN
FORMULA ESTIMASI

• Parameter : , P, dan R
– Statistics : x, p dan r
– Model distribusi teoretik : Distribusi Normal,
Distribusi t
• Parameter : 
– Statistik : s
– Model distribusi teoretik : Distribusi F
• Parameter : Distribusi jumlah sel
– Statistik : distribusi sel dari sampel
– Model distribusi teoretik : Chi-square (2)
LANGKAH :
– Apa parameter ( karakteristik populasi )
yang akan dideskripsikan (,P,R, ). Apa
dasarnya ?
– Pilih Sampel representatif (n) dari Populasi
(N)
– Hitung nilai statistik yg sesuai (x,p,r,s)
– Lakukan Estimasi nilai parameter  dari x,
 dari s , R dari r atau P dari p, dengan
teknik Estimasi yang sesuai
– Interpretasi hasil estimasi
Estimator
yang baik….?
1. Unbias
nilai hasil statistik sampel sama dengan nilai
parameter populasi. Mungkinkah ?
2. Effisien
Statistik sampel yang digunakan mempunyai
kesalahan baku paling kecil
3. Konsisten
Bila besar sampel bertambah nilai statistik sampel
akan lebih mendekati nilai parameter populasi.
Interval keyakinan
• Estimasi nilai parameter populasi tidak
mungkin tepat atau benar 100 % , mengapa ?
• Namun estimasi nilai parameter populasi dari
statistik sampel dapat dipercayai atau diyakini
terletak diantara rentang nilai statistik
• Rentang nilai statistik didasarkan pada tingkat
keyakinan : interval keyakinan yang kita
inginkan ( confidence interval ) apakah 90 % ,
95 % ataukah 99 %.
Contoh
• Andaikan rerata kadar gula darah 60 penderita
Diabetes ( sampel ) yang telah berobat teratur
selama 6 bulan sebesar : 150 mg %, dengan
simpangan baku : 10 mg %.
• Andaikan Interval keyakinan 95 %, nilai reratanya
terletak 140 – 160 mg %, artinya kita yakin 95 %
bahwa rerata kadar gula darah
sesungguhnya penderita Diabetes yang telah
berobat teratur selama 6 bulan terletak
antara 140 mg % dan 160 mg %
Macam Estimasi
1. Estimasi satu populasi
a. Nilai rata – rata
- Point estimasi atau interval estimasi
b. Nilai proporsi
- Point estimasi atau interval estimasi
2. Estimasi dua populasi
a. Perbedaan nilai rata – rata
- Interval estimasi
b. Perbedaan proporsi
- Interval estimasi
PROSES ESTIMASI
SAMPLE
POPULASI
ESTIMASI x 1, p 1
• , P

X 1 - 1,96 . SE X1    X1  1,96 . SE X1

x1  x 2
x2, p2

X2 - 1,96 . SE X    X2  1,96 . SE X
2 2

ESTIMATION OF PARAMETER FROM STATISTICS


PROSES ESTIMASI SATU POPULASI

SAMPLE
POPULASI
ESTIMASI n1 x 1, p 1
• , P
Point Estimate
of Population Mean
n1
X1 - 1,96 . SE x    X1  1,96 . SE x
1 1
S
SE X 
n
Lower 95% Interval Estimate of
Confidence Limit Population Mean

95% Confidence Coeficient

ESTIMATION OF PARAMETER FROM STATISTICS


ESTIMASI PARAMETER DUA POPULASI

POPULASI-1 x1

1 ? p1

P1 ?

• x1  x2 ? • 1 = 2 ?

POPULASI-2 • p1 = p2 ? • p1 = p2 ?

2 ?
P2 ?
x2
p2
SE p =  p (1-p) /n
Contoh Estimasi satu populasi
Dalam suatu daerah tertentu berat badan waktu lahir bayi
Laki-laki tersebar secara normal dengan  = 3,3 Kg ,  =0,5.
Dari sampel acak 100 bayi laki-laki yang lahir dari kelompok
Etnis tertentu mempunyai berat waktu lahir = 3,2 Kg.
Apakah berat rata rata waktu lahir bayi laki laki dari sub kelompok
etnis berbeda dengan berat rata rata waktu lahir didaerah tsb ?
(X - ) Z= (3,2 –3,3) / (0,5 /100) = 2
Z= --------- Z hitung > 1.96
 / n
Apabila tingkat kepercayaan 95 % ….. Nilai Z = 1,96
Kesimpulan secara statistik berbeda bermakna
Berapa peluang untuk mendapatkan bayi lahir dengan BB > 3,2 Kg ?
MENGHITUNG LUAS AREA DIBAWAH KURVA
NORMAL

• Lihat tabel 6.1 hal 70 Kuzma


• z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
• 1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621
• etc
• 1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4812 .4817
• etc
• 2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4963 .4964

.3413

A = 0.500 - .3413 = 0.1587

Z=0.0 1.0
TEST OF TWO INDEPENDENT SAMPLE
MEANS

• DATA-1: n1, X1, S1 • DATA-2: n2, X2, S2


• ex : n1=30, X1=11,4 dan • ex: n2 = 40, X2= 10,0 dan
S1=1,2; S2=1,5

Is 1  2 ?
x1 - x 2 - 0
2 2
s (n1 - 1)  s (n 2 - 1) t
Sp  1 2
sp 1/n1  1/n 2
n1  n2  2

IF t computed > t(n1 - n2 - 2),=0.05 then 1  2


IF t computed  t(n1 - n2 - 2), =0.05 then 1 = 2
CONTOH - 1 (Kuzma, p.113-114)
Apakah Olah Raga Jogging meningkatkan VO2 max ?
(A) Joggers group (B) Non-Joggers group
n1=25; x1=47.5 ml/Kg; s1=4.8 n2=26; x2=36.5 mg/Kg; s2=5.1

4,82 . (25 - 1)  5,12 . (26 - 1) 1203,21


Sp    4,96
25  26 - 2 49

47,5 - 37,5 - 0 10.00


t computed    7,2
4,96 1/25  1/26 1,39
t ( n1n 2 2 ),   0.05  t 49, 0.05  2,58 (Kuzma, Table 7.2, p 85 : col.3, row

SINCE t computed > t (n1+n2-1), 0.05 THEN IT IS TRUE THAT JOGGERS


GROUP HAS HIGHER VO2 MAX THEN NON JOGGERS GROUP.
TEST OF TWO RELATED OR PAIRED SAMPLE
MEANS (Kuzma, p 118)

• Apakah olah raga jogging meningkatkan VO2 max?


– 40 mhs non-joggers diukur vo2 max(n=40, x1=47,5 dan s1=4,8);
Kemudian di masukkan DIKLAT untuk dilatih jogging 1 jam per
hari selama 1 bulan, kemudian diukur vo2maxnya (x2=37,5 dan
s2=5,1).
– SOLUTION :
• Hitung selisih VO2max sebelum dan sesudah latihan jogging
sehingga didapat rata-rata perubahan VO2max (d) dan
Standard Deviasi perubahan VO2max (sd);
• Hitung tcomputed = (d - 0) / [sd/n]
• IF t computed > t (n-2),  =0.05 THEN Jogging increase VO2max;
Otherwise Jogging has no effect on VO2 max.
DIKLAT
Jogging
Non Non Jogger
Jogger Post
n = 40 Diklat

x1 = 47,5 ml/kg d x1 = 37,5 ml/kg


s1 = 4,8 ml/ kg s1 = 5,1 ml/ kg

•tcomputed = (d - 0) / [sd /n]


TEST OF TWO INDEPENDENT PROPORTION
(Kuzma, p 135-138)

• Seorang Dokter Puskesmas melakukan kampanye


anti rokok pada orang laki-laki dewasa pada
tahun 1965-1980. Pada awal 1965, dipilih 100
lelaki dewasa, ternyata 51 orang adalah perokok.
Tahun 1980, dari 100 lelaki yang dipilih secara
acak, ternyata 43 orang perokok.
• PROBLEM : Apakah kampanye anti rokok berhasil
menurunkan proporsi perokok dikalangan lelaki
dewasa ?
SOLUTION
• n1=100; p1 = 0,51; n2=100; p2 = 0,43;
• pgabungan = p’ = (p1,n1+p2.n2)/(n1+n2) = (51+43)/200=0.47
• q GABUNGAN = q’ = 1-p’ = 1 - 0.47 = 0.53
• SE(p1-p2) = [(p’q’/n1)+(p’q’/n2)]=
[(0,47.0,530/100)+(0,47.0,53/100)] = 0.071
• Zcomputed = (p1-p2-0)/[SE(p1-p2)] = (0.51 - 0.43) / 0.071 = 1.13
• IF you decide to use 95% confidence interval, Z tables = 1,96 and
for 99% confidence interval, Z tables = 2.86;
• IF Z computed > Ztables, THEN most probably p1 p2
• IF Z computed  Z tables, THEN most probably p1 = p2
PEMILIHAN METODA STATISTIK
BEDA DUA POPULASI

• Dependent variabel = quantitatif, Independent = nominal


(kualitatif)
– Dua populasi Independen (beda rata-rata prestasi akademik
mahasiswi vs mahasiswa)
• Independent t - test
– Dua populasi berpasanganatau paired (beda rata prestasi
mahasiswa sebelum dan sesudah kursus)
• paired t-test
• Dependent variabel = qualitatif, Independent = nominal
(kualitatif)
– Beda proporsi dua populasi independen
• Beda p
• Chi-square
– Beda proporsi dua populasi paired : McNemar Test
( TESTING HYPOTHESIS )
HIPOTESIS……?
• Pernyataan atau kesimpulan atau dugaan
sementara tentang keadaan populasi.
• Hipotesis menyatakan parameter populasi
dari variabel yang terdapat dalam populasi
dan dihitung berdasarkan statistik sampel
• Hipotesis selalu dirumuskan terlebih dahulu
sebelum pengambilan sampel
Mengapa perlu diuji dan Apa yang di
uji…?
• Hipotesis mungkin benar atau mugkin tidak benar
( ketidak pastian )
• Pengujian dilakukan dengan membandingkan hasil
statistik sampel dengan nilai hipotesis.
• Bila perbedaan nilai statistik dengan nilai hipotesis
tersebut kecil kita menerima hipotesis.
• Tetapi bila perbedaan nilai tersebut besar maka kita
menolak hipotesis.
Pengujian hipotesis apakah merupakan
pembuktian kebenaran ?

• Pengujian hipotesis secara statistik berupa


menerima atau menolak hipotesis null (Ho)
• Statistik sama sekali tidak melakukan
pembuktian kebenaran.
• Dasar pengujian hipotesis adalah probabilitas.
Hipotesis Null vs Hipotesis Kerja
 Hipotesis kerja ( Alternatip,Scientific ), H1, Ha:
* Hipotesis yang dirumuskan peneliti
* Hipotesis yang akan diuji

 Hipotesis Null ( Ho ) :
* Hipotesis yang akan di uji dengan perhitungan statistik.
* Pada uji statistik diformulasikan untuk tidak diterima.
* Biasanya formulasinya :
* Tidak ada perbedaan dua atau lebih variabel
* Tidak ada hubungan dua atau lebih variabel
* Persamaan dua atau lebih variabel
* Berlawanan dengan hipotesis kerja
Power
Probabilitas untuk menolak hipotesis nol ( menerima
hipotesis kerja ) dan sesungguhnya pada populasi ada
perbedaan. PADA POPULASI
berbeda tak berbeda

HO Kesalahan
POWER Type I
ditolak 5%
(1–)
UJI
( berbeda) ( ) 1%
HIPOTESIS Kesalahan
Type I I (1-)
HO
diterima (  ) 5 – 20 %
(tak beda )
BENTUK PENGUJIAN : SATU ARAH atau DUA ARAH

Penerimaan
Penolakan H0 Penolakan
H0 H0
0.025 μ 0.025
( 2,5 % ) 95 % ( 2,5 % )
α -1.96 s x +1.96 s α

 = 5 % atau p = 0.05 ;  = 1 % atau p = 0.01


H0 : sama / tak ada beda / tak ada hubungan ( uji dua arah )
H0 : lebih besar dari / lebih kecil dari ( uji satu arah )
Parameter yang diuji
Uji nilai rata-rata hitung ( Mean ):
- independen
- pasangan ( paired )
 Uji Variabilitas terhadap Mean ( Varian )
 Uji nilai Proporsi
 Uji koefisien korelasi ( r )
 Uji Regresi
Klasifikasi Statistik pengujian hipotesis
• Parametrik :
– Focus pada parameter populasi
– Data kuantitatip
– Skala ukur variabel paling sedikit dengan skala interval
– Asumsi populasi berdistribusi normal
• Non Parametrik :
– Data kualitatip
– Tak berasumsi distribusi normal populasi
– Tak terikat pada satudistribusi
– Dasar analisa peringkat
Bentuk pengujian hipotesis
• Komparasi : Perbedaan
• Hubungan variabel :
– Hubungan assosiasi
– Hubungan korelasional
– Hubungan timbal balik ( relationship ) ….Regresi
UJI t INDEPENDENT
• KOMPARASI NILAI MEAN SATU VARIABEL
INDEPENDENT DAN SATU VARIABEL
DEPENDENT
• INDEPENDENT VAR : SKALA NOMINAL
• DEPENDENT VAR ; SKALA NUMERIK
Bivariate test
• Independent t - test
• Dependent t – test ( paired t- test )
• Anova
Uji t untuk satu variabel bebas
Ho : Tidak ada perbedaan kadar Cholesterol darah siswa SD di
daerah perkotaan dengan Siswa SD di daerah pedesaan.
Level sign : 95 % ( p = 0.05 )

SD n = 100, Rerata Kolesterol = 182 mg/ml


Urban sd = 19,2

SD
Rural n = 100, Rerata kolesterol = 160 mg/ml, sd = 22,4

Uji t independen, df = 198, p= 0,0032 Tolak Ho. INTERPRETASI ?


PAIRED t-test
• KOMPARASI NILAI BEDA MEAN ( Mean Differences ) ANTARA
SATU VARIABEL INDEPENDEN DAN SATU VARIABEL
DEPENDEN.

SD MEAN CHOL MEAN CHOL


URBAN AWAL AKHIR
d1
KOMPARASI
d

SD MEAN CHOL MEAN CHOL


RURAL AWAL AKHIR
Uji t untuk data pasangan.

Ho: tidak ada perbedaan tekanan darah antara sebelum dan sesudah
pemberian obat X.

Before After differences


132 136 4
160 130 - 30
145 128 - 17
.. … ….
134 136 2
123 111 -12
- dihitung Mean differences dan Sd differences
- gunakan statistik t test dari differences
- interpretasi hasil p lebih kecil atau lebih besar dari 0.05
Anova test
• Komparasi nilai mean dari satu variabel
independent yang terbagi dalam sub grup
dan satu variabel dependen
• Independent var : skala nominal
• Dependent var : skala Numerik
ANOVA : Analysis of Variance
Kita akan meneliti hubungan antara ibu merokok dengan
berat badan bayi yang dilahirkan untuk berbagai
Kelompok perokok

Tidak merokok I pak sehari > 1 pack

n = 10 n = 10 n = 20
Nilai BB bayi nilai BB bayi nilai BB bayi
Mean BB Mean BB Mean BB
komparasi
Chi-Square test
CHI-SQUARE TEST

• DATA KUALITATIP
• DATA KATEGORI ( SKALA KONTINUE KE SKALA
KATEGORI )
• HUBUNGAN (ASSOCIATION ) ANTARA DUA
VARIABEL
• DASAR : KOMPARASI FREKWENSI PENGAMATAN
( OBSERVED FREQUENCIES ) DENGAN FREKWENSI
YANG DIHARAPKAN ( EXPECTED FREQUENCIES
• NON PARAMETRIK TEST
EXPECTED FREQUENCIES dan
OBSERVED FREQUENCIES
• Ambil satu uang logam dan lemparkan keatas
kemudian tangkap kembali dengan telapak tangan
kanan lalu tutup dengan telapak tangan kiri. Coba
tebak yang menghadap keatas apakah Gambar
atau Angka yang sdr inginkan ? Sekarang buka dan
lihat apakah sesuai dengan yang sdr inginkan ?

FORMULA :
X² =  ( O – E )² / E dengan
Derajat bebas ; ( k – 1 ) ( b – 1 )
Bandingkan dengan Nilai X² tabel
Penggunaan
Chi-Square test

• Independensi antara dua variabel (association test)


• Homogenitas berbagai subgroup (homogenity test)
• Perbedaan antara dua proporsi (significancy test
between two proportion )
• Nilai pengamatan apakah mengikuti salah satu
distribusi tertentu (Goodness of fit test)
Test association
• dr. X ingin mengetahui apakah dikalangan remaja
perokok juga peminum kopi ?
• Apakah pada ibu hamil yang minum alkohol
berpengaruh terhadap berat badan bayi yang
dilahirkannya ?
• Apakah ada hubungannya antara lama belajar
dengan Indeks Prestasi ?
• Bila X² hitung > X² tabel : ada assosiasi antara dua
variabel
Test homogenity
• Apakah berbagai kelompok etnis ada
hubungannya dengan merokok ?
• Apakah ada hubungan antara berbagai status
sosial ekonomi dengan kebiasaan
mengkonsumsi narkoba ?
• Bila hasil X² hitung > X² tabel : hasil
pengamatan dari berbagai sub kelompok
tersebut berbeda.
Test significancy of two proportion
• Apakah ada perbedaan antara kelompok yang diberi
vit. C dengan kelompok yang diberi placebo terhadap
penyakit influensa ?
• Apakah ada perbedaan antara kelangsungan berobat
dengan kesembuhan penyakit TBC ?
• Interpretasi : Bila hasil X² hitung > X² tabel : ada
perbedaan antara proporsi dua variabel
Test goodness of fit
• Apakah distribusi pengamatan dari data yang
dikumpulkan antara variabel merokok mengikuti
pola distribusi normal pada populasi ?
• Formula : X² =  ( O² / E ) – N
• Bila hasil X² hitung > X² tabel : Frekwensi
distribusi variable tersebut mengikuti distribusi
Normal .
Ketentuan pemakaian
Chi - Kuadrat
• Jumlah sampel harus cukup besar
• Pengamatan bersifat independen
• Digunakan pada data deskrit atau data kontinyu yang
telah dikelompokkan menjadi kategori
• Jumlah frekwensi yang diharapkan harus sama
dengan jumlah frekwensi yang diamati
• Pada derajat bebas sama dengan 1 tidak boleh ada
nilai expected < 5
Keterbatasan
Chi-Square test
• Bila salah satu cell expected frek kurang dari
5  tak dapat digunakan gunakan Fisher
test.
• Tidak dapat menunjukkan kekuatan
hubungannya
• Tidak dapat menyimpulkan hubungan sebab
akibat
Contoh :Uji hipotesis untuk proporsi

Uji Kai – kuadrat ( CHI SQUARE )

Ho : tidak ada perbedaan kesembuhan terhadap penderita


typhus abdominalis antara obat baru dengan obat standar.

50 pend typh abd diberikan obat standart , sembuh 38


50 pend typh abd diberikan obat baru , sembuh 41
Apakah perbedaan ini bermakna ?

Dasar :
- Menilai perbedaa nilai expected dan pengamatan ( observed )
- Tak dapat dihitung reratanya
- Menyatakan assosiasi
Sembuh tak sembuh

Standar 38 (a) 12 (b) 50

Baru 41 (c) 9 (d) 50

79 21 100

Chi Square test : 0,01 < p < 0,05


Ea = (a+b)(a+c) / (a+b+c+d)
Eb = ((a+b)(b+d)/ (a+b+c+d)
KORELASI - REGRESI
* Salah satu teknik untuk melihat hubungan yang terjadi
antara satu variabel dengan variabel yang lain.

Derajat hubungan yang terjadi : KORELASI

KORELASI tidak menunjukkan hubungan sebab akibat


timbal balik

* Apabila kita akan melakukan prediksi variasi nilai dari


variabel dependen akibat variasi dari veriabel
independen

Kita gunakan : teknik REGRESI


SAMPEL

VARIABEL VARIABEL
X Y

INDEPENDEN DEPENDEN

1. hubungan antara variabel X dan variabel Y …….. korelasi


2. besar derajat hubungannya ………koefisien korelasi
3. perubahan var X memberikan perubahan var Y …Regresi
Diagram Scatter :
Y
Y **
* **** **
* * * ***
** * **
** X
X
Tak ada hubungan Hubungan positip

Y
***
***
***
***
X
Hubungan negatip
Korelasi
derajat hubungan atau kekuatan hubungan antar variabel
diukur dengan KOEFISIEN KORELASI ( r )

* harga Koefisien korelasi : +1,0 dan -1,0

Interpretasi Koefisien korelasi ( r )

antara 0,8 - 1,0 = kuat


0,5 - 0,8 = sedang
0,2 - 0,5 = lemah
0,0 - 0,2 = dapat diabaikan
Pembatasan koefisien korelasi :

1. Jumlah pengamatan variabel harus sama, atau kedua nilai


variabel tersebut berpasangan.

2. Secara relatip makin besar koefisien korelasi makin tinggi


derajat hubungan antar variabel, dan sebaliknya.

3. Pola hubungan yang terjadi diasumsikan hubungan linier

4. Koefisien korelasi memperlihatkan adanya kekuatan hubungan


sebab akibat antara variabel yang diukur.

5. Jenis datanya kuantitatip ( numerik )


Teknik korelasi yang paling sering digunakan :

1. Korelasi produk momen dari Pearson


2. Korelasi rank Spearman
3. Korelasi biserial
Korelasi Pearson :

* Bila variabel X dan variabel Y : variabel Interval / Rasio ( Numerik)


* Formula :
[ n XY - ( X ) ( Y)]
r = ------------------------------------
 n  X 2 - (X ) 2  ( n Y2 - (  Y ) 2

- Hubungan antara kadar cholesterol serum dengan


tekanan darah sistolis
Korelasi Spearman :

* Variabel dalam skala ordinal ( Nominal )


* Nilai variabel diatur dalam bentuk ranking kemudian dicari
beda dari masing masing pengamatan

* Formula :

6 d12
rs = 1 - -----------
N3 - N
Korelasi biserial :

* Salah satu variabelnya dianggap sebagai variabel dichotomi

* Formula :
_
Xp - X p.q
r = ----------- [ ------- ]
Sx Y

* Contoh : Hubungan IQ dengan kelulusan

data : 60 % lulus akhir tahun kuliah


40 % tidak lulus
Mean IQ lulus = 120
Mean IQ tidak lulus 110
Analisa Regresi
*Regresi sederhana : 2 variabel Int,Var
* Multiple regresi : lebih dari 2 variabel

Bila pola hubungannya dinyatakan dalam bentuk linier


disebut sebagai regresi linier

Bila hubungannya dinyatakan dalam bentuk tidak linier


( Fungsi logaritmik, kwadratik dsb ) disebut regresi non linier

* Hubungan cause dan effek

•Regresi seyogyanya dilakukan bila antar variabel menunjukkan


korelasi, baik korelasi positip ataupun korelasi negatip.
Regresi linier sederhana :

Populasi : Y = A + BX

Sampel : Y = a + bx

Y = Variabel tidak bebas


X = Variabel bebas

A atau a = intercept, bilangan konstan rata rata nilai Y jika


variabel X = 0

B atau b = Koefisien regresi, bilangan yang menyatakan


besarnya perubahan Y jika X berubah 1 unit
Contoh :
Jumlah balita tingkat kematian
di immunisasi ( X ) per kabupaten ( Y )
18 96
20 90
25 80
30 70
33 69
35 60
38 58
40 50

n XY - ( X ) (Y) Y X
b= --------------------- a = Y bx = ---- - b ----
n X2 - (X)2 n n
Buat tabel :

X Y X2 XY

18 96 324 1728
20 90 400 1800
dst
239 573 7607 16209

n XY –[ ( X ) (Y)]/n Y X
b= --------------------- a = Y bx = ---- - b ----
X2 – [(X)2 ] / n n n

b = - 1,95 a = 129,8
Y = 129,8 – 1,95 X Bila immunisasi = 50
Y = 129,88 - 1,95 ( 50 ) = 32,8 = 32 ( tingkat kematian )
Statistik
Non Parametrik
Assumsi
Non Parametrik

• Sampel dari distribusi bebas / tidak


berdistribusi normal / tidak bergantung
distribusi populasi
• Tidak tahu distribusi populasi
Keuntungan
Non Parametrik

• Tidak ada pembatasan normalitas


• Dapat dipakai untuk sampel dari distribusi
normal
• Metode lebih mudah
• Dapat menggantikan data numerik dengan
jenjang
• Cocok untuk data berskala nominal atau
ordinal.
Kerugian
Non Parametrik
• Mengabaikan beberapa informasi tertentu,
mis : 125,47 140,62 145,34 bila angka
terakhir 145,34 berubah menjadi 2145,34
maka tetap pada jenjang ke 3.
• Power kurang
• Tidak di ekstrapolasi ke populasi studi
Metode
Non Parametrik

• Uji tanda ( sign test )


• Sign Rank test ( Wilcoxon )
• Rank Sum Test ( Wilcoxon )
• Rank Correlation Test ( Spearman )
• Fisher Probability exact test
• Mc Nemar test
• dll
NILAI RANKING
25 ------ 2 3

34 3 45

20 1 1.5

20 1 1.5

45 5 67

35 4 5 6

34 3 4,5

Arti dari ranking


Uji Tanda
• Hasil pengamatan didasarkan pada tanda (+)
atau (-) bukan pada besarnya nilai numerik.
• Nilai lebih besar dari Md diberi tanda + , nilai
lebih kecil Md diberi tanda – , nilai sama
dengan Md = 0
• Ho : diharapkan tanda ( + ) sama dengan
tanda ( - ) atau 50 % tanda ( + ) dan 50 %
tanda ( - )
• Jika ada perbedaan tanda, apakah memang
berbeda atau kebetulan.
Contoh Uji Tanda
• Obat A untuk menghilangkan nyeri , Md
penyembuhan = 8 jam, apakah kombinasi
obat A dan B mempercepat penyembuhan ?
• Sampel = 11 pasien
• Derajat kepercayaan 95 %
• Ho : Md populasi = Md sampel
• Dibuat urutan nilai pengamatan :
6 7 8 9 10 10 10 11 11 12 12
- - 0 + + + + + + + +
• Terdapat 2 (-) dan 1 ( 0 )
• Tabel uji tanda n=10 --- 1 dibuang krn 0
• Alpha = 5 % -----nilai ( - ) = 1
• Ho tidak ditolak ---- tak ada perbedaan
statistik
• Uji sampel berpasangan … Wilcoxon Sign Rank
Test
• Uji sampel tidak berpasangan …. Wilcoxon
Rank Sum Test
• Korelasi -----Spearman Correlation
• Variabel dalam % dan nilai ekspektasi < 5
• Fisher :
(a+b) ! (c+d)! (a+c ) ! ( b+d) !
N ! a ! b! c! d !
MULTIVARIATE ANALISA
• Independent variabel atau dependent variabel
lebih dari dua
• Misal :
– IV : 2+ , DV : 1
– IV : 1 , DV : 2 +
– IV : 2 + , DV : 2+
TEST MULTIVARIATE
• MULTIPLE KORELASI
• MULTIPLE REGRESI
• MULTIPLE LOGISTIK KORELASI
• MULTIPLE LOGISTIK REGRESI
• MULTIVARIATE ANALYSIS OF VARIANCE
( MANOVA )
• ANALISIS FAKTORIAL
• DESCRIMINANT ANALYSIS
GUIDE TEST STATISTIK

Variabel TEST
Bebas Tak bebas

Nominal Nominal Kai-kuadrat, uji Fisher


Nom ( dikotom ) Numerik Uji t independen, pasangan
Nom ( > 2 nilai ) Numerik ANOVA
Numerik Numerik Korelasi, regresi
Variabel bebas lebih dari satu

Variabel Metode
Bebas Tak bebas

Nominal Numerik ANOVA


Numerik Numerik Multiple regresi
Nom + Numerik Nom (dikotom) Regresi Logistik

Anda mungkin juga menyukai