Prinsip Analisis Data Edit
Prinsip Analisis Data Edit
1
Research gap,
Knowledge, research interest Ethics in
science and theory and ideas Research
Data mining
and collection
Data
Analysis
FOKUS KITA
Research
Writings 2
JENIS DAN KELUASAN ANALISIS
TERGANTUNG DARI:
2.Skala Pengukuran
3. Metode Sampling
4. Besar Sample
3
TOPIK PENELITIAN
VARIABEL
VARIABELDEPENDEN
DEPENDEN--YY
MENCARI
MENCARI HUBUNGAN
HUBUNGANATAU
ATAUPERBEDAAN
PERBEDAAN
DENGAN
DENGANVARIABEL
VARIABELLAIN
LAIN
VARIABEL
VARIABELINDEPENDEN
INDEPENDEN-- XX
XY 4
VARIABEL DEPENDEN(Y)
HASIL MENGUKUR
Y
KATEGORI
KATEGORI KONTINU
KONTINU
5
PENGUKURAN VARIABEL
HASIL MENGUKUR
X&Y
KATEGORI
KATEGORI KONTINU
KONTINU
6
HASIL UKUR
Y
VARIABEL
KATEGORI KONTINU
KATEGO
GORI-GORI GORI-TINU
RI
X
KONTINU TINU-GORI TINU-TINU
7
HASIL UKUR vs HIPOTESA
• Mencari hubungan kategori
– Ada hubungan merokok dengan kejadian
BBLR
– Berkaitan dengan risiko atau penyebab
• Mencari perbedaan kontinyu
– Ada perbedaan kadar kolesterol antara
kelompok intervensi dengan kelompok kontrol
8
HASIL UKUR vs
ANALISIS STATISTIK
• Gori-gori
– Chi-square
• Tinu-gori
– Regresi logistik
• Gori-tinu
– Gori 2 : uji T
• Tidak berhubungan- independen
• Berhubungan- related
– Gori 3 : uji Anova
• Tinu-tinu
– Korelasi, regresi linier
9
ANALISA UNIVARIAT
Mean, Median, Mode, Sd, Se, Range,
Min-Max, Skewness, Kurtosis
Boxplot; Stem-Leaf
Tujuan:
1. Deskripsi setiap variabel diteliti
2. Diagnosis asumsi statistik lanjut
3. Deteksi nilai ekstrim/outlier
ANALISIS BIVARIAT:
1. Diagnosis data
2. Uji Hipotesisi 2 var
10
ANALISIS BIVARIAT
skala NOMINAL ORDINAL Intv&Rasio
NOMINAL Chi-Sq.
Phi-Coeff.
Cramer's V
G-K Lambda
Relative Risk
Fisher's Excat
ORDINAL Chi-Sq. Chi-Sq.
G-K Lambda G-K Lambda
Kruskal-Wallis Kendal's Tau
Median test Spearman r
Sign Test Somer's d
Wicoxon Test
Somer's d
Kolmogorov
Runs test
INTERVAL Paired t-test Pearson-r
& RASIO ANOVA Regresi 11
ANALISIS MULTIVARIAT:
Umur
Umur
Jenis
JenisKelamin
Kelamin
Aktifitas
Aktifitasfisik
fisikdan
dan
olahraga
olahraga PERLEMAKAN
PERLEMAKAN
Hiperlipidemia
Hiperlipidemia HATI
HATI
Penderita
PenderitaDiabetes
Diabetes
Melitus
Melitus
Kegemukan
Kegemukan
Diet
DietLemak
LemakTinggi
Tinggi
14
Tahapan Analisis
• Identifikasilah desain atau cara pengumpulan
data:
– Primer (cross-sectional, cohort, dst.)
– Sekunder
– Sampling random
• Identifikasilah variabel-variabel yang menjadi
perhatian (berdasarkan substansi permasalahan)
• Buatlah deskripsi data untuk variabel-variabel
yang menjadi perhatian (grafik, tabel)
• Tentukan metode yang tepat
15
LATIHAN MEMILIH ALAT STATISTIK(1)
16
LATIHAN MEMILIH ALAT STATISTIK(2)
Kemampuan
substantif
UNSUR Mengetahui
DALAM alat-alat statistik
PENELITI HASIL DATA
Mengetahui hasil ANALISIS
komputasi
Tim Pakar
Substantif
UNSUR
PENDUKUNG Dukungan
statistician
18
MISI ANALISIS & PENYAJIAN HASIL
.Menjawab Masalah Penelitian; Tujuan & Hipotesis
(Menjawab Secara Efektif-efisien-elegan)
20
CONTOH TEKSTULAR
(ALINEA YANG BAIK)
21
ANALISIS UNIVARIAT
X&Y
22
Tabel No X:
Frekuensi Distribusi Variabel Karakteristik Responden
Variables Frequency %
1. Sex
Male 77 30.8
Female 173 69.2
2. Education
Illiterate 17 6.8
Elementary 74 29.6
TAMPILAN Junior High 61 24.4
Senior High 89 35.6
TABULAR Graduate 9 3.6
3. Type of Employment
Unemployed 1 0.4
Civil Servant 30 12.0
Public company 9 3.6
Military 11 4.4
Private company 79 31.6
Other 120 48.023
Tabel 7. Distribusi responden
menurut variabel penelitian
Variabel Frekuensi Persentase
N= 808
Perlemakan Hati:
Perlemakan Hati 247 30.6
Normal 561 69.4
Jenis Kelamin:
Pria 261 32.3
Wanita 547 67.0
Kategori umur
Umur Muda 202 25.0
Umur Menengah 379 46.9
Umur Tua 227 28.1
24
Interpretasinya
• Pada tabel 7. terlihat distribusi perlemakan hati
pada resoponden dapat dilihat pada tabel 6.
Hasil penelitian dilaporkan bahwa prevalensi
perlemakan hati sebesar 30.6%.
• Gambaran jenis kelamin responden dilaporkan
bahwa sebagian besar adalah wanita yaitu
sebanyak 67.7% (Berdasarkan katagori umur,
umur yang terbanyak adalah umur menengah
antara 41 sampai 55 tahun, 46.9 %, kemudian
umur tua, usia diatas 55 tahun, 28.1% (SE 1.84)
dan usia muda dibawah 40 tahun, 25 %
25
PENYAJIAN DATA
• Penyajian data PENDIDIKAN RESPONDEN
mempunyai prinsip
efisiensi, artinya Frequency Percent
sajikan hanya Valid Tdk sekolah 8 8.9
informasi penting SD tdk tamat 12 13.3
saja, jangan semua Tamat SD 24 26.7
output komputer Tamat SMP 26 28.9
disajikan dalam
Tamat SMU 16 17.8
laporan. Contoh
penyajian data Tamat D3/PT 4 4.4
kategorik sbb: Total 90 100.0
26
Contoh Interpretasi
• “Distribusi frekuensi tingkat pendidikan
responden dapat dilihat pada Tabel-1,
terlihat bahwa sebagian besar responden
adalah tamat SMP (28.9%), kemudian
diikuti oleh tamat SD sebanyak 26,7% dan
tamat SMU (17,8%).”
27
TAMPILAN TABULAR
Table :
Descriptive Values of Patient Characteristics
28
Interpretasi variabel dengan data
numerik/kontinyu
Descriptive Statistics
Pr
Pr
173 / 69%
173 / 69%
BarDiagram
Bar DiagramSex
Sexof
ofRespondents
Respondents
180
180
173
173
160
160
140
140
120
120
100
100
80
80
77
77
60
nn
60
Pr
Pr
Lk
Lk
30
SEX
GRAFIK LINGKARAN (PIE DIAGRAM)
31
Prevalensi Pneumonia Balita
5%
95%
32
Proporsi sakit TB pada anak SD kelas I, II, dan III dengan uji tuberkulin
positif di kota Padang
Umur
16.47% 14.12% 6 TH
7 TH
8 TH
> 8 TH
29.41%
40.00%
33
GRAFIK BATANG (BAR CHART)
Harus simpel dan self explanatory
- Harus disertai judul (mengikuti kaidah judul tabel), serta
sumber kutipan atau keterangan yang diperlukan
- Kurang memberikan informasi secara detail
- menggambarkan distribusi frekuensi data nominal atau
ordinal
- Sumbu horisontal adalah sumbu x (variabel
independen) dan sumbu vertikal adalah sumbu Y
(variabel dependen)
- Batang harus memiliki lebar yang sama dan terpisah
satu dan lain agar tidak menunjukkan adanya
kontinuitas
34
- Dapat juga untuk menggambarkan data dua variabel atau
lebih berskala kategorik dengan grafik balok berkelompok
(group bar chart) atau grafik balok bertumpuk
80 80
60 60
40
40
20
20 jenis kelamin
wanita
Percent
Percent
0 pria
0
40-59 60-69 70-79 >=80
40-59 60-69 70-79 >=80
kel umur
kel umur
140
120
100
80
60
40
jenis kelamin
Percent
20 pria
0 wanita
40-59 60-69 70-79 >=80
kel umur
2.9
2.8
Mean Score
2.8 Physician
2.8
2.7 Nurse
W M Physician
2.0
1.5
1.0
Physician
.5
0.0 Nurse
W M 37
SEX
KASUS TB ANAK DI RSCM &
RS M.JAMIL
Jumlah
Jumlah
350
160
300
140
250 120
200 100
150 80
60
100
40
50
20
0 0
2000 2001
KASUS
KASUS
38
Grafik garis
• Untuk mengilustrasikan hubungan dua
variabel kontinyu
• Digunakan bila tujuannya untuk melihat
kecenderungan, biasanya menurut waktu
• Garis penghubung antar titik akan
memperlihatkan bagaimana
kecenderungan fenomena
39
150
140
130
120
110
100
90
tekanan darah sistol
80 ik
M ean
70 td diastolik duduk
40-59 60-69 70-79 >=80
kel umur
XY
41
TAMPILAN TABULAR
42
Tabel . RERATA JUMLAH KOLONI ALBICANS
MENURUT KELOMPOK PENELITIAN
43
Interpretasinya
• Ada perbedaan signifikan rata-rata jumlah
koloni candida albicans pada kelompok
diare dan non diare dengan nilai p< 0.05.
Dimana rata-rata jumlah koloni candida
albicans lebih banyak pada kelompok
diare dibandingkan non diare
44
UJI BEDA 2 RERATA
(Uji-t)
Group Statistics
Std. Error
RESPON TX. N Mean Std. Deviation Mean
DERAJAT-ANGIO Lkp. 34 48.59 28.57 4.90
Buruk 16 40.63 18.22 4.56
45
Contoh analisis data bivariat
kategori
Hiperlipidemia
Hipertrigliserida 71 56.8 54 43.2 < 0.0001* 3.8 (2.6-5.5)
Normal 176 25.8 507 74.2 1
46
Interpretasi Hipertrigliserida
• Hiperlipidemia yang dilihat melalui kadar trigliserida
diduga berhubungan dengan perlemakan hati.
• Hasil penelitian dilaporkan bahwa proporsi responden
hipertrigliserida yang mengindap perlemakan hati
dengan sebesar 56.8%. Proporsi responden dengan
kadar trigliserida dalam darah normal sebesar 25.8 %.
• Hasil uji kai kuadrat dapat disimpulkan bahwa ada
hubungan antara perlemakan hati dengan
hipertrigliserida, dan nilai p < 0.0001.
• Dimana penderita hipertrigliserida berisiko 3.8 kali
mengalami perlemakan hati dibandingkan dengan kadar
trigliserida dalam darah normal (interval kepercayaan
95% 2.63; 5.46).
47
EKONOMI * SAKIT Crosstabulation
SAKIT
sakit TB/ tidak sakit
jumlah TB/ jumlah
skor >= 6 skor <6 Total
EKONOMI Tingkat ekonomi rendah Count 27 12 39
% within EKONOMI 69.2% 30.8% 100.0%
Tingkat ekonomi tinggi Count 8 13 21
% within EKONOMI 38.1% 61.9% 100.0%
Total Count 35 25 60
% within EKONOMI 58.3% 41.7% 100.0%
TABULASI SILANG
Chi-Square Tests
49
Tabel Hasil Penelitian
Pajanan/ Keluaran/penyakit Jumlah
paparan
Ada Tidak
Ada a b a+b
Tidak c d c+d
50
Besarnya hubungan
• Relative Risk
a /(a b)
PR
• Odds Ratio c /(c d )
a /( a b) a
Odds _ keluaran _ pada _ kelompok _ terpajan
b /( a b) b
c /(c d ) c
Odds _ keluaran _ pada _ kelompok _ tidak _ terpajan
d /(c d ) d
a / c ad
POR
b / d bc
51
Tabel 8. Hasil uji bivariat variabel independen dengan
variabel perlemakan hati
VARIABEL PERLEMAKAN HATI Nilai p OR dengan CI
Perlemakan hati Normal 95%
Frekuensi % Frekuensi %
Jenis Kelamin
Pria 87 33.3 174 66.7 0.254 1.2 (0.9–1.7)
Wanita 160 29.3 387 70.7 1
Kategori Umur
Umur Muda 31 15.3 171 84.7 < 0.0001* 1
Umur Menengah 141 37.2 238 62.8 < 0.0001* 3.3 (1.9-5.6)
Umur Tua 75 33 152 67 2.7 (1.6-4.5)
Pola konsumsi
Diet tinggi lemak 40 32.8 82 67.2 0.533 1.1 (0.8-1.7)
Diet rendah Lemak 207 30.2 479 69.8 1
Hiperlipidemia
Hipertrigliserida 71 56.8 54 43.2 < 0.0001* 3.8 (2.6-5.5)
Normal 176 25.8 507 74.2 1
Diabetes Melitus
Penderita DM 61 52.6 55 47.4 <0.0001* 3.0 (2.0-4.5)
Bukan penderita 186 26.9 506 73.1 1
Kegemukan
Kegemukan 193 47.4 214 52.6 <0.0001* 5.8 (4.2-8.0)
Tidak gemuk 54 13.5 347 86.5 1
Aktivitas fisik dan olah raga
Kurang aktif 210 31.2 464 68.8 0.416 1.2 (0.8 - 1.8)
Aktif 37 27.6 97 72.4 1 52
ANALISIS MULTIVARIAT
53
Contoh Analisis Multivariat
• Tujuannya adalah untuk mengetahui faktor-
faktor yang berhubungan dengan kejadian
perlemakan hati setelah dikontrol oleh variabel
lainnya.
• Analisis yang digunakan adalah regresi
logistik. Analisis ini merupakan model
matematik yang digunakan untuk mempelajari
hubungan beberapa variabel independen
dengan variabel yang bersifat dikotomus.
54
REGRESI LOGISTIK
• Fungsi logistik yang digunakan dengan rumus:
1
ƒ(z)
ƒ(z)==
• model regresi logistik dituliskan dalam bentuk 1 e z
penjumlahan linier
• Z = α +β1X1 + β2X2 + …+βkXk
• P(Perlemakan hati) =
1
( 1 1 2 2 .... k k )
1 e
55
•• Umur
Umur
•• Jenis
JenisKelamin
Kelamin
•• Aktifitas
Aktifitasfisik
fisik&olahraga
&olahraga
•• PERLEMAKAN
PERLEMAKAN
Hiperlipidemia
Hiperlipidemia
•• HATI
HATI
Penderita
PenderitaDiabetesMelitus
DiabetesMelitus
•• Kegemukan
Kegemukan
•• Diet
DietLemak
LemakTinggi
Tinggi
1.
1. Umur
Umur
2.
2. Hiperlipidemia
Hiperlipidemia PERLEMAKAN
PERLEMAKAN
3.
3. Penderita
PenderitaDiabetesMelitus
DiabetesMelitus HATI
HATI
4.
4. Kegemukan
Kegemukan
56
PROBABILITAS
• Seorang pria berumur 47 tahun sedang
melakukan general check up. Riwayat penyakit
dahulu dinyatakan menderita diabetes melitus,
dari pemeriksaan tinggi badan dan berat badan
dikategorikan kegemukan dengan IMT >25, dan
hasil pemeriksaan darah didapatkan kadar
trigliserida dalam darah diatas 200 mg/dl. Maka
probabilitas orang tersebut untuk menderita
perlemakan hati
57
PERHITUNGAN
• P=
1
1 e ( 2.662 0.833*1 0.576*0 1.142*11.106*11.558*11.134*1*1
• P= 0.715
58
Interpretasi
• Artinya pria tersebut mempunyai
probabilitas untuk terkena perlemakan hati
sebesar 71.5%.
59
TERIMA KASIH
60