Anda di halaman 1dari 33

Korelasi Regresi Linier

Sederhana dan Multiple


I Gde Raka Widiana
Part 1
Jenis analisis statistik
Pemilihan: Parametrik/non-parametrik
• Skala variabel: kontinyu, ordinal, nominal, deskrit
• Uji normalitas: normal/non normal
• Uji kesamaan variansi: sama/tidak sama
• Uji kolineiritas: hubungan antar variabel independen
Dasar-Dasar dan Aplikasi Biostatistika
Klinik
• Pada dasarnya statistik bertujuan untuk menganalisis studi
kedokteran:
• 1) meng-estimasi kuatnya hubungan atau besarnya perbedaan
(besarnya efek);
• 2) melakukan uji kemaknaan statistik (inferensi), menarik
kesimpulan mengenai populasi dari mana sampel itu diambil,
dengan memperhitungkan pengaruh peluang akibat variasi
sampel (probabilitas), dan
• 3) mengontrol pengaruh variable penggangu terhadap besar efek
(estimasi) dan inferensi.
Conceptual Framework
Function
Univariat

Indep var.
Depend var
(one or more)
Bivariat
Multivariat

Designs Type
Descriptive Continuous
Cross-sectional Interval
ratio
Case-control
Descrete
Cohort/eksperimental Nominal (gender,
Extraneous Var.
treatment, One or more
race) A,B,C etc
Ordinal (stage,
levels)
Function and type of the variables
Function
• Independent: associated factors
• Dependent: outcomes or end-points
Type
• Continuous
• Interval
• ratio
• Descrete
• Nominal (gender, treatment, race)
• Ordinal (stage, levels)
Univariable analysis
one dependent variable and no independent
variable.
Bivariable analysis
one dependent variable and one independent variable.
Multivariable analysis
one dependent variable and two or more independent
variables.
Figure . Flow chart to select a bivariable analysis for a continuous dependent variable

Continuous
dependent variable

Continuous Nominal independent


independent variable
variable

Independent variable Independent variable Independent variable from


from naturalistic or from naturalistic sample naturalistic or purposive
purposive sample sample

Slope and intercept Pearson’s correlation Difference between


coefficient means

Regression analysis Correlation analysis

F test Student’s t test Student’s t test


Beberapa poin perlu diingat kembali adalah:

• 1) sampel adalah individu yang diobservasi dan dilakukan pengukuran


menegnai karakteristiknya (variable);
• 2) populasi adalah kelompok individu yang lebih besar, dari mana
sampel itu diambil, dan dimana fenomena yang terjadi ingin
deketahui;
• 3) distribusi frekuensi (dalam bentuk grafik), menggambarkan
distribusi sampel yang dipakai penduga distribusi populasidari mana
sampel itu diambil.
Alur pemilihan uji statistic adalah sebagai
berikut:
• 1)tentukan variable dependen (umumnya satu variable dependen);
• 2) tentukan jumlah variable independen:
• a) bila tidak ada variable independen, statistik yang dipakai adalah analisis
univariat (deskriptif);
• b)bila ada satu variable independen, statistik yang dipakai adalah analisis
bivariat, dan
• c)bila ada lebih dari satu variable independen, statistik yang dipakai adalah
analisis multivariate
Distribusi frekuensi sampel
• dipakai memperkirakan tingkat representasi sampel terhadap
populasi.
• mempermudah beberapa uji statistik secara kuantitatif dapat
memperkirakan kualitas representasi sampel.
• Pada variable kontinyu, kualitas data ini ditentukan dengan mengukur
parameter gravitasi sentral (rerata atau median) dan penyebaran atau
disperse (simpang baku atau kuartil), yakni seberapa jauh data
individual berada dari posisi gravitasi sentral
Untuk memilih uji statistic yang spesifik,
pertimbangan yang terpenting adalah:

• 1) fungsi variable yakni, apakah independen dan dependen atau


variable pengganggu potensial.
• Kebanyakan hipotesis mengandung satu variable dependen dan satu atau
beberapa variable independen,
• 2) dan tipe atau skala variable (lihat bab skala variable).
Distribusi normal
dipakai untuk melihat kualitas data sampel terhadap populasi dari
mana sampel diambil.
• Bentuk ideal sama dengan distribusi populasi yakni berbentuk
lonceng
• sampel kecil dan variasi sampel besar (sampel heterogen berntuk
tidak ideal.
Uji normalitas
• Uji Kolmogorov-Smirnov, atau Shapiro-Wilks.
• Uji ini harus dilengkapi dengan grafik histogram yang memperlihatkan
distribusi frekuensi variabel.
• Grafik ini menilai normalitas distribusi empirik karena pada histogram
diberikan gambar kurva normal sebagai rujukannya.
• Dari gambar histogram dan kurva normalnya dapat dinilai, misalnya
kurva bersifat bimodal (dengan dua puncak), yang berarti data tidak
homogen dimana elemen data berasal dari dua populasi yang
berbeda.
Diagram hubungan variabel korelasi dan Regresi sederhana dan multipel

Var. independen 1

Var, Dependen
Var. independen 2

Var. independen 3
Gambar 1.2. Hubungan serentak antara
beberapa variabel independen-independen
dan variabel dependen (panel atas).
Hubungan antara satu variabel independen
dan satu variabel dependen,
namun meperhitungkan variabel lainnya
(panel bawah).
Part 2
Memilih analisis bivariat
Variabel Variabel Analisis Bivariat Analisis Keterangan
Independen Dependen Multvariat
Kontinyu Kontinyu Korelasi Pearson Korelasi Tentukan
(data normal) (data normal) ES: rho/rho2 Pearson persamaan
Regresi linier sederhana parsial/regresi regresi
ES: slope βx/intercept(β0) linier berganda
ES:
βxi/intercept(β0)
Kontinyu Kontinyu (non- Korelasi Spearman Korelasi
(non-normal normal atau ES: rho/rho2 Spearman
atau ordinal) ordinal) parsial
Var. kontinyu versus var Kontinyu
Pendekatan:
• Regresi Linier sederhana
• Korelasi
• Pearson (normal) atau
• Spearman(non-normal)
Gambar 2.3. Intercept β0 adalah nilai Yi saat X1 sama dengan nol, slope β1 adalah setiap unit perubahan y ( yang disebabkan oleh setiap unit perubahan x
( dengan demikian β1 = . Persamaan dihasilkan adalah Yi (expected) = β0 + β1 Xi. Y adalah nilai total veriabel dependen sampel ke i,
Yi adalah nilai estimasi variabel dependen sampel ke i pada persamaan linier, dan i adalah kesalahan (error) dari variabel dependen sampel ke i
Regresi linear Sederhana
• Sampel untuk analisis ini berlaku untuk sampel naturalistik atau purposif
persamaan garis lurus: Yi = α + βXi ,rerata variable dependen (Yi) untuk setiap
nilai variable independen (xi).
• Persamaan linier pada populasi: Yi = α + βXi, akan digambarkan dengan dua
parameter, yakni
• intercept (β) dan slope (α)
• Intercept adalah esimasi rerata variable dependen (Y) apabila variable
independen (X) sama dengan 0.; misalnya, nilai tekanan darah saat kadar
kreatinin serum=0.
• Slope adalah perubahan rerata variable dependen untuk setiap unit perubahan
nilai numerik dari variable independen, misalnya, berapa tekanan darah berubah
untuk setiap peningkatan satu mg/dl kadar kreatinin serum.
• uji signifikasi (hipotesis nol, tak ada hubungan linier) digunakan uji F
Korelasi
• Mengukur seberapa konsisten perubahan variebel independen diikuti oleh
perubahan variable dependen (hubungan kovariansi)
• Koefisien korelasi (r), menunjukkan kekuatan hubungan antara variable dependen
dan variable independen.
• Koefisien korelasi untuk variable kontinyu dinyatakan dengan Koefisien korelasi
Pearson yang nilainya berkisar antara -1 sampai dengan +1.
• Koefisien korelasi nol: idak ada hubungan antara variable independen dan
variable dependen.
• Korelasi positif: hubungan positif, artinya peningkatan variable independen diikuti
dengan peningkatan variable dependen, demikian sebaliknya penurunan variable
independen diikuti penurunan variable dependen.
• Korelasi negatif; hubungan negatif, artinya peningkatan variable independen
diikuti dengan penurunan variable dependen, demikian sebaliknya penurunan
variable independen diikuti peningkatan variable dependen.
Nilai r dan R2
• Kekuatan hubungan: menjadi kuadrat r atau R2, disebut dengan koefisien
determinasi.
• Misalnya R2 hubungan antara konsumsi garam dan tekanan darah diastolic
sama dengan 45%, itu berarti variasi tekanan darah dapat dijelaskan sebesar
45% oleh konsumsi garam, sisanya 55% dapat dijelaskan oleh factor lain
(yang tidak diketahui).
• Bila koefisien determinasi ini dinyatakan dengan nilai persen, maka ia
menyatakan persentase variasi pada variabel dependen yang dapat
dijelaskan oleh nilai variable independen-nya.
• Koefisien determinasi ini hanya dapat digunakan bila sampel penelitian
diambil secara random dari populasi.
• Korelasi antara variable dependen dan independen ditentukan dari besar
atau kuatnya hubungan itu (R2) dan signifikansi korelasi (nilai P).
Scatter diagram correlation and regression
y, dependent variable [age (years)]
58

56

54

52
Y=a + β X

50

48

46
Observed

44 Linear
80 90 100 110

x, independent variable [weight (kg)]


Diagram pencar hubungan korelasi (tanpa
garis)
Korelasi Antara Elastisitas Parenkim Hepar
(SWE) dan Indeks Fibrosis

R = 0,52

- Kekuatan korelasi sedang

- Korelasi positif = semakin tinggi


nilai indeks fibrosis maka semakin
tinggi juga nilai elastisitas hepar

P < 0,001
R = 0,52; R2 = 0,27; p < 0,001
Linear Regression with 95.00%
LVMI = 123.40 + 4.32 * adiponektin Individual Prediction Interval

R-Square = 0.16
300.00
LVMI (g/m2)

Persamaan regresi:
200.00
LVMI = a + βAdiponektin + e
A

100.00

5.00 10.00 15.00 20.00

adiponektin serum
Regresi linier berganda
• Regresi Berganda
• Korelasi Parsial
• statistic multivariate dipakai analisis korelasi dan regresi ganda variable
dependen kontinyu dapat diestimasi dengan beberapa variable independen
kontinyu.
• Dalam analisis regresi multipel, nilai rerata variable dependen kontinyu diestimasi
dengan persamaan linier (garis lurus) seperti regresi linier sederhana, hanya saja
variable independen-nya dua atau lebih.Misalnya, peneliti ingin mengetahui
hubungan antara laju filtrasi glomerulus (ml/menit) sebagai variable dependen
kontunyu berdasarkan indeks masa tubuh kg/m2, umur (tahun), dan tekanan
darah diastolic (mm Hg) dimana semua variable independen berskala kontinyu.
Dengan analisis regresi multiple, dihasilkan persamaan regresi:
• Laju filtrasi (ml/menit) = 72,74 +3,11 (indeks masa tubuh) – 1,15 (umur) - 0,23
(tekanan darah diastolik)
Uji Hipotesis
• Hipotesis nol omnibus = kesalahan tipe 1 (α) → Hipotesis nol, artinya
keseluruhan variable independen, tidak dapat mengestimasi variable
dependen (dengan Uji F)
• Koefisien regresi (β) pada persamaan regresihubungan antara
variable masing-masing independen dan variable dependen
• Estimasi (effect size) adalah β dan IK koefisien regresi.
Nilai Signifikansi (Nilai-P)

• Uji signifikansi (Nilai p) untuk masing-masing β: Uji F


parsial  menguji H0: β=0
• IK dan nilai-p adalah kesalahan tipe 1 ini, dipengaruhi
jumlah variable independen.
• Semain banyak variable independen, semakin besar
nilai-p.
Tabel Korelasi linier berganda
Hubungan antara variable dependen (eGFR) dan seluruh variable independen
(indeks masa tubuh, umur dan tekanan darah diastolik) dinyatakan dengan koefisien korelasi (R multiple), atau
koefisien determinasi (R2multiple).
misalkan, R2multipel=0,81, maka ini berarti 0,35 atau 35% dari eGFR pada sampel dapat
dijelaskan oleh indeks masa tubuh, umur dan tekanan darah diastolik., namun masing2 hubungan variabel
independen IMT, umur, dan TDD, dapat dinyatakan dengan r parsial dan nilai signifikansinya (nilai-p)

R2multiple=0,35, p<0,001
Korelasi Elastisitas Parenkim Hepar Terhadap Indeks
Fibrosis Setelah Dikontrol dengan Variabel Kontrol

Variabel Koefisien B SE (B) t R parsial Nilai-p

Indeks fibrosis 0,72 0,15 4,75 0,26 0,001

IMT (kg/m2) -0,20 0,12 -1,72 0,03 0,09

Jenis kelamin (perempuan) -1,62 0,74 -2,18 0,15 0,03

Riwayat antivirus (tidak) -0,68 0,73 -0,93 0,07 0,36

F model = 9,20; R = 0,61; R2 = 0,37; adjusted R2 = 0,33; SE: Standard error


Terima Kasih

Anda mungkin juga menyukai