Anda di halaman 1dari 46

UJI KORELASI &

REGRESI LINIER

Arfiyan Sukmadi
NIM. P1337420815009
STATISTIKA
 Penggunaan istilah statistika berakar dari istilah istilah dalam bahasa
latin modern statisticum collegium ("dewan negara") dan bahasa
Italia statista ("negarawan" atau "politikus").
 Gottfried Achenwall (1749) menggunakan Statistik dalam
bahasa Jerman untuk pertama kalinya sebagai nama bagi kegiatan
analisis data kenegaraan, dengan mengartikannya sebagai "ilmu
tentang negara (state)". Pada awal abad ke-19 telah terjadi
pergeseran arti menjadi "ilmu mengenai pengumpulan dan klasifikasi
data". Sir John Sinclair memperkenalkan nama (Statistics) dan
pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip
mula-mula hanya mengurus data yang dipakai lembaga-lembaga
administratif dan pemerintahan. Pengumpulan data terus berlanjut,
khususnya melalui sensus yang dilakukan secara teratur untuk
memberi informasi kependudukan yang berubah setiap saat.
 Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan
bidang-bidang dalam matematika, terutama peluang. Cabang statistika yang
pada saat ini sangat luas digunakan untuk mendukung metode ilmiah,
statistika inferensi, dikembangkan pada paruh kedua abad ke-19 dan awal abad
ke-20 oleh Ronald Fisher (peletak dasar statistika inferensi), Karl Pearson
(metode regresi linear), dan William Sealey Gosset (
meneliti problem sampel berukuran kecil). Penggunaan statistika pada masa
sekarang dapat dikatakan telah menyentuh semua bidang ilmu pengetahuan,
mulai dari astronomi hingga linguistika. Bidang-bidang ekonomi, biologi dan
cabang-cabang terapannya, serta psikologi banyak dipengaruhi oleh statistika
dalam metodologinya. Akibatnya lahirlah ilmu-ilmu gabungan seperti
ekonometrika, biometrika (atau biostatistika), dan psikometrika.
 Meskipun ada pihak yang menganggap statistika sebagai cabang dari
matematika, tetapi sebagian pihak lainnya menganggap statistika sebagai
bidang yang banyak terkait dengan matematika melihat dari sejarah dan
aplikasinya. Di Indonesia, kajian statistika sebagian besar masuk dalam fakultas
matematika dan ilmu pengetahuan alam, baik di dalam departemen tersendiri
maupun tergabung dengan matematika.
UJI KORELASI
 Analisis korelasi bertujuan untuk melihat
keeratan hubungan antara dua variabel atau
lebih.
 Hubungan antar variabel dapat berbentuk
searah (+) atau terbalik (-)
 Nilai koefisien korelasi berkisar antara -1
sampai +1
 Koefisien korelasi bernilai + (searah), dalam
model regresi bermakna semakin tinggi nilai
X maka semakin tinggi nilai Y
 Koefisien korelasi bernilai -(terbalik), dalam
model regresi bermakna semakin tinggi nilai
X maka semakin rendah nilai Y
 Dalam menghitung koefisien korelasi banyak
rumus yang digunakan, tergantung pada
skala data yang dianalisis. Untuk itu harus
dipahami skala data dengan baik
 Secara umum skala data ada 4 yaitu nominal,
ordinal, interval dan rasio
 Beda skala data yang diukur, maka beda
rumus korelasi yang digunakan.
 Rumus korelasi yang paling umum digunakan
adalah rumus product moment dari Pearson
dengan syarat skala data interval/rasio (scale)
 Bila skala datanya berupa ordinal, maka
rumus korelasi yang digunakan adalah rumus
dari spearman’s rho atau Kendall’s tau (non-
parametrik)
A. Pearson Product Moment
 Salah satu jenis korelasi yang paling populer adalah
koefisien korelasi momen-produk Pearson, yang diperoleh
dengan membagi kovarians kedua variabel dengan perkalian
simpangan bakunya. Meski memiliki nama Pearson, metode ini
pertama kali diperkenalkan oleh Francis Galton.
 Korelasi Pearson-product moment digunakan untuk menguji
hubungan antara dua varaiabel dengan skala data interval atau
ratio.
 Kegunaan :
1. Untuk menyatakan ada atau tidaknya hubungan antara variabel
X dengan variabel Y.
2. Untuk menyatakan besarnya sumbangan variabel satu terhadap
yang lainnya yang dinyatakan dalam persen.
 Asumsi / Syarat uji :
1. Data berdistribusi Normal
2. Variabel yang dihubungkan mempunyai data
linear.
3. Variabel yang dihubungkan mempunyai data
yang dipilih secara acak.
4. Variabel yang dihubungkan mempunyai
pasangan yang sama dari subyek yang sama pula
(variasi skor variabel yang dihubungkan harus
sama).
5. Variabel yang dihubungkan mempunyai data
interval atau rasio.
 Contoh : Sebuah penelitian untuk mengetahui
apakah ada hubungan antara Hb Ibu hamil dan
berat badan lahir bayinya. Variabel independent
adl Hb Ibu hamil dgn skala data interval dan
variabel dependen adl berat badan lahir bayi dgn
skala data interval.
 Sebanyak 20 responden dikumpulkan data-
datanya sbg berikut :
Langkah Uji Korelasi  SPSS

Entry data
Uji normalitas
menggunakan
Kolomogorov
Smirnov.

Pilih menu
Analyze  sub
menu
Nonparametric
Test  1-Sampel
K-S  OK
Pada dialog box, insert variabel yg ingin di tes
normalitas  OK
Uji Normalitas Data

Interpretasi : Dari hasil uji, kedua data berdistribusi normal dengan Asymp. Sig. (2-
tailed) lebih dari 0,05.
Kemudian
melakukan uji
korelasi Pearson dgn
cara pilih menu
Analyze  Sub
menu Correlate 
Bivariate  OK
Pd dialog
Box, insert
kedua
variabel 
pilih Pearson
 OK
Output SPSS

Tanda ** menunjukkan nilai signifikansi pada 0,01


mempunyai dua arah
Penyajian tabel & Interpretasi
Tabel 1. Analisis korelasi kadar Hb ibu hamil terhdap berat badan lahir bayi (n=20).

Berat badan lahir bayi


r 0,757
Kadar Hb Ibu hamil p 0,0001
n 20

Interpretasi :
1. Dari hasil uji diketahui bahwa rhitung = 0,757, dibaca pd
Pearson Correlation (r). Nilai ini dibandingkan dengan
besarnya rtabel pd α = 1% dgn n = 20 (rtabel = 0,423), shg rhitung >
rtabel artinya Ho ditolak. Atau dgn membaca nilai signifikansi
(p) = 0,0001 yg dibandingkan dgn nilai α = 1% dimana p <
0,01 shg Ho ditolak (Ada hubungan antara Hb Ibu hamil dgn
Berat badan lahir bayi).
2. Sifat korelasi dpt dilihat dri nilai r yg positif, artinya semakin
tinggi Hb Ibu hamil, maka semakin berat BBL-nya.
3. Nilai r terbesar adalah +1 dan r terkecil adalah –1. r = +1
menunjukkan hubungan positip sempurna, sedangkan r = -1
menunjukkan hubungan negatip sempurna.
4. r tidak mempunyai satuan atau dimensi. Tanda + atau - hanya
menunjukkan arah hubungan. Intrepretasi nilai r = 0,757
(kekuatan korelasi kuat).

(Sugyiono, 2007).
B. Korelasi Spearman Rank & Kendall’s Tau

 Koefisien korelasi Spearman & Kendall’s tau


digunakan untuk pengukuran statistik non-
parametrik data ordinal. Korelasi Spearman dan
Kendall’s pada awalnya akan melakukan
perangkingan terhadap data penelitian kemudian
baru dilakukan pengujian korelasinya.
 Dari semua statistik yang didasarkan atas ranking
(jenjang), koefisien korelasi rank Spearman
adalah yang paling awal dikembangkan dan
mungkin yang paling dikenal dengan baik hingga
kini. Statistik ini, kadang-kadang disebut rho, di
sini ditulis dengan rs. Ini adalah ukuruan asosiasi
yang menuntut kedua variable diukur sekurang-
kurangnya dalam skala ordinal sehingga obyek-
obyek atau individu-individu yang dipelajari
dapat di-ranking dalam dua rangkaian berurut.
 Perbedaan antara Spearman & Kendall’s yakni
jika dalam korelasi Kendall’s (diberi symbol i)
merupakan suatu penduga tidak bisa untuk
parameter populasi, maka dalam korelasi
Spearman (diberikan symbol r) dan tidak
memberikan dugaan untuk koefisien peringkat
suatu populasi.
 Asumsi / Syarat uji
1. Data yang digunakan untuk korelasi Spearman harus
berskala ordinal.
2. Korelasi Spearman tidak memerlukan asumsi adanya
hubungan linier dalam variable-variabel yang diukur
dan tidak perlu menggunakan data berskala interval,
tetapi cukup dengan menggunakan data berskala
ordinal.
3. Asumsi yang digunakan dalam korelasi ini ialah
tingkatan (rank) berikutnya harus menunjukkan
posisi jarak yang sama pada variable-variabel yang
diukur. Jika menggunakan skala Likert, maka jarak
skala yang digunakan harus sama. Juga, data tidak
harus berdistribusi normal.
Langkah Uji Korelasi  SPSS
 Langkah awal adalah entry data sejumlah 30
responden yang akan diteliti mengenai hubungan
dukungan keluarga dengan tingkat kecemasan
pasien sebelum operasi.
 Data berupa dukungan keluarga (DK) dengan
kategori : kurang, cukup, baik, dan sangat baik.
 Dan kecemasan responden (Cem)dengan kategori
menurut Hamilton Rating Scale for Anxiety,
yakni : Tdk cemas, cemas ringan, cemas sedang,
cemas berat, & panik.
Entry
data 
 Analyze 
Correlate 
Bivariate 
Klik
 Pada dialog box,
insert variabel yg
akan diukur 
pilih Kendall’s
tau & Spearman
pd menu
correlations
coeficient  OK
Output

Jika tidak ada tanda


**, maka otomatis
nilai signifikansi
pada taraf 0,05
Penyajian tabel & Interpretasi
Tabel 2. Analisis korelasi dukungan keluarga dengan kecemasan pasien pre operasi (n
= 30).
Tingkat Kecemasan
(Cem)
r - 0,369
Dukungan Keluarga (DK) p 0,009
n 30

#Kendall’s Tau

Interpretasi :
1. Dari hasil uji diketahui bahwa nilai signifikansi (p) = 0,009 yg
dibandingkan dgn nilai α = 1% dimana p < 0,01 shg Ho ditolak (Ada
hubungan antara Dukungan Keluarga dgn Tingkat Kecemasan pre operasi).
2. Sifat korelasi dpt dilihat dri nilai r yg negatif, artinya semakin
tinggi Dukungan Keluarga, maka semakin rendah tingkat
kecemasan pasien pre operasi.
3. Nilai r terbesar adalah +1 dan r terkecil adalah –1. r = +1
menunjukkan hubungan positip sempurna, sedangkan r = -1
menunjukkan hubungan negatip sempurna.
4. r tidak mempunyai satuan atau dimensi. Tanda + atau - hanya
menunjukkan arah hubungan. Intrepretasi nilai r = 0,369
(kekuatan korelasi rendah).

(Sugyiono, 2007).
Penyajian tabel & Interpretasi
Tabel 3. Analisis korelasi dukungan keluarga dengan kecemasan pasien pre operasi (n
= 30).
Tingkat Kecemasan
(Cem)
r - 0,568
Dukungan Keluarga (DK) p 0,001
n 30

#Spearman Rank

Interpretasi :
1. Dari hasil uji diketahui bahwa nilai signifikansi (p) = 0,001 yg
dibandingkan dgn nilai α = 1% dimana p < 0,01 shg Ho ditolak (Ada
hubungan antara Dukungan Keluarga dgn Tingkat Kecemasan pre operasi).
2. Sifat korelasi dpt dilihat dri nilai r yg negatif, artinya semakin
tinggi Dukungan Keluarga, maka semakin rendah tingkat
kecemasan pasien pre operasi.
3. Nilai r terbesar adalah +1 dan r terkecil adalah –1. r = +1
menunjukkan hubungan positip sempurna, sedangkan r = -1
menunjukkan hubungan negatip sempurna.
4. r tidak mempunyai satuan atau dimensi. Tanda + atau - hanya
menunjukkan arah hubungan. Intrepretasi nilai r = 0,568
(kekuatan korelasi sedang).

(Sugyiono, 2007).
REGRESI LINIER
 Analisis regresi dalam statistika adalah salah satu metode untuk
menentukan hubungan sebab-akibat antara satu variabel dengan variabel(-
variabel) yang lain. Variabel "penyebab" disebut dengan bermacam-macam
istilah: variabel penjelas, variabel eksplanatorik, variabel independen, atau
secara bebas, variabel X (karena seringkali digambarkan dalam grafik
sebagai absis, atau sumbu X). Variabel terkena akibat dikenal sebagai
variabel yang dipengaruhi, variabel dependen, variabel terikat, atau
variabel Y. Kedua variabel ini dapat merupakan variabel acak (random),
namun variabel yang dipengaruhi harus selalu variabel acak.
 Analisis regresi adalah salah satu analisis yang paling populer dan luas
pemakaiannya. Analisis regresi dipakai secara luas untuk melakukan
prediksi dan ramalan, dengan penggunaan yang saling melengkapi dengan
bidang pembelajaran mesin. Analisis ini juga digunakan untuk memahami
variabel bebas mana saja yang berhubungan dengan variabel terikat, dan
untuk mengetahui bentuk-bentuk hubungan tersebut.
 Analisis regresi termasuk dalam uji statistik parametrik,
yang termasuk dalam menguji prediksi, atau estimasi, atau
memperkirakan suatu kejadian (variabel) yang telah
ditentukan. Variabel prediktor disebut dengan variabel
independent dan variabel dependen adalah variabel yang
akan diprediksi.
 Prediksi atau estimasi atau perkiraan yang akan dicari,
berdasarkan perhitungan rumus regresi yang ditetapkan.
Rumus regresi sebagai hasil akhir uji regresi digunakan
untuk memprediksi suatu variabel independen terhadap
variabel dependen. Dalam rumus regresi variabel
dependen diberi notasi Y dan variabel dependen diberi
notasi X, perlu adanya besaran lain yang disebut koefisien
regresi dari variabel independen, yang digunakan untuk
perhitungan estimasi dan koefisien konstanta.
 Rumus umum regresi linier adalah : Υ = βo
+ β1 Χ
 Dimana Y adalah variabel dependen, X adalah
variabel independen, βo adalah konstanta, dan β1
adalah koefisien regresi variabel X.
 Syarat uji / asumsi :
 Regresi adalah metode statistik parametrik bahwa
data harus berdistribusi normal.
 Regresi harus memenuhi syarat uji asumsi klasik
yaitu :
1. Heteroskedastisitas
2. Autokorelasi
3. Multikolinieritas dan,
4. Normalitas.
 Uji asumsi klasik dilakukan untuk mengetahui apakah model
estimasi telah memenuhi kriteria ekonometrika, dalam arti tidak
terjadi penyimpangan yang cukup serius dari asumsi-asumsi
yang harus dipenuhi dalam metode
 Ordinary Least Square
 (OLS). Terdapat enam asumsi yang diperlukan dalam
penaksiran OLS, yaitu:
1. Rata-rata kesalahan pengganggu (e) sama dengan nol;
2. Kesalahan pengganggu berbentuk distribusi normal;
3. Kesalahan pengganggu tidak berkorelasi dengan Variabel
Independen;
4. Tidak adanya Autokorelasi antar gangguan (e);
5. Tidak adanya Multikolinearitas; dan
6. Varian kesalahan pengganggu tetap atau homoskedastisitas
(tidak terjadi Heteroskedastisitas);
 Contoh : Sebuah penelitian yang menjadikan
variabel umur ibu sebagai prediktor variabel
tekanan darah sistolik.
 Sebanyak 30 responden diambil data umur dan
tekanan darah sistoliknya.
Langkah Uji Regresi Linier 
SPSS
 Langkah awal adl
memasukkan data dengan
membuat variabel umur
(umur ibu) dan variabel
TDS (tekanan darah
sistolik). Setelah selesai
maka dapat kita entry data
ke-30 responden tsb.
 Setelah yakin
bahwa data yg
di entry benar,
maka pilih
menu Analyze
 Regression
 Linier 
Klik
 Kemudian pada dialog
box, insert tekanan
darah sistolik (TDS) ke
dlm kolom dependent,
dan variabel umur ke
dlm kolom independet
(s).
Output
Penyajian tabel & Interpretasi
Tabel 4. Nilai determinan umur Ibu terhadap tekanan darah sistolik (n=30)

Std. Error of the


Model R R Square
estimate
1 0,654 0,427 17,631

#Model Summary

Interpretasi :
Dari tabel Model Summary, nilai R2 = 0,429, artinya variabel
bebas umur ibu mampu menerangkan atau memprediksi variabel
terikat tekanan darah sistolik sebesar 42,9%. Sisanya sebesar
57,1% diterangkan oleh faktor—faktor lain selain umur ibu.
Penyajian tabel & Interpretasi
Tabel 5. Analisis regresi linier sederhana umur ibu terhadap tekanan darah sistolik (n =
30)
Model Sum of Squares F Sig.
Regression 6314,580 21,057 0,0001

#Anova

Interpretasi :
Dari tabel anova diketahui dimana nilai p (signifikansi) besarnya
0,0001 dengan demikian p < 0,05, maka Ho ditolak (Ho = rumus
regresi tidak dapat digunakan untuk memprediksi TDS dari
umur), sehingga rumus regresi dapat digunakan untuk
memprediksi TDS dari umur.
Penyajian tabel & Interpretasi
Tabel 6. Analisis regresi linier sederhana umur ibu terhadap tekanan darah sistolik (n =
30)
Model B t Sig.
(Constant) 98,752 9,647 0,0001

Umur Ibu 0,969 4,487 0,0001

#Coefficientsa

Interpretasi :
Dari tabel coefficient, diketahui rumus regresi dimana diketahui
nilai koefisien regresi dari nilai B, untuk konstanta 98,75, dan
umur 0,969,
jadi Y = 98,75 + 0,969 X
 Penerapa rumus regresi adalah apabila kita
menentukan umur ibu 30 tahun, maka dapat kita
prediksikan tekanan darah sistoliknya dengan
rumus regresi yaitu :
 Y = 98,75 + 0,969 X
 Y = 98,75 + (0,969 x 30)
 Y = 98,75 + 29,01
 Y = 127,82
Sehingga tekanan darah sistoliknya adalah
127,82 mmHg.
Selesai....

Anda mungkin juga menyukai