Anda di halaman 1dari 12

12/3/2015

SOALAN UNTUK DIJAWAB HARI INI

CORRELATION
Denise Koh, PhD

SOALAN UNTUK DIJAWAB HARI INI


4. Bagaimana kalau data kita bukan data
interval atau nisbah?
5. Faktor apakah boleh mengelirukan pengiraan
pekali korelasi kita?
6. Bagaimana menggunakan SPSS untuk
melakukan pengiraan korelasi?

KORELASI
Korelasi hubungan antara dua
pembolehubah
Pekali Korelasi suatu ukuran hubungan
antara dua pembolehubah
Pekali Korelasi Pearson (r) Pekali korelasi
yang paling biasa digunakan

1. Bagaimana kita boleh tunjukkan hubungan


antara dua pembolehubah dengan
bermakna?
2. Bagaimana kita boleh mengukur tahap
hubungan secara kuantitatif dengan
menggunakan kovarians?
3. Kenapa Produk momen korelasi Pearson
merupakan ukuran yang lebih baik
berbanding kovarians?

CONTOH PERSOALAN KAJIAN


Adakah insiden barah buah dada (Y)
mempunyai hubungan dengan kekuatan
matahari di suatu tempat?
Adakah jangka hayat (Y) untuk seseorang
individu berubah mengikut per capita
pengambilan alkohol (X)?
Adakah jangka hayat (Y) di sebuah negara
akan meningkat apabila per capita health
expenditure (X) negara tersebut meningkat?

Scatterplot / Scatter Diagram


SCATTERPLOT
Salah satu teknik yang baik untuk
mendapatkan satu gambaran hubungan
antara 2 pembolehubah
Suatu gambarajah di mana setiap poin
data diplotkan secara dua-dimensi
(paksi-x dan paksi-y).

12/3/2015

CASES OF CORRELATION
Perfectly linearly
correlated in opposite
direction

Uncorrelated in
linear fashion

Strongly & positively


correlated in
linear fashion

Perfectly correlated in
nonlinear fashion, but
uncorrelated linearly.

Infant Mortality

SCATTER DIAGRAMS
Dalam menyediakan suatu scatter diagram,
pembolehubah tidak bersandar (predictor
variable) selalunya diletakkan di paksi-x dan
pembolehubah bersandar (dependent
variable) di paksi-y.

Life Expectancy and health Expenditure

(adjusted for gross national product) and

Number of doctors

r = 0.81
r = 0.14
Regression Line

Regression Line: The


line of best fit that
represents a straight
line drawn through
the data points.

BREAST CANCER MORTALITY AND


SUNSHINE

r = -0.75
Regression Line

COVARIANCE
Covariance: a statistic representing the
degree to which two variables vary
together suatu statistik yang
melambangkan tahap dua pembolehubah
berubah BERSAMA
Deviation score: the difference between a
score and the mean perbezaan antara
suatu skor mentah dengan mean

12/3/2015

COVARIANCE

BREAST CANCER AND SUNSHINE

r = -0.75

Kalau kita gantikan Y dengan X, kita akan


dapat formula untuk variance

adalah deviation score

PEKALI KORELASI PEARSON

Nilai max
r adalah 1

adalah

, maka had nilai

PENYELESAIAN & Output SPSS

PENGIRAAN

ID
1
2
3
4
5
6
7
8

Markah
5
3
9
4
9
5
7
2

Masa
Ulangkaji
2
1
3
2
5
2
4
1

FACTOR YANG MEMPENGARUHI


PEKALI KORELASI
Range restriction
Heterogeneous sub samples

12/3/2015

MENGHADKAN JULAT

HETEROGENEOUS SAMPLE

PEMERHATIAN EXTREME

PEMERHATIAN EXTREME

Household expenditure on tobacco and


alcohol
Region
North
Yorkshire
NorEast
East Midland
West Midland
East Anglia
Southeast
Southwest
Wales
Scotland
Nothern Ireland

Alcohol
6.47
6.13
6.19
4.89
5.63
4.52
5.89
4.79
5.27
6.08
4.02

Tobacco
4.03
3.76
3.77
3.34
3.47
2.92
3.2
2.71
3.53
4.51
4.56

CORRELATION & CAUSATION


Hubungan yang kita perhatikan mungkin
hubungan penyebab.
Tetapi kita mungkin gagal mengenalpasti
faktor manakah yang penyebab.
Hubungan mungkin separuh penyebab
Mungkin ada factor ketiga yang menjadi
pemangkin kepada hubugan ini.

r = 0.224;
p=0.509

UJIAN SIGNIFIKAN KORELASI


Seperti data yang lain, data korelasi juga akan
mempunyai ralat persempelan.
Contoh:
Rawak 25 numbor dilabelkan sebagai pendapatan
Rawak 25 nombor dilabelkan sebagai tahap
pandai menari
Dapat r = 0.278
df = N 2, N = bilangan pasangan data
Rujuk Jadual

12/3/2015

5 LANGKAH UJIAN HIPOTESIS


1.
2.
3.
4.
5.

Tulis Hipotesis
Tetapkan alpha ()
Buat pengiraan
Dapatkan critical value
Buat Keputusan dan tulis kesimpulan

UJIAN SIGNIFIKAN KORELASI


Pekali Korelasi
H0: = 0
untuk populasi
H1: 0
 = 0.05
Buat Pengiraan; dapat df
Dapatkan nilai kritikal (daripada
jadual)
Buat Keputusan

CONTOH AKHIR

CARA PENULISAN DAPATAN KORELASI

Suatu kajian menguji hubungan antara markah


penilaian suatu kursus (SPPP) dengan gred yang
mereka anggap mereka boleh dapat dalam kursus
tersebut.

Pensyarah biasanya percaya bahawa penilaian


pelajar terhadap kursus mereka dipengaruhi
(sebahagiannya) oleh gred yang akan mereka
dapati daripada kursus tersebut. Untuk menguji
hypotesis ini, penyelidik telah mengumpul data
daripada 50 kursus asas pelbagai fakulti di UKM,
dimana pelajar diminta untuk menilai kursus
(skala likert 5 poin) serta memberikan gred (A=4;
B=3) yang mereka jangka mereka akan perolehi
pada akhir semester.

N = 50
r = 0.30
Adakah pekali korelasi ini menunjukkan
hubungan yang significant?

Untuk setiap kursus, min untuk penilaian


kursus dan jangkaan gred telah dikira. Kajian
mendapati bahawa pekali korelasi Pearson
antara penilaian kursus dan jangkaan gred
adalah r = 0.30 dan hubungan ini, walaupun
kecil, adalah signifikan (r(48) = 0.30, p <0.05).

Daripada dapatan kajian ini, kesimpulan yang


boleh dibina penilaian kursus dan jangkaan gred
mempunyai hubungan yang signifikan, dan
semakin tinggi jangkaan gred, semakin tinggi
penilaian kursus. Tetapi, interpretasi kajian
kurang jelas. Mungkin pelajar yang menjangka
gred yang tinggi memberi ganjaran kepada
pensyarah dengan penilaian kursus yang tinggi.
Tetapi mungkin juga penilaian yang tinggi adalah
disebabkan oleh pengajaran yang efektif (maka
jangkaan gred yang tinggi).

12/3/2015

LATIHAN
Adakah keadaan seseorang
sebelum menahan nafas
mempunyai hubungan
dengan masa beliau boleh
tahan nafas?
Adakah hubungan ini
signifikan?
Tuliskan dapatan anda
dengan teliti.

Normal
56
56
65
65
50
25
87
44
35

Hyperventilating
87
91
85
91
75
28
122
66
58

Soalan yang akan dijawab


Apakah bezanya regresi dan korelasi?
Apakah kelebihan regresi berbanding dengan
korelasi?
Bagaimana kita hendak menetukan garisan
regresi?
Sejauhmana garis regresi fit data kita?
Bagaimana melakukan ujian hipotesis dan apakah
jenis hipotesis yang kita nak uji?
Bagaimana melakukan analisis regresi dengan
menggunakan SPSS?

ISTILAH BARU
Regresi: proses meramalkan (predict) nilai
suatu pembolehubah berdasarkan nilai
pembolehubah yang lain.
Regresi linear: Regresi dimana hubungan
antara pembolehubah adalah linear
Kuasa Dua Pekali Korelasi (r2): Kuasa dua
pekali korelasi. Interpretasi: jika r2 adalah
0.56, maka 56% daripada variasi Y boleh
dijelaskan oleh variasi pada X.

REGRESSION LINEAR MUDAH


Simple Linear Regression

BEZANYA REGRESI DENGAN KORELASI?


Apabila kita melakukan korelasi, kita berminat
untuk mengetahui hubungan antara dua
pembolehubah:
Apakah kekuatan hubungan tersebut?
Adakah ia hubungan positif atau negatif?

Apabila kita hendak mendapatkan suatu


persamaan supaya kita boleh predict /
meramalkan nilai suatu pembolehubah
berdasarkan pembolehubah yang lain, kita
melakukan regresi.

CONTOH PERBINCANGAN
ID

Markah

Masa Ulangkaji

12/3/2015

MASA ULANGKASI & MARKAH

r = 0.887

GARISAN BEST FIT

GARISAN REGRESI

= Nilai Y yang hendak dijangka


b = Kecerunan garisan
a = pintasan (nilai jangkaan Y apabila X = 0)
X = nilai pembolehubah tidak bersandar

Infant Mortality
(adjusted for gross national product) and

Number of doctors
Apakah maksudnya garisan best Fit? gasrisan
yang mempunyai error of prediction
yang paling kecil.
r = 0.81

Least squares regression


Garisan yang mempunyai
kecil

<

Kerana semua garisan yang mungkin MESTI


melalui
, dan garisan yang melalui
jumlah
adalah 0, maka kita perlu kuasa
duakan pengiraan kita.

Y Y = residual.

yang paling

INTERPRETASI r2

Formula Least Square Regression

Daripada contoh pada slide sebelum, r = 0.81.

Formula yang memudahkan kita mendapatkan


garisan regresi adalah.

Kirakan r2
Apakah maksudnya?
r 2= 0.6561. Maka, maksudnya, 65.61% daripada variasi
yang diperhatikan dalam kematian bayi (infant mortality)
boleh dijelaskan oleh variasi pada bilangan doktor
(number of doctors)

12/3/2015

PEKALI REGRESI
Regression coefficient (PEKALI REGRESI): the
general name given to the slope and the
intercept, often refers only to the slope.

CONTOH PERBINCANGAN
ID

Masa
Markah Ulangkaji

STRESS & SYMPTOMS CONTOH LEPAS

OUTPUT SPSS

Y = 33.988 + 2.239X1

PENTING

PENGUJIAN HIPOTESIS??

REGRESI HANYA BERMAKNA JIKA KORELASI


ANTARA DUA PEMBOLEHUBAH TERSEBUT
ADALAH SIGNIFIKAN!!!!

Kalau kita hanya ada satu faktor peramal


(predictor) atau dikenali sebagai
pembolehubah tidak bersandar, maka garisan
regresi adalah sama dengan garisan korelasi.
Kalau korelasi signifikan, maka regresi juga
adalah signifikan.

12/3/2015

PELAPORAN REGRESI
Satu kajian telah dijalankan untuk mengkaji
sejauhmana pengaruh stress terhadap
kesihatan mental seseorang pelajar. Seramai
13 subjek kajian telah dipilih secara rawak
daripada sebuah sekolah menengah dan skor
stress dan kesihatan mental telah direkodkan.
Ujian regresi mudah telah dijalankan dan
didapati bahawa stress mempunyai hubungan
yang singnifikan dengan kesihatan mental; (r
(11) = 0.86, p<0.05).

PELAPORAN REGRESI---samb
Rumus regresi untuk kajian ini adalah
Untuk setiap unit peningkatan stress akan
menyebabkan skor simpton kesihatan mental
meningkat sebanyak 2.24. Semakin tinggi
stress, semakin banyak simpton masalah
mental yang dilaporkan oleh pelajar.

LEBIH DARIPADA 1 PERAMAL?


Perlu melakukan analisis REGRESI BERGANDA
(multiple regression).

REGRESI BERGANDA
Multiple Regression

ISTILAH BARU
Pekali Korelasi Berganda (mulitple correlation
coefficient) (R): pekali korelasi antara satu
pembolehubah bersandar (Y) dengan satu set
faktor peramal/pembolehubah tidak bersandar
(X).
Kuasa Dua Pekali Korelasi (Squared correlation
coefficient) (R2): Kuasa dua pekali korelasi antara
satu pembolehubah bersandar (Y) dengan satu
set faktor peramal/pembolehubah tidak
bersandar (X) interpretasi sama seperti regresi
mudah.

ISTILAH BARU
Pekali Korelasi Regresi Standard
(Standardized Regression coefficient) ():
Pekali regresi yang akan didapati jika data
semua faktor peramal / pembolehubah tidak
bersandar di standardized.
Boleh digunakan sebagai anggaran tahap
pengaruh setiap faktor peramal kepada Y
apabila data mereka di standardized.

12/3/2015

LEBIH DARIPADA 1 PERAMAL?

Pekali korelasi satu model regresi diramal


menggunakan data sampel yang mempunyai k
pembolehubah tidak bersandar
Nilai Y yang
diramal

Pintasan
ramalan

Anggaran Pekali Kecerunan

= a + b X + b X +K+ b X
Y
1 1i
2 2
k k
= Nilai Y yang hendak dijangka
b = Kecerunan garisan setiap faktor peramal
a = pintasan (nilai jangkaan Y apabila X = 0)
X = nilai pembolehubah tidak bersandar

CONTOH REGRESI BERGANDA


Contoh: Adakah masa ulangkaji dan masa
tidur mempengaruhi markah ujian matematik
pelajar Tingakatan 5?

Interpretasi Kecerunan: (Net Regression Coefficient)


b1= Perubahan pada min Y berikutan satu unit perubahan
pada X1, dengan mengambil kira pengaruh X2
a = Pintasan Y. Sama seperti regresi mudah.

REGRESI BERGANDA
Y

Kerana kita ada tiga


pembolehubah, plot kita
juga mempunyai tiga
dimensi...
0

Y = Markah ujian matematik


X1 = Masa ulangkaji
X2 = Masa tidur

X2

GRAF MODEL DUA FAKTOR/PEMBOLEHUBAH


Tiga dimensi
Y

Kita cuba lukiskan


satu satah yang
mempunyai error
yang paling kecil

=a+b X +b X
Y
1 1
2 2

X1

REGRESI BERGANDA
Perlu dinyatakan bahawa korelasi untuk
regresi berganda adalah sentiasa positif.
Untuk mengetahui jenis hubungan (secara
langsung atau songsang), kita perlu lihat pekali
regresi.

X2

Jika positif: hubungan langsung


Jika negatif: hubungan songsang

X1

10

12/3/2015

OUTPUT SPSS

Contoh 1
Anda telah menjalankan kajian untuk melihat
hubungan antara pendidikan (tahun) dan
pendapatan dengan bilangan anak. Data anda
adalah seperti berikut:
No:

1 2 3 4 5 6 7 8

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Bil Anak (Y):

2 5 1 9 6 3 0 3

Pendidikan (X1)

12 16 20 12 9 1 16 14 9 12 12 10 20 11 9 18 16 14 9 8 12 10 20 11 9

Output SPSS menunjukkan bahawa rumus


regresi kita adalah berikut:

7 2 5 1 9 6 3 0 3 7 14 2 5 1 9 6

Pendapatan (000, X2): 3 4 9 5 4 12 10 1 4 3

10 4 9 4 4 12 10 6 4

1 10 3 9 2 4

OUTPUT SPSS

Bilangan Anak
yang diramal

Pendidikan

Pendapatan

OUTPUT SPSS Ujian t


51.9% variasi dalam
bilangan anak boleh
dijelaskan oleh tahun
pendidikan dan
pendapatan.

(Y Y)2

Ujian t digunakan untuk menguji jika terdapat


hubungan linear antara X dan Y. (menguji
kecerunan garisan regresi, b)
Hipotesis:
H0: = 0 (tidak ada hubungan linear)
H1: 0 (terdapat hubungan linear antara X dan Y)

Y = 10.06 - 0.31X1 0.33X2

Interpretasi ujian t ini sama dengan interpretasi


ujian t yang telah kita pelajari.

OUTPUT SPSS Ujian ANOVA

PELAPORAN REGRESI BERGANDA

Ujian ANOVA digunakan untuk menguji


kesignifikan model regresi. Ia menguji
hubungan kesemua X (sekaligus) dengan Y
Hipotesis:

Satu kajian telah dijalankan untuk menguji


hubungan antara bilangan anak dengan faktor
pendidikan dan pendapatan. Jumlah masa
(tahun) pendidikan dan pendapatan bulanan
(ribu) serta bilangan anak telah direkodkan.
Analisis regresi berganda telah dijalankan
untuk menguji hubungan ini.

H0: 1 = 2 = = k = 0 (tiada hubungan linear)


H1: sekurang-kurangnya satu 0

Interpretasi ujian ANOVA ini sama dengan


interpretasi ujian ANOVA yang telah kita
pelajari.

11

12/3/2015

PELAPORAN - samb
Analisis regresi berganda telah dijalankan dan
didapati secara keseluruhan model regresi
adalah signifikan (F(2,22)=11.88, dan R2 =
0.519). Faktor pendidikan (b=-0.31, t=-2.23,
p=0.036) dan pendapatan (b=-0.33, t=-2.19,
p=0.039) merupakan peramal yang signifikan
terhadap bilangan anak dalam kajian ini.
Rumus regresi untuk model ini adalah:
Bilangan anak = 10.06 Pendidikan (0.31)
Pendapatan (0.33)

SELAMAT MAJU JAYA

12

Anda mungkin juga menyukai