Anda di halaman 1dari 20

KELOMPOK 8

Nama Anggota Kelompok:

- Audy Putri Lestari (211810101090)


- Ezra Nurdiasastro (211810101010)

METODE STATISTIKA

12. Correlation & Simple Linear Regression

Materi ini membahas mengenai hubungan antara dua variabel kategoris


dengan the chi-square test of independence. Meteri ini akan memeriksa
hubungan antara dua variabel kuantitatif dengan korelasi dan regresi linier
sederhana. Variabel kuantitatif memiliki nilai numerik dengan besaran yang
dapat ditempatkan dalam urutan yang bermakna.
12.1 Scatterplot
Representasi grafis dari dua variabel kuantitatif di mana variabel
penjelas berada pada sumbu x dan variabel respons berada pada sumbu y.
Cara menentukan variabel yang merupakan variabel penjelas dan variabel
respons yaitu. Secara umum, variabel penjelasan mencoba menjelaskan,
atau memprediksi, hasil yang diamati. Variabel penjelasan yaitu variabel
yang digunakan untuk menjelaskan variabilitas dalam variabel respon, atau
juga disebut sebagai variabel independen atau variabel predictor. Variabel
respons mengukur hasil penelitian. Variabel responsa atau variabel hasil,
juga dikenal sebagai variabel dependen.
Ketika menggambarkan hubungan antara dua variabel kuantitatif, perlu
dipertimbangkan hal-hal berikut:

1. Arah (positif atau negatif)


2. Bentuk (linier atau non-linier)
3. Kekuatan (lemah, sedang, kuat)
4. Outliers
Hubungan linier terjadi ketika garis yang paling cocok untuk
menggambarkan hubungan antara x dan y adalah garis lurus. Hubungan
linier antara dua variabel akan positif ketika nilai x lebih besar dari y
menjadi lebih besar, hubungan ini juga dikenal sebagai hubungan langsung.
Hubungan linier antara dua variabel negatif ketika yang satu meningkat
ketika yang lain menurun. Misalnya, sebagai nilai dari x dapatkan nilai yang
lebih besar dari y menjadi lebih kecil, hubungan ini juga dikenal sebagai
hubungan tidak langsung.

Scatterplots adalah alat yang berguna untuk memvisualisasikan data. Cara


untuk meringkas hubungan-hubungan ini secara numerik ini dengan
mengeksplorasi korelasi

Gambar 1.1. Contoh Scatterplot

12.2 Correlation

Pearson's r digunakan sebagai ukuran korelasi antara dua variabel


kuantitatif. Contohnya menggunakan simbol r. Dalam suatu populasi, akan
digunakan simbol ρ ("rho"). Pearson's r dapat dengan mudah dihitung
menggunakan Minitab. Namun, memahami rumus konseptual dapat
membantu untuk lebih memahami arti koefisien korelasi.
Ketika zx dan zy diganti dengan z rumus skor dan pindahkan n−1 untuk
fraksi terpisah, maka didapatkan rumus:

Properti Pearson's r

1. −1≤ r ≤+1
2. Untuk asosiasi yang positif, r > 0, untuk asosiasi negatif r < 0, jika tidak
ada hubungan r = 0
3. Semakin dekat r dengan 0 maka semakin lemah hubungan dan semakin
dekat ke +1 atau -1 semakin kuat hubungan (misalnya, r = −88 adalah
hubungan yang lebih kuat daripada r = + 60)
4. Korelasi bebas satuan; si x dan y variabel TIDAK perlu pada skala yang
sama (misalnya, dimungkinkan untuk menghitung korelasi antara tinggi
dalam sentimeter dan berat dalam pound)
5. Tidak masalah variabel mana yang diberi label sebagai x dan yang diberi
label sebagai y. Korelasi antara x dan y sama dengan korelasi
antara y dan x

12.2.1 Hypotesis Testing


Dalam menguji signifikansi statistik dari hubungan antara dua variabel
kuantitatif, akan menggunakan prosedur pengujian hipotesis berikut:
1. Periksa asumsi dan tulis hipotesis, untuk menggunakan pearson’s r
kedua variable harus kuantitatif dan hubungan antara x dan y harus
linier.
2. Hitung statistika tes, r dihitung menggunakan Minitab.
3. Tentukan p-value, Minitab akan memberi p-value untuk tes dua
arah (yaitu, Ha:ρ≠0). Jika dilakukan tes satu arah, maka nilai-p
dalam output harus dibagi dengan 2.
4. Buat Keputusan, Kalau p ≤ α menolak hipotesis nol, maka ada
bukti hubungan dalam populasi. Kalau p ≤ α  gagal menolak
hipotesis nol, maka tidak ada bukti hubungan dalam populasi.
5. Nyatakan kesimpulan “dunia nyata”, menuliskan kesimpulan
berdasarkan langkah 4.
Uji Statistik t
Jika melakukan tes dengan tangan, a t statistik pengujian dihitung
pada langkah 2 menggunakan rumus berikut:

Pada langkah 3, a t distribusi dengan df = n − 2 digunakan untuk


mendapatkan p-value.

12.2.2 Correlation Matrix


Ketika memeriksa korelasi lebih dari dua variabel (yaitu, lebih dari
satu pasang), matriks korelasi biasanya digunakan. Di Minitab, jika kita
meminta korelasi antara tiga variabel atau lebih sekaligus, outputnya akan
berisi matriks korelasi dengan semua kemungkinan korelasi berpasangan.
Untuk setiap pasangan variabel, r Pearson akan diberikan bersama dengan
nilai p.
12.3 Simple Linear Regression
Regresi menggunakan satu atau lebih variabel penjelasan (x) untuk
memprediksi satu variabel respons (y). Simple Linear Regrission atau regresi
linier sederhana berarti materi kali ini hanya akan menggunakan satu variabel
penjelasan. Jika ada dua atau lebih variabel penjelasan, maka regresi linier
berganda diperlukan. Linier berarti kita akan menggunakan garis lurus untuk
memprediksi variabel respons menggunakan variabel penjelas.
Garis lurus dirumuskan dengan y = mx + b dimana m adalah lereng
dan b adalah y-mencegat. Kemiringannya adalah ukuran seberapa curam garis
itu, dalam aljabar terkadang digambarkan sebagai "perubahan dalam y lebih
dari perubahan dalam x," atau "rise over run". Kemiringan positif
menunjukkan garis yang bergerak dari kiri bawah ke kanan atas. Kemiringan
negatif menunjukkan garis yang bergerak dari kiri atas ke kanan bawah. Untuk
setiap satu unit peningkatan x nilai prediksi dari y meningkat dengan nilai
kemiringan. Si y intersep adalah lokasi di y sumbu di mana garis melewati ini
adalah nilai dari y Kapan x sama dengan 0. Dalam statistik, rumus yang serupa
yaitu:
Garis Regresi Linier Sederhana dalam Sampel

y^=b0+b1x

y^ = nilai prediksi dari y untuk nilai yang diberikan dari x


b0 = y-mencegat
b1 = kemiringan

Dalam populasi, y-intercept dilambangkan sebagai β0 dan kemiringannya


dilambangkan sebagai β1. Beberapa buku teks dan ahli statistik menggunakan
notasi yang sedikit berbeda. Misalnya, Anda mungkin melihat salah satu
notasi berikut yang digunakan:

Perhatikan bahwa dalam semua persamaan di atas, y-intercept adalah nilai


yang berdiri sendiri dan kemiringan adalah nilai yang melekat pada x.

12.3.1. Formulas
Regresi linier sederhana menggunakan data dari sampel untuk
membangun garis yang paling cocok. Tapi apa yang membuat garis
"paling cocok"? Metode yang paling umum untuk membangun garis
regresi, dan metode yang akan kita gunakan dalam kursus ini,
adalah metode kuadrat terkecil. Metode kuadrat terkecil menghitung nilai-
nilai intersep dan kemiringan yang membuat jumlah residu kuadrat sekecil
mungkin. Residu adalah perbedaan antara nilai aktual y dan nilai prediksi
y (yaitu, y− ^y ). Nilai prediksi y (" ^y ") kadang-kadang disebut sebagai "nilai
yang dipasang" dan dihitung sebagai  ^y i=b0+b1xi.

Di bawah ini, kita akan melihat beberapa rumus yang terkait dengan
metode regresi linier sederhana ini. Dalam kursus ini, Anda akan
bertanggung jawab untuk menghitung nilai dan residu yang diprediksi
dengan tangan. Anda tidak akan bertanggung jawab untuk menghitung
intersep atau kemiringan dengan tangan.

Residu

Residu disimbolkan oleh ε ("epsilon") dalam populasi dan e atau − ^


E
dalam sampel. Seperti kebanyakan prediksi, Anda mengharapkan ada
beberapa kesalahan. Misalnya, jika kita menggunakan tinggi badan untuk
memprediksi berat badan, kita tidak akan berharap untuk dapat dengan
sempurna memprediksi berat badan setiap individu menggunakan tinggi
badan mereka. Ada banyak variabel yang memengaruhi berat badan
seseorang, dan tinggi badan hanyalah salah satu dari banyak variabel
tersebut. Kesalahan dalam prediksi regresi ini disebut kesalahan prediksi
atau residual.

Residu dihitung dengan mengambil nilai y yang diamati individu


dikurangi nilai prediksi y yang sesuai. Karena itu, setiap individu memiliki
residu. Tujuan dalam regresi kuadrat terkecil adalah untuk membangun
garis regresi yang meminimalkan residu kuadrat. Intinya, kami membuat
garis yang paling cocok yang memiliki jumlah kesalahan paling sedikit.

Sisa

Ei = yi− ^y i

y = nilai aktual y untuk pengamatan ith

^y i = nilai prediksi y untuk pengamatan ith

Jumlah Residu Kuadrat

Juga dikenal sebagai Jumlah Kesalahan Kuadrat (SSE)


SSE = ∑ (y− ^y )2 
Menghitung Intersep & Kemiringan

Perangkat lunak statistik akan menghitung nilai-nilai y-mencegat


dan miring yang meminimalkan jumlah residu kuadrat. Rumus konseptual
di bawah ini menunjukkan bagaimana statistik ini terkait satu sama lain
dan bagaimana mereka berhubungan dengan korelasi yang Anda pelajari
sebelumnya dalam pelajaran ini. Dalam kursus ini kita akan selalu
menggunakan Minitab untuk menghitung nilai-nilai ini.

Lereng

sy
b1=r
sx

r= Koefisien korelasi Pearson antara x dan y


sy = simpangan baku y
sx = simpangan baku x

y-intersep

b0 =  y  −b1 x
y  = rata-rata y
x  = rata-rata x
b1 = kemiringan

12.3.2. Asumsi

Uji asumsi yaitu analisis maupun suatu pernyataan statistik yang harus
dipenuhi pada analisis regresi linear sederhana yang berbasis ordinary
leastvsquare (OLS). Uji asumsi tidak dilakukan pada semua regresi linear,
contohnya yaitu uji multikolinearitas tidak dapat digunakan pada analisis
regresi linear sederhana serta uji autokorelasi tidak perlu digunakan pada
data cross sectional. Terdapat 4 asumsi pada regresi linear, antara lain
sebagai berikut:

a. Uji Normalitas

Uji Normalitas adalah untuk melihat apakah nilai residual terdistribusi


normal atau tidak. Model regresi yang baik yaitu mempunyai nilai residual
yang teristribusi normal.

b. Uji Autokorelasi

Uji Autokorelasi adalah untuk melihat apakah terjadi korelasi antara


suatu periode t dengan periode sebelumnya (t - 1). Dengan begitu, secara
sederhana yaitu bahwa analisis regresi yaitu untuk melihat pengaruh antara
variabel bebas terhadap variabel terikat, jadi tidak boleh ada korelasi
antara observasi dengan data observasi sebelumnya.

c. Uji Heteroskedastisitas

Uji Heteroskedastisitas adalah untuk melihat apakah terdapat


ketidaksamaan varians dari residual satu ke pengamatan yang lain. Model
regresi yang memenuhi persyaratan yaitu dimana terdapat kesamaan
varians dari residual satu ke pengamatan yang lain tetap atau disebut
homoskedastisitas.

d. Uji Multikolinearitas

Uji Multikolinearitas adalah untuk melihat ada atau tidaknya korelasi


(keterkaitan) yang tinggi antara variabel – variabel bebas dalam suatu
model regresi linear. Apabila korelasi yang tinggi di antara variabel –
variabel bebasnya, sehingga hubungan antara varaibel bebas terhadap
variabel terikatnya menjadi terganggu.

12.3.3. Minitab – Regresi Sederhana


Minitab merupakan suatu software statistik selain SPSS dan EViews
(Ekonometrik Views). Regresi yaitu suatu analisis dimana digunakan
untuk meneliti apakah ada pengaruh variable bebas (independent) terhadap
variable terikat (dependen). Contohnya yaitu seperti pengaruh upah
terhadap kinerja atau seperti pengaruh absensi terhadap nilai. Berikut
langkah – langkah dalam melakukan analisis regresi menggunakan
MINITAB:

1. Pastikan komputer atau laptop sudah memiliki aplikasi MINITAB


2. Buka aplikasi MINITAB yang sudah dimiliki pada komputer
maupun laptop, maka akan muncul layar pembuka program seperti
berikut:
https://agunganggoroseto.wordpress.com/2014/05/10/analisis-
regresi-sederhana-dengan-menggunakan-minitab/
3. Isikan data yang hendak di regresi maupun korelasi seperti
penelitian upah dan kinerja, dengan mengisika kolom C1 dan C2
dan isi nilai hasil observasi masing – masing variable.

4. Data yang sudah dimasukkan, selanjutnya dilakukan pengujian


terhadap variabel yang bersangkutan, dengan cara memilih stat,
kemudian pilih regression, dan pilih regression lagi.

maka akan menampilkan menu regression sebagai berikut:


5. Mengisi kolom Response dan Predictors. Response yaitu suatu data
dimana didalamnya berisi variabel yang terikat dalam hal kinerja,
sedangkan predictors yaitu suatu data dimana didalamnya berisi
variabel bebas. Cara pengisiannya yaitu dengan klik pada kolom
response, kemudian klik kinerja, lalu pilih select. Sedangkan pada
variabel predictors yaitu engan klik di predictors, pilih upah, dan
pilih select. Menyebabkan upah dan kinerja masuk kedalam kolom
reponse dan predictors.
6. Klik OK apabila variabel – variabel sudah dimasukkan, sehingga
akan didapati hasil seperti berikut

Hasil yang diperoleh, dapat dijabarkan satu persatu. R-Sq (adj)


atau R-Square Adjust bernilai 87,0%, variabel kinerja dapat
dijelaskan sebesar 87% oleh variabel upah. Sehingga didapati
persamaan:
Kinerja = 6,86 + 0,000043
Upah mengalami kenaikan Rp. 1, pengaruh positif yang diberikan
terhadap kinerja yaitu 0,000043 serta setiap kenaikanRp. 100.000,-
upah memberikan dampak positif terhadap kenaikan kinerja
sebesar 0,43%.
12.4 Pengujian Hipotesis

Pengujian hipotesis memilik maksud tersendiri, yaitu guna melihat


apakah suatu hipootesis yang diajukan ditolak atau diterima. Hipotesis
sendiri yaitu suatu asumsi maupun pernyataan mungkin benar atau salah
mengenai suatu populasi, dengan cara mengamati seluruh populasi maka
suatu hiptesis akan dapat diketahui benar salahnya penilitian tersebut.

Pengujian hipotesis terdapat asumsi maupun pernyataan yang


disebut hipotesis nol. Hipotesis nol yaitu hipotesis yanag diuji, dinyatakan
dengan H0 serta penolakan H1 dimaknai dengan penerimaan hipotesis
lainnya yang dinyatakan oleh H1. Apabila telah ditentukan oeh Koefisien
Determinasi (r2), maka akan dilanjutkan dengan Uji Signifikan
mnggunakan Uji-t. Dengan langkah – langkahnya seperti berikut:

a. Menentukan hipotesis

H0 = tidak ada pengaruh yang signifikn

H1= ada pengaruh yang signifikan

b. Menentukan tingkat signifikansi

Biasanya menggunakan tingkat signifikan sebesar 5% atau 0,05

c. Menentukan t hitung

d. Menentukan t table

e. Membandingkan t hitung dn t table dengan kriteria

H0 diterima jika: t hitung ≥ t table


H0 ditolak jika: t hitung < t table

H0 diterima jika: -t hitung ≤ t table

H0 ditolak jika: -t hitung > t table

f. Kesimpulan hasil uji siginfikan

12.3.3. Interval Keyakinan untuk kemiringan

Interval kepercayaan untuk rata – rata sering kali berbentuk:

ESTÂ ± CRIT.SE atau ESTÂ ± MARGIN

EST merupakan perkiraan untuk parameter yang


diinginkan, SE adalah kesalahan standar dari perkiraan, dan
MARGIN = CRIT.SE.kemudian, dalam membuat interval
kepercayaan untuk β0 dan β1 yaitu menggunakan:

KOEFISIEN DETERMINASI

Koefisien determinasi pada regresi linear sederhana seringkali diartikan


sebagai mengukur seberapa besar kemampuan semua variabel bebas dalam
menjelaskan varians dari variabel terikatnya. Koefisien determinasi dihitung
dengan mengkuadratkan Koefisen Relasi (R), contoh:

Jika nilai R adala 0,80 maka, maka koefisien determinasi (R square)

R square = 0,80 x 0,80 = 0,64


Berarti kemampuan variabel bebas dalam menjelaskan varians dari varabel
terikatnya yaitu sebesar 64,0%, dengan begitu 36% (100%-64%) varians variabel
terikat yang dijelaskan oleh factor lain, sehingga nilai r square yaitu antara 0 – 1.

Penggunan R square (R Kuadrat) sering menimbulkan permasalahan,


bahwa nilainya akan selalu naik dengan adanya penambahan variabel bebas dalam
satu model.

12.5 Koefisien Determinasi


Koefisien determinasi pada regresi linear sederhana seringkali
diartikan sebagai mengukur seberapa besar kemampuan semua variabel
bebas dalam menjelaskan varians dari variabel terikatnya. Koefisien
determinasi dihitung dengan mengkuadratkan Koefisen Relasi (R), contoh:
Jika nilai R adala 0,80 maka, maka koefisien determinasi (R
square)
R square = 0,80 x 0,80 = 0,64
Berarti kemampuan variabel bebas dalam menjelaskan varians dari
varabel terikatnya yaitu sebesar 64,0%, dengan begitu 36% (100%-64%)
varians variabel terikat yang dijelaskan oleh factor lain, sehingga nilai r
square yaitu antara 0 – 1.
Penggunan R square (R Kuadrat) sering menimbulkan
permasalahan, bahwa nilainya akan selalu naik dengan adanya
penambahan variabel bebas dalam satu model.
12.6 Contoh Korelasi dan Determinasi
a. Korelasi
Terdapat data usia dan berat badan anak disebuah kelas. Berdasarkan
data tersebut, tentukan nilai korelasi diantara keduanya!

No Usia Berat
. (x) Badan
(y)
1. 9 40

2 9 42

3. 9 39

4. 10 45

5. 10 44

6. 11 43

7. 11 47

8. 12 49

9. 12 50

10. 13 50

11. 13 52

12. 13 54

13. 13 53

14. 13 49

15. 13 60
Jawaban:

Berdasarkan hasil pengujian, ditemukan bahwa tingkat korelasi antara


usia dan tinggi badan yaitu 0,90 yang berarti terdapat hubungan yang
sangat kuat antara usia dan berat badan.
b. Regresi
Sebuah penelitian terhadap pohon mahoni, dimana akan
diteliti apakah ada hubungan antara tinggi pohon dengan artian
apakah pengaruh diameter batang pohon terhadap tinggi pohon
tersebut?

Jawaban:

Persamaan regresi:
Y’ = a + bX
Menentukan konstanta a dan koefisien b, sebagai
berikut:

Maka diperoleh:
Persamaan regrsi diperoleh:

Y’ = -1,3147 + 4,5413X

Dimana :

Y’ = Tinggi pohon mahoni yang diprediksi


X = Diameter batang pohon mahoni

Interpretasi dari koefisien regresi :

Nilai a = -1,3147 yang berarti tidak ada diameter batang


pohon maka tidak ada tinggi pohon. (karena tidak ada tinggi yang
bernilai negatif sehingga dianggap nol).
Nilai b = 4,5413 yang berarti jika terjadi peningkatan
diameter batang pohon mahoni satu satuan maka akan terjadi
peningkatan tinggi pohon mahoni sebesar 4,5413 satuan.
Koefisien Determinasi R2:

r = 0,886 bernilai positif dan kuat


Berarti terdapat hubungan atau korelasiyang kuat antara
tinggi pohon mahoni denagn diameter batangpohon mahoni.
Dimana semakin besar diameter batang pohoni maka semakin
tinggi batang pohon mahoni
R2 = 0,8862 = 0,785
Berarti sekitar 78,5% variasi dari variabel diameter batang
pohon mahoni dapat menjelaskan variasi dari variabel tinggi pohon
mahoni.
Standar eror estimate persamaan regresi:

Jadi, besarnya standar eror estimate persamaan regresi yaitu


6,6364. Jal tersebut menunjukkan penyimpangan data – data
terhadap garis regresi maupun bagaimana penyimpangan data yang
menyebar disekitar garis regresi.

Pengujian koefisien regresi:

 Hipotesis uji

Ho : b = 0

Ha : b ≠ 0
 Taraf signifikan

Pilih nilai signifikasi a = 15%

 Daerah kritis
Dengan nilai a = 5%,dan derajat bebas n – 2 = 8 - 2
= 6, maka diperoleh t-tabel pada 5%/2 yaitu 2,447.
 Statistik uji

12.7 Ringkasan Pelajaran 12


Hasil model persamaan regresi dapat dipergunakan gunakan
sebagai pedoman untuk memproduksi hubungan antar variabel diluar data
yang dijadikan sampel dalam suatu popuasi. Uji regresi linear sederhana
seperti uji signifikan dengan uj-t sangat membantu guna mengetahui
pengaruh secara kualitas dan kuantitas satu variabel bebas terhadap
variabel tak bebas.

Anda mungkin juga menyukai