Anda di halaman 1dari 41

Kuliah

MATEMATIKA DAN STATISTIKA TERAPAN


Cakupan

Analisis Korelasi
• Mengidentifikasi hubungan antar peubah dengan scatter
diagram
• Mengukur dan menginterpretasikan keeratan hubungan antar
peubah dengan koefisien korelasi
• Melakukan uji hipotesis terhadap koefisien korelasi
Analisis Regresi Linier Sederhana
• Mengidentifikasi peubah bebas dan tak bebas, konsep regresi,
dan perbedaannya dengan korelasi
• Mengukur dan menginterpretasikan kekuatan hubungan antar
peubah dengan regresi linier
• Menghitung confidence interval dan prediction interval
• Mengenal uji hipotesis regresi dan koefisien determinasi
Terminologi

Regression and Correlation Analysis


• Teknik statistik sederhana untuk mengeksplorasi hubungan
linier antara dua atau lebih peubah
Scatter Diagram/Diagram Acak
• Diagram yang menunjukkan hubungan antara dua peubah
Dependent Variable/ Peubah Terikat
• Peubah yang diduga atau diperkirakan/predicted variable
Independent Variable/Peubah bebas
• Peubah yang menjadi dasar perkiraan/predictor variable
Analisis Korelasi
(Pearson Correlation)
Koefisien Korelasi r

 Koefisien korelasi () mengukur keeratan hubungan antara dua


variabel
 Menggunakan data dengan skala interval atau rasio
 Bernilai antara -1.00 sampai dengan 1.00
 Nilai -1.00 or 1.00 menunjukkan korelasi kuat dan sempurna
 Nilai mendekati 0.0 menunjukkan korelasi lemah
 Nilai negatif menunjukkan hubungan terbalik dan
 Nilai positif menunjukkan hubungan searah
Analisis
Korelasi
• Tidak harus menggambarkan hubungan sebab akibat, tetapi
menggambarkan keterkaitan linier antar peubah
• Kelemahan Koefisien Korelasi:
1. Sangat peka terhadap nilai pencilan
2. Tidak dapat mendeteksi hubungan non linier
• Koefisien korelasi = 0 bukan berarti tidak ada hubungan
antara kedua variabel. Artinya tidak ada hubungan LINIER,
tapi bisa jadi ada hubungan dalam bentuk lain (kuadratik dll)
• Perhatian: Korelasi tidak sama dengan hubungan sebab
akibat!
Scatter
Diagram
Contoh-contoh
13 - 9
Rumus Koefisien Korelasi

Rumus yang digunakan untuk menghitung koefisien korelasi adalah


sebagai berikut:

Keterangan:
• X dan Y adalah data variabel tertentu
• n adalah banyaknya observasi
Contoh

Hubungan antara Pendapatan dan Kesejahteraan

r = 0.7415
Teladan
Anda, seorang mahasiswa, berpikir Judul Halaman Harga
bahwa ada hubungan antara harga EASL 500 84
buku teks dengan jumlah halaman Kalkulus 700 75
buku tersebut. Dasar Ekonomi 800 99
Untuk membuktikannya, anda
Pengantar Sosiologi 600 72
memilih delapan buku teks yang
Manajemen Bisnis 400 69
dijual di toko buku kampus.
Pengantar Keuangan 500 81
Terlampir data judul, jumlah
halaman dan harga (dalam ribu Pemasaran 600 63
rupiah) Statistika Bisnis 800 93
Gambarkan scatter diagram
Hitung koefisien korelasi
Scatter Diagram
Diagram pesebaran antara jumlah halaman (X) dan harga (Y)
1 00

90
Harga

80

70

60
400 500 600 700 800
Jumlah Halaman
Koefisien Korelasi
n S xy - (S x )( S y)
r =
n S x 2 - (S x ) 2 n S y 2 - (S y ) 2

x y xy x2 y2
Judul Halaman Harga)
EASL 500 84 42 000 250 000 7 056
Kalkulus 700 75
Dasar Ekonomi 800 99 52 500 490 000 5 625
Pengantar Sosiologi 600 72 79 200 640 000 9 801
Manajemen Bisnis 400 69 43,200 360 000 5 184
Pengantar Manajemen 500 81 27 600 160 000 4 761
Pemasaran 600 63 4 050 250 000 6 561
Statistik Bisnis 800 93 37 800 360 000 3 969

Total 4900 636 397 200 3150


74 400 000 518 649
640 000 606
Koefisien Korelasi
n S xy - (S x)( S y)
r =
n S x 2 - (S x ) 2 n S y 2 - (S y ) 2

Sx yS S
xy x2S yS
2

4 900 636 397 200 3 150 00051 606


8 ( 397 200 ) - ( 4 900 )( 636 )
=
2
8 (3150 000) - ( 4900) 8 ( 51 ,606 ) - ( 636 ) 2
r = 0.614
Nilai Koefisien Korelasi adalah 61.4%.
Menunjukkan hubungan sedang antar variabel
Cara Lain
X Y X-X Y-Y
500 84 -112.5 4.5 -506.25
r= 7650
700 7 (145.7738)(12.21241)
75 87.5 -4.5 -393.75
800 99 187.5 19.5 3656.25
600 72 -12.5 -7.5 93.75 r = 0.614
400 69 -212.5 -10.5 2231.25
500 81 -112.5 1.5 -168.75
600 63 -12.5 -16.5 206.25
800 93 187.5 13.5 2531.25
7650

X= 612.5 Y = 79.5 SX = 145.7738 SY = 12.21241


Pengujian Signifikansi untuk
Korelasi

 Hipotesis Statistik:
(tidak ada hubungan linier antara kedua variabel)
(ada hubungan linier antara kedua variabel)
 Statistik Uji

 Kriteria Statistik
1. TERIMA H0  |t-hit|<
2. TOLAK H0  |t-hit|>
Hypothesis Test
Andaikan kita uji hipotesis akan nilai koefisien korelasi
Gunakan taraf nyata/significance level 0.02
Step 1
Nyatakan hipotesis nol dan hipotesis satu H0: = 0
H 1:  0
Step 2 Nyatakan taraf nyata  = 0.02
Step 3 Pilih statistik uji

Step 4 Nyatakan syarat penolakan H0

H0 ditolak jika thitung>3.143 atau thitung<-3.143


derajat bebas/df = 6, didapatkan dari n – 2 = 8 –
2 =56. Lakukan uji dan ambil kesimpulan
Step

...Step 5
Step 5 Lakukan uji dan ambil kesimpulan

.614 8 - 2
= = 1.905
1 - (.614) 2

H0 diterima

…tidak ada hubungan/correlation pada populasi.


Besar
Analisis Regresi Linier Sederhana
Analisis Regresi

…Regression analysis is concerned with the study of the


dependence of one variable, the dependent variable, on
one or more other variables, the explanatory variables,
with a view to estimating and/or predicting the
(population) mean or average value of the former in terms
of the known or fixed (in repeated sampling) values of the
latte (Gujarati, 20014).
Model Regresi

Model Regresi

1 peubah penjelas > 1 peubah penjelas


Sederhana Berganda

Linier Non Linier Linier Non Linier

Polinom Multiplikatif Reciprocal Log Eksponensial


Model Regresi Linier
Sederhana
• Sederhana  banyaknya peubah bebas/penjelas hanya satu
• Hubungan antara X dan Y dinyatakan dalam fungsi linier/ordo 1
• Perubahan Y diasumsikan karena adanya perubahan X
• Model populasi regresi linier sederhana yang hubungannya linier
(selanjutnya cukup sebut “regresi linier sederhana”)

dengan:
 dan adalah parameter regresi
 adalah sisaan/galat/eror (peubah acak)
 adalah peubah bebas yang nilainya diketahui dan presisinya sangat tinggi
(bukan peubah acak)
 adalah peubah tak bebas (peubah acak)
Model Regresi Linier
Sederhana

Model Regresi Linier Sederhana (populasi) :


Intersep Y Koefisien Peubah bebas/ Sisaan/
Peubah tak
bebas/ populasi kemiringan Peubah penjelas galat
Peubah populasi
respon

Y  β0  β1 X 
ε Komponen linier (fix) Komponen acak
Model Regresi Linier
Sederhana

Y Y  β 0  β1 X 
Nilai
pengamatan Y yi ε
untuk Xi
εi Slope = β1
Rataan Y Sisaan/galat
𝐸(𝑌 ∨ 𝑋 𝑖 )
untuk Xi
untuk xi

yi  β0 β1 xi  εi
Intersep = β0

xi X
Persamaan Regresi
Linier Sederhana

Nilai dugaan y Dugaan bagi


Dugaan bagi kemiringan garis
pada pengamatan
intersep β 0 regresi β1
ke - i

Nilai x pada

yˆi  b0 
pengamatan ke - i

be 1x(y i- y )  y - (b b x )
Galat individu ei mempunyai rataan sebesar nol

i i
ˆi i 0 1 i

• b0 adalah rata-rata nilai y ketika x bernilai nol (jika x = 0 dalam selang


pengamatan)  nilai intersep
• b1 adalah rata-rata perbedaan nilai y jika x berubah satu satuan 
nilai koefisien kemiringan
Asumsi Regresi Linier
Sederhana
 Bentuk hubungannya linear (Y merupakan fungsi linier dari X)
 Sisaan εi adalah peubah acak yang bebas terhadap nilai x
 Sisaan merupakan peubah acak yang menyebar Normal dengan rataan 0
dan memiliki ragam konstan, σ2 (sifat ragam yang konstan/homogen ini
disebut homoscedasticity)
dan untuk i=1,2,…,n
 Sisaan εi, tidak berkorelasi satu dengan yang lainnya, sehingga

 Kondisi ortogonalitas terpenuhi. Artinya , peubah bebas tidak berkorelasi


dengan error
Rumus Persamaan Regresi

y = b0 + b1xi Ŷ = a + bx

n( Sxy ) - ( S x )( Sy )
b1 =
n( S x ) - ( S x) b = r (S /S )
2 2
1 Y X

Sy Sx
b 0 = n - b n b0 = Ȳ - b 1 X
Teladan 2

Anda, seorang mahasiswa, berpikir Judul Halaman Harga


bahwa ada hubungan antara harga EASL 500 84
buku teks dengan jumlah halaman Kalkulus 700 75
buku tersebut. Dasar Ekonomi 800 99
Untuk membuktikannya, anda
Pengantar Sosiologi 600 72
memilih delapan buku teks yang
Manajemen Bisnis 400 69
dijual di toko buku kampus.
Pengantar Keuangan 500 81
Terlampir data judul, jumlah
halaman dan harga (dalam ribu Pemasaran 600 63
rupiah) Statistika Bisnis 800 93
Buat persamaan regresi untuk
memperkirakan harga buku teks
berdasarkan jumlah halamannya
Teladan 2

• Setiap penambahan satu


halaman akan menambah
rata-rata harga buku
sebesar Rp 51;
• Nilai intersep y
menunjukkan bahwa buku
dengan 0 halaman akan
berharga Rp 48000. Namun
ini merupakan skenario
yang tidak mungkin, maka:
Nilai a, Rp 48000 dalam hal
ini diartikan sebagai nilai
rata-rata y (harga) yang
tidak dapat dijelaskan oleh
variabel x (nomor halaman).
Teladan 2

• Berapa harga buku dengan 800 halaman?

• Rata-rata harga buku dengan 800 halaman adalah Rp 89140


Teladan 2

Temukan standard error of estimate untuk soal harga buku dan


jumlah halaman

Y 2  b0Y  b1XY
se 
n2
51,606  48(636) 

0.05143(397,200)
8
 2
10.408
- 2
S (Y y )
Rumus lain Se = = 10.408
n -2
Judul Halaman (X) Harga(Y)
EASL 500 84
Y ŷ (Y – ŷ)2
Kalkulus 700 75
84 73.715 105.7812
Dasar Ekonomi 800 99
75 84.001 81.018
Pengantar Sosiologi 600 72 99 89.144 97.14074
Manajemen Bisnis 400 69 72 78.858 47.03216
Pengantar Keuangan 500 81 69 68.572 0.183184
Pemasaran 600 63 81 73.715 53.07122
Statistika Bisnis 800 93
63 78.858 251.4762
93 89.144 14.86874
Confidence Interval &
Prediction Interval

• Confidence interval  rata-rata nilai Y


untuk nilai X tertentu

• Prediction interval  individu nilai Y


untuk nilai X tertentu
Teladan 3

• Buat 95% confidence interval untuk harga rata-rata


buku dengan 800 halaman
Teladan 3

• Buat 95% prediction interval untuk harga buku


dengan 800 halaman
Kesimpulan Hasil:
Teladan 1-3

• Rata-rata harga buku dengan 800 halaman adalah Rp89140


• Standard error of estimate is Rp 10410
• 95 persen selang kepercayaan/confidence interval untuk rata-
rata harga buku dengan 800 halaman adalah Rp89140
±Rp15310
Artinya selang harga rata-rata buku dengan 800 halaman antara
Rp 73830 dan Rp104450
• 95 persen selang perkiraan/prediction interval untuk buku
dengan 800 halaman adalah Rp89140 + Rp29720.
Artinya harganya antara Rp59420 dan Rp118860
Uji hipotesis regresi: MINITAB output
Bandingkan p-value dengan .

Regression Analysis: Price versus Pages

The regression equation is Uji-t (parsial: setiap


Price = 48.0 + 0.0514 Pages variabel)
Predictor Coef SE Coef T P
Constant 48.00 16.94 2.83 0.030
Pages 0.05143 0.02700 1.90 0.105
Uji-F (uji model
S = 10.41 R-Sq = 37.7% R-Sq(adj) = 27.3%
secara keseluruhan:
Analysis of Variance Analisis Ragam)

Source DF SS MS F P
Regression 1 393.4 393.4 3.63 0.105
Residual Error 6 650.6 108.4
Total 7 1044.0

Predicted Values for New Observations

New Obs Fit SE Fit 95.0% CI 95.0% PI


1 89.14 6.26 ( 73.82, 104.46) ( 59.41, 118.88)
Koefisien Determinasi

• Koefisien Determinasi menunjukkan seberapa bagus model


regresi yang diperoleh.
• Koefisien Determinasi

• mengukur proporsi keragaman yang dijelaskan oleh (peubah


bebas x dalam) model regresi
• Seringkali secara informal digunakan sebagai ukuran
goodness-of-fit untuk membandingkan validitas beberapa
spesifikasi model
Koefisien Determinasi

• Interpretasi dari nilai R2 37.7% yaitu 37.7% keragaman harga jual


buku dapat dijelaskan oleh keragaman (banyaknya halaman buku)
model.
• Angka ini relatif rendah, menandakan bahwa walaupun banyaknya
halaman buku adalah variabel penjelas yang cukup baik, namun
masih diperlukan informasi lain untuk meningkatkan akurasi model.

S = 10.41 R-Sq = 37.7% R-Sq(adj) = 27.3%

Analysis of Variance

Source DF SS MS F P
Regression 1 393.4 393.4 3.63 0.105
Residual Error 6 650.6 108.4
Total 7 1044.0
Thank
You
Next week:
http://www.minitab.com/en-us/products/minitab/free-trial/

Anda mungkin juga menyukai