Anda di halaman 1dari 49

STATISTIKA

Pertemuan 14-15: Analisis Regresi dan


Korelasi; Pengantar Statistika
Nonparametrik

Dosen Pengampu MK:


Materi Hari Ini

 Hubungan antar variabel


 Analisis regresi linier sederhana
 Perbedaan analisis regresi dan korelasi
 Analisis korelasi Pearson
 Pengantar Statistika Nonparametrik
Hubungan antar Variabel

 Bila data mengandung lebih dari satu variabel, hal


yang menarik untuk ditelusuri/dianalisis adalah
bagaimana hubungan antar variabel-variabel
tersebut
 Kausal  hubungan sebab akibat --- Regresi
 Non-kausal ---- Korelasi
Analisis Regresi Linier Sederhana [1]

 Bertujuan untuk mengetahui hubungan/pengaruh


satu/beberapa variabel independen (X) terhadap
variabel dependen(Y)
 Regresi sederhana: hubungan satu variabel
independen (X) terhadap satu variabel dependen (Y)
 Bentuk umum model regresi linier sederhana
Y     X    model populasi 
Y  a  bX  e (model sampel )

a dan b adalah estimate value untuk α dan β


a adalah kontanta, secara grafik menunjukkan intersep
b adalah koefisien regresi yang menunjukkan besarnya pengaruh X terhadap
Y, secara grafik menunjukkan slope (kemiringan garis regresi).
Analisis Regresi Linier Sederhana [2]

 Nilai a dan b pada model sampel dapat dihitung


dengan metode OLS yaitu
n n n
n X iYi   X i  Yi
b i 1 i 1 i 1
2
; a  Y  bX
n
  n
n X    X i 
i
2

i 1  i 1 
 Sehingga akan diperoleh model estimasi
Ŷ  a  bX
Model estimasi ini digunakan untuk memprediksi/meramalkan nilai Y
Tanda slope (b) : negatif  hubungan kebalikan antar X dan Y
positif  hubungan searah antar X dan Y
Contoh Kasus
 Misalkan diketahui data mengenai panjang dan berat
ikan di Gelondonggede sbb
No L W ln (L) ln (W)

1 63.60 4.57 4.1526 1.5195

2 85.38 14.07 4.4471 2.6440

3 85.80 15.94 4.4520 2.7688

4 73.80 12.17 4.3014 2.4990

5 76.61 11.12 4.3387 2.4087

 Hubungan panjang (L) dan berat ikan (W) dapat


diketahui dengan meregresikan antara ln(L) sbg var. X
dan ln(W) sbg var. Y
 Tentukan model regresi antar hubungan tersebut
 Scatter plot ln(L) vs ln(W)
3.00
2.50
2.00
ln(W)

1.50
1.00
0.50
0.00
4.10 4.20 4.30 4.40 4.50
ln(L)

 Scatter plot penting sbg eksplorasi awal hubungan


antar variabel
 Hubungan ini dapat dinyatakan dalam persamaan garis
linier (model regresi)
Pembahasan [1]

 Untuk memudahkan, buat tabel perhitungan


berikut
n n n
No X Y X2 XY n X iYi   X i  Yi
1 4.15 1.52 17.24 6.31
2 4.45 2.64 19.78 11.76
b i 1 i 1 i 1
2
n
 n  a  Y  bX
3 4.45 2.77 19.82 12.33
n X i    X i 
2
n n
4 4.30 2.50 18.50 10.75
i 1  i 1  Y X
5 4.34 2.41 18.82 10.45 i i
5(51.59)  (21.69)(11.84)  i 1
b i 1
Jumlah 21.69 11.84 94.17 51.59
 n n
5(94.17)  (21.69) 2
11.84 21.69
1.1404   (2.895)
 5 5
0.3939 a  10.19
b  2.895
 Model estimasi Yˆ  10.19  2.895 X
Pembahasan [2]
Yˆ  10.19  2.895 X  ln(Wˆ )  10.19  2.895ln( L)
 Nilai koefisien b=2.895 menunjukkan faktor
kondisi allometris
 Karena koefisien b bersifat positif, maka hal ini
menunjukkan bahwa semakin panjang ikan,
maka beratnya semakin besar
 Prediksi: berapa berat ikan jika diketahui
panjang ikan sebesar 80?
 Diketahui : L=80  ln(L)=ln(80)=4.382
 Dari persamaan regresi diperoleh
ln(Wˆ )  10.19  2.895(4.382)  2.496
ln(Wˆ )  2.496  Wˆ  exp(ln(Wˆ ))  exp(2.496)  12.13

 Dengan demikian, ikan dengan panjang 80


diprediksi memiliki berat sebesar 12.13
Analisis Korelasi Pearson
 Bertujuan untuk mengukur kekuatan keeratan hubungan antar dua
variabel
 Dalam analisis korelasi tidak perlu ditentukan mana variabel
independen atau dependen
 Rumus untuk menghitung korelasi (Rumus Pearson)
n i 1X iYi   i 1X i  i 1Yi
n n n

rxy 
   
2 2
n i 1X i   i 1X i n i 1Yi   i 1Yi
n 2 n n 2 n

 Nilai korelasi : -1 < rxy <1


 Tanda korelasi: negatif  hubungan kebalikan
positif  hubungan searah
Perbedaan Regresi dan Korelasi

 Korelasi (r) mengukur kekuatan dari asosiasi


dua variabel
 Model regresi merupakan persamaan prediksi
yang menduga/mengestimasi nilai Y bila
diketahui X
 Catatan: variabel2 yg dianalisis regresi pasti
bisa dianalisis korelasi. Namun tidak berlaku
sebaliknya
Kriteria nilai korelasi
Koefisien Hubungan Korelasi
Korelasi
0 Tidak ada hubungan antar dua
variabel
0 < ǀrǀ ≤ 0,25 Keeratan hubungan sangat lemah
0,25 < ǀrǀ≤ 0,5 Keeratan hubungan cukup
0,5 < ǀrǀ ≤ 0,75 Keeratan hubungan kuat
0,75 < ǀrǀ < 1 Keeratan hubungan sangat kuat
1 Korelasi sempurna (hubungan
sangat erat)
Koefisien Determinasi

 Koefisien determinasi adalah koefisien yang


menunjukkan persentase keragaman variabel Y
yang dapat dijelaskan oleh variabel X.

 
n 2
Yˆi  Y
R  1
2 i 1
n
r
2
XY

 Y  Y 
2
i
i 1
Contoh dan Pembahasan
 Berdasarkan data sebelumnya, sekarang akan dihitung
koefisien korelasi Perason antar ln(L) dan ln(W)

n i 1X iYi   i 1X i  i 1Yi


No X Y X2 XY Y2 n n n

1 4.15 1.52 17.24 6.31 2.31 rxy 


 X   Y 
2 2
2 4.45 2.64 19.78 11.76 6.99
n i 1X  n i 1Yi 
n 2 n n 2 n

3 4.45 2.77 19.82 12.33 7.67


i i 1 i i 1 i

4 4.30 2.50 18.50 10.75 6.25 5(51.59)  (21.69)(11.84)


5 4.34 2.41 18.82 10.45 5.80 
Jumlah 21.69 11.84 94.17 51.59 29.01 5(94.17)  (21.69) 2 . 5(29.01)  (11.84) 2
1.1404

(0.6276)(2.2055)
rxy  0.897

•Koefisien korelasi positif menunjukkan hubungan searah antar panjang


dan berat ikan
•Nilai koefisien korelasi antara 0.75-1, sehingga dapat dikatakan bahwa
hubungan kedua variabel sangat erat
 Koefisien determinasi

 Yˆ  Y 
n 2
i
R2  1  i 1
n
 rXY
2
 (0.897) 2  0.805  80.5%
 Y  Y 
2
i
i 1

 Interpretasi: persentase keragaman variabel


berat ikan/ln(W) yang dapat dijelaskan oleh
variabel panjang ikan/ln(L) adalah sebesar
80.5%, sedangkan 19.5% sisanya dijelaskan
variabel lain di luar model regresi.
Analisis Non-Parametrik

 Analisis statistika yang sejauh ini sudah


dibahas merupakan golongan analisis statistika
parametrik
 Salah satu asumsi penting dalam statistika
parametrik adalah data berskala rasio/interval
dan berdistribusi normal
 Apabila data berskala nominal/ordinal dan/atau
tidak berdistribusi normal, maka alternatif
analisis yg bisa digunakan adalah analisis
non-parametrik
Keuntungan Statistik Non
Parametrik

 Uji nonparametrik tertentu dapat digunakan


untuk analisis data nominal
 Uji nonparametrik tertentu dapat digunakan
untuk analisis data ordinal
 Proses perhitungan pada statistika non
parametrik biasanya lebih sederhana
dibandingkan pada statistika parametrik,
khususnya untuk sampel kecil
Kerugian Statistik Non
Parametrik

 Kadang-kadang tidak ada alternatifnya pada


statistika parametrik
 Uji nonparametrik menjadi tak berguna apabila
uji parametrik untuk data yang sama tersedia
 Uji nonparametrik pada umumnya tidak tersedia
secara luas dibandingkan dengan uji parametrik
 Untuk sampel besar, perhitungan untuk
statistika nonparametrik menjadi rumit
Macam Data Bentuk Hipotesis
Deskriptif Komparatif (dua sampel) Komparatif (lebih dari 2 Asosiatif
(satu sampel) (hubungan)
variabel)
Related Independen Related Independen
Nominal Binomial Mc Nemar Fisher Exact 2 for k sample 2 for k sample Contingency
Probability Coefficient C
Cochran Q
2 One 2 Two
Sample Sample

Ordinal Run Test Sign test Median test Friedman Median Spearman Rank
Wilcoxon Mann-Whitney Two Way- Extension Correlation
matched parts U test Anova
Kruskal-Wallis Kendall Tau
Kolmogorov One Way
Simrnov Anova

Wald-
Woldfowitz

Interval T Test* T-test of* T-test of* One-Way One-Way Pearson


Related independent Anova* Anova* Product
Rasio Moment *
Two Way Two Way
Anova* Anova* Partial
Correlation*

Multiple
Correlation*
Keuntungan Statistik Non
Parametrik

 Kadang-kadang tidak ada alternatifnya pada


statistika parametrik
 Uji nonparametrik tertentu dapat digunakan
untuk analisis data nominal
 Uji nonparametrik tertentu dapat digunakan
untuk analisis data ordinal
 Proses perhitungan pada statistika non
parametrik biasanya lebih sederhana
dibandingkan pada statistika parametrik,
khususnya untuk sampel kecil
Kerugian Statistik Non
Parametrik

 Uji nonparametrik menjadi tak berguna apabila


uji parametrik untuk data yang sama tersedia
 Uji nonparametrik pada umumnya tidak tersedia
secara luas dibandingkan dengan uji parametrik
 Untuk sampel besar, perhitungan untuk
statistika nonparametrik menjadi rumit
Penggunaan Non Parametrik
TES PENGGUNAAN FUNGSI
Chi Square Menggunakan data nominal untuk menguji Tes independensi variabel
independensi satu sampel atau dua sampel atau
lebih dari 2 sampel
Codran Q Untuk menguji hubungan lebih dari 2 sampel Membantu pada data yang memberikan
pada skala nominal jawaban 2 kategori
Uji Tanda Untuk menguji hubungan 2 sampel pada skala Tes yang baik untuk data berjenjang
ordinal (rangking)
Uji median -Pada satu sampel untuk melihat randomisasi pada -Untuk melihat kesimetrisan distribusi
data dari populasi - Tes independensi variabel
- untuk menguji independensi lebih dari 2 sampel
pada skala ordinal
Uji Mann-Whitney U Untuk menguji independensi 2 sampel pada skala Analog pada independensi 2 sampel t-
ordinal Test
Uji Kruskal- Untuk menguji independensi lebih dari 2 sampel Alternatif dari uji One-Way ANOVA di
Wallis pada skala ordinal mana asumsi distribusi normal tidak
digunakan
Uji Fiedman Uji menguji hubungan lebih dari 2 sampel pada Alternatif dari uji Two-Way ANOVA
skala ordinal dimana asumsi distribusi normal tidak
digunakan
Uji Kolmogorov- Untuk menguji independensi dari satu sampel Uji ini lebih powerful dibanding uji chi-
Smirnov atau 2 sampel pada skala ordinal. square atau uji Mann-Whitney
Pengujian Satu Sampel

 Biasanya bertipe goodness of fit.


 Dalam kasus ini kita menarik sampel random
dan kemudian menguji hipotesis bahwa sampel
ini ditarik dari suatu populasi dengan distribusi
tertentu.
 Uji statistik yang digunakan :
 Uji binomial
 Uji runs
 Uji kolmogorov-smirnov satu sampel.
Uji Binomial

 Untuk menguji hipotesis bila suatu variabel


berasal dari populasi binomial yang terdiri atas
2 kategori atau menguji hipotesis tentang suatu
proporsi populasi.
 Data berbentuk nominal (laki-laki-wanita,
sukses-gagal, ya-tidak, suka-tidak suka,
anggota-bukan anggota)
 Jika ingin mengetahui apakah masyarakat lebih
menyukai makanan yang dibungkus warna
kuning emas atau yang metalik.
Uji runs

 Untuk melihat apakah data tersebut acak atau


tidak
 Prosedur run test untuk menyelidiki keacakan
biasanya didasarkan pada banyaknya dan sifat
rangkaian yang terdapat di dalam data dengan
data berbentuk ordinal.
Uji Kolmogorov-Smirnov

 Digunakan untuk menentukan seberapa baik


sebuah sampel random data menjajaki
distribusi teoritis tertentu (normal, uniform,
poisson, eksponensial). Didasarkan pada
perbandingan fungsi distribusi kumulatif sampel
dengan fungsi distribusi kumulatif hipotesis.
 Data berbentuk ordinal.
Pengujian Dua Sampel
Independen

 Untuk menguji signifikansi perbedaan nilai dua


sampel yang independen, atau untuk menguji
mungkin tidaknya dua sampel independen itu
berasal dari populasi yang sama.
 Uji yang digunakan :
 Uji Mann-Whitney,
 Uji kolmogorov-smirnov,
 Uji Moses extreme,
 Uji run Wald-Wolfowitz.
Uji Mann-Whitney U

 Untuk menguji signifikansi hipotesis komparatif


2 sampel independen bila datanya berbentuk
ordinal dan untuk 2 sampel yang berukuran
tidak sama.
 Penelitian untuk mengetahui apakah ada
perbedaan berapa lama hidup pasien leukimia
yang diberi serum dengan yang tidak diberi
serum penghambat pertumbuhan leukimia.
Uji Kolmogorov-Smirnov

 Untuk menguji apakah 2 sampel berasal dari


populasi-populasi yang mempunyai distribusi
yang sama atau berbeda.
 Membandingkan 2 distribusi kumulatif dan
memfokuskan pada selisih terbesar antara
kedua distribusi tersebut.
 Membandingkan produktivitas operator mesin
lulusan SMK mesin dan SMU IPA.
Uji Moses Extreme Reactions

 Digunakan untuk menguji hipotesis kesamaan


parameter-parameter penyebaran. Uji ini tidak
mengandaikan kesamaan antara parameter-parameter
lokasi. Skala pengukuran ordinal.
 Suatu kondisi eksperimental akan menyebabkan
beberapa subyek memperlihatkan tingkah laku ekstrem
dalam satu cara, sementara kondisi itu membuat
subyek-subyek lain menunjukkan tingkah laku ekstrem
dalam arah yang berkebalikan. Jadi kita mungkin
berfikir bahwa depresi ekonomi dan ketidak-stabilan
politik akan menyebabkan orang-orang tertentu menjadi
reaksioner yang ekstrem dan menyebabkan orang-
orang lain menjadi “golongan kiri” yang ekstrem dalam
hal pandangan politik mereka.
Uji Run Wald-Wolfowitz

 Digunakan untuk menguji apakah 2 sampel


berasal dari populasi yang sama atau berbeda.
Dalam uji ini skala pengukuran yang digunakan
minimal ordinal dan disusun dalam bentuk run.
Dengan demikian sebelum dianalisis data dari
kedua sampel dirangking dan kemudian
disusun dalam bentuk run.
 Apakah ada perbedaan disiplin kerja Gol III dan
IV didasarkan atas keterlambatan masuk dan
pulang kantor.
Pengujian K Sampel Independen

 Untuk menguji signifikansi perbedaan antara


tiga (atau lebih) kelompok atau sampel
independen.
 Uji statistik ini menguji hipotesis-nol, bahwa k
sampel independen telah ditarik dari populasi
yang sama atau dari k populasi yang identik.
 Uji yang digunakan :
 Uji Kruskal-Wallis
 Uji Median
Uji Kruskal-Wallish H

 Merupakan altarnatif dari analisis varian satu


jalur (One-way ANOVA) di mana nilai data
diganti dengan rank.
 Empat jenis rokok, cap A, B, C dan D hendak
dibandingkan kadar tarnya.
Uji Median

 Digunakan untuk menguji apakah 2 sampel


atau lebih digambarkan dari populasi yang
mempunyai median sama, bila datanya
berbentuk ordinal dan ukuran sampel tidak
harus sama.
 Pada tiga kuliah statistik yang diberikan oleh
tiga dosen dapat ditentukan sebaran nilai yang
diberikan oleh ketiga dosen itu berbeda atau
tidak dengan uji median ini.
Uji Tanda (Sign test)

 Digunakan untuk menguji hipotesis bahwa dua


variabel yang merupakan dua sampel berkaitan
mempunyai distribusi yang sama/berkorelasi
apabila datanya berbentuk ordinal
 Untuk menguji tingkat keberhasilan suatu
sistem diet baru.
Uji Wilcoxon

 Digunakan untuk menguji hipotesis bahwa dua


variabel yang merupakan dua sampel berkaitan
mempunyai distribusi yang sama bila datanya
berbentuk ordinal
 Untuk menguji rata-rata kadar nikotin dari dua
rokok yang berbeda
Uji Mc Nemar

 Merupakan uji untuk 2 variabel dikotomi yang


berkaitan bila datanya berbentuk nominal atau
ordinal.
 Untuk mengukur pengaruh suatu sponsor yang
diberikan suatu perusahaan pada suatu
pertandingan sepakbola terhadap nilai
penjualan barangnya.
Uji K Sampel Berhubungan

 Untuk membandingkan distribusi dua variabel


yg berhubungan atau lebih, yaitu menguji
hipotesis bahwa k sampel yang berhubungan
ditarik dari populasi yang sama atau k populasi
yang k identik.
 Uji yang digunakan :
 Uji Friedman
 Uji Kendall`s
 Uji Cochran
Uji Friedman

 Untuk menguji signifikansi k sampel yang


berkaitan, berasal dari populasi yang sama,
dengan skala data minimal ordinal.
 Studi tentang efek-efek jenis obat dalam kaitan
dengan waktu reaksi yang diberikan oleh
subyek manusia yg menghasilkan data
tersebut.
Uji Kendall`s W

 Untuk menguji beberapa sampel berkaitan yang


berasal dari populasi yang sama. Koefisien
konkordansi W menyatakan tingkat asosiasi
antara k variabel yang diukur dalam ranking
 Percobaan pemeringkatan sampel tulisan
tangan oleh mahasiswa psikologi.
Uji Cochran`s Q

 Untuk menguji hipotesis antara k sampel


berpasangan bila data berbentuk nominal dari
frekuensi dikotomi, yang berkaitan mempunyai
mean yang sama. Uji ini merupakan
pengembangan dari uji Mc Nemar yang dipakai
bilamana banyak sampel lebih dari 2.
 Diukur dalam skala nominal atau ordinal yang
dipisah duakan (ya-tidak, sukses-gagal).
 Penelitian efektivitas tiga metode kerja baru.
Uji Chi Square

 Uji yg mempunyai penerapan yang sangat luas


untuk memeriksa ketidak-tergantungan dan
homogenitas.
 Untuk memeriksa ketidak-tergantungan dan
homogenitas.
Uji 2 untuk memeriksa ketidak-
tergantungan

 Melihat keterkaitan antar variabel, apakah dua


variabel memiliki hubungan atau tidak (saling
bebas)
 1 sampel : pengujian apakah para ibu hobi
berbelanja ke supermarket.
 2 sampel : Hubungan antara hipertensi dengan
kebiasaan merokok. (ada atau tidak adanya
hipertensi tidak bergantung pada kebiasaan
merokok).
Uji 2 untuk memeriksa
homogenitas

 Untuk menguji ketidaktergantungan


(kebebasan), dapat juga diterapkan untuk
menguji apakah k populasi binom memiliki
parameter yang sama p (proporsi).
 1 sampel : sebaran nilai kuliah statistik adalah
seragam.
 2 sampel : proporsi ibu rumah tangga yang
menonton telenovela di 3 kota besar.
 K sampel : variasi kejahatan
(rampok,perkosa,jambret) di berbagai kota.
Korelasi

 Untuk mencari hubungan antara dua variabel


atau lebih yang sifatnya kuantitatif dan kualitatif.
 Misal, kita memiliki dua variabel (Y dan X)
apakah hubungannya berbanding lurus atau
terbalik, atau tidak mempunyai hubungan sama
sekali.
 Uji statistik yg digunakan :
 Korelasi Spearman`s
 Korelasi Tau Kendall`s
 Koefisien Kontingensi.
Korelasi Spearman

 Untuk mencari hubungan atau untuk menguji


signifikansi hipotesis asosiatif bila masing-
masing variabel yang dihubungkan berbentuk
ordinal, dan sumber data antar variabel tidak
harus sama.
 Korelasi peringkat data hasil statistik UTS
dengan UAS.
Korelasi Tau Kendall`s

 Untuk digunakan sebagai ukuran asosiasi


dengan jenis data dengan jenis data yang sama
dengan data di mana koefisien korelasi
Spearman digunakan.
 Hubungan antara rangking SMU dengan IPK
kuliah
Koefisien Kontingensi : C

 Suatu ukuran asosisasi antara 2 variabel yang


berbentuk atribut.

Anda mungkin juga menyukai