Anda di halaman 1dari 67

BAGAN DASAR ANALISA

DATA
HUBUNGAN
KATEGORIK KATEGORIK

KONTINU KONTINU

1
Menganalisis Hubungan Dua
Variabel Kategorik

2
TABULASI SILANG
Digunakan untuk menguji hubungan dua variabel
kategorik

CONTOH
Seorang dosen ingin mengetahui apakah ada hubungan
antara gender dengan kesukaan mahasiswa terhadap
mata kuliah Ekonomi. Kesukaan terhadap mata kuliah
tersebut digolongkan menjadi tidak suka, biasa saja dan
suka
Dari 100 mahasiswa yang diajarnya, ia mendapatkan hasil
penggolongan sebagai berikut:

3
Maksud dari 2 angka di belaka
desimalnya???

Data Crosstab.sav
4
TABULASI SILANG 2 VARIABEL
KATEGORIK SPSS
Analyze  Descriptive Statistics 
Frequencies

Variabel
kategorik yang Ceklis
akan dianalisis persentase
yang ingin
ditampilkan di
tiap cell

5
6
Tanyain maksud dari Within gender dllnya

7
UJI STATISTIK
TABULASI SILANG
Akan diuji apakah ada hubungan antara Gender dan
Kesukaan terhadap mata kuliah Ekonomi

H0 : tidak ada hubungan antara Gender dan Kesukaan


terhadap Ekonomi
H1 : tidak demikian

Pilih α = 0.10

8
2
 
2 ( 𝑂𝑖𝑗 − 𝐸𝑖𝑗 )
Statistik Uji : 𝜒 =∑ ∑ 𝜒
𝑖 𝑗 𝐸𝑖𝑗 ( ( 𝑟 − 1) ( 𝑐 −1 ) )
 
Banyaknya pengamatan baris , kolom
Nilai harapan baris , kolom jika baris dan kolom
saling bebas
jumlah baris
jumlah kolom
H0 ditolak jika nilai tabel atau jika nilai yang dipilih

9
CHI-SQUARE TEST TABULASI
SILANG
Analyze  Descriptive Statistics 
Crosstabs
Checklist Chi-square

10
UJI STATISTIK TABULASI
SILANG(2)
H0 : tidak ada hubungan antara Gender dan
Kesukaan terhadap Ekonomi
H1 : tidak demikian

Asymp Sig = 0.000 < 0.10  H0 ditolak


Ada hubungan antara Gender dan Kesukaan terhadap
Ekonomi 11
Menganalisis Hubungan Dua
Variabel Kontinu

12
KORELASI
Digunakan untuk melihat KEKUATAN hubungan
linear antara dua variabel numerik (kontinu)

- Adakah hubungan antara umur dan tingkat


kedewasaan

- Apakah ada hubungan antara Lama Kerja dan


Tingkat Kejenuhan Kerja

- Adakah hubungan antara Skor Kemampuan


Memimpin dengan Gaji

13
KORELASI(2)
Dalam Pelatihan ini akan dibatasi hubungan linier antara
2 variabel numerik

Koefisien korelasi (r) yang biasa digunakan adalah


koefisien korelasi Pearson (menggunakan nilai data
yang kontinu) atau koefisien korelasi Spearman
(menggunakan rank dari data)

14
KORELASI(3)
1. Nilai r selalu di antara –1 dan 1.
2. Nilai r > 0 terjadi bila kenaikan nilai x terjadi bersama-sama
dengan kenaikan nilai y.
3. Nilai r < 0 terjadi bila kenaikan nilai x terjadi bersama-sama
dengan penurunan nilai y.
4. Nilai r = 1 atau -1 terjadi hubungan linier yang sempurna
antara variabel x dan y, baik dengan arah positif maupun
dengan arah negatif
5. Nilai r dekat 0 terjadi bila hubungan linier antara kedua
variabel sangat lemah atau tidak ada hubungan linier antara
ke dua variabel
15
KORELASI DATA
Contoh :

Seorang ingin melihat apakah ada hubungan


linear antara lama masa bekerja(tahun)
dengan income yang diterima.
Dari 20 pekerja yang dipilih didapatkan data
sebagai berikut

16
Data Korelasi.sav
17
KOEFISIEN KORELASI
𝑛 𝑛 𝑛
 

𝑟=
𝑛 ∑ 𝑥𝑖 𝑦1 −
𝑖=1
(∑ )(∑ )
1
𝑥𝑖
1
𝑦𝑖

√[
𝑛 𝑛 2 𝑛 𝑛 2
𝑛∑ 𝑥
1
2
𝑖 −
(∑
1
𝑥𝑖
) ][ ∑ (∑ ) ]
𝑛
1
𝑦 2
𝑖 −
1
𝑦𝑖

 
Dari data didapat: INI DARIMANAPAKK
variasi income dipengaruhi oleh lama masa kerja
Jika lama masa kerja naik maka income akan naik

Apakah hubungan lama masa kerja dan income kuat?

18
19
KORELASI SPSS

Analyze  Correlate Bivariate


Variabel
yang akan
dianalisis

Pilih koefisien korelasi


Pearson dan Spearman

20
Ho : tidak ada korelasi antara X danY
H 1: ada korelasi
Tentukan 
Statistik Uji :
n  3  1 r  
Z ln   ~ N (0,1)
2  (1  r ) 
Distribusi Z diperoleh jika X dan Y berdistribusi Normal
Jika salah satu dari X atau Y tidak berdistribusi Normal
maka akan digunakan koefisien korelasi Spearman atau
Kendal
21
KOEFISIEN KORELASO SPEARMAN
Misalkan ( X 1, Y 1)......( Xn, Yn) sampel random ukuran n
R( Xi ) adalah rank dari Xi
R(Yi ) adalah rank dariYi
Koefisien korelasi spearman adalah sebagai berikut :
n
 n  1  n  1
  R ( Xi )  2   R (Yi  2 
r  i 1
n(n 2  1) /12

Nilai koefisien korelasi Spearman antara 1 s / d 1


( sama seperti Pearson)
22
Statistik Uji untuk menguji koefisien korelasi
Spearman adalah sebagai berikut:
Ho : tidak ada korelasi antara X danY
H 1: ada korelasi
Tentukan 
Statistik Uji :
n 2

T    R ( Xi )  R (Yi ) 
i 1

Statistik Uji di atas akan dibandingkan dengan


tabel Hottelling  Pabst  Test  Statistics
(tabel A11  NonParametric Conover )
23
KOEFISIEN KORELASI(2)
H 0 :Tidak ada korelasi antara X danY
 
 H : Ada korelasi antara X dan Y
1
Pilih :𝛼=0.05
 

𝑆𝑖𝑔=0.004<0.05 → 𝐻 0 𝑑𝑖𝑡𝑜𝑙𝑎𝑘
 

Ada korelasi antara lama masa kerja dan income

24
KOEFISIEN KORELASI(3)
Jika digunakan Koefisien Korelasi Spearman
didapat hasil sebagai berikut:

25
BAGAN

PENGARUH
VARIABEL VARIABEL BEBAS METODE
DEPENDENT
Kontinu Kategorik Anova/Kruskall
Wallis
Kontinu Kontinu Regresi
Kategorik Kategorik Tabulasi Silang
Khusus
Kategorik Kontinu Regresi Logistik

26
Menganalisis Pengaruh Variabel
Kategorik terhadap Variabel
Kontinu

27
ANOVA
Digunakan untuk menguji apakah ada pengaruh variabel
bebas kategorik terhadap variabel respon numerik
(kontinu).

Variabel bebas adalah variabel yang nilainya tidak


dipengaruhi oleh variabel lain
Variabel respon adalah variabel yang nilainya dipengaruhi
variabel bebas

Dalam pelatihan ini materi dibatasi pada pengaruh satu


variabel bebas kategorik terhadap satu variabel respon
numerik.
Metode Anova yang digunakan disebut Anova Satu Arah
28
MODEL ANOVA
 

Variabel respon kontinu


rata-rata Y keseluruhan
pengaruh kategori ke- dari variabel
bebas kategorik
error

29
ANOVA DATA
Seorang sales manajer ingin mengetahui sales
performance dari 3 grup sales yang ada di
perusahaan tersebut. Untuk melihat hal tersebut
diambillah data hasil penjualan tiap sales dari
ketiga grup dalam seminggu terakhir.

DATA ANOVA

30
Data Anova.sav

31
MODEL
𝑌 =𝜇+𝛼 +𝜀
 
ANOVA
𝑖

𝑌  =hasil penjualan
 𝜇=rata− rata keseluruhan

𝛼
  = pengaruh kategori ke −𝑖 ; 𝑖=1,2,3
𝑖

𝜀 =error
 

1: grup sales 1
2: grup sales 2
3: grup sales 3
H 0 :Tidak ada perbedaan performance ketiga grup
 

 H :Tidak demikian(ada perbedaan)


1

Pilih :𝛼=0.15
 
32
ASUMSI ANOVA
Anova mempunyai asumsi yang harus
dipenuhi, salah satunya adalah error harus
berdistribusi Normal
Jika asumsi tidak dipenuhi maka metode yang
digunakan adalah metode Kruskall Wallis
Asumsi bisa tidak diperhitungkan jika banyak
pengamatan per kategori sama atau
proporsional  Jika banyak pengamatan per
kategori sama maka asumsi tidak perlu
diperiksa
33
ANOVA SPSS
Analyze  Compare Means One-Way Anova

Pilih variabel
dependen dan
faktor yang
membedakan

34
TABEL ANOVA

Sig = 0.000 < 0.15  H0 ditolak


Ada pengaruh perbedaan grup sales dengan
hasil penjualan.

35
MEANS PLOT
Penjualan paling banyak
datang dari grup sales 3 dan
paling sedikit dari grup sales 2.

36
Menganalisis Pengaruh Variabel
Kontinu terhadap Variabel
Kontinu

37
ANALISIS REGRESI

Digunakan untuk melihat pengaruh dari variabel bebas


kontinu terhadap variabel respon kontinu

Dalam contoh untuk korelasi  lama kerja merupakan


variabel bebas dan Income merupakan variabel respon

38
ANALISIS REGRESI(2)
Jika kita hanya memperhatikan satu variabel bebas, maka
dikatakan kita melakukan analisis regresi sederhana.

Jika ada beberapa variabel bebas yang diperhatikan,


maka dikatakan kita melakukan analisis regresi berganda.

Dalam pelatihan ini, hanya akan dibahas mengenai


analisis regresi sederhana dimana hanya diperhatikan
satu variabel respon (Y) dan satu variabel bebas (X).

39
MODEL REGRESI
 
Model Regresi Sederhana

 
Taksiran Model

n
 n  n 
n  xi yi    xi    yi 
b1  1  1   1 
2
n
 n

n  xi    xi 
2

1  1 
bo  y  b1 x
40
MODEL REGRESI(2)
Y  bo  b1 X 1
 
adalah nilai dari jika = 0
adalah besar kenaikan jika naik 1 satuan
Jika  Variabel tidak mempengaruhi .
Karena itu dalam analisis regresi ingin diuji apakah
mempengaruhi atau tidak.
Dengan perkataan lain ingin diuji apakah atau
tidak. 41
REGRESI SPSS
Analyze  Regression Linear…..

42
SPSS OUTPUT

 H 0 : Lamamasa berkerja tidak mempengaruhi income


 H : Lama masa bekerja mempengaruhi income
1
Pilih :𝛼=0.05
 

𝑆𝑖𝑔 =0.004< 0.05 → H 0 ditolak


 

Ada pengaruh lama masa kerja dan income

Data Korelasi.sav
43
SPSS OUTPUT(2)
Dari contoh di atas didapat hasil sebagai
berikut:

Income =835.714,286+880.952,381*lama masa kerja

Jika masa kerja=0, maka income diterima sebesar Rp


835.715,-

Jika masa kerja bertambah 1 tahun maka income yang


diterima bertambah Rp 880.952,- 44
Menganalisis Pengaruh Variabel
Kategorik terhadap Variabel
Kategorik

45
TABULASI SILANG KHUSUS
Menguji pengaruh variabel kategorik
terhadap variabel kategorik
Misalkan kesukaan terhadap mata kuliah
Ekonomi dianggap sebagai variabel respon
dan Gender dianggap sebagai variabel bebas
H0 : tidak ada pengaruh Gender terhadap
kesukaan terhadap ilmu Ekonomi
H1 : tidak demikian
46
TABULASI SILANG
KHUSUS SPSS
Analyze  Descriptive Statistics 
Crosstabs

47
TABULASI SILANG KHUSUS
OUTPUT

Data Crosstab.sav

Approx Sig = 0.000 < 0.10  H0 ditolak


Gender mempengaruhi Kesukaan terhadap Ekonomi

48
Menganalisis Pengaruh Variabel
Kontinu terhadap Variabel
Kategorik

49
ANALISIS REGRESI
LOGISTIK
Digunakan untuk melihat pengaruh variabel bebas
kontinu atau kategorik terhadap variabel respon
kategorik.
Dalam pelatihan ini variabel bebas merupakan
variabel gaji, dan variabel respon kategorik dengan
dua kategori, yaitu Y=1 jika “Ya (sukses)” dan Y=0 jika
“Tidak (gagal)”.
Variabel gaji yang digunakan berupa variabel kontinu

50
REGRESI LOGISTIK VARIABEL
BEBAS KONTINU
 Adalah
bentuk khusus dari model regresi dimana variabel
dependen merupakan variabel biner. Dengan variabel bebas
merupakan variabel kontinu
Misal variabel = 1 jika sukses dengan probability
= 0 jika gagal dengan probability (1-)
Model regresi logistik  mengasumsikan hubungan dengan
variabel bebas dapat dituliskan sebagai:

51
MODEL REGRESI LOGISTIK
 Model Regresi Logistik sering dituliskan sebagai:

= resiko sukses

Jika naik 1 satuan maka odd naik satuan.

52
REGRESI LOGISTIK
Berpindahnya seorang pelayan gereja diasumsikan
dipengaruhi oleh besarnya gaji. Dari 50 pelayan yang
terpilih menjadi responden didapat catatan data sebagai
berikut:

Sebut Y = 1 jika pelayan pindah (sukses)


Y = 0 jika pelayan tidak pindah

53
DATA

54
55
56
57
REGRESI LOGISTIK
OUTPUT

80% responden terklasifikasi dengan benar oleh model

58
 Jika Gaji = 0 

Jika tidak dibayar maka probabilitas karyawan akan berpindah 1


(hampir pasti berpindah)

Jika Gaji 1 satuan = 100.000 maka

Jika Gaji bertambah 1 satuan = 100.000, maka

= 0.856   berkurang sebesar = 0.4612

59
REGRESI LOGISTIK
OUTPUT(3)

Model cocok

60
REGRESI LOGISTIK VARIABEL
BEBAS KATEGORIK
Misalkan variabel gaji (kontinu) dikategorikan
menjadi 3 kategori yaitu:
Kategori Gaji Rendah : kategori gaji antara 5-25 satuan
Kategori Gaji Sedang : kategori gaji antara > 25-45 satuan
Kategori Gaji Tinggi : Kategori gaji antara >45-75 satuan

Note : 1 satuan = Rp. 100.000,-

61
Data Logistik.sav

62
REGRESI LOGISTIK SPSS
Analyze  Regression Binary Logistic
Pilih variabel bebas
kategorik.

63
REGRESI LOGISTIK
OUTPUT

88% responden terklasifikasi dengan benar oleh model.

64
OUTPUT(2)

Pandang Variabel G1 = gaji (1) dan G2= gaji (2)


Base dari ketiga kategori adalah kategori gaji 46-75. G1=0, G2=0
Gaji 26-45 (sedang)  G1=1, G2=0
Gaji 5-25 (rendah)  G1=0. G2=1
Model :

ln   0  1 G1   2 G2
1 
65
REGRESI LOGISTIK
OUTPUT(3)

66
Jika Gaji Tinggi (G1  0, G 2  0)
e 0 0.059
Pr( pindah)  0
  0.056
1 e 1  0.059
0
Odd   0    e 0

1 0
Jika Gaji Sedang (G1  1, G 2  0)
e 0  1
Pr( pindah)   0  1
 0.62
1 e
0, 62
Pr pindah jika Gaji sedang  11 kali prob pindah
0.056
jika Gaji tinggi

67

Anda mungkin juga menyukai