net/publication/369793795
Pengantar Statistika 2
CITATIONS READS
0 189
1 author:
Nurul Aziza
Universitas Maarif Hasyim Latif Sidoarjo, Indonesia
24 PUBLICATIONS 24 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Nurul Aziza on 05 April 2023.
PENGANTAR STATISTIKA 2
UU No 28 tahun 2014 tentang Hak Cipta
Fungsi dan sifat hak cipta Pasal 4
Hak Cipta sebagaimana dimaksud dalam Pasal 3 huruf
a merupakan hak eksklusif yang terdiri atas hak moral
dan hak ekonomi.
Pembatasan Pelindungan Pasal 26
Ketentuan sebagaimana dimaksud dalam Pasal 23,
Pasal 24, dan Pasal 25 tidak berlaku terhadap:
i Penggunaan kutipan singkat Ciptaan dan/atau
produk Hak Terkait untuk pelaporan peristiwa aktual
yang ditujukan hanya untuk keperluan penyediaan
informasi aktual;
ii Penggandaan Ciptaan dan/atau produk Hak Terkait
hanya untuk kepentingan penelitian ilmu
pengetahuan;
iii Penggandaan Ciptaan dan/atau produk Hak Terkait
hanya untuk keperluan pengajaran, kecuali
pertunjukan dan Fonogram yang telah dilakukan
Pengumuman sebagai bahan ajar; dan
iv Penggunaan untuk kepentingan pendidikan dan
pengembangan ilmu pengetahuan yang
memungkinkan suatu Ciptaan dan/atau produk Hak
Terkait dapat digunakan tanpa izin Pelaku
Pertunjukan, Produser Fonogram, atau Lembaga
Penyiaran.
Editor:
Suci Haryanti, M.Pd., CEPT
Penerbit
Anggota IKAPI
No. 370/JBA/2020
PENGANTAR STATISTIKA 2
Wahyudin, M.Pd
Febri Rismaningsih, S.Pd. Si., M.Sc
Ul’fah Hernaeny, M.Pd
Erwinda Fenty Anggraeni, S.Pd.Si., M.Sc
Fauziah Astuti, M.Pd
Bergita Gela M Saka, S, Si., M.Sc
Eka Hendrayani, S.E., M.M
Yessi Oktavia, S.Si
I Putu Tedy Indrayana, S.Pd., M.Sc
Diah Oga Nusantari, S.Si., M.Pd
Sudirman, M.ED
Ir. Nurul Aziza, MT., IPM., ASEAN Eng
Dr. Jan Setiawan, S. Si, M.Si
Supriyanto, S.Pd.Si
Editor:
Suci Haryanti
Tata Letak :
Mega Restiana Zendrato
Desain Cover :
Syahrul Nugraha
Ukuran :
A5 Unesco: 15,5 x 23 cm
Halaman :
vi, 237
ISBN :
978-623-362-628-6
Terbit Pada :
Juli 2022
i
DAFTAR ISI
KATA PENGANTAR.......................................................................... i
DAFTAR ISI ....................................................................................... ii
1 PENGUJIAN HIPOTESIS .................................................... 1
Definisi ..................................................................................... 1
Macam-macam Rumusan Hipotesis .............................. 2
Langkah-Langkah Pengujian Hipotesis ........................ 4
2 UJI CHI-KUADRAT DAN ANALISIS VARIANS ........... 13
Uji Chi-Kuadrat 𝛘𝟐 ............................................................. 13
Analisis Varians .................................................................. 18
3 ANALISIS REGRESI SEDERHANA ................................ 31
Konsep Regresi Linier Sederhana ................................. 31
Analisis Regresi ................................................................... 31
Uji Signifikansi dan Hipotesis ........................................ 38
4 ANALISIS REGRESI MULTIPLE ..................................... 45
Regresi Multiple .................................................................. 45
Analisis Regresi Multiple ................................................. 47
Studi Kasus .......................................................................... 50
Tahapan analisis regresi menggunakan
software SPSS...................................................................... 52
Analisis regresi multiple .................................................. 60
Kesimpulan .......................................................................... 64
5 ANALISIS KORELASI SEDERHANA.............................. 67
Pengertian Analisis Korelasi Sederhana ..................... 67
Koefisien Korelasi (r).......................................................... 71
ii
Tahapan Uji Hipotesis hubungan dua Variabel
X dan Y .................................................................................. 75
Menghitung dan menguji korelasi sederhana
Koefisien Korelasi x dan y ............................................... 77
Soal Latihan ......................................................................... 83
6 ANALISIS KORELASI MULTIPLE ................................... 87
Uji Signifikansi .................................................................... 89
Contoh Kasus Uji Korelasi Berganda .......................... 90
7 ANALISIS UJI ANOVA SATU ARAH .............................. 99
Pengertian Anova................................................................ 99
Kegunaan Anova................................................................. 99
Alasan Penggunaan Anova ............................................ 100
Syarat Anova...................................................................... 101
Jenis-jenis Anova ............................................................. 101
8 WILCOXON ......................................................................... 111
Langkah-Langkah Uji Wilcoxon................................... 111
Contoh Soal ........................................................................ 113
Cara Manual ...................................................................... 114
Penggunaan dengan SPSS ............................................ 122
9 MANN-WHITNEY............................................................... 129
Pendahuluan ..................................................................... 129
Teori Mann-Whitney ........................................................ 131
Asumsi-asumsi Pengujian ............................................. 136
Pernyataan Hipotesis ...................................................... 137
Prosedur Pungujian Statistik ....................................... 139
Kaidah Keputusan ........................................................... 140
Penerapan Mann Whitney ............................................. 141
iii
Ringkasan ........................................................................... 153
10 ANALISIS NONPARAMETRIK
KORELASI RANK SPEARMAN ...................................... 157
Pendahuluan ..................................................................... 157
Statistika Non Parametik............................................... 158
Analisis Korelasi Rank Spearman .............................. 161
Aplikasi Metoda Analisis Korelasi Rank Spearman
Dalam Penelitian .............................................................. 166
11 KRUSKALL WALLIS ......................................................... 171
Pengertian ........................................................................... 171
Rumus dan Asumsi Kruskall Wallis .......................... 173
Prosedur Uji Kruskal Wallis.......................................... 175
Penerapan Kruskal Wallis ............................................. 175
Manfaat Kruskal Wallis .................................................. 184
12 LINEAR DISCRIMINANT ANALYSIS ............................ 187
Pendahuluan ..................................................................... 187
Analisis Diskriminan Linier .......................................... 188
Model Analisis Diskriminan Linier ............................. 190
Istilah-istilah Statistik dalam Analisis
Diskriminan Linier........................................................... 192
Pengujian Model Analisis Diskriminan Linier ........ 194
Cara Mengelompokkan Obyek/Responden
Berdasarkan Fungsi Diskriminan .............................. 197
13 ANALISIS DISKRIMINAN KUADRATIK ...................... 203
Pendahuluan ..................................................................... 203
Fungsi Diskriminan Kuadratik .................................... 204
Analisis Diskriminan Kuadratik .................................. 205
iv
14 ANALISIS KORELASI KANONIKAL.............................. 217
Penggunaan Korelasi Kanonikal ................................. 217
Contoh Kasus .................................................................... 222
Rancangan Penyelesaian Kasus .................................. 225
Pengujian dengan SPSS ................................................. 225
Interpretasi Hasil Uji Korelasi Kanonikal ................. 230
v
12
LINEAR DISCRIMINANT ANALYSIS
Pendahuluan
Istilah linear discriminant analysis atau analisis
diskriminan linear, yang biasa disebut dengan LDA
merupakan generalisasi diskriminan linear Fisher, adalah
suatu metode dalam bidang statistik bertujuan mencari
kombinasi linier sebuah fitur melalui pembelajaran mesin
dan pengenalan pola yang memiliki karakteristik tertentu
yang mampu memisahkan menjadi dua atau beberapa
obyek/peristiwa. Sehingga munculnya kombinasi
tersebut menjadi pengklasifikasi linear, atau biasanya
digunakan untuk proses mengurangi dimensionalitas
sebelum dilakukan pengklasifikasian.
Analisis variansi (ANOVA) dan analisis regresi terkait
dengan metode LDA, dimana variabel dependen yang
disimbolkan dengan y sebagai suatu kombinasi linear
fitur-fitur atau pengukuran-pengukuran lainnya
(McLachlan, 2004). Perbedaannya pada ANOVA yaitu
penggunaan variabel independen (simbol; x) berupa data
kategoris dan variabel dependen (y) adalah data kontinu.
Sedangkan pada LDA menggunakan variabel independen
yang kontinu dan variabel dependen (y) adalah data
kategoris, variabel independen (x) adalah data kontinyu
(Wetcher, 2011).
187
LDA mampu melakukan analisis komponen utama dan
analisis faktor sehingga menemukan kombinasi linear
variabel-variabel yang terbaik dalam menjelaskan data
(Martinez, 2001). Sehingga metode LDA mampu
memodelkan perbedaan antara kelas-kelas data. Namun
analisis diskriminan memiliki perbedaan dengan analisis
faktor karena analisis diskriminan bukan teknik yang
interdependen, sehingga perbedaan antara variabel
independen dan dependen harus ditetapkan. Persyaratan
untuk metode LDA yaitu pengukuran dilakukan terhadap
variabel-variabel independen setiap pengamatan adalah
data kuantitatif kontinyu. Apabila data yang dihadapi
merupakan variabel independen dengan data kategoris,
maka teknik yang sesuai menggunakan analisis
korespondensi diskriminan (Abdi, 2007).
188
menggunakan analisis diskriminan, berikut ini akan
dibandingkan dengan analisis regresi dan analisis varian:
Tabel 12.1 Perbandingan Analisis diskriminan, analisis
regresi, dan analisis varian
Diskriminan Regresi ANOVA
Banyaknya Satu Satu Satu
variabel
dependen
(y)
Banyaknya Lebih dari Lebih dari Lebih dari
variabel satu satu satu
independen
(x)
Sifat Kategori – Metrik – Metrik –
variabel nominal/ordi interval/ras interval/rasio
dependen nal io (kuantitatif)
(y) (kualitatif) (kuantitatif)
Sifat Metrik – Metrik – Kategori –
variabel interval/rasio interval/ras nominal/ordi
independen (kuantitatif) io nal
(x) (kuantitatif) (kualitatif)
Tujuan analisis diskriminan secara umum sebagai berikut
(Supranto, 2010) :
1. Membuat suatu fungsi diskriminan atau kombinasi
linier dari prediktor atau variabel independen yang
bisa membedakan kategori variabel dependen. Artinya
mampu membedakan suatu responden (obyek) masuk
ke kelompok/grup /kategori yang mana.
2. Melakukan pengujian apakah ada perbedaan
signifikan antara kategori/kelompok dikaitkan
dengan variabel independen.
3. Menentukan variabel dependen yang memberikan
kontribusi terbesar terjadinya perbedaan antar
kategori/kelompok/grup.
189
4. Mengelompokkan obyek/responden/kasus kedalam
suatu kategori/kelompok/grup didasarkan pada nilai
variabel independen.
5. Melakukan evaluasi keakurasian
klasifikasi/pengelompokan.
Berdasar tujuan analisis diskriminan, maka kegunaan
analisis diskriminan sangat banyak sekali (Usman,D. Et
al, 2013), misalnya :
1. Banyak atau sedikitnya konsumen membeli produk
setiap hari.
2. Pemilihan warna produk.
3. Menganalisis karakter perusahaan yang berpotensi
bangkrut atau tidak.
4. Mengelompokkan sales berdasarkan jumlah produk
yang terjual dengan kategori sedikit, sedang, banyak.
Dengan demikian penggunaan analisis diskriminan linier
bisa untuk berbagai bidang antara lain pemasaran,
produktivitas karyawan, perbankan, dan sebagainya.
190
Dimana :
D = skor diskriminan
b = koefisien diskriminan
x = variabel independen
Apabila ingin mengklasifikasikan responden/obyek
kedalam dua kelompok dengan teknik analisis
diskriminan linier ini, maka model yang yang didapatkan
berjumlah satu. Sedangkan apabila ingin
mengklasifikasikan menjadi 3 kelompok/grup maka
model yang didapat berjumlah dua. Dengan kata lain
model yang didapatkan sesuai dengan jumlah kelompok
yang diinginkan dapat dicari dengan rumus (n-1) buah.
Dari model yang didapatkan maka dapat dihitung nilai D.
Berdasarkan nilai D, responden/obyek akan dimasukkan
kedalam suatu kategori sesuai batasan nilai setiap
kategori.
Data variabel independen dapat dihitung berdasarkan
data asli riil di lapangan atau bisa dilakukan standarisasi.
Sebenarnya data asli bisa langsung bisa digunakan
namun dengan syarat bahwa data memiliki satuan
pengukuran yang sama. Apabila satuan pengukurannya
tidak sama, maka sebaiknya data harus distandarisasi
terlebih dahulu. Hal ini dilakukan agar tidak terjadi
dominasi data karena terdapat data dengan nominal yang
terlalu tinggi/besar. Misalnya saja perbandingan data
jumlah karyawan dengan jumlah omset. Agar data omset
tidak terlalu mendominasi dan tidak mempengaruhi
variabel lainnya, maka sebaiknya dilakukan standarisasi
sehingga diharapkan memiliki rata-rata dan varian yang
sama. Formulasi standarisasi data dapat dilakukan
melalui persamaan berikut :
𝑋𝑖 − 𝑋̅
𝑋𝑠 =
𝑆𝑥
191
Dimana :
𝑋𝑠 adalah nilai variabel independen setelah distandarisasi
𝑋𝑖 adalah nilai variabel independen hasil observasi
𝑋̅ adalah rata − rata variabel independen hasil observasi
𝑆𝑥 adalah standar deviasi variabel independen hasil observasi
Saat standarisasi ini dilakukan maka semua variabel
akan memiliki nilai rata-rata sama dengan 0 dan standar
deviasi 1. Dengan demikian kesamaan ini variabel ini akan
memudahkan peneliti membandingkan dominasi dari
setiap variabel independen terhadap model persamaan.
192
5. Hit ratio adalah salah satu kriteria yang mampu
menilai kekuatan persamaan diskriminan dalam
mengelompokkan responden/obyek.
6. Classification matrix (Matrik klasifikasi) atau biasa
disebut dengan prediction matrix yang memuat jumlah
obyek/responden/kasus yang diklasifikasikan secara
tepat dan yang diklasifikasikan secara salah.
7. Discriminant coefficient function adalah pengali
variabel dimana variabel dalam nilai asli pengukuran.
8. Discriminant score adalah koefisien yang tidak
distandarisasi dikalikan dengan nilai variabel.
9. Eigenvalue adalah rasio antara jumlah kuadrat antar
kelompok (sums of squares between group) dan jumlah
kuadrat dalam kelompok (sums of squares within
group). Eingenvalue besar menunjukkan fungsi yang
semakin baik.
10. Nilai F dan signifikansi, dihitung berdasarkan ANOVA
one way.
11. Rata-rata group dan standar deviasi grup yaitu rata-
rata grup dan standar deviasi yang dihitung untuk
setiap grup.
12. Pooled with correlation matrix dihitung dengan
menacari rata-rata matrik covarian tersendiri untuk
semua grup.
13. Standarized discriminant function coefficient
merupakan koefisien fungsi diskriminan yang
digunakan sebagai pengali pada saat variabel sudah
distandarisasi dimana rata-rata sama dengan 0 dan
standar deviasi sama dengan 1.
14. Structure correlation disebut juga discriminant loadings
adalah korelasi yang merupakan representasi korelasi
193
sederhana antara variabel-variabel independen dan
fungsi diskriminan.
15. Total correlation matrix diperoleh apabila setiap
kasus/responden/obyek dianggap berasal dari
sampel dan korelasi dihitung, maka matrik korelasi
total didapatkan.
16. Wilk’ bisa disebut juga dengan statistik U adalah
rasio antara jumlah kuadrat dalam kelompok (within
group sums of squares) dan jumlah kuadrat total (total
sums of squares). Nilai Wilk’ antara 0 sampai 1. Nilai
Wilk’ yang besar menunjukkan bahwa rata-rata grup
cenderung tidak berbeda, dan sebaliknya apabila nilai
Wilk’ kecil mendekati 0 maka menunjukkan rata-rata
grup signifikan berbeda.
194
𝐻0 = 𝜇1 = 𝜇2
𝐻1 = 𝜇1 ≠ 𝜇2
Dimana :
𝜇1 𝑎𝑑𝑎𝑙𝑎ℎ 𝑟𝑎𝑡𝑎 − 𝑟𝑎𝑡𝑎 𝑘𝑎𝑟𝑎𝑘𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑘 𝑘𝑒𝑙𝑜𝑚𝑝𝑜𝑘 1
𝜇2 𝑎𝑑𝑎𝑙𝑎ℎ 𝑟𝑎𝑡𝑎 − 𝑟𝑎𝑡𝑎 𝑘𝑎𝑟𝑎𝑘𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑘 𝑘𝑒𝑙𝑜𝑚𝑝𝑜𝑘 2
Berdasarkan contoh kasus diatas, maka kita tentukan
3 hipotesis yang akan dibuat yaitu :
a. H0 : rata-rata kepuasan kerja kelompok
produktivitas tinggi sama dengan kelompok
produktivitas rendah
H1 : rata-rata kepuasan kerja kelompok
produktivitas tinggi tidak sama dengan kelompok
produktivitas rendah
b. H0 : rata-rata gaji kelompok produktivitas tinggi
sama dengan kelompok produktivitas rendah
H1 : rata-rata gaji kelompok produktivitas tinggi
tidak sama dengan kelompok produktivitas
rendah
c. H0 : rata-rata jumlah insentif kelompok
produktivitas tinggi sama dengan kelompok
produktivitas rendah
H1 : rata-rata jumlah insentif kelompok
produktivitas tinggi tidak sama dengan kelompok
produktivitas rendah
Misalkan saja setelah dilakukan pengolahan data
didapatkan tingkat kepuasan kerja adalah sama
antara karyawan produktivitas tinggi dan rendah,
maka bisa disimpulkan tingkat kepuasan kerja tidak
berpengaruh terhadap produktivitas karyawan.
Demikian juga sebaliknya, apabila tingkat kepuasan
kerja tidak sama atau terdapat perbedaan antara
195
karyawan produktivitas tinggi dan rendah, maka
dapat diambil kesimpulan bahwa ada pengaruh
tingkat kepuasan kerja terhadap produktivitas
karyawan. Pengujian hipotesis ini dapat
menggunakan analisis varian (ANOVA).
2. Menguji ketepatan model.
Terdapat 3 pengujian ketepatan model yaitu :
a. Eigenvalue
b. Uji Wilk’
c. Korelasi kanonik
Formulasi untuk perhitungn eigenvalue dapat
dirumuskan sebagai berikut :
𝑛
𝑆𝑆 = ∑(𝑋𝑖 − 𝑋̅)2
𝑖=1
Dimana :
𝑆𝑆 ∶ 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡
𝑋𝑖 ∶ 𝑛𝑖𝑙𝑎𝑖 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖 𝑘𝑒 − 𝑖
𝑋̅ ∶ 𝑟𝑎𝑡𝑎 − 𝑟𝑎𝑡𝑎
Setelah didapatkan nilai SS, maka nilai eigenvalue
dapat dirumuskan dengan :
𝑆𝑆𝐴
𝐸𝑖𝑔𝑒𝑛𝑣𝑎𝑙𝑢𝑒 =
𝑆𝑆𝐷
Dimana :
𝑆𝑆𝐴 ∶ 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑎𝑛𝑡𝑎𝑟 𝑘𝑒𝑙𝑜𝑚𝑝𝑜𝑘
𝑆𝑆𝐷 : 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑑𝑎𝑙𝑎𝑚 𝑘𝑒𝑙𝑜𝑚𝑝𝑜𝑘
Keterangan :
196
Eingenvalue besar menunjukkan fungsi yang semakin
baik.
Untuk uji statistik Wilk’ (Lambda) hampir sama dengan
cara perhitungan eigenvalue, formulasinya dapat
dirumuskan sebagai berikut :
𝑆𝑆𝐷
𝑊𝑖𝑙𝑘 ′ 𝜆 =
𝑆𝑆𝑇
Dimana :
𝑆𝑆𝐷 ∶ 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑑𝑎𝑙𝑎𝑚 𝑘𝑒𝑙𝑜𝑚𝑝𝑜𝑘
𝑆𝑆𝑇 : 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑡𝑜𝑡𝑎𝑙
Keterangan :
Semakin kecil nilai Wilk’ (Lambda) yang didapat, maka
akan semakin baik model yang didapat. Sedangkan untuk
korelasi kanonikal, maka semakin besar nilai korelasi
kanonikalnya, maka akan semakin baik pula model yang
didapat.
197
𝐷𝐴 + 𝐷𝐵
𝐷0 =
2
Dimana :
𝐷0 ∶ 𝑛𝑖𝑙𝑎𝑖 𝑝𝑒𝑚𝑖𝑠𝑎ℎ (𝑐𝑢𝑡𝑡𝑖𝑛𝑔 𝑠𝑐𝑜𝑟𝑒)
𝐷𝐴 ∶ 𝑐𝑒𝑛𝑡𝑟𝑜𝑖𝑑 𝑘𝑒𝑙𝑜𝑚𝑝𝑜𝑘 𝐴
𝐷𝐵 ∶ 𝑐𝑒𝑛𝑡𝑜𝑟𝑖𝑑 𝑘𝑒𝑙𝑜𝑚𝑝𝑜𝑘 𝐵
198
Gambar 12.2 Penentuan kelompok bila jumlah
observasi berbeda
Sumber : Supranto, 2010
199
Daftar Pustaka
McLachlan, G. J. (2004). Discriminant Analysis and
Statistical Pattern Recognition. Wiley Interscience.
ISBN 0-471-69115-1. MR 1190469
Wetcher, D & Hendricks. (2011). Analyzing Quantitative
Data: An Introduction for Social Researchers, New
Jersey: Wiley.
Martinez, A. M.; Kak, A. C. (2001). PCA versus LDA (PDF).
IEEE Transactions on Pattern Analysis and Machine
Intelligence. 23 (=2): 228–233.
doi:10.1109/34.908974.
Abdi, H. (2007). Discriminant Correspondence Analysis. In:
N.J. Salkind (Ed.): Encyclopedia of Measurement and
Statistic. Thousand Oaks (CA): Sage. pp. 270–275.
Supranto, J. (2010). Analisis Multivariat ; Arti &
Interpretasi. Jakarta: Rineka Cipta.
Usman, H. & Sobari,N. (2013). Aplikasi Teknik
Multivariate Untuk Riset Pemasaran. Jakarta:
RajaGrafindo Persada.
Maholtra & Naresh, K. (1996). Marketing Research An
Applied Orientation. New Jersey: Prentice Hall Inc.
Simamora, B. (2005). Analisis Multivariat Pemasaran.
Jakarta : Gramedia Pustaka Utama.
200
Profil Penulis
201
JUDUL BAB X
202
View publication stats