Anda di halaman 1dari 22

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/362711852

STATISTIK PARAMETRIK DAN NONPARAMETRIK

Chapter · May 2022

CITATIONS READS

0 857

1 author:

Pardomuan Robinson Sihombing


Statistics Indonesia
98 PUBLICATIONS   34 CITATIONS   

SEE PROFILE

All content following this page was uploaded by Pardomuan Robinson Sihombing on 16 August 2022.

The user has requested enhancement of the downloaded file.


TEORI STATISTIK PENDIDIKAN

Dr. Rahmy Zulmaulida, M.Pd.


Dr. Edy Saputra, M.Pd.
Nurul Akmal, M.Pd.
Pardomuan Robinson Sihombing, SST, M.Stat
Febriyani eka Supriatin, S.Si., M.Si.
Ikhsan Fuady, M.Si.
Ega Gradini, M.Sc.
Mellkior Wewe, M.Pd.
Aulia Puspaning Galih, MS.
Dr. Julhidayat Muhsam, S.Pd., M.Pd.

Editor:
Prof. Dr. Bansu Irianto Ansari, M.Pd.

Yayasan Penerbit Muhammad Zaini


TEORI STATISTIK PENDIDIKAN

Penulis:
Dr. Rahmy Zulmaulida, M.Pd; Dr. Edy Saputra, M.Pd; Nurul Akmal,
M.Pd; Pardomuan Robinson Sihombing, SST, M.Stat; Febriyani eka
Supriatin, S.Si., M.Si; Ikhsan Fuady, M.Si; Ega Gradini, M.Sc;
Mellkior Wewe, M.Pd; Aulia Puspaning Galih, MS; Dr. Julhidayat
Muhsam, S.Pd., M.Pd.

ISBN: 978-623-5722-53-5
Editor:
Prof. Dr. Bansu Irianto Ansari, M.Pd.
Penyunting:
Nanda Saputra, M.Pd.
Desain Sampul dan Tata Letak:
Atika Kumala Dewi
Cetakan: 03 April 2022
Ukuran: A5 (14,8 x 21cm)
Halaman: iii, 1112 Lembar
Penerbit:
Yayasan Penerbit Muhammad Zaini
Anggota IKAPI (026/DIA/2021)
Redaksi:
Jalan Kompleks Pelajar Tijue
Desa Baroh Kec. Pidie
Kab. Pidie Provinsi Aceh
No. Hp: 085277711539
Email: penerbitzaini101@gmail.com
Website: penerbitzaini.com

Hak Cipta 2022@ Yayasan Penerbit Muhammad Zaini


Hak cipta dilindungi undang-udang, dilarang keras menerjemahkan,
memfotokopi, atau memperbanyak sebagian atau seluruh isi buku ini
tanpa izin tertulis dari penerbit.
DAFTAR ISI

DAFTAR ISI .................................................................................. i


BAB I KONSEP DASAR STATISTIK PENDIDIKAN ................ 1
A. Statistika ................................................................................................ 1
B. Data........................................................................................................ 4
BAB II STATISTIK DESKRIPTIF ...............................................8
A. Pengertian Data ................................................................................... 8
B. Penyajian Data ..................................................................................... 9
C. Distribusi Frekuensi ............................................................................ 9
D. Ukuran Nilai Pusat dan Ukuran Dispersi ...................................... 14
BAB III STATISTIKA INFERENSIAL...................................... 22
A. Pengertian Statistik Inferensial ........................................................ 22
B. Manfaat Statistik Inferensial............................................................. 22
C. Fungsi Statistik Inferensial ............................................................... 23
D. Ruang Lingkup Statistik Inferensial ................................................ 23
BAB IV STATISTIK PARAMETRIK DAN NONPARAMETRIK
...................................................................................................... 28
BAB V SIMPANGAN BAKU DAN VARIANS ........................... 45
A. Rentang (Range) .................................................................................. 45
B. Rentang Antar Kuartil (RAK) ......................................................... 47
C. Rata-rata Simpangan (Deviasi Rata-rata) ....................................... 48
D. Standar Deviasi dan Varians ............................................................ 49
BAB VI POPULASI DAN SAMPLE ........................................... 53
A. Populasi ............................................................................................... 53
B. Sampel ................................................................................................. 55
C. Teknik Sampling ................................................................................ 56
BAB VII HIPOTESIS PENELITIAN ........................................ 66
A. Konsep Hipotesis dan Jenis Hipotesis Penelitian ........................ 66
B. Parameter dan Statistik ..................................................................... 68
C. Definisi Hipotesis Nol dan Hipotesis Alternatif .......................... 70
D. Jenis Pengujian Hipotesis ................................................................. 71
E. Hipotesis Statistik .............................................................................. 72
BAB VIII VALIDITAS DAN RELIABILITAS ........................... 74
A. Pengertian Validitas ........................................................................... 74
B. Macam-macam Validitas................................................................... 76
C. Cara Mengetahui Validitas Alat Ukur ............................................. 77

i
BAB IV
STATISTIK PARAMETRIK DAN NONPARAMETRIK

Pardomuan Robinson Sihombing, SST, M.Stat


Badan Pusat Statistik RI

Pada bab sebelumnya telah disebutkan bahwa ada dua cabang


besar metode statistika yaitu statistik deskriptif dan statistik inferensia
(Sugiyono, 2017). Statistika deskriptif/ deduktif merupakan teknik
dalam mengumpulkan, mengolah serta menyajikan data dari sampel
penelitian. Statistika deskriptif dapat berupa ringkasan data (data berupa
ukuran pemusatan/ central tendency, ukuran letak/ posisi dan ukuran
keragaman/ dispersi) maupun penyajian data (dapat berupa tabel atau
grafik). Sedangkan, statistik inferensia/ induktif merupakan teknik
untuk mengeneralisasi atau mencari kesimpulan terhadap kondisi
populasi dari sampel yang ada, dengan kata lain menjawab hipotesis
penelitian (Supranto & Abdullah, 2017).
Penggunaan metode statistik inferensia dalam penelitian memiliki
tiga tujuan utama yaitu melakukan pengujian komparasi/ perbandingan,
melihat hubungan/ korelasi/ asosiasi, dan melakukan pembentukan
model. Dalam melakukan pengujian komparasi, hal yang dapat
dibandingkan ukuran data seperti proporsi data, varian data dan nilai
rata-rata data. Baik untuk ketiga ukuran data dapat diuji pada satu
populasi dengan membandingkan terhadap suatu nilai acuan. Selain itu
dapat dilakukan pada dua populasi yang bersifat dependen/
berpasangan yang diberikan suatu treatment/ kebijakan maupun pada
dua populasi yang bersifat independen di mana antar nilai/ peluang
kejadian populasi tidak saling mempengaruhi. Selain itu uji ini juga
dapat dilakukan untuk data lebih dari dua populasi.
Metode menguji arah dan kuat hubungan dapat dilakukan
dengan metode korelasi/ asosiasi. Metode di dalam pembentukan
model dapat berupa model-model sebab akibat yang salah satu metode
yang paling sering digunakan adalah metode analisis regresi. Dalam
pembentukan model regresi dapat dilakukan pengujian hipotesis
pengaruh antar variabel maupun prediksi terhadap suatu nilai/
klasifikasi suatu variabel respon.

28
Pada umumnya statistika inferensia dapat digolongkan menjadi
dua bagian besar yaitu statistika parametrik, dan statistika
nonparametrik. Penggolongan statistika inferensia ini dapat digunakan
untuk ketiga tujuan statistik, baik untuk tujuan komparasi, melihat
keeratan hubungan/ korelasi/ asosiasi maupun pembentukan model.
Selanjutnya akan dibahas perbedaan penggunaan masing-masing
statistika parametrik dan statistika nonparametrik untuk ketiga tujuan
tersebut.
Pada kasus pengujian komparasi, statistik parametrik dapat
digunakan untuk pengujian rata-rata, proporsi dan varian dari suatu
data. Pengujian statistik parametrik biasanya digunakan dengan
memperhatikan distribusi sebaran data populasi. Pada umumnya,
asumsi distribusi yang digunakan dalam pengujian hipotesis adalah
distribusi normal, walaupun dapat digunakan untuk distribusi lainnya
tetapi jarang digunakan. Selain itu untuk beberapa hal yang perlu
diperhatikan dalam penggunaan statistik parametrik adalah datanya
berupa data kuantitatif/ numerik dengan skala data interval dan
rasionya, pada umumnya data yang digunakan besar (n > 30 data). Pada
kasus tertentu memerlukan adanya asumsi kehomeganan dalam varian,
misalnya dalam pengujian rata-rata lebih dari dua populasi dengan
menggunakan metode analisis of variance (Anova).
Di sisi lain, pada kasus pengujian komparasi, statistik
nonparametrik dapat digunakan untuk pengujian rata-rata, proporsi dan
median dari suatu data. Pengujian komparasi dengan menggunakan
statistik nonparametrik tidak memerlukan adanya asumsi-asumsi
mengenai sebaran data populasi, sehingga terkadang disebut sebagai
statistik bebas sebaran (distribution free) (Doane & Seward, 2011). Pada
umumnya data yang digunakan dalam statistik nonparametrik berupa
data kualitatif/ kategorik dengan skala nominal atau ordinal (Siegel,
1997). Statistik nonparametrik juga digunakan untuk data berjumlah
kecil (n <30). Selain itu tidak adanya asumsi kehomegan dalam varian
data.
Pada umumnya statistik parametrik jika asumsi yang mendasari
terpenuhi seperti data berasal dari distribusi tertentu (misalnya distribusi
normal), sampel diambil secara acak/ random dengan menggunakan
probability sampling, memenuhi jumlah minimum sampel, memiliki
keunggulan dibandingkan dengan statistik nonparametrik. Keunggulan
statistik parametrik sekaligus sebagai kelemahan statistik nonparametrik

29
yaitu seluruh informasi dalam sampel dapat dimanfaatkan secara efisien,
tingkat akurasi dalam statistik parametrik juga lebih tinggi.
Di sisi lain kelebihan statistik nonparametrik sekaligus sebagai
kelemahan statistik parametrik Dengan tidak adanya asumsi distribusi
populasi dalam statistik nonparametrik, penggunaan statistik
nonparametrik penggunaannya lebih fleksibel terhadap jenis data.
Perhitungan dalam statistik nonparametrik umumnya dapat
dilaksanakan dengan cepat dan mudah. Selain itu, jika peneliti
menghadapi keterbatasan data yang tersedia misalnya skala pengukuran
yang kualitatif (nominal atau ordinal) dan jumlah data yang kecil, maka
statistik nonparametrik lebih dapat diandalkan. Berikut ini akan
ditampilkan perbandingan beberapa metode yang digunakan dalam
statistik parametrik maupun dalam statistik nonparametrik.

Tabel 1. Perbandingan Uji Komparasi Statistik Parametrik dan Statistik


Nnparametrik
Variabel Variabel Jenis Analisis
Dependen Independen/ Parametri NonParame
Terikat/ Bebas/Predikt k trik Contoh
Respon/ or/
Dipengaruhi Mempengaruhi
1 variabel 0 variabel One  Binomial Apakah
metrik/ kualitatif sample t Test nilai rata-
kuantitatif (1 test  Chi- rata ujian
populasi/kelo Square statistik
mpok) Test mahasisw
 Kolmogo a kelas
rov- manajem
Smirnov en lebih
Test besar dari
7
 Run Test
1 variabel 1 variabel Independ  Eksak Apakah
metrik/ kualitatif en Fisher nilai rata-
kuantitatif (2 populasi/ Sample T  Chi- rata ujian
kelompok -Test Square statistik
independen) Test mahasisw
 Median a kelas A
lebih

30
Test besar
 U Mann- kelas B
Whitney
 Wilcoxon
Rank
 Kolmogo
rov-
Smirnov
 Wald-
Wolfowit
z
 Moses
Test
1 variabel 1 variabel Paired  McNema Apakah
metrik/ kualitatif (2 Sample T r nilai rata-
kuantitatif populasi/ –Test  Sign Test rata ujian
kelompok  Wilcoxon statistik
dependen/ Rank- mahasisw
berpasangan) Sign a kelas A
setelah
 Walsh
tutor
Test
lebih baik
 Randomi dari
sasi Test sebelum
tutor
1 variabel 1 variabel One Way  Kruskal Apakah
metrik/ kualitatif (>2 ANOVA Wallis ada
kuantitatif populasi/  Median perbedaa
kelompok Test n nilai
independen)  Chi- rata-rata
Square ujian
statistik
mahasisw
a kelas A,
kelas B,
dan kelas
C
1 variabel 2 variabel Two - Apakah
31
metrik/kuant kualitatif (>2 ways ada
itatif populasi/kelo ANOVA perbedaa
mpok n nilai
independen) rata-rata
ujian
statistik
mahasisw
a
manajem
en
menurut
kelas
(kelas A,
kelas B,
dan kelas
C dan
menurut
jenis
kelamin
(pria dan
wanita)
1 variabel 1 variabel ANOVA Friedman Apakah
metrik/ kualitatif (>2 with ada
kuantitatif populasi/kelo repeated perbedaa
mpok measure n nilai
independen) ujian
mahasisw
a berbeda
untuk
pretest,
posttest 1
dan
posttest 2
1 variabel 1 variabel ANCOV - Apakah
metrik/ kualitatif (>2 A ada
kuantitatif populasi/kelo perbedaa
mpok n nilai
independen) rata-rata

32
dan 1 variabel ujian
metrik/kuantit statistik
atif mahasisw
a kelas A,
kelas B,
dan kelas
C dan
berdasark
an IQ
>=2 variabel 1 variabel One Way - Apakah
metrik/ kualitatif (>2 MANOV ada
kuantitatif populasi/kelo A perbedaa
mpok n nilai
independen) rata-rata
dan
waktu
mengerja
kan ujian
statistik
mahasisw
a kelas A,
kelas B,
dan kelas
C
>=2 variabel 2 variabel Two - Apakah
metrik/ kualitatif (>2 Ways ada
kuantitatif populasi/kelo MANOV perbedaa
mpok A n nilai
independen) rata-rata
dan
waktu
mengerja
kan ujian
statistik
menurut
kelas
(kelas A,
kelas B,

33
dan kelas
C) dan
menurut
jenis
kelamin
(Pria dan
Wanita)
>=2 variabel 1 variabel MANCO - Apakah
metrik/ kualitatif (>2 VA ada
kuantitatif populasi/kelo perbedaa
mpok n nilai
independen) rata-rata
dan 1 variabel dan
metrik/kuantit waktu
atif mengerjk
an ujian
statistik
mahasisw
a
menurut
kelas
(kelas A,
kelas B,
dan kelas
C) dan
berdasark
an IQ

Selanjutnya penggunaan pengujian keeratan hubungan/ korelasi


pada statistik inferensia. Analisis korelasi merupakan salah satu metode
dalam statistika yang digunakan untuk melihat arah dan kuat
hubungan/ asosiasi antara dua variabel (Walpole, 2012). Analisis
korelasi diperkenalkan pertama kali oleh Galton (1988). Dalam analisis
korelasi terdapat satu dictum yang mengatakan “correlation does not imply
causation”, hal ini bermakna korelasi tidak digunakan untuk melihat
adanya hubungan kausalitas (sebab akibat) antar variabel. Dalam
korelasi tidak dikenal variabel dependen dan variabel independen,
penulisan variabel 𝑥 dan variabel 𝑦, hanya sebagai simbol pembeda

34
dalam penamaan variabel saja. Arah koefisien korelasi dinyatakan dalam
bentuk hubungan positif atau negatif. Jika koefisien bertanda positif,
berarti arah hubungan searah. Artinya apabila nilai variabel 𝑥
meningkat, nilai variabel 𝑦 juga meningkat dan berlaku sebaliknya.
Sedangkan, jika koefisien korelasi bertanda negatif, berarti arah
hubungan berlawaan arah. Artinya, apabila nilai variabel 𝑥 meningkat,
nilai variabel 𝑦 akan menurun dan berlaku sebaliknya. Tetapi dalam hal
ini perubahan (peningkatan) nilai variabel 𝑥 tidak mengakibatkan
perubahan (peningkatan/ penurunan) nilai variabel 𝑦.
Besarnya nilai koefesien korelasi berada di antara antara -1
sampai 1. Untuk memudahkan melakukan interpretasi mengenai
kekuatan hubungan antara dua variabel, ada beberapa referensi yang
digunakan. Pada umumnya besaran korelasi dibagi kedalam 5 kriteria.
Kriteria pertama adalah koefisien korelasi bernilai nol, artinya tidak
terdapat korelasi antara kedua variabel. Kriteria kedua adalah nilai
absolut/ mutlak koefisien korelasi diantara nol sampai 0.5, artinya
terdapat korelasi yang lema antara kedua variabel. Kriteria ketiga adalah
nilai absolut/ mutlak koefisien korelasi diantara 0.5 sampai 0.7, artinya
terdapat korelasi yang moderat/ cukup kuat antara kedua variabel.
Kriteria keempat adalah nilai absolut/ mutlak koefisien korelasi diantara
0.7 sampai 0.99, artinya terdapat korelasi yang kuat antara kedua
variabel. Kriteria kelima adalah koefisien korelasi bernilai satu, artinya
terdapat korelasi sempurna antara kedua variabel.
Salah satu jenis korelasi dalam statistik parametrik adalah korelasi
pearson. Syarat dalam penggunaan korelasi pearson adalah hubungan
antar variabel berbentuk linier, kedua variabel mengikuti distribusi
normal dan kedua variabel adalah data kuantitatif (numerik) dengan
minimal berskala interval. Sebagai contoh kasus korelasi pearson,
apabila peneliti ingin mengetahui hubungan antara berat dan tinggi
badan seseorang. Pembahasan dan rumus yang digunakan dalam
korelasi ini akan dibahas pada bab khusus tentang korelasi.
Pada statistik nonparametrik ada banyak jenis pengujian keeratan
hubungan. Hubungan antar variabel tidak harus linier dan tidak harus
berasal dari distrubusi tertentu Selain itu data yang digunakan tidak
harus berupa data kuantitatif/ metrik tetapi dapat digunakan untuk data
kualitatif/ kategerik dengan skala nonimal dan ordinal. Jika peneliti
memiliki data yang berskala ordinal tetapi berdistribusi normal maka
korelasi yang tepat adala korelasi polychoric. Korelasi polychoric

35
diperkenalkan oleh Karl Pearson. Sebagai contoh kasus korelasi
polychoric, apabila peneliti ingin mengetahui hubungan antara tingkat
disiplin dengan tingkat kinerja karyawan, dimana kedua variabel diukur
dengan skala likert.
Apabila data yang diteliti tidak berdistribusi normal, dan salah
satu atau kedua variabel dapat dibuat sebagai rangking (menjadi
berskala ordinal) maka korelasi yang tepat adalah korelasi spearman.
Korelasi spearman diperkenalkan oleh Carl Spearman. Sebagai contoh
kasus korelasi spearman, apabila peneliti ingin mengetahui hubungan
antara tingkatan IQ dan nilai ujian matematika siswa. Apabila data yang
diteliti tidak berdistribusi normal, dan kedua variabel dapat dibuat
sebagai rangking (menjadi berskala ordinal) maka korelasi yang tepat
adalah korelasi Kendal tau. Korelasi kendall tau diperkenalkan oleh
Maurice Kendall. Sebagai contoh kasus korelasi kendall tau, apabila
peneliti ingin mengetahui hubungan antara penilaian dua orang juri
terhadap 10 kontestan masak. Korelasi spearman dan korelasi kendall
tau termasuk dalam korelasi nonparametrik.
Selanjutnya jika peneliti memiliki data salah satu variabel berskala
ordinal dengan dua kategori (biner/ dikotomi) dan lainnya data
kuantitatif / numerik minimal berskala interval maka korelasi yang tepat
adalah korelasi biserial. Sebagai contoh kasus korelasi biserial, apabila
peneliti ingin mengetahui hubungan antara tingkat pendidikan (rendah/
sma ke bawah atau tinggi/ sma dan perguruan tinggi) dengan
pendapatan yang dimiliki. Sedangkan jika peneliti memiliki data salah
satu berskala nomimal dengan dua kategori (biner/ dikotomi) dan
lainnya data kuantitatif / numerik minimal berskala interval maka
korelasi yang tepat adalah korelasi point biserial. Sebagai contoh kasus
korelasi poin biserial, apabila peneliti ingin mengetahui hubungan antara
aktivitas olahraga (olahraga atau tidak) dengan tingkat stamina/
kebugaran.
Apabila kedua variabel yang diteliti merupakan data berskala
ordinal yang terdiri atas dua kategori (biner) maka korelasi yang tepat
adalah korelasi tetrachoric. Sebagai contoh kasus korelasi tetrachoric,
apabila peneliti ingin mengetahui hubungan antara status pegawai (staf
dan manajer) dan tipe tempat tinggal (kontrakan dan perumaan elit).
Apabila kedua variabel yang diteliti merupakan data berskala nominal
yang terdiri atas dua kategori (biner) maka korelasi yang tepat adalah
korelasi phi. Sebagai contoh kasus korelasi phi, apabila peneliti ingin

36
mengetahui hubungan antara gender (pria dan wanita) dan jenis
tontonan (sinetron dan berita). Sedangkan, Apabila kedua variabel yang
diteliti merupakan data berskala nominal yang terdiri atas dua kategori
(biner) maka korelasi yang tepat adalah korelasi phi. Sebagai contoh
kasus korelasi phi, apabila peneliti ingin mengetahui hubungan antara
gender (pria dan wanita) dan jenis tontonan (sinetron dan berita).
Apabila kedua variabel yang diteliti merupakan data berskala
ordinal yang terdiri atas lebih dari dua kategori maka korelasi yang tepat
adalah korelasi gamma. Sebagai contoh kasus korelasi gamma, apabila
peneliti ingin mengetahui hubungan antara tingkat pendidikan (rendah,
sedang, tinggi) dan tingkat pendapan seseorang (rendah, sedang, tinggi).
Sedangkan apabila kedua variabel yang diteliti merupakan data berskala
nominal yang terdiri atas lebih dari dua kategori maka korelasi yang
tepat adalah korelasi cramer V. Sebagai contoh kasus korelasi cramer V,
apabila peneliti ingin mengetahui hubungan antara stasiun televisi
(RCTI, SCTV, Anteve) dan jenis acara (olahraga, musik dan sinetron).
Selanjutnya jika peneliti memiliki data salah satu variabel berskala
ordinal dan lainnya berskala nominal maka korelasi yang tepat adalah
korelasi rank biserial. Sebagai contoh kasus korelasi rank biserial,
apabila peneliti ingin mengetahui hubungan antara gender (pria dan
wanita) dengan tingkat pendidikan (rendah, sedang, tinggi).
Ringkasan penggunaan pengujian keetratan hubungan/ korelasi/
asosiasi dalam statistik inferensia dapat dilihat pada Tabel 2.

Tabel 2. Berbagai Pengujian Keeratan Hubungan/ Korelasi


Ordinal Nominal
Rasio Num Kategorik Kategorik
/ erik
Asosiasi/ Korelasi Poly
Interv (tidak Poly Bina
al norm Binary (>
(> 2) ry
al) 2)
poin
pears spear biseria Jaspe t
Rasio/ Interval eta
on man l m biser
ial
Ordi spear kenda
Numerik
nal man ll tau

37
Ordinal Nominal
Rasio Num Kategorik Kategorik
/ erik
Asosiasi/ Korelasi Poly
Interv (tidak Poly Bina
al norm Binary (>
(> 2) ry
al) 2)
rank
rank biser
Bin biseri tetrach gamm
biser ial,
ary al oric a
ial thet
Kateg a
orik rank rank
Pol polyk
biser biser
y Jaspe gamm orik,
ial, ial,
(> m a Some
thet thet
2) r
a a
rank
point rank cra
Bin biseria
biseri biseria phi mer
ary l,
al l, V
Nom Kateg theta
inal orik Pol rank
rank cra cra
y biseria
eta biseria mer mer
(> l,
l, theta V V
2) theta

Selanjutnya adalah pembahasan mengenai pembentukan model


hubungan sebab akibat dalam statistik inferensia. Salah satu metode
dalam statistik inferensia dalam pembentukan model (melihat hubungan
antar variabel) adalah analisis regresi. Ada dua jenis variabel dalam
penelitian yaitu variabel dependen/ terikat/ endogen/ respon/ yang
dipengaruhi dan variabel independen/bebas/ eksogen/ prediktor/ yang
mempengaruhi. Suatu model regresi, biasanya diawali dengan memplot
hubungan antara variabel dependen dengan variabel independennya.
Melalui plot yang dibuat misalkan dengan scatter plot maka dapat
dilihat pola hubungan antar variabel tersebut apakah berbentuk linier
atau tidak. Jika ditilik dari pola hubungan antar variabel maka model
regresi dapat dibedakan menjadi model regresi linier dan model regresi
nonlinier

38
Dalam pembentukan model, statistik inferensia dapat dibagi
menjadi tiga bentuk yaitu statistik parametrik, statistik nonparametrik
dan statistik semiparametrik. Pembeda dalam statistik ini selain
berdasarkan asumsi distribusi yang digunakan juga berdasarkan
spesifikasi parameter dalam model yang digunakan. Pada statistik
parametrik didasarkan pada 𝑚(. ) merupakan fungsi yang melibatkan
parameter yang modelnya diketahui. Estimasi dalam regresi parametrik
memiliki struktur dari fungsi regresi diketahui, penaksiran parametrikt
ergantung pada jumlah parameter yang terbatas. Sehingga keuntungan
regresi parametrik masih bisa digunakan untuk ukuran data yang kecil
dan perhitungan yang mudah dan mudah diintrepetasikan. Kelemahan
dalam statistic parametrik adalah sering kali muncul kesulitan untuk
menyesuaikan plot data dengan prespesifikasi model, serta sangat sulit
untuk membuat fungsi dari visualisasi data sehingga 𝑚(. ) tidak bisa
dibuat prespesifikasinya
Selain itu datanya mengikuti distribusi tertentu. Pada umumnya
didasarkan pada asumsi datanya berdistribusi normal biasa disebut
dengan regresi linier berganda berbasis gaussian. Pembahasan lebih
lanjut tentang regresi ini akan dibahas pada bab selanjutnya. Jika
datanya tidak berdistribusi normal tetapi variabel responnya mengikuti
distribusi keluarga eksponensial maka dapat menggunakan pendekatan
model linier terampat/ general linear model (GLM) (Agresti, 2002).
Beberapa model GLM yang sering digunakan adalah model
regresi binari logistik, regresi multinomial, regresi ordinal, poisson,
regresi beta, regresi survival dan lainnya. Regresi binary logistik
digunakan jika variabel respon yang digunakan berbentuk kategori (dua
pilihan) dan berdistribusi binomial/ bernouli dimana hanya terdapat
dua nilai yaitu 0 dan 1. Misalnya, peneliti ingin mengetahui pengaruh
pendidikan, jenis kelamin terhadap status miskin seseorang (miskin atau
tidak miskin).
Regresi multinomial digunakan jika variabel respon yang
digunakan berbentuk kategori (lebih dua pilihan/ nominal) dan
berdistribusi multinomial. Misalnya, peneliti ingin mengetahui pengaruh
pendidikan, jenis kelamin terhadap jenis tontonan seseorang (sinetron,
berita, musik, olahraga). Regresi interval digunakan jika variabel respon
yang digunakan berbentuk interval nilai. Misalnya, peneliti ingin
mengetahui pengaruh nilai tulisan, peringkat dan jenis program (umum,

39
vokasi dan akademis) terhadap variabel rata-rata IPK yang diwakili oleh
dua nilai dari nilai Interval bawah (LGPA) dan nilai interval atas (ugpa).
Regresi ordinal digunakan jika variabel respon yang digunakan
berbentuk kategori (lebih dua pilihan/ ordinal), dimana ada urutan dari
kategori yang digunakan. Misalnya, peneliti ingin mengetahui pengaruh
pendidikan, jenis kelamin terhadap status miskin seseorang (miskin,
hampir miskin, tidak miskin). Regresi poisson digunakan jika variabel
respon yang digunakan merupakan data cacahan (count), dimana
datanya berdistribusi poisson. Misalnya, peneliti ingin mengetahui
pengaruh banyaknya jumla dokter, jumlah puskesmas di suatu desa
teradap jumlah kematian bayi (neonatal).
Regresi beta digunakan jika variabel respon yang digunakan
merupakan data rasio/proporsi yang nilainya diantara 0 sampai 1,
dimana datanya berdistribusi bernouli. Misalnya, peneliti ingin
mengetahui pengaruh banyaknya jumlah dokter, jumlah puskesmas di
suatu desa terhadap rasio bayi lahir hidup per 1000 kelahiran. Regresi
survival digunakan jika variabel respon yang digunakan merupakan data
waktu hingga suatu kejadian terjadi. Misalnya, peneliti ingin mengetahui
pengaruh jenis kelamin dan dosis obat terhadap daya tahan pasien
kanker.
Beberapa contoh analisis regresi parametrik dapat dilihat pada
Tabel 3.
Variabe
Variabel Independen
l Dependen
Bebas/ Jenis
Terikat/Respon Contoh
Prediktor/ Analisis
/
Mempengaruhi
Dipengaruhi
1 variabel 1 variabel kuantitatif/ Regresi Pengaruh
metrik/ metrik/ numerik Linier Tinggi
kuantitatif Sederhana badan
(RLS) terhadap
berat
badan
1 variabel >=2 variabel kuantitatif/ Regresi Pengaruh
metrik/ metrik/ numerik data Linier ukuran
kuantitatif cross section Berganda perusahaan
Data Cross dan NPL
Section terhadap

40
ROA di
seluruh
perbankan
di
Indonesia
1 variabel >=2 variabel kuantitatif Regresi Pengaruh
metrik/ /metrik/numerik data Linier ukuran
kuantitatif time series Berganda perusahaan
Data Time dan NPL
Series terhadap
ROA di
BCA
selama
tahun
2010-2015
1 variabel >=2 variabel Regresi Pengaruh
metrik/kuantita kuantitatif/metrik/nume Linier ukuran
tif rik data time series Berganda perusahaan
Data Panel dan NPL
terhadap
ROA di
beberapa
perbankan
di
Indonesia
selama
tahun
2010-2015
1 variabel >=2 variabel Regresi Pengaruh
metrik/kuantita kuantitatif/metrik/nume Linier umur dan
tif rik dan data kualitatif Berganda jenis
dengan kelamin
dummy terdapat
pendapata
n
1 variabel Variabel Regresi Pengaruh
kualitatif/kateg kuantitaif/metrik Binary pendapata
ori (2 maupun data kualitatif Logistik n dan

41
kelompok) dan pendidikan
Regresi terhadap
Probit status
kesejaterha
n orang
(miskin
dan tidak
miskin)
1 variabel Variabel Regresi Pengaruh
kualitatif/kateg kuantitaif/metrik Multinomi pendapata
ori (>2 maupun data kualitatif al Logistik n dan
kelompok) pendidikan
terhadap
pemilihan
merk
mobil
(merk A,
merk B
dan merk
C)
1 variabel Variabel Regresi Pengaruh
interval kuantitaif/metrik Interval peringkat
maupun data kualitatif dan jenis
progran
terhadap
IPK
(dalam
interval)
1 variabel Variabel Regresi Pengaruh
integer(bilangan kuantitaif/metrik Poisson jumlah
bulat) maupun data kualitatif pasien dan
metrik/kuantita jenis
tif rumah
sakit
terhadap
jumlah
operasi
cesar

42
1 variabel Variabel Regresi Pengaruh
kuantitatif rasio kuantitaif/metrik Beta banyaknya
kontinu (dari 0 maupun data kualitatif jumlah
sampai 1 dokter,
jumlah
puskesmas
di suatu
desa
terhadap
rasio bayi
lahir hidup
per 1000
kelahiran
1 variabel Variabel Regresi Pengaruh
kualitatif/kateg kuantitaif/metrik berupa Survival lamanya
ori (2 waktu maupun data perawatan
kelompok) kualitatif dan jenis
kelamin
terhadap
status
pasien
1 variabel Variabel Regresi Pengaruh
metrik/kuantita kuantitaif/metrik berupa Kuantil usia, jenis
tif yang dibagi 4 waktu maupun data kelamin
kelompok kualitatif terhadap
total
pengeluara
n medis
1 variabel Variabel Regresi Pengaruh
kualitatif kuantitaif/metrik berupa Ordinal harga dan
bersifat ordinal waktu maupun data pendapata
kualitatif n terhadap
pemesanan
makanan
ukuran
(kecil,
sedang,
besar)

43
Selanjutnya pada statistik nonparametrik 𝑚(. ) bersifat penghalus
(smoothing), fleksibel, tetapi tidak diketahui modelnya. Sehingga
penggunaan regresi nonparametrik digunakan jika adanya
ketidakpastian fungsi m(x), dan model parametrik tidak fleksibel
terhadap kondisi data, seain itu dibutuhkannya sebuah fungsi yang tidak
bergantung pada jumlah parameter yang terbatas. Salah satu model
regresi nonparametrik adalah regresi nonlinier dimana parameter yang
digunakan tidak linier. Sementara pendekatan semi-parametrik fungsi
𝑚(. ) memiliki beberapa parameter untuk ditaksir, tetapi sebagian yang
lain tidak diketahui bentuknya (sulit dibuat prespesifikasi modelnya.
Dalam regresi nonparametrik dimana hubungan fungsional antar
variabel tidak diketahui, dan diharapkan dapat mencari sendiri bentuk
estimasinya sehingga memiliki fleksibilitas yang tinggi (Hardle, 1990).
Kurva regresi hanya diasumsikan termuat dalam suatu ruang fungsi
yang berdimensi tak hingga dan merupakan fungsi mulus (smooth). Ada
beberapa teknik smoothing yang dapat digunakan antara lain estimator
histogram, kernel, deret orthogonal, spline, k-NN (Nearest-
Neighborhood), deret fourier, dan wavelet.
Selain menggunakan fungsi smoothing dalam pembentukan model
dalam statistic nonparametric juga dapat menggunakan regresi kernel,
regresi spline dan regresi kuantil. Regresi kernel yang paling sering
digunakan menggunakan teknik estimator Nadaraya-Watson (NWE),
Gasser-Muller (GME) dan estimator Polinomial Lokal (LPE) (Fan &
Gijbels, 1995). Dalam regresi spline dapat menggunakan penggunaan
metode B-Spline atau P-Spline.

44

View publication stats

Anda mungkin juga menyukai