3
Macam-macam Statistik
4
populasi yang berdistribusi normal. Seperti korelasi
product moment pearson, ANAVA, t-tes, F-tes, regresi dll.
b. Statistika non parametrik digunakan terutama untuk
menganalisis data nominal dan ordinal dari populasi yang
bebas distribusi, jadi tidak harus normal. Seperti: Korelasi
spearman rank, kendal tau, chi kuadrat dll.
5
Peranan Statistik Dalam Penelitian Pendidikan
6
1. Alat untuk menghitung besarnya anggota sampel yang diambil
dari suatu populasi. Penggunaan statistik dalam menentukan
jumlah sampel penelitian dapat memberikan jumlah sampel
yang representatif terhadap jumlah populasi sehingga jumlah
sampel yang ditentukan lebih dapat di pertanggung jawabkan.
Statistik membantu peneliti untuk menentukan berapa jumlah
sampel yang tepat untuk dapat mewakili populasi penelitian.
2. Alat untuk menguji validitas dan reliabilitas instrumen.
Sebelum instrumen digunakan untuk penelitian, maka harus di
uji validitas dan reliabilitasnya terlebih dahulu. Sehingga data
yang dihasilkan oleh instrumen tersebut dapat dipercaya.
Selain itu statistik juga diperlukan untuk menentukan daya
pembeda tes dan tingkat kesukaran tes.
3. Membantu peneliti menyajikan data hasil penelitian sehingga
data lebih komunikatif. Teknik-teknik penyajian data ini
antara lain: tabel, grafik, diagram lingkaran, dan piktogram
atau yang didalam statistik dinamakan dengan statistik
deskriptif.
4. Alat untuk analisis data seperti menguji hipotesis Penelitian
yang diajukan. Dalam hal ini statistik yang digunakan antara
lain: korelasi, regresi, T- test, Anava, Chi kuadrat dll. Dengan
statistik kita dapat mengambil kesimpulan yang tepat
7
mengenai keadaan populasi dan sampel penelitian melalui data
yang dihasilkan oleh penelitian yang kita lakukan.
8
Jenis Data Dalam Statistik dan Penelitian
1. Data Kualitatif.
Yaitu data yang berbentuk kategorisasi, karekteristik
berbentuk kalimat, kata-kata atau gambar. Data kualitatif
merupakan data yang menunjukkan kualitas sesuatu, oleh
karena itu data kualitatif sering menunjukkan kualitas sesuatu
baik manusianya, benda-benda, maupun suatu variabel
tertentu seperti motivasi, minat dan lainnya. Contoh data
kualitatif: siswa itu rajin, motivasi belajarnya rendah dan
sebagainya. Data ini biasanya didapat dari wawancara atau
pengamatan dan bersifat subjektif sebab data tersebut dapat
ditafsirkan berbeda oleh orang lain yang juga melakukan
pengamatan.
Dengan melakukan pengklasifikasian terhadap data
kuantitatif kita dapat mengubah data kuantitatif menjadi
kualitatif. Dengan memberikan kategori-kategori terhadap
kuantitas tertentu kita mengubah data kuantitatif menjadi
9
kualitatif. Misalkan saja data motivasi belajar siswa yang
diukur dengan menggunakan angket motivasi belajar akan
menghasilkan data kuantitatif berupa angka-angka skor
motivasi belajar. Skor motivasi belajar tersebut dapat diubah
menjadi kualitas tentang motivasi belajar dengan
menggunakan syarat-syarat tertentu, misal saja kategori
tersebut dibuat sebagai berikut:
10
Kita bisa mengatakan bahwa motivasi belajar tinggi jika
saja skor motivasi belajarnya diatas 33,8 ( > 33,8), motivasi
belajar rendah jika skor motivasi belajarnya dibawah 25,0 ( <
25,0) dan selain itu dikatakan motivasi belajar kategori sedang.
2. Data Kuantitatif
Yaitu data yang berbentuk angka atau data kualitatif yang
diangkakan. Contoh : skor ulangan Matematika Rudi 75, skor
minat belajar andi 105, skor IQ Winda 135, jumlah siswa laki
di kelas X SMA 20 Medan adalah 23 orang.
Data kuantitatif dapat dikelompokkan menjadi dua
kelompok besar, yaitu data diskrit dan data kontinu. Data
diskrit adalah data yang diperoleh dari hasil menghitung atau
mencacah, data seperti ini sering juga disebut dengan data
11
nominal dan ordinal. Data kontinu adalah data yang diperoleh
dari hasil pengukuran. Data kontinu dapat dikelompokkan
menjadi dua, yaitu data interval dan Rasio.
Berdasarkan skala ukurnya data kuantitatif dapat
dibedakan menjadi data: nominal, ordinal, interval dan rasio.
1) Data Nominal
Data nominal adalah data yang hanya mengandung unsur
penamaan (Bahasa Latin, Nomos = nama). Contoh; jenis
kelamin mahasiswa fakultas Tarbiyah terdiri dari laki-laki
dan perempuan, laki-laki berjumlah 450 orang dan
perempuan sebanyak 765 orang.
12
perempuan, oleh sebab itu pemberian bobot dapat
dilakukan secara terbalik. Harus diingat, bahwasanya
statistik adalah pendekatan kuantitatif, sehingga data yang
bersifat kualitatif harus diubah dalam bentuk numerik
dengan cara pemberian skor (skoring) atau agregat.
Jurusan yang ada difakultas Tarbiyah, fakultas yang ada di
IAIN SU Medan, latar belakang pekerjaan orang tua
mahasiswa merupakan contoh dari data nominal lainnya.
Apabila penelitian yang dilakukan menghasilkan
data nominal maka ukuran satatistik yang tepat untuk
menjelaskan keadaan data tersebut adalah modus, tabel
distribusi frekuensi, baik tabel distribusi frekuensi absolut
maupun tabel distribusi frekuensi relatif. Sedangkan
statistik inferensial untuk pengujian hipotesis adalah
statistik nonparametrik yaitu uji Chi kuadrat. Berikut
adalah cara menganalisa data nominal mengenai keadaan
pegawai SMA Negeri 4 padang sidimpuan Sumatera utara
13
pada tahun ajaran 2009/2010.
2) Data Ordinal
Data ordinal adalah data yang selain mengandung
unsur penamaan juga memiliki unsur urutan (Order =
urutan). Berikut merupakan contoh dari data ordinal.
15
Pada data ordinal selain dilakukan pembobotan
atau penskoran, urutan dari penskoran tersebut juga
memiliki arti atau makna. Posisi letak menentukan
kedudukan kategori data. Jika Ahmad jais mendapatkan
16
ranking 1, itu berarti dia mendapatkan kedudukan
rangking pertama dari semua teman-temannya. Rangking
tersebut tidak dapat di tukar ataupun dibolak balik seperti
pada contoh tabel 1.3 diatas. Namun pada data ordinal ini
jarak antara tingkatan tidak diketahui berapa intervalnya.
Pada tabel rangking siswa diatas kita tidak dapat
menentukan berapa jarak antara ranking pertama dengan
ranking kedua, ranking kedua dengan ranking ketiga atau
ranking keempat dengan ranking kelima. Bisa saja terjadi
perbedaan jarak antara ranking pertama - ranking kedua
dengan jarak ranking kedua – ranking ketiga. Status sosial
masyarakat, golongan kepangkatan dosen dari IIIa sampai
IVe, indeks prestasi mahasiswa juga merupakan contoh
data ordinal.
Apabila data hasil penelitian merupakan data
ordinal maka perhitungan statistik yang tepat untuk data
ordinal adalah modus, median dan tabel distribusi
frekuensi. Sedangkan untuk pengujian hipotesis dan
penarikan kesimpulan yang berhubungan dengan data
ordinal dapat dilakukan dengan menggunakan statistik
nonparametrik seperti korelasi spearman rank.
3) Data Interval
17
Data interval adalah data yang selain mengandung
unsur penamaan dan urutannya juga memiliki sifat interval
atau selang, jaraknya bermakna, disamping itu, data ini
memiliki ciri angka dimana angka nol-nya tidakmutlak.
Pada data interval selain data memiliki skor, memiliki
urutan juga memiliki interval yang jelas antara satu
tingkatan data dengan yang lainnya. Salah satu contoh data
interval yang paling sering digunakan dalam dunia
pendidikan adalah skor kecerdasan individu atau skor tes
IQ seseorang dan nilai yang diperoleh siswa pada mata
pelajaran tertentu.
18
Pada tabel IQ siswa diatas dapat diketahui bahwa
jarak antara IQ 110 dengan IQ 115 adalah 5 sama dengan
jarak atau interval IQ 114 ke 119. Namun nilai 0 pada IQ
diatas tidaklah mutlak karena kita tidak bisa mengatakan
bahawa jika seorang siswa memiliki IQ 0, sama sekali
tidak memiliki IQ sama sekali. Nilai siswa juga merupakan
jenis data interval, jika saja seorang siswa mendapatkan
nilai 0 (nol) bukan berarti siswa tersebut tidak mempunyai
nilai. Akan tetapi ia tetap juga dikatakan memiliki nilai,
hanya saja besar nilainya adalah nol. Nilai nol pada data
interval diatas tidak menunjukkan ketidak adaan tetapi
hanya merupakan skor perolehan semata. sedangkan jarak
antara nilai siswa 70 ke nilai siswa 80 adalah sama dengan
jarak nilai siswa 75 ke nilai siswa 85, yaitu sama-sama 10.
Dalam hal tersebut dikatakan bahwa data interval memiliki
interval yang sama antara satu data dengan yang lainnya.
4) Data Rasio
Data rasio adalah data yang memiliki unsur
penamaan, urutan, intervalnya bermakna dan angka nolnya
mutlak, sehingga rasionya memiliki makna. Beberapa
contoh dari data rasio adalah jarak, berat badan, tinggi,
pendapatan dan lainnya.
19
20
Taksiran Titik untuk μ dan σ 2
Teorema 1
n
1
^μ= ∑ X i= X́
n ❑
Dan
n
1
σ^ = ∑ (X ¿ ¿ i− X́ )¿
n ❑
Bukti
21
n
2 2
L ( μ; σ ) = ∏ f ( x i ; μ ,σ )
i=1
¿
1
e
−
(2 σ 2 )¿ ¿
2
√2 π σ
¿¿
Selanjutnya,
n
2 −n 1
log(¿ 2 π σ )− 2 ∑ ( X i−μ)2 ¿ ¿
2
1=log L μ ; σ =
( ) ¿
2 2σ i=1
n
1
¿ 2 ∑ ( X i−μ)❑=0
σ i=1
dan
n
∂ 1 −n 1
2
= 2 + 4 ∑ (X i−μ)2=0
∂ σ 2 σ 2σ i=1
n n
1 1
^μ= ∑ X 1= X́ dan σ^2= ∑ ( X i −μ)2
n i=1 n i=1
22
Teorema 2
Bukti
∂ log f ( X : μ , σ 2 ) X−μ
= 2
∂μ σ
dan
∂2 log f ( X : μ , σ 2 ) 1
= 2
∂ μ2 σ
1
−1 σ 2
σ[ ]
−n 2 =
n
23
Ini sama dengan variansi penaksir maximum likehood, yakni var
2
( X́ )= σ . Jadi X́ efisien untuk μ.
n
Var ( X́ )
P ( 1 X́−μ ⋮<∈ )> 1−
∈2
σ2
Karena Var ( X́ ¿= , maka
n
σ2
P ( ⋮ X́−μ ⋮<ϵ ) >1−
∐ ∈2
Ini berarti bahwa X́ konvergen secara stokastik ke μ, yakni
konsisten, karena untuk setiap σ > 0 , X́ akan berjarak ∈ terhadap μ
paling tidak ( 1−σ ) 100 % kali, jika
~ σ2
n=n ∈ ,σ ≥ 2
( )
ϵ σ
Teorema 3
24
Misalkan X 1 , X 2 , … , X n sampel random dari N ( μ ; σ ¿¿ 2)¿.
Maka,
1
∑ ¿¿
n i=1
Bukti:
n
E [ 1
∑
n i=1
(
2 1
] [
X i− X́ ) =E ∑ ( X i−2 X́ X i + X́ )
n ]
n
¿
[ (∑ )]
1
n i=1
−n X́ 2
n
1
¿ ∑ E ( X ¿ ¿ i 2)−E ( X́ ¿ ¿ 2)¿ ¿
n i=1
Tetapi E( X ¿ ¿ i2 )=σ 2+ μ 2 ¿
σ2 2
dan E( X́ ¿ ¿ 2)= +μ ¿
n
25
Maka
n
σ2
1
[
n i=1
2 1
]
E ∑ ( X i− X́ ) = ( nσ 2 +nμ 2) − −μ2
n n
σ 2 n−1 2
¿ σ2−
n
=( )
n
σ
Catatan
n ^2 1
S2= σ = ∑ X 1− X́ ¿ 2 ¿
(n−1) (n−1)
Tentu saja ini adalah penaksir tak bias berdasarkan statistik sufien:
n
E( σ^2) ¿= 1
(n−1) 2 2
E( S¿ ¿2)= σ =σ
( n−1 ) (n−1) n
26
Asumsi-Asumsi dalam Inferensi Statistika
27
apabila hasil uji asumsi ternyata tidak sesuai dengan harapan.
Berbagai reaksi timbul mulai dari reaksi wajar berupa usaha untuk
menggunakan alternatif model uji yang lebih cocok dengan data,
transformasi data agar sesuai dengan model yang diinginkan,
sampai pada usaha-usaha memanipulasi data agar tampak
memenuhi asumsi yang diinginkan. Sayangnya seringkali hal itu
dilakukan tanpa pemahaman yang cukup mengenai permasalahan
yang sedang dihadapi sehingga ada peneliti yang melakukan
'trimming' atau pemangkasan terhadap subjek yang dianggapnya
sebagai 'outliers' agar datanya terdistribusi mengikuti model linier,
dan ada pula praktisi yang mecoba menggunakan model
matematis yang terlalu kompleks bagi tujuan penelitiannya
sehingga malah menjadikan kesimpulan analisisnya sulit dicerna
oleh pembaca awam.
29
Analisis Varian
31
μ tertentu dan σ 2 tertentu, akan berbentuk normal N(0,1) apabila
n → ∞ (central limit theorem; Hogg & Tanis, 1977). Oleh karena
itu, kita tidak perlu terlalu mengkhawatirkan asumsi normalitas ini
sepanjang kita memiliki cukup banyak subjek bagi masing-masing
sampel perlakuan. Di mana kita merasa bahwa normalitas
distribusi skor tidak terpenuhi maka kita hanya perlu mengambil
subjek dalam jumlah yang lebih banyak.
32
menyatakan sah-tidaknya penggunaan analisis varian. Untuk itu
memang terdapat beberapa metode pengujian heterogenitas varian
seperti tes Hartley, tes Bartlett, tes Levene, dan lain-lain. Namun
kegunaan berbagai tes ini mendahului analisis varian adalah tidak
jelas. Isunya bukanlah apakah varian-varian populasi itu berbeda
akan tetapi apakah perbedaan yang ada cukup besar sehingga
mengakibatkan rasio mean kuadrat pada analisis varian menjadi
tidak lagi terdistribusi sebagai F (Myers, 1979). Di samping itu,
tes heterogenitas varian yang biasanya digunakan ternyata sangat
sensitif terhadap ketidaknormalan distribusi populasi sehingga
para ahli statistik menganggap prosedur uji homogenitas ini tidak
robust. Dengan demikian uji heterogenitas varian sebelum
melakukan analisis varian tidak banyak memiliki nilai praktis, dan
pendapat mutakhir mengatakan bahwa analisis varian dapat dan
seharusnya dilakukan tanpa melakukan uji heterogenitas varian
lebih dahulu, terutama apabila besarnya n dalam setiap kelompok
sampel adalah sama (Box, 1953, 1954 dalam Hays, 1973).
33
terhadap validitas inferensi/kesimpulan analisis akhir akibat
terjadinya distorsi eror tipe I. Dalam kasus n pada kelompok
sampel tidak sama atau kasus perbedaan varian yang sangat besar
di antara kelompok perlakuan, uji signifikansi F masih dapat
dilakukan sesuai dengan level α yang dikehendaki asalkan
distribusi populasi perlakuan masih mendekati normal. Dengan
demikian, selama kita memiliki alasan yang cukup layak untuk
menganggap bahwa varian-varian di antara kelompok perlakuan
adalah setara, kita dapat terus melakukan uji F tanpa
kekhawatiran, namun bila kita merasa sangsi akan homogenitas
varian yang terlibat maka gunakanlah n yang setara bagi setiap
kelompok sampel.
34
varian efek terbatas (fixed effects analysis of variance). Asumsi
yang penting ini, tidak untuk diuji terpenuhi atau tidaknya,
melainkan sebagai pegangan bagi peneliti agar selalu menjaga
independensi pengukurannya. Legitimasi penggunaan statistik F
lebih tergantung pada sejauhmana prosedur pengukuran dan
desain yang digunakan dalam eksperimen dapat meyakinkan
adanya independensi tersebut.
36
Korelasi dan Regresi Linear
37
Koefisien korelasi yang signifikan membawa kepada
penggunaan fungsi linier dari korelasi itu untuk melakukan
prediksi, yaitu dengan menentukan persamaan garis regresi.
Dalam situasi prediksi ini harus ditentukan lebih dahulu manakah
variabel yang berlaku sebagai independen (predictor) dan mana
yang berlaku sebagai dependen (criterion).
39
Perhatikan bahwa asumsi-asumsi tersebut sebenarnya
identik dengan asumsiasumsi yang mendasari penggunaan analisis
varian desain terbatas (fixed effects). Perhatikan pula bahwa sama
sekali tidak terdapat asumsi apa pun yang menyangkut distribusi
skor X sebagai prediktor.
40
maka semua asumsi yang diperlukan benar-benar dianggap
berlaku (taken for granted). Sebaliknya apabila statistik r atau by.x
terlalu kecil sehingga gagal menolak H0 dalam level signifikansi
yang layak, barulah mungkin dirasakan perlunya untuk melakukan
pemeriksaan asumsi-asumsi.
42
maka merupakan indikasi adanya dependensi eror. Adanya
korelasi atau hubungan antara eror secara sekuensial ini dapat juga
dilihat lewat statistik D (Durbin-Watson). Statistik D yang kecil
berarti adanya korelasi positif di antara eror sekuensial sedangkan
statistik D yang besar berarti adanya korelasi negatif di antara eror
sekuensial.
44
mendahuluinya dengan uji asumsi. Sebaliknya, bilamana ada
keraguan mengenai datanya, maka cara aman dalam
menggunakan analisis varian adalah dengan mengambil sampel
yang cukup besar dan menggunakan jumlah n yang kurang-lebih
sama dalam setiap kelompok perlakuan; sedangkan dalam analisis
regresi lakukanlah analisis residual bilamana diperoleh R2 yang
tidak signifikan atau gunakan model regresi yang lebih sesuai
dengan data yang dimiliki.
45
Penelitian Statistika Berkarakter dan
Permasalahannya
48
Pemahaman Regresi Parametrik
49
error random. Dalam regresi parametrik terdapat asumsi yang
sangat kaku dan kuat yaitu bentuk kurva regresi diketahui,
misalnya linear, kuadratik, kubik, polinomial derajat-p, eksponen,
dan lain-lain. Untuk memodelkan data menggunakan regresi
parametrik linear, kuadrat, kubik atau yang lain, umumnya
dimulai dengan membuat scater plot (Budiantara, 2006a). Apabila
scater plot ini terdapat kecendrungan data mengikuti pola linear
maka digunakan model regresi (parametrik) linear, sebaliknya jika
scater plot data terdapat kecendrungan pola kuadratik maka
digunakan model regresi (parametrik) kuadratik, dan seterusnya.
Disamping memperhatikan pola kecendrungan data melalui scater
plot, kita juga dituntut dalam regresi parametrik memiliki
informasi masa lalu yang detail tentang pola data agar diperoleh
pemodelan yang baik (Wahba, 1990; Eubank, 1988; Antoniadis,
2001; Kayri, & Zirhhoglu, 2009; Wu & Zhang, 2006; Budiantara,
2009b).
50
Sebagai ilustrasi tentang karakteristik data yang memiliki
pola regresi parametrik diberikan dalam Gambar 3(a,b) (regresi
parametrik linear), Gambar 4(a,b) (regresi parametrik kuadrat),
dan Gambar 5(a,b) (regresi parametrik kubik). Pendekatan regresi
parametrik memiliki sifat yang sangat baik dari pandangan
Statistika inferensi (Budiantara, 2009b), seperti sederhana, mudah
51
interpretasinya, parsimoni, estimatornya tidak bias, tergolong
estimator linear, efisien, konsisten, BLUE (Best Linear Unbiased
Estimator), yang sangat jarang dimiliki oleh pendekatan regresi
lain seperti regresi nonparametrik dan regresi semiparametrik.
Karena kebaikan (luar biasa) yang dimiliki oleh regresi parametrik
inilah yang menyebabkan model regresi parametrik sangat populer
dan sangat disukai oleh berbagai kalangan, baik dari golongan
Statistika teoritis maupun golongan Statistika aplikasi (Becher,
dkk., 2009; Huang & Liu, 2006).
52
Mengingat perkembangan ilmu pengetahuan dan teknologi
yang sangat pesat dan memperhatikan gejala-gejala alam yang
dalam beberapa tahun terakhir mengarah pada pola yang tidak
seperti biasanya (seolah-olah abnormal), maka sangat sulit bagi
kita untuk menduga perilaku alam. Pada beberapa tahun yang lalu,
kita masih mampu memperkirakan dengan tepat kapan mulai dan
berakhirnya musim kemarau dan penghujan dengan sangat baik,
sehingga para petani kita mampu mempersiapkan diri kapan
memulai menanam padi dan kapan memanennya, tetapi sekarang
hal tersebut seolah-olah sulit dilakukan. Beberapa tahun yang lalu
kita dapat memprediksi dengantepat kapan akan terjadinya
gelombang pasang, angin kencang dan lain sebagainya, sehingga
para nelayan kita dapat merencanakan kapan mereka ke laut untuk
mencari ikan. Tetapi sekarang hal tersebut seolah-olah sulit kita
prediksi (Budiantara, 2009a; 2009b). Dalam era perubahan iklim
global seperti sekarang ini, yang disebabkan oleh berbagai konflik
kepentingan, baik Regional, Nasional, maupun Internasional,
sangatlah mustahil jika kita masih menggunakan pendekatan
standar untuk tujuan pemodelan dan prediksi yang kompleks
tersebut. Diperlukan suatu metode baru, yang dapat digunakan
dan diandalkan serta memberikan hasil pemodelan dan prediksi
yang lebih baik.
53
Persoalan kemiskinan, keterbelakangan, kebodohan, dan
krisis moral merupakan musuh kita bersama pada saat ini, dan
mungkin musuh ”abadi” kita pada masa yang akan datang.
Persoalan ini, seolah-olah tidak pernah dapat diselesaikan dengan
tuntas oleh Pemerintah dan kita semua. Persoalan seperti
persentase penduduk miskin, beserta variabel-variabel
penyebabnya merupakan salah satu contoh kejadian yang bentuk
polanya tidak jelas (tidak mengikuti pola tertentu), dan seolah-
olah tidak beraturan (lihat Gambar 6) (Budiantara, 2009b).
Walaupun model regresi parametrik sederhana dan mudah, dalam
situasi seperti ini, tidaklah bijaksana jika kita menggunakan
pendekatan regresi parametrik untuk tujuan pemodelan dan
prediksi. Dalam pemodelan Statistika, memang sangat diharapkan
sedapat mungkin menggunakan model yang parsimoni
(sederhana), tetapi dalam keadaan dimana terdapat kondisi yang
mengharuskan pemodelan menggunakan model yang lebih
kompleks, maka model parsimoni tidak selayaknya dipaksakan,
karena hasil yang diperoleh akan sangat bias dan memiliki error
yang sangat besar (Budiantara, 2009a).
Dalam persoalan pemodelan, model yang baik tidaklah
tunggal (tidak satu satunya). Model yang baik dapat dipandang
dari berbagai aspek. Oleh karena itu, seorang pakar Statistika
diharapkan memperlihatkan kearifannya, dan menghindari
54
fanatisme bidang keilmuan yang berlebihan, serta dapat
menempatkan sesuatu persoalan pemodelan tepat pada porsinya.
Secara spesifik, apabila sekumpulan data dapat diselesaikan
dengan baik menggunakan pendekatan regresi parametrik,
(”karena fanatisme berlebihan yang melekat pada bidang
keilmuannya”), maka harus diselesaikan dengan pendekatan
regresi nonparametrik ataupun semiparametrik. Demikian pula
sebaliknya. Walaupun hal tersebut benar secara Statistika teoritis,
tetapi kurang bijaksana dilihat dari sudut pandang kekomplekan
modelnya (Budiantara, 2009a; 2009b).
Berbeda dengan regresi parametrik yang tanpa disadari
cendrung ada unsur pemaksaan dari peneliti dan tanpa disadari
pula, peneliti ikut campur tangan dalam menentukan bentuk
estimasi dari kurva regresi, maka dalam regresi nonparametrik,
hal ini tidak akan terjadi. Dalam pandangan regresi
nonparametrik, biarkan data sendiri yang akan mencari bentuk
estimasi dari kurva regresinya, tanpa harus dipengaruhi oleh
faktor subyektifitas sipeneliti (Eubank, 1988; Budiantara, 2001a).
Ini berarti pendekatan model regresi nonparametrik sangatlah
fleksibel dan sangat obyektif. Beberapa model regresi
nonparametrik yang banyak digunakan diantaranya, Histogram,
Kernel (Kayri, & Zirhhoglu, 2009; Budiantara & Mulianah,
2007), Spline (Budiantara, dkk.,1997; 2010a; 2010b; Becher,
55
dkk., 2009; Huang dan Liu, 2006; Oehlert, 1992; Cox &
O’Sullivan, 1996; Wahba, 1990; Lestari, dkk.,2010; Koenker,
dkk.,1994), Polinomial Lokal (Eubank, 1988), Deret Ortogonal
(Eubank, 1988), Deret Fourier (Bilaudio, 1992), k-NN
(Hardle,1990; 1991), Neural Network (NN), Wavelets
(Antoniadis, 2001), MARS (Budiantara, dkk.,2006), dan yang
lainnya. Semua model-model regresi nonparametrik ini
mempunyai kelebihan dan kekurangan serta memiliki motivasi
tersendiri dalam memodelkan pola data.
56
Pemahaman Regresi Semiparametrik
57
swasembada beras), padahal negara ini tercatat sebagai negara
agraris. Produksi beras nasional dikuatirkan akan terancam,
karena beralih fungsinya dan berkurangnya lahan pertanian dari
tahun ketahun secara sistematis, untuk berbagai kepetingan seperti
perumahan, industri, bisnis dan yang lainnya. Lebih dari separuh
produksi beras nasional, disumbang dari produksi padi yang
berasal dari padi sawah. Untuk mempertahankan dan
meningkatkan produksi beras nasional, disamping
memperluas lahan pertanian baru, salah satu hal yang perlu
dilakukan adalah menyelidiki faktorfaktor yang mempengaruhi
produksi padi sawah di Indonesia.
Pola hubungan antara besarnya produksi padi sawah dan variabel
luas lahan memang berpola linear (parametrik), tetapi dengan
variabel-variabel lain seperti penggunaan pupuk, penggunaan
benih, tenaga kerja dan pestisida, tidak berpola linear, bahkan
terlihat tidak ada pola tertentu (nonparametrik), (lihat Gambar 7(a-
f)). Akibatnya, untuk memperkirakan produksi beras nasional
pada periode waktu tertentu, selayaknya mempertimbangkan
menggunakan model regresi semiparametrik sebagai salah satu
alternatif (Budiantara, 2009b).
58
59
Uji Distribusi Populasi dengan Distribusi Sampel
60
Daftar Pustaka
61