Oleh :
Kelompok 6
3
Daftar isi
Kata Pengantar i
!Unexpected End of Formula
BAB I 3
PENDAHULUAN 3
1.1. Latar belakang 3
1.2. Rumusan Masalah 4
1.3. Tujuan 4
BAB II 5
PEMBAHASAN 5
2.1. Sejarah Generalized Linier Models 5
2.2 Komponen Generalized Linear Model 9
2.3 Exponential Family (Distribusi Keluarga Eksponensial) 9
2.4. Model Generalized Linier Model 13
2.5. Fungsi Link 14
2.6. Estimasi Generalized Linier Model 15
2.7. Langkah-Langkah Generalized Linier Model 17
BAB III 25
PENUTUP 25
3.1. KESIMPULAN 25
3.2. saran 25
Daftar Pustaka 26
BAB I
PENDAHULUAN
4
Program R sama dengan R studio yang fasilitas dan penggunaannya yang
lebih mudah untuk pengguna, dengan contoh fasilitas yang terdapat didalamnya
yaitu R-Commander. Paket R-Commander pada awalnya dibuat untuk keperluan
analisis statistik yang sederhana, yaitu sebagai alat komputasi untuk perkuliahan
statistika dasar, khususnya untuk pengguna yang cenderung lebih terbiasa
menggunakan paket-paket statistika yang bersifat point and click.
Tulisan ini menyajikan secara teoritis tentang Model Linier Tergeneralisir.
Selanjutnya suatu contoh kasus yang dikerjakan dengan menggunakan software R
akan diberikan sebagai bahan diskusi. Pemakaian software R secara explisit akan
disajikan dalam studi kasus, dan analisis hasil (output) nya akan dijelaskan.
Generalized Linier Models (GLM) bertujuan untuk mengetahui hubungan
sebab-akibat, pengaruh dari variable independent terhadap variable dependent.
Keunggulan GLM dibandingkan dengan regresi linier biasa terletak pada
distribusi (bentuk kurva) varaibel dependent. Variable dependent pada GLM
tidak diisyarakatkan berditribusi normal (kurva lonceng simetris), akan tetapi
distribusi-distribusi yang termasuk keluarga eksponensial, yaitu; Binomial,
Poisson, Binomial Negative, Normal, Gamma, Invers Gaussian.
Penelitian-penelitian generalized linier model telah banyak dilakukan oleh
para statistikawan, pengembangan teoritisnya generalized linier mixed models,
generalized additive model, generalized additive mixed model.
5
7. Bagaimana cara mengolah data di R dengan menerapkan Model Linier
Tergeneralisir?
1.3. TUJUAN
6
BAB II
PEMBAHASAN
Analisis regresi adalah salah satu metode untuk menentukan hubungan sebab-
akibat antara satu variabel dengan variabel yang lain. Variabel penyebab disebut
dengan variabel independen, variabel penjelas atau variabel X. Sementara variabel
yang terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel dependen,
variabel terikat, variabel respon atau variabel Y. Pendugaan kurva regresi
digunakan untuk menjelaskan hubungan antara peubah penjelas dengan peubah
respon. Pendekatan pendugaan yang paling sering digunakan adalah pendekatan
parametrik. Asumsi yang mendasari pendekatan ini adalah kurva regresi dapat
diwakili oleh suatu model parametrik (Hardle, 1990). Dalam regresi parametrik,
diasumsikan bahwa bentuk kurva regresi diketahui berdasarkan teori, informasi
sebelumnya, atau sumber- sumber lain yang dapat memberi pengetahuan secara
terperinci.
Apabila model dari pendekatan parametrik diasumsikan benar, maka
pendugaan parametrik akan sangat efisien. Tetapi jika salah, maka akan
menyebabkan interpretasi data yang menyesatkan. Selain itu, model parametrik
mempunyai keterbatasan untuk menduga pola data yang tidak diharapkan. Jika
asumsi bentuk kurva parametrik ini tidak terpenuhi, maka kurva regresi dapat
diduga menggunakan model regresi dari pendekatan nonparametrik. Pendekatan
nonparametrik merupakan metode pendugaan model yang dilakukan berdasarkan
pendekatan yang tidak terikat asumsi bentuk kurva regresi tertentu.
Dalam praktek di lapangan, data yang ditemukan seringkali tidak memenuhi
asumsi yang diisyaratkan regresi linier klasik. Generalized linier model (GLM)
merupakan perluasan dari model regresi linier dengan asumsi prediktor memiliki
efek linier akan tetapi tidak mengasumsikan distribusi tertentu dari variabel
respon dan digunakan ketika variabel respon merupakan anggota dari keluarga
eksponensial (Nelder dan Weddeburn, 1972).
Generalized Linier Models (GLM) bertujuan untuk mengetahui hubungan
sebab-akibat, pengaruh dari variable independent terhadap variable dependent.
Keunggulan GLM dibandingkan dengan regresi linier biasa terletak pada
distribusi (bentuk kurva) varaibel dependent. Variable dependent pada GLM tidak
diisyarakatkan berditribusi normal (kurva lonceng simetris), akan tetapi distribusi-
distribusi yang termasuk keluarga eksponensial, yaitu; Binomial, Poisson,
Binomial Negative, Normal, Gamma, Invers Gaussian.
7
Sejarah dari GLMs (LM, GLM, GLMs)
Model linear klasik awalnya lebih banyak digunakan dalam bidang
matematika atau yang lebih dikenal dengan persamaan garis lurus. Pada awal abad
ke 18, model linear klasik banyak dipakai dalam bidang statistika terutama untuk
memodelkan masalah astronomi. Menggunakan model linear, Gauss (1801) telah
dapat memprediksi posisi kemunculan asteroid Ceres. Hal tersebut merupakan
titik awal dari karir Gauss, hingga tahun 1809, Gauss menemukan distribusi
Normal. Model linear klasik yang paling sederhana didefinisikan pada persamaan
(1).
y=f ( x , β , ε )
y=β 0 + β x + ε
(1)
dengan y adalah variable dependen yang nilainya tergantung oleh variable
independen x. β adalah parameter model yang belum diketahui, sedangkan ε
merupakan variabel random selisih nilai aktual y dengan nilai taksirannya.
Variabel random ε diasumsikan mengikuti distribusi Normal(0, σ 2).
8
Dimana Y n adalah random matriks ukuran n × m. Gn adalah matriks m× k. X n, H n,
Z n, danQ n masing-masing merupakan matriks berukuran
n × p , q × k , n× u , dan v ×k. B adalah matriks p ×q dari parameter yang tidak
diketahui. Θ merupakan random matriks u × v. Dan En adalah matriks n × k dari
random error yang berdistribusi Normal (0, Σ).
Lebih lanjut, Carey (1998) mengemukakan bahwa dalam metode least square,
mengharuskan matriks ( Χ ' Χ ) yang non singular, jika ( Χ ' Χ ) singular, maka nilai
dari parameternya tidak dapat diberikan. Hal ini disebabkan karena nilai invers
dari ( Χ ' Χ ) tidak ada. Karena LM menggunakan least square, maka jika terdapat
kasus dimana matriks ( Χ ' Χ ) nya singular, maka LM tidak mampu menghasilkan
model. Namun GLM dapat mengatasinya, karena GLM menggunakan
Generalized invers untuk menyelesaikan normal equation tersebut.
Seiring dengan perkembangan LM dan GLM yang mengedepankan asumsi
normalitas, pemodelan linear yang melanggar asumsi normalitas juga
bermunculan. Bliss (1935) mengemukakan pemodelan dengan analisis probit
yang dibingkai oleh kasus bidang toxicology. Tahun 1952, Dyke dan Patterson
mempublikasikan analisis dari cross-classified data survey yang berkonsentrasi
pada proporsi responden yang memiliki pengetahuan mengenai kanker. Analisis
ini menggunakan logit model untuk proporsi. Log linear muncul kemudian
dengan aplikasi pada data counting yang melibatkan distribusi Poisson. Invers
Polinomial, diperkenalkan pula oleh Nelder (1966) yang digunakan dalam bidang
Biologi.
Berbagai perkembangan model tersebut, Nelder dan Wedderburn (1972)
akhirnya mencetuskan ide mengenai Generalized Linear Model (GLMs). Yang
mengemukakan bahwa linearitas dapat ditampilkan dalam suatu wadah yang
memuat berbagai teknik analisis statistik. GLMs mengakomodasi berbagai model
linear, baik itu yang memerlukan asumsi distribusi Normal maupun Non Normal.
McCullagh dan Nelder (1989) menjelaskan lebih detail mengenai GLMs
serta beberapa model yang menggunakan GLMs. Agresti (2007) mengemukakan
asumsi dalam GLMs yang secara jelas membedakan dengan LM maupun GLM.
Secara ringkas, summary dari LM/GLM dengan GLMs diberikan pada Tabel 1.1.
9
Normal, melainkan masuk
dalam distribusi keluarga
Eksponential
Y dan X tidak harus linear.
Namun transformasi Y
Linearitas antar melalui
variabel dependen Y dan X linear dalam link function, diasumsikan
Y dan independen parameter berhubungan secara linear,
X contoh dalam regresi logistic
biner dimana
logit ( π )=β 0 + βΧ
10
2.2.
2.3.
2.4.
2.5.
2.6.
2.2 KOMPONEN GENERALIZED LINEAR MODEL
Generalized Linear Model (GLMs) merupakan bentuk umum atau general dari
Model Linear. Diketahui vektor y memiliki n komponen, yang merupakan
realisasi dari sebuah matrik respon Y. Setiap komponennya independen dan
berdistribusi dengan mean atau E(Y)= μ. Jika model yang terbentuk memiliki
prediktor X, dengan beberapa parameter yang tidak diketahui β 1 , … , β n, maka
p
modelnya adalah berupa kombinasi linear μ=∑ Χ j β j , atau jika dituliskan dalam
j=1
11
2.7. 2.3 EXPONENTIAL FAMILY (DISTRIBUSI KELUARGA EKSPONENSIAL)
Dalam GLMs, distribusi respon dapat berbagai jenis, yang termasuk dalam
Exponential Family. Sebuah variabel random Y, masuk dalam distribusi yang
tergabung dalam Exponential Family, jika memiliki bentuk:
yθ−b (θ )
f Y ( y :θ , ϕ)=exp { + c ( y , ϕ)}
a( ϕ)
(1)
dengan fungsi tertentu a(.), b(.) dan c(.). Jika ϕ diketahui, maka bentuk persamaan
(1) merupakan Exponential Family dengan parameter kanonik θ.
Beberapa jenis distribusi yang kerap digunakan dalam GLMs dapat dijabarkan
sbb:
1. Distribusi Normal
dengan:
12
Nilai Ekspektasi, Varians dan Deviance
2. Distribusi Binomial
dengan:
13
Nilai Ekspektasi, Varians dan Deviance
3. Distribusi Poisson
14
Tabel 1.2. Beberapa link function dalam GLMs (*canonical), semua parameter
dalam lambang μ
15
distribusi respon selain normal dan variansi tidak homogen dapat dimodelkan
dengan model ini.
h=
Berikut ini tabel penghubung kanonik (η) untuk beberapa distribusi (Jong dan
Heller, 2008)
16
2.6. ESTIMASI GENERALIZED LINIER MODEL
17
18
2.7. LANGKAH-LANGKAH GENERALIZED LINIER MODEL
19
variabel penelitian yang paling sering digunakan dalam penelitian karena
mempunyai kemampuan aplikasi yang luas. Data yang diperoleh pada
proses pengumpulan data, selanjutnya peneliti harus mengklasifikasikan
dan menentukan data yang termasuk ke dalam variabel independent dan
data yang termasuk dalam varaibel dependent. Penentuan kedua variabel
ini berdasar teori keilmuan terkait.
3. Statistika Deskriptif
Pada deskripsi data, diberikan ukuran tendensi pusat, ukuran posisi dan ukuran
variasi, kesemuanya menggambarakan karakteristik data. Ukuran numerik
yang menggambarkan beberapa karakteristik dari populasi adalah
parameter, sedangkan ukuran numerik yang menggambarkan karakteristik
dari data pengamatan (sampel) adalah statistic yang mana tujuannya
adalah untuk menduga atau mengestimasi parameter. Sebagai contoh, rata
– rata penjualan yang diperoleh dari populasi keseluruhan adalah
parameter, sedangkan rata – rata penjualan dari suatu sampel yang
representative adalah statistic. Statistic ini yang dijadikan sebagai penduga
parameter.
4. Pengujian Linieritas
Uji linieritas merupakan syarat sebelum dilakukan uji generalized linier models.
Secara umum Uji Linieritas bertujuan untuk mengetahui apakah dua
varaibel mempunyai hubungan yang linier secara signifikan atau tidak.
Data yang baik seharusnya terdapat hubungan yang linier antara varaibel
independent dan varaibel dependent.
5. Identifikasi Distribusi Variabel dependent dan Pemilihan Fungsi Link
Identifikasi varaibel dependent perlu dilakukan dengan fitting distribution,
mencocokan data pada kurva distribusi. Setelah diketahui distribusi
varaibel dependent kemudian ditentukan fungsi link yang berkaitan
dengan distribusi tersebut.
6. Pemodelan Generalized Linier Model
Melakukan pemodelan generalized linier model dengan memasukan semua
variabel independent dan dependent. Menggunakan uji parameter untuk
menyeleksi parameter yang masuk ke dalam model, selanjutnya
menggunakan uji kecocokan model untuk menyeleksi model yang
signifikan.
7. Pemilihan Model Terbaik
Metode pemilihan model GLM terbaik ini digunakan untuk memilih model yang
paling tepat untuk menjelaskan hubungan antara variabel dependent (y)
dan variabel independent (x). Pada setiap hubungan antara variabel Y dan
variabel X terdapat beberapa model yang mampu menggambarkan.
beberapa kriteria untuk pemilihan model terbaik diantaranya : lain
Akaike’s Information Criterian (AIC), Bayesian Information Criterion
(BIC) dan Root Mean Square Error(RMSE). Memilih model terbaik
berdasarkan nilai AIC, BIC dan RMSE terkecil.
Contoh Kasus
20
Misalkan akan diteliti hubungan antara tipe konsumen berdasarkan lamanya
menjadi konsumen (X1) dan tingkat persepsi konsumen terhadap kualitas produk
HBAT (X6) terhadap kemauan konsumen untuk membangun hubungan dengan
perusahaan di masa yang akan datang (X3, yang jawabannya adalah YA dan
TIDAK).
21
X1 X2 Y
2 8.5 1
3 8.2 0
3 9.2 1
1 6.4 0
2 9 0
1 6.5 0
1 6.9 0
2 6.2 0
2 5.8 1
1 6.4 0
3 8.7 0
1 6.1 0
1 9.5 1
3 9.2 1
2 6.3 1
3 8.7 0
2 5.7 1
2 5.9 1
2 5.6 0
3 9.1 1
1 5.2 0
3 9.6 1
2 8.6 0
3 9.3 1
1 6 0
2 6.4 0
3 8.5 0
1 7 0
3 8.5 0
1 7.6 0
1 6.9 0
1 8.1 0
1 6.7 0
2 8 1
1 6.7 0
1 8.7 0
2 9 0
3 9.6 1
2 8.2 1
1 6.1 0
2 8.3 1
2 9.4 1
22
3 9.3 1
2 5.1 1
3 8 0
2 5.9 1
3 10 1
2 5.7 0
3 9.9 1
3 7.9 1
1 6.7 0
3 8.2 1
3 9.4 1
1 6.9 0
2 8 1
3 9.3 1
2 7.4 1
3 7.6 1
3 10 0
3 9.9 1
3 8.7 1
2 8.4 1
1 8.8 0
1 7.7 0
1 6.6 0
2 5.7 1
2 5.7 0
2 5.5 0
1 7.5 0
2 6.4 1
3 9.1 0
1 6.7 0
2 6.5 0
3 9.9 1
2 8.5 1
3 9.9 1
1 7.6 0
2 9.4 1
3 9.3 1
1 7.1 0
3 9.9 0
3 8.7 1
2 8.6 0
1 6.4 0
2 7.7 1
1 7.5 0
23
1 5 0
2 7.7 0
2 9.1 0
2 5.5 1
3 9.1 1
1 7.1 0
3 9.2 0
3 9.3 1
3 9.3 1
1 8.6 1
1 7.4 0
1 8.7 0
2 7.8 0
2 7.9 0
24
4. Pilih data dengan klik Data set->Statistics->Fit Models->Generalized
Linear Models . . . akan muncul jendela seperti di bawah ini
25
Hasil output :
2.8.
26
27
BAB III
PENUTUP
3.1. KESIMPULAN
R programing adalah sebuah bahasa Pemograman dan perangkat
lunak yang menggunakan GUI (grafik user interface). Program R
digunakan untuk menganalisa statistika dan grafik, intinya program
R dibuat untuk memudahkan user dalam mencari atau menentukan nilai-
nilai dari proses statistika. Program ini sangat memudahkan bagi
statistikawan untuk mengasah profesinya.
Aplikasi ini dapat mengolah pengujian statistika, salah
satunyapenerapan Model Linier Tergeneralisir. Untuk penerapan ujinya
dapat dilakukan dengan menggunakan package R-Commander.
3.2.
3.3. SARAN
Menyadari bahwa makalah ini belum sempurna, kedepannya kami
akan lebih fokus dan detail dalam menjelaskan tentang makalah di atas
dengan sumber-sumber yang lebih banyak, yang tentunya dapat di
pertanggungjawabkan.
Diharapkan setelah membaca makalah ini para pembaca dapat
mengetehui perbedaan antara Model Linier dan Model Linier
Tergeneralisir dan kapan kita dapat menerapkanya dalam penyelesaian
suatu penelitian. Dan mengetahui cara mengolah data yang menerapkan
Model Linier Tergeneralisir dengan menggunakan R-Studio.
28
Daftar Pustaka
Suhartono, 2008. Analisis Data Statistik Dengan R. Lab Statistik
Komputasi ITS. Surabaya.
Dobson, A. J. (1990) An Introduction to Generalized Linear
Models. London: Chapman and Hall.
Jamillatuzzahro,Rezzy,Riki (2017) Aplikasi Generalized Linier
Model Pada R
29