Anda di halaman 1dari 29

MAKALAH EKSPLORASI DAN PENGOLAHAN DATA

MODEL LINIER TERGENERALISIR


(GENERALIZED LINIER MODEL)
Makalah Ini Disusun Guna Memenuhi Tugas Mata Kuliah Eksplorasi Dan
Pengolahan Data
Dosen Pengampu : Dr. Iqbal Kharisudin, S.pd., M.Sc.

Oleh :
Kelompok 6

Rini Kurniawati 4112317001


Aathifah Hayyu Rahmi 4112317008
Desy Noor Permata Sari 4112317029

PROGRAM STUDI D3 STATISTIKA TERAPAN DAN KOMPUTASI


JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI SEMARANG
2018
2
Kata Pengantar

Puji syukur kami panjatkan kehadirat Tuhan Yang Maha Esa


karena dengan rahmat, karunia, serta taufik dan hidayah-Nya kami dapat
menyelesaikan makalah tentang Model Linier Tergeneralisir
(Generalized Linier Models) dengan baik meskipun banyak kekurangan
didalamnya. Kami sebagai penyusun berharap makalah ini dapat berguna
dalam rangka menambah wawasan serta pengetahuan kita.
Kami juga menyadari sepenuhnya bahwa di dalam makalah ini
terdapat kekurangan dan jauh dari kata sempurna. Oleh sebab itu, Kami
berharap adanya kritik, saran dan usulan demi perbaikan makalah di
masa yang akan datang, mengingat tidak ada sesuatu yang sempurna
tanpa saran yang membangun.
Semoga makalah ini dapat dipahami bagi siapapun yang
membacanya. Sekiranya makalah yang telah disusun ini dapat berguna
bagi orang yang membacanya. Sebelumnya kami mohon maaf apabila
terdapat kesalahan kata-kata yang kurang berkenan dan kami memohon
kritik dan saran yang membangun demi perbaikan di masa depan.

Semarang, 15 Oktober 2018

3
Daftar isi

Kata Pengantar i
!Unexpected End of Formula
BAB I 3
PENDAHULUAN 3
1.1. Latar belakang 3
1.2. Rumusan Masalah 4
1.3. Tujuan 4
BAB II 5
PEMBAHASAN 5
2.1. Sejarah Generalized Linier Models 5
2.2 Komponen Generalized Linear Model 9
2.3 Exponential Family (Distribusi Keluarga Eksponensial) 9
2.4. Model Generalized Linier Model 13
2.5. Fungsi Link 14
2.6. Estimasi Generalized Linier Model 15
2.7. Langkah-Langkah Generalized Linier Model 17
BAB III 25
PENUTUP 25
3.1. KESIMPULAN 25
3.2. saran 25
Daftar Pustaka 26

BAB I
PENDAHULUAN

1.1. LATAR BELAKANG


Di zaman modern ini telah bergeser ke era penggunaan teknologi.
terutama teknologi komputer, sehingga masyarakat modern masa kini telah di
mudahkan dalam melakukan pekerjaannya. Tidak bisa di pungkiri bahwa peran
statistik sangat vital dalam berbagai instansi. Dan alat untuk memenuhi suatu
statistic dalam instansi tersebut yaitu suatu aplikasi yang di dalamnya telah
terdapat berbagai uji-uji dalam bidang statistika. Salah satu alat pendukung
tersebut salah satunya yaitu program R.

4
Program R sama dengan R studio yang fasilitas dan penggunaannya yang
lebih mudah untuk pengguna, dengan contoh fasilitas yang terdapat didalamnya
yaitu R-Commander. Paket R-Commander pada awalnya dibuat untuk keperluan
analisis statistik yang sederhana, yaitu sebagai alat komputasi untuk perkuliahan
statistika dasar, khususnya untuk pengguna yang cenderung lebih terbiasa
menggunakan paket-paket statistika yang bersifat point and click.
Tulisan ini menyajikan secara teoritis tentang Model Linier Tergeneralisir.
Selanjutnya suatu contoh kasus yang dikerjakan dengan menggunakan software R
akan diberikan sebagai bahan diskusi. Pemakaian software R secara explisit akan
disajikan dalam studi kasus, dan analisis hasil (output) nya akan dijelaskan.
Generalized Linier Models (GLM) bertujuan untuk mengetahui hubungan
sebab-akibat, pengaruh dari variable independent terhadap variable dependent.
Keunggulan GLM dibandingkan dengan regresi linier biasa terletak pada
distribusi (bentuk kurva) varaibel dependent. Variable dependent pada GLM
tidak diisyarakatkan berditribusi normal (kurva lonceng simetris), akan tetapi
distribusi-distribusi yang termasuk keluarga eksponensial, yaitu; Binomial,
Poisson, Binomial Negative, Normal, Gamma, Invers Gaussian.
Penelitian-penelitian generalized linier model telah banyak dilakukan oleh
para statistikawan, pengembangan teoritisnya generalized linier mixed models,
generalized additive model, generalized additive mixed model.

Di bidang kedokteran seringkali menggunakan analisis regresi linier


sederhana dan ganda untuk penelitian. Analisis yang berfungsi untuk
mengetahui hubungan sebab akibat, misalkan untuk mengetahui pengaruh
umur dan kebersihan mulut terhadap karies gigi.

1.2. RUMUSAN MASALAH


Rumusan Masalah dari makalah ini ialah :
1. Bagaimana sejarah Model Linier Tergeneralisir?
2. Apa saja komponen Model Linier Tergeneralisir?
3. Apa saja Distribusi Keluarga Eksponensial?
4. Bagaimana model dari Model Linier Tergeneralisir?
5. Apa Itu Fungsi Link?
6. Bagaimana cara mengestimasi Model Linier Tergeneralisir?

5
7. Bagaimana cara mengolah data di R dengan menerapkan Model Linier
Tergeneralisir?

1.3. TUJUAN
  

Setelah mengerjakan makalah ini, kita diharapkan dapat :


1. Memahami sejarah Model Linier Tergeneralisir
2. Memahami berbagai komponen Model Linier Tergeneralisir
3. Memahami distribusi apa saja yng masuk ke dalam kategori Distribusi
Keluarga Eksponensial
4. Memahami bentuk model dari Model Linier Tergeneralisir
5. Memahami apa itu Fungi Link
6. Mengetahui cara mengestimasi Model Linier Tergeneralisir
7. Mengetahui cara mengolah data di R dengan menerapkan Model Linier
Tergeneralisir
8.

6
BAB II
PEMBAHASAN

2.1. SEJARAH GENERALIZED LINIER MODELS

Analisis regresi adalah salah satu metode untuk menentukan hubungan sebab-
akibat antara satu variabel dengan variabel yang lain. Variabel penyebab disebut
dengan variabel independen, variabel penjelas atau variabel X. Sementara variabel
yang terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel dependen,
variabel terikat, variabel respon atau variabel Y. Pendugaan kurva regresi
digunakan untuk menjelaskan hubungan antara peubah penjelas dengan peubah
respon. Pendekatan pendugaan yang paling sering digunakan adalah pendekatan
parametrik. Asumsi yang mendasari pendekatan ini adalah kurva regresi dapat
diwakili oleh suatu model parametrik (Hardle, 1990). Dalam regresi parametrik,
diasumsikan bahwa bentuk kurva regresi diketahui berdasarkan teori, informasi
sebelumnya, atau sumber- sumber lain yang dapat memberi pengetahuan secara
terperinci.
Apabila model dari pendekatan parametrik diasumsikan benar, maka
pendugaan parametrik akan sangat efisien. Tetapi jika salah, maka akan
menyebabkan interpretasi data yang menyesatkan. Selain itu, model parametrik
mempunyai keterbatasan untuk menduga pola data yang tidak diharapkan. Jika
asumsi bentuk kurva parametrik ini tidak terpenuhi, maka kurva regresi dapat
diduga menggunakan model regresi dari pendekatan nonparametrik. Pendekatan
nonparametrik merupakan metode pendugaan model yang dilakukan berdasarkan
pendekatan yang tidak terikat asumsi bentuk kurva regresi tertentu.
Dalam praktek di lapangan, data yang ditemukan seringkali tidak memenuhi
asumsi yang diisyaratkan regresi linier klasik. Generalized linier model (GLM)
merupakan perluasan dari model regresi linier dengan asumsi prediktor memiliki
efek linier akan tetapi tidak mengasumsikan distribusi tertentu dari variabel
respon dan digunakan ketika variabel respon merupakan anggota dari keluarga
eksponensial (Nelder dan Weddeburn, 1972).
Generalized Linier Models (GLM) bertujuan untuk mengetahui hubungan
sebab-akibat, pengaruh dari variable independent terhadap variable dependent.
Keunggulan GLM dibandingkan dengan regresi linier biasa terletak pada
distribusi (bentuk kurva) varaibel dependent. Variable dependent pada GLM tidak
diisyarakatkan berditribusi normal (kurva lonceng simetris), akan tetapi distribusi-
distribusi yang termasuk keluarga eksponensial, yaitu; Binomial, Poisson,
Binomial Negative, Normal, Gamma, Invers Gaussian.

7
Sejarah dari GLMs (LM, GLM, GLMs)
Model linear klasik awalnya lebih banyak digunakan dalam bidang
matematika atau yang lebih dikenal dengan persamaan garis lurus. Pada awal abad
ke 18, model linear klasik banyak dipakai dalam bidang statistika terutama untuk
memodelkan masalah astronomi. Menggunakan model linear, Gauss (1801) telah
dapat memprediksi posisi kemunculan asteroid Ceres. Hal tersebut merupakan
titik awal dari karir Gauss, hingga tahun 1809, Gauss menemukan distribusi
Normal. Model linear klasik yang paling sederhana didefinisikan pada persamaan
(1).
y=f ( x , β , ε )
y=β 0 + β x + ε
(1)
dengan y adalah variable dependen yang nilainya tergantung oleh variable
independen x. β adalah parameter model yang belum diketahui, sedangkan ε
merupakan variabel random selisih nilai aktual y dengan nilai taksirannya.
Variabel random ε diasumsikan mengikuti distribusi Normal(0, σ 2).

Rao (1973), mengemukakan mengenai General Linear Model (GLM).


GLM sederhana merupakan pengembangan dari model linear klasik (LM) dengan
banyak predictor atau yang disebut Regresi Linear Multiple. Metode least square
oleh Gauss tetap dijadikan dasar dalam estimasi parameter model. Asumsi pada
LM juga masih tetap terbawa pada GLM, yaitu ε mengikuti distribusi Normal(0,
σ 2). Dalam lanjutan penjelasannya, Rao (1973) menyatakan bahwa predictor tidak
harus kontinu. Prediktor yang bersifat kategori juga mendasari penelitian Fisher
pada Desain Eksperimen.
Beberapa penjelasan lain mengenai GLM yang merupakan perkembangan
dari LM, diberikan oleh Carey (1998). Carey memaparkan bahwa GLM
merupakan LM dengan banyak respon. Jika respon y lebih dari satu dan dapat
dibuat persamaan linear dengan menyatakan respon kedalam matriks Y, maka
modelnya adalah GLM. Lebih lanjut, Carey mengemukakan bahwa dalam GLM,
memungkinkan adanya kombinasi linear dalam prediktornya.
Dibawah naungan asumsi distribusi Normal, model linear dapat dituliskan
secara umum atau general. International Encyclopedia of Statistical Science
(2011) mendefinisikan GLM seperti pada persamaan(2).
Y n Gn=X n BH n+ Z n ΘQ n + En (2)

8
Dimana Y n adalah random matriks ukuran n × m. Gn adalah matriks m× k. X n, H n,
Z n, danQ n masing-masing merupakan matriks berukuran
n × p , q × k , n× u , dan v ×k. B adalah matriks p ×q dari parameter yang tidak
diketahui. Θ merupakan random matriks u × v. Dan En adalah matriks n × k dari
random error yang berdistribusi Normal (0, Σ).
Lebih lanjut, Carey (1998) mengemukakan bahwa dalam metode least square,
mengharuskan matriks ( Χ ' Χ ) yang non singular, jika ( Χ ' Χ ) singular, maka nilai
dari parameternya tidak dapat diberikan. Hal ini disebabkan karena nilai invers
dari ( Χ ' Χ ) tidak ada. Karena LM menggunakan least square, maka jika terdapat
kasus dimana matriks ( Χ ' Χ ) nya singular, maka LM tidak mampu menghasilkan
model. Namun GLM dapat mengatasinya, karena GLM menggunakan
Generalized invers untuk menyelesaikan normal equation tersebut.
Seiring dengan perkembangan LM dan GLM yang mengedepankan asumsi
normalitas, pemodelan linear yang melanggar asumsi normalitas juga
bermunculan. Bliss (1935) mengemukakan pemodelan dengan analisis probit
yang dibingkai oleh kasus bidang toxicology. Tahun 1952, Dyke dan Patterson
mempublikasikan analisis dari cross-classified data survey yang berkonsentrasi
pada proporsi responden yang memiliki pengetahuan mengenai kanker. Analisis
ini menggunakan logit model untuk proporsi. Log linear muncul kemudian
dengan aplikasi pada data counting yang melibatkan distribusi Poisson. Invers
Polinomial, diperkenalkan pula oleh Nelder (1966) yang digunakan dalam bidang
Biologi.
Berbagai perkembangan model tersebut, Nelder dan Wedderburn (1972)
akhirnya mencetuskan ide mengenai Generalized Linear Model (GLMs). Yang
mengemukakan bahwa linearitas dapat ditampilkan dalam suatu wadah yang
memuat berbagai teknik analisis statistik. GLMs mengakomodasi berbagai model
linear, baik itu yang memerlukan asumsi distribusi Normal maupun Non Normal.
McCullagh dan Nelder (1989) menjelaskan lebih detail mengenai GLMs
serta beberapa model yang menggunakan GLMs. Agresti (2007) mengemukakan
asumsi dalam GLMs yang secara jelas membedakan dengan LM maupun GLM.
Secara ringkas, summary dari LM/GLM dengan GLMs diberikan pada Tabel 1.1.

Tabel 1.1.Summary dari LM/GLM dengan GLMs

Property LM/GLM GLMs


Respon Diasumsikan Diasumsikan Independen,
Y 1 ,Y 2 , … , Y n Independen dan namun tidak harus
berdistribusi Normal berdistribusi

9
Normal, melainkan masuk
dalam distribusi keluarga
Eksponential
Y dan X tidak harus linear.
Namun transformasi Y
Linearitas antar melalui
variabel dependen Y dan X linear dalam link function, diasumsikan
Y dan independen parameter berhubungan secara linear,
X contoh dalam regresi logistic
biner dimana
logit ( π )=β 0 + βΧ

Tidak harus terpenuhi,


contoh:
Kehomogenan
Harus terpenuhi kasus overdispersi pada
varians
regresi
logistik
Diasumsikan Independen,
Diasumsikan
namun tidak harus
Error Independen dan
berdistribusi
berdistribusi Normal
Normal
LM menggunakan
metode least square,
dengan asumsi
(Χ ' Χ ) Lebih banyak menggunakan
yang non singular metode maksimum
Estimasi
GLM mampu likelihood
parameter
menangani kondisi dengan penyelesaian secara
dimana ( Χ ' Χ ) iteratif.
singular, yaitu
menggunakan
Generalized invers.
Regresi Linear
Sederhana atau
multiple ANOVA, Semua model LM dan GLM
MANOVA Regresi Logistik Regresi
Model
ANCOVA, Poisson Log Linear Regressi
MANCOVA Gamma dll
Respon surface
Mixed model dll

10
2.2.

2.3.

2.4.

2.5.

2.6.
2.2 KOMPONEN GENERALIZED LINEAR MODEL

Generalized Linear Model (GLMs) merupakan bentuk umum atau general dari
Model Linear. Diketahui vektor y memiliki n komponen, yang merupakan
realisasi dari sebuah matrik respon Y. Setiap komponennya independen dan
berdistribusi dengan mean atau E(Y)= μ. Jika model yang terbentuk memiliki
prediktor X, dengan beberapa parameter yang tidak diketahui β 1 , … , β n, maka
p
modelnya adalah berupa kombinasi linear μ=∑ Χ j β j , atau jika dituliskan dalam
j=1

bentuk matriks menjadi μ= Χ β.


Sebagai transisi dari model Linear ke Generalized Linear model, maka
dijabarkan bentuk melalui tiga buah komponen, yaitu:
1. Random Component, yaitu nilai-nilai pengamatan respon Y yang saling
bebas dari berdistribusi tertentu.
2. Systematic Component,yaitu kombinasi linear dari variabel X dengan
parameter ߚyang dilambangkan dengan η=Χ β .
3. Link between random and Systematic/ link function, yaitu suatu fungsi
yang menjelaskan nilai ekspektasi dari variabel respon (Y) yang
menghubungkan dengan variabel-variabel penjelas melalui persamaan
linier. Dituliskan dengan ηi =g (.), fungsi g(.) inilah yang disebut
dengan fungsi penghubung atau link function.
Dari ketiga komponen tersebut, linkfunction akan menentukan model
yang akan digunakan dalam GLMs. Link function paling sederhana adalah
g(μ) = μ disebut sebagai penghubung identitas (identity link). Apabila GLM
memiliki fungsi penghubung paling sederhana maka GLM merupakan model
linier dengan respon kontinu. Fungsi penghubung yang lain akan menghubungkan
μ secara nonlinier terhadap prediktor.

Pada Model Linear klasik, Y diasumsikan berdistribusi Normal dengan Ε ( Y )=μ


dan varians σ 2. Namun pada kenyataannya, kondisi ini tidak begitu saja terpenuhi.
Pada GLMs, variable respon Y dapat berdistribusi selain Normal, yang masuk
dalam Exponential Family.

11
2.7. 2.3 EXPONENTIAL FAMILY (DISTRIBUSI KELUARGA EKSPONENSIAL)
Dalam GLMs, distribusi respon dapat berbagai jenis, yang termasuk dalam
Exponential Family. Sebuah variabel random Y, masuk dalam distribusi yang
tergabung dalam Exponential Family, jika memiliki bentuk:

yθ−b (θ )
f Y ( y :θ , ϕ)=exp ⁡{ + c ( y , ϕ)}
a( ϕ)
(1)
dengan fungsi tertentu a(.), b(.) dan c(.). Jika ϕ diketahui, maka bentuk persamaan
(1) merupakan Exponential Family dengan parameter kanonik θ.

Beberapa jenis distribusi yang kerap digunakan dalam GLMs dapat dijabarkan
sbb:
1. Distribusi Normal

Dirubah dalam form Exponential Family:

dengan:

12
Nilai Ekspektasi, Varians dan Deviance

2. Distribusi Binomial

Dirubah dalam form Exponential Family:

dengan:

13
Nilai Ekspektasi, Varians dan Deviance

3. Distribusi Poisson

Canonical link merupakan link function yang diturunkan melalui bentuk


Exponential Family, sedangkan link lainnya diperoleh dengan transformasi Y
yang menjamin nilai Y dalam domainnya dan g(μ) dari -∞ sampai +∞.

14
Tabel 1.2. Beberapa link function dalam GLMs (*canonical), semua parameter
dalam lambang μ

Link Name Link Inverse link 1st Derivative


Gaussian/N
ormal μ η 1
*Identitas
Binomial
(Bernoulli: m
m=1) ( μ ( m−μ ) )
μ μ μ
*Logit
Probit
ln ln ( m−μ )Φ ( )−1
m
ln ln (−ln ln (
1− )
m/ ( 1+exp exp (−η ) ) m Φ ( η ) m(1−exp exp (−exp exp ( η ) ))
m
)
μ
Complemen m/ϕ {Φ−1
m( )
}¿
tari
Log-log
Poisson ln ln ( μ ) exp exp ( η ) 1/ μ
*Log
Negatif
1
Binomial ln ln¿ exp exp ( η ) /(a ( 1−exp exp ( η ) ))exp exp2 ( 1/μ
η)
*NB-C ( μ+α μ )
Log
Gamma 1/ μ 1/η −1/ μ2
*Invers
Invers
Gaussian 1/ μ2 1/ √ ❑ −1/ μ3
*Inv Quad
Sumber: International Encyclopedia of Statistical Science (2011)

2.4. MODEL GENERALIZED LINIER MODEL


Model linier merupakan model yang analisis antara dua variabel yaitu variabel
independen atau biasa disebut prediktor dengan variabel dependen atau biasa
disebut respon, dimana prediktor diasumsikan mempengaruhi respon secara linier,
sehingga variabel respon dapat diduga dari variabel prediktor. Tetapi model ini
mengasumsikan bahwa variabel respon harus berdistribusi Normal dan
kehomogenan variansi.

Mc Cullagh dan Nelder (1989) mendefinisikan bahwa Generalized Linier Models


merupakan perluasan dari model linier klasik. Sifat penting dari model ini adalah
mengasumsikan independensi observasi. Normalitas dan kehomogenan variansi
tidak diperlukan, sehingga hubungan antara variabel respon dan prediktor dengan

15
distribusi respon selain normal dan variansi tidak homogen dapat dimodelkan
dengan model ini.

Generalized Linier Models terdiri dari 3 komponen yaitu:

1. Variabel dependen (variabel respon) y 1 , y 2 ….. y ndengan mean E ( y i ) =μ i


Variabel dependen diasumsikan sebagai keluarga eksponensial, yaitu
distribusi normal, Poisson, Binomial, Gamma atau Invers Gaussian.
2. Sekumpulan parameter β( px 1) dan variabel independen (variabel penjelas /
explanatory variabel)
β=⌈ β 0 β 1 .. β n ⌉ x i=⌈ x0 x 1 . . xn ⌉

3. Fungsi Link monoton h( μi ) sedemikian sehingga :



h ( μi ) = ηi = ∑ m x ℑ β = x i β , dengan μi = E ( y i )

Maka, model Generalized Linier Model dapat dimodelkan sebagai berikut :

h=

2.5. FUNGSI LINK

Menurut Mc Cullagh dan Nelder (1989)


Fungsi hubung adalah suatu fungsi yang menghubungkan prediktor linier η
dengan nilai harapan respon y yaitu . Fungsi link dapat menjelaskan hubungan
linier antara fungsi transformasi dari mean, g (µ) dengan variable predictor yang
menghubungkan komponen sitematis η terhadap nilai mean µ. Fungsi hubungan
atau link function merupakan nilai harapan dari komponen acak.  

Fungsi link dimodelkan sebagai berikut: η = g(µ) atau µ = (η)

Berikut ini tabel penghubung kanonik (η) untuk beberapa distribusi (Jong dan
Heller, 2008)

16
2.6. ESTIMASI GENERALIZED LINIER MODEL

Metode yang digunakan untuk mengestimasi parameter regresi logistic adalah


Maximum Likelihood Estimation (MLE). MLE adalah teknik yang digunakan
untuk mencari titik tertentu untuk memaksimumkan sebuah fungsi. Langkah yang
perlu dilakukan dengan metode MLE yaitu dengan membuat fungsi likelihood
distribusi, membuat transformasi fungsi tersebut dalam bentuk ln, menurunan
secara parsial terhadap parameter dan menyamakannya dengan nol. Dari
pendeferensial diperoleh estimasi parameter.

Cara menetukan estimator parameter µ dan σ2 dengan metode Maximum


Likelihood Estimation (MLE) adalah sebagai berikut.

1. Membuat fungsi likelihood distribusi normal, yaitu sebagai berikut.

2. Membuat transformasi fungsi tersebut dalam bentuk ln.

3. Membuat turunan secara parsial terhadap parameter µ dan σ2 dan


menyamakannya dengan nol.
Turunan terhadap µ:

Turunan terhadap σ2:

4. Dari turunan parsial terhadap µ dan σ2 bisa diperoleh estimator parameter


µ dan σ2 sebagai berikut.

17
18
2.7. LANGKAH-LANGKAH GENERALIZED LINIER MODEL

Berikut digambarkan langkah – langkah dalam melakukan analisis generalized


linier model
1. Mengumpulkan data
Salah satu komponen yang penting dalam penelitian adalah proses peneliti dalam
pengumpulan data. Kesalahan yang dilakukan dalam proses pengumpulan
data akan membuat proses analisis menjadi sulit.
Selain itu hasil dan kesimpulan yang akan didapat pun akan menjadi rancu apabila
pengumpulan data dilakukan tidak dengan benar.Pengumpulan data
dilakukan untuk memperoleh informasi yang dibutuhkan dalam rangka
mencapai tujuan penelitian. Proses pengumpulan data ditentukan oleh
variabel-variabel yang ada dalam hipotesis. Pengumpulan data dilakukan
terhadap sampel yang telah ditentukan sebelumnya.
2. Menentukan variable depedent dan variable independent
Variabel independen (independent variable) adalah tipe variabel yang
menjelaskan atau mempengaruhi variabel yang lain. Variabel dependen
(dependent variable) adalah tipe variabel yang dijelaskan atau dipengaruhi
oleh variabel independen. Kedua tipe variabel ini merupakan kategori

19
variabel penelitian yang paling sering digunakan dalam penelitian karena
mempunyai kemampuan aplikasi yang luas. Data yang diperoleh pada
proses pengumpulan data, selanjutnya peneliti harus mengklasifikasikan
dan menentukan data yang termasuk ke dalam variabel independent dan
data yang termasuk dalam varaibel dependent. Penentuan kedua variabel
ini berdasar teori keilmuan terkait.
3. Statistika Deskriptif
Pada deskripsi data, diberikan ukuran tendensi pusat, ukuran posisi dan ukuran
variasi, kesemuanya menggambarakan karakteristik data. Ukuran numerik
yang menggambarkan beberapa karakteristik dari populasi adalah
parameter, sedangkan ukuran numerik yang menggambarkan karakteristik
dari data pengamatan (sampel) adalah statistic yang mana tujuannya
adalah untuk menduga atau mengestimasi parameter. Sebagai contoh, rata
– rata penjualan yang diperoleh dari populasi keseluruhan adalah
parameter, sedangkan rata – rata penjualan dari suatu sampel yang
representative adalah statistic. Statistic ini yang dijadikan sebagai penduga
parameter.
4. Pengujian Linieritas
Uji linieritas merupakan syarat sebelum dilakukan uji generalized linier models.
Secara umum Uji Linieritas bertujuan untuk mengetahui apakah dua
varaibel mempunyai hubungan yang linier secara signifikan atau tidak.
Data yang baik seharusnya terdapat hubungan yang linier antara varaibel
independent dan varaibel dependent.
5. Identifikasi Distribusi Variabel dependent dan Pemilihan Fungsi Link
Identifikasi varaibel dependent perlu dilakukan dengan fitting distribution,
mencocokan data pada kurva distribusi. Setelah diketahui distribusi
varaibel dependent kemudian ditentukan fungsi link yang berkaitan
dengan distribusi tersebut.
6. Pemodelan Generalized Linier Model
Melakukan pemodelan generalized linier model dengan memasukan semua
variabel independent dan dependent. Menggunakan uji parameter untuk
menyeleksi parameter yang masuk ke dalam model, selanjutnya
menggunakan uji kecocokan model untuk menyeleksi model yang
signifikan.
7. Pemilihan Model Terbaik
Metode pemilihan model GLM terbaik ini digunakan untuk memilih model yang
paling tepat untuk menjelaskan hubungan antara variabel dependent (y)
dan variabel independent (x). Pada setiap hubungan antara variabel Y dan
variabel X terdapat beberapa model yang mampu menggambarkan.
beberapa kriteria untuk pemilihan model terbaik diantaranya : lain
Akaike’s Information Criterian (AIC), Bayesian Information Criterion
(BIC) dan Root Mean Square Error(RMSE). Memilih model terbaik
berdasarkan nilai AIC, BIC dan RMSE terkecil.
Contoh Kasus

20
Misalkan akan diteliti hubungan antara tipe konsumen berdasarkan lamanya
menjadi konsumen (X1) dan tingkat persepsi konsumen terhadap kualitas produk
HBAT (X6) terhadap kemauan konsumen untuk membangun hubungan dengan
perusahaan di masa yang akan datang (X3, yang jawabannya adalah YA dan
TIDAK).

21
X1 X2 Y
2 8.5 1
3 8.2 0
3 9.2 1
1 6.4 0
2 9 0
1 6.5 0
1 6.9 0
2 6.2 0
2 5.8 1
1 6.4 0
3 8.7 0
1 6.1 0
1 9.5 1
3 9.2 1
2 6.3 1
3 8.7 0
2 5.7 1
2 5.9 1
2 5.6 0
3 9.1 1
1 5.2 0
3 9.6 1
2 8.6 0
3 9.3 1
1 6 0
2 6.4 0
3 8.5 0
1 7 0
3 8.5 0
1 7.6 0
1 6.9 0
1 8.1 0
1 6.7 0
2 8 1
1 6.7 0
1 8.7 0
2 9 0
3 9.6 1
2 8.2 1
1 6.1 0
2 8.3 1
2 9.4 1

22
3 9.3 1
2 5.1 1
3 8 0
2 5.9 1
3 10 1
2 5.7 0
3 9.9 1
3 7.9 1
1 6.7 0
3 8.2 1
3 9.4 1
1 6.9 0
2 8 1
3 9.3 1
2 7.4 1
3 7.6 1
3 10 0
3 9.9 1
3 8.7 1
2 8.4 1
1 8.8 0
1 7.7 0
1 6.6 0
2 5.7 1
2 5.7 0
2 5.5 0
1 7.5 0
2 6.4 1
3 9.1 0
1 6.7 0
2 6.5 0
3 9.9 1
2 8.5 1
3 9.9 1
1 7.6 0
2 9.4 1
3 9.3 1
1 7.1 0
3 9.9 0
3 8.7 1
2 8.6 0
1 6.4 0
2 7.7 1
1 7.5 0

23
1 5 0
2 7.7 0
2 9.1 0
2 5.5 1
3 9.1 1
1 7.1 0
3 9.2 0
3 9.3 1
3 9.3 1
1 8.6 1
1 7.4 0
1 8.7 0
2 7.8 0
2 7.9 0

Dengan menggunakan Rcommander langkah-langkahnya sebagai berikut :


1. Klik Import Dataset ->From Excel, kemudian muncul jendela seperti di
bawah ini.

2. Klik Browser->Carilah data excel yang akan diuji->klik Open->ubah data


menjadi numeric pada Data Preview->Klik Import
3. Aktifkan Rcmdr pada menu Packages dengan cara mencecklist kedua
menu Rcmdr maka akan muncul jendela seperti dibawah ini.

24
4. Pilih data dengan klik Data set->Statistics->Fit Models->Generalized
Linear Models . . . akan muncul jendela seperti di bawah ini

5. Pilih X2 pada Variables(double-click to formula)->isikan X3 pada


Splines/Polynomials->isikan X1 pada kolom sampingnya->klick Formula
plus (+) auto X1+X2 ->pilih binomial pada Family -> pilih logit pada Link
Function -> Klik OK

25
Hasil output :

Output di atas menunjukkan bahwa jenis (lama menjadi) konsumen HBAT


berpengaruh signifikan terhadap kemauan konsumen untuk membangun
hubungan di masa yang akan datang, Hal ini ditunjukkan oleh besarnya p‐
value dari uji Z pada kedua variabel untuk X1 tersebut yang lebih kecil dari
α=0.05. Sedangkan persepsi terhadap kualitas produk tidak berpengaruh
terhadap kemauan untuk membangun hubungan di masa datang. Hal ini
ditunjukkan oleh besarnya p‐value dari uji Z untuk variabel X2 lebih besar
dari α=0.05.

2.8.

26
27
BAB III
PENUTUP
3.1. KESIMPULAN
R programing adalah sebuah bahasa Pemograman dan perangkat
lunak yang menggunakan GUI (grafik user interface). Program R
digunakan untuk menganalisa statistika dan grafik, intinya program
R dibuat untuk memudahkan user dalam mencari atau menentukan nilai-
nilai dari proses statistika. Program ini sangat memudahkan bagi
statistikawan untuk mengasah profesinya.
Aplikasi ini dapat mengolah pengujian statistika, salah
satunyapenerapan Model Linier Tergeneralisir. Untuk penerapan ujinya
dapat dilakukan dengan menggunakan package R-Commander.
3.2.

3.3. SARAN
Menyadari bahwa makalah ini belum sempurna, kedepannya kami
akan lebih fokus dan detail dalam menjelaskan tentang makalah di atas
dengan sumber-sumber yang lebih banyak, yang tentunya dapat di
pertanggungjawabkan.
Diharapkan setelah membaca makalah ini para pembaca dapat
mengetehui perbedaan antara Model Linier dan Model Linier
Tergeneralisir dan kapan kita dapat menerapkanya dalam penyelesaian
suatu penelitian. Dan mengetahui cara mengolah data yang menerapkan
Model Linier Tergeneralisir dengan menggunakan R-Studio.

28
Daftar Pustaka
Suhartono, 2008. Analisis Data Statistik Dengan R. Lab Statistik
Komputasi ITS. Surabaya.
Dobson, A. J. (1990) An Introduction to Generalized Linear
Models. London: Chapman and Hall.
Jamillatuzzahro,Rezzy,Riki (2017) Aplikasi Generalized Linier
Model Pada R

29

Anda mungkin juga menyukai