Anda di halaman 1dari 61

APLIKASI GENERALIZED LINEAR MODEL PADA R

oleh Jamilatuzzahro; Rezzy Eko Caraka; Riki Herliansyah

Hak Cipta © 2018 pada penulis

Ruko Jambusari 7A Yogyakarta 55283


Telp: 0274-889398; 882262 Fax: 0274-889057; E-mail: info@innosain.com
Hak Cipta dilindungi undang-undang. Dilarang memperbanyak atau memindahkan sebagian
atau seluruh isi buku ini dalam bentuk apa pun, secara elektronis maupun mekanis, terma-
suk memfotokopi, merekam, atau dengan teknik perekaman lainnya, tanpa izin tertulis dari
penerbit.

Tajuk Entri Utama: Jamilatuzzahro


APLIKASI GENERALIZED LINEAR MODEL PADA R/Jamilatuzzahro; Rezzy Eko Caraka;
Riki Herliansyah
− Edisi Pertama. Cet. Ke-1. − Yogyakarta: Innosain, 2018
xvi + 94 hlm.; 25 cm

Bibliografi.: 91 - 94
ISBN : 978-602-6542-46-5
E-ISBN : 978-602-6542-47-2

1. Statistik Deskriptif
I. Caraka, Rezzy Eko
II. Herliansyah, Riki III. Judul

519.53

Semua informasi tentang buku ini, silahkan scan QR Code di cover belakang buku ini
BAB 3

KATA PENGANTAR
Jamilatuzzahro

M
aha baik Allah yang memperjalankan skenario hamba-Nya,
memberikan kami kesempatan, kemudahan, dan kemampuan
untuk menyelesaikan buku ini. Semua tergerak atas izin-Nya.
Warisan keilmuan yang hingga kini sampai kepada kita adalah tulisan.
Lewat tulisan karya para ilmuwan terdahulu, ilmu sampai pada kita. Sebut
saja Al Khawarizm lewat penemuan aljabar dan angka nol dan karya
tulisannya kita bisa belajar. Maka, tidak berlebihan ketika kita katakan
kegemaran membaca dan menuangkan hasil bacaan dan pembelajaran
dalam bentuk tulisan dapat membangun sebuah peradaban besar.
Ide menulis buku ini muncul ketika ditawarkan oleh satu penerbit
yang tertarik dengan salah satu jurnal kami yang merupakan
pengembangan dari skripsi saya saat menempuh program sarjana di
Universitas Gadjah Mada. Dengan melakukan penambahan literatur dan
juga berkolaborasi dengan dua penulis lainnya, atas rahmat-Nya hadir
buku yang kami beri judul aplikasi Generalized Linier Model dengan R.
Statistika dikenal sebagai tongkat pembimbing di daerah
ketidaktahuan dan ketidakpastian, karenanya statistika diperlukan dalam
meneropong masa depan (problem solver of the future). Penerapan keilmuan
statistika sangat luas. Model-model statistika digunakan sebagai tools
penelitian di berbagai bidang disiplin ilmu. Baik dalam penyusunan
model, perumusan hipotesa, pengembangan alat atau instrumen
vi Aplikasi Generalized Linear Model Pada R

pengumpulan data, penyusunan desain penelitian, penentuan sampel, dan


analisa data. Dunia pendidikan, psikologi, teknik, kimia, ekonomi, biologi,
ilmu-ilmu kesehatan, bahkan bidang hukum atau kriminalitas.
Perkembangan penerapan ilmu statistika beririsan dengan berbagai
disiplin ilmu lainnya. Dalam prospeknya di masa yang akan datang,
statistika akan menjadi bagian dari ilmu teknologi informasi dalam
mengolah dan menganalisis informasi atau data. Kajian ketergantungan
satu variabel terhadap variabel lain atau biasa disebut sebagai hubungan
sebab akibat dalam pemodelan statistika umumnya diselesaikan dengan
regresi, adanya batasan asumsi distribusi normal pada variabel respon
pada model regresi seringkali tidak mampu menjelaskan fenomena terkait.
Generalized Linier Model merupakan perluasan dari model regresi dengan
penggunaannya lebih luas, yaitu distribusi variabel respon/ dependent
tidak hanya distribusi normal namun distribusi-distribusi yang masuk
kedalam exponential family. Hubungan tidak linier antar variabel dapat
dijelaskan dengan metode Generalized Additive Models, sedangkan
pemodelan yang lebih kompleks, yaitu adanya pengaruh variabel laten
pada model dijelaskan dengan metode Generalized linier latent variable
model. Selain bahasan teoretis, buku ini menyajikan aplikasi yang sangat
mudah dipahami dengan simulasi Program R.
Ucapan terima kasih specially penulis sampaikan untuk dua orang
kawan baik saya yang tergabung dalam penulisan buku ini Rezzy Eko
Caraka dan Riki Herliansyah, berteman dengan mereka memaksa saya
untuk lekas mengakselerasi diri belajar statistika. Semoga karya sederhana
kami ini bisa memberikan manfaat. Kami menyadari masih terdapat
kekurangan dalam karya sederhana ini, untuk itu kritik dan saran terhadap
penyempurnaan buku ini sangat diharapkan.
Bandung, 13 Desember 2017
Jamilatuzzahro, S.Si
Aktuaria Institut Teknologi Bandung
BAB 3

KATA PENGANTAR
Rezzy Eko Caraka

P
uji syukur kepada Allah SWT kami panjatkan, berkat rahmat dan
karunia-Nya penulis dapat menyelesaikan buku ini. Tak lupa
semoga shalawat serta salam senantiasa tercurah kepada
jungjungan kita Nabi Muhammad SAW, kepada keluarganya, sahabatnya,
para tabi'in, tabiut tabiahum, kepada kita semua, serta kepada seluruh
umatnya hingga akhir zaman yang menjadikan sebagai uswatun hasanah,
suri tauladan yang baik.
Buku ini merupakan karya saya dengan 2 sahabat saya, Mbak
Jamilatuzzahro dan Bang Riki Herliansyah. Mereka berdua sosok yang
hangat mengayom dan membimbing saya dengan baik. Mbak
Jamilatuzzahro menamatkan program magister aktuaria di Institut
Teknologi Bandung (ITB) dan Bang Riki Herliansyah program magister
statistika di University of New South Wales (UNSW) sebuah kebanggaan
bagi saya untuk mengenal mereka berdua. Dengan kata pengantar ini saya
mengucapkan terima kasih kepada kedua orang tua saya Fauziani dan
Rozali juga adik Bungsu Roffi Dwi Putra. Kepada supervisor saya
Dr.Sakhinah Abu Bakar School of Mathematical Sciences The National
University of Malaysia, Bapak Dr. Toni Toharuddin, Dr.Irlandia Ginanjar,
Ibu Anindya Apriliyanti , Bapak Gumgum Darmawan dan semua keluarga
besar Departemen Statistika Universitas Padjadjaran, Keluarga Persatuan
viii Aplikasi Generalized Linear Model Pada R

Pelajar Indonesia se-Malaysia (PPI-M) dan juga kepada semua sahabat-


sahabat saya.
Hadirnya buku ini semoga menjadi angin segar khususnya pada
bidang statistika di Indonesia. Buku ini merupakan kompilasi dari catatan
kuliah kami ber-3 yang kami susun ulang agar mudah dipahami dan
dimengerti. Kami juga menyediakan panduan untuk menganalisis dan
interpretasi. Oleh karena itu penulis terus membuka diri untuk menerima saran
dan kritikan untuk perbaikan buku ini. Semua korespondensi dapat dilakukan
dengan email rezzyekocaraka@gmail.com Untuk efisiensi pembaca, Semua script
syntax program, data yang digunakan dapat diunduh pada website
www.rezzyekocaraka.com dengan kata kunci (password)
“kontribusiuntuknegeri“.
Kuala Lumpur, 27 December 2017

Rezzy Eko Caraka


Dosen Departemen Statistika
Universitas Padjadjaran
BAB 3

KATA PENGANTAR
Riki Herliansyah

P
uji syukur kita panjatkan atas kehadit Allah yang maha kuasa yang
berkat rahmat dan karunia yang dilimpahkan kami dapat
menyelesaikan buku yang berjudul “Aplikasi Generalized Linear
Model pada R”. kami sadari bahwa buku ini masih jauh dari bentuk
sempurna untuk digunakan oleh berbagai kalangan. Buku ini merupakan
karya pertama dari saya sebagai seseorang yang baru bergelut di dunia
Pendidikan. Tujuan dari penyusunan buku ini adalah untuk memberikan
penjelasan secara singkat tentang bagaimana melakukan pemodelan
regresi yang distribusi dari variable responnya tidak terikat pada distribusi
tertentu. Pada bagian awal dari buku ini juga diberikan pengenalan secara
singkat program R dan R studio yang direkomendasikan oleh penulis.
Selain diberikan penjelasan mengenai teori singkat dari GLM, proses
estimasi dan pengujian koefisien model regresi, contoh simulasi beberapa
distribusi juga diberikan dan bagaimana menyusun algoritmanya di R.
Aplikasi dari GLM pada data nyata juga tidak lupa diberikan sebagai
pembelajaran.
Terlepas dari GLM, buku ini juga menambahkan sedikit materi
tentang perluasan dari model GLM yaitu seperti Generalized Linear Mixed
Model yaitu model GLM dengan efek acak, Generalized Aditive Model dan
Generalized Linear Latent Variable Models. GLLVM merupakan sebuah
model statistika yang kompleks yang umum digunakan untuk
memodelkan kekayaan spesies di ekologi.
x Aplikasi Generalized Linear Model Pada R

Pada kesempatan ini juga, kami akan memperkenalkan model ini dan
package yang dapat digunakan. Package ini disusun oleh saya pribadi dan
beberapa tim dari UNSW, ANU, Australia dan beberapa peniliti di
universitas Finlandia. Nama package dari model ini adalah gllvm yang
dapat diunduh di CRAN R yang disusun oleh Niku dkk (2017).
Sebelum saya menutup kata pengantar ini, saya berharap buku ini
dapat menjadi sarana belajar bagi siapapun yang tertarik mengenai
pemodelan regresi. Tentu kritik dan saran yang membangun sangat kami
harapkan dari pembaca sekalian untuk bekal kami di kemudian hari untuk
menciptakan karya-karya lain yang bermanfaat. Sekian dari saya semoga
buku ini memberi manfaat dan selamat belajar.
Wassalam

Balikpapan, 17 Desember 2017

Riki Herliansyah, S.Si., M.Stats.


Dosen Prodi Matematika ITK
BAB 3

DAFTAR ISI

KATA PENGANTAR v
DAFTAR ISI xi
DAFTAR GAMBAR xiii
DAFTAR TABEL xv
PENDAHULUAN 1
BAB 1 GENERALIZED LINIEAR MODEL 13
1.1 Sejarah dari GLMs (LM, GLM, GLMs) 15
1.2 Komponen GLMs 20
1.3 Exponential Family (Distribusi Keluarga Eksponensial) 21
1.4 Model Generalized Linier Model 30
1.5 Fungsi Link 31
1.6 Estimasi Generalized Linier Models 31
1.7 Kriteria Pemilihan Model Terbaik 32
1.8 Uji Analisis Generalized Linier Models 33
1.9 Langkah – Langkah Generalized Linier Model 35
BAB 2 GENERALIZED ADDITIVE MODELS (GAM) 39
2.1 Additive Model 40
2.2 Smoothing Spline 40
2.3 Pemilihan Parameter Penghalus 42
BAB 3 GENERALIZED ADDITIVE MIXED MODELS (GAMM) 45
xii Aplikasi Generalized Linear Model Pada R

3.1 Pengantar Generalized Additive Mixed Models 45


3.2 Estimasi Parameter Generalized Additive Mixed Models 46
3.3 Inferensi dalam Generalized Additive Mixed Models 49
3.4 Prediksi Berdasar Generalized Additive Mixed Models
(poison) 50
3.5 Asumsi Generalized Additive Mixed Models (GAMM) 53
3.5.1 Uji Linieritas 53
3.5.2 Indentifikasi Variabel Respon 55
3.6 Analisis Generalized Additive Mixed Models 56
3.6.1 Generalized Additive Mixed Models I 57
3.6.2 Generalized Additive Mixed Models II 58
BAB 4 GENERALIZED LINIEAR MODEL (GLMS) KASUS
UNTUK RESPON BINER 67
4.1 GLMs untuk Respon Biner 67
4.2 Estimasi Parameter 72
4.3 Kasus khusus: Overdispersi 75
4.4 Contoh dan Aplikasi dengan syntax R 76
BAB 5 GENERALIZED LINIEAR LATENT VARIABLE
MODELS (GLLVM) 81
DAFTAR PUSTAKA 91

-oo0oo-
BAB 3

DAFTAR GAMBAR

Gambar 1.1 Analaisis GLM 35


Gambar 2.1 Ilustrasipenghalus spline 41
Gambar 3.1 Uji linieritas Loyalitas dengan Pelayanan 54
Gambar 3.2 Uji linieritas Lotalitas dengan Produk 54
Gambar 3.3 Uji linieritas 55
Gambar 3.4 Histogram variabel respon 56
Gambar 3.5 Distribusi Variabel Response 61
Gambar 3.6 Uji Linieritas Semua Variabel 62
Gambar 3.7 Variabel Setelah dilakukan Smoothing 63

-oo0oo-
xiv Aplikasi Generalized Linear Model Pada R
BAB 3

DAFTAR TABEL

Tabel 0.1 Operasi Matriks 11


Tabel 0.2 Fungsi kepadata peluang (d_), fungsi distribusi kumulatif (p_),
fungsi kuantil (q_) dan fungsi pembangkit acak (r_) 11
Tabel 0.3 Beberapa fungsi umum tanpa menggunakan packages 12
Tabel 1.1 Summary dari LM/GLM dengan GLMs 19
Tabel 1.2. Beberapa link function dalam GLMs (*canonical), semua
parameter dalam lambang ࣆ 29
Tabel 1.3 Fungsi hubung kanonik 31
Tabel 3.1 Hasil estimate parameter GAMM 1 57
Tabel 3.2 Hasil estimate parameter GAMM 2 58
Tabel 3.3 Pemilihan model terbaik GAMM 59
Tabel 3.4 Uji Interfensi Variabel 64
Tabel 4.1 Representasi data pada respon biner 68
Tabel 4.2 Dengkuran dan Penyakit Jantung 77
Tabel 4.3 Estimasi peluang untuk masing-masing kategori x 79

-oo0oo-
xiv Aplikasi Generalized Linear Model Pada R
PENDAHULUAN

R
adalah salah satu aplikasi statistika yang tersedia secara gratis
yang dikembangkan oleh Ross Ihaka dan Robert Gentleman
berdasarkan Bahasa S yaitu sebuah Bahasa komputasi untuk
analisis data dan grafik pada tahun 1990an. Pengembangan dan
pendistribusian R adalah merupakan tugas dari the R Development Core
Team yang dikelompoki oleh beberapa ahli statistika.
Untuk menginstall R di komputer kita, aplikasi tersebut telah tersedia
dan dapat diperoleh di halaman web the Comprehensive R Archive Network
(CRAN):http://cran.r-project.org/dengan beberapa versi yang tersedia
untuk Windows, Linux, dan Mac. R memiliki banyak manfaat untuk
analisis statistik dan grafik yang outputnya tersedia dalam berbagai format
seperti jpg, png, bmp, ps, pdf, emf, pictex, xfig. Hasil analisis ditampilkan
langsung dilayar seperti P-values, koefiesien regresi, residual, standar erorr
dan sebagainya. R menyediakan berbagai macam fitur untuk analisis
statistik dari yang sederhana untuk statistika deskriptif seperti membuat
grafik dan diagram, mencari rata-rata dan varians dana analisis regresi
sederhana hingga analisis statistic yang kompleks untuk statistika inferensi
seperti analisis runtun waktu, generalized linear model (GLM), generalized
linear mixed model (GLMM) dan beberapa analisis statistic lainnya.
Berikut adalah langkah-langkah menginstall R untuk pengguna yang baru
pertama kali menggunakan R.
2 Aplikasi Generalized Linear Model Pada R

 Masukkan halaman web yang disebutkan sebelumnya di halaman


pencari
 Pilih versi R yang diinginkan sesuai dengan system operasi di
computer kita misalkan windows.
 Pilih base dan kemudian klik Download R 3.4.2 for Windows
 Setelah selesai dan melakukan penginstallan, pilih jawaban default
untuk semua pertanyaan.
Setelah berhasil melakukan penginstallan, di layar computer anda
akan muncul sebuah aplikasi baru yang bernama “R”. Dengan menekan
ikon R, anda akan memasuki tampilan standar dan R telah siap untuk
digunakan. Namun penulis merekomendasikan untuk menggunakan
RStudio Karena tampilan yang lebih mudah dan nyaman untuk
digunakan. RStudio merupakan sebuah aplikasi pengembangan dari R dan
terintegrasi di dalamnya. Beberapa manfaatnya antara lain adalah RStudio
memiliki tools pengkodean yang dirancang untuk meningkatkan
produktivitas penggunanya, memudahkan navigasi ke file dan fungsi-
fungsi dengan cepat, mendukung untuk penulisan berformat HTML, PDF,
Word Documents dan slide shows dan RStudio juga mendukung grafik
yang menarik dan interaktif.
Berikut adalah langkah-langkah untuk menginstal RStudio pada
computer anda.
 Masukkan halaman web berikut ini: http://www.rstudio.org/
 Klik Download RStudio
 Klik Download RStudio Dekstop
 Pilih Installers for Supported Platforms
 Kemudian pilih jenis installer sesuai dengan system operasi dari
computer anda misalkan Windows
 Lakukan penginstalan dan pilih jawaban default untuk semua
pertanyaan.
Tampilan RStudio terdiri dari beberapa jendela yaitu:
1. Jendela Console yang terletak pada bagian sebelah kiri bawah yang
disebut juga sebagai jendela Command. Pada jendela ini, kita dapat
Pendahuluan 3

menulisk kan perintah setelah tand da “->” dan R akan men ngeksekusi
perintah tersebut.
2. Jendela EEditor juga diisebut jendelaa Script. Perin
ntah yang kitta tuliskan
pada jend dela Console pada dasarny ya tidak dapaat simpan, seh hingga kita
harus meenuliskan kem mbali setiap kali
k kita mem mbuka R. Jend dela Script
memung gkinkan kita untuk
u menyiimpan dan m mengedit perintah yang
kita tuliiskan. Agar perintah yan ng kita tuliss pada jend dela Script
dieksekuusi oleh R, kitta perlu memmberikan perin ntah RUN deengan cara
menekan n tombol RUNN atau dengan n CTRL+ENTE ER untuk mengirimkan
perintah tersebut ke jeendela Comm mand.
3. Jendela Environmentt/ History yang y terletak pada bagiaan sebelah
kanan attas. Pada jen ndela ini terssedia pilihann Import Dattaset yang
memberiikan kita pilih han untuk meengimport daata secara lang gsung dari
berbagai jenis file diiantara lain CSV, Excel, SPSS, SAS dan d Stata.
Jendela history men nunjukkan pekerjaan yan ng telah kitta ketikan
sebelumn nya.
4. Jendela yyang keempatt adalah files// plots/ packaages/ help. Paada jendela
ini kita d
dapat membu uka file, melihat grafik, mmenginstal dan n memuat
package aatau menggu unakan fung gsi help untu uk mencari penjelasan
p
mengenaai syntax atau fungsi tertenntu.
4 Aplikasi Generalized Linear Model Pada R

Seperti yang telah disebutkan sebelumnya bahwa R dapat melakukan


banyak pekerjaan mengenai analisis data dan statistic. Analisis-analisis
tersebut tergabung dalam sebuah algoritma yang disebut packages atau
libraries. Beberapa package yang umum telah terinstal bersaamaan pada saat
menginstal R sebelumnya. Beberapa analisis membutuhkan packages
tertentu sehingga analisis tersebut dapat dieksekusi. Misalkan untuk
menguji asumsi multivariat normal dari sebuah data, kita memerlukan
package “mvnormtest”. Untuk melihat daftar packages yang tersedia dalam
program R kita, ketikan perintah berikut pada jendela Console.
> library()

Pada layar computer anda akan muncul daftar packages yang telah
terinstal. Pada dasarnya, sudah ada cukup banyak packages yang terinstal
dan dapat langsung digunakan. Sedangkan, jika kita ingin menginstal
packages baru yang belum tersedia dalam daftar, pada jendela keempat
pilih menu packages kemudian klik instal. Selanjutnya, kita memasukkan
nama package yang ingin diinstal dengan mengetikan nama package tersebut
pada kolom yang tersedia atau dapat dilakukan secara langsung pada
jendela Console sebagai berikut:
> install.packages(“mvnormtest”)

Untuk menggunakan packages yang telah disintal maka kita perlu memuat
package tersebut terlebih dahulu.
> library(mvnormtest)

Berikut diberikan beberapa contoh sederhana untuk membuat


perintah di R.
1. Input Data
Ada beberapa jenis data yang bisa diinput di R diantaranya adalah
vector, matriks, data frame dan beberapa jenis lainnya. Dalam
pengantar ini, akan diberikan contoh untuk menginput ketiga jenis
data ini pada jendela Console. Untuk menginput data dengan jenis
vector, perhatikan contoh perintah berikut ini:
> vektor = c(1, 7, 1, 2, 9, 2)
> vektor
[1] 1 7 1 2 9 2
Pendahuluan 5

> vektor[1]
[1] 1
> vektor2 = rep(1,6)
> vektor2
[1] 1 1 1 1 1 1
> vektor3 = seq(from=1, to=6, by=1)

Pada baris 1, kita menuliskan sebuah variable yang bernama vektor


yang kemudian elemennya diketikan dengan menggunakan fungsi c().
Untuk memanggil elemen dari vector tersebut, R menggunakan [i]
yang menunjukkan indeks elemen ke i. Kita juga dapat membuat
vector dengan menggunakan perintah rep() seperti ditunjukkan pada
baris 4 yang berarti kita membuat replikasi angka 1 sebanyak 6 kali.
Dan terakhir kita juga bisa menggunakan fungsi seq() seperti
ditunjukkan pada baris berikutnya.
Selanjutnya akan ditunjukkan bagaimana menginput sebuah data
dengan jenis matriks.
>matriks = matrix(data=c(1, 7, 1, 2, 9, 2), ncol =3)
>matriks
[,1] [,2] [,3]
[1,] 1 1 9
[2,] 7 2 2
>matriks = matrix(data=c(1, 7, 1, 2, 9, 2), nrow =3)
>matriks
[,1] [,2]
[1,] 1 2
[2,] 7 9
[3,] 1 2

Untuk menginput matriks di R, kita menggunakan fungsi


matrix() yang kemudian dilanjutkan dengan mengetikan data yang
ingin diinput dan memasukkan jumlah baris atau kolom matrik yang
diinginkan seperti contoh diatas. Jenis data berikutnya adalah data
frames. Data frames merupakan sebuah matriks dimana kita dapat
menuliskan nama variable untuk setiap kolom data yang diinput.
Misalkan kita memiliki sebuah data sebagai berikut:

A B C
10 0.6 23
17 1.7 41
12 1.2 10
7 0.9 15
6 Aplikasi Generalized Linear Model Pada R

Untuk menginput data tersebut perhatikan contoh perintah


berikut:
>contoh = data.frame(A=c(10,17,12,7), B=c(0.6,1.7,1.2,0.9),
C=c(23,41,10,15))
>contoh
A B C
1 10 0.6 23
2 17 1.7 41
3 12 1.2 10
4 7 0.9 15
>sum(contoh)
[1] 139.4
>mean(contoh$A)
[1] 11.5

Jenis data ini diinput dengan menggunakan fungsi data.frame().


Untuk memanggil variable tertentu misal A, kita menggunakan tanda
“$” seperti ditunjukkan pada baris terakhir atau kita bisa
menggunakan fungsi attach() untuk memungkinkan memanggil
variable tersebut secara langsung.
>attach(contoh)
>A
[1] 10 17 12 7

Tidak seperti aplikasi statistika lain pada umumnya, kita tidak


dapat menyalin sebuah data secara langsung ke R dengan
menggunakan perintah copy dan paste. Namun, RStudio memberikan
kemudahan kepada para penggunanya dengan menyediakan fitur
“import data” dari berbagai format. Sehingga tidak perlu mengubah
jenis data seperti R biasa dimana biasanya data diubah ke format .csv
dan .txt.
Pendahuluan 7

2. Grafik
Membuaat grafik meru upakan salah h bagian penting dari sebu
uah proses
analisis d
data dan stattistic. Grafik biasanya
b dibu
uat untuk meemberikan
deskripsii awal meng genai data kitta. Dalam beeberapa analisis seperti
runtun wwaktu, grafik merupakan langkah
l pentiing dalam meenentukan
model p peramalan. Pada
P contoh dibawah inii, kita ingin membuat
sebuah g grafik dari va
ariable x dimmana variable ini merupakan sebuah
data yaang dibangk kitkan meng ggunakan ffungsi rnorm m() yang
merupak kan fungsi distribusi
d no
ormal baku. Fungsi plott() adalah
perintah yang diguna akan untuk menggambark
m kan grafik suaatu fungsi.
Kita bisaa memodifika asi grafik deengan mengu ubah pengatu uran yang
terdapat dalam fungsii plot.
>x = rnorrm(17)
>plot(x)
8 Aplikasi Generalized Linear Model Pada R

Dengan mengubah sedikit pengaturan pada fungsi tersebut, kita


peroleh gambar seperti yang ditunjukkan dibawah ini. Untuk meilhat
pilihan apa saja yang bisa dimodifikasi pada fungsi plot, kita cukup
mengetikan perintah help(plot). Contoh berikutnya adalah bagaimana
membuat histogram pada jendela Console.
>plot(x, type = "l", lty = 2, xlab = "Indeks", ylab = "Nilai X", col =
"red")
Pendahuluan 9

>hist(x)

3. Pemprograman
R juga memungkinkan pengunanya untuk menulis sendiri fungsi
tertentu seperti di Matlab. Dalam membuat fungsi, kita dapat
menggunakan penyataan if dan perulangan (for) ke dalam fungsi kita.
Pernyataan if digunakan ketika sebuah fungsi hanya akan berjalan jika
kondisi tertentu terpenuhi. Misalnya pada contoh berikut, sebuah
kondisi diberikan yaitu 60. Fungsi ini mengerjakan perintah
selanjutnya jika kondisi ini terpenuhi.
> X = 56
> if (X < 60) {
Kode = “Tidak Lulus”
} else {
Kode = “Lulus”
}
> Kode
[1] "Tidak Lulus"

Selanjutnya adalah akan diberikan contoh bagaimana melakukan


perulangan di R. Untuk melakukan perulangan di R, kita
menggunakan fungsi for (). Sebelum kita menuliskan fungsi kita,
perhatikan bahwa jika variable yang akan dihitung berupa vector atau
matriks maka terlebih dahulu harus didefinisikan variable yang akan
10 Aplikasi Generalized Linear Model Pada R

dihitung, misal pada contoh kita ingin menghitung ,


dimana i = 1,2, ..., 10 sehingga kita membuat sebuah vector 0 sebanyak
10 sebagai nilai inisial dari vector nilai. Variabel ini kemudian nantinya
akan diisi dengan nilai baru sesuai dengan formula yang kita input
pada fungsi perulangan.
h = seq(1, 10, 1)
>nilai = rep(0,10)
>for(i in 1:10){
nilai[i]=h[i]+i
}
>nilai
[1] 2 4 6 8 10 12 14 16 18 20

Berikut adalah contoh bagaimana kita membuat sebuah fungsi di


R. Kita memulai dengan memberi nama fungsi yang akan dibuat misal
latihan. Kemudian, kita memasukkan data yang akan diinput nantinya,
pada contoh ini kita memasukkan sebagai variable yang harus
diinput. Kemudian kita menuliskan algoritma pada baris berikutnya
sesuai dengan apa yang akan dihitung atau dikerjakan. Untuk
memanggil hasil perhitungan, pada akhir fungsi sebelum tanda “}”
terakhir, kita menuliskan kembali nama variable yang dihitung. Untuk
memanggil fungsi yang telah dibuat, kita cukup menuliskan nama
fungsi tersebut dan memasukan variable input yang diinginkan seperti
ditunjukkan pada contoh dibawah.
>latihan = function(x){
+ jumlah = 0
+ if (x > 5) {
+ for (i in 1:x){
+ jumlah = jumlah + i
+ }
+ }else{
+ jumlah = jumlah - i
+ }
+ jumlah
+ }
>latihan(7)
[1] 28
>latihan(3)
[1] -10

Berikut ini diberikan beberapa contoh fungsi dan perintah dasar


untuk pemula sebagai langkah awal dalam memulai R. Fungsi-fungsi
Pendahuluan 11

berikut ini dapat dilihat penjelasannya secara detail dengang mengetikan


nama fungsi tersebut pada jendela help di kolom pencarian bukan find.

Tabel 0.1. Operasi Matriks

Perintah/Tanda Pengertian
matrix() untuk membuat sebuah matriks
c() untuk membuat sebuah vektor
diag() untuk membuat matriks identitas atau nilai diagonal
matriks
+ penjumlahan matriks
- Pengurangan
* Perkalian skalar antar matriks
%*% perkalian matriks
solve() invers matriks
det() determinan matriks
t() transpose matriks
cbind() menggabung dua atau lebih matriks atau vektor kolom
rbind() menggabung dua atau lebih matriks atau vektor baris

Tabel 0.2. Fungsi kepadata peluang (d_), fungsi distribusi kumulatif (p_), fungsi
kuantil (q_) dan fungsi pembangkit acak (r_)

Distribusi Perintah Distribusi Perintah


Normal dnorm() Log Normal dlnorm()
pnorm() plnorm()
qnorm() qlnorm()
rnorm() rlnorm()
Binomial dbinom() Logistik dlogis()
pbinom() plogis()
qbinom() qlogis()
rbinom() rlogis()
Poisson dpois() Negative Binomial dnbinom()
ppois() pnbinom()
qpois() qnbinom()
rpois() rnbinom()
12 Aplikasi Generalized Linear Model Pada R

Distribusi Perintah Distribusi Perintah


Gamma dgamma() Log Normal dlnorm()
pgamma() plnorm()
qgamma() qlnorm()
rgamma() rlnorm()

Tabel 0.3. Beberapa fungsi umum tanpa menggunakan packages

Perintah Pengertian
plot() untuk membuat grafik
hist() untuk membuat histogram
barplot() untuk membuat diagram batang
piechart() untuk membuat diagram lingkaran
mean() untuk mencari rata-rata
sd() untuk mencari standar deviasi
cor() untuk mencari korelasi
summary() untuk memberikan statistika deskriptif
cor.test() untuk analisis korelasi
lm() digunakan untuk membuat model linier (regresi)
glm() digunakan untuk membuat model generalized linear model
(glm)
shapiro.test() untuk menguji asumi normalitas
chisq.test() untuk menguji tabel kontingensi menggunak uji Chi-Square
t.test() uji T untuk satu dan dua sampel
anova() uji anava
arima() untuk pemodelan runtuk waktu

-oo0oo-
Bab 1

GENERALIZED LINIEAR MODEL

P
ada umumnya pemodelan statistika bersifat abstrak yang
merupakan konsep sederhana dari sebuah teori yang lumrahnya
digunakan pada rumpun sains, teknologi penelitian tentang
hubungan diantara fenomena-fenomena real merupakan dasar dari tujuan
sains dan memainkan peranan penting dalam kehidupan sehari-hari. Saat
ini analisis regresi merupakan alat yang populer untuk mengetahui
hubungan tersebut. Analisis regresi adalah salah satu metode untuk
menentukan hubungan sebab-akibat antara satu variabel dengan variabel
yang lain. Variabel penyebab disebut dengan variabel independen, variabel
penjelas atau variabel X. Sementara variabel yang terkena akibat dikenal
sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat,
variabel respon atau variabel Y. Pendugaan kurva regresi digunakan untuk
menjelaskan hubungan antara peubah penjelas dengan peubah respon.
Pendekatan pendugaan yang paling sering digunakan adalah pendekatan
parametrik. Asumsi yang mendasari pendekatan ini adalah kurva regresi
dapat diwakili oleh suatu model parametrik (Hardle, 1990). Dalam regresi
parametrik, diasumsikan bahwa bentuk kurva regresi diketahui
berdasarkan teori, informasi sebelumnya, atau sumber- sumber lain yang
dapat memberi pengetahuan secara terperinci.
Apabila model dari pendekatan parametrik diasumsikan benar,
maka pendugaan parametrik akan sangat efisien. Tetapi jika salah, maka
14 Aplikasi Generalized Linear Model Pada R

akan menyebabkan interpretasi data yang menyesatkan. Selain itu, model


parametrik mempunyai keterbatasan untuk menduga pola data yang tidak
diharapkan. Jika asumsi bentuk kurva parametrik ini tidak terpenuhi,
maka kurva regresi dapat diduga menggunakan model regresi dari
pendekatan nonparametrik. Pendekatan nonparametrik merupakan
metode pendugaan model yang dilakukan berdasarkan pendekatan
yang tidak terikat asumsi bentuk kurva regresi tertentu.
Analisis regresi klasik mempunyai syarat pemenuhan asumsi
linieritas dan asumsi data berdistribusi normal. Analisis ini bertujuan
untuk mengetahui arah hubungan antara variabel independen dengan
variabel dependen apakah positif atau negatif sekaligus untuk
memprediksi nilai dari variabel dependen apabila nilai variabel
independen mengalami kenaikan atau penurunan. Data yang digunakan
biasanya berskala interval atau rasio. Jika jumlah variabel independen
lebih dari satu, maka digunakan analisis regresi linier berganda.
Dalam praktek di lapangan, data yang ditemukan seringkali tidak
memenuhi asumsi yang diisyaratkan regresi linier klasik. Generalized linier
model (GLM) merupakan perluasan dari model regresi linier dengan asumsi
prediktor memiliki efek linier akan tetapi tidak mengasumsikan distribusi
tertentu dari variabel respon dan digunakan ketika variabel respon
merupakan anggota dari keluarga eksponensial (Nelder dan Weddeburn,
1972).
Generalized Linier Models (GLM) bertujuan untuk mengetahui
hubungan sebab-akibat, pengaruh dari variable independent terhadap
variable dependent. Keunggulan GLM dibandingkan dengan regresi linier
biasa terletak pada distribusi (bentuk kurva) varaibel dependent. Variable
dependent pada GLM tidak diisyarakatkan berditribusi normal (kurva
lonceng simetris), akan tetapi distribusi-distribusi yang termasuk keluarga
eksponensial, yaitu; Binomial, Poisson, Binomial Negative, Normal,
Gamma, Invers Gaussian.
Penelitian-penelitian generalized linier model telah banyak dilakukan
oleh para statistikawan, pengembangan teoritisnya generalized linier
Generalized Linear Model 15

mixed models, generalized additive model, generalized additive mixed


model.
Di bidang kedokteran seringkali menggunakan analisis regresi linier
sederhana dan ganda untuk penelitian. Analisis yang berfungsi untuk
mengetahui hubungan sebab akibat, misalkan untuk mengetahui pengaruh
umur dan kebersihan mulut terhadap karies gigi.

Ekonometrik merupakan bidang ekonomi yang mempelajari


penerapan statistika matematika dan analisis statistika inferensia
terhadap pengukuran empiris berdasarkan teori-teori ekonomi
(Greene, 2008). Metodologi yang menggabungkan statistika mate-
matika dan teori ekonomi menghasilkan apa yangdisebut dengan
model ekonometrik. Dalam aplikasinya, memprediksi inflasi yang
disebabkan oleh faktor-faktor yang mempengaruhinya, memprediksi
indeks harga saham, memprediksi surat hutang sukuk dan obligasi.

1.1 Sejarah dari GLMs (LM, GLM, GLMs)


Model linear klasik awalnya lebih banyak digunakan dalam bidang
matematika atau yang lebih dikenal dengan persamaan garis lurus. Pada
awal abad ke 18, model linear klasik banyak dipakai dalam bidang
statistika terutama untuk memodelkan masalah astronomi. Menggunakan
model linear, Gauss (1801) telah dapat memprediksi posisi kemunculan
asteroid Ceres. Hal tersebut merupakan titik awal dari karir Gauss, hingga
tahun 1809, Gauss menemukan distribusi Normal.
Model linear klasik yang paling sederhana didefinisikan pada
persamaan (1).
= ( , , )
= + + (1)
dengan y adalah variable dependen yang nilainya tergantung oleh variable
independen x. adalah parameter model yang belum diketahui,
sedangkan merupakan variabel random selisih nilai aktual y dengan nilai
16 Aplikasi Generalized Linear Model Pada R

taksirannya. Variabel random disumsikan mengikuti distribusi


Normal(0, ).
Estimasi parameter model linear klasik sebenarnya pernah
disinggung oleh Gauss tahun 1795 yang merupakan cikal bakal metode
least square. Tahun 1805 sebelum Gauss menemukan distribusi Normal,
Legendre juga mengemukakan pendekatan dengan meminimumkan .
Gauss dan Legendre mengembangkan model linear dan metode least square
yang lebih dikenal dengan Regresi Linear.
Tahun 1877, Galton ikut menyumbangkan idenya mengenai nilai
slope model linear sederhana yang diberi nama co-relation (saat ini dikenal
dengan correlation/ korelasi). Nilai ini akan menjadi koefisien determinasi
jika jumlah variabel independen/ prediktor lebih dari satu.
Perkembangan model linear sangat pesat setelah ditemukannya
distribusi Normal, hingga awal abad ke 19, R. A. Fisher mempublikasikan
penelitiannya dalam bidang agrikultur yang menggunakan Desain
Eksperimen. Bentuk “lain” model linear dikemukakan oleh Fisher dkk
mendapat perhatian dari seluruh kalangan. Asumsi Normalitas juga
digunakan dalam model tersebut.
Rao (1973), mengemukakan mengenai General Linear Model (GLM).
GLM sederhana merupakan pengembangan dari model linear klasik (LM)
dengan banyak predictor atau yang disebut Regresi Linear Multiple.
Metode least square oleh Gauss tetap dijadikan dasar dalam estimasi
parameter model. Asumsi pada LM juga masih tetap terbawa pada GLM,
yaitu mengikuti distribusi Normal(0, ). Dalam lanjutan penjelasannya,
Rao (1973) menyatakan bahwa predictor tidak harus kontinu. Prediktor
yang bersifat kategori juga mendasari penelitian Fisher pada Desain
Eksperimen.
Beberapa penjelasan lain mengenai GLM yang merupakan
perkembangan dari LM, diberikan oleh Carey (1998). Carey memaparkan
bahwa GLM merupakan LM dengan banyak respon. Jika respon y lebih
dari satu dan dapat dibuat persamaan linear dengan menyatakan respon
kedalam matriks Y, maka modelnya adalah GLM. Lebih lanjut, Carey
Generalized Linear Model 17

mengemukakan bahwa dalam GLM, memungkinkan adanya kombinasi


linear dalam prediktornya.
Dibawah naungan asumsi distribusi Normal, model linear dapat
dituliskan secara umum atau general. International Encyclopedia of
Statistical Science (2011) mendefinisikan GLM seperti pada persamaan (2).
= + + (2)
dimana adalah random matriks ukuran . adalah matriks .
, , , dan masing-masing merupakan matriks berukuran ,
, dan . B adalah matriks dari parameter yang tidak
diketahui. merupakan random matriks . Dan adalah matriks
dari random error yang berdistribusi Normal (0, ).
Model pada persamaan (2) merupakan GLM yang menaungi
berbagai model-model linear, baik itu regresi linear (sederhana atau
multiple), Mutivariate regression, Analysis of Variance (ANOVA), Multivariate
Analysis of Variance (MANOVA), linear mixed model, Analysis of Covariance
(ANCOVA), Multivariate Analysis of Covariance (MANCOVA), Response
Surface, Growth Curve Model, dll. Teknik estimasi parameter juga ikut
berkembang. Selain least square, estimasi parameter dapat diperoleh
dengan metode maksimum likelihood, shrinkage estimation, stein-rule
estimation hingga dengan pendekatan bayes/ bayessian estimation.
Namun lebih daripada itu, secara teknis, model GLM mampu
menyelesaikan masalah dalam LM yang tidak mampu diakomodasi oleh
Metode Least Square. Misalkan dalam one way ANOVA, jika pengamatan
dalam masing-masing faktor tidak seimbang dan dibiarkan apa adanya
tanpa didekati dengan rata-rata, maka LM tidak mampu mengeluarkan
model. Hal ini dikarenakan least square tidak mampu mengestimasi
parameter.
Lebih lanjut, Carey (1998) mengemukakan bahwa dalam metode least
square, mengharuskan matriks ( ) yang non singular, jika ( ) singular,
maka nilai dari parameternya tidak dapat diberikan. Hal ini disebabkan
karena nilai invers dari ( ) tidak ada. Karena LM menggunakan least
square, maka jika terdapat kasus dimana matriks ( ) nya singular, maka
18 Aplikasi Generalized Linear Model Pada R

LM tidak mampu menghasilkan model. Namun GLM dapat mengatasinya,


karena GLM menggunakan Generalized invers untuk menyelesaikan
normal equation tersebut.
Seiring dengan perkembangan LM dan GLM yang mengedepankan
asumsi normalitas, pemodelan linear yang melanggar asumsi normalitas
juga bermunculan. Bliss (1935) mengemukakan pemodelan dengan analisis
probit yang dibingkai oleh kasus bidang toxicology. Tahun 1952, Dyke dan
Patterson mempublikasikan analisis dari cross-classified data survey yang
berkonsentrasi pada proporsi responden yang memiliki pengetahuan
mengenai kanker. Analisis ini menggunakan logit model untuk proporsi.
Log linear muncul kemudian dengan aplikasi pada data counting yang
melibatkan distribusi Poisson. Invers Polinomial, diperkenalkan pula oleh
Nelder (1966) yang digunakan dalam bidang Biologi.
Berbagai perkembangan model tersebut, Nelder dan Wedderburn
(1972) akhirnya mencetuskan ide mengenai Generalized Linear Model
(GLMs). Yang mengemukakan bahwa linearitas dapat ditampilkan dalam
suatu wadah yang memuat berbagai teknik analisis statistik. GLMs
mengakomodasi berbagai model linear, baik itu yang memerlukan asumsi
distribusi Normal maupun Non Normal.
Nelder dan Wedderburn (1974), mengembangkan GLMs dalam
sebuah aplikasi bernama GLIM untuk mempermudah estimasi parameter
dalam GLMs. Dari tahun 1972-1990, estimasi parameter dalam GLMs
sejalan dengan berkembang pesatnya statistika komputasi dengan
perantara algoritma Newton Raphson.
Nelder dan Wedderburn pada papernya yang berjudul Generalized
Linear Model yang diterbitkan oleh Journal of the Royal Statistical Society.
Series A (General), Vol. 135, No. 3 (1972), memberikan ide mengenai
komponen-komponen dalam GLMs. Sebuah model linear klasik (LM)
dapat dibentuk dalam GLMs mengikuti komponen-komponen yang
disebut dengan komponen random, komponen sistematis, yang
dihubungkan dalam sebuah fungsi bernama link function. Penjabaran
mengenai komponen GLMs, diberikan pada sub-bab selanjutnya.
Generalized Linear Model 19

McCullagh dan Nelder (1989) menjelaskan lebih detail mengenai


GLMs serta beberapa model yang menggunakan GLMs. Agresti (2007)
mengemukakan asumsi dalam GLMs yang secara jelas membedakan
dengan LM maupun GLM. Secara ringkas, summary dari LM/GLM dengan
GLMs diberikan pada Tabel 1.1.

Tabel 1.1.Summary dari LM/GLM dengan GLMs

Property LM/GLM GLMs


Respon , ,…, Diasumsikan Diasumsikan Independen,
Independen dan namun tidak harus berdistribusi
berdistribusi Normal Normal, melainkan masuk
dalam distribusi keluarga
Eksponential
Linearitas antar Y dan X linear dalam Y dan X tidak harus linear.
variabel dependen parameter Namun transformasi Y melalui
Y dan independen link function, diasumsikan
X berhubungan secara linear,
contoh dalam regresi logistic
biner dimana ( )= +

Kehomogenan Harus terpenuhi Tidak harus terpenuhi, contoh:


varians kasus overdispersi pada regresi
logistik
Error Diasumsikan Diasumsikan Independen,
Independen dan namun tidak harus berdistribusi
berdistribusi Normal Normal
Estimasi parameter LM menggunakan Lebih banyak menggunakan
metode least square, metode maksimum likelihood
dengan asumsi ( ′ ) dengan penyelesaian secara
yang non singular iteratif.
GLM mampu
menangani kondisi
dimana ( ′ )
singular, yaitu
menggunakan
Generalized invers.
Model Regresi Linear Semua model LM dan GLM
Sederhana atau Regresi Logistik
20 Aplikasi Generalized Linear Model Pada R

Property LM/GLM GLMs


multiple Regresi Poisson
ANOVA, MANOVA Log Linear
ANCOVA, Regressi Gamma
MANCOVA dll
Respon surface
Mixed model
dll

1.2 Komponen GLMs


Generalized Linear Model (GLMs) merupakan bentuk umum atau
general dari Model Linear. Diketahui vektor y memiliki n komponen, yang
merupakan realisasi dari sebuah matrik respon Y.Setiap komponennya
independen dan berdistribusi dengan mean atau E(Y)= .Jika model yang
terbentuk memiliki prediktor X, dengan beberapa parameter yang tidak
diketahui , … , , maka modelnya adalah berupa kombinasi linear
=∑ , atau jika dituliskan dalam bentuk matriks menjadi = .

Sebagai transisi dari model Linear ke Generalized Linear model,


maka dijabarkan bentuk melalui tiga buah komponen, yaitu:
1. Random Component, yaitu nilai-nilai pengamatan respon Y yang saling
bebas dari berdistribusi tertentu.
2. Systematic Component,yaitu kombinasi linear dari variabelX dengan
parameter yang dilambangkan dengan =
3. Link between random and Systematic/ link function, yaitu suatu fungsi
yang menjelaskan nilai ekspektasi dari variabel respon (Y) yang
menghubungkan dengan variabel-variabel penjelas melalui persamaan
linier. Dituliskan dengan = (. ), fungsi (. ) inilah yang disebut
dengan fungsi penghubung atau link function.
Dari ketiga komponen tersebut, linkfunction akan menentukan model
yang akan digunakan dalam GLMs. Link function paling sederhana adalah
g(μ) = μ disebut sebagai penghubung identitas (identity link). Apabila GLM
memiliki fungsi penghubung paling sederhana maka GLM merupakan
Generalized Linear Model 21

model linier dengan respon kontinu. Fungsi penghubung yang lain akan
menghubungkan μ secara nonlinier terhadap prediktor.
Pada Model Linear klasik, Y diasumsikan berdistribusi Normal
dengan E( ) = dan varians . Namun pada kenyataannya, kondisi ini
tidak begitu saja terpenuhi. Pada GLMs, variable respon Y dapat
berdistribusi selain Normal, yang masuk dalam Exponential Family.

1.3 Exponential Family (Distribusi Keluarga Eksponensial)


Dalam GLMs, distribusi respon dapat berbagai jenis, yang termasuk
dalam Exponential Family. Sebuah variabel random Y, masuk dalam
distribusi yang tergabung dalam Exponential Family, jika memiliki bentuk:

( : , ) = exp ( ) ⁄ ( )+ ( , ) (1)

dengan fungsi tertentu a(.), b(.) dan c(.). Jika diketahui, maka bentuk
persamaan (1) merupakan Exponential Family dengan parameter kanonik .
Beberapa jenis distribusi yang kerap digunakan dalam GLMs dapat
dijabarkan sbb:
1. Distribusi Normal
~ ( , )
( )= exp (2)

Dirubah dalam form Exponential Family:

1 1
( ; , ) = exp + log
2 √2
2 +
( ; , ) = exp log √2
2

( ; , ) = exp + log √2
2 2

( ; , ) = exp log √2 +
2 2
22 Aplikasi Generalized Linear Model Pada R

( ; , ) = exp log √2 +
2

dengan:
:
:
( ) : /2
:
( ) :

( , ) : log √2 +
2

Nilai Ekspektasi, Varians dan Deviance

 ( )= ( )
2
( )=
2
( )= =

 ( )= ( ) ( )
( )=1 ( )
( )= =
( ; )
 =2 ( , ; ) ( ̂, ; )
( ; ̂) 1 1 1
=2 √2 √2
2 2 2
( ; ̂)
=

2. Distribusi Binomial
~ ( , )
( )= ( ) (1 ) (3)
28 Aplikasi Generalized Linear Model Pada R

Dirubah dalam form Exponential Family:


1 ( )
( ; , ) = exp log +
2 2 2
( 2 + ) 1
( ; , ) = exp + log
2 2 2
2 1
( ; , ) = exp + + log
2 2 2 2 2
2 1
( ; , ) = exp + + log
2 2 2 2 2
1
( ; , ) = exp + + log
2 2 2 2

dengan:
:
:
2
( ) : ( 2 )
: 1
( ) :
1
( , ) : + log
2 2 2

Nilai Ekspektasi, Varians dan Deviance

 ( )= ( )
1( 2 ) ( 2)
( )=
2
/
( )=( 2 ) =

 ( )= ( ) ( )
1( 2 ) ( 2)
( )=
2
/
( )=
Generalized Linear Model 29

( ; )
 =2 ( , ; ) ( ̂, ; )
( ; ̂) 1
=2 + + log
2 2 2 2
1
+ + log
2 2 2 2
( ; ̂) 1 1 1 1
= +
2

Canonical link merupakan link function yang diturunkan melalui


bentuk Exponential Family, sedangkan link lainnya diperoleh dengan
transformasi Y yang menjamin nilai Y dalam domainnya dan g(μ) dari −∞
sampai +∞.
Tabel 1.2. Beberapa link function dalam GLMs (*canonical), semua parameter
dalam lambang
Link Name Link Inverse link 1st Derivative
Gaussian/Normal
*Identitas 1
Binomial
(Bernoulli: m=1)
*Logit ln ( /( )) /(1 + exp( )) /( ( ))
Φ ( / ) Φ( ) / Φ ( / )
Probit
ln( ln(1 (1
Complementari ( 1 ln(1
/ )) exp( exp( )))
Log-log / )
Poisson
*Log ln( ) exp( ) 1/
Negatif Binomial
*NB-C ln ( /( exp( ) 1/( + )
+ 1/ )) /( (1 exp( ))) 1/
Log
ln( ) exp( )
Gamma
*Invers 1/ 1/ 1/
Invers Gaussian
*Inv Quad 1/ 1/ 1/

Sumber: International Encyclopedia of Statistical Science (2011)


30 Aplikasi Generalized Linear Model Pada R

1.4 Model Generalized Linier Model


Model linier merupakan model yang analisis antara dua variabel
yaitu variabel independen atau biasa disebut prediktor dengan variabel
dependen atau biasa disebut respon, dimana prediktor diasumsikan
mempengaruhi respon secara linier, sehingga variabel respon dapat diduga
dari variabel prediktor. Tetapi model ini mengasumsikan bahwa variabel
respon harus berdistribusi Normal dan kehomogenan variansi.
Mc Cullagh dan Nelder (1989) mendefinisikan bahwa Generalized
Linier Models merupakan perluasan dari model linier klasik. Sifat penting
dari model ini adalah mengasumsikan independensi observasi. Normalitas
dan kehomogenan variansi tidak diperlukan, sehingga hubungan antara
variabel respon dan prediktor dengan distribusi respon selain normal dan
variansi tidak homogen dapat dimodelkan dengan model ini.
Generalized Linier Models terdiri dari 3 komponen yaitu:
i. Variabel dependen (variabel respon) , ,…, dengan mean
( ) = . Variabel dependen diasumsikan sebagai keluarga
eksponensial, yaitu distribusi normal, Poisson, Binomial, gamma atau
invers Gaussian.
ii. Sekumpulan parameter ( ) dan variabel independen (variabel
penjelas/explanatory variabel)
1
= =

iii. Fungsi link monoton (·) sedemikian sehingga


( )= =∑ = , dengan = ( )

Maka, model Generalized Linier Model dapat dimodelkan sebagai


berikut :
( )=
Ada fungsi hubung khusus yang disebut fungsi hubungan kanonik
yang berkaitan dengan distribusi dari variable dependent. Misalnya, jika
Generalized Linear Model 31

variable dependent berdistribusi poisson, maka (·) adalah fungsi ln.


Berdasarkan penjabaran diatas, maka komponen penting yang membentuk
generalized linier model antara lain : variable independent linier, variable
dependent merupakan distribusi keluarga eksponensial dan ada fungsi
hubungan.

1.5 Fungsi Link


Menurut Mc Cullagh dan Nelder (1989), fungsi hubung adalah suatu
fungsi yang menghubungkan prediktor linier η dengan nilai harapan
respon y yaitu . Berikut ini penghubung kanonik (η) untuk beberapa
distribusi (Jong dan Heller, 2008). Fungsi link dapat menjelaskan hubung
linier antara fungsi transformasi dari mean, g (µ) dengan variable predictor
yang menghubungkan komponen sitematis η terhadap nilai mean µ. Fungsi
hubungan atau link function merupakan nilai harapan dari komponen acak.
Fungsi link dimodelkan sebagai berikut
η = g(µ) atau µ = (η)

Tabel 1.3 Fungsi hubung kanonik

Distribusi Fungsi HubungKanonik


Normal η=μ
Poisson = log
Binomial = log
1
Gamma =
Inversi Gaussian =

1.6 Estimasi Generalized Linier Models


Metode yang digunakan untuk mengestimasi parameter regresi
logistic adalah Maximum Likelihood Estimation (MLE). MLE adalah teknik
yang digunakan untuk mencari titik tertentu untuk memaksimumkan
sebuah fungsi. Langkah yang perlu dilakukan dengan metode MLE adalah
32 Aplikasi Generalized Linear Model Pada R

dengan membuat fungsi likelihood distribusi, membuat transformasi fungsi


tersebut dalam bentuk ln, menurunan secara parsial terhadap parameter
dan menyamakannya dengan nol. Dari pendeferensial diperoleh estimasi
parameter.
Fungsi likelihood didefinisikan sebagai berikut :

( , ; )= ( ; , )

Selanjutnya, dibuat transformasi dalam bentuk ln atau disebut


dengan log-likelihood

ln ( , ; ) = ( , ; )= ∑ ln ( ; , )

subtitusi distribusi keluarga eksponensial kedalam fungsi log-


likelihood

( )
( , )= ln ( , ) +

( )
= + ln ( , )

1.7 Kriteria Pemilihan Model Terbaik


Pemilihan model terbaik dari bebrapa model yang disajikan, dipilih
berdasarkan kriteria yang digunakan. Adapun pilihan kriteria sebagai
perbandingan model untuk memperoleh model terbaik,antara lain Akaike’s
Information Criterian (AIC), Bayesian Information Criterion (BIC) dan Root
Mean Square Error (RMSE).
AIC adalah suatu kriteria yang menyeimbagkan goodness of fit model
berdasarkan nilai likelihood dengan banyaknya parameter dari model.
Sehingga, model yang terbaik adalah model dengan nilai Akaike’s
Information Criterian (AIC) terkecil. Nilai AIC diperoleh dari persamaan
sebagai berikut :
= 2 log + 2
Generalized Linear Model 33

BIC merupakan sebuah persamaan dengan l log-likelihood dari model,


k adalah jumlah variable prediktor sedangkan N adalah banyaknya
observasi. Model terbaik adalah model dengan nilai BIC terkecil, nilai
Bayesian Information Criterion (BIC) didapatkan dari persamaan :
= 2 + 2 log

RMSE merupakan indeks yang digunakan untuk mengevaluasi


ketepatan model yang terbentuk. Berdasar kriteria Root Mean Square Error
(RMSE), model terbaik adalah model dengan nilai RMSE terkecil. Nilai
RMSE diperoleh dari persamaan :

1
RMSE =

1.8 Uji Analisis Generalized Linier Models


Pada generalized linier model perlu dilakukan uji Inferensia diantara-
nya adalah uji parameter dan uji kecocokan model. Uji parameter dilaku-
kan untuk mengetahui apakah parameter dalam model GLM signifikan
atau tidak dan uji kecocokan model adalah dengan membandingkan model
dengan model yang paling mungkin cocok, yaitu model yang didalamnya
banyak parameter.

 Uji Parameter
Hipotesis utama yang ingin diuji adalah
Ho : = 0 (koefisien tidal layak masuk model)
H1 : 0 (koefisien layak masuk model)
Tingkat Signifikansi : α

Statistik Hitung : =

= korelasi y dan untuk parameter ke-i


= jumlah observasi
34 Aplikasi Generalized Linear Model Pada R

Daerah penolakan :
Ho akan ditolak jika statistik uji lebih kecil daripada nilai
( , ) atau dinotasikan dengan ( , ). Jika
menggunakan software, maka dilihat dari nilai p_value apabila p_value
< alpha maka Ho ditolak.

 Uji Kecocokan Model


Hipotesis utama yang ingin diuji adalah
Ho : model tidak layak digunakan
H1 : model layak digunakan
Tingkat Signifikansi : α

Statistik Hitung : =∑

=
=
Daerah penolakan :
Ho akan ditolak jika statistik uji hitung lebih kecil daripada tabel nilai
atau dinotasikan dengan hitung tabel . Jika menggunakan software,

maka dilihat dari nilai p_value apabila p_value < alpha maka Ho
ditolak.
Generalized Linear Model 35

1.9 Langkah – Langkah Generalized Linier Model

Pemilihan Variabel
DATA Statistika
Respon dan
Deskriptif
Prediktor

LINIER ?

Pemilihan Fungsi
Link

Identifikasi Distribusi
Variabel respons
Pemodelan
Pemodelan Distribusi Variabel
Generalized Linier Respons
Model

Pemilihan Model Model


Terbaik Terbaik

Gambar 1.1. Analaisis GLM Sumber : Jamilatuzzahro, Rezzy Eko Caraka, Riki
Herliansyah

Berikut digambarkan langkah – langkah dalam melakukan analisis


generalized linier model
1. Mengumpulkan data
Salah satu komponen yang penting dalam penelitian adalah proses
peneliti dalam pengumpulan data. Kesalahan yang dilakukan dalam
proses pengumpulan data akan membuat proses analisis menjadi sulit.
36 Aplikasi Generalized Linear Model Pada R

Selain itu hasil dan kesimpulan yang akan didapat pun akan menjadi
rancu apabila pengumpulan data dilakukan tidak dengan
benar.Pengumpulan data dilakukan untuk memperoleh informasi yang
dibutuhkan dalam rangka mencapai tujuan penelitian. Proses
pengumpulan data ditentukan oleh variabel-variabel yang ada dalam
hipotesis. Pengumpulan data dilakukan terhadap sampel yang telah
ditentukan sebelumnya.
2. Menentukan variable depedent dan variable independent
Variabel independen (independent variable) adalah tipe variabel yang
menjelaskan atau mempengaruhi variabel yang lain. Variabel
dependen (dependent variable) adalah tipe variabel yang dijelaskan atau
dipengaruhi oleh variabel independen. Kedua tipe variabel ini
merupakan kategori variabel penelitian yang paling sering digunakan
dalam penelitian karena mempunyai kemampuan aplikasi yang luas.
Data yang diperoleh pada proses pengumpulan data, selanjutnya
peneliti harus mengklasifikasikan dan menentukan data yang
termasuk ke dalam variabel independent dan data yang termasuk
dalam varaibel dependent. Penentuan kedua variabel ini berdasar teori
keilmuan terkait.
3. Statistika Deskriptif
Pada deskripsi data, diberikan ukuran tendensi pusat, ukuran posisi
dan ukuran variasi, kesemuanya menggambarakan karakteristik data.
Ukuran numerik yang menggambarkan beberapa karakteristik dari
populasi adalah parameter, sedangkan ukuran numerik yang
menggambarkan karakteristik dari data pengamatan (sampel) adalah
statistic yang mana tujuannya adalah untuk menduga atau
mengestimasi parameter. Sebagai contoh, rata – rata penjualan yang
diperoleh dari populasi keseluruhan adalah parameter, sedangkan rata
– rata penjualan dari suatu sampel yang representative adalah statistic.
Statistic ini yang dijadikan sebagai penduga parameter.
4. Pengujian Linieritas
Uji linieritas merupakan syarat sebelum dilakukan uji generalized linier
models. Secara umum Uji Linieritas bertujuan untuk mengetahui
Generalized Linear Model 37

apakah dua varaibel mempunyai hubungan yang linier secara


signifikan atau tidak. Data yang baik seharusnya terdapat hubungan
yang linier antara varaibel independent dan varaibel dependent.
5. Identifikasi Distribusi Variabel dependent dan Pemilihan Fungsi Link
Identifikasi varaibel dependent perlu dilakukan dengan fitting
distribution, mencocokan data pada kurva distribusi. Setelah diketahui
distribusi varaibel dependent kemudian ditentukan fungsi link yang
berkaitan dengan distribusi tersebut.
6. Pemodelan Generalized Linier Model
Melakukan pemodelan generalized linier model dengan memasukan
semua variabel independent dan dependent. Menggunakan uji
parameter untuk menyeleksi parameter yang masuk ke dalam model,
selanjutnya menggunakan uji kecocokan model untuk menyeleksi
model yang signifikan.
7. Pemilihan Model Terbaik
Metode pemilihan model GLM terbaik ini digunakan untuk memilih
model yang paling tepat untuk menjelaskan hubungan antara variabel
dependent (y) dan variabel independent (x). Pada setiap hubungan
antara variabel Y dan variabel X terdapat beberapa model yang
mampu menggambarkan. beberapa kriteria untuk pemilihan model
terbaik diantaranya : lain Akaike’s Information Criterian (AIC), Bayesian
Information Criterion (BIC) dan Root Mean Square Error(RMSE). Memilih
model terbaik berdasarkan nilai AIC, BIC dan RMSE terkecil.

-oo0oo-
38 Aplikasi Generalized Linear Model Pada R
BAB 2

GENERALIZED ADDITIVE MODELS (GAM)

G
eneralized additive models (GAM) merupakan perluasan dari
regresi linier biasa dengan menggantikan fungsi linier menjadi
fungsi aditif sehingga model ini dapat digunakan meskipun
hubungan variabel respon dan beberapa variabel prediktor tidak linier.
Dan seperti halnya GLM, distribusi respon pada GAM tidak hanya pada
distribusi normal saja tapi juga distribusi yang termasuk dalam keluarga
eksponensial dapat dianalisis dengan metode ini. Teori model aditif
bersifat menyeluruh dalam mengungkapkan hal-hal yang lebih kompleks
terutama yang berkaitan dengan pengaruh acak, komponen ragam dan
bentuk sebaran data peubah yang tidak normal. Selanjutnya, model
GAMM ini diharapkan lebih efisien dalam mengidentifikasi sebaran
pengaruh komponenen acak sehingga mampu menerangkan lebih tepat
pengaruh komponenen acak tersebut dalam suatu model.
Pada umumnya koefisien dalam analisis regresi bersifat efek tetap
(fixed efect), dan relatif mudah dalam mengambil kesimpulan. Namun,
dalam beberapa kasus analisis regresi dipengaruhi oleh efek acak (random
efect). Seperti halnya pada kasus pengambilan kesimpulan untuk seluruh
populasi yang memiliki beberapa tingkatan dimana sampel diambil secara
acak.
Efek tetap (fixed efect) adalah seluruh parameter terkait yang diambil
dari populasi dalam suatu percobaan, sedangkan efek acak (random efect)
40 Aplikasi Generalized Linear Model Pada R

yaitu pengambilan secara acak individual-eksperimental suatu unit dari


populasi.
Suatu model regresi yang dipengaruhi oleh efek tetap (fixed efect) dan
efek acak (random efect) disebut dengan efek campuran (mixed efect).

2.1 Additive Model


Generalized additive mixed models digunakan ketika tidak ada
hubungan linier antara variabel respon terhadap beberapa variabel
prediktornya. Model linier pada generalized linier mixed models diganti
menjadi model aditif. Model aditif merupakan pengembangan dari model
linier dimana komponen prediktornya berupa jumlahan fungsi penghalus
(Hastie dan Thibshirani, 1999). Hubungan antara variabel prediktor pada
model aditif adalah independent, dan setiap variabel prediktornya
memberikan kontribusi untuk variabel respon. Misalkan kita mempunyai
set data , , ,…, dengan n adalah jumlah observasi. Maka
model aditif dapat ditulis sebagai berikut :

∑ (2.1)

· = fungsi tunggal yang dimiliki oleh setiap prediktor

dengan p adalah banyaknya variabel independent dan 0,


.

2.2 Smoothing Spline


Fungsi Penghalus adalah alat untuk meringkaskan trend pada
variabel respon Y sebagai fungsi dari satu atau lebih variabel prediktor
, … , . Penghalus yang digunakan untuk meringkaskan trend ini
disebut sebagai scatterplot smoother. Kegunaan dari fungsi penghalus adalah
mempermudah dalam melihat trend pada scatterplot smoother yang
dihasilkan antara variabel respon Y dan variabel prediktor X.Penghalus
pada Respon Y dapat dilakukan dengan cara menghitung nilai rata-rata Y
dari setiap kategori untuk data yang prediktornya bernilai kategorik.
Sedangkan teknik penghalusan untuk data non-kategorik dapat dilakukan
Generalized Additive Models (GAM) 41

dengan teknik penghalusan running mean, kernel atau spline. Pada model
aditif terdapat jumlahan i fungsi yang merupakan jumlahan fungsi tunggal
dari setiap variabel prediktor. Persamaan yang memiliki jumlah observasi
yang besar seringkali menghasilkan bentuk kurva regresi yang tidak sesuai
dengan kondisi sebenarnya. Sehingga, kurva tersebut tidak dapat
menggambarkan kecenderungan kurva pada bagian tertentu. Konsep yang
digunakan dalam penyelesaian permasalahan tersebut yaitu dengan
membagi data ke dalam beberapa bagian lalu menghubungkan setiap
bagiannya, sehingga diperoleh estimasi yang tepat. Konsep ini disebut
dengan piecewise of regression equation. Metode yang digunakan dalam
pendekatan estimasi tersebut yaitu smoothing spline.
Hastie dan Tibshirani (1990) membahas berbagai macam penghalus
diagram pencar. Salah satu dari penghalus diagram pencar tersebut adalah
penghalus spline yang merupakan solusi dari:
∑  (3.2)

Dengan  adalah parameter penghalus dalam interval 0    1 .


Nilai  besar akan menghasilkan kurva yang mulus, sedangkan  kecil
akan menghasilkan gambar kurva yang kasar. Suku pertama pada
persamaan diatas digunakan untuk mengukur kerapatan data, sedangkan
suku kedua memperlihatkan kurva suatu fungsi.

Gambar 2.1 Ilustrasipenghalus spline


Sumber: Jamilatuzzahro, Rezzy Eko Caraka. International Journal Of
Chemistry, Mathematics And Physics(IJCMP)
42 Aplikasi Generalized Linear Model Pada R

Gambar kiri menunjukkan diagram pencar samaran dari plot


variabel respon  terhadap variabel prediktor X. Gambar kanan,
penghalus diagram pencar telah ditambahkan untuk menggambarkan
kecenderungan (trend) variabel respon  terhadap variabel prediktor X
(Hastie dan Tibshirani, 2004).

2.3 Pemilihan Parameter Penghalus


Estimator smoothing spline sangat tergantung pada parameter
penghalus, sehingga pemilihan parameter penghalus (smoothing
parameter) merupakan hal yang penting dalam mencari estimator spline
yang paling sesuai. Jika nilai parameter penghalus sangat kecil maka akan
memberikan estimator spline yang sangat kasar. Sebaliknya, jika nilai
parameter penghalus sangat besar maka akan menghasilkan estimator
spline yang sangat mulus. Akibatnya perlu dipilih parameter penghalus
yang optimal agar diperoleh estimator spline yang paling sesuai untuk
data. Salah satu kriteria dalam pemilihan parameter penghalus pada model
nonparametrik yakni generalized cross validation (GCV) dinyatakan sebagai:

Parameter penghalus yang dipilih adalah yang membuat nilai GCV


minimum.Generalized Additive Model memiliki kemampuan untuk
menjelaskan pengaruh dari setiap prediktor variabel respon seperti halnya
pada model linier. Dengan menerapkan smoothing spline dalam
mengestimasi fungsi aditif dalam model ini, maka kecenderungan –
kecenderungan dalam data seperti adanya hubungan nonlinier atau
bahkan pada beberapa titik data dapat terlihat.Pada Generalized additive
models , komponen linier yang ada pada generalized linier model diganti
dengan jumlahan fungsi pengahlus, yaitu fungsi penghalus pada model
additive. Generalized additive models memiliki bentuk sebagai berikut :
Generalized Additive Models (GAM) 43

Dimana adalah fungsi hubung yang menghubungkan anatara mean


observasi ke i yaitu dengan komponen jumlahan fungsi penghalus
sebanyak p , , dan berdistribusi keluarga eksponensial.

-oo0oo-
44 Aplikasi Generalized Linear Model Pada R
BAB 5

DAFTAR PUSTAKA

Agresti, A., (2007). An Introduction to Categorical Data Analysis. New Jersey:


John Wiley & Sons.
Anderson, T.W. (1949). Some Scaling Models and Estimation Procedures in
the Latent Class Model. U. Grenander, ed., Probability and Statistics,
Wiley, pp.9-38.
Bartholomew, David, Knott, M and Moustaki, Irini (2011). Latent Variable
Models and Factor Analysis. A John Wiley & Sons, Ltd, Publication
Caraka, R.E., Yasin,H. 2017. Geographically weighted regression (GWR) :
sebuah pendekatan regresi geografis. Graha Ilmu Yogyakarta –
Mobius. ISBN: 978-602-19479-7-5
Caraka, R.E., Yasin,H., and Waridi,A. 2017. Peramalan Crude Palm Oil
(CPO) Support Vector Regression Kernel Radial Basis. Jurnal
Matematika. Vol.1 No.1 pp. 43-57 ISSN 1693-1394. Universitas
Udayana
Caraka,R.E. (2017). Simulasi Kalkulator Energi Baru Terbarukan (EBT)
Guna Memenuhi Ketahanan Energi di Indonesia. In STATISTIKA:
Forum Teori dan Aplikasi Statistika (Vol. 16, No. 2, pp. 77-88).
92 Aplikasi Generalized Linear Model Pada R

Caraka,R.E. Devi,A,R. 2016. Application Of Non Parametric Basis Spline (B-


SPLINE) In Temperature Forecasting. Journal Statistika, Vol. 4, No. 2 .
pp.69-73
Caraka,R.E., and Sugiyarto.W. 2016. Inflation Rate Modeling. Journal
Etikonomi Volume 15 (2), October. P-ISSN: 1412-8969; E-ISSN: 2461-
077. Page 111 – 124. DOI: 10.15408/etk.v15i2.326
Caraka,R.E., Sugiyarto,W., Erda,G., and Sadewo.E. 2016. Pengaruh Inflasi
Terhadap Impor Dan Ekspor Di Provinsi Riau Dan Kepulauan Riau
Menggunakan Generalized Spatio Time Series. Journal Badan
Pendidikan Dan Pelatihan Keuangan Kementerian Keuangan
Republik Indonesia (BPPK).Vol.9,No.2.pp.180-198
Carey, Gregory., (1998). The General Linear Model: Theory. Courses
Handout.
http://psych.colorado.edu/~carey/Courses/PSYC7291/handouts/g
lmtheory.pdf
Collet, D., (1991). Modeling Binary Data. London: Chapman and Hall.
Dobson, A., (2002). An Introduction to Generalized Linear Model. New York:
Chapman and Hall.
Dobson, Annette J., 2002, An Introduce to Generalized Linier Models, D.C,
Chapman and Hall, Washington, USA.
Hastie, T. and Tibshirani, R., 1986. Generalized Additive Mixed Models.
Statistical Science Vol.1, No. 3, 297-318.
Hikmananda, N. 2013,Skripsi Generalized Additive Models, Program Study
Statistika Jurusan Matematika FMIPA UGM, Yogyakarta.
Hui, Francis K.C., Warton, David I., Ormerod, John T., Haapaniemi,Viivi &
Taskinen, Sara (2016). Variational Approximations for Generalized
Linear Latent Variable Models. Journal of Computational and
Graphical Statistics, DOI: 10.1080/10618600.2016.1164708
International Encyclopedia of Statistical Science, (2011), Springer.
Daftar Pustaka 93

Jiang, J., 2007, Linier and Generalized Linier Mixed Models and their Application,
Penerbit Springer, New York, USA.
Lin, X., 1999, Inference in Genralized Additive Mixed Models, University of
michigan annarbor, USA.
Mamouridis, V., 2011, Additive Mixed Models applied to the study of red shrimp
landings: comparison between frequentist and Bayesian perspectives.
McCullagh, P., and Nelder, J.A., (1989). Generalized Linear Model. London:
Chapman and Hall.
Nelder, J. A., and Wedderburn, (1972). :Generalized Linear Model”. Journal
of the Royal Statistical Society. Series A (General), Vol. 135, No. 3.
Niku, Jenni, Warton, David I., Hui, Francis K.C. and Taskinen, Sara (2017).
Generalized Linear Latent Variable Models for Multivariate
Abundance Data in Ecology. Journal of Agricultural, Biological and
Environmental Statistics.
Ovaskainen, O., Abrego, N., Halme, P., and Dunson, D. (2016). Using latent
variable models to identify large networks of species-to-species
associations at different spatial scales. Methods in Ecology and
Evolution, pages 549–555.
Pinheiro, J.C, Bates, D., Mixed Efect Models in S and S-Plus, Bell Laboratories
Lucent Technologies and Departement of Computer Sciences and
Statistics, University of Wisconsin Madison, USA.
Rao, C. R., (1973). Linear Statistical inference and Applications. New York:
John Wiley & Sons.
Rosadi, D., 2010,Analisis Ekonometrika & Runtun Waktu Terapan dengan R,
Penerbit Andi, Yogyakarta.
Shen, J., 2011, Additive Mixed Modeling of HIV Patien Outcomes Across
Multiple Studies, University of California, Los Angeles 2011.
Skrondal, Anders and Hesketh, Sophia Rabe (2004). Generalized Latent
Variable Modeling. Chapman & Hall/CRC
94 Aplikasi Generalized Linear Model Pada R

Sutrisni, 2010, Analisis Pengaruh Kualitas Produk, Kualitas Pelayanan dan


kepercayaan Terhadap loyalitas Pelanggan Indosat IM3, Universitas
Diponogoro, Semarang
Thorson, James T., Ianelli, James N., Larsen, Elise A., Ries, L., Scheuerell,
Mark D., Szuwalski, C., and Zipkin, Elise F. (2016). Joint dynamic
species distribution models: a tool for community ordination and
spatio-temporal monitoring. Global Ecology and Biogeography 25,
1144-1158.
Venables, W. N., and Ripley, B. D., (2002). Modern Applied Statistics with
S. Springer.
Warton, David I., Blanchet, F. Guillaume, O’Hara, Robert N., Ovaskainen,
O., Taskinen, S., Walker, Steven C. and Hui, Francis K.C. (2015). So
Many Variables: Joint Modeling in Community Ecology. Trends in
Ecology & Evolution: Vol. 30, No. 12
Zahro, J., and Caraka,R.E.(2017). Modelling Inflation Using Generalized
Mixed Models (GAMM). International Journal Of Chemistry,
Mathematics And Physics(IJCMP).Vol.1.No.1 pp 73-79

-oo0oo-

Anda mungkin juga menyukai