PERTEMUAN VI
PENGANTAR ANALISIS REGRESI
Oleh
NPM : F1F022034
LABORATORIUM MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BENGKULU
2023
KATA PENGANTAR
Puji dan syukur kepada Tuhan Yang Maha Esa karena berkat limpahan
rahmat dan karunianya laporan tugas praktikum mata kuliah Pengantar Analisis
Regresi ini dapat diselesaikan dengan tepat waktu. Pada kesempatan ini penulis
juga mengucapkan terima kasih yang sebesar-besarnya kepada berbagai pihak
yang telah membantu selama pengerjaan praktikum ini, terutama kepada:
1. Dyah Setyo Rini, S.Si.,M.Sc. selaku Dosen Pengampu
2. Destria Dwina Putri Syahbet selaku Asisten Praktikum
3. Alya Saputri selaku Asisten Praktikum
4. Terakhir, pada keluarga dan teman-teman yang senantiasa memberikan
dukungan kepada penulis.
Penulis menyadari bahwa dalam proses penyusunan laporan praktikum ini
masih banyak kekurangan baik pada segi susunan kata, kalimat ataupun tatanan
bahasa. Oleh karena itu, kritik dan saran sangat diharapkan penulis agar dimasa
datang menjadi lebih baik.
ii
DAFTAR ISI
HALAMAN JUDUL...............................................................................................i
KATA PENGANTAR...........................................................................................ii
DAFTAR ISI.........................................................................................................iii
DAFTAR GAMBAR.............................................................................................iv
DAFTAR TABEL..................................................................................................v
DAFTAR LAMPIRAN.........................................................................................vi
BAB I PENDAHULUAN.......................................................................................
1.1 Latar Belakang...........................................................................................
1.2 Rumusan Masalah.....................................................................................
1.3 Tujuan Penelitian.......................................................................................
1.4 Manfaat Penelitian.....................................................................................
1.5 Batasan Masalah........................................................................................
1.6 Sistematika Penulisan................................................................................
BAB II TINJAUAN PUSTAKA...........................................................................
2.1 Analisis Regresi Berganda........................................................................
2.2 Outlier pada Analisis Regresi Berganda..................................................
BAB III METODE PENELITIAN.......................................................................
3.1 Jenis dan Sumber Data..............................................................................
3.2 Variabel Penelitian.....................................................................................
3.3 Analisis Data...............................................................................................
3.4 Diagram Alir Penelitian..........................................................................10
BAB IV HASIL DAN PEMBAHASAN.............................................................11
4.1 Statistik Deskriptif Data..........................................................................11
4.2 Hasil Batasan Masalah............................................................................12
4.3 Pengujian Hipotesis.................................................................................13
BAB V KESIMPULAN DAN SARAN...............................................................15
5.1 Kesimpulan...............................................................................................15
5.2 Saran.........................................................................................................16
DAFTAR PUSTAKA...........................................................................................17
LAMPIRAN..........................................................................................................18
iii
DAFTAR GAMBAR
iv
DAFTAR TABEL
v
DAFTAR LAMPIRAN
vi
BAB I
PENDAHULUAN
mengetahui hubungan sebuah variabel tak bebas dengan satu atau lebih variabel
bebas. Analisis regresi dapat digunakan untuk menganalisis data dan mengambil
variabel lainnya. Berdasarkan jumlah variabel bebas, analisis regresi linier dibagi
menjadi dua macam yaitu, analisis regresi linier sederhana dan analisis regresi
linier berganda. Regresi linier yang terdiri dari satu variabel dependen dan satu
variabel independen disebut regresi linier sederhana, sedangkan regresi linier yang
terdiri dari satu variabel dependen dan beberapa variabel independen disebut
identifikasi outlier. Pencilan (outlier) dapat diartikan sebagai suatu datum pada
data pengamatan yang jauh (ekstrim) dari ukuran pemusatan data. Pencilan
memberikan informasi penting yang tidak ada pada datum lainnya pada data
melakukan pengamatan baik salah dalam input data atau kesalahan yang tidak
disengaja lainnya. Tetapi ada kalanya data pencilan tersebut adalah murni dari
pengamatan dalam kasus yang jarang atau langka. Yang mana pencilan tersebut
vii
menyimpan informasi tertentu yang tidak dapat diganti oleh data yang lain.
seharusnya dilakukan tanpa alasan yang tepat dan jika hal ini terjadi sebisa
mungkin harus digunakan alternatif atau cara lain tanpa harus mengeluarkan atau
Outlier adalah satu atau lebih data yang tidak biasa, yang tidak cocok dari
sebagian data lainnya (one or more atypical data points that do not fit with the
rest of the data). Pencilan dapat dilihat sebagai pengamatan dengan sisaan yang
cukup besar, pengamatan yang jauh dari kelompok data yang mungkin
Dengan manfaat yang didapatkan dari penelitian ini adalah sebagai berikut :
viii
3. Dapat dijadikan referensi untuk penelitian selanjutnya.
Pada penelitian ini, adapun batasan masalahnya adalah mencari data yang
BAB I PENDAHULUAN
penulisan.
Bab ini merupakan bab yang memuat pengertian dan teori yang
Bab ini merupakan bab yang memuat jenis dan sumber data,
Bab ini merupakan bab yang memuat hasil dan pembahasan yang
Bab ini merupakan bab yang memuat kesimpulan dan saran yang
telah dilakukan.
ix
DAFTAR PUSTAKA
sumber dari mana saja untuk mendapatkan teori pada BAB I dan
BAB II.
LAMPIRAN
x
BAB II
TINJAUAN PUSTAKA
hubungan satu variabel tak bebas atau response (Y ) dengan dua atau lebih
berganda adalah untuk memprediksi nilai variabel tak bebas atau response (Y )
Keterangan:
a=¿ konstanta.
X 1 , X 2 , … , X n = variabel bebas.
punyai nilai diantara jika nilai¿ 0 ,dalam hal ini variabel Y tidak dipengaruh oleh
X 1 dan X 2 . Jika nilainya negatif, maka terjadi hubungan dengan arah terbalik
antara variabel tak bebas Y dengan variabel-variabel X 1 dan X 2 . Dan jika nilainya
positif maka terjadi hubungan yang searah antara variabel tak bebas Y dengan
xi
2.2 Outlier pada Regresi Linier Berganda
oleh komponen sisaan atau galat dalam model yang dihasilkan. Beberapa asumsi
itu antara lain bahwa galat harus memenuhi asumsi normalitas, kehomogenan
ragam dan tidak terjadi autokorelasi. Apabila asumsi itu terpenuhi, maka penduga
parameter yang diperoleh bersifat Best Linier Unbiased Estimator (BLUE) atau
penduga terbaik yang bersifat linear dan tak bias. Seringkali dalam berbagai kasus
Data yang diperoleh tidak jarang ditemukan satu atau beberapa yang jauh dari
(outlier). Pencilan dapat dilihat sebagai pengamatan dengan sisaan yang cukup
besar. Pencilan adalah pengamatan yang jauh dari kelompok data yang mungkin
oleh beberapa hal diantaranya adalah kesalahan input data, kekeliruan pada sistem
pengukuran ataupun karena terjadinya peristiwa yang luar biasa seperti krisis
1. Outlier Pengamatan-Y
t i=e i
√ n− p−1
SSE ( 1−hii )−e 2i
(2.2)
xii
H 1 : kasus ke−i merupakan outlier.
2. Outlier Pengamatan-X
pengamatan-𝑋.
Elemen diagonal hii pada matriks HAT mempunyai beberapa sifat, yakni
Pengamatan ke−i yang memiliki nilai hii >2 p /n disebut sebagai outlier
xiii
BAB III
METODE PENELITIAN
Jenis data yang digunakan dalam penelitian ini berupa data kuantitatif. Data
kuantitatif adalah jenis data yang dapat diukur atau dihitung secara langsung. Data
Sumber data yang digunakan pada penelitian ini ialah data sekunder. Data
sekunder adalah data yang diperoleh secara tidak langsung melalui perantara atau
pihak lain. Data sekunder yang dimaksud merupakan data yang bersumber dari
Pada penelitian ini menggunakan tiga variabel bebas dan satu variabel respon
sesuai pada sumber data yang diantaranya adalah indeks pembangunan manusia
sebagai variabel Y dan rata-rata lama sekolah (tahun), umur harapan hidup saat
lahir (tahun), pengeluaran per kapita (ribu rupiah/orang/ tahun) sebagai variabel X
. Variabel yang diambil merupakan data untuk 38 kota atau kabupaten di Provinsi
Jawa Timur pada tahun 2021. Lebih jelasnya adalah sebagai berikut:
xiv
3.3 Analisis Data
6. Deteksi outlier
7. Interpretasi model
xv
3.4 Diagram Alir Penelitian
Mulai
Input data
Estimasi parameter
Deteksi outlier
Output data
Interpretasi
xvi
BAB IV
Adapun hasil dari statistik data dari batasan masalah adalah sebagai berikut:
Pada Tabel 4.1 didapatkan hasil statistik deskriptif dari variabel ( Y ¿ yaitu
data IPM (Indeks Pembangunan Manusia) nilai minimum: 62.80, 1st quartile:
68.66, median: 71.63, mean: 72.23, 3rd quartile: 75.25, maximum : 82.31. Pada
4.860, 1st quartile: 7.200, median: 7.695, mean: 8.061, 3rd quartile: 9.220,
nilai Minimum: 66.89, 1st quartile: 70.44, median: 72.45, mean: 71.72, 3rd
perkapita didapatkan nilai minimum: 8673, 1st qurtile: 10038, median: 11260,
xvii
4.2 Hasil Batasan Masalah
Berdasarkan pada tabel 4.2, diperoleh output dari model regresi berganda
yang didapatkan konstanta atau nilai variabel Y yaitu 19.46 , dengan koefisien
0.0008478 . Dari nilai-nilai ini model regresi linier berganda yang terbentuk adalah
sebagai berikut:
Dari model regresi ini berarti bahwa, jika variabel X meningkat sebesar 1
satuan, maka indeks pembangunan manusia (Y^ i) akan meningkat sebesar 0.4037 .
xviii
manusia) sebesar 98.58% dengan sisanya sebesar 1.42% dipengaruhi oleh faktor
lainnya.
dalam function tersebut, lalu jika dijalankan akan menghasilkan plot seperti pada
lampiran 3 dan outlier ditunjukkan dengan angka atau nomor yang muncul pada
plot. Jika kita amati, angka yang muncul adalah 26, 28, 30, 36, dan 37 dengan
nilai Stundentized Residual, Hat, dan juga nilai dari CookD dapat dilihat pada
lampiran 2.
1. Merumuskan hipotesis
xix
H 1 : kasus ke-30 merupakan outlier
α =5 %
3. Statistik uji
t i=e i
√ n− p−1
SSE ( 1−hii )−e 2i
Pvalue =0.039106
4. Kriteria penolakan
5. Kesimpulan
atau 0.05 diperoleh Pvalue =0.039106< α=0.05 maka tolak H 0 dan dapat
disimpulkan bahwa pada taraf nyata pengujian 5% kasus ke-30 merupakan outlier
xx
BAB V
5.1 Kesimpulan
Pencilan dapat dilihat sebagai pengamatan dengan sisaan yang cukup besar.
Pencilan adalah pengamatan yang jauh dari kelompok data yang mungkin
36, dan 37. Kita dapat juga mendeteksi outlier dengan menggunakan pengujian
yang menunjukkan outlier pada data 30 dan kita dapat melakukan pengujiannya
xxi
dan menghasilkan Pvalue =0.039106< α=0.05 maka tolak H 0 dan dapat
menghilangkan data ke-30 maka kita perlu melakukan langkah yang sama dengan
hasilnya Y^ i=19.18+ 1.633 X 1+ 4.099 X 2 +0.000 9033 X 3 untuk model regresi yang
dapat menjelaskan Y sebesar 98.7% lebih besar daripada ketika outlier sebelum
dihilangkan dengan sisanya sebesar 1.3% dipengaruhi oleh faktor lainnya. Dan
5.2 Saran
memasukkan data, dikarenakan jika salah maka kita tidak akan mendapatkan hasil
yang diharapkan. Kita harus cermat dalam menginterprestasikan hasil dari uji
yang dilakukan. Dalam program R perlu dilakukan sesuai dengan prosedur yang
xxii
DAFTAR PUSTAKA
xxiii
LAMPIRAN
xxiv
Kota Batu 9.31 72.65 12887 76.28
xxv
xxvi