Anda di halaman 1dari 35

MATEMATIKA TERAPAN

Materi
Bab 4 – Menggambarkan Data : Menampilkan dan Menjelajahi
Data
Bab 14 – Analisisis Regresi Berganda

Dosen : Rosalendro Eddy Nugroho, Dr. Ir, MM

Disusun Oleh: Kelompok 2

1. Eka Nur Fitriani (55716120013)


2. Yosie Malinda (55716120020)

Pascasarjana Magister Teknik Sipil


Universitas Mercu Buana
Jakarta
2018
KATA PENGANTAR

Puji syukur ke hadirat Allah SWT karena berkat rahmat dan karunia-Nya kami dapat
menyelesaikan makalah soal dan pembahasan statistika analisis regresi berganda ini dengan
baik dan tepat waktu.

Berkaitan dengan tugas ini, kami banyak mendapatkan bantuan dan bimbingan dari
berbagai pihak yang kami terima secara langsung maupun tidak langsung, terutama Bapak
Rosalendro EddyNugroho, Dr. Ir,MM selaku dosen mata kuliah matematika terapan. Tidak
lupa kami mengucapkan terima kasih kepada semua pihak yang membantu kami dalam
pembuatan tugas ini.

Kami menyadari bahwa makalah ini masih banyak kekurangan-kekurangan karena


keterbatasan pengetahuan. Oleh karena itu kami mengharapkan kritik atau saran dari para
pembaca untuk menyempurnakan makalah ini.

Akhirnya kami mengharapkan semoga tugas ini dapat bermanfaat bagi kita semua.
Amin.

Penulis,

Kelompok 2
BAB I
PENDAHULUAN

1.1. Latar Belakang

Statistik merupakan sebuah metoda perhitungan yang mampu membantu banyak


kalangan manusia pada saat ini. Baik dalam kehidupan secara umum, sekolah,
perkuliahan, perkantoran dan lain sebagainya. Tidak hanya sampai di sana, statistik juga
digunakan untuk membantu dalam hal penelitian, bahkan membuat karya ilmiah seperti
skripsi, tesis dan disertasi. Hal ini juga diungkapkan Riduwan (2009), “statistik
merupakan alat untuk mempermudah perhitungan angka-angka atau data. Dari berbagai
kehidupan akan membutuhkan statistik untuk menganalisis sesuatu”.
Dalam pembuatan karangan ilmiah begitu banyak materi-materi dari statistik yang
digunakan, mulai dari distribusi frekuensi, uji t, korelasi, regresi, ukuran letak (ukuran
lokasi) dan lain sebagainya, yang digunakan untuk membantu memudahkan dalam
pengolahan data dari hasil penelitian terutama pada penelitian kuantitatif. Dalam
penelitian tersebut, statistik sangatlah peran penting. Menurut Andi (2007: 69), ukuran
lokasi (ukuran letak) dimaksudkan sebagai besaran atau ukuran untuk mendapatkan
gambaran yang lebih jelas berdasarkan letak data dari sekumpulan data yang dipunyai.
Ukuran ini sangat berarti dalam rangka melakukan analisis data.
Penggunaan statistika dalam segala bidang akan mempengaruhi tingkat analisis dari
hasil penelitian yang sedang dilakukan. Penelitian yang menggunakaan aspek perhitungan
statistik akan memperoleh data yang hamper mendekati benar atau dengan
memperhatikan dari analisa regresi. Untuk mengukur besarnya pengaruh variabel bebas
terhadap variabel tergantung dan memprediksi variabel tergantung dengan menggunakan
variabel bebas. Analisis regresi sebagai kajian terhadap hubungan satu variabel yang
disebut sebagai variabel yang di terangkan (the explained variabel) dengan satu atau dua
variabel yang menerangkan (the explanatory) . Variabel pertama disebut juga sebagai
variabel tergantung dan variabel kedua disebut juga sebagai variabel bebas. Jika variabel
bebas lebih dari satu, maka analisis regresi disebut regresi linear berganda. Disebut
berganda karena pengaruh bebrapa variabel bebas akan dikenakan variabel tergantung.
Regresi merupakan suatu teknik statistika yang dapat digunakan untuk
menggambarkan hubungan fungsional antara suatu variabel tak bebas (respon) dengan
satu atau beberapa variabel bebas (deterministik). Menurut Drapper and Smith (1992)
analisis regresi merupakan metode analisis yang dapat digunakan untuk menganalisis
data dan mengambil kesimpulan yang bermakna tentang hubungan ketergantungan
variabel terhadap variabel lainnya.
Analisa regresi berganda adalah salah satu metode statistika yang sering
digunakan untuk mengetahui sejauh mana ketergantungan dan hubungan sebuah
variabel tak bebas dengan sebuah atau lebih variabel bebas, bila dalam analisisnya
hanya melibatkan sebuah variabel bebas maka regresi linier sederhana. Sedangkan
bila dalam analisisnya melibatkan dua atau lebih variabel bebas maka analisis yang
digunakan adalah analisis linear berganda. Hubungan dan pengaruh dua variabel
tersebut bermanfaat untuk mengetahui kondisi atau dampak yang terjadi akibat adanya
perubahan suatu variabel terhadap variabel lainnya, sehingga dapat disusun suatu
rencana dalam menghadapi dampak tersebut Seringkali digunakan untuk mengatasi
permasalahan analisis regresi yang melibatkan hubungan dari dua atau lebih variabel
bebas.
Regresi linear adalah alat statistik yang dipergunakan untuk mengetahui pengaruh
antara satu atau beberapa variabel terhadap satu buah variabel. Variabel “penyebab”
atau yang dikenal sebagai variabel yang mempengaruhi disebut dengan bermacam-
macam istilah: variabel independen, variabel bebas, variabel penjelas, variabel
eksplanatorik, atau variabel X (karena seringkali digambarkan dalam grafik sebagai
absis, atau sumbu X). Sedangkan, variabel “akibat” dikenal sebagai variabel yang
dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Secara umum,
persamaan regresi dapat terdiri dari satu atau lebih peubah bebas namun hanya
memiliki satu peubah terikat.
Analisis regresi membentuk persamaan garis lurus (linear) dan menggunakan
persamaan tersebut untuk membuat perkiraan (prediction). Berdasarkan jumlah
variabel bebas, analisis regresi linear yang terdiri dari dua variabel dikenal dengan
analisis linear sederhana, sedangkan yang lebih dari dua variabel disebut analisis
linear berganda dan yang akan kita pelajari lebih lanjut.
Dalam suatu penelitian, pada beberapa kenyataan akan ada lebih dari satu variabel
independen yang mempengaruhi variabel dependen yang kita inginkan. Misalnya,
keadaan dimana kemampuan komunikasi adalah variabel yang mempengaruhi nilai
prestasi kerja. Keadaan demikian kelihatannya sangat tidak realistik. Kenyataannya,
yang mempengaruhi prestasi kerja tidak hanya kemampuan komunikasi namun dapat
pula dilihat misalnya dari kemampuan bekerjasama, kemampuan IT, kemampuan
berbahasa inggrisnya dan lainnya. Untuk menganalisis beberapa variabel yang
mempengaruhi satu variabel lain maka kita menggunakan analisis regresi linear
berganda.
Regresi pertama-tama dipergunakan sebagai konsep statistik pada tahun 1877 oleh
Sir Francis Galton, seorang ilmuwan asal Inggris yang melakukan studi tentang
kecenderungan tinggi badan anak. Hasil studi tersebut memberikan suatu kesimpulan
bahwa kecenderungan tinggi badan anak yang lahir terhadap orangtuanya adalah
menurun (regress) mengarah pada tinggi badan rata-rata penduduk. Istilah regresi
pada mulanya bertujuan untuk membuat perkiraan nilai satu variabel (tinggi badan
anak) terhadap satu variabel yang lain (tinggi badan orangtua). Selanjutnya
berkembang menjadi alat untuk membuat perkiraan nilai suatu variabel dengan
menggunakan beberapa variabel lain yang berhubungan dengan variabel tersebut.
Model regresi linier berganda untuk dua variabel bebas dan satu variabel terikat
adalah sebagai berikut:

Gambar 1.1. Model Regresi Linier Berganda

Model diatas dapat dijelaskan bahwa dalam model regresi linier berganda
mempunyai dua uji pengaruh yaitu :
1. Pengaruh variabel X (bebas) secara simultan terhadap variabel Y (terikat)
2. Pengaruh variabel X (bebas) secara parsial terhadap variabel Y (terikat), yaitu
meliputi :
a. Pengaruh variabel X1 terhadap variabel Y
b. Pengaruh variabel X2 terhadap variabel Y

1.2. Rumusan Masalah

1. Bagaimana menentukan ukuran posisi ?


2. Bagaimana mendapatkan persamaan regresi linear berganda ?
3. Bagaimana menentukan pengaruh signifikansi dari variabel terikat dan variabel
bebas?
3.1. Tujuan Penulisan

Adapun tujuan dari penulisan tugas ini sebagai berikut :

1. Memahami dan menghitung ukuran posisi.


2. Menggambarkan hubungan antara beberapa variabel bebas dengan variabel terikat
melalui analisis regresi berganda.
3. Membuat, menafsirkan, dan menggunakan tabel ANOVA.
4. Menghitung dan menafsirkan ukuran kekuatan hubungan dalam regresi berganda.
5. Melakukan uji hipotesis untuk menentukan apakah sekumpulan koefisien regresi tidak
sama dengan nol.
6. Melakukan uji hipotesis dari setiap koefisien regresi.
7. Menggunakan analisis residu untuk mengevaluasi asumsi analisis regresi berganda.
8. Menilai pengaruh dari variabel bebas yang berkorelasi.
9. Menilai dan menggunakan variabel bebas kualitatif.
10. Menjelaskan interaksi yang mungkin di antara variabel bebas.
11. Menjelaskan regresi berjenjang.

3.2. Metode Penulisan

1. Studi Literatur
2. Pembahasan Studi Kasus

3.3. Manfaat Penulisan

Hasil laporan ini adalah memberikan pemahaman tentang :


1. mengenai ukuran lokasi tersebut baik kuartil, desil maupun persentil agar mampu
menganalisis data pada saat penelitian
2. Model regresi dapat digunakan untuk mengukur keeratan hubungan antara variabel
dependen (tak bebas) dan variabel independen (bebas).
3. Model regresi dapat digunakan untuk mengetahui pengaruh suatu atau beberapa
variabel independen terhadap variabel dependen (respons).
4. Model regresi berguna untuk memprediksi pengaruh suatu atau beberapa variabel
independen terhadap variabel dependen (respons).
BAB II
LANDASAN TEORI

2.1 Ukuran Posisi


Standar deviasi merupakan ukuran dispersi yang paling banyak digunakan. Akan
tetapi, terdapat cara lain dalam menggambarkan variasi atau sebaran pada sekelompok data.
Salah satu metodenya ialah menentukan lokasi nilai yang membagi sekelompok pengamatan
ke dalam bagian yang sama. Ukuran tersebut terdiri atas kuartil, desil, dan persentil.
Kuartil membagi sekelompok pengamatan menjadi empat bagian yang sama. Sebagai
penjelasan lebih lanjut, pikirkan sekelompok nilai tertentu yang disusun dari yang terkecil
hingga yang terbesar. Nilai tengah dari sekelompok data yang disusun dari yang terkecil
hingga yang terbesar adalah median. Yakni 50 persen pengamatan lebih besar dari median
dan 50 persen lebih kecil. Median merupakan ukuran lokasi karena median menunjukkan
pemusatan data. Dalam hal yang sama, kuartil membagi sekelompok pengamatan ke dalam
empat bagian yang sama. Kuartil pertama, biasanya dilambangkan Q1, merupakan nilai di
bawah 25 persen dari pengamatan yang terjadi, dan kuartil ketiga, biasanya dilambangkan Q3,
merupakan nilai di bawah 75 persen dari pengamatan yang terjadi. Logikanya, Q2 merupakan
median. Q1 dapat dianggap median dari separuh data terbawah dan Q3 sebagai median
separuh data teratas.
Dengan cara yang sama, desil membagi sekelompok pengamatan ke dalam 10 bagian
yang sama dan persentil ke dalam 100 bagian yang sama. Jadi, jika anda mendapat IPK anda
berada pada desil kedelapan di universitas anda, anda dapat menyimpulkan bahwa 80 persen
mahasiswa memiliki IPK di bawah IPK anda dan 20 persen memiliki IPK yang lebih tinggi.
IPK pada persentil ke-33 berarti bahwa 33 persen mahasiswa yang memiliki IPK lebih rendah
dan sebanyak 67 persen memiliki IPK yang lebih tinggi. Angka persentil sering kali
digunakan untuk melaporkan hasil dari ujian berstandar nasional, misalnya SAT, ACT,
GMAT (digunakan sebagai syarat masuk menuju berbagai program master administrasi
bisnis), dan LSAT (digunakan sebagai syarat m
asuk menuju sekolah hokum).

Kuartil, Desil, dan Persentil


Secara umum kuartil merupakan sekumpulan data yang dibagi menjadi empat bagian
yang sama banyak, sesudah disusun menurut urutan nilainya, maka bilangan pembaginya
disebut kuartil. Pengertian kuartil di atas juga didukung oleh Andi (2007: 80) menyebutkan,
nilai kuartil merupakan nilai dari sekumpulan data yang dibagi menjadi empat bagian yang
sama, dan yang membagi data tersebut dinamakan kuartil. Selain itu juga terdapat pengertian
lainnya yang menyebutkan kuartil merupakan nilai atau angka yang membagi data terkecil
sampai data terbesar atau sebaliknya dari data terbesar sampai data terkecil, (Riduwan, 2009:
104).
Menurut Andi (2007: 80), menyebutkan Ada tiga buah kuartil, yakni kuatil pertama,
kuartil kedua, dan kuartil ketiga yang masing-masing disingkat dengan K1, K2, dan K3.
Pemberian nama ini dimulai dari nilai kuartil paling kecil. Untuk menentukan nilai kuartil
dapat dilakukan dengan dua kategori yaitu, nilai kuartil yang belum dikelompokkan (data
tunggal), dan juga data yang sudah dikelompokkan (data kelompok).
Jika sekumpulan data dibagi menjadi 10 bagian yang sama, maka didapat sembilan
pembagi dan tiap pembagi dinamakan desil. Karenanya ada sembilan buah desil, ialah D1,
D2, …, D9. Hal ini diperkuat oleh Riduwan (2009: 111), menyatakan desil (Ds) ialah nilai
atau angka yang membagi data yang menjadi 10 bagian yang sama, setelah disusun dari data
terkecil sampai data terbesar atau sebaliknya.
Berdasarkan penjelasan di atas, maka data diartikan bahwa desil (Ds) merupakan
angka yang membagi data menjadi 10 bagian yang sama setelah melalui penyusunan data
terlebih dahulu. Data itu dapat disusun dimulai dari angka terkecil sampai dengan angka
terbesar. Menurut Riduwan pada bukunya (2009: 111), menyebutkan bahwa cara mencari
desil hampir sama dengan mencari kuartil hanya bedanya terletak pada pembagian saja.
Harga-harga desil di wakili dengan: D1, D2, D3, . . . . . . . . . . D9. Untuk menentukan nilai
desil dapat dilakukan dengan dua kategori yaitu, nilai desil yang belum dikelompokkan (data
tunggal), dan juga data yang sudah dikelompokkan (data kelompok).
Sekumpulan data yang dibagi menjadi 100 bagian yang sama, akan menghasilkan 99
pembagi berturut-turut yang dinamakan persentil pertama, persentil kedua, …, persentil ke-
99. Penjelasan di atas juga didukung oleh Riduwan (2009: 114), menyatakan persentil (Ps)
ialah nilai yang membagi data menjadi 100 bagian yang sama. Setelah disusun dari angka
terkecil sampai ke yang terbesar. Harga persentil ada 99 bagian yaitu Ps1, Ps2, Ps3, .......,
Ps99. Penjelasan lain juga disampaikan oleh Andi (2007: 85), menyatakan nilai persentil
merupakan nilai yang sekumpulan data yang dibagi menjadi seratus bagian yang sama, dan
yang membagi data tersebut dinamakan persentil.
Berdasarkan penjelasan di atas, maka dapat dikatakan bahwa persentil merupakan
nilai dari sekumpulan data yang dibagi menjadi 100 bagian yang sama. Selain itu persentil

8
memiliki 99 bagian, dimulai dari Ps1 sampai dengan Ps99. Menurut Andi (2007: 85), untuk
menentukan nilai-nilai persentil tersebut dapat dibagi menjadi dua yaitu data yang belum
dikelompokkan (data tunggal) dan data yang sudah dikelompokkan (data kelompok).
Guna merumuskan prosedur perhitungan, Lp menunjukkan lokasi dari persentil yang
diinginkan. Jadi, jika kita ingin mencari persentil ke-33, kita akan menggunakan L33 dan jika
kita menginginkan mediannya, persentil ke-50, maka L50. Jumlah obeservasi adalah n, jadi
jika kita ingin menemukan median, letaknya berada pada (n+1)/2, atau kita dapat
menuliskannya sebagai (n+1)/(P/100), di mana P merupakan persentil yang diinginkan.
𝑃
Lokasi Persentil Lp = (n+1)100

2.2 Analisis Regresi Berganda

2.2.1 Pengantar
Analisis regresi merupakan studi dalam menjelaskan dan mengevaluasi
hubungan antara suatu peubah bebas (independent variable) dengan satu peubah tak bebas
(dependent variable) dengan tujuan untuk mengestimasi dan atau meramalkan nilai peubah
tak bebas didasarkan pada nilai peubah bebas yang diketahui (Widarjono, 2005).

Analisis regresi adalah teknik statistika yang berguna untuk memeriksa dan memodelkan
hubungan diantara variabel-variabel. Penerapannya dapat dijumpai secara luas di banyak
bidang seperti teknik, ekonomi, manajemen, ilmu-ilmu biologi, ilmu-ilmu sosial, dan ilmu-
ilmu pertanian. Pada saat ini, analisis regresi berguna dalam menelaah hubungan dua variabel
atau lebih, dan terutama untuk menelusuri pola hubungan yang modelnya belum diketahui
dengan sempurna, sehingga dalam penerapannya lebih bersifat eksploratif.

Analisis regresi dikelompokkan dari mulai yang paling sederhana sampai yang paling
rumit, tergantung tujuan yang berlandaskan pengetahuan atau teori sementara, bukan asal
ditentukan saja. jika dalam persamaan regresi hanya terdapat satu variabel terikat,maka
disebut sebagai regresi sederhana. Sedangkan jika variabel bebasnya lebih dari satu, maka
disebut sebagai persamaan regresi berganda

Analisis regresi merupakan analisis data untuk mengetahui seberapa besar pengaruh suatu
variabel independen terhadap variabel dependen. Analisis regresi terbagi menjadi regresi
linear dan nonlinear. Regresi linear dibagi menjadi dua bagian yaitu, regresi linear sederhana
9
dan regresi linear berganda. Analisis regresi adalah salah satu analisis yang paling populer
dan luas pemakaiannya. Hampir semua bidang ilmu yang memerlukan analisis sebab-akibat
boleh dipastikan mengenal analisis ini.

Koefisien yang mendekati nilai plus atau minus 1,00 (misalnya, - 0,88 atau 0,78)
menunjukkan hubungan linier yang sangat kuat, sementara nilai yang mendekati 0 (misalnya,
- 0,12 atau 0,18 ) menunjukkan hubungan yang lemah. Selanjutnya, dikembangkan prosedur
dalam menentukan persamaan linier untuk menunjukkan hubungan antara dua variable yang
disebut sebagai garis regresi. Garis tersebut menggambarkan hubungan antar variabel. Garis
tersebut juga menggambarkan keseluruhan pola dari suatu variabel terikat (y) terhadap suatu
variabel bebas atau penjelas (X).
Dalam regresi dan korelasi linier berganda, digunakan variabel bebas tambahan (X1,
X2,…..,dan seterusnya) yang membantu menjelaskan atau meramalkan variabel terikatnya
(Y) dengan lebih baik. Hampir seluruh gagasan yang diamati dalam regresi dan korelasi linier
sederhana berkembang menjadi situasi yang lebih umum. Akan tetapi, variabel bebas
tambahan mendorong munculnya bebarapa pertimbangan baru. Analisis regresi berganda
dapat digunakan baik sebagai teknik deskriptif maupun sebagai inferensial.

2.2.2 Analisis Regresi Berganda

Regresi berganda seringkali digunakan untuk mengatasi permasalahan analisis regresi


yang melibatkan hubungan dari dua atau lebih variabel bebas. Pada awalnya regresi berganda
dikembangkan oleh ahli ekonometri untuk membantu meramalkan akibat dari aktivitas-
aktivitas ekonomi pada berbagai segmen ekonomi. Misalnya laporan tentang peramalan masa
depan perekonomian di jurnal-jurnal ekonomi (Business Week, Wal Street Journal, dll), yang
didasarkan pada model-model ekonometrik dengan analisis berganda sebagai alatnya. Salah
satu contoh penggunaan regresi berganda dibidang pertanian diantaranya ilmuwan pertanian
menggunakan analisis regresi untuk menjajagi antara hasil pertanian (misal: produksi padi
per hektar) dengan jenis pupuk yang digunakan, kuantitas pupuk yang diberikan, jumlah hari
hujan, suhu, lama penyinaran matahari, dan infeksi serangga.Model regresi linier berganda
merupakan pengembangan signifikan dari model regresi linier sederhana. Jika regresi
sederhana hanya ada satu variabel dependen (Y) dan satu variabel independen (X), maka
pada kasus regresi berganda, terdapat satu variabel dependen dan lebih dari satu variabel
independen.
10
Bentuk deskriptif yang umum dari persamaan linier berganda terlihat dari menggunakan
symbol k untuk mewakili jumlah variabel bebas. Nilai k dapat berupa sembarang bilangan
bulat positif.

Persamaan Umum Regresi Berganda Ŷ=a+b1X1+ b2X2+ b3X3+…+bkXk


Keterangan :
a = titik potong, yaitu nilai Y ketika seluruh X sama dengan nol.
b1= jumlah perubahan Y ketika X1 bertambah 1 (satu) unit dengan nilai seluruh variabel
bebas lainnya tetap konstan. Indeks huruf j hanya merupakan symbol yang membantu
mengenali tiap-tiap variabel bebas ; yang tidak digunakan pada bagian manapun dalam
perhitungan. Biasanya indeks tersebut merupakan nilai bilangan di antara 1 dan k yang
merupakan jumlah variabel bebasnya. Akan tetapi, indeks tersebut juga dapat berupa kata
yang pendek atau singkatan misalnya “usia”.
Analisis regresi menggambarkan dan menguji hubungan antara variabel terikat Ŷ
dengan suatu variabel bebas X. Hubungan antara Ŷ dan X secara grafis digambarkan oleh
sebuah garis. Ketika terdapat dua variabel bebas, persamaan regresinya adalah :
Ŷ=a+b1X1+ b2X2
Oleh karena terdapat dua variabel bebas, hubungan tersebut secara grafis
digambarkan berupa bidang yang ditunjukkan pada diagram 14-1. Diagram tersebut
menunjukkan residu sebagai selisih antara Y actual dengan Ŷ yang sesuai pada bidang. Jika
analisis regresi berganda mencakup lebih dari dua variabel bebas, maka tidak dapat
digunakan grafik untuk menggambarkan analisis karena grafik hanya terbatas untuk tiga
dimensi.
Untuk menggambarkan penafsiran titik potong beserta dua koefisien regresi.,
andaikan terdapat sebuah mobil yang dapat menempuh jarak (dalam satuan mil) per gallon
bensin yang berbanding lurus dengan nilai oktana bensin yang sedang digunakan (X1) dan
berbanding terbalik dengan berat mobil (X2). Asumsikan bahwa persamaan regresinya yang
dihitung melalui perangkat lunak statistik adalah :
Ŷ=6,3+0,2X1-0,001X2
Nilai titik potong sebesar 6,3 menunjukkan persamaan regresi yang bersinggungan
dengan sumbu Y di titik 6,3 ketika X1 dan X2 sama dengan nol. Tentunya, tidak masuk akal
jika ada mobil yang tidak memiliki berat (nol) dan yang menggunakan bensin tanpa oktana.
Penting untuk diingat bahwa persamaan regresi tidak digunakan secara umum di luar kisaran
nilai sampel.
11
Nilai b1 sebesar 0,2 menunjukkan bahwa setiap kenaikan 1 nilai oktana bensin, mobil
akan menempuh jarak lebih dari 2/10 mil per galon, tidak peduli berapapun berat mobilnya.
Nilai b2 sebesar -0,001 menunjukkan bahwa untuk setiap kenaikan 1 pon berat mobil, jarak
yang ditempuh per gallon menurun sebesar 0,001, tanpa menghiraukan nilai oktana bensin
yang digunakan.
Sebagai contoh, mobil yang menggunakan bensin oktana 92 dan memiliki berat 2.000
pon rata-rata akan menempuh jarak 22,7 mil per gallon, diperoleh dari :
Ŷ=a+b1X1+ b2X2 = 6,3 + 0,9(92) – 0,001 (2.000) = 22,7
Nilai koefisien pada persamaan linier berganda diperoleh melalui metode kuadrat
terkecil. Metode kuadrat terkecil membuat jumlah kuadrat selisih antara nilai actual dengan
nilai Y yang sesuai bernilai sekecil mungkin, yakni komponen Σ (Y-Ŷ)2 minimum.
Perhitungan tersebut biasanya dikerjakan dengan paket perangkat lunak statistic, misalnya
excel atau minitab.
Menurut Tiro (2006), asumsi untuk regresi linear berganda yaitu :
1. Asumsi Eksistensi
Untuk setiap kombinasi khusus nilai-nilai tetap dari variabel bebas (dasar) 𝑋1 , 𝑋2 , … , 𝑋𝑘
(misalnya X1= 57, X2 = 8) adalah variabel acak (univariate) dengan distribusi peluang
tertentu yang mempunyai nilai rata-rata dan variansi terhingga.

2. Asumsi Kebebasan
Nilai-nilai Y adalah hasil pengamatan yang bebas statistik antara satu dengan lainnya.

3. Asumsi kelinearan
Nilai rata-rata Y, untuk setiap kombinasi nilai khusus dari 𝑋1 , 𝑋2 , … , 𝑋𝑘 dan ditulis
dengan notasi 𝜇𝑌|𝑋1 ,𝑋2,…,𝑋𝑘 adalah sebuah fungsi linear dari 𝑋1 , 𝑋2 , … , 𝑋𝑘 ; yakni:

𝜇𝑌|𝑋1 ,𝑋2 ,…,𝑋𝑘 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝜀

Atau

𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝜀

4. Asumsi Kehomogenan
Variansi Y sama untuk setiap kombinasi tertentu dari 𝑋1 , 𝑋2 , … , 𝑋𝑘 , yakni

2
𝜎𝑌|𝑋1 ,𝑋2 ,…,𝑋𝑘
≡ 𝑉𝑎𝑟(𝑌|𝑋1 , 𝑋2 , … , 𝑋𝑘 ) ≡ 𝜎 2

12
5. Asumsi Kenormalan
Untuk setiap nilai kombinasi tertentu 𝑋1 , 𝑋2 , … , 𝑋𝑘 , Y mempunyai distribusi normal. Kita
gunakan simbol

𝑌 = 𝑁(𝜇𝑌|𝑋1 ,𝑋2 ,…,𝑋𝑘 , 𝜎 2 )

yang berarti Y berdistribusi normal dengan rata-rata 𝜇𝑌|𝑋1 ,𝑋2 ,…,𝑋𝑘 dan variansi 𝜎 2 . Asumsi ini
tidak diperlukan untuk membuat model regresi akan tetapi umumnya diperlukan untuk
membuat inferensi.

Misalkan banyaknya variabel bebas berjumlah 2 (k=2), nilai data variabel tersebut, dapat
dituliskan sebagai berikut:

(𝑥1𝑖 , 𝑥2𝑖 ), 𝑖 = 1,2, … , 𝑛

Untuk menghitung nilai 𝛽̂ 0, 𝛽̂ 1, 𝛽̂ 2 apabila k=2 sebagai taksiran 𝛽0, 𝛽1 , 𝛽2 melalui metode
OLS (Ordinary Least Square) dengan hasil sebagai berikut:

𝑏0 = 𝑌̅ − 𝑏1 𝑋̅1 − 𝑏2 𝑋̅2

(∑𝑛 2 𝑛 𝑛 𝑛
𝑖=1 𝑥2𝑖 )(∑𝑖=1 𝑥1𝑖 𝑦𝑖 )−(∑𝑖=1 𝑥1𝑖 𝑥2𝑖 ) (∑𝑖=1 𝑥2𝑖 𝑦𝑖 )
𝑏1 = 2
(∑𝑛 2 𝑛 2 𝑛
𝑖=1 𝑥1𝑖 )(∑𝑖=1 𝑥2𝑖 )− (∑𝑖=1 𝑥1𝑖 𝑌2𝑖 )

(∑𝑛 2 𝑛 𝑛 𝑛
𝑖=1 𝑥1𝑖 )(∑𝑖=1 𝑥2𝑖 𝑦𝑖 )−(∑𝑖=1 𝑥1𝑖 𝑥2𝑖 ) (∑𝑖=1 𝑥1𝑖 𝑦𝑖 )
𝑏2 = 2
(∑𝑛 2 𝑛 2 𝑛
𝑖=1 𝑥1𝑖 )(∑𝑖=1 𝑥2𝑖 )− (∑𝑖=1 𝑥1𝑖 𝑥2𝑖 )

2.2.3 Pengujian Analisis Linear Berganda


Menurut Julie Pallant dan Andy Field, Uji Regresi Berganda punya sejumlah asumsi
yang tidak boleh dilanggar. Asumsi-asumsi Uji Regresi Berganda adalah:

1. Ukuran Sampel
Masalah berkenaan ukuran sampel di sini adalah generabilitas. Dengan sampel kecil
anda tidak bisa melakukan generalisasi (tidak bisa diulang) dengan sampel lainnya. Berbeda
penulis berbeda berapa sampel yang seharusnya dalam uji Regresi Berganda. Stevens (1996,
p.72) merekomendasikan bahwa “untuk penelitian ilmu sosial, sekitar 15 sampel per
prediktor (variabel bebas) dibutuhkan untuk mengisi persamaan uji regresi.” Tabachnick and

13
Fidell (1996, p.132) memberi rumus guna menghitung sampel yang dibutuhkan uji Regresi,
berkaitan dengan jumlah variabel bebas yang digunakan :
n > 50 + 8m
Dimana :
n = Jumlah Sampel
m = Jumlah Variabel Bebas

2. Outlier
Regresi Berganda sangat sensitif terhadap Outlier (skor terlalu tinggi atau terlalu
rendah). Pengecekan terhadap skor-skor ekstrim seharusnya dilakukan sebelum melakukan
Regresi Berganda. Pengecekan ini dilakukan baik terhadap variabel bebas maupun terikat.
Outlier bisa dihapus dari data atau diberikan skor untuk variabel tersebut yang tinggi, tetapi
tidak terlampau beda dengan kelompok skor lainnya. Prosedur tambahan guna mendeteksi
outlier juga terdapat pada program SPSS file mah_1. Outlier pada variabel terikat dapat
diidentifikasi dari Standardised Residual plot yang dapat disetting. Tabachnick and Fidell
(1996, p. 139) menentukan outlier adalah nilai-nilai Standardised Residual di atas 3,3 (atau <
- 3,3).
Outlier juga bisa dicek menggunakan jarak Mahalanobis yang tidak diproduksi oleh
program Regresi Berganda SPSS ini. Ia tidak terdapat dalam output SPSS. Untuk
mengidentifikasi sampel mana yang merupakan Outlier, anda perlu menentukan nilai kritis
Chi Square, dengan menggunakan jumlah variabel bebas yang digunakan dalam penelitian
sebagai “degree of freedom-nya” atau derajat kebebasan.

3. Normalitas Residu
Normalitas adalah residu yang seharusnya terdistribusi normal seputar skor-skor
variabel terikat. Residu adalah sisa atau perbedaan hasil antara nilai data pengamatan variabel
terikat terhadap nilai variabel terikat hasil prediksi. Untuk melihat apakah residu normal atau
tidak, dapat dilakukan dengan cara berikut:
 Melihat grafik Normal P-P Plot, dan
 Uji Kolmogorov-Smirnov
Pada grafik Normal P-P Plot, residu yang normal adalah data memencar mengikuti fungsi
distribusi normal yaitu menyebar seiring garis z diagonal. Residu normal dari uji
Kolmogorov-Smirnov adalah diperolehnya nilai p > 0,05.

14
Linieritas adalah residual yang seharusnya punya hubungan dalam bentuk “straight-line”
dengan skor variabel terikat yang diprediksi. Homoskedastisitas adalah varians residual
seputar skor-skor variabel terikat yang diprediksi seharusnya sama bagi skor-skor yang
diprediksi secara keseluruhan.

4. Multikolinieritas
Uji Regresi mengasumsikan variabel-variabel bebas tidak memiliki hubungan linier
satu sama lain. Sebab, jika terjadi hubungan linier antarvariabel bebas akan membuat prediksi
atas variabel terikat menjadi bias karena terjadi masalah hubungan di antara para variabel
bebasnya.
Dalam Regresi Berganda dengan SPSS, masalah Multikolinieritas ini ditunjukkan
lewat tabel Coefficient, yaitu pada kolom Tolerance dan kolom VIF (Variance Inflated
Factors). Tolerance adalah indikator seberapa banyak variabilitas sebuah variabel bebas tidak
bisa dijelaskan oleh variabel bebas lainnya. Tolerance dihitung dengan rumus 1 – R2 untuk
setiap variabel bebas. Jika nilai Tolerance sangat kecil (< 0,10), maka itu menandakan
korelasi berganda satu variabel bebas sangat tinggi dengan variabel bebas lainnya dan
mengindikasikan Multikolinieritas. Nilai VIF merupakan invers dari nilai Tolerance (1 dibagi
Tolerance). Jika nilai VIF > 10, maka itu mengindikasikan terjadinya Multikolinieritas.

5. Autokorelasi
Autokorelasi juga disebut Independent Errors. Regresi Berganda mengasumsikan
residu observasi seharusnya tidak berkorelasi (atau bebas). Asumsi ini bisa diuji dengan
teknik statistik Durbin-Watson, yang menyelidiki korelasi berlanjut antar error (kesalahan).
Durbin-Watson menguji apakah residual yang berdekatan saling berkorelasi. Statistik
pengujian bervariasi antara 0 hingga 4 dengan nilai 2 mengindikasikan residu tidak
berkorelasi. Nilai > 2 mengindikasikan korelasi negatif antar residu, di mana nilai < 2
mengindikasikan korelasi positif. >
Cara melakukan uji Durbin-Watson adalah, nilai Durbin-Watson hitung harus lebih
besar dari batas atas Durbin-Watson tabel. Syarat untuk mencari Durbin-Watson tabel adalah
Tabel Durbin-Watson. Untuk mencari nilai Durbin-Watson tabel :
a. tentukan besar n (sampel) dan k (banyaknya variabel bebas).
b. Tentukan taraf signifikansi penelitian yaitu 0,05.
Durbin-Watson hitung dapat dicari dengan SPSS. Nilai Durbin-Watson hitung terdapat

15
dalam output SPSS, khususnya pada tabel Model Summary. Hipotesis untuk Autokorelasi ini
adalah :

6. Homoskedastisitas
Uji Regresi bisa dilakukan jika data bersifat Homoskedastisitas bukan
Heteroskedastisitas. Homoskedastisitas adalah kondisi dalam mana varians dari data adalah
sama pada seluruh pengamatan. Terdapat sejumlah uji guna mendeteksi gejala
heteroskedastisitas misalnya uji Goldfeld-Quandt dan Park. Namun, Wang and Jain
beranggapan bahwa Uji Park dapat lebih teliti dalam memantau gejala heteroskedastisitas ini.
Dengan demikian, penelitian ini akan menggunakan Uji Park guna menentukan gejala
heteroskedastisitas variabel-variabelnya.
Uji Park dilakukan dengan meregresikan nilai residual (Lne2) dengan masing-masing
variabel independent. Rumus uji Park sebagai berikut :

Cara melakukan Uji Park adalah sebagai berikut:


1. Dengan SPSS klik Analyze -->Regression --> Linear --> Masukkan variabel y ke
Dependent --> Masukkan variabel x1, x2, x3, x4 ke Independent(s) --> Klik Save --
> Pada Residual klik Unstandardized --> Continue --> OK
2. Pada SPSS klik Data View --> Cek bahwa ada satu variabel baru bernama res_1. Ini
merupakan nilai ε_i^ . Nilai ini harus dikuadratkan dengan cara (pada SPSS) klik
Transform --> Compute --> Isi Target Variable dengan ε_i^2 --> Pada operasi
hitung kalikan nilai ε_i^ dengan ε_i^ . Pada Variable View SPSS muncul variabel
baru bernama ε_i^2.
3. Dengan SPSS, tepatnya menu Transform --> Compute lakukan perubahan nilai
ε_i^2, X1, X2, X3, X4 ke dalam bentuk logaritma natural (Ln) [caranya dengan Klik
16
Ln lalu pindahkan variabel] Ln(ε_i^2 ) yaitu regresi unstandardized residual pada
Target Variable dinamai Lnei2; X1 yaitu variabel x1 pada Target Variable dinamai
Lnx1; X2 yaitu variabel x2 pada Target Variable dinamai Lnx2; x3 yaitu variabel x3
pada Target Variable dinamai Lnx3; x4 yaitu variabel x4 pada Target Variable
dinamai Lnx4.
4. Setelah diperoleh nilai variabel-variabel baru Lnei2, LnX1, LnX2, LnX3, dan
LnX4.
5. Lakukan uji regresi kembali secara satu per satu.
6. Pertama, klik Analyze --> Regression>Linear --> Masukkan variabel Lnei2 ke kotak
Dependent --> Masukkan variabel LnX1 ke Independent(s) --> OK. Sementara hasil
belum dihiraukan.
7. Kedua, klik Analyze --> Regression --> Linear --> Variabel Lnei2 masih ada di
Dependent, biarkan > Keluarkan LnX1 dan masukkan LnX2 ke Independent(s) >
OK. Sementara hasil belum dihiraukan.
8. Ketiga, klik Analyze --> Regression --> Linear --> Variabel Lnei2 masih ada di
Dependent, biarkan > Keluarkan LnX2 dan masukkan LnX3 ke Independent(s) >
OK. Sementara hasil belum dihiraukan.
9. Keempat, klik Analyze --> Regression --> Linear --> Variabel Lnei2 masih ada di
Dependent, biarkan > Keluarkan LnX3 dan masukkan LnX4 ke Independent(s) >
OK. Sementara hasil belum dihiraukan.
10. Perhatikan Output SPSS. Pada output, terdapat hasil perhitungan Park bagi variabel
x1, x2, x3 dan x4, tepatnya adalah hasil uji Lnei2 dengan LnX1, dan uji Lnei2
dengan LnX2, uji Lnei2 dengan LnX3, dan uji Lnei2 dengan LnX4.
11. Peneliti akan memperbandingkan apa yang tertera di tabel Coefficients, yaitu nilai t.
12. Guna memastikan apakah ada gejala heteroskedastisitas, peneliti akan
memperbandingkan nilai thitung dengan ttabel. Nilai ttabel dapat dicari pada Tabel t,
yaitu dengan menentukan df = n - 4 . n adalah jumlah sampel dan 4 karena jumlah
variabel independen penelitian adalah 4. Sehingga nilai df = 48 – 4 = 44. Dalam
taraf 0,05 uji yang dilakukan adalah 2 sisi sehingga singnifikansi pada tabel adalah
0,025.
Dengan mempertemukan nilai 46 dan 0,025 dan uji 2 sisi pada taraf 95% (0,025) pada
Tabel t diperoleh nilai t tabel penelitian sebesar ......
Hipotesis yang diajukan mengenai masalah homoskedastisitas ini sebagai berikut:

17
Jika uji Park dianggap terlampau rumit, maka pengujian alternatif dapat ditempuh
guna melihat apakah terjadi Homoskedastisitas atau Heteroskedastisitas.
Caranya dengan melihat grafik persilangan SRESID dengan ZPRED pada output hasil
SPSS. Caranya sebagai berikut :
1. Klik Analyze --> Regression --> Linear
2. Klik Plot.
3. Isikan SRESID pada y-axis dan ZPRED pada x-axis.
4. Klik Continue. Perhatikan grafik scatterplot. Ingat, Homoskedastisitas terjadi jika
varians dari residual satu pengamatan ke pengamatan lain tetap atau sama.
Heteroskedastisitas terjadi jika varians dari residual satu pengamatan ke
pengamatan lain tidak sama atau tidak tetap.
Homoskedastisitas terjadi jika tidak terdapat pola tertentu yang jelas, serta titik-titik
menyebar di atas dan di bawah angka 0 pada sumbu Y. Heteroskedastisitas terjadi jika
terdapat titik-titik memili pola tertentu yang teratur seperti bergelombang, melebar kemudian
menyempit.

2.2.4 Interpretasi Hasil Uji Regresi Berganda

Setelah uji Regresi Berganda selesai dilakukan, peneliti harus melakukan interpretasi.
Rumus Regresi Berganda (standar) adalah sebagai berikut:

18
Setelah pengujian Regresi Berganda dengan SPSS selesai, hal-hal penting untuk
interpretasi adalah apa yang tercantum pada tabel-tabel pada output SPSS.
a. Tabel Descriptives
Pada tabel Descriptive dapat dilihat nilai Standar Deviasi. Nilai ini terdapat
pada kolom Std. Deviation. Nilai ini nanti akan diperbandingkan dengan nilai Std.
Error of the Estimate.
b. Tabel Model Summary
Tabel ini memberi informasi seberapa baik model analisis kita secara
keseluruhan, yaitu bagaimana 4 variabel bebas mampu memprediksikan 1 variabel
terikat, dengan rincian sebagai berikut ini:
 Kolom Model. Menunjukkan berapa buah model analisis yang kita bentuk.
 Kolom R. Menunjukkan seberapa baik variabel-variabel bebas memprediksikan
hasil (multiple correlation coefficient). Kisaran nilai R adalah 0 hingga 1.
Semakin nilai R mendekati angka 1, maka semakin kuat variabel-variabel bebas
memprediksikan variabel terikat. Namun, ketepatan nilai R ini lebih
disempurnakan oleh kolom Adjusted R Square yang merupakan koreksi atas nilai
R.
 Kolom Adjusted R Square. Fungsinya menjelaskan apakah sampel penelitian
mampu mencari jawaban yang dibutuhkan dari populasinya. Kisaran nilai
Adjusted R Square adalah 0 hingga 1.
Kalikan Adjusted R2 dengan 100% maka akan diperoleh berapa % varians
tiap sampel pada variabel terikat bisa diprediksi oleh variabel-variabel bebas secara
bersama-sama (simultan).
Std. Error of the Estimate. Kolom ini menjelaskan seberapa kuat variabel-
variabel bebas bisa memprediksi variabel terikat. Nilai Std. Error of the Estimate
diperbandingkan dengan nilai Std. Deviation (bisa dilihat pada tabel Descriptives).
Jika Std. Error of the Estimate < Std. Deviation, maka Std. Error of the Estimate baik
untuk dijadikan prediktor dalam menentukan variabel terikat. Jika Std. Error of the
Estimate > Std. Deviation, maka Std. Error of the Estimate tidak baik untuk dijadikan
prediktor dalam mementukan variabel terikat.
 Durbin-Watson. Kolom ini digunakan untuk mengecek uji asumsi Autokorelasi.
Bagaimana variabel bebas yang satu berkorelasi dengan variabel bebas lainnya.
Durbin-Watson ini digunakan dalam uji asumsi Regresi sebelumnya.

19
2.2.5 Tabel Coefficients
Pada tabel Coefficient, mohon perhatikan lalu jelaskan nilai-nilai yang tertera pada
kolom-kolom berikut ini:
 Model. Kolom ini menjelaskan berapa banyak model analisis yang dibuat peneliti.
Pada kolom ini juga terdapat nama-nama variabel bebas yang digunakan dalam
penelitian. Variabel-variabel tersebut diberi label “Constant” yaitu nilai konstanta
yang digunakan dalam persamaan uji Regresi Berganda (a).
 Unstandardized Coefficient. Kolom ini terdiri atas b dan Std. Error. Kolom b
menunjukkan Koefisien b, yaitu nilai yang menjelaskan bahwa Y (variabel terikat)
akan berubah jika X (variabel bebas) diubah 1 unit.
 Standardized Coefficients. Pada kolom ini terdapat Beta. Penjelasan sebelumnya
mengenai nilai b punya masalah karena variabel-variabel kerap diukur
menggunakan skala-skala pengukuran yang berbeda. Akibatnya, kita tidak bisa
menggunakan nilai b guna melihat variabel-variabel bebas mana yang punya
pengaruh lebih kuat atas variabel terikat. Misalnya, jika variabel yang diteliti
adalah jenis kelamin yang punya skala minimal 1 dan maksimal 2 dan pengaruhnya
terhadap sikap yang skalanya minimal 1 dan maksimal 6, nilai b diragukan
efektivitas prediksinya. Ini akibat nilai yang diperolehnya rendah atas pengaruh
perbedaan skala pengukuran. Untuk memastikan pengaruh inilah maka nilai Beta
dijadikan patokan. Nilai Beta punya kisaran 0 hingga 1, di mana semakin
mendekati 1 maka semakin berdampak besar signifikansinya.
 Sig. Kolom ini menjelaskan tentang signifikansi hubungan antar variabel bebas
dengan variabel terikat. Nilai Sig. ini sebaiknya adalah di bawah 0,05 (signifikansi
penelitian).
 Tolerance. Kolom ini menjelaskan banyaknya varians pada suatu variabel yang
tidak bisa dijelaskan oleh variabel prediktor lainnya. Kisarannya 0 hingga 1, di
mana semakin mendekati 1 maka semakin mengindikasikan prediktor-prediktor
lain tidak bisa menjelaskan varians di variabel termaksud. Nilai yang semakin
mendekati 0 artinya hampir semua varians di dalam variabel bisa dijelaskan oleh
variabel prediktor lain. Nilai Torelance sebaiknya ada di antara 0,10 hingga 1.

20
2.2.6 Tabel ANOVA
Sig. Tabel ANOVA menunjukkan besarnya angka probabilitas atau
signifikansi pada perhitungan ANOVA. Nilai yang tertera digunakan untuk uji
kelayanan Model Analisis [dimana sejumlah variabel x mempengaruhi variabel y]
dengan ketentuan angka probabilitas yang baik untuk digunakan sebagai model
regresi harus < 0,05. Nilai ini bisa dilihat pada kolom Sig. Jika Sig. < 0,05, maka
Model Analisis dianggap layak. Jika Sig. > 0,05, maka Model Analisis dianggap tidak
layak.
Dalam Regresi Berganda, hal utama yang hendak dilihat adalah apakah
serangkaian variabel bebas secara serentak mempengaruhi variabel terikat. Dalam
output SPSS ini bisa ditentukan lewat tabel ANOVA.
Pada tabel ANOVA terdapat kolom F. Nilai yang tertera pada kolom F
tersebut disebut sebagai F hitung. F hitung ini diperbandingkan dengan F tabel.
Peraturannya:

Persoalannya, bagaimana menentukan F tabel? F tabel dapat ditentukan dengan cara:


a. Tentukan signifikansi penelitian yaitu 0,05 (uji 2 sisi jadi 0,025.
b. Tentukan df1. Df1 diperoleh dari jumlah variabel bebas
c. Tentukan df2. Df2 diperoleh dari n – k – 1 = 48 – 4 – 1 = 43.
d. Cari angka 43 dan 4 dalam tabel F untuk signifikansi 0,025.
e. Dengan Excel, ketikkan rumus =FINV(0,05;4;43)
Selain perbandingan nilai F, penerimaan atau penolakan Hipotesis juga bisa
menggunakan nilai Sig. pada tabel ANOVA. Peraturannya :

21
2.2.7 Koefisien Determinasi
Dalam uji Regresi Berganda, Koefisien Determinasi digunakan untuk
mengetahui persentase sumbangan pengaruh serentak variabel-variabel bebas
terhadap variabel terikat. Untuk itu, digunakan angka-angka yang ada pada Tabel
Model Summary.
Cara menentukan Koefisien Determinasi sangatlah mudah. Peneliti tinggal
melihat nilai pada kolom R2 dikalikan 100%. Misalnya nilai R2 adalah 0,7777.
Dengan demikian Koefisien Determinasinya = 0,7777 x 100% = 77,77%. Jadi, secara
serentak variabel-variabel bebas mempengaruhi variabel terikat sebesar 77,77%.
Sisanya, yaitu 100 – 77,77% = 22,23% ditentukan oleh variabel-variabel lain yang
tidak disertakan di dalam penelitian.

2.2.8. Koefisien Regresi Parsial


Koefisien Regresi Parsial menunjukkan apakah variabel-variabel bebas punya
pengaruh secara parsial (terpisah atau sendiri-sendiri) terhadap variabel terikat?
Pada Tabel Coefficient, pengujian Hipotesis akan dilakukan. Uji hipotesis
dilakukan dengan menggunakan Uji t. Pernyataan Hipotesis yang hendak diuji
sebagai berikut:

22
Nilai t hitung bisa dilihat pada kolom t bagi masing-masing variabel bebas. Nilai t
tabel bisa dicari dengan cara berikut ini :
 α = 0,05; untuk uji 2 sisi = 0,025
 Degree of Freedom (df) = jumlah sampel – jumlah variabel bebas – 1 (angka 1
adalah konstanta) = 48 – 4 – 1 = 43.
 Cari persilangan antara df = 43 dan 0,025.
 Pencarian nilai t tabel dengan Excel mudah sekali. Ketik rumus =tinv(0,05;43).

23
BAB III
PEMBAHASAN

3.1 Menggambarkan Data : Menampilkan dan Menjelajahi Data

Soal
Bab 4
B.Wildcat Plumbing Supply Inc. : Apakah kami memiliki perbedaan jenis kelamin ?

Wildcat Plumbing Supply telah melayani kebutuhan pipa ledeng di Southwest


Arizona selama lebih dari 40 tahun. Perusahaan didirikan oleh Terrence St. Julian dan
dioperasikan hari ini oleh putranya, Cory. Perusahaan berkembang dari seorang pegawai ahli
hingga lebih dari 500 saat ini. Cory berfokus pada beberapa posisi di dalam perusahaan ini
dimana ia memiliki pria dan wanita yang mengerjakan pekerjaan utama yang sama namun
dengan bayaran berbeda. Untuk memeriksanya, ia mengumpulkan informasi berikut.
Anggaplah anda adalah siswa magang di Departemen Akuntansi dan diberi tugas
untuk menulis laporan yang merangkum situasi tersebut.

Upah Tahunan (ribu $) Perempuan Laki-Laki


Kurang dari 30 2 0
30 hingga 40 3 1
40 hingga 50 17 4
50 hingga 60 17 24
60 hingga 70 8 21
70 hingga 80 3 7
80 atau lebih 0 3

Untuk menyelesaikan proyek, Cory St. Jullian menyelenggarakan pertemuan dengan


stafnya dan Anda diundang. Pada pertemuan tersebut, Anda diminta menghitung beberapa
ukuran lokasi, menggambar diagram, semisal distribusi frekuensi kumulatif, dan menentukan
kuartil bagi pria dan wanita. Buatlah diagram dan tulislah laporan yang merangkum gaji
tahunan pegawai di Wildcat Plumbing Supply. Apakah terlihat terdapat perbedaan bayaran
berdasarkan jenis kelamin ?

24
Penyelesaian :
Tabel Prosentase Jumlah Pegawai dan Upah Tahunannya
UpahTahunan (ribu $) Perempuan Laki-laki Perempuan Laki-laki
<30 2 0 4% 0,00%
30-40 3 1 6% 1,67%
40-50 17 4 34% 6,67%
50-60 17 24 34% 40,00%
60-70 8 21 16% 35,00%
70-80 3 7 6% 11,67%
≥80 0 3 0% 5,00%
50 60 100% 100,00%

Berdasarkan hasil table diatas dibuatkan table histogram dan diagram frekuensi upah tahunan
masing-masing jenis kelamin seperti yang ditunjukan pada gambar di bawah ini.

Histogram Upah Tahunan (ribu $)


30

25

20
Frekuensi

15
Perempuan
Laki-Laki
10

0
<30 30-40 40-50 50-60 60-70 70-80 ≥80
Upah Tahunan (ribu $)

25
Diagram Frekuensi Upah Tahunan Perempuan

6% 4%
6%

16%

34%

34%

<30 30-40 40-50 50-60 60-70 70-80 ≥80

Diagram Frekuensi Upah Tahunan Laki-laki


5% 0%
2% 6%
12%

40%

35%

<30 30-40 40-50 50-60 60-70 70-80 ≥80

Dari data diatas dibuatkan frekuensi kumulatif kurang dari dan lebih dari dilihat pada table di
bawah ini.
Tabel Frekuensi Kumulatif Kurang Dari
UpahTahunan (ribu $) Perempuan Laki-Laki
Kurangdari 30 2 0
Kurangdari 40 5 1
Kurangdari 50 22 5
Kurangdari 60 39 29
Kurangdari 70 47 50
Kurangdari 80 50 57

26
Tabel Frekuensi Lebih Dari
Upah Tahunan (ribu $) Perempuan Laki-Laki
Lebih dari 30 48 60
Lebih dari 40 45 59
Lebih dari 50 28 55
Lebih dari 60 11 31
Lebih dari 70 3 10
Lebih dari 80 0 3

Dari data diatas dihitung Quartil pertama dan Quartil Ketiga pada masing-masing jenis
kelamin yaitu sebagai berikut :
25
 Quartil Pertama Perempuan (L25) = (𝑛 + 1) 100 = 12,75

Quartil pertama pada perempuan terdapat pada data ke 12,75 yaitu dengan nilai upah
tahunan antara 40-50 (ribu $)
75
 Quartil Ketiga Perempuan (L75) = (𝑛 + 1) 100 = 38,25

Quartil pertama pada perempuan terdapat pada data ke 38, 25 yaitu dengan nilai upah
tahunan antara 50-60 (ribu $)
25
 Quartil Pertama Laki-laki (L25) = (𝑛 + 1) 100 = 15,25

Quartil pertama pada laki-laki terdapat pada data ke15,25 yaitu dengan nilai upah
tahunan antara 50-60 (ribu $)
75
 Quartil Ketiga Pria (L75) = (𝑛 + 1) 100 = 45,75

Quartil pertama pada laki-laki terdapat pada data ke45,75 yaitu dengan nilai upah
tahunan antara 60-70 (ribu $)
Perempuan Laki-Laki

Quartil Pertama (L25) 40-50 (ribu $) 50-60 (ribu $)

Quartil Ketiga (L75) 50-60 (ribu $) 60-70 (ribu $)

Kesimpulan :
1. Jika dilihat dari data frekuensi kumulatif upah tahunan kurang dari $ 30.000 terdapat
2 orang pegawai perempuan dan 0 pegawail aki-laki sedangkan untuk data frekuensi
kumulatif upah tahunan lebih dari $ 80.000 terdapat 0 pegawai perempuan dan 3

27
pegawai laki-laki hal ini menandakan bahwa terdapat perbedaan bayaran upah
berdasarkan jenis kelamin.
2. Jika dilihat dari hasil perhitungan Quartil pertama (L25) dan quartile ketiga (L75) data
pegawai perempuan lebih kecil dibandingkan dengan data pegawai laki-laki sehingga
dapat disimpulkan bahwa terdapat perbedaan bayaran upah berdasarkan jenis kelamin.

3.2 Analisis Regresi Berganda


Study Kasus Terry and Associates : Waktu untuk mengantarkan Perlengkapan Medis

Terry and Associates merupakan pusatahli uji kesehatan di Denver, Colorado. Salah
satu sumber pemasukan utama perusahaan ini adalah perlengkapan yang digunakan untuk
menguji peningkatan kandungan timbal di dalam darah. Para pekerja di took mobil, pekerja
perawatan rumput, dan jasa tukang cat rumahan diduga telah mengalami peningkatan kadar
timbale dalam darahnya dan harus diuji secara acak. Untuk mengadakan uji timbale sangatlah
mahal, sehingga perlengkapan tersebut dikirim sesuai permintaan keberbagai lokasi di
seluruh area Denver.
Kathleen Terry, sang pemilik, ingin menetapkan biaya yang sesuai untuk setiap pengiriman.
Untuk mengetahuinya, Ny. Terry mengumpulkan informasi sampel acak berupa 50
pengiriman terakhir. Faktor-faktor yang diperkirakan terkait dengan biaya pengiriman kotak
antara lain :
 Persiapan : Waktu (dalam menit) antara barang tersebut mulai dipesan oleh
pelanggan melalui telepon dengan waktu pesanan tersebut siap
diantar.
 Pengiriman : waktu tempuh actual dalam satuan menit dari pabrik Terry
kepelanggan.
 Jarak mil : Jarak dalam satuan mil dari pabrik Terry ke pelanggan.
Data tersebut terdapat pada table di bawah ini.
Nomer
Biaya Persiapan Pengiriman Jarak
Sample
1 $32,60 10 51 20
2 $23,37 11 33 12
3 $31,49 6 47 19
4 $19,31 9 18 8
5 $28,35 8 88 17
6 $22,63 9 20 11

28
7 $22,63 9 39 11
8 $21,53 10 23 10
9 $21,16 13 20 8
10 $21,53 10 32 10
11 $28,17 5 35 16
12 $20,42 7 23 9
13 $21,53 9 21 10
14 $27,55 7 37 16
15 $23,27 9 25 12
16 $17,10 15 15 6
17 $27,06 13 34 15
18 $15,99 8 13 4
Nomer
Biaya Persiapan Pengiriman Jarak
Sample
19 $17,96 12 12 4
20 $25,22 6 41 14
21 $24,29 3 28 13
22 $22,76 4 26 10
23 $28,17 9 54 16
24 $19,68 7 18 8
25 $25,15 6 50 13
26 $20,36 9 19 7
27 $21,16 3 19 8
28 $25,95 10 45 14
29 $18,76 12 12 5
30 $18,76 8 16 5
31 $24,29 7 35 13
32 $19,56 2 12 6
33 $22,63 8 30 11
34 $21,16 5 13 8
35 $21,16 11 20 8
36 $19,68 5 19 8
37 $18,76 5 14 7
38 $17,96 5 11 4
39 $23,37 10 25 12
40 $25,22 6 32 14
41 $27,06 8 44 16
42 $21,96 9 28 9
43 $22,63 8 31 11
44 $19,68 7 19 8
45 $22,76 8 28 10
46 $21,96 13 18 9
47 $25,95 10 32 14
48 $26,14 8 44 15
49 $24,29 8 34 13
29
50 $24,35 3 33 12

Pertanyaan :
1. Buat perhitungan regresi linear berganda dan uji regresinya yang menyatakan hubungan
antara biaya pengiriman dengan variabel lainnya.
2. Perkirakan biaya pengiriman untuk perlengkapan yang memakan waktu persiapan 10
menit, waktu 30 menit untuk diantar, dan harus menempuh jarak 14 mil.
Penyelesaian :
Untuk penyelesaian permasalahan diatas yaitu regresi linear berganda, menggunkan software
SPSS versi 17. Cara interpertasi model regresi linear berganda pada software SPSS versi 17
dengan langkah sebagai berikut :
1. Interpretasikan koefisien determinasi;
2. Uji F statistik;
3. Uji regresi parsial dengan uji t.

1. Koefisien Determinasi

Model Summary

Std. Error of the


Model R R Square Adjusted R Square Estimate

1 .978a .956 .953 .77466

a. Predictors: (Constant), Jarak, Persiapan, Pengiriman

Tampilan luaran SPSS model summary menunjukkan besaranya adjusted R2 sebesar


0,953, hal ini berarti 95,3% variasi Biaya dapat dijelaskan oleh variasi dari tiga variabel
independen waktu persiapan, waktu pengiriman dan jarak. Sedangkan sisanya (100%-
95,3%=4,7%) dijelaskan oleh sebab-sebab yang lain di luar model. Standard error of
estimate (SEE) sebesar 0,77466, makin kecil nilai SEE akan membuat model regresi
semakin tepatdalam memprediksi variabel dependen.

2. Uji Signifikan Simultan (Uji Statistik F)


ANOVAb

30
Model Sum of Squares Df Mean Square F Sig.

1 Regression 604.361 3 201.454 335.698 .000a

Residual 27.605 46 .600

Total 631.966 49

a. Predictors: (Constant), Jarak, Persiapan, Pengiriman

b. Dependent Variable: Biaya

Berdasarkan table ANNOVA atau F test, diperoleh nilai F hitung sebesar 335,698
dengan probabilitas 0,000. Oleh karena probabilitas jauh lebih kecil dari 0,05, maka
dapat disimpulkan bahwa koefisien waktu persiapan, waktu pengiriman dan jarak tidak
sama dengan nol, atau ketiga variabel independen secara simultan berpengaruh terhadap
biaya pengiriman.

3. Uji Signifikan Parameter Individual (Uji Statistik t)


Untuk menginterprestasikan koefisien parameter variabel independen dapat
menggunakan unstandardized coefficients maupun standardized coefficients.

Coefficientsa

Standardized
Unstandardized Coefficients Coefficients

Model B Std. Error Beta t Sig.

1 (Constant) 13.390 .469 28.526 .000

Persiapan -.014 .039 -.011 -.369 .714

Pengiriman .003 .014 .011 .188 .852

Jarak .885 .052 .968 17.105 .000

a. Dependent Variable: Biaya

Unstandardized Beta Coefficients


Dari ketiga variabel independen yang dimasukkan dalam model ternyata hanya satu
variabel jarak yang signifikan pada =5%, hal ini terlihat dari probabilitas signifikansi
variabel tersebut jauh dibawah 0,05. Jadidapat disimpulkan bahwa variabel biaya
pengiriman dipengaruhi oleh waktu persiapan, waktu pengiriman dan jarak, dengan
persamaan matematis sebagai berikut :
31
Y = 13,39 -0,14 X1 + 0,003 X2 + 0,885 X3
dimana :
Y = biaya pengiriman ($)
X1 = Waktu persiapan (menit)
X2 = Waktu pengiriman (menit)
X3 = Jarak (mil)
 Koefisien konstanta bernilai positif menyatakan bahwa dengan mengasumsikan
ketiadaan variabel waktu persiapan, waktu pengiriman, dan jarak, maka biaya
pengiriman cenderung mengalami peningkatan.
 Koefisien regresi waktu persiapan (X1) bernilai negative menyatakan bahwa
dengan mengasumsikan ketiadaan variabel independen lainnya, maka apabila
waktu persiapan mengalami peningkatan, maka biaya pengiriman cenderung
mengalami penurunan.
 Koefisien regresi waktu pengiriman (X2) bernilai positif menyatakan bahwa
dengan mengasumsikan ketiadaanv ariabel independen lainnya, maka apabila
waktu pengiriman mengalami peningkatan, maka biaya pengiriman cenderung
mengalami peningkatan.
 Koefisien regresi jarak (X3) bernilai positif menyatakan bahwa dengan
mengasumsikan ketiadaan variabel independen lainnya, maka apabila variabel
jarak mengalami peningkatan, maka biaya pengiriman cenderung mengalami
peningkatan.
Dari persamaan diatas, maka dapat dihitung biaya pengiriman dengan nilai waktu
persiapan 10 menit, waktu 30 menit untuk diantar, dan harus menempuh jarak 14 mil
yaitu :
Y = 13,39 -0,14 X1 + 0,003 X2 + 0,885 X3
Y = 13,39 -0,14.(10) + 0,003 (30) + 0,885 (14)
Y = $ 24,47

Standardized Beta Coefficients.

32
Apabila masing-masing koefisien variabel kita standarisasi terlebihdahulu, maka kita
akan mempunyai garis regresi yang melewati origin (titik pusat), sehingga persamaan
regresi tidak memiliki konstanta atau secara matematis dapa dituliskan sebagai berikut :
Y = -0,11 X1 + 0,11 X2 + 0,968 X3
dimana :
Y = biaya pengiriman ($)
X1 = Waktu persiapan (menit)
X2 = Waktu pengiriman (menit)
X3 = Jarak (mil)

BAB IV

33
PENUTUP

4.1.Kesimpulan

Adapun kesimpulan pada laporan ini, sebagai berikut :

1. Ukuran lokasi (ukuran letak) merupakan ukuran untuk melihat dimana letak salah satu
data dari sekumpulan banyak data yang ada, yang termasuk ukuran lokasi (ukuran
letak) antara lain adalah kuartil, desil dan persentil.
2. Regresi linear adalah alat statistik yang dipergunakan untuk mengetahui pengaruh
antara satu atau beberapa variabel terhadap satu buah variabel.
3. Analisis regresi membentuk persamaan garis lurus (linear) dan menggunakan
persamaan tersebut untuk membuat perkiraan (prediction).
4. Tujuan dari analisis regresi yaitu untuk membuat perkiraan nilai suatu variabel terikat
jika nilai variabel bebas yang berhubungan dengannya sudah ditentukan dan untuk
menguji hipotesis signifikansi pengaruh dari variabel bebas (X) terhadap variabel
terikat (Y).

4.2.Saran

Adapun saran yang dapat penulis sampaikan pada laporan pembahasan mengenai Widcat
Plumbing Supply dan Kasus B, sebagai berikut :
1. Bagi seorang peneliti dalam memberikan hasil data perhitungan harus disertai dengan
interpretasi atau kesimpulan yang jelas.

34
DAFTAR PUSTAKA

Andi. 2007. Statistika “Data Kajian Deskriftif, Inferensi, dan Non Parametrik”. Jakarta:
Kencana Prenada Media Group.
Jonathan Sarwono, Statistik Itu Mudah: Panduan Lengkap untuk Melakukan Komputasi
Statistik Menggunakan SPSS 16 (Yogyakarta: Penerbit ANDI, 2009)
Julie Pallant, SPSS Survival Manual: A Step by Step Guide to Data Analysis using SPSS for
Windows, Third Edition (Berkshire: McGraw-Hill and Open University Press, 2007)
Lind, Douglas A, William G. Marchal, dan Samuel A. Wathen. 2012. Teknik-teknik
Statistika dalam Bisnis dan Ekonomi, Edisi 15. Jakarta : Penerbit Salemba Empat.
Nancy L. Leech, Karen C. Barrett, George A. Morgan, SPSS for Intermediate Statistics: Use
and Interpretation, Second Edition (New Jersey: Lewrence Erlbaum Associates,
Publishers, 2005)
Riduawan. 2009. Pengantar statistika sosial. Bandung: Alfabeta.
Sarah Boslaugh and Paul Andrew Watter, Statistics in a Nutshell: A Desktop Quick
Reference (Sebastopol: O’Reilly Media, Inc., 2008)
Simon Washington, Matthew G. Karlaftis and Fred L. Mannering, Statistical and
Econometric Methods for Transportation Data Analysis, (Boca Raton : Chapman &
Hall/CRC, 2003)
Tony Wijaya, Analisis Data Penelitian Menggunakan SPSS (Yogyakarta: Penerbit
Universitas Atma Jaya Yogyakarta, 2009)
http://aklianwari.blogspot.com/2016/10/makalah-statistik-kuartil-desil-dan_6.html
http://setabasri01.blogspot.com/2011/04/uji-regresi-berganda.html

35