analisis regresi
Dalam kenyataan, sebelum sebuah keputusan diambil, terlebih dahulu harus dilakukan pengujian
terhadap pendapat atau hasil yang diperoleh dari suatu analisis. Dalam hal ini, kita perlu
melakukan pengujian terhadap nilai koefisien regresi yang telah dihasilkan, sebelum digunakan
selanjutnya dalam proses pengambilan keputusan.
(1) Ha : 1 B
(2) Ha : 1 > B
(3) Ha : 1 < B
Selanjutnya, seperti telah dibahas dalam bab Pengujian Hipotesa terdahulu, maka langkah
berikutnya adalah menghitung nilai t observasi (to) yaitu:
t observasi (to) tersebut mengikuti distribusi t dengan derajad kebebasan (df) sebesar
(n-2)
(1) Ha : 0 A
(2) Ha : 0 > A
(3) Ha : 0 < A
t observasi (to) tersebut mengikuti distribusi t dengan derajad kebebasan (df) sebesar
(n-2)
Sama halnya dengan koefisien regresi, koefisien korelasi juga perlu diuji sebelum digunakan
dalam pengambilan keputusan. Biasanya pengujian dilakukan untuk mengetahui apakah ada
hubungan yang signifikan atau tidak, sehingga pertanyaan dalam hipotesa akan berbunyi “apakah
nilai korelasi yang sebenarnya sama dengan nol atau tidak?”.
Sehingga pada umumnya bentuk hipotesa koefisien korelasi adalah seperti berikut:
t observasi (to) tersebut mengikuti distribusi t dengan derajad kebebasan (df) sebesar
(n-2)
Selanjutnya, jika nilai to di daerah penolakan, maka hipotesa H0 ditolak.
Dalam kenyataan, hubungan antara variabel X dan Y tidak selalu bersifat linier, akan tetapi ada
kalanya bersifat bukan linier. Dalam kasus hubungan dua variabel yang bersifat bukan linier,
pendekatan dengan menggunakan sebuah garis lurus untuk mewakili seluruh data plot atau
diagram pencar dari kedua variabel tentu tidak dapat lagi dilakukan. Garis lurus yang dibuat
tentu tidak dapat mewakili titik-titik atau data-data dari plot tersebut, karena untuk hubungan
yang bukan linier, titik-titik dalam plot atau diagram pencar cenderung akan membentuk pola
yang mendekati garis lengkung, dan bukan garis lurus. Contoh fungsi bukan linier adalah fungsi
parabola, fungsi logaritma, fungsi eksponensial, fungsi polynomial, dan sebagainya.
Sebagai pemecahan, beberapa fungsi bukan linier dapat ditransformasikan ke dalam bentuk linier
dengan menggunakan satu atau beberapa fungsi matematika. Dengan demikian, fungsi hasil
transformasi yang berbentuk linier tersebut selanjutnya diselesaikan seperti kasus regresi linier
biasa. Namun dalam beberapa kasus, fungsi bukan linier tidak dapat ditransformasikan ke dalam
bentuk linier meskipun telah melalui beberapa tahapan transformasi. Dalam hal ini, maka
penyelesaian dapat dilakukan dengan membuat matrik penghitungan koefisien regresi, seperti
yang dilakukan dalam penyelesaian regresi dengan dua variabel bebas atau lebih (multiple
regression), dengan metode eliminasi dan substitusi.
Transformasi yang dilakukan biasanya menggunakan fungsi logaritma (log) atau logaritma
natural (ln). Berikut adalah contoh fungsi bukan linier yang dapat ditransformasikan ke dalam
bentuk linier.
Contoh:
Variabel X 1 2 3 4
Variabel Y 183 487 1242 3261
bX
Misal, diasumsikan hubungan kedua variabel mengikuti fungsi eksponensial Y = a.e
Tentukan persamaan regresinya.
Penyelesaian:
Bentuk tersebut menjadi: ln Y = ln a + bX, dimana Yt = ln Y, b0 = ln a, dan
b1 = b
Xt = X Y Yt = ln Y XtYt Xt2
1 183 5,21 5,21 1
2 487 6,19 12,38 4
3 1242 7,12 21,37 9
4 3261 8,09 32,36 16
10 5173 26,61 71,32 30
Untuk fungsi bukan linier yang tidak dapat diselesaikan dengan cara transformasi, adakalanya
dapat diselesaikan dengan metode substitusi atau eliminasi dari beberapa persamaan yang
dihasilkan. Sebagai contoh, Y = b0 + b1X + b2X2 merupakan fungsi kuadratik dimana nilai
koefisien regresi b0, b1 dan b2 dapat diselesaikan berdasarkan beberapa persamaan hasil turunan
seperti berikut:
I. ………………..…(1)
II. …………….(2)
III. ……………(3)
Contoh :
Tabel 1. Data Fiktif Variabel Tak Bebas (Y) dan Variabel Bebas (X) di Beberapa Cabang
Perusahaan “PT. Jaka Sampurna Jaya Tbk”
Polsek Y X
A 7 2
B 12 3
C 17 4
D 20 5
Diasumsikan bentuk hubungan antara X dan Y mengikuti fungsi kuadratik, yaitu
Y = b0 + b1X + b2X2
Berdasarkan data pada Tabel 1, maka disusun penghitungan seperti pada Tabel 2 guna
memperoleh nilai-nilai yang diperlukan dalam persamaan (1), (2), dan (3) di atas.
Tabel 2. Penghitungan Awal Untuk Menentukan Persamaan Regresi kuadratik dengan n = 4
Y X XY X2Y X2 X3 X4
7 2 14 28 4 8 16
12 3 36 108 9 27 81
17 4 68 272 16 64 256
20 5 100 500 25 125 625
56 14 218 908 54 244 978
Selanjutnya :
Dengan metode eliminasi, persamaan (1) dan (2) menghasilkan persamaan (4)
722 = 782 b2
b2 = 722/782 = 0,923
Kemudian nilai b2 dimasukkan ke dalam persamaan (4) diperoleh nilai b1 :
44 = 40 b1 + 110 b2
44 = 40 b1 + 110 (0,923)
44 = 40 b1 + 101,53
-57,53 = 40 b1
b1 = - 57,53/40 = - 1,438
56 = 4 b0 + 14 b1 + 54 b2
56 = 4 b0 + 14 (-1,438) + 54 (0,923)
56 = 4 b0 – 20,132 + 49,842
4 b0 = 26,29
b0 = 26,29/4 = 6,5725
Untuk fungsi polynomial, seperti Y = b0 + b1X + b2X2 + b3X3, maka cara penyelesaian seperti
fungsi kuadratik di atas, tetapi jumlah persamaan turunan yang diperlukan sebanyak 4 (empat)
persamaan. Cara tersebut sama dengan penyelesaian untuk regresi dengan 3 (tiga) buah variabel
bebas.
Regresi berganda yang menggunakan satu dependen variabel (Y) dan dua independen variabel
(X1 dan X2) masih relatif mudah untuk diselesaikan dengan bantuan kalkulator (terutama untuk
kalkulator dengan type/fasilitas statistik yang lengkap). Namun jika kita ingin meningkatkan
akurasi untuk menaksir variabel dependen (Y) tersebut, maka kita harus menambah beberapa
variabel independen lain, misalnya X3, X4, dan seterusnya. Dengan demikian jika kita hanya
mengandalkan kalkulator dalam penghitungan koefisien regresi berikut analisa regresi berganda
lainnya, maka kita akan menemui kendala yang cukup kompleks. Untuk itu, dalam melakukan
analisis regresi yang kompleks tersebut dianjurkan untuk menggunakan bantuan program paket
komputer, seperti SPSS (statistical package for social science), Excel, SAS, Minitab, Stata, dan
sebagainya untuk menyelesaikan analisanya. Dari berbagai ragam perangkat lunak (software)
yang ada, SPSS dapat dijadikan salah satu pilihan karena banyaknya fasilitas yang dapat
menangani berbagai persoalan statistik, disamping tampilan dan operasionalnya yang user
friendly, serta cukup mudah untuk diperoleh dan di-install ke dalam komputer anda.
Ada beberapa hal yang perlu diperhatikan dalam penggunaan SPSS. Sejauh ini, sistem operasi
komputer yang kompatibel untuk menjalankan SPSS adalah Windows 95, Windows 98,
Windows 2000, dan Windows XP. Bagi pengguna Windows 2000 sebaiknya menggunakan
versi di atas Windows 2000 prior to build 2072 untuk menghindari kemungkinan adanya
masalah dalam pengoperasiannya.
SPSS for Windows mengenal beberapa format file data yang dapat dibaca ke dalam software ini.
Pada dasarnya file data yang dapat dibaca oleh SPSS dibagi menjadi 3 (tiga) kelompok, yaitu:
a. File data SPSS
b. File data bukan dalam format SPSS yang dapat dibaca langsung ke dalam SPSS, misalnya file
yang berasal dari Excel (*.xls) dengan versi 4.0 kebawah, Lotus (*.w*), dBase (*.dbf) kecuali
versi Visual, dan sejenisnya.
c. File data bukan dalam format SPSS yang dapat dibaca melalui fasilitas import yang terdapat
dalam SPSS, misalnya file text (*.txt), Systat (*.sys; .syd), Data (*.dat), dan sejenisnya.
Pertama-tama, pastikan bahwa program SPSS sudah ter-install di dalam komputer. Selanjutnya
langkah-langkah yang harus dilakukan ntuk mengaktifkan program SPSS for Windows adalah
sebagai berikut:
Dari menu Start, pilih Programs. Klik SPSS xx.xx for Windows, sehingga akan membuka
jendela SPSS. Tanda xx.xx adalah versi dari program SPSS yang telah diinstall. Sebagai contoh,
jika SPSS yang diinstall ke komputer anda adalah versi 10.01, maka yang muncul adalah SPSS
10.01 for Windows. Tampilan yang muncul adalah sebagai berikut:
a. Membuka File Data SPSS atau File yang Dapat Dibaca Langsung Oleh SPSS
2). Buka direktori tempat file dimaksud, dengan cara meng-klik pada Look in box. Kemudian pilih
file yang akan dibuka, Klik OK.
a. Input Data
Jika anda telah memasukkan data ke dalam SPSS sebelumnya, maka langkah pertama buka
data file tersebut. Atau, jika sebelumnya anda belum melakukan pemasukan data, maka langkah
pertama adalah pemasukan data dengan cara mengetikkan data-data atau angka-angka dari
masing-masing variabel ke dalam layar data editor SPSS for Windows, urut ke bawah. Dalam
contoh berikut, analisa regresi dilakukan untuk mengetahui hubungan antara Rata-rata
Keuntungan penjualan per bulan – dalam jutaan rupiah (Y) dan jumlah cabang/counter (X1) serta
jumlah karyawan marketing (X2) dari sebuah perusahaan. Data diperoleh dari pengamatan di 7
kota terpilih dimana perusahaan tersebut beroperasi. Contoh pemasukan data (selanjutnya
digunakan sebagai data contoh dalam analisa lebih lanjut) untuk regresi berganda seperti di
bawah ini:
Jika nama variabel (atau sekedar Y, X1 dan X2) ingin ditampilkan ke dalam data dan selanjunya
akan terus ditampilkan dalam analisa, maka langkah yang dilakukan adalah dengan cara Double
Klik pada judul kolom (variabel) yang dimaksud. Sebagai contoh, variabel default VAR00001
sebagai variabel Y diubah menjadi “Rata2 Keuntungan Penjualan per bulan”. Double klik judul
kolom VAR00001, selanjutnya akan muncul dialog berikut.
Nama Variabel, susuai
dengan judul kolom yang
ditampilkan. Nama
default adalah VAR00001
Ketik “Y” (berarti VAR00001 sebagai variabel Y). Kemudian klik icon Label, sehingga muncul
dialog seperti berikut.
Ketik “Rata2 Keuntungan Penjualan/bln” sebagai nama/keterangan dari variabel Y pada
box Variable Label, kemudian klik Continue lalu OK. Lakukan hal yang sama untuk pemberian
nama pada dua variabel lainnya, yaitu X1 (Jumlah Counter) dan X2 (Jumlah Karyawan
Marketing). Selanjutnya yang muncul pada data editor seperti berikut.
b. Melakukan Analisis
1). Klik menu Analyze, kemudian arahkan pointer mouse ke sub-menu Regression, kemudian
klik Linear. Dialog yang muncul adalah seperti berikut.
2). Pindahkan variabel Y ke dalam box Dependent, yang akan dianalisa sebagai variabel dependen
(dengan cara meng-klik variabel dimaksud, kemudian klik tanda “ “ ) . Kemudian pindahkan
kedua variabel X1 dan X2 dalam box Independent, yang selanjutnya akan diperlakukan sebagai
variabel independen. Selanjutnya klik OK.
Catatan:
1. Klik Statistics untuk menentukan uji tambahan
2. Klik Save, jika diinginkan menyimpan beberapa hasil prosedur uji
3. Klik Options, apabila dikehendaki beberapa penghitungan statistik lain dalam analisa regresi
Jika dari dialog tersebut langsung di-klik OK (tidak ada tambahan prosedur seperti pada catatan
di atas), maka output hasil standar analisa Regresi Berganda tersebut adalah sebagai berikut.
1). Pada tabel Model Summary terlihat hasil penghitungan angka koefisien determinasi. Karena data
diperoleh dari hasil sampel, maka angka koefisien yang digunakan dalam analisa Regresi
Berganda adalah Adjusted R Square. Berdasarkan hasil tersebut, diperoleh bahwa koefisien
determinasi antara variabel Jumlah Counter dan Jumlah Karyawan Marketing terhadap besarnya
Rata-rata Keuntungan Penjualan per bulan adalah 0,967. Hal ini menunjukkan bahwa tinggi
rendahnya keuntungan penjualan 96,7% dipengaruhi oleh banyaknya armada dan banyaknya
personil yang ada. Sedangkan sisanya, yaitu sebesar 3,3% dipengaruhi oleh faktor lain.
2). Pada tabel ANOVA dapat dilihat hasil dari pengujian hipotesa terhadap nilai parameter dari
seluruh koefisien regresi berganda (ß0, ß1, ß2) secara bersama-sama pada persamaan Y = b0 +
b1X1 + b2X2.
Bentuk hipotesanya adalah:
3). Pada tabel Coefficients dapat dilihat nilai estimasi dari masing-masing koefisien regresi (b0, b1,
b2) serta hasil pengujian hipotesa dari parameter masing-masing koefisien tersebut. Dari tabel
tersebut dapat dilihat bahwa nilai b0 adalah -6,625, b1 adalah 1,035 dan b2 adalah 1,868.
Dalam pengujian hipotesa koefisien regresi, bentuk hipotesa adalah sebagai berikut:
H0 : ß0 = 0 H0 : ß1 = 0 H0 : ß2 = 0
H1 : ß0 ≠ 0 H1 : ß1 ≠ 0 H1 : ß2 ≠ 0
Dari tabel tersebut diperoleh nilai Critical Point α untuk ß0 adalah 0,140 untuk ß1adalah 0,031
sedangkan untuk ß0 adalah 0,038. Jika ditentukan α = 5%, maka nilai dari b0 tidak signifikan,
sementara nilai dari b1 dan b2 adalah signifikan. Kesimpulannya, berdasarkan data yang ada dan
dengan tingkat keyakinan sebesar 95%, maka dapat dikatakan bahwa variabel Jumlah Counter
dan Jumlah Karyawan Marketing yang tersedia secara signifikan mempengaruhi tinggi
rendahnya Rata-rata Keuntungan Penjualan per bulan di perusahaan tersebut.
6. Latihan Soal Regresi Berganda
1. Data berikut adalah data banyaknya salesman (X1), luas wilayah sasaran marketing atau wilayah
tugas (X2), dan jumlah produk yang terjual (Y) sebagai berikut:
X1 (Orang) 15 8 12 7 10
X2 (Km2) 10 5 10 3 2
Y (unit) 30 22 16 7 14
1. Pengantar
Berkaitan dengan pengumpulan data untuk keperluan analisis dalam dunia ekonomi dan bisnis,
terkadang kita dihadapkan pada masalah keterbatasan data, sehingga berakibat pada lemahnya
hasil analisis yang dihasilkan. Untuk mengatasi hal tersebut, dalam bab ini akan diulas satu
metode analisis statistik yang lain, yang dapat dijadikan alternatif dalam melakukan analisis
statistik, yaitu metode Nonparametrik. Tentu, disamping beberapa keunggulan yang dimiliki,
statistik nonparametrik juga memiliki beberapa kelemahan.
Setelah mempelajari materi dalam bab ini, mahasiswa diharapkan dapat memahami kegunaan
metode statistik nonparametrik dalam menganalisa data di bidang ekonomi dan bisnis dengan
benar. Secara khusus, mahasiswa diharapkan mampu:
b) Mengidentifikasi keadaan dimana metode statistik nonparametrik tertentu perlu diterapkan
dalam analisa data
c) Menerapkan metode Sign Test dalam pengujian hipotesa nonparametrik untuk data tertentu
d) Menerapkan metode Wilcoxon Signed Rank Test dalam pengujian hipotesa nonparametrik untuk
jenis data tertentu
e) Menerapkan metode Mann-Whitney Test dalam pengujian hipotesa nonparametrik
f) Menghitung koefisien korelasi untuk data ordinal (Spearmann Rank Correlation)
Dalam bab terdahulu telah kita pelajari berbagai metode penghitungan dalam statistik
parametrik. Dalam statistik parametrik tersebut, agar dapat dilakukan analisa data, ada beberapa
syarat atau asumsi harus terpenuhi. Sebagai contoh, dalam pengujian hipotesa perbedaan rata-
rata dari dua populasi, ada dua asumsi yang harus terpenuhi, yaitu:
- dua sampel tersebut harus bersifat independent random sample, yang diambil dari populasi yang
berdistribusi normal
- variance dari kedua populasi tersebut relatif sama.
Jika salah satu asumsi tersebut tidak terpenuhi, maka penggunaan probabilita distribusi Normal
ataupun Student-t tidak dapat dilakukan dalam pengujian tersebut. Terlebih lagi untuk kasus
yang melibatkan jumlah sampel sampel yang kecil, asumsi normalitas perlu dipertimbangkan.
Untuk itu, harus dicari alternatif lain dalam pengujian hipotesa tersebut, dimana asumsi-asumsi
tidak dapat terpenuhi.
Statistik Nonparametrik merupakan alternatif untuk metode statistik inferens yang tidak
memerlukan asumsi bentuk distribusi tertentu dari data populasinya. Metode statistik ini banyak
digunakan dalam bidang ilmu sosial yang mungkin akan dihadapi dalam dunia ekonomi dan
bisnis. Walaupun tingkat precisi dan kekuatan metode ini lebih rendah dibanding statistik
parametrik, metode nonparametrik memiliki beberapa keuntungan antara lain:
- distribution-free method, yaitu tidak adanya asumsi bahwa skor atau nilai yang dianalisa diambil
dari populasi yang mempunyai distribusi tertentu, misal distribusi normal. Konsekuensinya
adalah metode ini tidak banyak dipengaruhi dengan error yang disebabkan oleh outlier maupun
skewness (kemencengan distribusi populasi).
- Selain dapat digunakan juga untuk data berskala rasio, metode nonparametrik biasanya
digunakan untuk menganalisa data kategorik maupun data ranking.Bahkan data yang berbentuk
tanda, positip dan negatip saja, memungkinkan untuk dianalisa menggunakan metode ini.
- penghitungan dalam metode non parametrik ini sangat sederhana sehingga mudah dimengerti
dan mudah dilakukan.
Diposkan oleh SIMPLICITY di 20.32