Anda di halaman 1dari 15
REGRESI DAN KORELASI SEDERHANA 2.1. PENDAHULUAN Analisa pasangan variabel membutubkan data yang terdiri dari 2 kelompok hasil observasi atau pengukuran. Data yang dapat“diperoleh dari pelbagai bidang kegiatan yang menghasilkan pasangan observasi sebanyak n, dinyatakan sebagai (x; y,. Di dalam penelitian ilmiah, selain ingin menunjukkan hubungan antara dua variabel atau lebih dan mengukur hubungan itu, juga ingin dapat meramalkan sesuatu, yaitu menentukan nilai suatu variabel sesudah mengetahui nilai-nilai variabel yang lain. Untuk dapat meramal, harus diketahui dulu hubungan antara variabel-variabel itu. Yang berhubungan dengan peramalan dan kesalahan peramalan, dinamakan proses regresi. Sedangkan pengukuran hubungan antara variabel, dinamakan proses korelasi. Definisi : Regresi dan korelasi sederhana adalah suatu cara untuk mengetahui hubungan antara satu variabel dengan satu variabel yang lain. Jika pasangan observasi pengukuran (x; y) digambarkan di atas kertas berskala hitung, | akan diperoleh serangkaian titik-titik koordinat yang menghubungkan kedua hasil observasi. 45 Penggambaran demikian dinamakan diagram pencar (scatter diagram). Dari diagram pencar dapat ditarik suatu garis yang menggambarkan nilai rata-rata y terhadap x, sehingga diperoleh persamaan garis regresi. y y ila-nita observes : . (sample points) . nilai-nilai observasi . a . (sample points) 0 x 0 x Gb.L.1. Scatter Diagram Gb.12, $.D. dengan Garis Lengkung y nilai-nilal observasi | a (sample co 0 x | Gb.1.3. Scatter Diagram dengan garis linear Biasanya yang sering digunakan dan mudah untuk perhitungan, digunakan persamaan garis linear dari Scatter Diagram dengan garis lurus seperti di alas. Persamaan garis linear : by, = A + BX dimana : j1,, = rata-rata populasi y terhadap x A™ = jarak antara 0 dengan sumbu Y B_ = koefisien regresi / kemiringan 46 2.2. METODE KUADRAT MINIMUM ( Least Squares ) Prosedur statistik untuk memperoleh garis lurus dengan “kesesuaian terbaik” (best fitting) untuk serangkaian titik dari pasangan data bisa kita peroleh dengan meminimumkan penyimpangan (deviasi) titik-titik dari garis yang akan kita buat.” Rata-rata populasi y terhadap x biasanya tidak diketahui, schingga digunakan suatu garis penduga (garis regresi). Persamaan garis penduga : dimana : {= penduga untuk ui, = penduga untuk nilai A = penduga untuk nilai B cee Y=A+ BX Gb.1.5. Persamaan Garis Linear Dengan prinsip kuadrat minimum (principle of least squares), dapat dibuat suatu garis Turus yang memiliki “kesesuaian terbaik”, yaitu pilih sebuah garis dengan “kesesuaian terbaik” yang meminimumkan jumlah kuadrat penyimpangan nilai yang diamati dengan yang diramalkan, Atau meminimumkan ssp = vy,-9,¥ il Istilah SSE menyatakan jumlah kuadrat penyimpangan, yang biasa disebut jumlah kuadrat Kesalahan (sum of squares for error). Kalau disubstitusikan ramus persamaan garis regresi dalam rumus SSE, maka : SSE Sy Ly,- @+bx) P =i 47 Rumus Kuadrat Terkecil untuk a dan b SS, i: be x dan asy-bx SS, dimana : n Cd xF a -, 8. SS.= YK -HE DM I i=l n SS, = 2 (x, - MY,- 9) iI a a (Lx dy) a i = 2 xy, — 1 n Contoh 2.1 : Tabel 2.1, Pengeluaran iklan dan volume penjualan untuk suatu perusahaan selama 10 bulan yang dipilih secara random Pengeluaran untuk iklan Volume pengeluaran Bulan x (x Rp 10,000,000) ¥ (x Rp 10.000.000) | 1 12 101 2 08 2 3 10 110 4 13 120 5 07 90 6 Ox 82 7 10 a 8 06 75 9 09 ot 10 Ll 105, Buatlah persamaan garis regresi dari data di atas 48 Penyelesaian : Langkah pertama adalah membuat tabel data perhitungan yang dibutubkan untuk mencari nilai-nilai a dan b, seperti pada tabel di bawah ini. Tabel 2.2. Perhitungan dari data Tabel 2.1. % x * 1 y 101 12 1,44 121,1 10,201 92 08 0,64 73,6 8,464 110 1,0 1,00 110,0 12,100 120 13 1,69 156,0 14,400 90 0.7 0.49 63,0 8,100 82 0.8 0,64 65,6 6,724 93 1,0 1,00 93,0 8,649 75 0,6 0,36 45,0 5,625 91 09 0,81 881.9 8,281 102 dl 1,21 115.5 11,025 Jumlah 959 94 9,28 924,8 93,569 Rata-Rata 959 0,94 0,928 92,48 9,3569 0,44 9,4)(959) CAO) 9334 Jadi : y Ss, 0.4a4 SS, 23,34 = 52,5676 = 52,57 dan : a = y — bx = 95,9 — (52,5676)(0,94) = 46,49 maka persamaan regresi adalah : $=atbdx atau 4 = 46,49 + 52,57x Misalkan perusahaan menganggarkan Rp 10,000,000 untuk pengeluaran iklan pada satu bulan, maka volume penjualan yang diramalkan adalah : J =a + dx = 46,49 + (52,57)(1,0) = 99.06 atau kalau dalam rupiah, volume penjualan = Rp 990.600.000. 2.3. STANDARD ERROR OF ESTIMATE Kalau sampel memiliki jumlah n yang cukup besar, pengukuran dispersi titik-titik koordinat dari garis duga regresinya dapat dicari dari : SSE ss : dimana (n-2) adalah derajat kebebasan (degrees of freedom) n2 Rumus Menghitung SSE SSE = SS, - bSS,, dimana : n (Z yy ss,=¥ ¢ -y-E y- Ve eye n n n CZ xc y,) i=] i=] n Contoh 2.2.: Untuk data pada Tabel 2.1. hitung dan taksirlah standard error populasinya. 50 Penyelesaian : Dalam contoh 2.1, telah kita peroleh nilai SS,, = 23,34 dan nilai koefisien regresi (b) = 52,57. Sckarang kita hitung dulu nilai SS, dan SSE seperti ramus di atas. (959)? 85, = 93,569 -——— = 1.6009 SSE = SS, - bSS,, = 1,600.9 — (52,5676)(23,34) = 373.97 maka : SSE 373,97 ga = = 46,76 n2 s= V46.76 = 6.84 dan s, merupakan taksiran untuk 6? dan 6. 2.4. INFERENSI MENGENAI KEMIRINGAN (B) DARI SUATU GARIS Inferensi awal yang dikehendai dalam mempelajari hubungan antara y de x adalah mengenai adanya eksistensi hubungan kedua variabel. Yaitu, apakah data itu menyajikan bukti yang cukup untuk menunjukkan bahwa x menyumbangkan (memberikan) informasi untuk peramalan y dalam lingkup pengamatan? atau cukup besarkah kemungkinan bahwa kalau y dan x sama sekali tidak mempunyai hubungan. Diasumsikan berkenaan dengan distribusi kemungkinan (probabilistik) y untuk suatu nilai x tertentu, dapat ditunjukkan bahwa baik a maupun b keduanya disdistribusikan secara normal dalam pengambilan sampel secara berulang dan bahwa nilai yang diharapkan (nilai rerata) dan varian dari b adalah : o E@)=B dan S\= 57 Karena nilai o* yang sebenamya tidak diketahui, dapat diganti dengan varians yang diperkirakan untuk nilai b, yaitu s s Yss, dan * SS, Dengan mensubstitusikan (mengganti) s untuk ¢ dalam statistik normal, maka pendugaan dan pengujian hipotesis dapat menggunakan distribusi t,,,. Si Pengujian Hipotesis Mengenai Kemiringan suatu Garis Hipotesis Nol : HL: B=0 Hipotesis Altematif : ditentukan oleh peneliti, tergantung pada nilai b yaug diinginkan untuk dideteksi b-B, Statistik Tes (Uji): t= dengan db = n ~ 2 Interval nilai B : PO baneg § Koefisien regresi nyata. babel Contoh 2.3. : Dengan menggunakan data pada Tabel 2.1., buatlah uji hipotesis untuk menunjukkan bahwa b tidak sama dengan nol dengan 0 = 0,05. Penyelesaian : Pertama-tama kita tentukan bentuk yji hipotesisnya. Karena disini kita diarahkan ke dalam suatu bentuk statement tertentu, digunakan uji hipotesis altematif dua arah (B # 0). Kalau uji hipotesis satu arah, pengujian diarahkan untuk membuktikan (B > 0) atau B<0). - Hipotesis nol. H,: B= 0 — Hipotesis alt. al eer 52 +— Daerah Penerimaan ———>, 0,025 pila thicong 72,306 2,906 5,12 Karena t, > t,,., maka kita tolak hipotesis nol : B = 0 dan menyimpulkan bahwa ada bukti yang menunjukkan bahwa pengeluaran biaya iklan memberikan informasi untuk digunakan dalam peramalan volume penjualan bruto bulanan (hipotesis alt. diterima : B + 0). Contoh 2.4. Hitunglah interval nilai B dengan selang keyakinan 95 % dengan menggunakan data pada Tabel 2.1. Penyelesaian : D—hanaa $< B : derajat hubungan antara dua variabel menunjukkan hal yang sejajar atau paralel (koefisien korelasi positip). Pada grafik, garis regresinya miring ke bawah kanan. *r=0 : tidak ada hubungan sama sekali antara dua variabel, Pada grafik, tidak ada korelasi linear. Rumus Koefisien Korelasi Contoh 2.5. : Hitunglah koefisien korelasi untuk data pengeluaran iklan dan volume penjualan pada Tabel 2.1. : Penyelesaian : Telah kita ketahui bahwa nilai-nilai : 23,34 SS, = 0.444 SS, = 1.6009 rs Ini berarti koefisien korelasinya positip, atau dengan kata lain hubungan antara pengeluaran iklan berjalan paralel dengan volume penjualan, Jadi, semakin tinggi dana yang dikeluarkan untuk iklan, semakin besar pula volume penjualan 54 ee 2.6. GARIS REGRESI X TERHADAP Y | Kita bisa membuat suatu garis linear rata-rata X terhadap Y (i,,) dengan membuat suatu garis penduga (garis regresi) rata-rata x terhadap y : Qaa'eby dimana : A ax Dray) a= estes n dan 55 v ye Y LATIHAN SOAL Apa yang dimaksud dengan analisis regresi sederhana ? Jelaskan kenapa dan bagaimana kita membuat suatu diagram titik (Scarter diagram) ? Apa kegunaan dari analisis korelasi ? Apa yang dimaksud dengan metode least square ? Diketahui sehimpunan data : X 13 16 14 I 17 9 13) 17 1B 12 WG? 86.122 45) 00 a9: 658 90105 50), a, Tentukan persamaan garis regresinya ! b. Dugalah nilai Y untuk X = 10, 15, dan 20. Diketahui sehimpunan data : X $6 48 42 58 40 39 50 Y 45 385 345 461 333 321 404 a. Carilah persamaan garis regresinya ! b. — Hitung standart error dari analisis anda ! cc. Carilah interval perkiraan Y dengan ot = 0,05 untuk X = 44, Jika dari suatu data diketahui nilai SS,, = 15: SS, = 0,4; dan SS, = 1500. Carilah nilai koefisien korelasi. Apa yang dapat saudara simpulkan dari hasil perhitungan saudara ! Dari schimpunan data : x 3°97 4 2 0 4 9 2 pil) 18) 9 4 7 Ge tae a. Buatlah suatu uji hipotesis untuk menunjukkan bahwa koefisien regresi (b) lebih besar dari nol dengan 0. = 0,05. ‘Apa yang dapat saudara simpulkan dari hasil analisis saudara. s SOAL-SOAL MULTIPLE CHOICE Analisis untuk melihat keeratan hubungan antar variabel : a. time series c. regresi b. ANOVA d. korelasi Prinsip pendugaan persamaan regresi adalah a. meminimalkan jumlah kuadrat error b. meminimalkan jumlah kuadrat variabel ¢. meminimalkan kemiringan persamaan regresi Variabel dalam suatu eksperimen yang mudah dikendalikan dikenal sebagai variabel : a. respon c. dependen b. independen 4. adan b benar Jika B = 0, maka garis regresi populasi dimana Y = A + B X akan: a. membentuk sudut 45° c. sejajar sumbu X b. sejaiar sumbu Y 4. berhimpit sumbu Y Dari hasil analisis variabel dimana X adalah harga barang (dalam rupiah) dan Y adalah jumlah penawaran (unit), diperoleh nilai koefisien korelasi r = 0,893. Hubungan kedua variabel dapat disimpulkan sebagai berikut a. kenaikan harga barang akan diikuti oleh penurunan penawaran b. penununan harga akan diikuti oleh peningkatan penawaran c. _kenaikan harga akan diikuti oleh peningkatan penawaran d. tidak ada hubungan antara kenaikan harga dengan jumlah penawaran Gunakan soal no. 5. Jika hubungan X dan Y dinyatakan dalam persamaan garis = 55 + 1.25X, maka penawaran 180 unit barang dicapai pada harga : a. Rp. 100 c. Rp 280 b. Rp. 100.000 d. Rp 280.000 Nilai mid-test (X) dan ujian akhir (Y) dari 9 mahasiswa adalah : egy 50) 107) eel) 04 09 6) Y 8 6 7 34 47 85 9 68 maka persamaan regresinya adalah : a ¥=21+087X 12 + 0,78X 4 ° 57 13. 58 Gunakan soal no. 7. Dugaan nilai akhir bagi mahasiswa yang mendapat nilai mid-test = 85 adalah : a c. 68 be 76 d. 94 Bila koefisien korelasi suatu persamaan regresi mendekati nilai +1, maka : a. garis regresi turun dari kanan ke kiri b. kedua variabel mempunyai hubungan kausal c. _garis regresi naik dari kiri ke kanan d._b dan c benar . Dua variabel X dan Y diukur pada skala interval. untuk 60 pasang data (x,y,) diperoleh hasil sebagai berikut : x= 10 y=20 SS, = 144 Kalau nilai Y = 22, maka nilai X yang diramalkan menurut garis regresi X terhadap Y sama dengan : fay 105 c. 82 b. 18,0 a 28 . Untuk 25 pasangan data (x;y,) berlaku : x= 10 y=l5 SS, =2 SS, = 6 b=03 Jadi, untuk data ini koefisien korelasi X terhadap Y adalah : a 03 c. 09 b. 0,1 d. salah semua ., Variabel X dan variabel Y kedua-duanya diukur pada skala interval. Untuk 200 pasangan data (x;y) berlaku : x=20 y=30 SS, = 10 SS, =5 Kalau X = 15, maka nilai Y yang diramalkan menurut garis regresi Y terhadap X sama dengan : a. -20 c. 25 b. ~40 a. 10 (Data di bawah ini digunakan untuk soal no.13 sid no. 17) Diketahui data sebagai berikut : xX: 1 2 3 4 5 Y: 1 1 2 3 3 Koefisien regresi (b) X dan Y adalah : a 0,6 c. 0,1 b. 02 a. 04 14, 19, Koefisien korelasi (r) data tersebut adalah : a. 0,35 c. 0,55 b. 0.95 ce |. Rata-rata X adalah : a 3 ce 35 b 5 d. 5,55 . Rata-rata Y adalah : a 02 « 2 b. 1,2, d, 2, |. Standar deviasi X adalah : a 1,76 ce. 158 b. 12 d, 0.98 . Standard deviasi Y adalah : a 1,76 ce 12 bool d. 0.98 Diketahui varians regresi sebesar (s) 93.1864 digunakan untuk menguji apakah ada hubungan linear antara besamya pendapatan (Y) dengan banyaknya konsumsi yang dikeluarkan (X). Diketahui pula jumlah kuadarat untuk variabel X sebesar 10.378.461,18. Maka dapat kita tentukan a. 8, = 0,005 ©. b. 5, = 0.67 q > |. Berdasakan soal no. 19, tindak lanjut dilakukan pengujian hipotesis dengan & = 5 %, maka bisa disimpulkan : a. tidak terdapat hubungan linear antara kedua variabel b. ada hubungan linear antara kedua variabel c. Hipotesis nol H, : B = 0 diterima d.adan c benar 59

Anda mungkin juga menyukai