Anda di halaman 1dari 19

ANALISIS REGRESI LINEAR SEDERHANA DAN KORELASI

Drs. Suwarno, M.Si. PENDAHULUAN

MODUL

rancis Galton, adalah orang yang pertama kali memperkenalkan alat statistik yang bernama analisis regresi dan analisis korelasi. Ia lahir pada 16 Februari 1822 di Birmingham, Inggris. Galton mempelajari hubungan antara tinggi badan ayah dan anak. Ia mengamati bahwa tinggi anak yang bera-sal dari tinggi dan pendek cenderung mundur (regress) ke arah rataan grup. Ia menamakan kecenderungan ini regresi ke arah mediokritas (sedang). Galton kemudian mengem-bangkan suatu deskripsi matematis bagi kecenderungan re-gresi ini. Istilah regresi tetap bertahan sampai hari ini untuk menjelaskan hubungan statistik antara dua atau lebih peu-bah. Dengan mempelajari modul 9 ini, Anda memperoleh pengetahuan tentang beberapa konsep yang terkait dengan analisis regresi linear sederhana dan analisis korelasi. Setelah mempelajari modul ini, secara umum, Anda diharapkan dapat membedakan penggunaan analisis regresi linear sederhana dan analisis korelasi. Secara khusus, Anda diharapkan dapat: 1. Membedakan analisis regresi linear sederhana dengan analisis korelasi. 2. Menentukan korelasi linear antara dua peubah 3. Menjelaskan pegertian peubah tak bebas (dependent variables) dengan peubah bebas (independent variables). 4. Menjelaskan asumsi-asumsi yang mendasari analisis regresi linear sederhana 5. Menentukan dan mengartikan penduga inetersep dan slope pada regresi linear sederhana. 6. Menjelaskan konsep koefisien determinasi 7. Melakukan uji hipotesis terhadap intersep dan slope pada regresi linear sederhana. Sajian materi modul ini dibagi dalam tiga kegiatan belajar, yaitu: Kegiatan Belajar 1: mencakup hakekat regresi linear, regresi linear sederhana, peubah tak bebas dengan peubah bebas, asumsi-asumsi dalam regresi linear

sederhana, pengertian interesep dan slope, konsep koefisien determinasi. Kegiatan Belajar 2: Inferensi dalam analisis regresi linear sederhana: uji hipotesis interesep dan slope. Kegiatan Belajar 3: mencakup hakekat korelasi, analisis korelasi, perbedaan analisis kore-lasi dan analisis regresi linear sederhana. Agar Anda dapat memahami modul ini dengan baik, sebaiknya Anda bekerja sama dalam kelompok belajar untuk mendiskusikan dan menyelesaikan kesulitan yang Anda hadapi ketika mempelajari modul. Mulailah dengan membaca dan mencoba memahami penjelasan dalam modul disertai dengan catatan-catatan yang Anda anggap perlu. Kerjakan setiap contoh soal dan latihan, dan melihat penyelesaiannya kemudian setelah Anda selesai mengerjakan. Demikian juga ketika Anda mengerjakan soal tes formatif. Jika hasil yang Anda peroleh masih salah, pahami kembali teorinya dan kerjakan kembali soalnya hingga Anda tidak menemukan kesalahan. Selamat Belajar, Semoga Berhasil.

Kegiatan Belajar 1

Analisis Regresi Linear Sederhana


Analisis regresi merupakan alat statistik yang memanfaatkan hubungan antara dua atau lebih peubah kuantitatif sehingga salah satu peubah bisa diramalkan dari peubah-peubah lainnya. Misalnya, jika kita tahu hubungan antara kemampuan awal siswa dan prestasi belajarnya pada tahun pertama di Sekolah Menengah Pertama (SMP), maka kita dapat meramal prestasi belajar siswa melalui analisis regresi jika kemampuan awal siswa telah kita ketahui. Pada modul ini, kita akan membahas analisis regresi dengan satu peubah peramal untuk meramal peubah yang menarik perhatian kita. Di dalam modul ini khususnya, kita kupas gagasan dasar analisis regresi dan membahas pendugaan paramter-parameter yang ada di dalam model. 9.1.1 Hubungan Antara Peubah-peubah Konsep suatu hubungan antara dua peubah, seperti misalnya antara pendapatan keluarga dan pengeluaran keluarga untuk perumahan, sudah sangat kita kenal. Kita akan membe-dakan antara hubungan fungsional dan hubungan statistik, dan akan mengupas masing-masing itu. Hubungan Fungsional antara Dua Peubah Suatu hubungan fungsional antara dua peubah dinyatakan melalui suatu rumus matematis. Jika X peubah bebas (independent variable) dan Y peubah takbebas (dependent variable), hubungan fungsional adalah berbentuk: Y = f(X) Jika suatu nilai X diketahui, fungsi f dapat menunjukkan nilai Y padanannya. Contoh 9.1.1 Perhatikan hubungan antara volume penjualan dalam rupiah (Y) sebuah produk yang dijual pada harga tetap tertentu dan banyaknya unit barang yang terjual (X). Jika harga jualnya adalah Rp 2.000,- per unit, maka hubungan antara keduanya dapat dinyatakan oleh persamaan: Y = 2X Hubungan fungsional ini ditunjukkan dalam Gambar 9.1. Banyaknya unit terjual dan volume penjualan selama tiga periode terakhir (harga jual tetap konstan pada Rp 2.000,- per unit) ialah sebagai berikut:
Ribuan Rp Y 300

200

100

Y = 2X

3
X

50 100 Unit terjual

Gambar 9.1.1 Teladan Hubungan Fungsional

Tabel 9.1.1 Banyaknya unit terjual pada setiap periode Periode 1 2 3 Banyaknya Unit Terjual 75 25 130 Volume Penjualan (Ribuan Rupiah) 150 50 260

Amatan-amatan ini kemudian diplotkan dalam Gambar 9.1.1 Perhatikan bahwa semua titik amatan jatuh tepat pada garis hubungan fungsional. Inilah ciri hubungan fungsional. Hubungan Statistik antara Dua Peubah Hubungan statistik, tidak seperti fungsional, tidaklah sempurna. Pada umumnya, amatanamatan untuk suatu hubungan statistik tidak jatuh tepat pada kurva hubungan tersebut. Contoh 9.1.2. Suatu penelitian ingin mengetahui hubungan antara Perhatian Orang Tua (POT) dengan Prestasi Belajar Siswa. Tabel 9.1.1. mencantumkan data skore POT dan prestasi belajar siswa untuk 10 siswa yang dipilih secara acak dari suatu sekolah. Data ini diplotkan dalam Gambar 9.1.2a. Prestasi belajar siswa diambil sebagai peubah takbebas atau peubah respons Y, sedangkan skore POT sebagai peubah bebas atau peubah peramal X. Pengeplotannya dilakukan seperti sebelumnya. Sebagai misal, siswa pertama diplotkan sebagai X = 30, Y = 44.

100 90 80
105 95 85

Regression Plot
Y = 15.5941+ 1.09412X R-Sq= 0.975

70 60 50 40 20 30 40 50 60 70 80

75 65 55 45 35 20 30 40 50 60 70 80

Gambar 9.1.2 Hubungan Statistik antara POT dan Prestasi Belajar Siswa Gambar 9.1.2a secara jelas mengindikasikan adanya suatu hubungan antara skore POT dengan prestasi belajar siswa, dalam pengertian bahwa semakin besar skore POT, semakin besar pula prestasi belajarnya. Akan tetapi, hubungan ini tidak sempurna. Titik-titiknya agak memencar, menunjukkan bahwa ada keragaman prestasi belajar yang tidak bisa dijelaskan oleh skore POT. Misalnya, dua siswa runtutan (1 dan 8) yang sama-sama memiliki skore POT 30, namun keduanya memiliki prestasi belajar yang sedikit berbeda. Karena perpencarannya titik-titik di dalam suatu hubungan statistik, maka Gambar 9.1.2a dinamakan diagram pencar atau plot pencar. Dalam terminologi statistika, setiap titik dalam diagram pencar menyatakan suatu tindakan (trial) atau suatu kasus. Dalam Gambar 9.1.2b, kita telah memplot suatu garis yang menggambarkan hubungan statistik antara prestasi belajar siswa dengan POT. Garis ini mengindikasikan kecenderungan umum bervariasinya prestasi belajar siswa berkaitan dengan berubahnya skore POT. Perhatikan bahwa sebagian besar titik tidak jatuh tepat pada garis hubungan statistik tersebut. Perpencaran titik-titik di sekitar garis ini menggambarkan keragaman prestasi belajar siswa yang tidak ada kaitannya dengan skore POT dan biasanya dianggap bersifat acak. Hubungan statistik bisa sangat bermanfaat, walaupun hubungan semacam ini tidak memiliki kepastian seperti halnya hubungan fungsional. Contoh 9.1.3. Gambar 9.1.3. menyajikan data umur dan kandungan sejenis steroid di dalam plasma untuk 17 perempuan sehat yang berumur antara 8 dan 25 tahun. Data ini mengindikasikan adanya suatu hubungan statistik yang kurvilinear (tidak linear). Kurva ini mengimplikasikan bahwa sejalan dengan semakin tingginya umur, kandungan steroid naik sampai suatu titik tertentu dan kemudian mulai menurun. Perhatikan sekali lagi memencarnya titik-titik di sekitar kurva hubungan statistik ini, yang tipikal pada semua hubungan statistik.
Tingkat Steroid Y 30 25 20 15 10 5 0 5


10

5
Umur (th) 15 20 25 X

Gambar 9.1.3. Hubungan Statistik Kurvilinear antara Umur dan Kandungan Steroid pada Perempuan Sehat Berumur 8 sampai 25. 9.1.2. Model Regresi dan Kegunaannya Konsep Dasar Model regresi merupakan suatu cara formal untuk mengekspresikan dua unsur penting suatu hubungan statistik : 1. Suatu kecenderungan berubahnya peubah tidak bebas Y secara sistematis sejalan dengan berubahnya peubah besar X. 2. Perpencaran titik-titik di sekitar kurva hubungan statistik itu. Kedua ciri ini disatukan dalam suatu model regresi dengan cara mempostulatkan bahwa : 1. Ada suatu rencana peluang peubah Y untuk setiap taraf (level) peubah X. 2. Rataan sebaran-sebaran peluang berubah secara sistematis sejalan dengan berubahnya nilai peubah X. Contoh 9.1.4. Misalkanlah Y menyatakan prestasi belajar siswa dan X menyatakan skore perhatian orang tua (POT). Dalam hal ini di dalam model regresi peubah Y diperlakukan sebagai suatu peubah acak. Untuk setiap skore perhatian orang tua, ada sebaran peluang bagi Y. Gambar 9.1.4. menunjukkan sebaran peluang demikian ini untuk X = 30, yaitu skore POT sebesar 30. Tabel 9.1.1. Nilai amatan Y yang sesungguhnya (44 dalam contoh kita ini) dengan demikian dipandang sebagai suatu amatan acak dari sebaran peluang ini.
Skore POT X

70

50
Garis Regresi Distribusi Peluang bagi Y

30

Prestasi Belajar

Gambar 9.1.4. Representasi Gambar bagi Model Regresi Linear

Gambar 9.1.4. juga menunjukkan sebaran peluang Y untuk ukuran lot X = 50 dan X = 70. Perhatikan bahwa rataan sebaran-sebaran peluang ini mempunyai hubungan yang sistematis dengan taraf-taraf peubah X. Hubungan sistematis ini dinamakan fungsi regresi Y terhadap X. Grafik fungsi regresi ini dinamakan kurva regresi. Perhatikan bahwa fungsi regresi dalam Gambar 9.1.4. adalah linear. Ini berimplikasi untuk contoh kita bahwa prestasi belajar siswa rata-rata bervariasi secara linear dengan skore POT. Tentu saja tidak ada alasan apriori mengapa prestasi belajar siswa mempunyai hubungan linear dengan skore POT. Dua model regresi mungkin saja berbeda dalam hal bentuk fungsi regresinya, dalam hal bentuk sebaran peluang bagi peubah Y, atau dalam hal lainnya lagi. Apapun perbedaannya, konsep sebaran peluang bagi Y untuk X yang diketahui merupakan pasangan formal bagi diagram pencar dalam suatu relasi statistik. Begitu pula, kurva regresi, yang menjelaskan hubungan antara rataan sebaran-sebaran peluang bagi Y dengan X, merupakan pasangan formal bagi kecenderungan umum bervariasinya Y secara sistematis terhadap X dalam suatu hubungan statistik. Catatan : Ungkapan peubah bebas atau peubah peramal bagi X dan peubah takbebas atau peubah respons bagi Y dalam suatu model regresi adalah kebiasaan saja. Tidak ada implikasi bahwa Y bergantung secara kausal pada X. Betapa pun kuatnya suatu hubungan statistik, ini tidak berimplikasi adanya hubungan sebab-akibat. Dalam kenyataannya, suatu peubah bebas mungkin saja sesungguhnya bergantung secara kausal pada peubah responsnya, seperti bila kita menduga suhu (respons) dari tinggi air raksa (peubah bebas) dalam suatu termometer. Bentuk Fungsional Hubungan Regresi Pemilihan bentuk fungsional hubungan regresi terkait dengan pemilihan peubah bebasnya. Ada kalanya, teori bilang ilmu bersangkutan bisa menunjukkan bentuk fungsional yang cocok. Teori belajar, misalnya, mungkin mengindikasikan bahwa fungsi regresi yang menghubungkan biaya produksi dengan berapa kali suatu item tertentu telah pernah muncul harus memiliki bentuk tertentu dengan sifat-sifat asimtotik tertentu pula. Yang lebih sering dijumpai adalah bahwa bentuk fungsional hubungan regresi tersebut tidak diketahui sebelumnya, sehingga harus ditetapkan setelah datanya diperoleh dan dianalisis. Oleh karenanya, fungsi regresi linier atau kuadratik sering digunakan sebagai suatu hampiran yang cukup memuaskan bagi fungsi regresi yang tidak diketahui bentuknya. Bahkan, kedua jenis fungsi regresi yang sederhana itu masih juga sering digunakan meskipun teori yang mendasarinya menunjukkan bentuk fungsionalnya, terutama bila bentuk fungsional yang ditunjukkan oleh teori terlalu rumit namun secara logis bisa dihampiri oleh suatu fungsi linier atau kuadratik. Cakupan Model. Ketika memformulasikan suatu model regresi, kita biasanya harus membatasi cakupan model ke suatu selang atau daerah nilai-nilai tertentu peubah bebasnya. Cakupan ini ditentukan oleh rancangan penelitian atau oleh jangkauan data yang tersedia. Misalnya, sebuah perusahaan yang mempelajari pengaruh harga terhadap volume penjualan menyelidiki enam tingkat harga, mulai dari Rp 4.950,- sampai Rp 6.950,-. Disini cakupan

model akan dibatasi pada harga-harga yang berkisar dari dekat Rp 5.000,- ke dekat Rp 7.000,-. Bentuk fungsi regresi akan cukup meragukan di luar kisaran harga ini sebab penelitian tidak memberikan informasi mengenai sifat hubungan statistik di bawah Rp 4.950,- dan di atas Rp 6.950,-. Kegunaan Analisis Regresi Analisis regresi mempunyai tiga kegunaan utama: (1) deskripsi, (2) kontrol atau kendali, dan (3) peramalan. Ketiga kegunaan itu telah diilustrasikan oleh ketiga contoh yang telah dikemukakan di atas. Studi tentang pembelian traktor mempunyai tujuan deskripsi. Dalam studi biaya pengoperasian kantor cabang, tujuannya adalah pengendalian administrasi; dengan mengembangkan suatu hubungan statistik yang bermanfaat antara biaya dengan peubah-peubah bebas di dalam sistem itu, maka pihak menejemen berhasil menetapkan biaya standart untuk setiap kantor cabang. Dalam studi medis terhadap anak-anak pendek, tujuannya adalah peramalan. Dokter dapat menggunakan hubungan statistik untuk meramalkan kekurangan hormon pertumbuhan pada anak-anak pendek dengan menggunakan indikator-indikator sederhana yang mudah diukur. Di dalam praktek, beberapa kegunaan regresi sering ditemukan dalam suatu analisis regresi, misalnya ialah contoh hubungan POT dengan prestasi belajar siswa. Pengetahuan mengenai hubungan antara skore POT dengan prestasi belajar siswa, di masa datang dapat digunkan untuk memberikan pengetahuan pada orang tua bahwa anaknya perlu mendapatkan perhatian dalam belajarnya, jika ingin anaknya mempunyai prestasi belajar yang cukup baik. 9.1.3 Model Regresi Linear Sederhana dengan sebaran Suku-suku Galat Tidak Diketahui Model Pada Kegiatan Belajar I ini, kita akan membahas suatu model regresi dasar yang melibatkan hanya satu peubah bebas dan fungsi regresinya linear. Adapun model regresinya dapat dituliskan sebagai berikut: Yi = 0 + 1Xi + i (9.1.1)

Dalam hal ini : Yi adalah nilai perubahan respons dalam amatan ke-i 0 dan 1 adalah parameter Xi adalah konstanta yang diketahui, yaitu nilai peubah bebas dari amatan ke-i 1 adalah suku galat yang bersifat acak dengan rataan E{i} = 0 dan ragam 2{i} = 2; i dan j tidak berkorelasi sehingga peragam (covariance) {I, j} = 0 untuk semua i, j; i j i = 1, 2, . . . ., n Model regresi (9.1.1) dikatakan sederhana, linear dalam parameter, dan linier dalam peubah bebas. Dikatakan sederhana karena hanya ada satu peubah bebas, linear dalam

parameter karena tidak ada parameter yang muncul sebagai salah satu eksponen atau dikalikan atau dibagi oleh parameter lain, dan linear dalam peubah bebas sebab peubah ini di dalam model berpangkat satu. Model yang linear dalam parameter dan linear dalam peubah bebas juga dinamakan model ordo-pertama. Ciri-Ciri Penting Model 1. Nilai Yi teramati pada amatan ke-i merupakan jumlah dua komponen : (1) suku konstan 0 + 1Xi dan (2) suku galat i. Jadi Yi adalah suatu peubah acak. 2. Karena E{i} = 0, maka kita peroleh : E{Yi} = E{0 + 1Xi + i} = 0 + 1Xi + E{i} = 0 + 1Xi Perhatikan bahwa 0 + 1Xi memainkan peranan sebagai konstanta. Jadi, respons Yi bila nilai X pada amatan ke-i adalah Xi berasal dari suatu sebaran peluang yang rataannya adalah : E{Yi} = 0 + 1Xi oleh karena itu kita peroleh fungsi regresi bagi model (9.1.1), yaitu : E{Y} = 0 + 1X (9.1.3) (9.1.2)

Karena fungsi regresi menghubungkan rataan sebaran peluang bagi Y untuk X tertentu dengan nilai X itu sendiri. 3. Nilai teramati Y pada amatan ke-i lebih besar atau lebih kecil daripada nilai fungsi regresi dengan selisih sebesar i. 4. Setiap suku galat i diasumsikan mempunyai ragam yang sama 2. oleh karenanya, respons Yi mempunyai ragam yang sama pula : 2 {Yi} = 2 Karena, berdasarkan sifat variansi, kita memperoleh : 2{0 + 1Xi + i} = 2 {i) = 2 Jadi, model regresi (9.1.1) mengasumsikan bahwa sebaran peluang bagi Y mempunyai ragam yang sama 2, tidak tergantung pada nilai peubah bebas X. 5. Suku-suku galat diasumsikan tidak berkorelasi. Oleh karenanya, hasil dari setiap amatan manapun yang mempengaruhi galat dari amatan lain yang manapun baik posotof atau negatif, kecil atau besar. Karena galat, i dan j tidak berkorelasi, maka begitu juga dengan respons Yi dengan Yj. 6. Ringkasan model regresi (9.1.1) mengimplementasikan bahwa peubah respons Yi bersal dari sebaran peluang dengan rataan E{Yi) = 0 + 1Xi dan ragam 2 yang sama untuk semua nilai X. lebih lanjut, dua amatan sembarang Yi dan dan Yj tidak berkorelasi. Contoh 9.1.5. (9.1.4)

Misalkan bahwa model regresi (9.1.1) dapat diterapkan pada Contoh Hubungan Skore Perhatian Orang Tua dengan Prestasi Belajar Siswa dan model itu ialah sebagai berikut: Yi = 15.6 + 1.09Xi + i Pada Gambar 9.1.5 dapat dilihat fungsi regresi : E{Y} = 15.6 + 1.09X

Y1 = 62 (Y1) = 2.8 E(Y1) = 59.2


E(Y) =15.6 +1.09X

20

40 Skore POT

Gambar 9.1.5 Misalnya bahwa suatu skore POT Xi = 40 dan ternyata prestasi belajar siswa yang teramati ialah Y1 = 62. maka galatnya ialah I = +2.8 sebab E{Y1) = 15.6 + 1.09(40) = 59.2 dan Yi = 62 = 59.2+2.8 Gambar 9.1.5 memperlihatkan sebaran peluang bagi Y untuk X= 40, dan memperlihatkan dari mana di dalam sebaran ini amatan Y1 = 62 beasal. Perhatikan sekali lagi bahwa suku galat I tidak lain adalah simpangan Yi dari nilai rataannya E(Yi). Gambar 9.1.5 juga memperhatikan sebaran peluang bagi Y bila X = 20. Perhatikan bahwa sebaran ini mempunyai ragam yang sama seperti sebaran peluang bagi Y untuk X = 45, sesuai dengan persyaratan model regresi (9.1.1). Makna Parameter Regresi Kedua parameter 0 dan 1 dalam model regresi (9.1.1) dinamakan koefisien regresi. 1 adalah kemiringan (slope) garis regresi. Kemiringan menunjukkan perubahan rataan

10

sebaran peluang bagi Y untuk stiap kenaikan X satu satuan. Parameter 0 adalah nilai intersep Y garis regresi tersebut. Bila cakupan model tidak mencakup X = 0, maka 0 tidak mempunyai makna. Contoh 9.1.6: Gambar 9.1.6 memperlihatkan fungsi regresi : E(Y) = 15.6 + 1.09X bagi contoh hubungan POT dengan prestasi belajar siswa. Kemiringan 1 = 1.09 menunjukkan bahwa kenaikan skore POT satu satuan akan menaikkan rataan sebaran peluang bagi Y sebesar 1.09.
Prestasi Belajar Y

E(Y) = 15.6 + 1.09 X 50

1 = 1.09 Kemirinagn X

0 = 15.6 0 10 20 Skore POT 30 40 x

Gambar 9.1.6. Fungsi regresi E(Y) = 15.6 + 1.09X Intersep 0 = 15.6 menunjukkan nilai fungsi pada X = 0. Akan tetapi, karena model regresi linear ini diformulasikan untuk diterapkan pada skore POT yang berkisar antara 20 sampai 80, maka dalam hal ini 0 tidak mempunyai makna. Khususnya, parameter ini tidak berarti bisa diartikan sebagai rata-rata prestasi belajar siswa bila tidak mendapatkan perhatian oranmg tua sama sekali. Suatu model dengan fungsi regresi kurvilinear dan satuan nilai 0 yang berbeda daripada yang ada di dalam model linear ini mungkin diperlukan cakupan model yang diperluas sampai nol.

9.1.4

Pendugaan Fungsi Regresi

Kita coba perhatikan Contoh hubungan Skore Perhatian Orang Tua (POT) dengan Prestasi Belajar Siswa untuk mengilustrasikan pendugaan fungsi regresi linear sederhana.

11

Data observasional untuk runtutan siswa yang teramati, yaitu skore POT (X) dan prestasi belajar siswa disajikan dalam Tabel 9.1. Kita akan melambangkan amatan (X, Y) dari tindakan pertama sebagai (X1, Y1) untuk tindakan kedua sebagai (X2, Y2) dan secara umum untuk tindakan ke-i sebagai (Xi, Yi), dengan i = 1, 2, . . . ., n. Untuk data dalam Tabel 9.1, X1 = 30, Y1 = 40, dan seterusnya, dan n = 10.

Tabel 9.1.2Data Skore Perhatian Orang Tua (POT) dan Prestasi Belajar Siswa Runtutan ke- I 1 2 3 4 5 6 7 8 9 10 Skore POT Xi 30 20 60 80 40 50 60 30 70 60 Prestasi Belajar Yi 44 38 87 98 62 70 80 47 92 85

Metode Kuadrat Terkecil Untuk mendapatkan penduga yang baik bagi parameter regresi 0 dan 1 kita akan menerapkan metode kuadrat terkecil. Untuk setiap amatan sampel(Xi, Yi), metode kuadrat terkecil akan menggunakan simpangan Yi dari nilai harapannya : Yi (0 + 1Xi) (9.1.7)

Lebih tepatnya metode kuadrat terkecil akan menggunakan jumlah n simpangan kuadrat. Kriterium ini dilambangkan sebagai Q : Q = (Yi 0 1 X i )
i 1 n 2

(9.1.8)

Menurut metode kuadrat terkecil, penduga bagi 0 dan 1 ialah nilai-nilai b0 dan b1 yang meminimumkan kriterium Q untuk data amatan yang dimiliki. Contoh 9.1.5. Gambar 9.1.7a mengulang kembali diagram pencar data dalam Tabel 9.1.1 untuk Contoh hubungan skore POT dengan Prestasi Belajar Siswa. Dalam Gambar 9.1.7b diplotkan garis regresi suaian (fitted regression line) dengan menggunakan nilai dugaan sembarang berikut:

12

Mulai Analisis Data Eksplorasi analysis Bangun satu atau lebih model regresi Apakah satu atau lebih model regresi tsb cocok untuk 50 60 70 data? YA Identifikasi X model yang palik sesuai suitable model Buat inferensi berdasar model regresi Selesai

100 90 80

70 60

Revisi model regresi atau bangun model 40 baru


50 20 30

TDK

40

80

Gambar 9.1.9 Strategi untuk Analisis Regresi Misalkanlah bahwa: b0 = 30 b1 = 0 maka simpangan dari garis regresi ialah Yi 30 (0)Xi. Perhatikan bahwa setiap simpangan digambarkan sebagai jarak vertikal antara yi dengan garis regresi suaian. Tampak jelas bahwa garis ini kurang cocok (kurang pas) bagi data tersebut. Ini tercermin dari besarnya simpangan-simpangan. Simpangan yang besar membuat simpangan kuadrat juga besar. Jumlah simpangan kuadrat Q ialah : Q = (44-30)2 + (38 30)2 + . . . . +(85 30)2 = 20415 Nilai ini jelas cukup besar. Sekarang perhatikan jika b0 = 15 dan b1 = 1.5. Garis ini lebih cocok (namun masih belum baik), simpangan simpangan sudah jauh lebih kecil, sehingga jumlah simpangansimpangan kuadrat berkurang menjadi Q = 4545. Ini berarti garis regresi yang lebih cocok menghasilkan Q yang lebih kecil. Tujuan metode kuadrat terkecil adalah menemukan nilai dugaan b0 dan b1 yang menghasilkan Q minimum. Dalam pengertian tertentu, yang segera akan kita bahas, nilai dugaan itu akan menghasilkan fungsi regresi linier yang baik.

13

Penduga Kuadrat Terkecil. Penduga b0 dan b1 yang memenuhi kriterium kuadrat terkecil dapat ditemukan dalam dua cara berikut. Pertama, digunakan suatu prosedur pencarian numerik. Prosedur ini untuk berbagai nilai dugaan b0 dan b1 yang berbeda sampai diperoleh nilai dugaan yang meminimumkan Q. Pendekatan kedua adalah menemukan nilai-nilai b0 dan b1 secara analitis yang meminimumkan Q. Pendekatan analitis mungkin dilakukan bila model regresinya secara sistematis tidak terlalu rumit, seperti halnya di sini. Dapat diperlihatkan nilai-nilai b0 dan b1 yang meminimumkan Q untuk data sampel yang dimiliki diberikan oleh sistem persamaan linear berikut : yi = nb0 + b1 X i
X 1Yi = b0 X i + b1 X i2

(9.1.9a) (9.1.9b)

Persamaan (9.1.9a) dan (9.1.9b) dinamakan persamaan normal; b0 dan b1 dinamakan penduga titik (point estimator) bagi 0 dan 1. Besaran-besaran Yi, Xi, dan seterusnya di dalam (9.1.9) dihitung dari amatanamatan sampel(Xi, Yi). Dengan demikian, kedua persamaan itu bisa diselesaikan. Untuk memperoleh b0 dan b1 bisa dihitung secara langsung menggunakan rumus : X i Yi X iYi ( X i X ) ( Yi Y ) n b1 = = (9.1.10a) 2 2 ( Xi ) ( Xi X ) 2 Xi n 1 b0 = ( Yi bi X i ) = Y b1X (9.1.10b) n dalam hal ini X dan Y berturut-turut adalah rataan Xi dan rataan Yi. Persamaan normal (9.1.9) dapat diturunkan secara kalkulus. Untuk suatu data amatan (Xi, Yi), besaran Q dalam (9.1.8) merupakan suatu fungsi 0 dan 1 yang meminimumkan Q dapat diturunkan dengan cara mendiferensialkan (9.1.8) terhadap 0 dan 1 . Kita peroleh:
Q = 2 (Yi 0 1 X i ) 0 Q = 2 X i (Yi 0 1 X i ) 1 Selanjutnya kedua turunan parsial ini disamakan dengan nol, dan dengan menggunakan b0 dan b1 untuk menyatakan 0 dan 1 yang meminimumkan Q, maka: (Yi 0 1 X i ) = 0

1 X i ) = 0 Sistem persamaan ini dinamakan persamaan normal. Dengan menyelesaikan persamaan-persamaan normal ini diperoleh:
i i 0

X (Y

14

b1 =

n X i Yi ( X i )( Yi ) n X i2 ( X i )2

b0 = Y b1 X Rumus terakhir ini merupakan versi lain dari rumusan yang telah disajikan di depan, namun akan menghjasilkan nilai yang sama (pembaca dapat membuktikannya). Penduga kuadrat terkecil ini ialah penduga tak bias dan merupakan fungsi linear dari Yi , yaitu: a. E (b0 ) = 0 dan E (b1 ) = 1 (jadi merupakan penduga tak bias).

b.

b1 = =

n X i Yi ( X i )( Yi ) n X i2 ( X i )2
i 2 i i i

dimana:

( X X )Y = k Y ( X X )
i i 2 i

ki =
b0

(X X ) ( X X ) 1 = Y X k Y = b Y n
i i i

i i

dimana: 1 bi = ( Xki ) n (jadi baik b1 maupun b0 merupakan kombinasi linear atau fungsi linear dari Yi ).

Latihan 1
1. Tabel di bawah ini menyajikan skore motivasi belajar Matematika (X) dan prestasi belajar Matematika (Y) dari 20 siswa yang dipilih secara acak dari suatu sekolah menengah pertama. X Y 78 60 57 40 59 70 65 66 68 58 44 38 70 60 65 68 50 74 46 54 85 70 65 45 78 89 50 60 75 50 50 40 87 75 78 80 45 90 50 58 Gambarkan diagram pencar untuk data di atas! Tentukan nilai dugaan koefisien regresi b1 dan b0! Tuliskan persamaan regresi dugaannya! Gambarkan garis regresi dugaan tersebut pada gambar

a. b. c. d. diagram pencar pada soal a!

15

2. Suatu penelitian telah dilakukan untuk menentukan hubungan antara peubah bebas X dan peubah tak bebas Y. Data hasil penelitian telah dihitung dan didapatkan hasil sebagai berikut: ; ; ; ; ; n=12. a. Tentukan nilai dugaan b1 dan b0! b. Tuliskan persamaan regresi dugaannya!

Rangkuman
Hubungan statistik antara peubah babas X dan peubah tak bebas Y telah kita pelajari di muka. Analisis regresi mempelajari hubungan antara rerata semua Y yang berkaitan dengan X tertentu. Dalam analisis regresi sederhana kita menganggap bahwa hubungan antara X dan Y berbentuk garis lurus yaitu: Y = 0 + 1 X + ; dimana merupakan suku galat yang bersifat acak. Dengan metode kuadrat terkecil kita duga persamaan regresi tersebut berdasarkan data berpasangan (Xi, Yi) i=1, 2, 3, ..., n. Adapun rumus dugaan dari koefisien regresi tersebut adalah: b1 = n X i Yi ( X i )( Yi ) n X i2 ( X i ) 2 , dan

b0 = Y b1 X . Dari nilai dugaan koefisien regresi tersebut di atas didapatkan penduga garis regresi sebagai berikut: Y = b0 + b1 X . Kita ketahui bahwa penduga-penduga di atas merupakan penduga tak bias.

Tes Formatif 1
Kerjakanlah semua soal di bawah ini, dengan cara menemukan satu pilihan jawaban yang paling tepat! A. Pada tabel di bawah ini, data menunjukkan harga X yang menyatakan tingkat kenyamanan guru dalam lingkungannya bekerja, dan Y yang menyatakan motivasi guru dalam untuk meningkatkan kinerjanya dalam memberikan pembelajaran terhadap siswanya. X Y 93 96 108 86 92 80 96 117 95 92 96 108 92 73 69 83 54 67 51 70 85 78 74 76 79 68

Bila masalah tersebut didalam regresi dimodelkan dengan model regresi linear: Y = 0 + 1 X + , maka:

16

1. Nilai dugaan untuk b1 adalah: a. 1,268 b. 0,998 c. 0,898 d. 0,998 e. -1,268 2. Nilai dugaan untuk b0 adalah: a. -25,131 b. -15,132 c. -5,321 d. 1,825 e. 5,321 3. Untuk Xk=100 maka nilai dugaan bagi Yk yaitu Yk sama dengan: a. 84,479 b. 80,345 c. 76,684 d. 74,668 e. 67,864 4. Untuk Xk=80 maka nilai dugan bagi Yk yaitu Yk sama dengan: a. 56,708 b. 65,078 c. 45,780 d. 54,708 e. 65,708 5. Oleh sebab itu untuk Xk=80, maka didapatkan nilai galat (residu) ek sama dengan: a. 7,508 b. 5,708 c. -5,708 d. -6,780 e. -7,807 B. Data pada tabel di bawah ini menunjukkan nilai X yang menyatakan skore total dalam ujian masuk di suatu sekolah, dan Y yang menyatakan nilai tes pelajaran Fisika dari sampel randon 20 siswa tahun pertama pada sekolah tersebut. X Y X Y 53 45 54 59 36 43 73 77 88 89 65 56 84 79 29 28 86 84 52 51 64 66 22 27 45 49 76 76 48 48 32 34 39 43 51 60 67 76 37 32

17

Bila masalah tersebut didalam regresi dimodelkan dengan model regresi linear: Y = 0 + 1 X + , maka: 6. Nilai dugaan untuk b1 adalah: a. 0,943 b. 0,749 c. 0,643 d. 0,479 e. 0,394 7. Nilai dugaan untuk b0 adalah: a. 0,943 b. 3,881 c. 4,184 d. 6,184 e. 8,418 8. Untuk Xk=80 maka nilai dugaan bagi Yk yaitu Yk sama dengan: a. 84,479 b. 79,624 c. 76,624 d. 69,188 e. 60,624 9. Untuk Xk=64 maka nilai dugan bagi Yk yaitu Yk sama dengan: a. 34,536 b. 35,653 c. 45,365 d. 54,536 e. 64,536 10. Oleh sebab itu untuk Xk=64, maka didapatkan nilai galat (residu) ek sama dengan: a. 6,424 b. 4,464 c. 4,264 d. 2,464 e. 1,464

Balikan dan Tindak Lanjut


Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang terdapat di bagian akhir Modul ini. Hitunglah jawaban Anda yang benar. Kemudian gunakan rumus di bawah ini untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 1.

18

Rumus: Jumlah jawaban Anda yang benar 100% 10 Arti tingkat penguasaan yang Anda dapat: Tingkat Penguasaan = 90% - 100% = baik sekali 80% - 89% = baik 70% - 79% = cukup < 70% = kurang Bila Anda mencapai tingkat penguasan 80% atau lebih, Anda dapat meneruskan dengan Kegiatan Belajar selanjutnya. Bagus! Tetapi bila tingkat penguasaan Anda masih di bawah 80%, Anda harus mengulangi Kegiatan Belajar 1, terutama bagian yang belum Anda kuasai.

19

Anda mungkin juga menyukai