Anda di halaman 1dari 7

Tujuan Pembelajaran

Pada pertemuan sebelumnya kalian telah mempelajari bagaimana menyelidiki kekuatan


korelasi diagram pencar dengan menggunakan koefisian korelasi-q dan membuat perkiraan
garis regresi linear dari Diagram Pencar (Scatterplot). Pada modul ini, kalian akan :

 Menginterpretasikan persamaan garis regresi linear.


 Menentukan model linear terbaik (best fit) pada data numerikal.

Ayo Berpikir Kritis

Perhatikan dan pikirkanlah garis mana yang paling tepat untuk mewakili data pada diagram
pencar di bawah ini. Jika menurut kalian tidak ada garis yang tepat, buatlah garis kalian sendiri.
Kemukakan alasan yang mendasari pilihan garis kalian.

Gambar 1

Di antara semua garis yang mungkin dibentuk, hanya ada satu garis yang paling tepat
yang disebut sebagai garis best-fit. Garis ini merupakan model linear yang memperkirakan
dengan lebih baik hubungan antara dua variabel kuantitatif pada diagram pencar tersebut.
A. Interpretasi Persamaan Garis Regresi Linear
Menginterpretasi persamaan garis regresi linear melibatkan pemahaman terhadap hubungan
(korelasi) antara variabel independen (x) dan variabel dependen (y) dalam konteks data yang
ada. Persamaan regresi linear yang dimaksud adalah :

𝑦 = 𝑎 + 𝑏𝑥

Dimana :
𝑦 = variabel dependen
𝑥 = variabel independen
𝑎 = titik potong dengan sumbu y
𝑏 = gradien (kemiringan garis)
Beberapa hal yang dapat diperhatikan dalam interpretasi ini diantaranya :
1. Kemiringan (Slope)
Nilai kemiringan (𝑏) memberikan informasi tentang seberapa besar perubahan rata-
rata dalam variabel dependen (y) terjadi ketika variabel independen (x) berubah
sebesar satu satuan. Jika 𝑏 positif, itu menunjukkan bahwa ada hubungan (korelasi)
positif antara x dan y, sedangkan jika 𝑏 negatif, itu menunjukkan hubungan (korelasi)
negatif.
2. Perpotongan dengan sumbu-y (𝒂)
Nilai perpotongan garis dengan sumbu-y (𝑎) adalah nilai y ketika x = 0
3. Prediksi Nilai
Dapat memperoleh nilai perkiraan sesuai variabel independennya (x)
Prediksi nilai ada dua jenis, yaitu interpolasi dan ekstrapolasi.
Interpolasi adalah penggunaan hubungan antar variabel untuk memprediksi nilai
yang berada di dalam jangkauan data. Sedangkan Ekstrapolasi adalah penggunaan
hubungan antar variabel untuk memprediksi nilai yang berada di luar jangkauan data
dengan asumsi bahwa hubungan ini berlaku meskipun di luar jangkauan data.
Tentunya, hasil interpolasi lebih dapat dipercaya dibandingkan dengan ekstrapolasi.

Contoh 1 :

Misalkan kita memiliki data tentang jumlah jam belajar (variabel independen) dan skor ujian
(variabel dependen) dari sejumlah siswa, dan kita ingin membangun model regresi linear untuk
memprediksi skor ujian berdasarkan jumlah jam belajar.

Jumlah Jam belajar (x) 1 2 3 4 5 6 7 8 9 10


Skor ujian (y) 35 40 45 50 55 60 65 70 75 80

Jika persamaan garis regresi linear yang dihasilkan dari data di atas adalah:
Skor Ujian (y) = 30 + (5 x Jumlah Jam Belajar (x))
Di sini, nilai kemiringan (𝑏) adalah 5 dan titik potong sumbu-y (𝑎) adalah 30.
Interpretasi dari persamaan ini adalah sebagai berikut:
1. Kemiringan (Slope) : Nilai kemiringan garis adalah 5. Ini berarti bahwa setiap tambahan
satu jam belajar (x) dihubungkan dengan peningkatan rata-rata 5 poin dalam skor ujian
(y). Dengan kata lain, setiap tambahan waktu belajar satu jam berkontribusi pada
kenaikan skor ujian sebesar 5 poin.
2. Perpotongan sumbu-y : adalah 30. Ini berarti jika seorang siswa sama sekali tidak
belajar (x = 0 jam), mereka diperkirakan akan memiliki skor ujian sekitar 30. Ini bisa
diartikan sebagai skor dasar yang diperoleh jika siswa sama sekali tidak
mempersiapkan diri.
3. Prediksi Skor Ujian:
- Jika seorang siswa yang belajar selama 8,5 jam (x = 8,5), Kita dapat menghitung
prediksi skor ujian dengan menggunakan persamaan garis regresi:
Skor Ujian = 30 + (5 x 8,5) = 72,5
Jadi, jika seorang siswa belajar selama 8,5 jam, mereka diperkirakan akan
mendapatkan skor ujian sekitar 72,5 (prediksi ini merupakan prediksi
interpolasi).
- Jika seorang siswa yang belajar selama 12 jam (x = 12), Kita dapat menghitung
prediksi skor ujian dengan menggunakan persamaan garis regresi:
Skor Ujian = 30 + (5 x 12) = 90
Jadi, jika seorang siswa belajar selama 12 jam, mereka diperkirakan akan
mendapatkan skor ujian sekitar 90 (prediksi ini merupakan prediksi
ekstrapolasi).

B. Metode Kuadrat Terkecil untuk Menentukan Garis Best-Fit


Berdasarkan kegiatan belajar pada modul bagian 3 tentang membuat persamaan garis
linear dari scatterplot, pasti ada atau banyak ide atau gagasan yang berbeda-beda mengenai
garis lurus yang yang dibuat. Namun pertanyaannya, apakah ada cara untuk memutuskan
apakah suatu garis regresi linear yang dibuat sudah tepat atau tidak? Ternyata ada, metode
umum untuk menempatkan garis lurus ke data-data hasil observasi disebut sebagai metode
kuadrat terkecil.
Sesuai dengan nama metode itu nanti kalian perlu melakukan operasi kuadrat dan
tujuannya adalah untuk menemukan suatu nilai terkecil. Nilai apa yang perlu kita kecilkan
hingga sekecil mungkin? Mari kita lihat gambar diagram berikut ini sebagai visualisasi
sederhana dari metode ini.

Gambar 2. Garis regresi dan residu

Gambar 2 memberikan gambaran bahwa ada selisih antara nilai variabel dependen (𝑦) dari
data asli dengan nilai variabel dependen prediksi (𝑦̂ yang dibaca y topi) dari garis regresi.
Selisih antara nilai variabel dependen yang diamati (y) dan nilai variabel dependen yang
diprediksi (𝑦̂) disebut sebagai residu (𝜀 yang dibaca epsilon). Maka dari itu, rumus residu ditulis
sebagai berikut :

̂
𝑹𝒆𝒔𝒊𝒅𝒖 (𝜺) = 𝒚 − 𝒚

Menurut kalian, jumlah nilai mutlak residu yang semakin kecil atau semakin besar yang
akan membuat suatu model garis regresi semakin tepat?
Ya, benar, semakin kecil jumlah nilai mutlak residu ini, maka garis semakin dekat ke data asli
yang artinya semakin tepat pula garis yang digambar.

Meskipun demikian, perhitungan yang dilakukan ternyata tidak cukup hanya


menggunakan konsep jumlah nilai mutlak residu, namun harus menggunakan konsep jumlah
kuadrat dari nilai residu. Konsep jumlah kuadrat dari nilai residu dapat memberikan
karakteristik khusus untuk membedakan setiap garis regresi yang mungkin terbentuk dari
suatu kumpulan data yang tidak dapat diberikan oleh konsep jumlah nilai mutlak residu.

Kuadrat residu (𝜀 2 ) = (𝑦 − 𝑦̂)2

Jumlah Kuadrat Residu (∑ 𝜀 2 ) = ∑(𝑦 − 𝑦̂)2

Perlu diingat bahwa setiap kumpulan data mempunyai jumlah kuadrat residu terkecil yang
dapat dicapai oleh model garisnya. Dasar inilah yang digunakan dalam penurunan rumus
untuk mencari persamaan garis regresi. Akan tetapi, hal ini tidak memungkinkan untuk
diajarkan saat ini karena memerlukan ilmu kalkulus lanjutan.

Contoh :

Tabel berikut menunjukkan banyak tempat duduk terhadap biaya per jam dari tiga model
pesawat terbang yang digunakan oleh maskapai Garuda Indonesia.

Model Pesawat Banyak Tempat Duduk Biaya (rupiah/jam)


A 50 1.100.000,00
B 100 2.100.000,00
C 150 2.700.000,00
Persamaan garis regresi mana yang lebih tepat untuk memprediksi banyak tempat duduk
terhadap biaya?

𝑦̂ = 367000 + 16000𝑥 atau 𝑦̂ = 300000 + 16000𝑥

Jawab :

Perhitungan residu kuadrat dari 𝑦̂ = 367.000 + 16.000𝑥

𝑥 𝑦 𝑦̂ 𝑦 − 𝑦̂ (𝑦 − 𝑦̂)2
50 1.100.000 1.167.000 -67.000 4.489.000.000
100 2.100.000 1.967.000 133.000 17.689.000.000
150 2.700.000 2.767.000 -67.000 4.489.000.000
Jumlah kuadrat residu 26.667.000.000

Perhitungan residu kuadrat dari 𝑦̂ = 300.000 + 16.000𝑥

𝑥 𝑦 𝑦̂ 𝑦 − 𝑦̂ (𝑦 − 𝑦̂)2
50 1.100.000 1.100.000 0 0
100 2.100.000 1.900.000 200.000 40.000.000.000
150 2.700.000 2.700.000 0 0
Jumlah kuadrat residu 40.000.000.000

Oleh karena 𝑦̂ = 367.000 + 16.000𝑥 mempunyai jumlah kuadrat residu yang lebih kecil dari
𝑦̂ = 300.000 + 16.000𝑥 maka persamaan garis regresi 𝑦̂ = 367.000 + 16.000𝑥 merupakan
garis yang paling tepat untuk memprediksi banyak tempat duduk terhadap biaya.
Uji Kompetensi

Jawablah pertanyaan berikut ini!

1. Biaya mingguan sebuah usaha kecil ditentukan dengan persamaan C = 25x + 300 di
mana C mewakili biaya mingguan usaha tersebut ketika x barang diproduksi. Berapa
titik potong sumbu y dari grafik persamaan ini dan apa artinya?
a. Titik potong dengan sumbu y adalah 25. Ini mewakili biaya mingguan meskipun
tidak ada barang yang diproduksi.
b. Titik potong dengan sumbu y adalah 300. Ini menunjukkan tingkat kenaikan biaya
untuk setiap barang tambahan yang diproduksi.
c. Titik potong dengan sumbu y adalah 25. Ini menunjukkan tingkat kenaikan biaya
untuk setiap barang tambahan yang diproduksi.
d. Titik potong dengan sumbu y adalah 300. Ini mewakili biaya mingguan meskipun
tidak ada barang yang diproduksi.
e. Tidak mungkin untuk menentukan titik potong dengan sumbu y tanpa melihat
data yang diplot pada diagram pencar.
2. Panjang dan diameter (dalam mm) sampel ubur-ubur yang dipilih dari lokasi tertentu
dicatat dan ditampilkan dalam diagram pencar di bawah ini. Garis regresi untuk data
ini ditampilkan. Persamaan garis regresinya adalah
panjang = 3,5 + (0,87 × diameter)

Dari persamaan garis regresi tersebut, dapat disimpulkan bahwa untuk ubur-ubur ini,
rata-rata :
a. ada peningkatan diameter 3,5 mm untuk setiap peningkatan panjang 1 mm.
b. ada penambahan panjang 3,5 mm untuk setiap penambahan diameter 1 mm.
c. ada peningkatan diameter 0,87 mm untuk setiap peningkatan panjang 1 mm.
d. ada peningkatan panjang 0,87 mm untuk setiap peningkatan diameter 1 mm.
e. ada peningkatan diameter 4,37 mm untuk setiap peningkatan panjang 1 mm.
3. Rata-rata curah hujan dan rata-rata suhu di beberapa lokasi berbeda di wilayah
Pasifik Selatan ditampilkan dalam diagram pencar di bawah ini. Grafik regresi linear
sbb :

Persamaan garis regresi linear yang tepat adalah ...


a. Rata-rata curah hujan = 210 – (11 x rata-rata suhu)
b. Rata-rata curah hujan = 210 + (11 x rata-rata suhu)
c. Rata-rata curah hujan = 18 - (0,08 x rata-rata suhu)
d. Rata-rata curah hujan = 18 + (0,08 x rata-rata suhu)
e. Rata-rata curah hujan = 250 - (13 x rata-rata suhu)
4. Diketahui persamaan best fit sebuah data adalah 𝑦̂ = 250 + 3,6𝑥
a. Tentukan nilai 𝑥 saat 𝑦̂ = 430
b. Tentukan nilai 𝑦̂ saat 𝑥 = 40
5. Diketahui data sebagai berikut!

Persamaan garis regresi manakah yang lebih tepat untuk memprediksi data? Apakah
𝑦̂ = 60 − 𝑥 atau 𝑦̂ = 61 − 0,5𝑥 ?

Anda mungkin juga menyukai