FIRSTQI WIRA A
NIM : 210611609394
SOAL
A. Silahkan kalian mendelajah dan temukan materi tentang analisis regresi. Tugas di bawah
ini di ketik di kertas ukuran A4 spasi 1.5 font 12. Tugasnya sbb.
1. Apakah yang dimaksd dengan analisis regresi, jelaskan!
2. Apakah perbedaan antara analisis korelasi (anakorel) dengan analisis regresi (anareg),
lengkapi dg contohnya.
3. Identifikasikan macam² analisis regresi tersebut! Lengkapi dg contohnya
4. Bagaimanakah bentuk garis persamaan regresi tunggal dan berganda 2 variabel bebas
dan 3 bebas.
5. Apakah yang dimaksud dg intercep dan apakah simbolnya.
6. Apakah yg dimaksud dg slope, jelaskan dan apakah simbolnya
7. Bagaimanakah cara mencari koef. Regresi Intercept untuk 1 variabel bebas, 2 variabel
bebas dan 3 variabel bebas
8. Bagaimanakah rumus untuk menghitung koefisien regresi bentuk intercept
9. Bagaimanakah cara menghitung koefisien slop
10. Temukan bagimana rumus uji lanjut agar garis regresi dapat digunakan untuk
meramalkan individu
JAWABAN :
1. Apakah yang dimaksd dengan analisis regresi, jelaskan!
Analisis regresi mempelajari bentuk hubungan antara satu atau lebih
peubah/variabel bebas (X) dengan satu peubah tak bebas (Y). Dalam penelitian
peubah bebas ( X) biasanya peubah yang ditentukan oleh peneliti secara bebas
misalnya dosis obat, lama penyimpanan, kadar zat pengawet, umur ternak dan
sebagainya. Analisis regresi merupakan suatu metode atau teknik analisis hipotesis
penelitian untuk menguji ada tidaknya perngaruh antara variabel satu dengan variabel
lain, yang dinyatakan dalam bentuk persamaan matematik (regresi).
Terdapat dua jenis dasar regresi yaitu, regresi linear sederhana dan regresi
linear berganda. Kalau regresi linear sederhana menggunakan satu variabel
independen untuk menjelaskan atau memprediksi hasil dari variabel dependen Y.
Sedangkan regresi linear multiples atau berganda berfungsi untuk mencari pengaruh
dari dua atau lebih variabel independent (variabel bebas atau X) terhadap variabel
dependent (variabel terikat Y).
Dengan demikian secara sederhana dapat dikatakan bahwa, apabila kita ingin
mengetahui ada tidaknya pengaruh satu variabel X terhadap variabel Y maka
digunakan analisis regresi sederhana. Sementara apabila kita ingin mengetahui
pengaruh dua variabel X atau lebih terhadap variabel Y maka digunakan analisis
regresi linear ganda (multiples)
2. Perbedaan dasar antara analisis korelasi (anakorel) dengan analisis regresi (anareg)
sebagai berikut;
a. Korelasi Pearson
Korelasi Pearson r adalah statistik korelasi yang paling banyak digunakan untuk
mengukur tingkat hubungan antara variabel yang berhubungan secara linier.
Sebagai contoh, di pasar saham, jika kita ingin mengukur bagaimana dua saham
saling terkait, digunakan korelasi Pearson r untuk mengukur derajat hubungan
antara keduanya. Korelasi Point-Biserial dilakukan dengan rumus korelasi
Pearson kecuali salah satu variabelnya dikotomis.
1. Apakah ada hubungan yang signifikan secara statistik antara usia, yang diukur
dalam tahun, dan tinggi, yang diukur dalam cm?
2. Apakah ada hubungan antara suhu, diukur dalam derajat Fahrenheit, dan
penjualan es krim, diukur dengan pendapatan?
3. Apakah ada hubungan antara kepuasan kerja, yang diukur dengan JSS, dan
pendapatan, yang diukur dalam dolar?
b. Korelasi peringkat Kendall
Berikut rumus yang digunakan untuk menghitung nilai korelasi rank kendall:
d. Korelasi Positif
Korelasi positif adalah hubungan antara dua variabel di mana kedua variabel
bergerak searah. Oleh karena itu, ketika satu variabel meningkat seiring dengan
peningkatan variabel lainnya, atau satu variabel menurun sedangkan variabel
lainnya menurun. Contoh korelasi positif adalah tinggi dan berat badan. Orang
yang lebih tinggi cenderung lebih berat.
Korelasi positif berkisar dari 0 hingga +1; batas atas yaitu +1 adalah koefisien
korelasi positif sempurna. Korelasi positif sempurna menentukan bahwa, untuk
setiap peningkatan unit dalam satu variabel, ada peningkatan proporsional di
variabel lainnya.
e. Korelasi Negatif
Korelasi negatif adalah hubungan antara dua variabel di mana kenaikan satu
variabel dikaitkan dengan penurunan variabel lainnya. Contoh korelasi negatif
adalah ketinggian di atas permukaan laut dan suhu. Saat kita mendaki gunung
(bertambahnya ketinggian), semakin dingin (penurunan suhu).
f. Korelasi Nol
Korelasi nol ada jika tidak ada hubungan antara dua variabel. Misalnya tidak ada
hubungan antara jumlah minum teh dan tingkat kecerdasan. Contoh lainnya
misalnya tidak ada korelasi antara berat badan dan kecerdasan, ukuran sepatu
dan gaji bulanan. Korelasi nol adalah titik tengah rentang – 1 hingga +1.
Perlu diketahui, dalam regresi linier berganda terdapat lebih dari satu variabel
independen dan dalam regresi linier sederhana hanya terdapat satu variabel
independen. Dengan demikian, regresi linier paling baik digunakan hanya jika ada
hubungan linier antara variabel bebas dan contohnya :
Misalnya saja sebuah bisnis dapat menggunakan regresi linier untuk mengukur
keefektifan kampanye pemasaran, penetapan harga, dan promosi atas penjualan suatu
produk. Misalkan sebuah perusahaan yang menjual peralatan olahraga ingin
memahami apakah dana yang mereka investasikan dalam pemasaran dan branding
produk mereka telah memberi mereka keuntungan yang besar atau tidak.
Dari contoh tersebut regresi linier adalah metode statistik terbaik untuk menafsirkan
hasil. Hal terbaik tentang regresi linier adalah ini juga membantu dalam menganalisis
dampak yang tidak jelas dari setiap aktivitas pemasaran dan pencitraan merek, namun
juga mengontrol potensi konstituen untuk mengatur penjualan.
Jika perusahaan menjalankan dua atau lebih kampanye iklan pada saat yang
bersamaan yang seolah-olah satu di televisi dan dua di radio, maka regresi linier dapat
dengan mudah menganalisis pengaruh independen serta gabungan dari menjalankan
iklan ini bersama-sama.
Perlu diketahui, regresi logistik tidak memerlukan hubungan linier antara variabel
dependen dan variabel independen seperti halnya regresi linier. Regresi logistik
menerapkan transformasi log non-linier untuk memprediksi rasio peluang. Oleh
karena itu, ia dengan mudah menangani berbagai jenis hubungan antara variabel
dependen dan variabel independen. Contohnya :
Adapun contoh metode dalam regresi logistik banyak digunakan untuk menganalisis
data kategorik, khususnya untuk data respon biner dalam pemodelan data bisnis.
Regresi logistik lebih sering digunakan ketika variabel dependen bersifat kategoris
seperti memprediksi apakah klaim kesehatan yang dibuat oleh seseorang itu nyata
atau curang, untuk memahami apakah tumor itu ganas atau tidak.
Perlu dicatat bahwa regresi polinomial lebih baik digunakan ketika beberapa variabel
memiliki eksponen dan sedikit yang tidak. Selain itu, dapat memodelkan data yang
dapat dipisahkan secara non-linier yang menawarkan kebebasan untuk memilih
eksponen yang tepat untuk setiap variabel dan itu juga dengan kontrol penuh atas fitur
pemodelan yang tersedia.
Adapun contoh analisis regresi polinomial bila dikombinasikan dengan analisis
permukaan respons dianggap sebagai pendekatan statistik canggih yang biasa
digunakan dalam penelitian umpan balik multisumber. Regresi polinomial banyak
digunakan di industri yang berhubungan dengan keuangan dan asuransi dimana
hubungan antara variabel dependen dan independen bersifat lengkung.
Dimana anlisis data ini hanya menyempurnakan model analisis dengan memasukkan
variabel secara acak. Analisis regresi bertahap direkomendasikan untuk digunakan
jika terdapat beberapa variabel independen, di mana pemilihan variabel independen
dilakukan secara otomatis tanpa campur tangan manusia.
Perlu kita catat bahwa dalam pemodelan regresi bertahap, variabel ditambahkan atau
dikurangkan dari kumpulan variabel penjelas. Kumpulan variabel yang ditambahkan
atau dihapus dipilih tergantung pada statistik uji dari koefisien yang diperkirakan.
Misalkan kita memiliki sekumpulan variabel independen seperti usia, berat badan,
luas permukaan tubuh, durasi hipertensi, denyut nadi basal, dan indeks stres
berdasarkan yang ingin kita analisis pengaruhnya terhadap tekanan darah.
Dalam regresi bertahap, subset terbaik dari variabel independen dipilih secara
otomatis, baik dimulai dengan tidak memilih variabel untuk melanjutkan lebih jauh
(karena menambahkan satu variabel pada satu waktu) atau dimulai dengan semua
variabel dalam model dan melanjutkan ke belakang (menghapus satu variabel pada
suatu waktu).
Jadi, dengan menggunakan analisis regresi, kita dapat menghitung dampak masing-
masing atau sekelompok variabel terhadap tekanan darah.
Regresi ridge didasarkan pada metode kuadrat terkecil biasa yang digunakan untuk
menganalisis data multikolinearitas (data di mana variabel independen sangat
berkorelasi). Kolinearitas dapat dijelaskan sebagai hubungan yang hampir linier
antara variabel.
Setiap kali terjadi multikolinearitas, perkiraan kuadrat terkecil tidak akan bias; tetapi,
jika perbedaan di antara keduanya lebih besar, maka itu mungkin jauh dari nilai
sebenarnya. Namun, regresi ridge menghilangkan kesalahan standar dengan
menambahkan beberapa tingkat bias ke perkiraan regresi dengan motif untuk
memberikan perkiraan yang lebih dapat diandalkan.
Perlu kita catat bahwa asumsi yang diturunkan melalui regresi ridge mirip dengan
regresi kuadrat terkecil, satu-satunya perbedaan adalah normalitas. Meskipun nilai
koefisien dibatasi dalam regresi ridge, nilai koefisien tidak pernah mencapai nol yang
menunjukkan ketidakmampuan untuk memilih variabel.
Misalkan kita tergila-gila pada dua gitaris yang tampil live di sebuah acara di dekat
tempat tinggal kita dan kita pergi menonton penampilan mereka dengan motif untuk
mencari tahu siapa gitaris yang lebih baik.
Tetapi ketika pertunjukan dimulai, kita melihat bahwa keduanya memainkan nada
hitam-biru pada saat yang bersamaan. Apakah mungkin menemukan gitaris terbaik
yang memiliki pengaruh terbesar pada suara di antara mereka saat mereka bermain
dengan keras dan cepat?
Karena keduanya memainkan nada yang berbeda, sangat sulit untuk membedakannya,
menjadikannya kasus multikolinearitas terbaik, yang pada gilirannya memiliki
kecenderungan meningkatkan kesalahan standar koefisien. Regresi ridge membahas
multikolinearitas dalam kasus-kasus seperti ini dan menyertakan bias atau estimasi
penyusutan untuk mendapatkan hasil.
Regresi berganda sebagai salah satu jenis analisis statistik, banyak sekali macamnya,
tergantung pada skala data per variabel. Berikut saya jelaskan satu persatu:
Contoh regresi berganda jenis ini adalah: “pengaruh DER dan NPM terhadap Return
Saham.”
A. Regresi Berganda
a. Regresi Logistik Berganda
Ada 5 metode perhitungan jenis regresi ordinal yang dapat anda pelajari pada
artikel kami yang berjudul: Penjelasan Regresi Ordinal. Contoh regresi berganda jenis
ini adalah: pengaruh tingkat penghasilan dan usia terhadap tingkat pengetahuan
terhadap IT. Dimana tingkat penghasilan sebagai faktor dengan kategori: rendah,
menengah dan tinggi. Usia sebagai covariates dengan skala data numerik. Dan tingkat
pengetahuan terhadap IT sebagai variabel terikat berskala data ordinal dengan
kategori: baik, cukup dan kurang.
Regresi multinomial berganda adalah jenis regresi dimana variabel terikat adalah data
nominal dengan jumlah kategori lebih dari 2 (dua) dan variabel bebas ada lebih dari
satu variabel. Jenis regresi ini hampir sama dengan regresi logistik berganda, namun
bedanya adalah variabel terikat kategorinya lebih dari dua, sedangkan regresi logistik
berganda variabel terikatnya mempunyai kategori hanya dua (dikotomi). Regresi ini
juga mirip dengan regresi ordinal, hanya saja bedanya skala data pada regresi ini tidak
bertingkat (bukan ordinal) atau dengan kata lain tidak ada yang lebih baik atau lebih
buruk.
Contoh regresi ini adalah: Pengaruh Pendidikan Orang Tua dan Penghasilan Orang
Tua terhadap pilihan jurusan kuliah. Dimana pendidikan dan penghasilan orang tua
berskala data ordinal dan pilihan jurusan kuliah adalah variabel berskala data nominal
lebih dari dua kategori, yaitu: jurusan kesehatan, hukum, sosial, sastra, pendidikan,
lain-lain.
Dari jenis-jenis di atas, sebenarnya masih ada jenis lain yang merupakan
pengembangan dari jenis-jenis di atas, yaitu dengan adanya kompleksitas berupa data
time series atau runtut waktu, atau data panel. Seperti yang terjadi pada regresi data
panel ataupun regresi cochrane orcutt.
Kalau misalnya regresi linear data panel, jika ada lebih dari satu variabel bebas, maka
bisa disebut dengan istilah regresi linear data panel berganda. Namun kebanyakan
orang atau peneliti, cukup menggunakan istilah yang umum digunakan, yaitu cukup
dengan menyebut sebagai regresi data panel saja.
4. Bagaimanakah bentuk garis persamaan regresi tunggal dan berganda 2 variabel bebas
dan 3 bebas.
Analisis regresi linear berganda sebenarnya sama dengan analisis regresi linear sederhana,
hanya variabel bebasnya lebih dari satu buah. Persamaan umumnya adalah:
Dengan Y adalah variabel bebas, dan X adalah variabel-variabel bebas, a adalah konstanta
(intersept) dan b adalah koefisien regresi pada masing-masing variabel bebas.
Interpretasi terhadap persamaan juga relatif sama, sebagai ilustrasi, pengaruh antara motivasi
(X1), kompensasi (X2) dan kepemimpinan (X3) terhadap kepuasan kerja (Y) menghasilkan
persamaan sebagai berikut:
Langkah-langkah yang lazim dipergunakan dalam analisis regresi linear berganda adalah
1) koefisien determinasi; 2) Uji F dan 3 ) uji t. Persamaan regresi sebaiknya dilakukan di
akhir analisis karena interpretasi terhadap persamaan regresi akan lebih akurat jika telah
diketahui signifikansinya. Koefisien determinasi sebaiknya menggunakan Adjusted R
Square dan jika bernilai negatif maka uji F dan uji t tidak dapat dilakukan.
Y ˆ a bX
yang mana :
Y ˆ = garis regresi/ variable response
a = konstanta (intersep), perpotongan dengan sumbu vertikal
b = konstanta regresi (slope) X = variabel bebas/ predictor