PENDAHULUAN
1
BAB II
PEMBAHASAN
Istilah regresi diperkenalkan oleh seseorang yang bernama Francis Galton. Menurut hasil
penelitian Francis Galton, meskipun ada kecenderungan bagi orangtua yang tinggi untuk
mempunyai anak yang tinggi dan orangtua yang pendek untuk mempunyai anak yang pendek,
distribusi mengenai tinggi dari suatu populasi tidak berubah dari generasi ke generasi. Hukum
regresi yang universal dari Galton telah dibuktikan oleh temannya yang bernama Karl Pearson.
Ia menemukan bahwa rata-rata tinggi anak dari kelompok orangtua yang tinggi ternyata lebih
kecil dari tinggi ayahnya, dan rata-rata tinggi anak dari kelompok orangtua yang pendek ternyata
lebih besar daripada tinggi ayah, jadi seolah-olah semua anak yang tinggi dan yang pendek
bergerak menuju ke rata-rata tinggi dari seluruh orang laki-laki. Menurut istilah
Galton: regression to mediocrity.
Interpretasi modern mengenai regresi agak berlainan dengan regresi versi Galton. Secara
umum, analisis regresi pada dasarnya adalah studi mengenai ketergantungan variable dependen
(terikat) dengan satu atau lebih variable independen (variable penjelas/bebas), dengan tujuan
untuk mengistimasi atau memprediksi rata-rata populasi atau nilai rata-rata variable berdasarkan
nilai variable yang diketahui.
Contoh:
Dapat diketahui bahwa dalam analisis regresi kita menaruh perhatian pada apa yang
dikenal sebagai ketergantungan secara statistik , bukan ketergantungan secara fungsi antar
variable, seperti pada fisika klasik. Di lain pihak, dalam fenomena deteminan, kita membahas
2
mengenai tipe sebuah hubungan, misal, seperti yang dijelaskan pada hukum gravitasi newton
yang menyebabkan setiap partikel dalam jagat raya ini dapat menarik partikel yang lain.
Analisis korelasi berhubungan secara dekat, namun secara konsep sangatlah berbeda
artinya dari analisis regresi, dimana objek utama adalah mengukur kekuatan atau tingkat
hubungan linier di antara dua variable. Sebagai contoh, kita dapat sangat tertarik untuk mencari
korelasi (koefisien) antara merokok dan penyakit paru-paru, antara nilai ujian statistic dan nilai
ujian matematika, antara besarnya nilai SMA dan nilai kuliah dan sebagainya, dalam analisis
regresi, seperti yang telah dijelaskan sebelumnya, kita menaruh perhatian utama pada nilai
ukuran-ukuran yang disebutkan tadi. Namun demikian, kita berusaha untuk membuat estimasi
atau membuat perkiraan dari nilai rata-rata suatu variable berdasarkan nilai pagu (tetap-fixed)
dari variable sebelumnya.
Istilah acak bersinonim dengan istilah stokastik. Variable acak atau stotastik adalah sebuah
variable yang dapat bernilai berapa pun, negatif maupun positif, dengan probabilitas tertentu.
Keberhasilan sebuah analisis ekonometrika sangat bergantung pada ketersediaan dari data
yang tepat. Oleh karena itu, sangatlah pentiing bagi kita meluangkan waktu untuk membahas
mengenai sifat, sumber, dan keterbatasan data yang mungkin saja ditemui dalam sebuah analisis
emperis.
Ada tiga data yang tersedia untuk sebuah analisis emperis, yaitu:
3
1. Data Time series
Data series adalah sebuah kumpulan observasi terhadap nilai-nilai sebuah variable dari
beberapa periode waktu yang berbeda. Data seperti itu dapat dikumpulkan pada sebuah
interval periode yang regular, seperti harian (misal, harga saham, laporan cuaca),
mingguan (misal, informasi uang beredar), bulanan (miasal, tingkat pengangguran,
indeks harga konsumen). Kadang data dapat tersedia baik untuk periode kuartalan atau
tahunan, seperti data PDB dan pengeluaran konsumen.
2. Data Cross-Section
Data cross-section adalah data yang terdiri atas satu atau lebih variable yang
dikumpulkan dalam satu periode yang sama.
3. Data Pool
Data pool adalah data kombinasi dari data time series dan data cross-section.
Sumber-sumber Data
Data-data yang digunakan dalam analisis empiris dapat dikumpulkan oleh pemerintah
(misal, departemen perdagangan), lembaga internasional (misal, international moneteri fund atau
world bank), pihak swasta (misal, standart dan poor’s corporation), atau perseorangan. Dengan
kata lain, terdapat ribuan lembaga yang melakukan pengumpulan data untuk kepentingan
masing-masing atau bersama. Data-data tersebut dapat bersumber dari:
Internet
Internet telah mengubah sifat pengumpulan data. Jika anda “berselancar di dunia maya”
dengan sebuah kata kunci (misal, nilai tukar). Anda akan mendapatkan sumber data. Data yang
dikumpilkan oleh lembaga ini dapat bersifat eksperimental maupun noneksperimental. Pada data
yang bersifat eksperimental, yang sering kali dikumpulkan pada ilmu ilmu alam. Pada data yang
bersifat noneksperimental sering kali dikumpulkan pada ilmu ilmu social dalam data tersebut
tidak dapat dikontrol atau dikendalikan oleh peneliti.