Dosen Pengampu: Prof. Dr. Dra. Ida Ayu Nyoman Saskara, M.Si.
Disusun oleh:
Kelompok 9
UNIVERSITAS UDAYANA
2022
KATA PENGANTAR
Puji syukur penyusun panjatkan kehadiran Tuhan Yang Maha Esa yang telah
melimpahkan berkat, rahmat, serta karunia-Nya, sehingga penyusun dapat
menyelesaikan paper yang berjudul “Analisis Regresi Dasar dengan Data Time Series”
Adapun tujuan dari penyusunan paper ini adalah untuk memenuhi serta melengkapi
tugas mata kuliah Ekonometrika, serta untuk menambah wawasan dan pengetahuan
bagi pembaca dan penyusun.
Penysun menyadari bahwa dalam penyusunan paper ini masih banyak kesulitan
dan tidak dapat diselesaikan tanpa bantuan orang lain. Untuk itu, pada kesempatan ini
penyusun mengucapkan terima kasih kepada orang tua yang telah memberikan
dorongan serta motivasi yang tidak pernah henti. Penyusun juga mengucapkan terima
kasih kepada dosen pengampu mata kuliah Ekonometrika yaitu Prof. Dr. Dra. Ida Ayu
Nyoman Saskara, M.Si. dan teman-teman.
Penyusun juga menyadari bahwa paper ini belum bisa dikatakan sempurna dan
masih memiliki banyak kekurangan. Untuk itu, penyusun mengharapkan masukan,
saran dan kritik yang membangun untuk menyempurnakan paper ini. Semoga paper ini
dapat bermaanfaat bagi pembaca serta penyusun.
Penyusun
I
DAFTAR ISI
II
BAB I
PENDAHULUAN
Metode regresi telah berkembang menjadi salah satu alat analisis yang banyak
digunakan dalam penelitian di bidang ekonomi, manajemen, akutansi dan bisnis, serta
bidang kajian lainnya. Perkembangan metode analisis regresi telah mengalami
berbagai kemajuan yang pesat, baik dalam aspek metode estimasi maupun variasi data
yang digunakan, perkembangan tersebut tidak terlepas dari kebutuhan terhadap alat
analisis yang mampu mengakomodasi berbagai bentuk data, salah satunya data antar
waktu (time series).
Model regresi data time series memiliki karakteristik khusus yang dirancang untuk
menangkap sifat dinamisnya. Kita bisa menganalisis dengan melihat bagaimana nilai
lag dari variabel dependen atau variabel penjelas sebagai regressor, atau juga
mempertimbangkan lag dalam residual, yang dapat digunakan untuk memodelkan
hubungan dinamis. Kita juga bisa menggunakan model autoregresif (AR) dalam
melakukan peramalan.
Analisis regresi data time series sangat penting bagi peneliti di beberapa bidang,
seperti para ahli ekonomi makro yang mempelajari perilaku ekonomi nasional dan
internasional, ekonom keuangan yang menganalisis pasar saham, dan ekonom
pertanian yang memprediksi penawaran dan permintaan produk-produk pertanian.
Misalnya, jika kita tertarik untuk memperkirakan pertumbuhan PDB atau inflasi, kita
bisa melihat berbagai indikator kinerja ekonomi dan mempertimbangkan perilakunya
selama beberapa tahun terakhir. Atau, jika kita tertarik menganalisis perubahan jumlah
pengangguran, kita bisa melihat perubahan jumlah lulusan tiap tahun maupun
perkembangan investasi yang terealisasi. Kita menganalisis masalah -masalah ini
menggunakan data time series.
1
2
1.3 Tujuan
Karakteristik nyata dari data time series yang membedakannya dari data cross-
sectional adalah bahwa rangkaian data time series dilengkapi dengan urutan waktu
temporal. Data time series adalah data yang dikumpulkan dari waktu ke waktu secara
berurutan pada satu atau lebih objek yang sama pada setiap periode waktu. Alasan
penggunaan data ini karena peristiwa masa lalu dapat mempengaruhi peristiwa masa
depan. Sangat tidak masuk akal jika sebaliknya, dimana tidak mungkin peristiwa yang
terjadi sekarang dapat mempengaruhi peristiwa kemarin.
Perbedaan lain antara data cross-sectional dan time series adalah masalah data
random (acak). Ketika kita mempelajari sifat statistik untuk estimasi dengan rumus
ordinary least square (OLS) berdasarkan pada gagasan bahwa sampel diambil secara
acak dari populasi yang sesuai. Memahami mengapa data cross-sectional harus diambil
secara acak adalah sampel yang berbeda diambil dari populasi umumnya akan
menghasilkan nilai yang berbeda baik variabel independen dan depe nden (seperti
pendidikan, pengalaman, upah, dan sebagainya). Oleh karena itu, estimasi OLS yang
dihitung dari sampel acak yang berbeda umumnya akan berbeda, dan inilah sebabnya
kita menganggap estimasi OLS dibangun menggunakan variabel acak. Bagaimana
seharusnya kita berpikir tentang keacakan dalam data time series? Tentu saja, data urut
waktu memenuhi persyaratan intuitif sebagai variabel acak. Sebagai contoh, hari ini
kita tidak tahu berapa nilai IHSG ditutup, kita juga tidak akan tahu persis berapa
pertumbuhan ekonomi Indonesia pada tahun ini. Karena nilai dari variabel-variabel ini
tidak diketahui sebelumnya, maka dengan mantab kita bisa mengatakan bahwa data
urut waktu sebagai variabel acak.
Secara formal, urutan variabel acak yang diindeks oleh waktu d isebut proses
stokastik atau proses deret waktu. “Stochastic” adalah sinonim dari kata acak yang
sering digunakan dalam istilah data time series. Ketika kita mengumpulkan data urut
3
4
waktu, kita akan memperoleh satu hasil yang mungkin berasal dari realisasi proses
stokastik. Kita hanya dapat melihat satu realisasi, karena kita tidak dapat kembali ke
masa lalu dan memulai kehidupan dari awal lagi. (Ini sejalan dengan analisis cross-
sectional di mana kita hanya dapat mengumpulkan satu sampel acak.) Namun, jika
kondisi tertentu dalam sejarah berbeda, kita umumnya akan memperoleh realisasi yang
berbeda untuk proses stokastik, dan inilah mengapa kita memikirkan waktu. Data seri
sebagai hasil dari variabel acak. Himpunan semua realisasi yang mungkin dari proses
deret waktu memainkan peran populasi dalam analisis cross-sectional. Ukuran sampel
untuk kumpulan data deret waktu adalah jumlah periode waktu di mana kami
mengamati variabel yang diinginkan.
Misalkan kita memiliki data deret waktu yang tersedia pada dua variabel,
katakanlah y dan z, di mana yt dan zt diberi tanggal secara bersamaan. Model statis
yang menghubungkan y ke z adalah:
(10.1)
Nama "model statis" berasal dari fakta bahwa kita memodelkan hubungan
kontemporer antara y dan z. Biasanya, model statis didalilkan ketika perubahan z pada
waktu t diyakini memiliki efek langsung pada y: ∆𝑦1 = 𝛽1 ∆𝑧1 , ketika ∆𝑢𝑡 = 0. Model
regresi statis juga digunakan ketika kita tertarik untuk mengetahui tradeoff antara y
dan z. Contoh model statis adalah kurva Phillips statis, yang diberikan oleh
(10.2)
Di mana inf t adalah tingkat inflasi tahunan dan unem t adalah tingkat
pengangguran tahunan. Bentuk kurva Phillips ini mengasumsikan tingkat
pengangguran alami yang konstan dan ekspektasi inflasi yang konstan, dan dapat
5
digunakan untuk mempelajari tradeoff yang terjadi pada saat yang bersamaan antara
inflasi dan pengangguran.
Secara alami, kita dapat memiliki beberapa variabel penjelas dalam model
regresi statis. Biarkan mrdrte t menunjukkan pembunuhan per 10.000 orang di kota
tertentu selama tahun t, biarkan convrte t menunjukkan tingkat hukuman pembunuhan,
biarkan unemt menjadi tingkat pengangguran lokal, dan biarkan yngmlet menjadi
bagian dari populasi yang terdiri dari laki-laki antara usia 18 dan 25. Kemudian,
model regresi berganda statis yang menjelaskan tingkat pembunuhan adalah:
(10.3)
Dalam model lag terdistribusi terbatas kami mengizinkan satu atau lebih
variabel mempengaruhi y dengan lag. Untuk contoh, untuk pengamatan tahunan,
pertimbangkan modelnya:
(10.4)
Di mana gfrt adalah tingkat kesuburan umum (anak yang lahir per 1.000 wanita
usia subur) dan hewan peliharaan adalah nilai dolar sebenarnya dari pembebasan
pajak pribadi. Idenya adalah untuk melihat apakah, secara agregat, keputusan untuk
memiliki anak terkait dengan nilai pajak memiliki anak. Persamaan (10.4) mengakui
bahwa, baik untuk alasan biologis dan perilaku, keputusan untuk memiliki anak tidak
akan serta merta dihasilkan dari perubahan pengecualian pribadi. Persamaan (10.4)
adalah contoh model:
(10.5)
6
Yang merupakan model lag terdistribusi terbatas orde dua. Untuk menafsirkan
koefisien dalam (10.5), anggaplah z adalah konstanta, sama dengan c, di semua
periode waktu sebelum waktu t. Pada waktu t, z meningkat satu unit ke c + 1 dan
kemudian kembali ke level sebelumnya pada waktu t + 1. (Artinya, peningkatan z
bersifat sementara.) Lebih tepatnya,
Untuk fokus pada efek ceteris paribus dari z pada y, kami menetapkan istilah
kesalahan di setiap periode waktu menjadi nol. Kemudian,
Demikian pula, 𝛿1 = y t+1 – y t-1 perubahan dalam y satu periode setelah perubahan
sementara dan 𝛿2= y t+2 – y t-1 adalah perubahan dalam y dua periode setelah perubahan.
Pada waktu t + 3, y telah kembali ke tingkat awalnya: y t+3 = y t-1. Ini karena kita telah
mengasumsikan bahwa hanya dua lag dari z yang muncul pada (10 .5). Ketika kita
membuat grafik 𝛿𝑗 sebagai fungsi dari j, kita memperoleh distribusi lag, yang
merangkum efek dinamis dari peningkatan sementara z terhadap y. Distribusi lag
yang mungkin untuk FDL orde dua diberikan pada Gambar 10.1. (Tentu saja, kita
tidak akan pernah mengetahui parameter 𝛿𝑗; sebaliknya, kita akan mengestimasi
𝛿𝑗dan kemudian memplot estimasi distribusi lag.)
Distribusi lag pada Gambar 10.1 menyiratkan bahwa efek terbesar adalah pada
lag pertama. Distribusi lag memiliki interpretasi yang berguna. Jika kita membakukan
7
nilai awal y pada y t-1 = 0, distribusi lag menelusuri semua nilai y selanjutnya karena
peningkatan satu unit sementara di z.
Ketika model memiliki variabel penjelas tertinggal (dan, seperti yang akan kita
lihat di bab berikutnya, untuk model dengan y tertinggal), kebingungan dapat muncul
mengenai perlakuan pengamatan awal. Sebagai contoh, jika dalam (10.5) kita
asumsikan bahwa persamaan berlaku mulai dari t = 1, maka variabel penjelas untuk
periode waktu pertama adalah z 1, z0, dan z-1. Konvensi kami adalah bahwa ini adalah
nilai awal dalam sampel kami, sehingga kami selalu dapat memulai indeks waktu
8
pada t = 1. Dalam praktiknya, ini tidak terlalu penting karena paket regresi secara
otomatis melacak pengamatan yang tersedia untuk memperkirakan model dengan
tertinggal. Tetapi untuk ini dan dua bab berikutnya, kita memerlukan beberapa
konvensi mengenai periode waktu pertama yang diwakili oleh persamaan regresi.
Dalam notasi x tj, t menunjukkan periode waktu, dan j adalah seperti biasa di
mana label untuk menunjukkan salah satu dari k atau variabel penjelas. Terminologi
yang digunakan dalam regresi cross-sectional berlaku di sini di mana y t adalah
variabel dependen, variabel yang dijelaskan atau regresi dan x tj adalah variabel
bebas, variabel penjelas, atau regresi. Misalnya, persamaan
dengan n baris dan k kolom. Ini mencerminkan bagaimana data deret waktu
disimpan dalam paket perangkat lunak ekonometrik: baris ketiga dari X adalah xt ,
terdiri dari semua variabel bebas untuk periode waktu t. Oleh karena itu, baris
pertama X sesuai dengan t = 1, baris kedua dengan t = 2, dan baris terakhir dengan
t = n. Secara alami, seperti halnya regresi cross-sectional, kita perlu
mengesampingkan kolinearitas sempurna di antara regresi.
Dalam sampel (dan karena itu dalam proses deret waktu yang mendasarinya),
tidak ada variabel independen yang konstan atau kombinasi linear sempurna dari
variabel lainnya.
E{𝑢𝑡|𝑋} = 0, 𝑡 = 1,2, . . . , 𝑛.
Ini adalah asumsi penting di mana asumsi ini menyiratkan bahwa kesalahan
pada waktu t, u t tidak berkorelasi dengan setiap variabel penjelas di setiap periode
waktu.Penting untuk melihat bahwa asumsi ketiga ini tidak membatasi korelasi
dalam variabel independen atau di u t sepanjang waktu. Asumsi ini hanya
menyatakan bahwa nilai rata-rata u t tidak berhubungan dengan variabel bebas pada
semua periode waktu.
Apa pun yang menyebabkan hal-hal yang tidak dapat diamati pada waktu t
untuk dikorelasikan dengan variabel penjelas mana pun dalam periode waktu apa
pun menyebabkan asumsi ketiga ini gagal. Dua kandidat utama untuk kegagalan
adalah variabel yang dihilangkan dan kesalahan pengukuran di beberapa regressor.
Tetapi asumsi eksogenitas yang ketat juga bisa gagal karena alasan lain yang kurang
jelas. Dalam model regresi statis sederhana
𝑦𝑡 = 𝛽0 + 𝛽1 𝑧1 +. . . . +𝑢𝑡
10
Asumsi ketiga ini tidak hanya mensyaratkan bahwa u t dan zt tidak berkorelasi,
tetapi u t juga tidak berkorelasi dengan nilai z masa lalu dan masa depan. Ini memiliki
implikasi di mana z tidak memiliki efek lag pada y. Poin yang lebih halus adalah
bahwa eksogenitas ketat meniadakan kemungkinan bahwa perubahan dalam istilah
kesalahan hari ini dapat menyebabkan perubahan masa depan dalam z. Ini secara
efektif mengesampingkan umpan balik dari y ke nilai z di masa mendatang.
a. Asumsi 1: Homoskedastisitas
Bersyarat pada X, variansi u t sama untuk semua t: Var( 𝑢𝑡|𝑋) = 𝑉𝑎𝑟(𝑢𝑡) =
𝜎 2 , 𝑡 = 1,2, . . . , 𝑛.
Asumsi ini berarti bahwa Var(𝑢𝑡|𝑋) tidak dapat bergantung pada X. Hal tersebut
cukup bahwa u t dan X saling bebas dan bahwa 𝑉𝑎𝑟(𝑢𝑡) konstan sepanjang waktu.
Ketika asumsi ini tidak berlaku, kami mengatakan bahwa kesalahannya
heteroskedastis, seperti dalam kasus cross-sectional. Misalnya, pertimbangkan
persamaan untuk menentukan tarif T-bill tiga bulan (i3 t) berdasarkan tingkat
inflasi (inf t) dan defisit federal sebagai persentase dari produk domestik bruto
(def t):
𝑖31 = 𝛽0 + 𝛽1 𝑖𝑛𝑓𝑡 + 𝛽2 𝑑𝑒𝑓𝑡 + 𝑢𝑡
Antara lain, asumsi ini mensyaratkan bahwa hal-hal yang tidak dapat diamati yang
mempengaruhi suku bunga memiliki varians yang konstan dari waktu ke waktu.
Karena perubahan rezim kebijakan diketahui mempengaruhi variabilitas tingkat
suku bunga, asumsi ini mungkin salah. Selanjutnya, bisa jadi variabilitas suku bunga
tergantung pada tingkat inflasi atau ukuran relatif dari defisit. Hal ini juga akan
melanggar asumsi homoskedastisitas. Ketika Var(𝑢𝑡 |𝑋) tidak bergantung pada X,
seringkali tergantung pada variabel penjelas pada waktu t (x t).
11
a. Normalitas
Kesalahan u t tidak bergantung pada X dan terdistribusi secara independen dan
identik sebagai normal (0, 𝜎 2 ). Asumsi ini indepedensi dan normalitas.
Implikasi dari distribusi sampling normal adalah yang paling penting. Ini
menyiratkan bahwa, ketika semua asumsi berlaku, semua yang telah kita pelajari
tentang estimasi dan inferensi untuk regresi cross-sectional berlaku langsung untuk
regresi deret waktu. Dengan demikian, statistik t dapat digunakan untuk menguji
signifikansi statistik dari variabel penjelas individu, dan statistik F dapat digunakan
untuk menguji signifikansi bersama. OLS memiliki sifat sampel hingga yang
diinginkan yang sama di bawah asumsi 1 hingga asumsi 5 yang dimilikinya. Sama
seperti dalam kasus cross-sectional, prosedur inferensi biasa hanya sebaik asumsi
12
yang mendasarinya. Asumsi model linier klasik untuk data deret waktu jauh lebih
restriktif daripada asumsi untuk data cross-sectional, khususnya, asumsi eksogenitas
yang ketat dan tidak ada korelasi serial dapat menjadi tidak realistis. Namun
demikian, kerangka kerja CLM adalah titik awal yang baik untuk banyak aplikasi.
Data dalam INTDEF berasal dari Laporan Ekonomi Presiden 2004 dan rentang tahun
1948 sampai 2003. Variabel i3 adalah tingkat T-bill tiga bulan, inf adalah tingkat
inflasi tahunan berdasarkan indeks harga konsumen (CPI), dan def adalah defisit
anggaran federal sebagai persentase dari PDB. Persamaan yang diperkirakan adalah
Perkiraan ini menunjukkan bahwa peningkatan inflasi atau ukuran relatif dari
defisit meningkatkan suku bunga jangka pendek, yang keduanya diharapkan dari
ekonomi dasar. Misalnya, ceteris paribus kenaikan satu poin persentase dalam tingkat
inflasi meningkatkan i3 sebesar 0,606 poin. Baik inf dan def sangat signifikan secara
statistik, dengan asumsi, tentu saja, asumsi CLM berlaku.
3.1 Kesimpulan
Dalam bab ini, kita telah membahas analisis regresi dasar dengan data time
series. Di bawah asumsi yang paralel dengan analisis cross-sectional, OLS tidak bias
(di bawah TS.1 hingga TS.3), OLS adalah BIRU (di bawah TS.1 hingga TS.5), dan
kesalahan standar OLS biasa, statistik t, dan Statistik F dapat digunakan untuk inferensi
statistik (di bawah TS.1 sampai TS.6). Karena korelasi temporal di sebagian besar data
deret waktu, kita harus secara eksplisit membuat asumsi tentang bagaimana kesalahan
terkait dengan variabel penjelas di semua periode waktu dan tentang korelasi temporal
dalam kesalahan itu sendiri. Asumsi model linier klasik bisa sangat membatasi untuk
aplikasi deret waktu, tetapi itu adalah titik awal yang alami. Kami telah menerapkannya
pada regresi statis dan model lag terdistribusi terbatas.
3.2 Saran
14
DAFTAR PUSTAKA
15