Anda di halaman 1dari 17

X.

ANALISIS DATA
Oleh Bambang Juanda
Pendahuluan: Analisis Data
Analisis data: peroses mencakup penelusuran & pengungkapan informasi
relevan dlm data; penyajian hasilnya ringkas sederhana; dan akhirnya mengarah
kepada perlunya penjelasan & penafsiran.
Proses awal tanpa terikat pd asumsi yg ketat supaya pengungkapan informasi
fleksibel & mendorong imajinasi tanpa melupakan kaidah ilmu maupun teori
yg telah dikenal.
Peneliti cenderung mengartikan sbg proses perhitungan penerapan statistika,
shg peranan & kegunaan sebenarnya terlupakan. Ini akan memberi kesan
bahwa pengujian hipotesis itu sederhana & mudah. Oleh karenanya seringkali
penelitian yg menarik, hanya diakhiri dgn kesimpulan yg menyatakan hasilnya
nyata atau tidak nyata secara statistik.
Perlu analisis deskriptif (grafik spt plot data berkala, diagram kotak-garis,
atau diagram dahan daun; tabel rekapitulasi data ). Analisis deskriptif yg
bersifat eksploratif utk menelusuri & mengungkapkan struktur dan pola data
tanpa mengaitkan secara kaku dgn asumsi tertentu.
Grafik sbg ringkasan data atau sbg alat diagnosa kesesuaian model dugaan &
merupakan pelengkap dlm teknik statistika.
Tujuan eksplorasi data spt ini: memberi keyakinan bhw data tsb dpt diwakili
oleh model; mengungkapkan adanya penyimpangan dari model tertentu dan
berusaha utk mencari cara penyelesaiannya.
Tahapan
Pemodelan
Ekonometrika
Model Regresi Berganda
i pi p i i i
X X X Y
2 2 1 1 0
Hubungan linear (dlm parameter) antara 1 peubah tak
bebas & 2 atau lebih peubah bebas
Intersep-Y
Populasi
Slope Populasi
Peubah tak bebas
(Respons) utk sampel
Peubah bebas (Explanatory)
utk model sampel
Random
Error
i pi p i i i
e X b X b X b b Y

+ + - - - + + + =
2 2 1 1 0
The regression equation is
Demand = 850 - 5.03 P + 4.74 Pr + 0.277 Advertise + 0.0107 Income + 1.31 T

Predictor Coef SE Coef T P
Constant 850.0 134.8 6.31 0.000
P -5.0326 0.4394 -11.45 0.000
Pr 4.7435 0.9696 4.89 0.000
Advertise 0.2774 0.1046 2.65 0.014
Income 0.010658 0.001316 8.10 0.000
T 1.3091 0.7534 1.74 0.095

S = 33.6398 R-Sq = 91.5% R-Sq(adj) = 89.7%

Analysis of Variance

Source DF SS MS F P
Regression 5 291364 58273 51.49 0.000
Residual Error 24 27159 1132
Total 29 318523
Contoh Output Minitab
F
(5,24)

0
o = 0.05
I. Uji Model Secara Keseluruhan
Apakah Model dapat menjelaskan keragaman Y
Hipotesis Statistik:
H
0
: Model tdk dpt menjelaskan keragaman Y
o
2
regresi
= o
2

atau o
2
regresi
/ o
2

= 1
|
1
= |
2
= = |
p
= 0 (tidak dapat menjelaskan)
H
1
: Model tdk dpt menjelaskan keragaman Y
o
2
regresi
> o
2

atau o
2
regresi
/ o
2

> 1
Minimal ada |
i
= 0 (ada peubah
bebas yg mempengaruhi Y)
Statistik uji-F = KTR/KTS ~ F
(p, n-1-p)
Y
i
= |
0
+ |
1
X
1
+ |
2
X1 ++ |
p
X
p
+
i

H
0

H
1

Kriteria Pengambilan Keputusan :
1. Terima H
0
, jika F
hitung
< F
table
, artinya secara statistik belum dapat
dibuktikan bahwa model tersebut bisa menjelaskan atau memprediksi
keragaman permintaan detergen; artinya semua variabel bebas tidak
berpengaruh terhadap nilai variabel tak bebas (Y).
2. Terima H
1
(tolak H0), jika F
hitung
> F
table
, artinya secara statistik telah
dibuktikan bahwa model tersebut dapat menjelaskan atau
memprediksi keragaman permintaan detergen; artinya harga produk,
harga produk pesaing, iklan, pendapatan dan trend secara bersama-
sama berpengaruh terhadap permintaan detergen.

Kriteria keputusan dpt menggunakan angka probabilitas (P_value atau
sign.) yg diperoleh dari perhitungan komputer kemudian
diperbandingkan dgn taraf nyata pengujian yang digunakan (o=5%).
1. Jika p_value < (o=5%), maka tolak H
0
atau terima H
1
.
2. Jika p_value > (o=5%), maka terima H
0
atau tolak H
1
.

P_value atau significance yang dikeluarkan oleh software Minitab atau
SPSS ini dapat diinterpretasikan sebagai peluang (risiko) kesalahan
dalam menyimpulkan H1.
II. Uji Signifikansi Masing
2
Peubah Bebas
Apakah peubah bebas X
i
mempengaruhi Y
Hypotesis Statistik:
H
0
: |
i
= 0 (X
i
tidak mempengaruhi Y)
H
1
: |
i
= 0 (X
i
mempengaruhi Y)
The regression equation is
Demand = 850 - 5.03 P + 4.74 Pr + 0.277 Advertise + 0.0107 Income + 1.31 T

Predictor Coef SE Coef T P
Constant 850.0 134.8 6.31 0.000
P -5.0326 0.4394 -11.45 0.000
Pr 4.7435 0.9696 4.89 0.000
Advertise 0.2774 0.1046 2.65 0.014
Income 0.010658 0.001316 8.10 0.000
T 1.3091 0.7534 1.74 0.095

Tahapan Uji Hipotesis dgn Uji-t
1. Perumusan Hipotesis Statistik:
Ho : o
i
= 0 (faktpr ke-i tidak berpengaruh terhadap
permintaan detergen)
H1 : o
i
= 0 (faktor ke-i berpengaruh nyata terhadap permintaan
detergen)
2. Penentuan nilai kritis, misal dgn taraf nyata o=5%. Karena
pengujian dua sisi (two-tailed test) maka pada penentuan t
table

menggunakan o/2. Untuk table t, derajat bebas (degree of
freedom) adalah n-p-1. p menyatakan banyaknya peubah bebas
dan n adalah banyaknya kasus.
3. Pengambilan Keputusan (Decision Rule) :
Terima H
0
, jika |t
hitung
| < t
table
, artinya secara statistik belum
dpt dibuktikan bahwa faktor ke-i tersebut perpengaruh nyata
terhadap permintaan detergen.
Terima H
1
(tolak H
0
), jika |t
hitung
| > t
table
, artinya secara statistik
telah dibuktikan bahwa faktor ke-i tersebut berpengaruh nyata
terhadap permintaan detergen.
Model Regresi Linier Bersegmen
(Pricewise linear Regression Model )
Model ini merupakan kasus khusus dari suatu
gugus model yg lebih besar (spline functions).
Spline functions adalah fungsi-fungsi dgn segmen-
segmen yg berbeda, yg digambarkan oleh fungsi
yg tidak harus garis lurus.
Model regresi linear bersegmen ini berkembang
dari model yg melibatkan peubah dummy utk
mengetahui dimana terjadi structural break.
Model dengan Pilihan Kualitatif (Models
of qualitative choice)
Sering digunakan dlm analisis data survei, yg
sering dihadapkan pada respon prilaku yg
kualitatif, misalnya masuk angkatan kerja atau
tidak, setuju atau tidak dengan pemerintahan
sekarang, dll.
Contoh dari model ini misalnya model peluang
linier, model probit, model logit, dan model
tersensor.
Model Regresi Diri dan Distribusi Beda
Waktu (Autoregressive & distributed lag models)

Dlm model yg melibatkan data deret waktu, seringkali respons peubah
tak bebas (Y) akan terdeteksi setelah beberapa waktu cukup lama. Oleh
karenanya peubah bebas beda waktu (lagged explanatory variables, X
t-k
)
harus dimasukkan dlm model. Misalnya pengaruh kredit usaha tani atau
pupuk terhadap produksi padi, atau pengaruh supply uang terhadap
inflasi memerlukan waktu beberapa bulan.
Dlm model dimana koefisien atau pembobot X
t-k
nya menurun secara
geometris (geometric lag model), dpt digunakan pendekatan atau
transformasi Koyck shg mempermudah pendugaan parameter
koefisien modelnya. Dari pendekatan ini dikembangkan model-model
seperti Adaptive Expectations Model.
Ilustrasi: sering kali dalam model linear sederhana, besarnya konsumsi
rumah tangga (Y) dipengaruhi oleh permanent income (X*), atau jumlah
yang ditawarkan (Y) dipengaruhi oleh harga yang diharapkan (X*)
bukan harga sebenarnya. Dalam realitas seringkali pelaku ekonomi
merubah ekspektasinya, dgn menyesuaikan pengamatan sekarang
dengan nilai harapan periode sebelumnya.
Model Persamaan Simultan
Metode OLS akan menghasilkan penduga yg bersifat BLUE jika
asumsi-asumsinya dipenuhi. Salah satu asumsinya adalah tidak
ada korelasi antara peubah penjelas (X) dengan error (c). Jika ada
karelasi antara keduanya maka metode OLS akan menghasilkan
penduga parameter koefisien regresi yg berbias dan tidak
konsisten.
Korelasi antara X dan c seringkali diakibatkan karena peubah
penjelas (X), yg seharusnya peubah nonstokastik (fixed variable),
dlm kenyataannya dipengaruhi oleh faktor (peubah) lain.
Sehingga sebenarnya model yg lebih cocok adalah terdiri dari
beberapa persamaan yg saling berkaitan (model persamaan
simultan). Dalam kasus seperti ini ada beberapa metode yang
'lebih baik' untuk digunakan misalnya metode intrumental, ILS,
2SLS, 3SLS, FIML
Model Deret Waktu Ekonometrik
Beberapa model deret waktu tanpa menggunakan pendekatan model
ekonometrik adalah ARMA (untuk data stasioner), ARIMA (untuk
data nonstasioner yg dpt distasionerkan dgn teknik pembedaan).
Model ARCH dan GARCH: pengembangan metode Box-Jenkins
(model ARMA) utk mengatasi ragam yg heterogen. Ragam peubah
respons dimodelkan sebagai fungsi nilai-nilai pd periode yg sdh lewat
dari peubah respons tsb dan peubah bebas atau eksogen.
Model fungsi transfer: model peramalan deret waktu berganda yg
menggabungkan beberapa karakteristik model-model ARIMA
univariat dgn beberapa karakteristik analisis regresi. Dasar pemikiran
kombinasi metode ini, adalah utk menangkap adanya hubungan
terstruktur di luar model ekonometrik dgn menggunakan model deret
waktu utk menjelaskan hubungan tesebut dlm sisaan model
ekonometrik. Model fungsi transfer merupakan teknik peramalan yg
lebih baik dibanding persamaan ekonometrik saja atau model deret
berkala saja karena mengandung penjelasan struktural (ekonometrik)
sebagai bagian keragaman y
t
, utk menjelaskan hubungan terstruktur,
dan penjelasan deret berkala thd sebagian keragaman y
t
yg tdk
diterangkan secara struktural. Model ini cukup efektif jika tdk ada
feedback.
Model Deret Waktu Ekonometrik
Dlm realitas semua peubah ekonomi merupakan peubah
endogen shg disarankan menggunakan model VAR (vector
AutoRegression). Umumnya model VAR digunakan untuk
peramalan sistem peubah-peubah deret waktu yg saling
berpengaruh, dan utk menganalisis dampak dinamis dari
penyimpangan acak thd semua peubah. Model VAR
memperlakukan setiap peubah (endogen) dlm sistem sebagai
fungsi peubah lag dari semua peubah dlm sistem.
Vector Error Correction Model (VECM) merupakan
model VAR yg terrestriksi yg dirancang utk menggunakan
data deret waktu nonstasioner yg terkointegrasi. VECM
merupakan regresi terkointegrasi atau mengalami
keseimbangan dlm jangka panjang. Istilah terkointegrasi
dikenal sebagai istilah koreksi error karena deviasi dari
keseimbangan jangka panjang dikoreksi secara bertahap
melalui serangkaian dinamika penyesuaian dlm jangka
pendek secara parsial.
Model Regresi Panel Data
Istilah lain dari data panel adalah pooled data (penggabungan data time
series dan cross section), micro panel data (kombinasi studi atas dasar
waktu dari berbagai variabel atau kelompok subjek), event history
analysis (studi perubahan suatu subjek dengan syarat waktu), atau
cohort analysis (studi jalur perkembangan karir dari sekelompok
manajer).

Keuntungan menggunakan data panel dlm model regresi dibandingkan
hanya dgn data time series atau hanya data cross section, yaitu:
1. Data panel akan memberikan informasi yg lebih lengkap, lebih
beragam, kurang berkorelasi antar variabel, derajat bebas lebih besar
dan lebih efisien.
2. Studi data panel lebih memuaskan untuk menentukan perubahan
dinamis dibandingkan dgn studi berulang dari cross section.
3. Membantu studi utk menganalisis perilaku yang lebih kompleks,
misalnya fenomena skala ekonomi dan perubahan teknologi.
4. Dapat meminimumkan bias yg dihasilkan oleh agregasi individu atau
perusahaan karena unit data lebih banyak.
Model Input-Output
digunakan utk meneliti tingkat saling keterkaitan diantara berbagai
sektor dlm suatu perekonomian guna memperoleh gambaran
mengenai kontribusi suatu sektor ekonomi terhadap perekonomian
secara keseluruhan dlm memenuhi berbagai tujuan pertumbuhan
ekonomi.
Leontief (1951) mempelopori analisis input-output dgn formulasi tabel
input-output.

4 pendekatan dpt digunakan dlm mengidentifikasi sektor-sektor kunci
(key sectors) dlm suatu perekonomian dgn menggunakan tabel IO:
1. Sektor yg mempunyai kaitan ke belakang (backward linkage) dan kaitan
ke depan (forward linkage) yg relatif tinggi.
2. Sektor yg menghasilkan output bruto yg relatif tinggi shg mampu
mempertahankan final demand yg relatif tinggi juga.
3. Sektor yg mampu menghasilkan penerimaan bersih devisa yg relatif
tinggi.
4. Sektor yg mampu menciptakan lapangan kerja yg relatif tinggi

Anda mungkin juga menyukai