Anda di halaman 1dari 17

Analisis data

Sekaran & Bougie Ch 14, 15


Cakupan Proses Analisis Data
 Menyiapkan data siap olah
 Analisis statistik deskriptif
 Uji kualitas data : uji normalitas data, uji asumsi
klasik regresi OLS
 Uji hipotesis
Menyiapkan data
 Mengecek data  mengecek data (secara kasat
mata) yang akan diolah apakah ada data yang
keliru (aneh), data yang tidak konsisten, data yang
nilainya cukup ekstrim
 Menyusundata dalam software statistik sesuai
kebutuhan
 Mengecek data dengan bantuan software statistik,
misal dengan scatterplot, boxplot
 Mentransformasi data, misal mengalikan satu
variabel dengan variabel lain (model interaksi)
Mencari gambaran data penelitian /
Analisis Statistik deskriptif
 Analisis
statistik deskriptif diperlukan untuk
mendapatkan gambaran mengenai karakteristik
data penelitian  bisa dijadikan justifikasi dalam
pembahasan hipotesis
 Analisis
statistik deskriptif dapat dilihat dari:
frekuensi, central tendency, dispersi, korelasi,
dan gambaran visual variabel (grafik, chart)
Statistik deskriptif: frekuensi
 Frekuensiadalah jumlah dari tiap kategori
dinyatakan dalam presentase
 Peneliti mungkin mengklasifikasi data ke dalam
berbagai kategori untuk memotret data penelitian
(profil sampel), misal berdasar gender, umur,
ukuran perusahaan, kualitas auditor, laba vs rugi
Statistik deskriptif: central tendency

 Ukuran central tendency:


 Mean (aritmetik dan geometrik): rata-rata (untuk
skala interval dan rasio)
 Median: nilai tengah dari data setelah diurutkan 
bisa diinterpretasi bila nilai mean di atas median,
maka nilai dari variabel tersebut cukup tinggi
 Mode (modus): kejadian/munculan terbanyak
dalam grup  biasanya data berskala nominal
Statistik deskriptif: dispersi, korelasi
 Nilai minimum dan maksimum, range
 Standar deviasi: menunjukkan sebaran distribusi
atau variabilitas data (data interval, dan rasio)
 Korelasi menunjukkan hubungan dua variabel
(korelasi rank Spearman atau Kendall untuk data
nominal/ordinal, dan matrik korelasi pearson untuk data
interval/rasio, Chi square untuk korelasi data nominal) 
arah dan magnitude (antara -1 smp +1)
Penyajian dan pembahasan statistik deskriptif
 Agar bermanfaat pembahasan statistik deskriptif tidak
hanya mengulang atau menyatakan angka-angka dalam
tabel ke dalam paragraf.
 Ukuran sentral tendensi dan dispersi variabel penelitian
dapat dinyatakan dalam sampel penuh atau sampel dibagi
dalam berbagai kategori sesuai kebutuhan peneliti. Misal
rata-rata manajemen laba (variabel) untuk sampel
perusahaan yg rugi dan laba, atau sampel perusahaan
besar kecil, atau berdasar industri.
 Statistik deskriptif variabel penelitian juga dapat disajikan
dalam bentuk grafik.
Uji Kualitas Data
 Uji reliabilitas dan validitas  untuk variabel laten (data
primer: survey kuesioner)
 Uji normalitas data  untuk analisis yang memerlukan
asumsi distribusi normal (uji parametrik)
 Uji asumsi klasik regresi OLS:
 Uji normalitas residual
 Uji multikolineritas
 Uji heteroskedastisitas
 Uji autokorelasi
Uji Normalitas data
 peneliti perlu menguji terlebih dahulu apakah data
berdistribusi normal jika akan menggunakan uji
parametrik. Jika data tidak berdistribusi normal, maka
dapat digunakan uji non parametrik
 Uji normalitas data dilakukan dengan uji scatterplot atau
uji one sample kolmogorov smirnov (KS) test. Jika prob KS
signifikan (<0.05), data tidak berdistribusi normal.
 Cek normalitas data untuk setiap variabel, bila ada outlier
dapat dibuang (jika outlier sedikit, data cukup banyak),
atau winzorising (jika outlier cukup banyak, data sedikit)
Uji asumsi normalitas residual
 Uji normalitas residual dilakukan jika menggunakan
analisis regresi OLS. Asumsi regresi OLS menyatakan
bahwa residual mengikuti distribusi normal
 Uji normalitas residual (save unstandardized residual)
dapat dilakukan dengan uji grafik, Uji KS, uji Jarque-Bera.
 Jika residual tidak berdistribusi normal, lakukan casewise
diagnostic untuk mendeteksi observasi yang tidak normal.
 Dalam kasus sampel cukup besar, di atas 100 observasi,
asumsi normalitas dapat diabaikan.
Asumsi Multikolinieritas
 Asumsi regresi OLS menyatakan bahwa model regresi
seharusnya tidak terjadi multikolinieritas. Multikolinieritas
adalah korelasi yang kuat/sempurna antar variabel
independen (hanya untuk regresi linier berganda)
 Adanya multikolineritas menyebabkan koefisien variabel
independen menjadi cenderung tidak signifikan
 Deteksi Multikolinieritas: (1) R2 tinggi, namun tidak ada
variabel independen yang signifikan, (2) korelasi antar
variabel independen lebil dari 0,8, (3) Tolerance value
dan Variance Inflation factor (VIF)  tidak terjadi
multikolinieritas jika TV > 0.1 atau VIF < 10
Asumsi Multikolinieritas
 Cara mengatasi multikolinieritas:
 Mengeluarkan variabel independen yang memiliki korelasi
sangat tinggi
 Transformasi data menggunakan log atau lag data
 Gunakan data centered untuk analisis. Data centered adalah
data mentah dikurangi nilai rata-rata (mean-nya)
Uji Heteroskedastisitas
 Asumsi ini menyatakan bahwa nilai residual model regresi memiliki
varian (variance) yang sama (homoskedastisitas). Umumnya terjadi
pada data cross-sectional
 Dilanggarnya asumsi homoskedastisitas akan membuat koefisien regresi
tidak efisien sehingga tidak bisa digunakan sebagai dasar pengujian
hipotesis
 Deteksi heteroskedastisitas dengan uji statistik: Uji Glejser, uji White,
uji Breusch-Pagan-Godfrey (BPG test), dll
 Jika terjadi heteroskedastisitas, maka perlu dilakukan koreksi terhadap
standard error agar memperoleh estimasi parameter yang benar, misal
koreksi HAC dengan software eviews
Uji Autokorelasi
 Model regresi yang yang baik mengasumsikan tidak terjadi
autokorelasi. Autokorelasi menunjukkan adanya korelasi
residual dari satu pengamatan (perioda t) dengan pengamatan
lainnya (perioda t-1). Biasanya terjadi pada data time series.
 Deteksi Autokorelasi adalah dengan (1) uji durbin watson (uji
DW), jika nilai DW terletak antara du dan 4-du, maka tidak
terdapat autokorelasi, (2) uji Langrange Multiplier (LM test)
atau uji Breusch-Godfrey (BG test)  jika prob chi square <
0,05 terjadi autokorelasi
 Koreksi autokorelasi dapat dilakukan dengan koreksi standard
error (Newey test) dengan software eviews
Pengujian Hipotesis
 Pengujian hipotesis adalah menggunakan statistik inferensial untuk
menarik kesimpulan mengenai populasi berdasarkan data dari sample
 Penelitian akan berusaha menolak H0 dengan tingkat keyakinan
tertentu  ada risiko bahwa kesimpulan mengenai populasi yang
diturunkan dari sampel adalah keliru (salah)
 Ada dua tipe kesalahan berkaitan dengan penarikan kesimpulan: Type
I error (alpha = α, level of significance)  probabilitas menolak H0
(simpulkan H1) padahal sebenarnya H0. Type II error (beta = β) 
probabilitas gagal menolak H0 (simpulkan H0) padahal sebenarnya
H1. Riset bisnis fokus pada type 1 error.
 Statistical power adalah probabilitas menolak H0 dengan benar 
tergantung alpha, efek size (perbedaan dalam populasi), dan jumlah
sample
Memilih metoda analisis statistik
 Testing hypothesis on single mean  One sample t test (metric), Chi-square
(non metric)
 Testing hypothesis about two related mean
 Independent samples  independent sample t-test (metric), Chi square or
Mann-Whitney U-test (non metric)
 Related samples  paired sample t-test (metric), Chi square or Wilcoxon signed-
rank test (non metric), McNemar’s test (non metric- nominal)
 Testing hypothesis about several mean: one way ANOVA (metric), Chi
square (non metric)
 Multivariate
 One metric dependent variable : two way anova, multiple regression, conjoint
 One non metric dependent variable: discriminant analysis, logistic regression
 More than one metric dependent variable: multivariate anova (Manova),
canonical correlation

Anda mungkin juga menyukai