Cakupan Proses Analisis Data Menyiapkan data siap olah Analisis statistik deskriptif Uji kualitas data : uji normalitas data, uji asumsi klasik regresi OLS Uji hipotesis Menyiapkan data Mengecek data mengecek data (secara kasat mata) yang akan diolah apakah ada data yang keliru (aneh), data yang tidak konsisten, data yang nilainya cukup ekstrim Menyusundata dalam software statistik sesuai kebutuhan Mengecek data dengan bantuan software statistik, misal dengan scatterplot, boxplot Mentransformasi data, misal mengalikan satu variabel dengan variabel lain (model interaksi) Mencari gambaran data penelitian / Analisis Statistik deskriptif Analisis statistik deskriptif diperlukan untuk mendapatkan gambaran mengenai karakteristik data penelitian bisa dijadikan justifikasi dalam pembahasan hipotesis Analisis statistik deskriptif dapat dilihat dari: frekuensi, central tendency, dispersi, korelasi, dan gambaran visual variabel (grafik, chart) Statistik deskriptif: frekuensi Frekuensiadalah jumlah dari tiap kategori dinyatakan dalam presentase Peneliti mungkin mengklasifikasi data ke dalam berbagai kategori untuk memotret data penelitian (profil sampel), misal berdasar gender, umur, ukuran perusahaan, kualitas auditor, laba vs rugi Statistik deskriptif: central tendency
Ukuran central tendency:
Mean (aritmetik dan geometrik): rata-rata (untuk skala interval dan rasio) Median: nilai tengah dari data setelah diurutkan bisa diinterpretasi bila nilai mean di atas median, maka nilai dari variabel tersebut cukup tinggi Mode (modus): kejadian/munculan terbanyak dalam grup biasanya data berskala nominal Statistik deskriptif: dispersi, korelasi Nilai minimum dan maksimum, range Standar deviasi: menunjukkan sebaran distribusi atau variabilitas data (data interval, dan rasio) Korelasi menunjukkan hubungan dua variabel (korelasi rank Spearman atau Kendall untuk data nominal/ordinal, dan matrik korelasi pearson untuk data interval/rasio, Chi square untuk korelasi data nominal) arah dan magnitude (antara -1 smp +1) Penyajian dan pembahasan statistik deskriptif Agar bermanfaat pembahasan statistik deskriptif tidak hanya mengulang atau menyatakan angka-angka dalam tabel ke dalam paragraf. Ukuran sentral tendensi dan dispersi variabel penelitian dapat dinyatakan dalam sampel penuh atau sampel dibagi dalam berbagai kategori sesuai kebutuhan peneliti. Misal rata-rata manajemen laba (variabel) untuk sampel perusahaan yg rugi dan laba, atau sampel perusahaan besar kecil, atau berdasar industri. Statistik deskriptif variabel penelitian juga dapat disajikan dalam bentuk grafik. Uji Kualitas Data Uji reliabilitas dan validitas untuk variabel laten (data primer: survey kuesioner) Uji normalitas data untuk analisis yang memerlukan asumsi distribusi normal (uji parametrik) Uji asumsi klasik regresi OLS: Uji normalitas residual Uji multikolineritas Uji heteroskedastisitas Uji autokorelasi Uji Normalitas data peneliti perlu menguji terlebih dahulu apakah data berdistribusi normal jika akan menggunakan uji parametrik. Jika data tidak berdistribusi normal, maka dapat digunakan uji non parametrik Uji normalitas data dilakukan dengan uji scatterplot atau uji one sample kolmogorov smirnov (KS) test. Jika prob KS signifikan (<0.05), data tidak berdistribusi normal. Cek normalitas data untuk setiap variabel, bila ada outlier dapat dibuang (jika outlier sedikit, data cukup banyak), atau winzorising (jika outlier cukup banyak, data sedikit) Uji asumsi normalitas residual Uji normalitas residual dilakukan jika menggunakan analisis regresi OLS. Asumsi regresi OLS menyatakan bahwa residual mengikuti distribusi normal Uji normalitas residual (save unstandardized residual) dapat dilakukan dengan uji grafik, Uji KS, uji Jarque-Bera. Jika residual tidak berdistribusi normal, lakukan casewise diagnostic untuk mendeteksi observasi yang tidak normal. Dalam kasus sampel cukup besar, di atas 100 observasi, asumsi normalitas dapat diabaikan. Asumsi Multikolinieritas Asumsi regresi OLS menyatakan bahwa model regresi seharusnya tidak terjadi multikolinieritas. Multikolinieritas adalah korelasi yang kuat/sempurna antar variabel independen (hanya untuk regresi linier berganda) Adanya multikolineritas menyebabkan koefisien variabel independen menjadi cenderung tidak signifikan Deteksi Multikolinieritas: (1) R2 tinggi, namun tidak ada variabel independen yang signifikan, (2) korelasi antar variabel independen lebil dari 0,8, (3) Tolerance value dan Variance Inflation factor (VIF) tidak terjadi multikolinieritas jika TV > 0.1 atau VIF < 10 Asumsi Multikolinieritas Cara mengatasi multikolinieritas: Mengeluarkan variabel independen yang memiliki korelasi sangat tinggi Transformasi data menggunakan log atau lag data Gunakan data centered untuk analisis. Data centered adalah data mentah dikurangi nilai rata-rata (mean-nya) Uji Heteroskedastisitas Asumsi ini menyatakan bahwa nilai residual model regresi memiliki varian (variance) yang sama (homoskedastisitas). Umumnya terjadi pada data cross-sectional Dilanggarnya asumsi homoskedastisitas akan membuat koefisien regresi tidak efisien sehingga tidak bisa digunakan sebagai dasar pengujian hipotesis Deteksi heteroskedastisitas dengan uji statistik: Uji Glejser, uji White, uji Breusch-Pagan-Godfrey (BPG test), dll Jika terjadi heteroskedastisitas, maka perlu dilakukan koreksi terhadap standard error agar memperoleh estimasi parameter yang benar, misal koreksi HAC dengan software eviews Uji Autokorelasi Model regresi yang yang baik mengasumsikan tidak terjadi autokorelasi. Autokorelasi menunjukkan adanya korelasi residual dari satu pengamatan (perioda t) dengan pengamatan lainnya (perioda t-1). Biasanya terjadi pada data time series. Deteksi Autokorelasi adalah dengan (1) uji durbin watson (uji DW), jika nilai DW terletak antara du dan 4-du, maka tidak terdapat autokorelasi, (2) uji Langrange Multiplier (LM test) atau uji Breusch-Godfrey (BG test) jika prob chi square < 0,05 terjadi autokorelasi Koreksi autokorelasi dapat dilakukan dengan koreksi standard error (Newey test) dengan software eviews Pengujian Hipotesis Pengujian hipotesis adalah menggunakan statistik inferensial untuk menarik kesimpulan mengenai populasi berdasarkan data dari sample Penelitian akan berusaha menolak H0 dengan tingkat keyakinan tertentu ada risiko bahwa kesimpulan mengenai populasi yang diturunkan dari sampel adalah keliru (salah) Ada dua tipe kesalahan berkaitan dengan penarikan kesimpulan: Type I error (alpha = α, level of significance) probabilitas menolak H0 (simpulkan H1) padahal sebenarnya H0. Type II error (beta = β) probabilitas gagal menolak H0 (simpulkan H0) padahal sebenarnya H1. Riset bisnis fokus pada type 1 error. Statistical power adalah probabilitas menolak H0 dengan benar tergantung alpha, efek size (perbedaan dalam populasi), dan jumlah sample Memilih metoda analisis statistik Testing hypothesis on single mean One sample t test (metric), Chi-square (non metric) Testing hypothesis about two related mean Independent samples independent sample t-test (metric), Chi square or Mann-Whitney U-test (non metric) Related samples paired sample t-test (metric), Chi square or Wilcoxon signed- rank test (non metric), McNemar’s test (non metric- nominal) Testing hypothesis about several mean: one way ANOVA (metric), Chi square (non metric) Multivariate One metric dependent variable : two way anova, multiple regression, conjoint One non metric dependent variable: discriminant analysis, logistic regression More than one metric dependent variable: multivariate anova (Manova), canonical correlation