Langkah pertama sebelum menganalisis model penelitian adalah memeriksa data untuk
memastikan tidak ada kesalahan, outlier, atau kesalahan responden. Selain itu, perlu pula
menilai apakah ada data yang hilang pada kumpulan data.
Pemeriksaan data (data screening) adalah langkah awal yang memakan waktu tetapi perlu,
dalam setiap analisis dan fatalnya sering diabaikan oleh para peneliti. Pada langkah ini, penulis
mengevaluasi dampak dari data yang hilang (missing value), mengidentifikasi outlier, dan
menguji asumsi yang paling mendasari teknik multivariat (dalam hal ini uji asumsi klasik
berupa uji normalitas, uji multikolinearitas). Tujuan dari data screening ini adalah untuk untuk
menggambarkan data aktual, karena efek dari data yang hilang, outlier, dan kesalahan lain
pada data ini bersifat tersembunyi dan seringkali terabaikan. Misalnya, bias yang dihasilkan
oleh data hilang tidak akan pernah diketahui kecuali secara eksplisit diidentifikasi dan
diperbaiki.
MISSING VALUE
Kenapa terjadi missing value?
Missing value atau adanya data yang hilang atau tidak tersedia dalam file data bisa terjadi
karena kesalahan responden dalam mengisi kuesioner. Responden melewatkan pertanyaan
untuk dijawab. Selain itu missing value ini bisa terjadi juga karena kesalahan surveyor dalam
mengisikan data sesuai arahan responden atau kesalahan terjadi pada peneliti dalam
tabulasi/input data.
Gambar 3.1
Kenapa tidak boleh ada data yang hilang?
Jika ada data yang tidak lengkap, maka ini akan memengaruhi nilai/bobot pada skor variabel
secara agregat. Selain itu, jika data ada yang kosong maka pada beberapa alat analisis seperti
Amos tidak bisa dijalankan. Selain itu, data yang kosong juga akan meningkatkan
kecenderungan kesalahan pada hasil analysis nantinya, serta beberapa alasan penting lainnya.
Oleh karena itu, penting bagi para peneliti untuk menyelesaikan kasus ini.
Menghapus responden
1. Pastikan pada file data sudah ada kolom ID yang berisi kode identitas responden.
2. Pada kolom paling ujung kanan, tambahkan satu kolom untuk menampilkan total
missing value pada setiap responden, namai kolom tersebut sesuai pemahaman Anda.
3. Pada kolom paling kanan tersebut, ketikkan rumus “COUNTBLANK(Rentang sel yang
diamati)” misal =COUNTBLANK(B2:X2)
4. Maka akan muncul jumlah missing value pada setiap (baris) responden seperti gambar
3.2 berikut:
Outlier adalah data observasi yang muncul dengan nilai-nilai ekstrim, baik secara univariat
ataupun multivariat. Yang dimaksud dengan nilai-nilai ekstrim dalam observasi adalah nilai
yang jauh atau beda sama sekali dengan sebagian besar nilai lain dalam kelompoknya.
Misalkan nilai ujian siswa dalam satu kelas yang berjumlah 30 siswa, sebanyak 29 siswa
mendapatkan nilai ujian dalam kisaran 70 sampai 80. Kemudian ada 1 siswa yang nilainya
sangat melenceng dari lainnya, yaitu mendapatkan nilai 30. Nah, tentunya 1 siswa tersebut
memiliki nilai ekstrem sehingga disebut sebagai outlier.
Jika digambarkan dalam bentuk grafik, berikut kira-kira pola grafik yang menggambarkan
outlier:
Gambar 3.3
Data outlier dalam penelitian harus mendapatkan perlakuan khusus, karena dapat
menyebabkan terjadinya masalah serius pada penelitian, salah satunya bias pada hasil
penelitian. Selain itu, kebanyakan metode analisis parametrik memerlukan asumsi distribusi data
yang valid, dan keberadaan outlier sering mengakibatkan kekeliruan asumsi tersebut. Outlier juga
meningkatkan variasi data dan dengan demikian mengurangi kekuatan uji statistik, yang tidak kita
inginkan. Outlier bisa jadi merupakan pengamatan yang salah, misalnya kesalahan yang terjadi
selama input data. Oleh karena itu, untuk mencapai data analysis yang bermakna dan tidak bias,
ia harus kita deteksi dan tangani secara tepat.
Namun disamping itu, semuanya masih tergantung pada tujuan penelitian, apabila nilai-nilai
ekstrim yang dimaksud memang diupayakan untuk dinilai keberadaannya atau dinilai
fenomenanya, maka outlier tersebut dibiarkan saja. Outlier sisi lain, dapat membuat pengamatan
menjadi menarik, seperti saat hasil ujian sangat jauh berbeda dengan rata-rata perolehan nilai siswa
lainnya hal ini mungkin menyimpan informasi menarik yang belum terungkap sebelumnya, dan ini
dapat menjadi fokus penelitian. Metode analisis kemudian juga bisa diganti menjadi analisis non-
parametrik jika keputusan ini diambil. Namun apabila tujuan penelitian adalah untuk
generalisasi, apalagi untuk menentukan sebuah model prediksi seperti dalam regresi linear,
maka data tersebut harus mendapatkan perlakuan khusus. Apakah perlakuan tersebut? Salah
satu yang bisa dilakukan adalah transformasi data jika nilai ekstrim masih bisa dikurangi
jaraknya dengan kelompok yang lainnya. Jika terlalu jauh, maka outlier bisa dikeluarkan dari
penelitian.
Cara mendeteksi outlier dengan SPSS salah satunya adalah dengan menggunakan Z-Score. Z-
score dapat digunakan untuk membantu menentukan apakah sebuah data bernilai ekstrem,
atau outlier. Aturan Z-score adalah nilai kurang dari –3 atau lebih dari +3 menunjukkan bahwa
nilai data adalah nilai ekstrem. Jadi Z-Score yang memiliki nilai <-3 atau >3 merupakan outlier.
Selain mengidentifikasi outlier dengan menggunakan nilai Z-Score, cara lain untuk
mengidentifikas outlier adalah dengan menggunakan probabilitas Mahalanobis di SPSS. Setelah
data outlier diketahui, outlier tersebut data dikeluarkan dari penelitian.
1. Uji Normalitas
Setelah memastikan tidak ada missing value, setelah semua outlier diidentifikasi dan
dikeluarkan atau data telah ditransformasi, maka selanjutnya untuk memastikan data layak
untuk dilakukan analisis lebih lanjut, penulis sebaiknya memastikan apakah data sudah
terdistribusi secara normal. Oleh karena itu, penulis perlu melakukan uji normalitas. Salah satu
cara yang dapat dilakukan untuk uji normalitas adalah dengan menggunakan fasilitas SPSS
yaitu Kolmogorov-Smirnov. Selain menggunakan Kolmogorov-Smirnof, alternatif unutk
melakukan uji normalitas lainnya adalah dengan menggunakan Shapiro-Wilk. Kolmogorov-
Smirnov digunakan pada sampel yang jumlahnya banyak (>100), sementara Shapiro-Wilk
untuk sampel yang jumlahnya sedikit (<100).
2. Uji Multikolinearitas
Uji multikolinearitas ini dimaksudkan untuk menguji apakah terdapat korelasi yang tinggi atau
sempurna antara variabel bebas dalam model regresi. Ada atau tidaknya multikolinearitas
dapat diketahui dari koefisien korelasi dari masing-masing variabel independen. Untuk
mendeteksi adanya korelasi yang tinggi antar variabel independen dapat dilakukan dengan
bebera cara salah satunya dengan menggunakan Tolerance dan Variance Inflation Factor (VIF).
Tolerance yang rendah sama dengan nilai VIF yang tinggi. Asumsi dari Tolerance dan Variance
Inflation Factor (VIF) dapat dinyatakan sebagai berikut:
1. Jika VIF > 10 dan nilai Tolerance < 0.10 maka terjadi multikolinearitas.
2. Jika VIF < 10 dan nilai Tolerance > 0.10 maka tidak terjadi multikolinearitas.
Jika terjadi multikolinearitas pada data, ada beberapa alternatif cara untuk mengatasi masalah
multikolinearitas diantaranya:
1. Mengganti atau mengeluarkan variabel yang mempunyai korelasi yang tinggi.
2. Menambah jumlah observasi.
3. Mentransformasikan data ke dalam bentuk lain, misalnya logaritma natural,
akar kuadrat atau first difference delta.