Anda di halaman 1dari 6

BAB 3 DATA SCREENING DAN DATA EXAMINING

Langkah pertama sebelum menganalisis model penelitian adalah memeriksa data untuk
memastikan tidak ada kesalahan, outlier, atau kesalahan responden. Selain itu, perlu pula
menilai apakah ada data yang hilang pada kumpulan data.

Pemeriksaan data (data screening) adalah langkah awal yang memakan waktu tetapi perlu,
dalam setiap analisis dan fatalnya sering diabaikan oleh para peneliti. Pada langkah ini, penulis
mengevaluasi dampak dari data yang hilang (missing value), mengidentifikasi outlier, dan
menguji asumsi yang paling mendasari teknik multivariat (dalam hal ini uji asumsi klasik
berupa uji normalitas, uji multikolinearitas). Tujuan dari data screening ini adalah untuk untuk
menggambarkan data aktual, karena efek dari data yang hilang, outlier, dan kesalahan lain
pada data ini bersifat tersembunyi dan seringkali terabaikan. Misalnya, bias yang dihasilkan
oleh data hilang tidak akan pernah diketahui kecuali secara eksplisit diidentifikasi dan
diperbaiki.

MISSING VALUE
Kenapa terjadi missing value?
Missing value atau adanya data yang hilang atau tidak tersedia dalam file data bisa terjadi
karena kesalahan responden dalam mengisi kuesioner. Responden melewatkan pertanyaan
untuk dijawab. Selain itu missing value ini bisa terjadi juga karena kesalahan surveyor dalam
mengisikan data sesuai arahan responden atau kesalahan terjadi pada peneliti dalam
tabulasi/input data.

Contoh missing value


Pada gambar 3.1 berikut menunjukkan penampakan missing value di file excel. Sel yang di arsir
abu-abu menunjukkan data yang kosong. Dengan kata lain data ini luput dari perhatian
responden dalam mengisi kuesioner atau peneliti dalam menginput data.

Gambar 3.1
Kenapa tidak boleh ada data yang hilang?
Jika ada data yang tidak lengkap, maka ini akan memengaruhi nilai/bobot pada skor variabel
secara agregat. Selain itu, jika data ada yang kosong maka pada beberapa alat analisis seperti
Amos tidak bisa dijalankan. Selain itu, data yang kosong juga akan meningkatkan
kecenderungan kesalahan pada hasil analysis nantinya, serta beberapa alasan penting lainnya.
Oleh karena itu, penting bagi para peneliti untuk menyelesaikan kasus ini.

Cara menangani Missing Value


Ada 2 cara yang dapat dilakukan untuk menyelesaikan masalah pmissing value:
1. Menghapus responden yang memiliki data tidak lengkap. Namun cara ini memiliki
kelemahan. Jika jumlah missing value banyak, maka akan banyak pula responden yang
akan terhapus sehingga akan mempengaruhi ukuran sampel nantinya.
2. Menggantikan (mengisi) data yang hilang dengan nilai mean, modus, atau mediannya.
Teknik ini dapat dilakukan jika data yang hilang pada suatu indikator kurang dari 5%.

Menghapus responden

1. Pastikan pada file data sudah ada kolom ID yang berisi kode identitas responden.
2. Pada kolom paling ujung kanan, tambahkan satu kolom untuk menampilkan total
missing value pada setiap responden, namai kolom tersebut sesuai pemahaman Anda.
3. Pada kolom paling kanan tersebut, ketikkan rumus “COUNTBLANK(Rentang sel yang
diamati)” misal =COUNTBLANK(B2:X2)
4. Maka akan muncul jumlah missing value pada setiap (baris) responden seperti gambar
3.2 berikut:

5. Anda dapat menghapus responden yang memiliki missing value.


OUTLIER

Outlier adalah data observasi yang muncul dengan nilai-nilai ekstrim, baik secara univariat
ataupun multivariat. Yang dimaksud dengan nilai-nilai ekstrim dalam observasi adalah nilai
yang jauh atau beda sama sekali dengan sebagian besar nilai lain dalam kelompoknya.
Misalkan nilai ujian siswa dalam satu kelas yang berjumlah 30 siswa, sebanyak 29 siswa
mendapatkan nilai ujian dalam kisaran 70 sampai 80. Kemudian ada 1 siswa yang nilainya
sangat melenceng dari lainnya, yaitu mendapatkan nilai 30. Nah, tentunya 1 siswa tersebut
memiliki nilai ekstrem sehingga disebut sebagai outlier.

Jika digambarkan dalam bentuk grafik, berikut kira-kira pola grafik yang menggambarkan
outlier:

Gambar 3.3
Data outlier dalam penelitian harus mendapatkan perlakuan khusus, karena dapat
menyebabkan terjadinya masalah serius pada penelitian, salah satunya bias pada hasil
penelitian. Selain itu, kebanyakan metode analisis parametrik memerlukan asumsi distribusi data
yang valid, dan keberadaan outlier sering mengakibatkan kekeliruan asumsi tersebut. Outlier juga
meningkatkan variasi data dan dengan demikian mengurangi kekuatan uji statistik, yang tidak kita
inginkan. Outlier bisa jadi merupakan pengamatan yang salah, misalnya kesalahan yang terjadi
selama input data. Oleh karena itu, untuk mencapai data analysis yang bermakna dan tidak bias,
ia harus kita deteksi dan tangani secara tepat.

Namun disamping itu, semuanya masih tergantung pada tujuan penelitian, apabila nilai-nilai
ekstrim yang dimaksud memang diupayakan untuk dinilai keberadaannya atau dinilai
fenomenanya, maka outlier tersebut dibiarkan saja. Outlier sisi lain, dapat membuat pengamatan
menjadi menarik, seperti saat hasil ujian sangat jauh berbeda dengan rata-rata perolehan nilai siswa
lainnya hal ini mungkin menyimpan informasi menarik yang belum terungkap sebelumnya, dan ini
dapat menjadi fokus penelitian. Metode analisis kemudian juga bisa diganti menjadi analisis non-
parametrik jika keputusan ini diambil. Namun apabila tujuan penelitian adalah untuk
generalisasi, apalagi untuk menentukan sebuah model prediksi seperti dalam regresi linear,
maka data tersebut harus mendapatkan perlakuan khusus. Apakah perlakuan tersebut? Salah
satu yang bisa dilakukan adalah transformasi data jika nilai ekstrim masih bisa dikurangi
jaraknya dengan kelompok yang lainnya. Jika terlalu jauh, maka outlier bisa dikeluarkan dari
penelitian.

Cara mendeteksi outlier dengan SPSS salah satunya adalah dengan menggunakan Z-Score. Z-
score dapat digunakan untuk membantu menentukan apakah sebuah data bernilai ekstrem,
atau outlier. Aturan Z-score adalah nilai kurang dari –3 atau lebih dari +3 menunjukkan bahwa
nilai data adalah nilai ekstrem. Jadi Z-Score yang memiliki nilai <-3 atau >3 merupakan outlier.

Langkah-langkah memunculkan nilai Z-Score di SPSS:


1. Pilih menu analyze
2. Pilih descriptive
3. Masukkan data yang hendak diidentifikasi pada kotak variables
4. Setelah muncul output nilai Z-Score, urutkan Z-Score melalui menu Data  Sort Case
5. Urutkan data anda berdasarkan Z score variabel yang ingin diketahui outliernya.

Selain mengidentifikasi outlier dengan menggunakan nilai Z-Score, cara lain untuk
mengidentifikas outlier adalah dengan menggunakan probabilitas Mahalanobis di SPSS. Setelah
data outlier diketahui, outlier tersebut data dikeluarkan dari penelitian.

UJI ASUMSI KLASIK

1. Uji Normalitas
Setelah memastikan tidak ada missing value, setelah semua outlier diidentifikasi dan
dikeluarkan atau data telah ditransformasi, maka selanjutnya untuk memastikan data layak
untuk dilakukan analisis lebih lanjut, penulis sebaiknya memastikan apakah data sudah
terdistribusi secara normal. Oleh karena itu, penulis perlu melakukan uji normalitas. Salah satu
cara yang dapat dilakukan untuk uji normalitas adalah dengan menggunakan fasilitas SPSS
yaitu Kolmogorov-Smirnov. Selain menggunakan Kolmogorov-Smirnof, alternatif unutk
melakukan uji normalitas lainnya adalah dengan menggunakan Shapiro-Wilk. Kolmogorov-
Smirnov digunakan pada sampel yang jumlahnya banyak (>100), sementara Shapiro-Wilk
untuk sampel yang jumlahnya sedikit (<100).

Langkah-langkah melakukan uji normalitas Kolmogorof-Smirnov dengan SPSS:

1. Isi dataset SPSS sesuai data Anda


2. Setelah data terisi pada variabel, pada Menu, Klik Analyze, 
3. Pilih Descriptive Statistics, 
4. Kemudian Explore.
5. Masukkan variabel ke dalam dependen list dan independent list
6. Klik tombol Plots, Centang Stem-and-Leaf, Histogram, Normality Plots With Tests
7. Klik tombol Continue dan selanjutnya Klik OK. 
Selanjutnya kan muncul halaman baru output SPSS. Berikut ini adalah contoh output SPSS hasil
uji Kolmogorov-Smirnov dan Shapiro-Wilk.

Data dikatakan berdistribusi normal jika pada uji Kolmogorov-Smirnov menunjukkan


signifikansi di bawah 0,05 berarti data yang akan diuji mempunyai perbedaan yang signifikan
dengan data normal baku, berarti data tersebut tidak normal.

2. Uji Multikolinearitas

Uji multikolinearitas ini dimaksudkan untuk menguji apakah terdapat korelasi yang tinggi atau
sempurna antara variabel bebas dalam model regresi. Ada atau tidaknya multikolinearitas
dapat diketahui dari koefisien korelasi dari masing-masing variabel independen. Untuk
mendeteksi adanya korelasi yang tinggi antar variabel independen dapat dilakukan dengan
bebera cara salah satunya dengan menggunakan Tolerance dan Variance Inflation Factor (VIF).
Tolerance yang rendah sama dengan nilai VIF yang tinggi. Asumsi dari Tolerance dan Variance
Inflation Factor (VIF) dapat dinyatakan sebagai berikut:
1. Jika VIF > 10 dan nilai Tolerance < 0.10 maka terjadi multikolinearitas.
2. Jika VIF < 10 dan nilai Tolerance > 0.10 maka tidak terjadi multikolinearitas.

Jika terjadi multikolinearitas pada data, ada beberapa alternatif cara untuk mengatasi masalah
multikolinearitas diantaranya:
1. Mengganti atau mengeluarkan variabel yang mempunyai korelasi yang tinggi.
2. Menambah jumlah observasi.
3. Mentransformasikan data ke dalam bentuk lain, misalnya logaritma natural,
akar kuadrat atau first difference delta.

Langkah-langkah melakukan uji multikolinearitas dengan menggunakan SPSS:

Sebelum melakukan uji multikolinearitas, pastikan seluruh data sudah dimasukkan ke


dalam variable view dan data view. 
1. Klik “Analyze”,
2. Pilih “Regression”,
3. Pilih “Linear” untuk memunculkan
4. Pada jendela “Linear Regression”, tempatkan masing-masing data sesuai dengan jenis
variabelnya. Klik “Statistic”, jangan lupa untuk mencentang “Estimates”, “Model Fit”,
dan “Collinearity Diagnostics”. Terakhir, klik “Continue” dan “OK”.
Output data dapat dibaca dengan dua cara berikut:
Data dianggap tidak memiliki multikolinearitas apabila nilai VIF-nya < 10,00.
Sebaliknya, data terjadi multikolinearitas jika nilai VIF ≥ 10,00.
Jika nilai Tolerance > 0,10, maka data tersebut tidak terjadi multikolinearitas.
Jika nilai Tolerance < 0,10, maka dalam data tersebut terjadi multikolinearitas.

Anda mungkin juga menyukai