PENDAHULUAN
Setelah data kuantitatif dikumpulkan dari sampel yang mewakili populasi, langkah selanjutnya adalah
menganalisisnya untuk menjawab pertanyaan penelitian. Namun, sebelum dapat mulai menganalisis
data, beberapa langkah awal perlu diselesaikan. Hal ini membantu memastikan bahwa data akurat,
lengkap, dan cocok untuk analisis lebih lanjut.
Mengkodekan tanggapan
Kesalahan manusia dapat terjadi saat pengkodean. Oleh karena itu, setidaknya 10% dari kuesioner
yang diberi kode harus diperiksa untuk akurasi pengkodean. Pemilihan mereka dapat mengikuti
prosedur pengambilan sampel yang sistematis. Artinya, setiap bentuk ke-n yang dikodekan dapat
diverifikasi keakuratannya. Jika banyak kesalahan ditemukan dalam sampel, semua item mungkin
harus diperiksa.
Entri data
Setelah respon telah dikodekan, maka data tersebut dapat dimasukkan ke dalam database. Data
mentah dapat dimasukkan melalui program perangkat lunak apa pun. Misalnya, Editor Data SPSS.
Penting untuk selalu menggunakan kolom pertama untuk tujuan identifikasi; berikan nomor untuk
setiap kuesioner, tulis nomor di halaman pertama kuesioner, dan masukkan nomor ini di kolom
pertama file data Anda. Hal ini memungkinkan peneliti untuk membandingkan data dalam file data
dengan jawaban peserta, bahkan setelah peneliti mengatur ulang file datanya. Kemudian, mulailah
memasukkan respon peserta ke dalam file data.
Mengedit Data
Setelah data dimasukkan, maka data tersebut perlu diedit. Misalnya, respon kosong (blank response),
jika ada, maka harus ditangani dengan cara tertentu, dan data yang tidak konsisten harus diperiksa dan
ditindaklanjuti. Pengeditan data berkaitan dengan mendeteksi, mengoreksi dan penghilangan data
yang tidak logis, tidak konsisten, atau ilegal dalam informasi yang dikembalikan oleh peserta
penelitian.
Contoh dari respon yang tidak logis (illogical response) adalah respon outlier. Outlier adalah
pengamatan yang secara substansial berbeda dari pengamatan lainnya. outlier tidak selalu merupakan
kesalahan meskipun kesalahan data (kesalahan entri) kemungkinan merupakan sumber outlier. Anda
dapat memeriksa penyebaran variabel nominal dan/atau ordinal dengan mendapatkan nilai dan tabel
frekuensi minimum dan maksimum. Ini akan dengan cepat mengungkapkan outlier yang paling jelas.
Untuk data interval dan rasio, alat bantu visual (seperti scatterplot atau boxplot) adalah metode yang
baik untuk memeriksa outlier.
Tanggapan tidak konsisten (inconcsistent response) adalah tanggapan yang tidak selaras dengan
informasi lain. Tanggapan yang tidak selaras ini kemudian dapat diedit oleh peneliti.
Kode ilegal (illegal code) adalah nilai yang tidak ditentukan dalam instruksi pengkodean. Misalnya,
kode "6" dalam pertanyaan 1 (saya berinvestasi lebih banyak dalam pekerjaan saya daripada yang
saya dapatkan) akan menjadi kode ilegal. Cara terbaik untuk memeriksa kode ilegal adalah dengan
membuat komputer menghasilkan distribusi frekuensi dan memeriksanya untuk kode ilegal.
Tidak semua responden menjawab setiap item dalam kuesioner. Kelalaian dapat terjadi karena
responden tidak memahami pertanyaan, tidak mengetahui jawabannya, atau tidak bersedia menjawab
pertanyaan.
Jika sejumlah besar pertanyaan – katakanlah, 25% dari item dalam kuesioner – tidak terjawab,
mungkin ide yang baik untuk membuang kuesioner dan tidak memasukkannya ke dalam kumpulan
data untuk analisis.
Dalam hal ini, penting untuk menyebutkan jumlah tanggapan yang dikembalikan tetapi tidak
digunakan karena data yang hilang berlebihan dalam laporan akhir yang diserahkan kepada sponsor
penelitian. Namun, jika hanya dua atau tiga item yang dibiarkan kosong dalam kuesioner dengan,
katakanlah, 30 item atau lebih, kita perlu memutuskan bagaimana tanggapan kosong ini akan
ditangani.
Salah satu cara untuk menangani respons kosong adalah dengan mengabaikannya saat analisis selesai.
Pendekatan ini dimungkinkan di semua program statistik dan merupakan opsi default di sebagian
besar program. Kerugian dari pendekatan ini adalah, tentu saja, akan mengurangi ukuran sampel,
kadang-kadang bahkan ke ukuran yang tidak sesuai, setiap kali variabel tertentu terlibat dalam
analisis. Selain itu, jika data yang hilang tidak hilang sepenuhnya secara acak, metode ini dapat
membiaskan hasil penelitian Anda. Untuk alasan ini, mengabaikan respons kosong paling cocok
untuk contoh di mana kami telah mengumpulkan sejumlah besar data, jumlah data yang hilang relatif
kecil, dan hubungan yang begitu kuat sehingga tidak terpengaruh oleh data yang hilang (Hair,
Anderson, Tatham & Hitam, 1995).
Solusi alternatif adalah dengan melihat pola respons peserta terhadap pertanyaan lain dan, dari
jawaban ini, menyimpulkan jawaban logis untuk pertanyaan untuk respons yang hilang. Solusi
alternatif kedua adalah dengan menetapkan item nilai rata-rata dari tanggapan semua orang yang telah
menanggapi item tertentu. Sebenarnya, ada banyak cara untuk menangani jawaban kosong (lihat Hair
et al., 1995), masing-masing memiliki kelebihan dan kekurangannya sendiri.
Perhatikan bahwa jika banyak responden menjawab “tidak tahu” untuk item- item tertentu,
penyelidikan lebih lanjut mungkin berguna. Pertanyaannya mungkin tidak jelas atau, karena alasan
tertentu, peserta mungkin enggan atau tidak mampu menjawab pertanyaan.
Transformasi Data
Transformasi data, variasi pengkodean data, adalah proses mengubah representasi numerik asli dari
nilai kuantitatif ke nilai lain. Data biasanya diubah untuk menghindari masalah pada tahap selanjutnya
dari proses analisis data. Jenis lain dari transformasi data adalah reverse scoring.
Transformasi data juga diperlukan ketika beberapa pertanyaan telah digunakan untuk mengukur satu
konsep. Dalam kasus seperti itu, skor pada pertanyaan asli harus digabungkan menjadi skor tunggal
(tetapi hanya setelah kita menetapkan bahwa konsistensi interitem memuaskan). Skor gabungan ini
dimasukkan ke dalam kolom baru di SPSS. Sangat mudah untuk menghitung variabel baru,
menggunakan kotak dialog Compute, yang terbuka ketika ikon Transform dipilih.
MENDAPATKAN DATA
Kita dapat merasakan data dengan memperoleh ringkasan visual atau dengan memeriksa tendensi
sentral dan dispersi variabel. Kita juga bisa mengetahui data kita dengan memeriksa hubungan antara
dua variabel.
Jika respons terhadap setiap item individu dalam skala tidak memiliki penyebaran (rentang) yang baik
dan menunjukkan variabilitas yang sangat kecil, maka peneliti dapat menduga bahwa pertanyaan
tertentu mungkin tidak disusun dengan benar. Bias, jika ada, juga dapat dideteksi jika responden
cenderung memberikan respons yang sama untuk semua item – yaitu, mereka hanya terpaku pada
titik-titik tertentu pada skala. Ingatlah bahwa jika tidak ada variabilitas dalam data, maka tidak ada
varians yang dapat dijelaskan! Dengan demikian, merasakan data merupakan langkah pertama yang
diperlukan dalam semua analisis data. Berdasarkan perasaan awal ini, analisis rinci lebih lanjut dapat
dilakukan untuk menguji kebaikan data.
Frekuensi
Frekuensi hanya mengacu pada berapa kali berbagai subkategori dari fenomena tertentu terjadi, dari
mana persentase dan persentase kumulatif kemunculannya dapat dengan mudah dihitung.
Mean Mean, atau rata-rata, adalah ukuran tendensi sentral yang menawarkan gambaran umum data
tanpa perlu membanjiri satu dengan masing-masing pengamatan dalam kumpulan data.
Median Median adalah item sentral dalam sekelompok pengamatan ketika mereka disusun dalam
urutan menaik atau menurun.
Modus Dalam beberapa kasus, satu set pengamatan tidak meminjamkan dirinya untuk representasi
yang berarti baik melalui mean atau median, tetapi dapat ditandai dengan fenomena yang paling
sering terjadi.
Ukuran Dispersi
Selain mengetahui bahwa ukuran tendensi sentral adalah mean, median, atau modus (bergantung pada
jenis data yang tersedia), kita juga ingin mengetahui tentang variabilitas yang ada dalam serangkaian
pengamatan. Seperti ukuran tendensi sentral, ukuran dispersi juga unik untuk data nominal dan
interval. Dua set data mungkin memiliki rata-rata yang sama, tetapi dispersinya bisa berbeda.
Tiga pengukuran dispersi yang dihubungkan dengan mean adalah jangkauan, varians, dan standar
deviasi.
Rentang (Range) Rentang (Range) mengacu pada nilai-nilai ekstrim dalam satu set pengamatan.
Varians Varians dihitung dengan mengurangkan mean dari masing-masing pengamatan dalam
kumpulan data, mengambil kuadrat dari perbedaan ini, dan membagi totalnya dengan jumlah
pengamatan.
Standar deviasi Standar deviasi, yang merupakan ukuran lain dari dispersi untuk interval dan data
skala rasio, menawarkan indeks penyebaran distribusi atau variabilitas dalam data. Ini adalah ukuran
dispersi yang sangat umum digunakan, dan hanya merupakan akar kuadrat dari varians.
Rata-rata (mean) dan standart deviasi adalah statistik deskriptif yang paling umum untuk data berskala
interval dan rasio. Standar deviasi, dalam hubungannya dengan mean, adalah alat yang sangat berguna
karena aturan statistik berikut, dalam distribusi normal:
1. Praktis semua pengamatan termasuk dalam tiga standar deviasi dari rata-rata atau rata-rata.
2. Lebih dari 90% pengamatan berada dalam dua standar deviasi dari mean.
3. Lebih dari setengah pengamatan berada dalam satu standar deviasi dari mean.
Korelasi
Matriks korelasi Pearson akan menunjukkan arah, kekuatan, dan signifikansi hubungan bivariat di
antara semua variabel yang diukur pada tingkat interval atau rasio. Korelasi diperoleh dengan menilai
variasi dalam satu variabel karena variabel lain juga bervariasi. Koefisien korelasi yang menunjukkan
kekuatan dan arah hubungan dapat dihitung dengan menerapkan rumus yang mempertimbangkan dua
set angka.
Sementara korelasi dapat berkisar antara 1.0 dan +1.0, kita perlu mengetahui apakah ada korelasi
yang ditemukan antara dua variabel yang signifikan atau tidak (yaitu, jika hal itu terjadi semata-mata
secara kebetulan atau jika ada kemungkinan besar keberadaan aktualnya). Seperti yang kita ketahui,
signifikansi p= 0,05 adalah tingkat konvensional yang diterima secara umum dalam penelitian ilmu
sosial. Hal ini menunjukkan bahwa 95 kali dari 100, kita dapat yakin bahwa ada korelasi yang benar
atau signifikan antara kedua variabel, dan hanya ada kemungkinan 5% bahwa hubungan tersebut tidak
benar-benar ada.
Koefisien korelasi Pearson sesuai untuk variabel skala interval dan rasio, dan koefisien Rank
Spearman atau Kendall's tau sesuai untuk variabel diukur pada skala ordinal. Korelasi bivariat apa
pun dapat diperoleh dengan mengklik menu yang relevan, mengidentifikasi variabel, dan mencari
statistik parametrik atau nonparametrik yang sesuai.