Anda di halaman 1dari 5

CH 14 Quantitive Data Analysis

Setelah data kuantitatif dikumpulkan dari sampel yang mewakili populasi, langkah selanjutnya
adalah menganalisisnya untuk menjawab pertanyaan penelitian kami. Namun, sebelum kita dapat
mulai menganalisis data, beberapa langkah awal perlu diselesaikan. Ini membantu memastikan
bahwa data akurat, lengkap, dan cocok untuk analisis lebih lanjut.

MENYIAPKAN DATA UNTUK ANALISIS


Setelah data diperoleh melalui kuesioner, mereka perlu dikodekan, dimasukkan, dan diedit.
Artinya, skema kategorisasi harus diatur sebelum data dapat diketik. Kemudian, outlier,
inkonsistensi, dan tanggapan kosong, jika ada, harus ditangani dengan cara tertentu. Masing-
masing tahap persiapan data ini dibahas di bawah ini.

Coding dan entri data


Langkah pertama dalam persiapan data adalah data coding. Pengkodean data melibatkan
pemberian nomor pada tanggapan peserta sehingga data tersebut dapat dimasukkan ke dalam
database. Dalam Bab 9, kami membahas kenyamanan survei elektronik untuk mengumpulkan
data kuesioner; survei semacam itu memfasilitasi masuknya tanggapan langsung ke komputer
tanpa memasukkan data secara manual. Namun, jika, karena alasan apa pun, hal ini tidak dapat
dilakukan, maka mungkin ide yang baik untuk menggunakan lembar pengkodean terlebih dahulu
untuk menyalin data dari kuesioner dan kemudian memasukkan datanya.

Mengkodekan tanggapan
Dalam kuesioner Excelsior Enterprises, kami memiliki 22 item yang mengukur ekuitas yang
dirasakan, pengayaan pekerjaan, kelelahan, kepuasan kerja, dan niat untuk pergi, dan enam
variabel demografis, seperti yang ditunjukkan pada Gambar 14.1, kuesioner sampel. Tanggapan
karyawan tertentu (peserta #1 dalam file data) untuk 22 pertanyaan pertama dapat dikodekan
dengan menggunakan nomor sebenarnya yang dilingkari oleh responden (1, 2, 3, 1, 4, 5, 1, 3, 3 ,
dll.). Pengkodean variabel demografis agak kurang jelas. Misalnya, tenurial adalah kasus khusus,
karena merupakan variabel dua kategori. Dimungkinkan untuk menggunakan pendekatan
pengkodean yang menetapkan 1 = paruh waktu dan 2 = penuh waktu. Namun, menggunakan 0 =
paruh waktu dan 1 = penuh waktu (ini disebut dummy coding) sejauh ini merupakan pendekatan
yang paling populer dan direkomendasikan karena membuat hidup kita lebih mudah dalam tahap
analisis data. Oleh karena itu, kami mengkodekan masa kerja (penuh waktu) dengan 1 untuk
peserta #1. Shift kerja (shift ketiga) dapat diberi kode 3, departemen (produksi) 2, dan usia 54.
Jenis kelamin dapat dikodekan 0 (laki-laki) Terakhir, pendidikan (kurang dari SMA) dapat diberi
kode 1. Pada tahap ini juga harus dipikirkan tentang bagaimana Anda ingin mengkode
nonresponses. Beberapa peneliti membiarkan nonrespons kosong, yang lain menetapkan "9",
"99" atau "." Semua pendekatan baik-baik saja, selama Anda mengkodekan semua nonresponses
dengan cara yang sama. Kesalahan manusia dapat terjadi saat pengkodean. Oleh karena itu,
setidaknya 10% dari kuesioner yang diberi kode harus diperiksa untuk akurasi pengkodean.
Pemilihan mereka dapat mengikuti prosedur pengambilan sampel yang sistematis. Artinya, setiap
bentuk ke-n yang dikodekan dapat diverifikasi keakuratannya. Jika banyak kesalahan ditemukan
dalam sampel, semua item mungkin harus diperiksa.

Data Entry
Setelah tanggapan telah dikodekan, mereka dapat dimasukkan ke dalam database. Data mentah
dapat dimasukkan melalui program perangkat lunak apa pun. Misalnya, Editor Data SPSS, yang
terlihat seperti spreadsheet dan ditunjukkan pada Gambar 14.2, dapat memasukkan, mengedit,
dan melihat isi file data. Setiap baris editor mewakili kasus atau pengamatan (dalam hal ini
peserta penelitian kami – 174 dalam studi Excelsior Enterprises), dan setiap kolom mewakili
variabel (di sini variabel didefinisikan sebagai item informasi berbeda yang Anda kumpulkan
untuk kasus; dengan demikian ada 28 variabel dalam kuesioner Excelsior Enterprises). Penting
untuk selalu menggunakan kolom pertama untuk tujuan identifikasi; berikan nomor untuk setiap
kuesioner, tulis nomor ini di halaman pertama kuesioner, dan masukkan nomor ini di kolom
pertama file data Anda. Ini memungkinkan Anda untuk membandingkan data dalam file data
dengan jawaban peserta, bahkan setelah Anda mengatur ulang file data Anda. Kemudian,
mulailah memasukkan tanggapan peserta ke dalam file data.

Editing data
Setelah data dimasukkan, mereka perlu diedit. Misalnya, tanggapan kosong, jika ada, harus
ditangani dengan cara tertentu, dan data yang tidak konsisten harus diperiksa dan ditindaklanjuti.
Pengeditan data berkaitan dengan mendeteksi dan mengoreksi data dan penghilangan yang tidak
logis, tidak konsisten, atau ilegal dalam informasi yang dikembalikan oleh peserta penelitian.
Contoh dari respon yang tidak logis adalah respon outlier. Pencilan adalah pengamatan yang
secara substansial berbeda dari pengamatan lainnya. Pencilan tidak selalu merupakan kesalahan
meskipun kesalahan data (kesalahan entri) kemungkinan merupakan sumber outlier. Karena
outlier memiliki dampak besar pada hasil penelitian, mereka harus diselidiki dengan hati-hati
untuk memastikan kebenarannya. Anda dapat memeriksa penyebaran variabel nominal dan/atau
ordinal dengan mendapatkan nilai dan tabel frekuensi minimum dan maksimum. Ini akan dengan
cepat mengungkapkan outlier yang paling jelas. Untuk data interval dan rasio, alat bantu visual
(seperti scatterplot atau boxplot) adalah metode yang baik untuk memeriksa outlier. Tanggapan
tidak konsisten adalah tanggapan yang tidak selaras dengan informasi lain. Misalnya, seorang
peserta dalam penelitian kami mungkin telah menjawab pernyataan ekuitas yang dirasakan
seperti pada Gambar 14.3. Perhatikan bahwa semua jawaban karyawan ini menunjukkan bahwa
peserta menemukan bahwa manfaat yang dia terima dari organisasi menyeimbangkan upaya
yang dia lakukan dalam pekerjaannya, kecuali jawaban untuk pernyataan ketiga. Dari empat
tanggapan lainnya kita dapat menyimpulkan bahwa peserta kemungkinan besar merasa bahwa,
untuk upaya yang dia lakukan dalam organisasi, dia mendapatkan banyak imbalan dan telah
membuat kesalahan dalam menanggapi pernyataan khusus ini. Tanggapan terhadap pernyataan
ini kemudian dapat diedit oleh peneliti.
Namun, mungkin saja responden dengan sengaja menunjukkan bahwa dia tidak mendapatkan
banyak imbalan atas upaya yang dia lakukan di organisasi. Jika demikian halnya, kami akan
memperkenalkan bias dengan mengedit data. Oleh karena itu, perhatian besar harus diambil
dalam menangani tanggapan yang tidak konsisten seperti ini. Bila memungkinkan, diinginkan
untuk menindaklanjuti dengan responden untuk mendapatkan data yang benar, meskipun ini
adalah solusi yang mahal. Kode ilegal adalah nilai yang tidak ditentukan dalam instruksi
pengkodean. Misalnya, kode "6" dalam pertanyaan 1 (saya berinvestasi lebih banyak dalam
pekerjaan saya daripada yang saya dapatkan) akan menjadi kode ilegal. Cara terbaik untuk
memeriksa kode ilegal adalah dengan membuat komputer menghasilkan distribusi frekuensi dan
memeriksanya untuk kode ilegal. Tidak semua responden menjawab setiap item dalam
kuesioner. Kelalaian dapat terjadi karena responden tidak memahami pertanyaan, tidak
mengetahui jawabannya, atau tidak bersedia menjawab pertanyaan. Jika sejumlah besar
pertanyaan – katakanlah, 25% dari item dalam kuesioner – tidak terjawab, mungkin ide yang
baik untuk membuang kuesioner dan tidak memasukkannya ke dalam kumpulan data untuk
analisis. Dalam acara ini, penting untuk menyebutkan jumlah tanggapan yang dikembalikan
tetapi tidak digunakan karena data yang hilang berlebihan dalam laporan akhir yang diserahkan
kepada sponsor penelitian. Namun, jika hanya dua atau tiga item yang dibiarkan kosong dalam
kuesioner dengan, katakanlah, 30 item atau lebih, kita perlu memutuskan bagaimana tanggapan
kosong ini akan ditangani.
Salah satu cara untuk menangani respons kosong adalah dengan mengabaikannya saat analisis
selesai. Pendekatan ini dimungkinkan di semua program statistik dan merupakan opsi default di
sebagian besar program. Kelemahan dari pendekatan ini adalah, tentu saja, akan mengurangi
ukuran sampel, kadang-kadang bahkan ke ukuran yang tidak sesuai, setiap kali variabel tertentu
terlibat dalam analisis. Selain itu, jika data yang hilang tidak hilang sepenuhnya secara acak,
metode ini dapat membiaskan hasil penelitian Anda. Untuk alasan ini, mengabaikan respons
kosong paling cocok untuk contoh di mana kami telah mengumpulkan sejumlah besar data,
jumlah data yang hilang relatif kecil, dan hubungan yang begitu kuat sehingga tidak terpengaruh
oleh data yang hilang (Hair, Anderson, Tatham & Hitam, 1995). Solusi alternatif adalah dengan
melihat pola respons peserta terhadap pertanyaan lain dan, dari jawaban ini, menyimpulkan
jawaban logis untuk pertanyaan untuk respons yang hilang. Solusi alternatif kedua adalah
menetapkan item nilai rata-rata dari tanggapan semua orang yang telah menanggapi item
tertentu. Sebenarnya, ada banyak cara untuk menangani jawaban kosong (lihat Hair et al., 1995),
masing-masing memiliki kelebihan dan kekurangannya sendiri. Perhatikan bahwa jika banyak
responden menjawab “tidak tahu” untuk item atau item tertentu, penyelidikan lebih lanjut
mungkin berguna. Pertanyaannya mungkin tidak jelas atau, karena alasan tertentu, peserta
mungkin enggan atau tidak mampu menjawab pertanyaan.

Data Transformation
Transformasi data, variasi pengkodean data, adalah proses mengubah representasi numerik asli
dari nilai kuantitatif ke nilai lain. Data biasanya diubah untuk menghindari masalah pada tahap
selanjutnya dari proses analisis data. Misalnya, para ekonom sering menggunakan transformasi
logaritmik agar data lebih merata. Jika, misalnya, data pendapatan, yang sering tidak merata,
direduksi ke nilai logaritmiknya, pendapatan tinggi dibawa lebih dekat ke ujung bawah skala dan
memberikan distribusi lebih dekat ke kurva normal. Jenis lain dari transformasi data adalah
reverse scoring. Ambil, misalnya, ukuran ketidakadilan yang dirasakan dari kasus Excelsior
Enterprises. Ketidaksetaraan yang dirasakan diukur dengan lima item survei: (1) “Saya
berinvestasi lebih banyak dalam pekerjaan saya daripada yang saya dapatkan darinya”; (2) “Saya
terlalu memaksakan diri untuk mempertimbangkan apa yang saya dapatkan sebagai balasannya”;
(3) “Untuk usaha yang saya lakukan dalam organisasi, saya mendapatkan banyak imbalan”
(terbalik); (4) “Jika saya memperhitungkan dedikasi saya, organisasi harus memberi saya
pelatihan praktis yang lebih baik”; dan (5) “Secara umum, manfaat yang saya terima dari
organisasi lebih besar daripada upaya yang saya lakukan” (terbalik). Untuk item pertama, kedua,
dan keempat, skor yang menunjukkan persetujuan tinggi akan menjadi negatif, tetapi untuk
pertanyaan ketiga dan kelima, skor yang menunjukkan persetujuan tinggi akan menjadi positif.
Untuk menjaga konsistensi dalam arti jawaban, item pertama, kedua, dan keempat harus diberi
skor terbalik (perhatikan bahwa kita mengukur kesetaraan dan bukan ketidakadilan). Dalam hal
ini, angka 5 ("Saya sepenuhnya setuju") akan diubah menjadi angka 1 ("Saya sangat tidak
setuju"), angka 4 menjadi angka 2, dan seterusnya.
Transformasi data juga diperlukan ketika beberapa pertanyaan telah digunakan untuk mengukur
satu konsep. Dalam kasus seperti itu, skor pada pertanyaan asli harus digabungkan menjadi satu
skor (tetapi hanya setelah kita menetapkan bahwa konsistensi interitem memuaskan (lihat
Menguji kebaikan data, nanti dalam bab ini).Misalnya, karena lima item telah digunakan untuk
mengukur konsep "perceived equity", skor "perceived equity" baru harus dihitung dari skor pada
lima item individual (tetapi hanya setelah item 1, 2, dan 4 diberi kode terbalik). menghitung skor
penjumlahan (per kasus/peserta) dan kemudian membaginya dengan jumlah item (dalam kasus
ini lima).Misalnya, karyawan kami #1 telah melingkari, masing-masing, 1, 2, 3, 1, dan 4 pada
lima partisipasi dalam pertanyaan pengambilan keputusan; skornya (karyawan # 1 adalah laki-
laki) pada item, setelah item 1, 2, dan 4 telah dikodekan terbalik, adalah 5, 4, 3, 5, dan 4. Skor
gabungan pada ekuitas yang dirasakan adalah 5 4 3 5 4 21/5 4.2). Skor gabungan ini dimasukkan
dalam kolom baru di SPSS. Sangat mudah untuk menghitung variabel baru, menggunakan kotak
dialog Compute, yang terbuka ketika ikon Transform dipilih (Gambar 14.4).

GETTING A FEEL FOR THE DATA


Kita dapat merasakan data dengan memperoleh ringkasan visual atau dengan memeriksa
tendensi sentral dan dispersi variabel. Kita juga bisa mengetahui data kita dengan memeriksa
hubungan antara dua variabel. Dalam Bab 12, kami menjelaskan bahwa operasi statistik yang
berbeda pada variabel dimungkinkan, tergantung pada tingkat di mana suatu variabel diukur.
Tabel 14.1 merangkum hubungan antara jenis skala, analisis data, dan metode memperoleh
ringkasan visual untuk variabel. Tabel 14.1 menunjukkan bahwa, tergantung pada skala ukuran
kami, modus, median, atau rata-rata, dan kisaran semiinterkuartil, simpangan baku, atau varians
akan memberi kami ide yang baik tentang bagaimana peserta dalam penelitian kami bereaksi
terhadap item dalam kuesioner. Statistik ini dapat dengan mudah diperoleh, dan akan
menunjukkan apakah rentang tanggapan memuaskan di atas skala. Jika respons terhadap setiap
item individu dalam skala tidak memiliki penyebaran (rentang) yang baik dan menunjukkan
variabilitas yang sangat kecil, maka peneliti dapat menduga bahwa pertanyaan tertentu mungkin
tidak disusun dengan benar. Bias, jika ada, juga dapat dideteksi jika responden cenderung
memberikan respons yang sama untuk semua item – yaitu, mereka hanya terpaku pada titik-titik
tertentu pada skala. Ingatlah bahwa jika tidak ada variabilitas dalam data, maka tidak ada varians
yang dapat dijelaskan! Dengan demikian, merasakan data merupakan langkah pertama yang
diperlukan dalam semua analisis data. Berdasarkan perasaan awal ini, analisis rinci lebih lanjut
dapat dilakukan untuk menguji kebaikan data.
Para peneliti berusaha keras untuk mendapatkan tendensi sentral, jangkauan, dispersi, dan
statistik lainnya untuk setiap item tunggal yang mengukur variabel dependen dan independen,
terutama ketika ukuran untuk suatu konsep baru dikembangkan. Statistik deskriptif untuk
variabel tunggal disediakan oleh frekuensi, ukuran tendensi sentral, dan dispersi. Ini sekarang
dijelaskan.

Frequencies
Frekuensi hanya mengacu pada berapa kali berbagai subkategori dari fenomena tertentu terjadi,
dari mana persentase dan persentase kumulatif kemunculannya dapat dengan mudah dihitung.
Bar charts and pie charts
Frekuensi juga dapat ditampilkan secara visual sebagai diagram batang, histogram, dan diagram
lingkaran. Diagram batang, histogram, dan diagram lingkaran membantu kami memahami data
Anda.

Measures of central tendency and dispersion


Ada tiga ukuran tendensi sentral: mean, median, dan modus. Ukuran disperse termasuk rentang,
deviasi standar, varians (di mana ukuran tendensi sentral adalah mean), dan rentang interkuartil
(di mana ukuran tendensi sentral adalah median).

Anda mungkin juga menyukai