Chapter 14 Only

ANALISIS DATA KUANTITATIF - BAB 14
PENDAHULUAN
Setelah data kuantitatif dikumpulkan dari sampel yang mewakili populasi, langkah selanjutnya adalah
menganalisisnya untuk menjawab pertanyaan penelitian. Namun, sebelum dapat mulai menganalisis
data, beberapa langkah awal perlu diselesaikan. Hal ini membantu memastikan bahwa data akurat,
lengkap, dan cocok untuk analisis lebih lanjut.
MENYIAPKAN DATA UNTUK ANALISIS

Setelah data diperoleh melalui kuesioner, mereka perlu dikodekan, dimasukkan, dan diedit. Artinya,
skema kategorisasi harus diatur sebelum data dapat diketik. Kemudian, outlier, inkonsistensi, dan
tanggapan kosong, jika ada, harus ditangani dengan cara tertentu.
Pengkodean Dan Entri Data

Langkah pertama dalam persiapan data adalah pengkodean data. Pengkodean data melibatkan
pemberian nomor pada tanggapan peserta sehingga mereka dapat dimasukkan ke dalam database.
Selanjutnya, akan dibahas mengenai survei elektronik untuk mengumpulkan data kuesioner; survei
semacam itu memfasilitasi masuknya tanggapan langsung ke komputer tanpa memasukkan data
secara manual. Namun, jika, karena alasan apa pun, hal ini tidak dapat dilakukan, maka mungkin ide
yang baik untuk menggunakan lembar pengkodean terlebih dahulu untuk menyalin data dari
kuesioner dan kemudian memasukkan data tersebut. Metode ini, berbeda dengan membolak-balik
setiap kuesioner untuk setiap item, menghindari kebingungan, terutama ketika ada banyak pertanyaan
dan juga sejumlah besar kuesioner.
Mengkodekan tanggapan
Kesalahan manusia dapat terjadi saat pengkodean. Oleh karena itu, setidaknya 10% dari kuesioner
yang diberi kode harus diperiksa untuk akurasi pengkodean. Pemilihan mereka dapat mengikuti
prosedur pengambilan sampel yang sistematis. Artinya, setiap bentuk ke-n yang dikodekan dapat
diverifikasi keakuratannya. Jika banyak kesalahan ditemukan dalam sampel, semua item mungkin
harus diperiksa.
Entri data
Setelah respon telah dikodekan, maka data tersebut dapat dimasukkan ke dalam database. Data
mentah dapat dimasukkan melalui program perangkat lunak apa pun. Misalnya, Editor Data SPSS.
Penting untuk selalu menggunakan kolom pertama untuk tujuan identifikasi; berikan nomor untuk
setiap kuesioner, tulis nomor di halaman pertama kuesioner, dan masukkan nomor ini di kolom
pertama file data Anda. Hal ini memungkinkan peneliti untuk membandingkan data dalam file data
dengan jawaban peserta, bahkan setelah peneliti mengatur ulang file datanya. Kemudian, mulailah
memasukkan respon peserta ke dalam file data.
Mengedit Data
Setelah data dimasukkan, maka data tersebut perlu diedit. Misalnya, respon kosong (blank response),
jika ada, maka harus ditangani dengan cara tertentu, dan data yang tidak konsisten harus diperiksa dan
ditindaklanjuti. Pengeditan data berkaitan dengan mendeteksi, mengoreksi dan penghilangan data
yang tidak logis, tidak konsisten, atau ilegal dalam informasi yang dikembalikan oleh peserta
penelitian.
Contoh dari respon yang tidak logis (illogical response) adalah respon outlier. Outlier adalah
pengamatan yang secara substansial berbeda dari pengamatan lainnya. outlier tidak selalu merupakan
kesalahan meskipun kesalahan data (kesalahan entri) kemungkinan merupakan sumber outlier. Anda
dapat memeriksa penyebaran variabel nominal dan/atau ordinal dengan mendapatkan nilai dan tabel
frekuensi minimum dan maksimum. Ini akan dengan cepat mengungkapkan outlier yang paling jelas.
Untuk data interval dan rasio, alat bantu visual (seperti scatterplot atau boxplot) adalah metode yang
baik untuk memeriksa outlier.
Tanggapan tidak konsisten (inconcsistent response) adalah tanggapan yang tidak selaras dengan
informasi lain. Tanggapan yang tidak selaras ini kemudian dapat diedit oleh peneliti.
Kode ilegal (illegal code) adalah nilai yang tidak ditentukan dalam instruksi pengkodean. Misalnya,
kode "6" dalam pertanyaan 1 (saya berinvestasi lebih banyak dalam pekerjaan saya daripada yang
saya dapatkan) akan menjadi kode ilegal. Cara terbaik untuk memeriksa kode ilegal adalah dengan
membuat komputer menghasilkan distribusi frekuensi dan memeriksanya untuk kode ilegal.
Tidak semua responden menjawab setiap item dalam kuesioner. Kelalaian dapat terjadi karena
responden tidak memahami pertanyaan, tidak mengetahui jawabannya, atau tidak bersedia menjawab
pertanyaan.
Jika sejumlah besar pertanyaan – katakanlah, 25% dari item dalam kuesioner – tidak terjawab,
mungkin ide yang baik untuk membuang kuesioner dan tidak memasukkannya ke dalam kumpulan
data untuk analisis.
Dalam hal ini, penting untuk menyebutkan jumlah tanggapan yang dikembalikan tetapi tidak
digunakan karena data yang hilang berlebihan dalam laporan akhir yang diserahkan kepada sponsor
penelitian. Namun, jika hanya dua atau tiga item yang dibiarkan kosong dalam kuesioner dengan,
katakanlah, 30 item atau lebih, kita perlu memutuskan bagaimana tanggapan kosong ini akan
ditangani.
Salah satu cara untuk menangani respons kosong adalah dengan mengabaikannya saat analisis selesai.
Pendekatan ini dimungkinkan di semua program statistik dan merupakan opsi default di sebagian
besar program. Kerugian dari pendekatan ini adalah, tentu saja, akan mengurangi ukuran sampel,
kadang-kadang bahkan ke ukuran yang tidak sesuai, setiap kali variabel tertentu terlibat dalam
analisis. Selain itu, jika data yang hilang tidak hilang sepenuhnya secara acak, metode ini dapat
membiaskan hasil penelitian Anda. Untuk alasan ini, mengabaikan respons kosong paling cocok
untuk contoh di mana kami telah mengumpulkan sejumlah besar data, jumlah data yang hilang relatif
kecil, dan hubungan yang begitu kuat sehingga tidak terpengaruh oleh data yang hilang (Hair,
Anderson, Tatham & Hitam, 1995).
Solusi alternatif adalah dengan melihat pola respons peserta terhadap pertanyaan lain dan, dari
jawaban ini, menyimpulkan jawaban logis untuk pertanyaan untuk respons yang hilang. Solusi
alternatif kedua adalah dengan menetapkan item nilai rata-rata dari tanggapan semua orang yang telah
menanggapi item tertentu. Sebenarnya, ada banyak cara untuk menangani jawaban kosong (lihat Hair
et al., 1995), masing-masing memiliki kelebihan dan kekurangannya sendiri.
Perhatikan bahwa jika banyak responden menjawab “tidak tahu” untuk item- item tertentu,
penyelidikan lebih lanjut mungkin berguna. Pertanyaannya mungkin tidak jelas atau, karena alasan
tertentu, peserta mungkin enggan atau tidak mampu menjawab pertanyaan.
Transformasi Data
Transformasi data, variasi pengkodean data, adalah proses mengubah representasi numerik asli dari
nilai kuantitatif ke nilai lain. Data biasanya diubah untuk menghindari masalah pada tahap selanjutnya
dari proses analisis data. Jenis lain dari transformasi data adalah reverse scoring.
Transformasi data juga diperlukan ketika beberapa pertanyaan telah digunakan untuk mengukur satu
konsep. Dalam kasus seperti itu, skor pada pertanyaan asli harus digabungkan menjadi skor tunggal
(tetapi hanya setelah kita menetapkan bahwa konsistensi interitem memuaskan). Skor gabungan ini
dimasukkan ke dalam kolom baru di SPSS. Sangat mudah untuk menghitung variabel baru,
menggunakan kotak dialog Compute, yang terbuka ketika ikon Transform dipilih.
MENDAPATKAN DATA
Kita dapat merasakan data dengan memperoleh ringkasan visual atau dengan memeriksa tendensi
sentral dan dispersi variabel. Kita juga bisa mengetahui data kita dengan memeriksa hubungan antara
dua variabel.
Jika respons terhadap setiap item individu dalam skala tidak memiliki penyebaran (rentang) yang baik
dan menunjukkan variabilitas yang sangat kecil, maka peneliti dapat menduga bahwa pertanyaan
tertentu mungkin tidak disusun dengan benar. Bias, jika ada, juga dapat dideteksi jika responden
cenderung memberikan respons yang sama untuk semua item – yaitu, mereka hanya terpaku pada
titik-titik tertentu pada skala. Ingatlah bahwa jika tidak ada variabilitas dalam data, maka tidak ada
varians yang dapat dijelaskan! Dengan demikian, merasakan data merupakan langkah pertama yang
diperlukan dalam semua analisis data. Berdasarkan perasaan awal ini, analisis rinci lebih lanjut dapat
dilakukan untuk menguji kebaikan data.
Frekuensi
Frekuensi hanya mengacu pada berapa kali berbagai subkategori dari fenomena tertentu terjadi, dari
mana persentase dan persentase kumulatif kemunculannya dapat dengan mudah dihitung.
Diagram batang dan diagram lingkaran

Frekuensi juga dapat ditampilkan secara visual sebagai diagram batang, histogram, atau diagram
lingkaran. Diagram batang, histogram, dan diagram lingkaran membantu kita memahami data kita.
Ukuran tendensi sentral dan dispersi

Ada tiga ukuran tendensi sentral: mean, median, dan modus. Ukuran dispersi meliputi rentang, deviasi
standar, varians (di mana ukuran tendensi sentral adalah mean), dan rentang interkuartil (di mana
ukuran tendensi sentral adalah median).
Ukuran tendensi sentral
Mean Mean, atau rata-rata, adalah ukuran tendensi sentral yang menawarkan gambaran umum data
tanpa perlu membanjiri satu dengan masing-masing pengamatan dalam kumpulan data.
Median Median adalah item sentral dalam sekelompok pengamatan ketika mereka disusun dalam
urutan menaik atau menurun.
Modus Dalam beberapa kasus, satu set pengamatan tidak meminjamkan dirinya untuk representasi
yang berarti baik melalui mean atau median, tetapi dapat ditandai dengan fenomena yang paling
sering terjadi.
Ukuran Dispersi
Selain mengetahui bahwa ukuran tendensi sentral adalah mean, median, atau modus (bergantung pada
jenis data yang tersedia), kita juga ingin mengetahui tentang variabilitas yang ada dalam serangkaian
pengamatan. Seperti ukuran tendensi sentral, ukuran dispersi juga unik untuk data nominal dan
interval. Dua set data mungkin memiliki rata-rata yang sama, tetapi dispersinya bisa berbeda.
Tiga pengukuran dispersi yang dihubungkan dengan mean adalah jangkauan, varians, dan standar
deviasi.
Rentang (Range) Rentang (Range) mengacu pada nilai-nilai ekstrim dalam satu set pengamatan.
Varians Varians dihitung dengan mengurangkan mean dari masing-masing pengamatan dalam
kumpulan data, mengambil kuadrat dari perbedaan ini, dan membagi totalnya dengan jumlah
pengamatan.
Standar deviasi Standar deviasi, yang merupakan ukuran lain dari dispersi untuk interval dan data
skala rasio, menawarkan indeks penyebaran distribusi atau variabilitas dalam data. Ini adalah ukuran
dispersi yang sangat umum digunakan, dan hanya merupakan akar kuadrat dari varians.
Rata-rata (mean) dan standart deviasi adalah statistik deskriptif yang paling umum untuk data berskala
interval dan rasio. Standar deviasi, dalam hubungannya dengan mean, adalah alat yang sangat berguna
karena aturan statistik berikut, dalam distribusi normal:
1. Praktis semua pengamatan termasuk dalam tiga standar deviasi dari rata-rata atau rata-rata.
2. Lebih dari 90% pengamatan berada dalam dua standar deviasi dari mean.
3. Lebih dari setengah pengamatan berada dalam satu standar deviasi dari mean.
Ukuran dispersi lainnya

Ketika median adalah ukuran tendensi sentral, persentil, desil, dan kuartil menjadi bermakna. Sama
seperti median membagi total bidang pengamatan menjadi dua bagian yang sama, kuartil membaginya
menjadi empat bagian yang sama, desil menjadi sepuluh, dan persentil menjadi 100 bagian yang
sama. Persentil berguna ketika sejumlah besar data, seperti skor GRE atau GMAT, ditangani.
Ukuran dispersi untuk median, rentang interkuartil (interquartile range), terdiri dari 50% tengah
pengamatan (yaitu, pengamatan tidak termasuk kuartil 25% bawah dan atas). Rentang interkuartil
sangat berguna ketika perbandingan dibuat di antara beberapa kelompok. Perbandingan
berdampingan dari berbagai plot dengan jelas menunjukkan nilai tertinggi, jangkauan, dan penyebaran
untuk setiap wilayah atau kota.
Singkatnya, mean, median, dan modus dapat menjadi ukuran tendensi sentral yang berguna,
tergantung pada jenis data yang tersedia. Demikian juga halnya dengan deviasi standar (dan varians,
yang merupakan kuadrat deviasi standar), dan rentang interkuartil adalah ukuran dispersi yang
berguna. Jelas, tidak ada ukuran dispersi yang terkait dengan mode.
Hubungan Antar Variabel

Dalam proyek penelitian yang mencakup beberapa variabel, selain mengetahui statistik deskriptif
variabel, kita sering ingin mengetahui bagaimana satu variabel terkait dengan variabel lainnya.
Artinya, kami ingin melihat sifat, arah, dan signifikansi hubungan bivariat dari variabel yang
digunakan dalam penelitian (yaitu, hubungan antara dua variabel di antara variabel yang disadap
dalam penelitian).
Tes nonparametrik tersedia untuk menilai hubungan antara variabel yang diukur pada skala nominal
atau ordinal. Korelasi peringkat Spearman dan korelasi peringkat Kendall digunakan untuk menguji
hubungan antara dua variabel ordinal. Matriks korelasi digunakan untuk menguji hubungan antara
variabel interval dan/atau rasio.
Hubungan antara dua variabel nominal: uji ꭓ2 (Chi-Square)

Kadang-kadang kita mungkin ingin tahu apakah ada hubungan antara dua variabel nominal atau
apakah mereka independen satu sama lain. Seperti yang kita ketahui, uji nonparametrik digunakan
ketika normalitas distribusi tidak dapat diasumsikan seperti pada data nominal atau ordinal. Uji ꭓ2
membandingkan frekuensi yang diharapkan (berdasarkan probabilitas) dan frekuensi yang diamati,
dan statistik ꭓ2 diperoleh dengan rumus:
( Oi−Ei )2
ꭓ 2=∑
Ei
Jadi, dalam menguji perbedaan dalam hubungan antara variabel berskala nominal, statistik 2 (chi-
kuadrat) sangat berguna. Hipotesis nol akan ditetapkan untuk menyatakan bahwa tidak ada hubungan
yang signifikan antara dua variabel (warna kulit dan sifat pekerjaan, dalam contoh di atas), dan
hipotesis alternatif akan menyatakan bahwa ada hubungan yang signifikan. Statistik chi-square
dikaitkan dengan degree of freedom (df), yang menunjukkan ada atau tidaknya hubungan yang
signifikan antara dua variabel nominal.
Uji signifikansi ꭓ2 membantu kita untuk melihat apakah dua variabel nominal terkait atau tidak.
Selain uji ꭓ2, uji lain, seperti uji probabilitas eksak Fisher dan uji Cochran Q digunakan untuk
menentukan hubungan antara dua variabel berskala nominal.
Korelasi
Matriks korelasi Pearson akan menunjukkan arah, kekuatan, dan signifikansi hubungan bivariat di
antara semua variabel yang diukur pada tingkat interval atau rasio. Korelasi diperoleh dengan menilai
variasi dalam satu variabel karena variabel lain juga bervariasi. Koefisien korelasi yang menunjukkan
kekuatan dan arah hubungan dapat dihitung dengan menerapkan rumus yang mempertimbangkan dua
set angka.
Sementara korelasi dapat berkisar antara 1.0 dan +1.0, kita perlu mengetahui apakah ada korelasi
yang ditemukan antara dua variabel yang signifikan atau tidak (yaitu, jika hal itu terjadi semata-mata
secara kebetulan atau jika ada kemungkinan besar keberadaan aktualnya). Seperti yang kita ketahui,
signifikansi p= 0,05 adalah tingkat konvensional yang diterima secara umum dalam penelitian ilmu
sosial. Hal ini menunjukkan bahwa 95 kali dari 100, kita dapat yakin bahwa ada korelasi yang benar
atau signifikan antara kedua variabel, dan hanya ada kemungkinan 5% bahwa hubungan tersebut tidak
benar-benar ada.
Koefisien korelasi Pearson sesuai untuk variabel skala interval dan rasio, dan koefisien Rank
Spearman atau Kendall's tau sesuai untuk variabel diukur pada skala ordinal. Korelasi bivariat apa
pun dapat diperoleh dengan mengklik menu yang relevan, mengidentifikasi variabel, dan mencari
statistik parametrik atau nonparametrik yang sesuai.

Chapter 14 Only

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Chapter 14 Only

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS DATA KUANTITATIF - BAB 14

MENYIAPKAN DATA UNTUK ANALISIS

Pengkodean Dan Entri Data

Diagram batang dan diagram lingkaran

Ukuran tendensi sentral dan dispersi

Ukuran tendensi sentral

Ukuran dispersi lainnya

Hubungan Antar Variabel

Hubungan antara dua variabel nominal: uji ꭓ2 (Chi-Square)

Anda mungkin juga menyukai