DOSEN PENGAMPU
Raudhatul Hidayah, Dr.,SE,ME,Ak,CA
KELOMPOK 2
DEPARTEMEN AKUNTANSI
FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS ANDALAS
2023
Daftar Isi
BAB I PEMBAHASAN 1
Collect, Prepare, and Examine Data 3
Collect Data 3
Prepare The Data 6
Edit The Data 9
Examine The Data 13
Cross tabulation 16
BAB II PENUTUP 18
KESIMPULAN 18
REFERENSI 19
BAB I Pembahasan
Collect, Prepare, and Examine Data
e) Aktifkan Survei
Peneliti harus menentukan kapan instrumen siap diluncurkan. Aktivasi survei
merupakan keputusan yang meluncurkan survei; hal ini menunjukkan bahwa peneliti
telah mengatasi semua masalah instrumen pengukuran yang diketahui, dan prosesnya
bebas dari kesalahan semaksimal mungkin.
f) Mengingatkan Peserta
Pesertanya adalah orang-orang sibuk. Mereka mempunyai kehidupan, dan
berpartisipasi dalam penelitian bukanlah prioritas utama bagi sebagian besar dari
mereka. Menyadari hal ini, seorang peneliti dapat secara dramatis meningkatkan
tingkat respons penelitian dengan mengingatkan peserta jika instrumen pengukuran
tidak diserahkan atau dikembalikan. Pengingat sering kali menggunakan email atau
kontak telepon. Beberapa pengingat dapat dilakukan, bergantung pada sifat sampel
probabilitas yang digunakan peneliti.
g) Masukkan Datanya
Entri data adalah serangkaian proses yang mencakup pengkodean (sebagian dilakukan
sebelum pengumpulan data ketika pertanyaan tertutup digunakan dan sebagian lagi
dilakukan setelah pengumpulan data) dan pembuatan file data. Tanpa entri data,
peneliti tidak mempunyai apa pun untuk dianalisis. Ini adalah langkah terakhir yang
penting dalam pengumpulan data dan sebelum persiapan data.
Proses pengumpulan data menjadi sangat penting sebab dalam sebuah penelitian dibutuhkan
data-data yang valid sehingga dapat menghasilkan sebuah kesimpulan yang valid pula. Nah,
sebelum mengumpulkan data, biasanya peneliti memiliki sebuah hipotesis. Hipotesis itu
sendiri adalah sebuah dugaan kesimpulan sementara tentang suatu hal yang akan diteliti.
Nantinya, hipotesis inilah yang akan dibuktikan oleh si peneliti sendiri secara empiris dalam
penelitian yang dilakukannya.
Agar bisa membuktikan benar atau tidaknya hipotesis dari peneliti tersebut, maka sangat
pengumpulan data dengan menggunakan cara yang tepat dan benar. Salah satu proses
pengumpulan data yang umum dilakukan menurut Nan Lin ada 8 tahap yang perlu dilalui,
diantaranya:
1. Tinjau literatur dan konsultasi dengan ahli
Pengumpulan data biasanya diawali dengan mengumpulkan informasi yang
berhubungan dengan masalah penelitian. Informasi-informasi tersebut dapat diperoleh
melalui peninjau literatur yang relevan dan konsultasi dengan para ahli.
Melalui usaha-usaha ini peneliti berusaha memahami benar-benar isu penelitian,
konsep, dan variable-variabel yang dipergunakan oleh peneliti lain dalam mempelajari
hal yang serupa di masa lalu, dan hipotesis-hipotesis yang pernah diteliti pada waktu
lalu. Perlu juga dipahami ciri-ciri orang yang menjadi responden kita dalam
penelitian.
2. Data Integration
Salah satu langkah dalam data preprocessing yang terdiri atas proses penyatuan
berbagai sumber data menjadi satu dataset
3. Data Reduction
Proses pengurangan volume atau kuantitas data dengan hanya menyimpan data yang
penting saja.
Tujuan dari data reduction adalah untuk meningkatkan efisiensi analisis data dan
menghindari overfitting.
Berikut adalah beberapa teknik yang umum digunakan untuk data reduction:
Dimensionality reduction: pengurangan variabel atau atribut random dengan cara
menyatukan data dengan karakteristik yang serupa atau berkorelasi dengan satu sama
lain
Numerosity reduction: penggantian data asli dengan representasi data yang lebih kecil
atau lebih sempit, representasi data dapat ditentukan dengan model regresi atau
clustering
Data compression: mengemas data dengan cara melakukan kompresi agar size-nya
jadi lebih kecil untuk tujuan penyimpanan atau data transmission
4. Data Transformation
Salah satu langkah dalam data preprocessing untuk mengkonversi atau
menyeragamkan data dari satu format ke format lain agar bisa dibaca oleh sistem
komputasi
Dengan desain survei yang terkomputerisasi dan pengumpulan data dengan bantuan
komputer, dikelola komputer, atau online, pengkodean awal diperlukan karena perangkat
lunak menghitung data saat data dikumpulkan. Setelah data dikumpulkan dan kami
memahami pembagian setiap bidang data ke dalam berbagai kategori berdasarkan kode, kami
dapat memutuskan bahwa aturan pemetaan asli tidak seberharga prediksi rencana analisis
awal. Pengodean ulang variabel melibatkan pengembangan aturan pemetaan baru dan
penetapan kode baru berdasarkan penggabungan kategori variabel awal. Pengodean ulang
selama pemeriksaan data berguna ketika mencoba memahami pola di dalam data.
Kebanyakan jawaban DK ada dua jenis. Pertama, adanya respon sah DK saat menjadi peserta
tidak tahu jawabannya. Masuk akal untuk mengharapkan bahwa beberapa tanggapan DK
yang sah mungkin akan dibuat untuk pertanyaan apa pun dengan tepat termasuk opsi respons
DK. Sebagai seorang peneliti, tanggapan ini mungkin saja terjadi memenuhi tujuan penelitian
kami; kami mengharapkan tanggapan DK dan menganggapnya bermanfaat. Ini seharusnya
diperiksa seperti halnya respons lainnya. Namun pada tipe kedua, balasan DK
menggambarkan hal tersebut kegagalan peneliti untuk mendapatkan informasi yang sesuai
dengan pertanyaan pengukuran. Pertanyaan-pertanyaan seperti itu akan menimbulkan kedua
jenis tanggapan DK dan dengan demikian akan membiaskan data; pengeditan kemungkinan
besar akan mengecualikan semuanya
Tanggapan DK dari analisis situasi selanjutnya.
Data Hilang
Data yang hilang adalah data dari partisipan yang tidak tersedia untuk satu atau lebih variabel
yang diminati. Di dalam survei, data yang hilang biasanya terjadi ketika peserta secara
sengaja atau tidak sengaja melewatkan, menolak menjawab, atau tidak mengetahui jawaban
pertanyaan pengukuran dan enggan menebak. Data juga hilang terjadi karena kesalahan
peneliti, perangkat lunak atau peralatan tidak berfungsi, file data rusak, dan perubahan dalam
penelitian atau desain instrumen setelah data dikumpulkan dari beberapa partisipan, seperti
ketika variabel dihilangkan atau ditambahkan. Dalam studi longitudinal, data yang hilang
mungkin disebabkan oleh keluarnya peserta keluar dari penelitian atau tidak hadir selama
satu atau lebih periode pengumpulan data.
Strategi penanganan data yang hilang terdiri dari proses dua langkah: (1) peneliti terlebih
dahulu melakukan eksplorasi pola data yang hilang untuk menentukan probabilitas bahwa
suatu nilai hilang daripada yang diamati, kemudian (2) peneliti memilih teknik koreksi data
yang hilang.
Misalnya saja dalam survei tentang pelatihan preferensi, asumsikan pengeditan menemukan
bahwa laki-laki bertanggung jawab atas lebih banyak data yang hilang pada suatu variabel
menilai acara pelatihan dibandingkan perempuan. Bagaimana cara penyuntingan mengatasi
masalah ini? Pertama, peneliti akan mengeksplorasi yang mana dari tiga jenis data yang
hilang yang diwakili :
• Data hilang sepenuhnya secara acak (MCAR)—kemungkinan besar hilangnya
data tertentu variabel TIDAK bergantung pada variabel itu sendiri dan TIDAK
bergantung pada variabel lain di dalamnya catatan data (misalnya, peserta
secara tidak sengaja melewatkan pertanyaan).
• Data hilang secara acak (MAR)—kemungkinan besar hilangnya data untuk
variabel tertentu TIDAK bergantung pada variabel itu sendiri tetapi
bergantung pada variabel lain dalam catatan data (misalnya, jawaban terhadap
pertanyaan pertama dari kumpulan pertanyaan bercabang mungkin
menyebabkan hilangnya data pertanyaan kedua dalam kumpulan pertanyaan
bercabang).
• Data hilang tetapi tidak hilang secara acak (NMAR)—kemungkinan besar
hilangnya data tertentu variabel bergantung pada variabel itu sendiri dan
TIDAK bergantung pada variabel lain dalam variabel tersebut catatan data
(misalnya, peserta menganggap pertanyaan tidak dapat dijawab atau terlalu
sensitif dan melewatkan pertanyaan).
Dalam contoh kita, MAR tidak berlaku karena tidak ada percabangan, melainkan MCAR atau
NMAR mungkin. Jika datanya adalah NMAR, maka peserta menyatakan pilihan “tidak ada
preferensi” yang bukan NMAR disediakan dengan melewatkan pertanyaan. Ini adalah
respons yang layak untuk menunjukkan “tidak ada preferensi” dan data tersebut harus
diperhitungkan dalam analisis sebagai kategori data terpisah pada variabel tersebut.
Pengeditan akan memberikan kode untuk “tidak ada preferensi.”
Tiga teknik digunakan untuk menyelamatkan catatan data dengan data yang hilang:
• Penghapusan secara listwise—kasus apa pun yang datanya hilang pada satu
variabel akan dihapus dari sampel untuk semua variabel analisis variabel
tersebut (opsi default di sebagian besar paket statistik seperti SPSS atau SAS);
tidak ada bias jika MAR atau MCAR karena hanya catatan data lengkap yang
digunakan untuk suatu variabel. Dalam contoh kita,pria yang melewatkan
pertanyaan akan dikecualikan. Namun, jika kita mengecualikan pria yang
melewatkannya pertanyaan dan data adalah NMAR, bukan MCAR,
menghapus laki-laki dari sampel yang bias dalam analisis apa pun preferensi
pelatihan terhadap preferensi pelatihan perempuan. Pria sengaja melewatkan
pertanyaan itu (NMAR) menyatakan “tidak ada preferensi” terhadap pelatihan,
data yang ingin kami tangkap.
Tepat Validasi data merupakan proses yang berupaya memverifikasi protokol penelitian
untuk menghindari kesalahan data diikuti dan data tersebut nyata dengan mengidentifikasi
data palsu atau tidak akurat. Pola respons yang khas dalam pertanyaan tertutup akan sering
muncul jika terjadi pemalsuan data. Untuk mengungkap hal ini, pengeditan harus dilakukan
menganalisis—sebagai satu set—instrumen yang digunakan oleh setiap pewawancara. Jika
ada dugaan kesalahan atau bias pewawancara,validasi mungkin memerlukan wawancara
ulang terhadap beberapa persentase peserta, setidaknya pada beberapa pertanyaan. Banyak
perusahaan riset akan menghubungi kembali sekitar 10 persen peserta dalam proses validasi
data. Wawancara telepon dan pribadi memfasilitasi validasi data jenis ini. Komputer yang
dikelola sendiri instrumen dapat diperiksa alamat IP dan waktu penyelesaiannya; alamat
duplikat dan ketat waktu yang berurutan membuat tanggapan terhadap instrumen tersebut
mencurigakan. Dalam instrumen kertas dan pensil,validasi mencari tulisan tangan yang
serupa sebagai indikator, lalu memeriksa apakah pola responsnya serupa-serupa pada
instrumen yang dicurigai.Entri data juga dapat menyebabkan ketidakakuratan. Terkadang
peserta bertanggung jawab atas kesalahannya, dan memang demikian jelas bahwa suatu entri
salah—misalnya, suatu instrumen meminta data rasio dalam beberapa minggu (misalnya,
perkiraan angka 4 atau kurang), namun peserta merespons pada skala lain (misalnya, 13).
Atau mereka mungkin merespons dengan dua jawaban terhadap pertanyaan yang meminta
satu jawaban.
Pengeditan harus menentukan tanggapan mana yang konsisten dengan maksud pertanyaan
atau informasi lain pada instrumen dan paling akurat untuk masing-masing peserta. Jika tidak
yakin, edit mengganti jawaban tersebut dengan kode editor untuk “tidak ada jawaban” atau
“tidak diketahui.”
Seorang peneliti mungkin memasukkan data di lokasi yang salah pada catatan data atau
memasukkan respons yang salah.Dalam skenario ini, pengeditan berupaya mendeteksi
(diungkapkan oleh kasus yang hilang atau kode variabel di luar jangkauan) dan ganti jawaban
yang benar dengan meninjau instrumen pengukuran asli atau informasi lain di dalamnya
Himpunan data. Inilah sebabnya mengapa pengkodean nomor kasus pada instrumen
pengukuran sangatlah berharga; lebih mudah untuk menemukannya instrumen yang sesuai.
Peneliti juga dapat menghubungi kembali partisipan untuk mendapatkan informasi yang
benar jika waktu dan anggaran memungkinkan.
Kode yang Sesuai
Rencana analisis awal kami memerlukan studi variabel—seringkali dalam bentuk
perbandingan atau tabulasi silang dengan variabel lain. Saat kami mempelajari pengukuran,
kami mendiskusikan pengembangan aturan pemetaan yang akan dibuat kategori dalam
variabel dan menggunakan aturan ini untuk memberikan nomor pada jawaban peserta
[misalnya, jika variabelnya adalah jenis kelamin, partisinya adalah laki-laki (1) dan
perempuan (2)]. Kategori dinilai sesuai jika memenuhi dua kriteria: (1) partisi data terbaik
untuk menguji hipotesis dan menunjukkan hubungan dan (2) ketersediaan data pembanding.
Kode awal ini diasumsikan sebagai kode yang akan kita gunakan selama analisis. Pertanyaan
tertutup, biasanya sudah dikodekan sebelumnya sebagai bagian dari desain instrumen,
mengikuti prinsip-prinsip berikut: kategori harus saling eksklusif, lengkap, dan terfokus pada
satu dimensi.
Cross Tabulation
Ketika kita tertarik untuk menentukan bagaimana dua atau lebih variabel kategorikal terkait
dalam suatu studi, cross tabulation adalah salah satu pendekatan awal yang perlu
dipertimbangkan. Dalam cross tabulation, kita membuat tabel yang mirip dengan
DISTRIBUSI FREKUENSI untuk mempelajari lebih lanjut tentang distribusi frekuensi,
tetapi di sini, kita menggabungkan jumlah dari nilai-nilai berbeda dari dua atau lebih variabel.
Dengan kata lain, tabel cross tabulation adalah cara untuk menyajikan distribusi frekuensi
dari dua atau lebih variabel secara bersamaan. Nilai-nilai berbeda dari variabel-variabel
tersebut dianggap sebagai kategori, dan mereka diklasifikasikan bersama satu sama lain
(Malhotra, 2007). Tabel cross tabulation juga dikenal sebagai tabel kontingensi. Meskipun
tabel cross tabulation dapat dibuat untuk sebarang jumlah variabel, tabel yang paling berguna
untuk tujuan manajerial biasanya dibentuk dengan dua atau tiga variabel.
Tabel 1 mengilustrasikan contoh cross tabulation dua variabel, yang juga dikenal sebagai
cross tabulation bivariat. Dalam contoh ini, mahasiswa dari kelas riset pasar tingkat sarjana
ditanyai tentang ketertarikan terhadap lemonade berwarna pink. Tanggapan mereka bersama
dengan identifikasi gender mereka ditampilkan dalam Tabel 1. Karena dua variabel 'suka
lemonade berwarna pink' dan 'gender' diklasifikasikan silang, kita juga dapat menghitung
persentase baris dan kolom untuk masing-masing nilai. Dari sudut pandang manajer, cross
tabulation bivariat seperti ini memberikan informasi tentang (i) bagaimana nilai dari dua
variabel terkait, (ii) cross-classification mana yang paling banyak dipilih oleh responden, dan
(iii) bagaimana cross-classifications ini berbeda satu sama lain. Dari contoh yang ditunjukkan
dalam Tabel 1, kita menemukan bahwa responden perempuan lebih suka lemonade berwarna
pink dibandingkan dengan responden laki-laki. Lebih tepatnya, 85,71% (= 30/35) dari
responden perempuan menyukai lemonade berwarna pink dibandingkan dengan 68,57% dari
responden laki-laki.
Ketika cross tabulation bivariat memerlukan klarifikasi lebih lanjut, variabel ketiga, yang
biasanya merupakan kategorisasi dari salah satu dari dua variabel, dipertimbangkan.
Melanjutkan dengan contoh di atas, mari masukkan variabel lain, 'kelompok usia gender,' ke
dalam cross tabulation untuk menjelaskan lebih lanjut hubungan antara responden pria dan
wanita. Tabel cross tabulation tiga variabel yang dihasilkan (Tabel 2) memberikan
pemahaman yang lebih besar.
BAB II
Penutup
Kesimpulan
Tahap-Tahap dalam dalam suatu penelitian data diperlukan beberapa tahap
1. Pengumpulan data merupakan langkah pertama dalam proses penelitian. Ada berbagai metode
pengumpulan data yang dapat digunakan, tergantung pada jenis penelitian yang dilakukan.
Beberapa metode pengumpulan data yang umum digunakan adalah:
Survei: Kuesioner atau wawancara dapat digunakan untuk mengumpulkan data dari
sekelompok orang.
Observasi: Peneliti mengamati dan mencatat perilaku orang atau kejadian.
Eksperimen: Peneliti memanipulasi variabel independen untuk mengamati pengaruhnya
terhadap variabel dependen.
2. Setelah data dikumpulkan, perlu disiapkan sebelum dapat dianalisis. Persiapan data meliputi:
Pembersihan data: Data dibersihkan dari kesalahan dan inkonsistensi.
Pengodean data: Data diberi kode untuk memudahkan analisis.
Transformasi data: Data diubah bentuknya untuk memudahkan analisis.
3. Pengeditan data merupakan proses memeriksa dan memperbaiki kesalahan dalam data.
Pengeditan data dapat dilakukan secara manual atau menggunakan perangkat lunak komputer.
4. Pemeriksaan data merupakan proses memeriksa keandalan dan validitas data. Pemeriksaan data
dapat dilakukan dengan cara:
Membandingkan data dengan sumber lain
Menghitung statistik deskriptif
Memeriksa pola dalam data
Referensi
Malhotra, N.K. (2007) Marketing Research: An Applied Orientation, 5th edn, Pearson Education,
Inc., Upper Saddle River.