Anda di halaman 1dari 19

METODOLOGI PENELITIAN

DOSEN PENGAMPU
Raudhatul Hidayah, Dr.,SE,ME,Ak,CA

KELOMPOK 2

Aafiyah Dwi Syahfitri (2110533053)


Aksan Maulana (2110533017)
Ana Suryani (2110531054)
Azzahra Primadenis (2110537001)
Adinda Puty Bungsu (2110533014)
Alisha Shafira (2110533016)
Clara Chintya (2110533018)
Mei Bagus Ivan Toro (2110531047)
Miranda Sisilia (2110532019)
Nadillah Rahmadani (2110533022)
Rania Rama (2110533052)
Rachel Orvala (2110533051)
Rahman Syarif Masri (2010533012)
Ruri Khaira (2110532021)
Widyasti Mewinda (2110532023)

DEPARTEMEN AKUNTANSI
FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS ANDALAS
2023
Daftar Isi
BAB I PEMBAHASAN 1
Collect, Prepare, and Examine Data 3
Collect Data 3
Prepare The Data 6
Edit The Data 9
Examine The Data 13
Cross tabulation 16

BAB II PENUTUP 18
KESIMPULAN 18
REFERENSI 19
BAB I Pembahasan
Collect, Prepare, and Examine Data

Collect Data (Kumpulkan Datanya)


Pengumpulan data melibatkan tindakan kolektif yang menggunakan instrumen pengukuran.
Termasuk tugas-tugas berikut:
a) Latih Pengumpul Data
Pelatihan merupakan langkah penting jika instrumen pengukurannya rumit atau
pewawancara mempunyai kebebasan dalam memilih peserta. Mengetahui cara
mengikuti petunjuk lewati dan petunjuk lainnya sangat penting untuk kualitas data.
Meskipun wawancara dengan bantuan komputer memberikan pertanyaan kepada
pewawancara, mereka perlu mengetahui keseluruhan instrumen dan di mana
kemungkinan letak kendalanya. Pewawancara juga dilatih dalam mendekati calon
peserta dan meminimalkan bias, termasuk penekanan kata, ekspresi wajah,
penggunaan alat bantu respons, dll. Memastikan pewawancara mengetahui cara
menyerahkan instrumen pengukuran yang telah diisi biasanya juga merupakan bagian
dari pelatihan.

b) Tentukan Timeline Pengumpulan Data


Meskipun studi penelitian Anda memiliki jangka waktunya, pengumpulan data Anda
yang sebenarnya memerlukan jangka waktunya sendiri. Minimal, hal ini perlu
menyertakan tanggal dan waktu aktivasi survei (waktu mulai dan berhenti), kapan
entri data dimulai dan diharapkan selesai, kapan pengeditan data dimulai dan selesai,
dan kapan file data bersih sudah siap. Hal ini juga dapat mencakup tanggal dan waktu
pelatihan pengumpul data ketika pewawancara telepon dan pribadi digunakan.

c) Menentukan dan Melaksanakan Disposisi Instrumen


Instrumen pengukuran yang sudah lengkap nilainya hanya sedikit jika tidak
dikembalikan. Disposisi instrumen mengacu pada prosedur dimana instrumen yang
telah selesai dikembalikan kepada peneliti. Beberapa instrumen kertas dan pensil
dikirimkan melalui pos, yang lain dimasukkan ke dalam kotak drop, dikirim melalui
email, atau diunggah. Masing-masing metode ini memerlukan pengaturan sebelumnya
mendapatkan dan menempatkan kotak drop, menyiapkan akun email khusus atau
kotak pos, dan menentukan lokasi pengunggahan di cloud. Metode-metode ini juga
memerlukan arahan, yang dapat disertakan bersama instrumen atau diberikan secara
terpisah. Jika kasus sampel telah direkrut terlebih dahulu untuk
survei, peneliti mungkin mengirimkan arahan untuk melengkapi dan mengumpulkan
instrumen sebelum survei dimulai.
Survei berbasis komputer tetap memerlukan proses pengajuan, meskipun jika
menggunakan perangkat lunak survei, proses ini sudah tertanam di dalam instrumen.
Ini mungkin sesederhana menambahkan baris ke kesimpulan instrumen Anda:
“Silakan klik tombol SELESAI untuk mengirimkan jawaban Anda kepada kami.” Jika
kegiatan selain instrumen pengukuran disertakan, seperti elemen video atau foto yang
disiapkan oleh peserta, maka perlu diunggah.

d) Undang Peserta Terpilih


Undangan ini penting untuk mendapatkan kerja sama dan merupakan langkah pertama
dalam membangun hubungan baik dengan peserta. Terlepas dari cara survei
dilakukan, peserta dapat diundang melalui telepon, email, atau surat. Peserta juga
dapat disaring sebagai bagian dari proses undangan ini. Mempersiapkan pertanyaan
layar dan menyiapkan naskah undangan, email, atau surat adalah bagian dari
pengumpulan data proses. Sekalipun sebuah perusahaan disewa untuk merekrut
sampel, peneliti tetap ingin ada pendapat mengenai apa yang diberitahukan kepada
partisipan, kompensasi apa yang ditawarkan, dan sebagainya. Untuk studi intersep,
pendekatan undangan adalah bagian dari pelatihan pewawancara.

e) Aktifkan Survei
Peneliti harus menentukan kapan instrumen siap diluncurkan. Aktivasi survei
merupakan keputusan yang meluncurkan survei; hal ini menunjukkan bahwa peneliti
telah mengatasi semua masalah instrumen pengukuran yang diketahui, dan prosesnya
bebas dari kesalahan semaksimal mungkin.

f) Mengingatkan Peserta
Pesertanya adalah orang-orang sibuk. Mereka mempunyai kehidupan, dan
berpartisipasi dalam penelitian bukanlah prioritas utama bagi sebagian besar dari
mereka. Menyadari hal ini, seorang peneliti dapat secara dramatis meningkatkan
tingkat respons penelitian dengan mengingatkan peserta jika instrumen pengukuran
tidak diserahkan atau dikembalikan. Pengingat sering kali menggunakan email atau
kontak telepon. Beberapa pengingat dapat dilakukan, bergantung pada sifat sampel
probabilitas yang digunakan peneliti.

g) Masukkan Datanya
Entri data adalah serangkaian proses yang mencakup pengkodean (sebagian dilakukan
sebelum pengumpulan data ketika pertanyaan tertutup digunakan dan sebagian lagi
dilakukan setelah pengumpulan data) dan pembuatan file data. Tanpa entri data,
peneliti tidak mempunyai apa pun untuk dianalisis. Ini adalah langkah terakhir yang
penting dalam pengumpulan data dan sebelum persiapan data.
Proses pengumpulan data menjadi sangat penting sebab dalam sebuah penelitian dibutuhkan
data-data yang valid sehingga dapat menghasilkan sebuah kesimpulan yang valid pula. Nah,
sebelum mengumpulkan data, biasanya peneliti memiliki sebuah hipotesis. Hipotesis itu
sendiri adalah sebuah dugaan kesimpulan sementara tentang suatu hal yang akan diteliti.
Nantinya, hipotesis inilah yang akan dibuktikan oleh si peneliti sendiri secara empiris dalam
penelitian yang dilakukannya.
Agar bisa membuktikan benar atau tidaknya hipotesis dari peneliti tersebut, maka sangat
pengumpulan data dengan menggunakan cara yang tepat dan benar. Salah satu proses
pengumpulan data yang umum dilakukan menurut Nan Lin ada 8 tahap yang perlu dilalui,
diantaranya:
1. Tinjau literatur dan konsultasi dengan ahli
Pengumpulan data biasanya diawali dengan mengumpulkan informasi yang
berhubungan dengan masalah penelitian. Informasi-informasi tersebut dapat diperoleh
melalui peninjau literatur yang relevan dan konsultasi dengan para ahli.
Melalui usaha-usaha ini peneliti berusaha memahami benar-benar isu penelitian,
konsep, dan variable-variabel yang dipergunakan oleh peneliti lain dalam mempelajari
hal yang serupa di masa lalu, dan hipotesis-hipotesis yang pernah diteliti pada waktu
lalu. Perlu juga dipahami ciri-ciri orang yang menjadi responden kita dalam
penelitian.

2. Mempelajari dan melakukan pendekatan terhadap kelompok masyarakat dimana data


akan dikumpulkan
Maksudnya di sini adalah peneliti yang bersangkutan dapat diterima di dalam
kelompok masyarakat itu dan memahami berbagai kebiasaan yang berlaku di
dalamnya. Untuk itu perlu dikaitkan terhadap tokoh-tokoh yang bersangkutan.

3. Membina dan memanfaatkan hubungan yang baik dengan responden dan


lingkungannya
Maksud di sini adalah peneliti perlu mempelajari kebiasaan-kebiasaan respondennya
termasuk bagaimana cara mereka berpikir, cara mereka melakukan sesuatu, Bahasa
yang biasa digunakan, waktu luang mereka, dan sebagainya.

4. Uji coba atau pilot study


Proses pengumpulan data dapat didahului dengan uji coba instrumen penelitian pada
kelompok masyarakat yang merupakan bagian dari populasi yang bukan sampel.
Maksud dari uji coba ini untuk mengetahui apakah instrumen tersebut cukup handal
atau tidak , komunikatif, dapat dipahami, dan sebagainya.

5. Merumuskan dan Menyusun pertanyaan


Setelah hasil uji coba itu dipelajari, di susunlah instrumen penelitian dalam bentuknya
yang terakhir berupa pertanyaan-pertanyaan yang relevan dengan tujuan penelitian.
Pertanyaan itu harus dirumuskan sedemikian rupa sehingga ia mengandung makna
yang signifikan dan substantif.

6. Mencatat dan memberi kode (recording and coding)


Melalui instrumen penelitian yang telah dipersiapkan, dilakukan pencatatan terhadap
data yang dibutuhkan dari setiap responden. Informasi-informasi yang diperoleh dari
pencatatan ini diberi kode guna memudahkan proses analisis.

7. Cross checking, validitas, dan reliabilitas


Pada proses pengumpulan data tahap ini terdiri atas cross checking terhadap data yang
masih diragukan kebenarannya, serta memeriksa validitas dan reliabilitasnya.
8. Pengorganisasian dan kode ulang data yang telah terkumpul supaya dapat dianalisis.
Setelah data terkumpul, saatnya mengkoordinasikan data-data yang telah terkumpul.
Jika sudah, maka kamu dapat mulai menganalisis data-data tersebut. Pastikan tidak
ada data yang kurang valid

Enter The Data.


Entri data adalah mengubah data yang dikumpulkan dengan metode sekunder atau primer
menjadi media untuk melihat dan memanipulasi data. Setelah data untuk studi tertentu
dimasukkan, file data akan dibuat. Berbagai program perangkat lunak memungkinkan
pengguna untuk menentukan bidang data dan menghubungkan file sehingga penyimpanan,
pengambilan, dan pembaruan menjadi disederhanakan. Penting untuk entri data yang akurat,
serta persiapan data dan analisis data, adalah skema pengkodean. Skema pengkodean (buku
kode), berisi setiap variabel dalam penelitian dan menentukan penerapannya aturan pemetaan
ke kode respons setiap variabel. Pengujian awal suatu instrumen memberikan informasi yang
cukup tentang variabel untuk menguji skema pengkodean. Skema awal yang digunakan
dengan data pretesting dapat mengungkap masalah pengkodean yang perlu diperbaiki
sebelum data untuk studi akhir dikumpulkan dan diproses.
Keyboarding tetap menjadi andalan para peneliti yang perlu segera membuat database
dan menyimpannya dalam ruang minimal di berbagai media. Ini bisa menjadi proses yang
lambat dan menuntut untuk memasukkan ratusan variabel untuk setiap ribuan instrumen dan
melakukannya dengan benar. Namun, para peneliti mendapatkan manfaat dari cara-cara yang
lebih efisien yang tidak hanya mempercepat proses pemasukan data, namun juga
meningkatkan keakuratannya: memasukkan data secara partisipan melalui survei online atau
seluler; barcode, karakter optik dan pengenalan tanda untuk survei kertas; pengenalan suara
untuk survei telepon; dan penggunaan tablet elektronik oleh pewawancara intersepsi.
Program basis data, termasuk spreadsheet dan paket analisis statistik, berfungsi sebagai
perangkat entri data yang berharga,
Tanggung Jawab dan Tugas Data Entry
Dalam menjalankan tugasnya, seorang data entry tidak hanya menginput data saja, ada tugas
lainnya yang mesti dikerjakan, diantaranya:
 Mempersiapkan dan menyortir dokumen sebelum data dimasukkan ke dalam
komputer.
 Menginput data ke dalam database milik perusahaan.
 Memeriksa dan memastikan keakuratan data yang sudah diinput ke dalam database.
 Melakukan penyesuaian informasi dan data yang tidak lengkap.
 Membuat backup data yang menjadi bagian dari rencana kontingensi.
 Menanggapi permintaan informasi dari anggota yang berwenang.
 Menguji sistem database baru dan pembaruan dari perangkat lunak.
 Mengelola dokumen dan catatan yang dimiliki perusahaan dengan baik.
 Menyiapkan laporan yang relevan sesuai dengan kebutuhan divisi terkait.
 Menerima dan memproses invoice untuk pembayaran dan memperbarui rincian
invoice.
Selain dari tugas yang disebutkan di atas, seorang data entry juga memiliki tanggung jawab
lainnya sesuai dengan kebijakan perusahaan.
Langkah-langkah tugas dalam prepare terdiri atas empat tugas utama, yakni:
1. Data Cleaning
Data cleaning adalah proses pembersihan dataset yang mencakup penghapusan data
yang salah, tidak lengkap, tidak akurat, dll.
Tujuan dari data cleaning adalah menyediakan sampel yang lengkap dan akurat untuk
diproses lebih lanjut dalam data mining.
Teknik yang digunakan dalam data cleaning biasanya bervariasi tergantung dari
kebutuhan data scientist yang bertanggung jawab.

2. Data Integration
Salah satu langkah dalam data preprocessing yang terdiri atas proses penyatuan
berbagai sumber data menjadi satu dataset

3. Data Reduction
Proses pengurangan volume atau kuantitas data dengan hanya menyimpan data yang
penting saja.
Tujuan dari data reduction adalah untuk meningkatkan efisiensi analisis data dan
menghindari overfitting.
Berikut adalah beberapa teknik yang umum digunakan untuk data reduction:
 Dimensionality reduction: pengurangan variabel atau atribut random dengan cara
menyatukan data dengan karakteristik yang serupa atau berkorelasi dengan satu sama
lain
 Numerosity reduction: penggantian data asli dengan representasi data yang lebih kecil
atau lebih sempit, representasi data dapat ditentukan dengan model regresi atau
clustering
 Data compression: mengemas data dengan cara melakukan kompresi agar size-nya
jadi lebih kecil untuk tujuan penyimpanan atau data transmission

4. Data Transformation
Salah satu langkah dalam data preprocessing untuk mengkonversi atau
menyeragamkan data dari satu format ke format lain agar bisa dibaca oleh sistem
komputasi

Prepare The Data


Persiapan data mencakup dua tugas: pengkodean data pasca-pengumpulan dan pengeditan
data. Keputusan yang diambil peneliti pada setiap fase dapat memastikan keakuratan data dan
konversinya dari bentuk mentah ke bentuk olahan yang lebih sesuai untuk dianalisis.
Mempersiapkan ringkasan statistik deskriptif dari data yang dikumpulkan untuk setiap
variabel adalah alat yang digunakan untuk menilai skema pengkodean untuk kesalahan
pengkodean dan mengidentifikasi kesalahan entri data.
a) Postcollection Coding of Data
1. Coding Textual and Verbal Responses
Content analysis sebagai metodologi yang menggunakan pendekatan sistematis dan obyektif
terhadap kode karakteristik pesan sehingga peneliti dapat memperlakukan beragam konten
tekstual atau verbal secara kuantitatif saat mereka mencari pola dan menarik kesimpulan.
Analisis isi dapat digunakan untuk menganalisis data tertulis, audio, atau video dari
eksperimen, observasi, survei, dan studi data kalimat, paragraf, dan sebagainya). Unit
rekaman adalah ide-ide yang tertanam dalam konten. Jadi “Sam Smith adalah pemain hebat
dengan potensi manajemen yang signifikan” akan mengungkapkan dua unit rekaman
“kinerja” dan “potensi manajemensekunder. Data tekstual yang akan dianalisis isinya
meliputi transkrip wawancara dan tanggapan survei terbuka. Namun peneliti juga
menggunakan analisis
konten pada evaluasi karyawan, laporan tahunan, laporan analis keuangan, iklan, brosur
promosi, siaran pers, pidato, halaman web, postingan media sosial, dokumen sejarah, dan
prosiding konferensi, serta artikel majalah dan surat kabar.
Pengkodean untuk analisis isi dimulai dengan menentukan unit data mana yang akan
dianalisis. Seorang peneliti menyarankan agar tiga jenis unit data dapat dipilih: konteks,
pengambilan sampel, atau rekaman. Unit Konteks mengacu pada tujuan penelitian (jika Anda
mempelajari kinerja karyawan, maka unitnya mungkin merupakan uraian tertulis tentang
kinerja dalam formulir evaluasi resmi).Unit pengambilan sampel adalah elemen teks apa yang
akan dikodekan peneliti (kata, frasa, .”
Unit rekaman dapat bersifat syntactical, referential, propositional, atau thematic. Masing-
masing jenis merupakan dasar untuk mengkodekan teks ke dalam kategori-kategori yang
saling eksklusif dalam pencarian makna oleh peneliti.
· Syntactical units adalah kata, frasa, kalimat, atau paragraf spesifik yang
ditentukan penulis. Kata-kata adalah unit data terkecil dan paling dapat
diandalkan untuk dianalisis. Meskipun kita dapat menghitung satuansatuan
ini, kita lebih tertarik pada maknanya dalam konteks.
· Referential units menggambarkan objek dengan menggunakan kata dan
frasa. Peserta dapat merujuk pada obyek sebagai “klasik”, “pemain yang
kuat”, atau “peringkat pertama dalam hal keselamatan”. Peneliti
menggunakan unit referensial untuk membuat kesimpulan tentang sikap,
nilai, atau preferensi.
· Propositional units adalah pernyataan tentang sebuah obyek. Misalnya,
seorang peneliti yang menilai iklan untuk langganan majalah mungkin
menemukan klaim, “Pelanggan yang menanggapi penawaran A akan
menghemat $15 dibandingkan tarif penerbitan tunggal.” Unit
proposisionalnya adalah “tabungan”.
· Thematic units adalah topik yang terdapat di dalam (dan di seluruh) teks;
mereka mewakili abstraksi tingkat tinggi yang disimpulkan dari teks dan
konteksnya.
Dalam hal pengkodean, peneliti harus menetapkan keandalan intra-
penilai(penilai yang sama harus memberikan kode dengan cara yang sama secara konsisten
untuk setiap teks yang dianalisis). Jika lebih dari satu orang mengkodekan konten, keandalan
antar penilai(penilai yang berbeda harus memberikan kode dengan cara yang sama pada teks
yang sama) menjadi penting. Seperti semua metodologi penelitian lainnya, penggunaan
analisis isi dipengaruhi oleh keputusan yang diambil peneliti sebelum pengumpulan data.
Analisis isi yang terkomputerisasi memang menjaga terhadap persepsi selektif terhadap isi,
menyediakan penerapan kriteria reliabilitas dan validitas yang ketat, dan dapat dilakukan
dengan komputerisasi.
a) Coding Closed Questions.
Proximity Plot of Restaurant Complaints :

Dengan desain survei yang terkomputerisasi dan pengumpulan data dengan bantuan
komputer, dikelola komputer, atau online, pengkodean awal diperlukan karena perangkat
lunak menghitung data saat data dikumpulkan. Setelah data dikumpulkan dan kami
memahami pembagian setiap bidang data ke dalam berbagai kategori berdasarkan kode, kami
dapat memutuskan bahwa aturan pemetaan asli tidak seberharga prediksi rencana analisis
awal. Pengodean ulang variabel melibatkan pengembangan aturan pemetaan baru dan
penetapan kode baru berdasarkan penggabungan kategori variabel awal. Pengodean ulang
selama pemeriksaan data berguna ketika mencoba memahami pola di dalam data.

Edit The Data


Pengeditan adalah proses untuk memverifikasi bahwa variabel telah menggunakan skema
pengkodean yang ditentukan dan bahwa semua data dikumpulkan dimasukkan dengan benar.
Ini mendeteksi kesalahan dan kelalaian, memperbaikinya bila memungkinkan, dan
menyatakan bahwa standar kualitas data maksimum telah tercapai. Meninjau ringkasan
statistik deskriptif data yang dikumpulkan untuk setiap variabel adalah tugas yang digunakan
untuk mengidentifikasi kesalahan. Sedangkan survei online dan mereka entri data peserta
berikutnya untuk pertanyaan terstruktur telah menghilangkan beberapa masalah pengeditan,
Metodologi tidak menghilangkan kebutuhan akan penyuntingan menyeluruh.
Tujuan pengeditan adalah untuk menjamin bahwa data:
• Menyelesaikan
• Akurat
• Kode yang sesuai
 Menyelesaikan
Data lengkap bila semua data yang dikumpulkan siap untuk dianalisis. Terkadang data berada
dalam bentuk yang tidak bisa dianalisis secara memadai. Misalnya, pada saat stres dalam
pengumpulan data dalam wawancara pribadi dan pencatatan kertas dan pensil dalam
observasi atau eksperimen, peneliti dapat menggunakan singkatan dan kata-kata khusus
simbol. Segera setelah wawancara, eksperimen, atau observasi, pengumpul data harus
menerjemahkannya singkatan atau singkatan.

 Jawaban “Tidak Tahu”.


Ketika sekelompok peserta memilih opsi respons “Tidak Tahu”, masing-masing peserta
mungkin memiliki arti tertentuberbeda. Respon “tidak tahu” (DK) menghadirkan
permasalahan khusus dalam penyiapan data. Ketika kelompok respon DK kecil, tidak
merepotkan. Namun jika jumlahnya besar, hal ini menjadi perhatian utama. Melakukan hal
ini maksudnya pertanyaan pengukuran yang memunculkan respon DK tidak ada gunanya?
Jawabannya adalah, “Semuanya tergantung.”

Kebanyakan jawaban DK ada dua jenis. Pertama, adanya respon sah DK saat menjadi peserta
tidak tahu jawabannya. Masuk akal untuk mengharapkan bahwa beberapa tanggapan DK
yang sah mungkin akan dibuat untuk pertanyaan apa pun dengan tepat termasuk opsi respons
DK. Sebagai seorang peneliti, tanggapan ini mungkin saja terjadi memenuhi tujuan penelitian
kami; kami mengharapkan tanggapan DK dan menganggapnya bermanfaat. Ini seharusnya
diperiksa seperti halnya respons lainnya. Namun pada tipe kedua, balasan DK
menggambarkan hal tersebut kegagalan peneliti untuk mendapatkan informasi yang sesuai
dengan pertanyaan pengukuran. Pertanyaan-pertanyaan seperti itu akan menimbulkan kedua
jenis tanggapan DK dan dengan demikian akan membiaskan data; pengeditan kemungkinan
besar akan mengecualikan semuanya
Tanggapan DK dari analisis situasi selanjutnya.

Data Hilang
Data yang hilang adalah data dari partisipan yang tidak tersedia untuk satu atau lebih variabel
yang diminati. Di dalam survei, data yang hilang biasanya terjadi ketika peserta secara
sengaja atau tidak sengaja melewatkan, menolak menjawab, atau tidak mengetahui jawaban
pertanyaan pengukuran dan enggan menebak. Data juga hilang terjadi karena kesalahan
peneliti, perangkat lunak atau peralatan tidak berfungsi, file data rusak, dan perubahan dalam
penelitian atau desain instrumen setelah data dikumpulkan dari beberapa partisipan, seperti
ketika variabel dihilangkan atau ditambahkan. Dalam studi longitudinal, data yang hilang
mungkin disebabkan oleh keluarnya peserta keluar dari penelitian atau tidak hadir selama
satu atau lebih periode pengumpulan data.
Strategi penanganan data yang hilang terdiri dari proses dua langkah: (1) peneliti terlebih
dahulu melakukan eksplorasi pola data yang hilang untuk menentukan probabilitas bahwa
suatu nilai hilang daripada yang diamati, kemudian (2) peneliti memilih teknik koreksi data
yang hilang.
Misalnya saja dalam survei tentang pelatihan preferensi, asumsikan pengeditan menemukan
bahwa laki-laki bertanggung jawab atas lebih banyak data yang hilang pada suatu variabel
menilai acara pelatihan dibandingkan perempuan. Bagaimana cara penyuntingan mengatasi
masalah ini? Pertama, peneliti akan mengeksplorasi yang mana dari tiga jenis data yang
hilang yang diwakili :
• Data hilang sepenuhnya secara acak (MCAR)—kemungkinan besar hilangnya
data tertentu variabel TIDAK bergantung pada variabel itu sendiri dan TIDAK
bergantung pada variabel lain di dalamnya catatan data (misalnya, peserta
secara tidak sengaja melewatkan pertanyaan).
• Data hilang secara acak (MAR)—kemungkinan besar hilangnya data untuk
variabel tertentu TIDAK bergantung pada variabel itu sendiri tetapi
bergantung pada variabel lain dalam catatan data (misalnya, jawaban terhadap
pertanyaan pertama dari kumpulan pertanyaan bercabang mungkin
menyebabkan hilangnya data pertanyaan kedua dalam kumpulan pertanyaan
bercabang).
• Data hilang tetapi tidak hilang secara acak (NMAR)—kemungkinan besar
hilangnya data tertentu variabel bergantung pada variabel itu sendiri dan
TIDAK bergantung pada variabel lain dalam variabel tersebut catatan data
(misalnya, peserta menganggap pertanyaan tidak dapat dijawab atau terlalu
sensitif dan melewatkan pertanyaan).
Dalam contoh kita, MAR tidak berlaku karena tidak ada percabangan, melainkan MCAR atau
NMAR mungkin. Jika datanya adalah NMAR, maka peserta menyatakan pilihan “tidak ada
preferensi” yang bukan NMAR disediakan dengan melewatkan pertanyaan. Ini adalah
respons yang layak untuk menunjukkan “tidak ada preferensi” dan data tersebut harus
diperhitungkan dalam analisis sebagai kategori data terpisah pada variabel tersebut.
Pengeditan akan memberikan kode untuk “tidak ada preferensi.”
Tiga teknik digunakan untuk menyelamatkan catatan data dengan data yang hilang:
• Penghapusan secara listwise—kasus apa pun yang datanya hilang pada satu
variabel akan dihapus dari sampel untuk semua variabel analisis variabel
tersebut (opsi default di sebagian besar paket statistik seperti SPSS atau SAS);
tidak ada bias jika MAR atau MCAR karena hanya catatan data lengkap yang
digunakan untuk suatu variabel. Dalam contoh kita,pria yang melewatkan
pertanyaan akan dikecualikan. Namun, jika kita mengecualikan pria yang
melewatkannya pertanyaan dan data adalah NMAR, bukan MCAR,
menghapus laki-laki dari sampel yang bias dalam analisis apa pun preferensi
pelatihan terhadap preferensi pelatihan perempuan. Pria sengaja melewatkan
pertanyaan itu (NMAR) menyatakan “tidak ada preferensi” terhadap pelatihan,
data yang ingin kami tangkap.

• Penghapusan berpasangan—pengeditan menggantikan data yang hilang untuk


suatu variabel dengan perkiraan (misalnya, rata-rata atau ukuran tendensi
sentral lainnya); perkiraan ditentukan dengan menggunakan semua kasus yang
memiliki data variabel atau pasangan variabel tersebut, mengasumsikan
MCAR, dan berpotensi menimbulkan bias. Di kami Misalnya, data laki-laki
yang hilang dapat diganti dengan ukuran tendensi sentral untuk semua orang
laki-laki; Hal ini akan menetralisir kekuatan opini-opini yang diungkapkan
secara ekstrem, tidak hanya oleh laki-laki, tetapi juga untuk sampel
keseluruhan, tergantung pada jumlah laki-laki yang kasusnya hilang.

• Penggantian prediktif—pengeditan menggantikan data yang hilang untuk


suatu variabel dengan perkiraan perkiraan dari nilai observasi pada variabel
lain; nilai yang diamati digunakan untuk menggantikan data yang
hilang,mengasumsikan MAR, dan berpotensi menimbulkan bias. Dalam
contoh kita, asumsikan instrumennya berisi pertanyaan sebelumnya yang
meminta preferensi untuk jenis pelatihan; kami akan menggunakan milik
masing-masing orang respons pada variabel itu sebagai pengganti datanya
yang hilang. Namun, kami berpotensi menimbulkan bias karena kita tidak
mengetahui bahwa preferensi keseluruhan terhadap pendekatan pelatihan sama
dengan penilaian terhadap acara pelatihan tertentu.

Tepat Validasi data merupakan proses yang berupaya memverifikasi protokol penelitian
untuk menghindari kesalahan data diikuti dan data tersebut nyata dengan mengidentifikasi
data palsu atau tidak akurat. Pola respons yang khas dalam pertanyaan tertutup akan sering
muncul jika terjadi pemalsuan data. Untuk mengungkap hal ini, pengeditan harus dilakukan
menganalisis—sebagai satu set—instrumen yang digunakan oleh setiap pewawancara. Jika
ada dugaan kesalahan atau bias pewawancara,validasi mungkin memerlukan wawancara
ulang terhadap beberapa persentase peserta, setidaknya pada beberapa pertanyaan. Banyak
perusahaan riset akan menghubungi kembali sekitar 10 persen peserta dalam proses validasi
data. Wawancara telepon dan pribadi memfasilitasi validasi data jenis ini. Komputer yang
dikelola sendiri instrumen dapat diperiksa alamat IP dan waktu penyelesaiannya; alamat
duplikat dan ketat waktu yang berurutan membuat tanggapan terhadap instrumen tersebut
mencurigakan. Dalam instrumen kertas dan pensil,validasi mencari tulisan tangan yang
serupa sebagai indikator, lalu memeriksa apakah pola responsnya serupa-serupa pada
instrumen yang dicurigai.Entri data juga dapat menyebabkan ketidakakuratan. Terkadang
peserta bertanggung jawab atas kesalahannya, dan memang demikian jelas bahwa suatu entri
salah—misalnya, suatu instrumen meminta data rasio dalam beberapa minggu (misalnya,
perkiraan angka 4 atau kurang), namun peserta merespons pada skala lain (misalnya, 13).
Atau mereka mungkin merespons dengan dua jawaban terhadap pertanyaan yang meminta
satu jawaban.
Pengeditan harus menentukan tanggapan mana yang konsisten dengan maksud pertanyaan
atau informasi lain pada instrumen dan paling akurat untuk masing-masing peserta. Jika tidak
yakin, edit mengganti jawaban tersebut dengan kode editor untuk “tidak ada jawaban” atau
“tidak diketahui.”
Seorang peneliti mungkin memasukkan data di lokasi yang salah pada catatan data atau
memasukkan respons yang salah.Dalam skenario ini, pengeditan berupaya mendeteksi
(diungkapkan oleh kasus yang hilang atau kode variabel di luar jangkauan) dan ganti jawaban
yang benar dengan meninjau instrumen pengukuran asli atau informasi lain di dalamnya
Himpunan data. Inilah sebabnya mengapa pengkodean nomor kasus pada instrumen
pengukuran sangatlah berharga; lebih mudah untuk menemukannya instrumen yang sesuai.
Peneliti juga dapat menghubungi kembali partisipan untuk mendapatkan informasi yang
benar jika waktu dan anggaran memungkinkan.
Kode yang Sesuai
Rencana analisis awal kami memerlukan studi variabel—seringkali dalam bentuk
perbandingan atau tabulasi silang dengan variabel lain. Saat kami mempelajari pengukuran,
kami mendiskusikan pengembangan aturan pemetaan yang akan dibuat kategori dalam
variabel dan menggunakan aturan ini untuk memberikan nomor pada jawaban peserta
[misalnya, jika variabelnya adalah jenis kelamin, partisinya adalah laki-laki (1) dan
perempuan (2)]. Kategori dinilai sesuai jika memenuhi dua kriteria: (1) partisi data terbaik
untuk menguji hipotesis dan menunjukkan hubungan dan (2) ketersediaan data pembanding.
Kode awal ini diasumsikan sebagai kode yang akan kita gunakan selama analisis. Pertanyaan
tertutup, biasanya sudah dikodekan sebelumnya sebagai bagian dari desain instrumen,
mengikuti prinsip-prinsip berikut: kategori harus saling eksklusif, lengkap, dan terfokus pada
satu dimensi.

EXAMINE THE DATA


1. Exploratory Data Analysis
Pemeriksaan data melibatkan dua tahap analisis utama: analisis data eksploratif (EDA) dan
analisis data konfirmatori (CFA). EDA bertujuan untuk menyelidiki dan menyederhanakan
data dengan menggunakan statistik deskriptif dan tampilan grafis awal. Sebaliknya, CFA
adalah proses analitis yang mengikuti aturan statistik klasik, melibatkan uji signifikansi dan
tingkat kepercayaan untuk menentukan hubungan antar variabel.
Analisis EDA dapat dibandingkan dengan peran detektif, fokus pada pencarian petunjuk dan
bukti. Di sisi lain, analisis CFA seperti peran hakim, berkonsentrasi pada penilaian kekuatan
bukti yang ditemukan. EDA menjadi langkah awal dalam mencari bukti, yang menjadi dasar
bagi analisis CFA.
Panduan pemeriksaan data adalah langkah awal dalam perencanaan analisis, membangun
dasar untuk mengembangkan alat pengukuran. Meskipun ketersediaan data real-time
mengundang peneliti untuk langsung melakukan analisis statistik, langkah pertama
seharusnya adalah mengevaluasi data sesuai rencana analisis awal setelah pengumpulan.
Kesalahan ini sering terjadi saat data dapat dilihat langsung selama proyek penelitian.
Perangkat lunak survei atau analisis statistik membantu menghitung frekuensi respons pada
setiap variabel, memungkinkan peneliti menilai nilai setiap langkah dalam rencana analisis.
Contohnya, jika rencana melibatkan tabel dummy tentang penggunaan makanan instan
berdasarkan kelompok usia, tetapi data menunjukkan bahwa 85% peserta secara rutin
mengonsumsi makanan instan, tabulasi silang "penggunaan makanan instan" berdasarkan
"usia" mungkin tidak memberikan informasi yang signifikan.
Dalam Analisis Data Eksploratif (EDA), peneliti memiliki fleksibilitas untuk merespons pola
dalam ringkasan awal data. EDA dapat mengambil berbagai pendekatan dalam mengungkap
misteri data karena tidak terikat pada struktur yang kaku.
2. Frequency Tables, Bar Charts, and Pie Graphs
Beberapa metode penting untuk menganalisis data. Sebagai contoh, tabel frekuensi adalah
alat sederhana untuk menyusun data. Contohnya diberikan dalam table 13-9. Tabel ini
menyusun data berdasarkan nilai kode tanggapan, mulai dari yang terendah hingga tertinggi.
Tabel ini mencakup kolom untuk jumlah, persentase, persentase valid (disesuaikan untuk data
yang hilang), dan persentase kumulatif. Tabel ini menjelaskan usia minimum yang diinginkan
untuk dapat memiliki akun jaringan sosial. Tabel 13-10 menampilkan data yang sama
menggunakan diagram lingkaran dan diagram batang. Menggunakan format grafis membuat
nilai dan persentase lebih mudah dipahami. Namun, jika variabel yang diamati diukur pada
tingkat interval-rasio dan memiliki banyak nilai potensial, teknik ini mungkin kurang
informatif. Pameran 13-11 adalah tabel frekuensi ringkas dari pembelian tahunan rata-rata 50
pelanggan teratas PrimeSell. Hanya dua nilai, 59.9 dan 66, muncul lebih dari satu kali. Oleh
karena itu, tabel frekuensi utamanya adalah daftar nilai yang diurutkan. Jika tabel ini diubah
menjadi diagram batang, akan ada 48 batang dengan panjang yang sama dan dua batang
dengan dua kejadian. Diagram batang tidak dapat menunjukkan nilai di mana tidak ada
pengamatan dalam rentang tersebut. Membuat diagram lingkaran untuk variabel ini juga tidak
berguna dengan bentuk data saat ini, tetapi tabel frekuensi memberikan peluang untuk
mengkode ulang variabel sehingga teknik ini mungkin bermanfaat.
3. Histogram
Histogram adalah solusi konvensional untuk menampilkan data interval-rasio. Histogram
digunakan ketika memungkinkan untuk mengelompokkan nilai variabel ke dalam interval.
Histogram dibuat dengan batang yang mewakili setiap interval, di mana kuantitas interval
menentukan tinggi batang, dan di mana setiap batang interval memiliki lebar yang sama dan
menempati jumlah area yang sama dalam grafik. Anda ingin jumlah interval mencerminkan
rentang data. Jumlah interval dapat dipilih secara sembarang.
Seorang peneliti menyarankan Anda menghitung jumlah interval berdasarkan akar kuadrat
dari jumlah observasi (setelah dibulatkan). Pada contoh di Pameran 13-11, jumlah intervalnya
akan menjadi 8 (akar kuadrat dari 50 = 7,07, dibulatkan ke atas). Lebar interval kemudian
seharusnya sekitar sama dengan rentang dibagi jumlah interval [(218,2 – 54,9)/8 = 20,4,
dibulatkan menjadi 20]. Analis data menemukan histogram berguna untuk (1) menampilkan
semua interval dalam distribusi, bahkan interval tanpa nilai yang diamati, dan (2) memeriksa
bentuk distribusi untuk kemiringan, kurtosis, dan pola modal.
4. Stem-and-Leaf Displays
Stem and leaf display adalah teknik yang erat kaitannya dengan histogram. Ini memiliki
beberapa fitur histogram tetapi menawarkan beberapa keunggulan unik. Mudah dikonstruksi
secara manual untuk sampel kecil atau dapat diproduksi oleh program komputer. Berbeda
dengan histogram, yang kehilangan informasi dengan mengelompokkan nilai data ke dalam
interval, stem leaf menyajikan nilai data aktual yang dapat diperiksa langsung, tanpa
menggunakan batang tertutup atau asterisk sebagai medium representasi. Fitur ini
mengungkap distribusi nilai dalam interval dan mempertahankan urutan peringkat mereka
untuk menemukan median, kuartil, dan statistik ringkasan lainnya. Ini juga memudahkan
menghubungkan observasi tertentu kembali ke file data dan peserta yang menghasilkannya.
Visualisasi adalah keunggulan kedua dari tampilan batang-daun. Rentang nilai terlihat
dengan sekilas, dan impresi bentuk dan penyebaran adalah langsung. Pola dalam data—
seperti celah di mana tidak ada nilai, area di mana nilai berkumpul, atau nilai yang
menyimpang dari tubuh utama data—dapat dengan mudah diamati.
5. Pareto Diagram
Diagram Pareto adalah grafik batang yang persentasenya mencapai 100 persen. Data berasal
dari skala pilihan ganda dengan respons tunggal; skala pilihan ganda dengan respons ganda;
atau hitungan frekuensi kata (atau tema) dari analisis konten. Jawaban peserta diurutkan
berdasarkan tingkat kepentingan yang menurun, dengan tinggi batang menurun dari kiri ke
kanan. Analisis keluhan perbaikan laptop digambarkan sebagai diagram Pareto dalam tabel
13-14. Garis frekuensi kumulatif dalam tabel ini menunjukkan bahwa dua masalah utama
(perbaikan tidak menyelesaikan masalah pelanggan, dan produk dikembalikan berkali-kali
untuk diperbaiki) menyumbang 80 persen dari alasan pelayanan perbaikan yang tidak
memadai. Susunan gambar yang muncul mengungkapkan bahwa setiap upaya untuk
meningkatkan layanan harus menangani dua masalah pertama.
6. Boxplots
Boxplot, atau yang dikenal juga sebagai diagram kotak-garis, adalah teknik lain yang sering
digunakan dalam analisis data eksploratif. Sebuah boxplot mengurangi detail dari tampilan
batang-daun dan memberikan gambaran visual yang berbeda mengenai lokasi, sebaran,
bentuk distribusi, panjang ekor, dan outlier. Boxplot adalah perluasan dari ringkasan lima
angka dari distribusi. Ringkasan ini terdiri dari median, kuartil atas dan bawah, serta
observasi terbesar dan terkecil. Median dan kuartil digunakan karena mereka adalah statistik
yang sangat tahan terhadap perubahan. Statistik yang tahan terhadap perubahan tidak
terpengaruh oleh outlier dan hanya sedikit berubah sebagai respons terhadap penggantian
sebagian kecil dari kumpulan data.
7. Mapping
Data penelitian semakin terkait dengan dimensi geografis karena perangkat lunak Sistem
Informasi Geografis (SIG) dan perangkat pengukur koordinat lebih terjangkau. SIG
menghubungkan data dengan menggunakan bidang data umum seperti alamat. Dengan SIG,
peneliti dapat mengaitkan variabel survei dengan data geografis, seperti data sensus AS,
untuk pemahaman lebih dalam tentang sikap dan perilaku. Teknologi identifikasi frekuensi
radio (RFID) juga memungkinkan keterkaitan data perilaku dengan basis data geografis.
Data semacam ini umumnya ditampilkan melalui peta, menggunakan warna dan pola untuk
menunjukkan pengetahuan, sikap, perilaku, atau data demografis. Peta dapat mencakup
tingkat blok, county, negara bagian, atau negara, membantu identifikasi lokasi terbaik untuk
toko berdasarkan segmentasi demografis, psikografis, dan tahap hidup. Penggunaan pemetaan
data juga dilakukan oleh peneliti konsumen dan bisnis untuk merencanakan penyebaran
geografis produk baru.

Cross Tabulation
Ketika kita tertarik untuk menentukan bagaimana dua atau lebih variabel kategorikal terkait
dalam suatu studi, cross tabulation adalah salah satu pendekatan awal yang perlu
dipertimbangkan. Dalam cross tabulation, kita membuat tabel yang mirip dengan
DISTRIBUSI FREKUENSI untuk mempelajari lebih lanjut tentang distribusi frekuensi,
tetapi di sini, kita menggabungkan jumlah dari nilai-nilai berbeda dari dua atau lebih variabel.
Dengan kata lain, tabel cross tabulation adalah cara untuk menyajikan distribusi frekuensi
dari dua atau lebih variabel secara bersamaan. Nilai-nilai berbeda dari variabel-variabel
tersebut dianggap sebagai kategori, dan mereka diklasifikasikan bersama satu sama lain
(Malhotra, 2007). Tabel cross tabulation juga dikenal sebagai tabel kontingensi. Meskipun
tabel cross tabulation dapat dibuat untuk sebarang jumlah variabel, tabel yang paling berguna
untuk tujuan manajerial biasanya dibentuk dengan dua atau tiga variabel.

Tabel 1 mengilustrasikan contoh cross tabulation dua variabel, yang juga dikenal sebagai
cross tabulation bivariat. Dalam contoh ini, mahasiswa dari kelas riset pasar tingkat sarjana
ditanyai tentang ketertarikan terhadap lemonade berwarna pink. Tanggapan mereka bersama
dengan identifikasi gender mereka ditampilkan dalam Tabel 1. Karena dua variabel 'suka
lemonade berwarna pink' dan 'gender' diklasifikasikan silang, kita juga dapat menghitung
persentase baris dan kolom untuk masing-masing nilai. Dari sudut pandang manajer, cross
tabulation bivariat seperti ini memberikan informasi tentang (i) bagaimana nilai dari dua
variabel terkait, (ii) cross-classification mana yang paling banyak dipilih oleh responden, dan
(iii) bagaimana cross-classifications ini berbeda satu sama lain. Dari contoh yang ditunjukkan
dalam Tabel 1, kita menemukan bahwa responden perempuan lebih suka lemonade berwarna
pink dibandingkan dengan responden laki-laki. Lebih tepatnya, 85,71% (= 30/35) dari
responden perempuan menyukai lemonade berwarna pink dibandingkan dengan 68,57% dari
responden laki-laki.

Ketika cross tabulation bivariat memerlukan klarifikasi lebih lanjut, variabel ketiga, yang
biasanya merupakan kategorisasi dari salah satu dari dua variabel, dipertimbangkan.
Melanjutkan dengan contoh di atas, mari masukkan variabel lain, 'kelompok usia gender,' ke
dalam cross tabulation untuk menjelaskan lebih lanjut hubungan antara responden pria dan
wanita. Tabel cross tabulation tiga variabel yang dihasilkan (Tabel 2) memberikan
pemahaman yang lebih besar.
BAB II
Penutup
Kesimpulan
Tahap-Tahap dalam dalam suatu penelitian data diperlukan beberapa tahap
1. Pengumpulan data merupakan langkah pertama dalam proses penelitian. Ada berbagai metode
pengumpulan data yang dapat digunakan, tergantung pada jenis penelitian yang dilakukan.
Beberapa metode pengumpulan data yang umum digunakan adalah:
 Survei: Kuesioner atau wawancara dapat digunakan untuk mengumpulkan data dari
sekelompok orang.
 Observasi: Peneliti mengamati dan mencatat perilaku orang atau kejadian.
 Eksperimen: Peneliti memanipulasi variabel independen untuk mengamati pengaruhnya
terhadap variabel dependen.
2. Setelah data dikumpulkan, perlu disiapkan sebelum dapat dianalisis. Persiapan data meliputi:
 Pembersihan data: Data dibersihkan dari kesalahan dan inkonsistensi.
 Pengodean data: Data diberi kode untuk memudahkan analisis.
 Transformasi data: Data diubah bentuknya untuk memudahkan analisis.
3. Pengeditan data merupakan proses memeriksa dan memperbaiki kesalahan dalam data.
Pengeditan data dapat dilakukan secara manual atau menggunakan perangkat lunak komputer.
4. Pemeriksaan data merupakan proses memeriksa keandalan dan validitas data. Pemeriksaan data
dapat dilakukan dengan cara:
 Membandingkan data dengan sumber lain
 Menghitung statistik deskriptif
 Memeriksa pola dalam data
Referensi
Malhotra, N.K. (2007) Marketing Research: An Applied Orientation, 5th edn, Pearson Education,
Inc., Upper Saddle River.

Anda mungkin juga menyukai