Anda di halaman 1dari 46

6

Penelitian eksperimental

CHAPTERCONTENTS

Pernyataan masalah 101


Teori dan konteks 101
Desain eksperimental 104
Validitas trade-off 108
Quasi-penelitian eksperimental 113

Abdel-Khalik dan Ajinkya (1979) memberikan definisi yang tepat dari sifat
percobaan dalam bahwa peneliti memanipulasi satu atau lebih variabel dengan
subyek yang ditugaskan secara acak ke berbagai kelompok. Kelompok ini
menerima kombinasi variabel yang berbeda (disebut Treatments); dalam beberapa
kasus kelompok kontrol mungkin ada yang tidak menerima perawatan tersebut.
Keuntungan utama dari eksperimen terletak pada kemampuan para peneliti untuk
memastikan validitas antar-nal yang tinggi, yang ditentukan dari segi seberapa baik
mereka dapat mengeliminasi hasil tersaingannya fatau hasilnya. Eksperimen,
dengan demikian, terutama cocok untuk pertanyaan penelitian yang menyelidiki
hubungan kausal antara variabel.
Gibbins dan Salterio (1996, hlm. 24) menyarankan empat pedoman untuk
penelitian eksperimental yang baik dalam akuntansi:

1 Sebuah pernyataan yang jelas tentang masalah, pentingnya dan kontribusi


untuk pengetahuan bahwa solusi akan membuat.
2 Sebuah pernyataan yang jelas dari teori yang mendasari proses, khususnya teori
yang mendorong perilaku dan dampak konteks pada teori.
3 Sebuahdesain eksperimental begitu und-karena cacat fatal dapat
diperkenalkan oleh desain yang tidak pantas atau tidak memadai.
4 Pengakuan atas pentingnya validitas eksternal. Jika ini berarti bahwa kita
membutuhkan pengaturan eksperimental yang lebih realistis, maka kita
perlupenjelasan heoretical yang sejalan lebih kaya dari perilaku resultan.
E x p dan r i m dan n t untuk l r dan s dan r c
h 101

Pedoman ini menyediakan kerangka kerja yang sangat baik untuk pertimbangan
masalah penelitian dalam percobaan akuntansi, dan diadopsi di sini.

Pernyataan masalah

Variabel yang menarik adalah:

Y variabel dependen atau observasi


Xi variabel independen (atau pengobatan) yang dapat dimanipulasi dalam nilai,
seperti dalam percobaan, atau diukur dari data arsip, seperti dalam studi Econo-
metrik. Sebuah eksperimen laboratorium biasanya akan memiliki lebih banyak
validitas internal daripada metode penelitian lainnyas (khususnya studi lapangan
atau penelitian pengarsipan). Ketika kita menjauh dari lingkungan kontrol tinggi
dari pengaturan experi-mental, berbagai ancaman terhadap validitas internal
tumbuh, dengan conse-quence bahwa tes kausalitas berhenti menjadi begitu handal.
Kami mungkin kemudian hanya dapat atribut Asosiasi (melalui tindakan korelasi),
bukan arah Asosiasi.

Teori dan konteks

Dengan ledakan penelitian eksperimental dalam audit pada pertengahan 1970-an,


penggunaan mata pelajaran yang berpengalaman or praktisi ahli sebagai peserta
dianggap penting untuk memberikan validitas eksternal yang diperlukan untuk
penelitian. Akibatnya, sebagian besar jurnal telah menyatakan preferensi untuk
penggunaan praktisi dalam penelitian eksperimental. Hal ini telah memaksakand
serius con-straint pada pelaksanaan pekerjaan eksperimental, terutama selama
sepuluh tahun terakhir, karena telah menjadi semakin sulit untuk mengamankan
Partia-tion 4 besar praktisi, katakanlah, untuk penelitian eksperimental. Partisipasi
ini remains penting untuk publikasi penelitian audit di atas jurnal; tapi Untungnya,
untuk pekerjaan eksperimental di luar lingkup audit ada peningkatan pengakuan
bahwa peserta pengganti mungkin memiliki diperlukan dasar keterampilan untuk
berpartisipasi. Penggunaan proporsi besar siswa dalam sebuah studi telah
dibenarkan oleh sejumlah penulis: (1) Ashton dan Kramer (1980), dalam kajian
penelitian dalam bisnis dan psikologi, melaporkan bahwa perilaku pengolahan
infor-mation siswa dan ' real-w orld ' pengambil keputusan tidak berbeda; (2)
abdolmohammadi dan Wright (1987) berpendapat bahwa untuk keputusan yang
sangat terstruktur tugas kinerja mahasiswa tidak boleh berbeda secara signifikan
dari yang nyata-pembuat keputusan dunia; (3) penelitian sebelumnya
102 researchMethodsinaccounting

telah melaporkan bahwa tidak ada perbedaan antara subyek dengan dan tanpa
pengalaman kerja dalam eksperimen menggunakan dataset informasi keuangan
(MacKay dan Villarreal, 1987; Stok dan Watson, 1984). Brownell (1995, MS 83)
menunjukkan bahwa dugaan kekurangan penggunaan siswa dalam eksperimen
berbasis laboratorium terlalu dibesar-besarkan. Dia menyamakan situasi yang non-
respon dalam pekerjaan survei, menunjukkan bahwa kita perlu demonstraTe kedua
perbedaan sistematis yang ada dan bahwa perbedaan tersebut masalah, sebelum kita
mengesampingkan penggunaan mahasiswa pengganti.

Peran teori dalam pengaturan penilaian nyata

Dalam rangka untuk mengambil keuntungan dari potensi kekuatan pengaturan


eksperimental dalam pengujian hubungan kausal, kerangka teoritis yang
dikembangkan dengan baik adalah penting. Setelah kerangka teoritis telah
ditetapkan, peneliti dapat memutuskan variabel mana yang harus dimanipulasi dan
diukur, dan yang dikendalikan.
Awal penelitian eksperimental dalam Akuntansi sangat dikritik karena
pendekatan ateo-retical nya, tetapi baru-baru ini kita telah melihat penerapan teori
psikologis untuk pengambilan keputusan penelitian, mengikuti karya Kahnemann
dan Tversky (1972) di the eksplorasi heuristik dan bias (misalnya, Ashton, 1983;
Smith, 1993) dan baru-baru ini dalam penggunaan teori pengetahuan, ingatan dan
pembelajaran (misalnya, Libby dan Frederick, 1990). Teori berbasis ekonomi
(terutama teori agensi) juga telah berevolusi kepengaturan eksperimental exp lain
dalam Akuntansi Manajemen (misalnya, demski dan Feltham, 1976).

Penyematan penghakiman dalam konteks


tugas tertentu

Pertanyaan tentang konteks adalah ancaman yang berpotensi besar untuk validitas
eksternal penilaian dalamtugas-tugas mental experi. Kita mungkin tidak yakin
apakah temuan yang diamati disebabkan oleh variabel yang terkena manipulasi,
atau dampak dari variabel seperti kompleksitas tugas, lokasi, kendala waktu, incen-
tives, dll. Percobaan yang dirancang dengan baik harustgoda untuk mengatasi
masing-masing masalah ini, tetapi meskipun demikian tetap sulit untuk mengontrol
untuk semua potensi variabel asing berhasil dengan 100 persen kepastian dalam
setiap percobaan. Perhatian besar harus diambil dalam merakit literatur
perbandingan findinGS untuk mendukung arah penelitian tertentu, terutama tanpa
kembali ke kertas asli; temuan yang tidak konsisten atau kontradiksi dapat
disebabkan oleh berbagai konteks penelitian daripada variabel kunci yang
bermasalah.

Peran insentifs kepada peserta

Salah satu isu kontekstual adalah keprihatinan khusus dan telah mengangkat
sejumlah isu yang terkait: ketersediaan insentif untuk memotivasi peserta untuk
mengeluarkan upaya dalam pelaksanaan tugas dapat membuat lebih banyak
masalah daripada
E x p dan r i m dan n t untuk l r dan s dan r c
h 103

itu memecahkan. Libby dan Lipe (1992) memberikan contoh menarik dari ini di
mana mereka menyarankan bahwa suara konseptual yang diperkenalkan oleh skema
insentif dipengaruhi oleh faktor yang tidak diukur. Bagi peserta didik, insentif
moneter yang sederhana mungkin diperlukan untuk menginduksi kehadiran,
partisipasi dan atten-tion, tetapi dampaknya pada hasil akhirnya tidak jelas. Kita
mungkin perlu meneliti teori dalamcentives, dan cara mereka mempengaruhi
eceran-ALS dengan karakteristik pribadi yang berbeda, sebelum kita dapat
mengukur efeknya. Libby dan Luft (1993) menunjukkan bahwa setiap upaya ekstra
yang disebabkan oleh insentif mungkin terkait dengan kemampuan dan
karakteristik pengetahuan para peserta. Persyaratan etis dapat memberlakukan
kendala lebih lanjut, sementara insentif untuk berpartisipasi mungkin dapat
diterima, insentif yang terkait dengan kinerja (di mana imbalan diferensial
disediakan) mungkin tidak diizinkan pada dasar ekuitas. Oleh karena itu, kami
cukup May mencoba untuk menghindari ketersediaan insentif dimanapun possi-
BLE. Penggunaan insentif tampaknya tidak diperlukan di mana para peserta adalah
profesional terampil. Bonner dan Sprinkle (2002) baru-baru ini estab-lished
kerangka teoritis untuk pembayaran insentif, yang mungkin untuk menghasilkan
penelitian lebih lanjut di daerah ini.

Penggunaan profesional sebagai peserta penelitian

Seperti dibahas di atas, beberapa jurnal dan beberapa pengaturan eksperimental


menuntut penggunaan peserta profesional terampil. It is menjadi semakin diffi-
kultus, bahkan di luar Top-tier jurnal, untuk mempublikasikan penelitian
eksperimental menggunakan siswa sepenuhnya penonton. Hal ini sangat begitu
untuk sarjana Audi-ences. Audiens siswa mungkin masih dapat diterima untuk
pelaksanaan pilot Stud-ies, tapi praktisi/subyek profesional akan diperlukan untuk
studi utama.

Penggunaan penipuan untuk membuat pengaturan penelitian yang sesuai

Fakta bahwa subyek ditempatkan dalam pengaturan laboratorium dapat


menciptakan efek yang mengakibatkan sebuah outcome yang tidak akan muncul di
luar pengaturan exper-imental. Hal ini dapat terjadi karena berbagai alasan,
termasuk di mana subyek dapat mengadopsi sikap di mana mereka mencoba untuk
menyenangkan experimenter: Weber dan Cook (1972) dan Schepanski et al. (1992)
report pada situasi di mana peserta dalam eksperimen ingin membantu experimenter
dengan rupanya berusaha untuk memberikan apa yang diharapkan dari mereka.
Dalam keadaan seperti itu mungkin perlu untuk menipu subyek untuk tujuan
percobaan, sehingga mereka tidak menyadari hasil diprediksi penelitian, dalam
rangka untuk memberikan hasilnya valid. Jadi Smith dan Taffler (1996)
menginformasikan subyek mereka bahwa mereka membuat penilaian pada 60
perusahaan yang terpisah, untuk mengamankan keputusan terpisah untuk masing-
masingkasus perusahaan 2 0 yang dipekerjakan dengan tiga perlakuan yang
berbeda. Hanya pada penyelesaian percobaan adalah penipuan terungkap. Namun
demikian, perilaku tersebut dapat menimbulkan sinisme di antara para peserta
sehingga mereka berada dalam keadaan
104 researchMethodsinaccounting

ketidakpercayaan mengenai pengaturan eksperimental yang mungkin menghalangi


partisipasi masa depan. Ada juga pertimbangan etis dalam partisipasi dalam
percobaan telah dicapaidengan cara yang sangat potensial yang tidak diinginkan,
dengan hasil yang kepercayaan peneliti dan kejujuran telah dikorbankan untuk
memberikan hasil experi-mental.

Desain eksperimental

Trotman (1996), mengikuti Campbell dan Stanley (1963) dan Libby (1981),
mengusulkan sejumlah alternatif sederhana.

Post-test hanya desain grup kontrol

Subyek secara acak ditugaskan untuk perawatan, yaitu ke tingkat yang berbeda dari
variabel independen (penjelasan). Untuk dua tingkat independen Vari-mampu, X1
dan x2 (salah satu yang mungkin menjadi kelompok kontrol tanpa pengobatan),
dua hasil yang sesuai diamati, oo1 dan oo2, katakanlah. Hasil ini diukur setelah
masing-masing subyek telah menerima perawatan. Perbandingan oo1 dan oo2 akan
mengungkapkan dampak yang berbeda Treatments. Bentuk dasar dari desain ini
dapat dengan mudah diperluas untuk mencakup berbagai tingkat pengobatan. Joyce
dan Biddle (1981) memberikan contoh dari jenis desain.

Pre-Test/post-test kelompok kontrol desain

Subyek diukur untuk melihat bagaimana mereka bereaksi terhadap pengobatan


berturut-turut, tapi kali ini desain eksperimental sebelum-dan-setelah digunakan
yang memungkinkan desain penelitian untuk mengontrol perbedaan individu.
Perawatan X1 diterapkan pada subjek, menghasilkan hasil yang diamati
oo1;reatment x2 lebih lanjut (yang mungkin sesuatu yang sederhana seperti
penyediaan informasi tambahan) kemudian diterapkan untuk subjek dan hasil baru
OO2 diamati, memfasilitasi perbandingan dari dua hasil yang diamati.
Meskipun keuntungan kontrol Individual perbedaan, penggunaan berulang
individu yang sama untuk perawatan berturut-turut juga menyebabkan masalah
potensial: mungkin ada ' belajar ' efek serta ' ketertiban ' efek. Heiman (1990)
menyediakan contoh dari jenis desain.

Factorial DesiGN: antara subyek

Ini melibatkan variasi simultan dari dua atau lebih perawatan (variabel penjelasan)
sehingga kita dapat memonitor dampak mereka yang terpisah pada ketergantungan
E x p dan r i m dan n t untuk l r dan s dan r c
h 105

variabel, dan setiap efek interaktif potensial antara variabel penjelasan (yaitu, sejauh
mana hubungan bersyarat seperti perlakuan X1, katakanlah, hanya memiliki efek
untuk tingkat tertentu dari pengobatan x2 ).
Desain 2 × 2 yang paling sederhana memanipulasi dua perawatan di dua
tingkat untuk memberikan empat kombinasi yang mungkin berbeda. Subyek secara
acak ditugaskan untuk masing-masing dari keempat sel, dan masing-masing
menerima hanya satu pengobatan. Trotman (1996, hlm. 19) mengidentifikasi
sejumlah keuntungan yang berbeda untuk menggunakan desain faktorial dari jenis
ini:

1 Efek interaksi dapat dievaluasi. Hal ini sangat penting di mana ada penjelasan
alternatif yang bersaing untuk pengamatan. Brown dan Solomon (1993)
memberikan sebuah exampLe dari jenis desain dalam menguji tiga penjelasan
teoritis yang bersaing dari literatur psikologis.

2 Variabel yang berpotensi membingungkan (misalnya, jenis kelamin,


pengalaman kerja) dapat diadakan secara konstan dalam sel sehingga
pengaruhnya dapat dievaluasi.
3 Validitas eksternal dapat berpotensi ditingkatkan dengan temuan yang
berstratis setan efek yang sama di sejumlah karakteristik subjek.
4 Desain semacam ini lebih ekonomis daripada hanya post-test sederhana desain
dalam penggunaan mata pelajaran. Lebih sedikit disambungCTS diperlukan
untuk melakukan tes yang sama, yang merupakan pertimbangan penting di
mana praktisi akan-ing untuk berpartisipasi sulit untuk menemukan.

Desain faktorial: dalam subyek

Seperti desain yang lebih sederhana, kita juga bisa mengenalkan desain faktorial '
sebelum-dan-sesudah '. Sedangkan dalam ' antara subyek ' desain mata pelajaran
hanya menerima satu memperlakukan-ment, dalam ' dalam subyek ' desain setiap
mata pelajaran menerima semua perlakuan berturut-turut. Ini merupakan apa yang
sering disebut desain ' tindakan berulang ' . Desain tersebut bahkan dapat memiliki
keuntungan lebih lanjut:

1 Mereka memerlukan banyak mata pelajaran yang lebih sedikit.


2 Kekuatan Statistik hasil berpotensi lebih besar karena kontrol implisit
diperkenalkan untuk karakteristik individu, dengan asumsi bahwaeristik
karakter individu tidak berubah secara signifikan antara pengobatan berturut-
turut ( melihat efek pematangan (halaman 109), mengenai masalah validitas
internal).
3 Mereka sangat berguna untuk memeriksa perbedaan dalam penggunaan
informasi dan dampak dari berbagai perawatan dalam lingkungan belajar dan
pelatihan.
Tetapi ada juga sejumlah kerugian yang berpotensi serius yang berkaitan dengan
desain penelitian ini, yang telah diidentifikasi oleh Brownell (1995, hlm. 11) dan
Trotman (1996, hal. 30):
106 researchMethodsinaccounting

1 Permintaan efek, sehingga subjek dapat memungut rincian percobaan


(misalnya, hipotesis di bawah tes, atau jumlah gagal compa-Nies dalam
sampel) sedemikian rupa sehingga mereka/perilakunya menjadi berbeda dari
yang akan diharapkan (( di bawah kondisi dunia nyata).
2 Salah satu kelemahan utama adalah bahwa variabel subjek tidak dapat
digunakan sebagai variabel penjelasan dalam desain dalam subjek
yangmenyebabkan char-acteristics individu tidak dapat diubah di seluruh
perawatan.
3 Efek prakteknya, seperti perubahan perilaku subjek sebagai hasil eksperimen –
mereka dapat berkinerja lebih baik karena kemampuan belajar dan
pengetahuan tentang akumulasi tepi, atau lebih buruk karena kelelahan atau
memuduknya antusiasme.
4 Membawa-atas efek, seperti bahwa cara pengobatan kedua dianggap sangat
tergantung pada pengalaman dari yang pertama (misalnya, dalam tugas
prediksi kegagalan berturut-turut, harapan, dibenarkan atau sebaliknya, bahwa
number kasus gagal akan identik). Ini mungkin berarti bahwa pengambilan
keputusan independen mungkin mustahil tanpa menggunakan tindakan
penyeimbang yang terkait dengan pemesanan ulang tugas. Bahkan dengan re-
Pemesanan, Schepanski et al. (1992) menunjukkan bahwaada e mungkin masih
menjadi masalah, yang dapat diatasi dengan memperkenalkan ' pengisi ' tugas
dan memperpanjang periode experi-mental. Namun, ini adalah solusi yang
akan sendiri menimbulkan masalah lebih lanjut. Efek pematangan juga dapat
terlihat di sini dalam desain yang dalam subjekharus pasti melibatkan beberapa
jeda waktu, yaitu bahwa antara pengobatan berturut-turut, yang akan membuat
mereka lebih rentan terhadap ancaman validitas internal semacam ini.
5 Efek statistik, sehingga kesetaraan asumsi varians adalah Vio-lated di dalam-
subyek analisis varians (ANOVA), membuat F-tes bias. Hasilnya mungkin
tidak serius tetapi harus diakui dengan melakukan pemeriksaan alternatif.
6 Efek arti-penting isyarat, sedemikian rupa sehingga jumlah variabel di bawah
fokus dalam xperiment dalam subjek eakan lebih sedikit dibandingkan
eksperimen antara subjek yang sesuai. Schepanski et al. (1992) menunjukkan
bahwa hal ini dapat menimbulkan ancaman validitas eksternal. Kendala utama
dalam kebanyakan experi-ments adalah jumlah waktu yang tersedia untuk
subyek untuk participdalam percobaan, dan variabilitas dalam waktu yang
diambil oleh subyek individu. Semua peneliti dibatasi sampai batas tertentu
dengan jumlah variabel yang dapat mereka pertimbangkan mengingat jumlah
dan jumlah waktu subyek yang tersedia.

Ada will hampir selalu menjadi variabel lain yang berpotensi berpengaruh yang
mengancam validitas internal, dan ini harus diatasi dengan menjalankan beberapa
bentuk kontrol. Sejumlah prosedur alternatif ada.

1 Kelompok kontrol: untuk menahan variabel yang tidak relevan konstan.


Sebuah ENVI-ronment dikendalikan didirikan oleh peneliti yang hadir selama
pelaksanaan percobaan, berbeda dengan pengaturan non-dikontrol seperti yang
digunakan oleh peneliti survei. Jika grup kontrol tidak layak, kami akan
E x p dan r i m dan n t untuk l r dan s dan r c
h 107

mungkin berusaha untuk mengendalikan variabel tersebut tidak langsung


terlibat dalam hubungan di bawah penyelidikan.
2 Randomisation: sehingga distribusi variabel sama-sama mungkin di semua
variabel independen. Subyek akan ditugaskan secara acak ke masing-masing
sel perawatan. Tugas acak mengasumsikan bahwa faktor yang sama akan
mempengaruhi setiap kelompok pengobatan, dan bahwa masing-masing harus
mengandung campuran kurang lebih sama faktor ini. Semakin besar ukuran
sampel, semakin besar kemungkinan hal ini terjadi. Di mana kita memiliki
sampel kecil, dan ukuran sel yang sangat kecil, kita harus meragukan Apakah
Pengacak akan secara efektif menumpulkan dampak perbedaan individu di
antara subyek.

3 Holding konstan: so bahwa variabel memiliki nilai yang sama di semua


nilai dari variabel independen.
4 Pencocokan: sehingga distribusi variabel umum di setiap variabel
independen. Dengan demikian, untuk percobaan audit, kami dapat
mencocokkan peserta berdasarkan pengalaman mereka; dalam akuntansi
keuangan, perusahaan dapat dicocokkan dengan ukuran. Pencocokan secara
efektif menghalangi studi tentang karakteristik ' cocok '. Di mana ini adalah
masalah kita mungkin berusaha untuk memasukkan variabel yang cocok
(misalnya, ukuran) sebagai variabel penjelasans. Namun, penyertaan tersebut
bukanlah solusi yang sepenuhnya memuaskan karena variabel yang cocok
tidak dapat ditetapkan secara acak ke grup eksperimental. Jadi, jika mereka
ditemukan berpengaruh, kita tidak bisa mengesampingkan hipotesis alternatif
bahwa beberapa variabel undikenal (proxy oleh variabel yang disertakan)
bertanggung jawab untuk hubungan.
5 Counterbalancing: menggunakan semua kombinasi dari Pemesanan
perawatan akan mengatasi dampak dari setiap efek order, tetapi akan
memerlukan prepa-Ration dari banyak versi yang berbeda dari percobaan.
Dengan demikian Trotman dan Wright (1996), dalam lingkungan audit,
memiliki separuh subyek yang memproses aspek pengendalian internal, diikuti
dengan aspek keprihatinan, sementara separuh lainnya melakukan bagian
kepedulian yang akan terjadi terlebih dahulu, diikutioleh kontrol antar-nal.
Demikian pula, Smith dan Taffler (1995), dalam lingkungan rekening
keuangan, membahas tiga format pemrosesan informasi yang berbeda (narasi
[N], rasio [R], grafik [G]) yang memerlukan enam instru-ments yang berbeda,
satu untuk setiap urutan yang mungkin kombinasi (NRG, NGR, RNG, RGN,
GNR, GRN). Namun, penyeimbang mungkin tidak menyelesaikan semua
masalah efek order. Smith dan Taffler (1996) mengamati bahwa untuk tugas
yang sama kesulitan, yang ' terakhir ' tes dilakukan, mana pun wsebagai, sering
dilakukan yang tercepat.
6 Mengabaikan variabel: baik sengaja (jika variabel dianggap memiliki
dampak yang tidak penting) atau tidak sengaja (jika dampaknya tidak dianggap
sama sekali!).
Masing-masing alternatif memiliki potensi Pitfalls. Dalam studi pengarsipan,
misalnya, biasanya mustahil untuk terus terus-menerus sejumlah besar variabel,
atau untuk mencocokkan pada banyak orang lain. Pencocokan dapat membuat
hampir sama banyak masalah seperti yang
108 researchMethodsin accounting

mencoba untuk memecahkan. Sebagai contoh, dalam Studi Akuntansi (misalnya,


Smith dan Taffler, 1992) adalah umum untuk mencocokkan perusahaan atas dasar
industri; ukuran tertentu, dan bahkan akhir tahun keuangan. Proses seperti itu
mungkin sangat membatasi ukuran sampel dapat dicapai, dan dapat secara efektif
menghilangkan pertimbangan pengaruh salah satu variabel yang cocok (ukuran
terutama) mungkin memiliki. Beberapa variabel dengan aman dapat diabaikan atas
dasar litera sebelumnya-Ture, tetapi banyak orang lain mungkin masih hAve untuk
diabaikan, meskipun kita tidak ada-Tain dari dampak potensial mereka. Jadi itu
adalah umum (misalnya, Schulz, 1999) untuk variabel yang terkait dengan
perbedaan individu antara peserta untuk diabaikan, selain untuk usia, jenis kelamin
dan pengalaman. Ini adalah meskipun bukti yang berkembang untuk pengaruh
berbagai faktor lain (misalnya, gaya kognitif, toleransi ambiguitas) pada perilaku
dalam lingkungan akuntansi. Beberapa variabel mungkin sangat sulit untuk
mengukur bahwa kita berusaha untuk mempekerjakan variabel proxy insteAD-
misalnya, penggunaan ukuran tindakan proxy untuk pengaruh Politi-Cal.
Kegagalan untuk memasukkan variabel potensial dapat mengakibatkan bias seleksi
pada tahap sampling data.

Pemeriksaan manipulasi dapat digunakan untuk membantu memastikan bahwa


mata pelajaran sangat memahami instrumentasi dan apa yang diperlukan dari
mereka, dan untuk memantau jalannya percobaan (terutama pada tahap pilot, di
mana satu layak) untuk memastikan bahwa berbagai perawatan yang menghasilkan
perubahan dalam arah yang sama seperti anticipated.

Validitas trade-off

Kita dapat mengidentifikasi tiga masalah validitas yang berbeda dalam melakukan
experi-ments: membangun validitas, validitas internal dan validitas eksternal.

Ancaman untuk membangun validitas

Validitas membangun menjelaskan sejauh mana konstruksi abstrak berhasil


dioperasionalisasi. Definisi ini mencakup baik sejauh mana konstruksi diukur andal
dan sejauh mana mereka menyediakan tindakan yang secara efektif menangkap
esensi dari abstraksi. Kamimenggoda untuk menafsirkan teori melalui
pengembangan konstruksi abstrak, dan kemudian berusaha untuk
mengoperasionalkan konstruksi ini dengan variabel yang terukur. Di mana hal ini
tidak mungkin kita harus mengganti variabel proxy, yang terukur tetapi yang
mungkin kurang dari sempurna proksi. Proxy yang tidak sempurna akan berarti tes
Cacat hipotesa.
Nunnally (1978) menjelaskan tiga aspek pendirian membangun validitas:
E x p dan r i m dan n t untuk l r dan s dan r c
h 109

1 Tentukan variabel yang keduanya diamati dan terkait dengan membangun-ini


memberitahu peneliti yang item untuk mengukur dan mengevaluasi pada
langkah berikutnya.
2 Tentukan sejauh mana variabel yang dapat diamati ini adalah ukuran yang
dapat diandalkan dari satu atau lebih konstruksi dan tingkat interhubungan
antara item yang diukur.
3 Tentukan sejauh mana ukuran-tingkat konstruksi yang dipekerjakan akan
menghasilkan hasil yang dapat diprediksi.

Sebagian besar perhatian dalam merancang penelitian laboratorium adalah pada


pengobatan eksperimental dengan khusus little perhatian dibayar untuk
membangun masalah validitas yang terkait dengan variabel diukur. Di mana ada
perhatian yang dibayar, biasanya ke kedua tahap Nunnally sendirian.
Konsekuensi dari kesalahan di sini berpotensi serius. Sebagai contoh,
Brownell (1995, ms 112) mengungkapkan bahwa dalam makalah sebelumnya
(brownell, 1982) dia menggunakan Milani diterima secara luas (1975) instrumen
untuk mengukur partisipasi anggaran. Namun, ia memahami ' partisipasi ' untuk
menjadi kombinasi dari kedua ' pengaruh ' dan ' melibatkanment ', dan tidak yakin
bahwa instrumen Milani memadai alamat kedua dimensi. Instrumen yang
digunakan tidak dapat mengukur konstruksi dengan cara yang andal, tetapi
alternatifnya adalah mengembangkan instrumen yang baru dan sepenuhnya belum
teruji. Brownell adalahpparently siap untuk perdagangan membangun validitas
untuk keandalan dalam contoh ini.

Ancaman terhadap validitas internal

Cook dan Campbell (1979) mengidentifikasi sembilan masalah validitas internal


yang terpisah.

1 Pematangan. Ini menyangkut dampak yang terkait dengan berlalunya waktu.


Hal ini berkaitan dengan perubahan pada subyek antara exper-iments berturut-
turut, atau bahkan selama percobaan tunggal atau wawancara. Ini juga
berkaitan dengan karakteristik kasus perusahaan, katakanlah, di mana
pertumbuhan atau restrukturisasi seiring waktu berarti bahwa kita tidak lagi
membandingkan seperti dengan seperti. Dengan demikian peneliti harus
menyadari dampak potensial pada sub-
jects seperti belajar, kelelahan dan kebosanan.
2 Sejarah. Ini mirip dengan yang di atas tetapi lebih peduli dengan perubahan
lingkungan That dapat berdampak pada penelitian, bukan dengan perubahan
dalam subjek. Perubahan lingkungan ini akan berdampak signifikan pada studi
longitudinal dan mereka di mana Collec-tion data (misalnya, wawancara atau
eksperimen) dilakukan selama
Padariod.
3 Pengujian. Hasil dari serangkaian tes mungkin sebagian disebabkan oleh hasil
tes sebelumnya. Efek dari tindakan berulang-ulang dapat memperpanjang
jangka waktu yang panjang.
110 researchMethodsinaccoun ting

4 Subjek kematian. Subyek mungkin mati atau, lebih mungkin, tidak ada diri
mereka bagian jalan melalui serangkaian eksperimen atau wawancara. Hal ini
akan menyebabkan hilangnya data tetapi, lebih serius, ketiadaan mungkin
tergantung pada faktor sistem-ATIC: subyek paling termotivasi mungkin drop
out dari percobaan sehingga kita ditinggalkan dengan kelompok yang tidak
representatif. Brownell (1995, hlm. 11) mengamati bahwa dalam pengaturan
eksperimental, kegagalan untuk merekrut partici-Pants, dan kegagalan mereka
untuk kembali muncul, mungkin terkaitdenganperawatan, terutama jika
beberapa perawatan dianggap kurang diinginkan daripada yang lain!

Casey (1980) melaporkan tingkat respons yang berbeda untuk surveinya;


orang dengan beban informasi terbesar yang paling tidak mungkin untuk
merespon. Demikian pula, dalam studi pengarsipan on kasus perusahaan,
kegagalan, merger atau akuisisi dari beberapa perusahaan berarti bahwa
mereka akan dihapus dari sampel dan akan kurang terwakili dalam studi seri
waktu.
5 Kematian eksperimental. Berlalunya waktu dapat memiliki banyak efek pada
perusahaan subject. Sebagai contoh, perusahaan mungkin telah tumbuh,
digabung atau bergeser dari publik ke status pribadi. Bias dapat timbul karena
perusahaan yang gagal telah dihilangkan dari analisis semua perusahaan karena
informasi yang tidak tersedia.
6 Instrumentasi. Identik bahan, instruksi dan prosedur harus digunakan
sepanjang studi, selain di mana perawatan sedang delib-erately bervariasi. Jika
instrumen menghasilkan ukuran yang berbeda dari hal yang sama di bawah
kondisi yang berbeda, maka ini menunjukkan bahwa prob-lems kontekstual
terkait dengan instrumen, dan administrasinya, memiliki validitas internal yang
mengancam ancaman.

Kecelakaan atau perencanaan yang buruk yang menyebabkan inkonsistensi


mengancam validitas internal dan mungkin memerlukan ' scripting ' peneliti
untuk enyakin tidak ada distractors yang tidak disengaja, serta penggunaan
peneliti yang sama untuk administrasi semua percobaan atau wawancara di
kluster untuk meminimalkan bias peneliti. Ketika dampak dari beberapa
variabel yang berbeda sedang diuji simultaneouSly, banyak versi yang berbeda
tes instru-ment harus dipersiapkan. Ini harus diperiksa dengan cermat (dengan
cara yang sama seperti kertas pemeriksaan) karena halaman yang hilang, atau
kesalahan kasus, dapat membatalkan seluruh eksperimen. Jika kesalahan dari
jenis ini harus dibuat, maka mereka harus terjadi pada tahap percontohan
dengan audiens siswa-peneliti tidak mampu membayar risiko membuang-
buang dataset dengan audiens praktisi karena instrumen belum teruji. Sebagai
contoh, dalam tahap percontohan Smith dan Taffler (1996) menjadi jelas
bahwa sementara salah satu pengobatan termasuk ' mean ' data, yang lain
termasuk kedua ' mean ' dan ' standar deviasi ' data. Perbedaan dalam kinerja
grup mungkin disebabkan oleh perbedaan data, bukan untuk mengobati-ment
substantif, yang akan membatalkan hasil percobaan (meskipun dalam praktek
mata pelajaran akan cenderung mengabaikan standar data deviasi). Instrumen
harus dikoreksi dan seluruh percobaan kembali dijalankan untuk memastikan
integritas hasil.
E x p dan r i m dan n t untuk l r dan s dan r c
h 111

7 Pilihan. Subyek harus dialokasikan secara acak ke sel (kelompok untuk tujuan
perbandingan), tapi ini mungkin tidak mungkin untuk dicapai dalam praktiknya
atau tidak cukup untuk mengontrol semua variasi dalam sampel. Sebagai
contoh, asumsi bahwa kontrol untuk pengalaman dan jenis kelamin, sebelum
alokasi untuk sel acak, akan cukup mungkin tidak realistis jika ada kesenjangan
yang luas dalam karakteristik individu di antara subyek. Dalam studi jadisaya,
terutama dalam penelitian lapangan, randomisation mungkin mustahil untuk
dicapai. Di luar biasa orang lain mungkin tidak diinginkan. Dengan demikian,
Cheng et al. (1998) memilih peserta eksperimental berdasarkan gaya kognitif
mereka untuk mengeksplorasi dampak dari karakteristik tertentu. Bias
pemilihan juga dapat berinteraksi dengan variabel yang menarik bagi peneliti
dengan cara yang menghalangi kemampuan untuk generalisasi ke mata
pelajaran lain. Sebagai contoh, jika pemilihan mata pelajaran didasarkan pada
relawan interesTed dalam topik akuntansi, maka individu ini mungkin
mengharapkan perubahan dan bereaksi terhadap hal itu, dengan cara yang
varians terhadap bahwa sebuah ' dunia nyata ' pembuat keputusan yang kurang
tertarik pada Akuntansi. Dimana pemilihan subjek pada dasarnya adalah
pilihan diri ProCess (sangat umum kasus di
percobaan akuntansi), maka pengalaman pribadi dan ekspektasi dari mereka
yang begitu tertarik mungkin tidak sesuai dengan yang lebih represen-tative set
individu.
8 Regresi Statistik. Akan ada kecenderungan statistik untuk hasil yang
berurutan dari individu untuk mundur menuju mean. Hal ini harus tercermin
dalam interpretasi dari pola hasil berturut-turut dari masa ke waktu. Dengan
demikian, di mana subyek menghasilkan nilai yang sangat tinggi/rendah dalam
satu tes, mereka cenderung tidak melakukan hal yang sama pada yang
berikutnya; mereka lebih cenderung untuk mundur menuju mean.
9 Imitasi perawatan. Dimana subyek dapat berkomunikasi satu sama lain
adalah mungkin bahwa kita tidak akan mencapai tanggapan independen. Hal
ini dapat diatasi secara expengaturan perimental dengan meminta subyek untuk
tidak
berkolaborasi, atau dengan memanipulasi perintah instrumentasi untuk
menghalangi perbandingan penggunaan, atau dengan menyediakan proses '
filler ' untuk menduduki subjek yang berpotensi mengganggu.
10 Mengerikan demoralisasi. Perawatan yang berbeda dapat menyebabkan
berbagai tingkat motivasi di antara subyek, dengan dampak konsekuen pada
hasil. Misalnya, subjek yang menerima masukan pada satu eksperimen
mungkin lebih termotivasi untuk eksperimen berikutnya, dibandingkan dengan
yang tidak.

Ancaman terhadap validitas eksternal

Christensen (1994) menentukan tiga bentuk keprihatinan validitas eksternal.


1 Validitas populasi. Temuan penelitian harus generalisable kepada orang lain,
perusahaan, negara, dan/atau budaya, sebagai appropriate. Tetapi banyak
sampel penelitian tidak representatif-sering karena masalah akses
112 researchMethodsinaccounting

dalam pengaturan studi Lapangan-membuat perpanjangan dari temuan


bermasalah. Trotman (1996) menunjukkan bahwa variabilitas kasus
merupakan ancaman validitas eksternal yang signifikan, terutama jika jumlah
kasus ekstrim yang digunakan dalam percobaan adalah varians dengan mereka
yang dihadapkan pada praktek.

2 Validitas ekologis. Temuan penelitian dapat digeneralisasi untuk situa-tions


lain dan pengaturan lingkungan. Persyaratan ini taji mencari realitas yang lebih
besar dalam eksperimen dan meningkatkan perhatian pada konteks
eksperimen. Keterbatasan data sering memberikan kendala dalam penelitian
experi-mental karena desain disertai dengan penghapusan Rich-Ness data.
Persyaratan analitis juga memerlukan penggunaan metode kategorisasi data
agar dapat menggunakan tingkat perlakuan yang disederhanakan darivariabel
dinal (misalnya, ya/tidak, tinggi/rendah, terstruktur/tidak terstruktur) untuk
menonjolkan variasi yang diamati dalam Tipe ANOVA analisis.
3 Validitas temporal. Temuan penelitian dapat digeneralisasi sepanjang waktu.

Brownell (1995, halaman 13) mengidentifikasi tiga ancaman validitas eksternal


lebih lanjut.

1 Pengobatan/seleksi interaksi. Manajer organisasi biasanya memilih anggota


staf yang akan berpartisipasi dalam penelitian; mereka biasanya akan menjadi
' lebih baik ' pemain dan mereka akan selalu mereka yang memiliki beberapa
ime t!
2 Pengobatan/pengaturan interaksi. Tanpa replikasi (yang akan atau-Mally
tidak mungkin untuk mencapai) kita tidak dapat menggeneralisasikan temuan
dari kelompok tertentu orang dalam sebuah organisasi untuk orang lain pada
tingkat yang berbeda atau di lokasi lain atau diorganisasi fferent.
3 Pengobatan/pengobatan interaksi. Di mana perawatan sebelumnya tampak
berdampak pada yang berikutnya (dalam desain eksperimental dalam subjek),
mungkin ada hubungan bersyarat yang memerlukan perancangan ulang model
penelitian.

Eksperimen dirancang untuk mencapai validitas internal dalam rangka untuk


mengkonfirmasi atau mendiskonfirmasikan teori yang ada. Teori semacam itu
kemudian dapat digeneralisasi untuk memberikan validitas eksternal. Namun,
kondisi eksperimental mungkin begitu ekstrem bahwa mereka beruang sedikit
kemiripan dengan aktualitas, membuat generalisasi sulit. Replikasi akan membantu
dalam verifikasi hasil, tetapi literatur Akuntansi sangat benci untuk
mempublikasikan replikasi alam ini, sehingga mereka cenderung tidak akan
dilakukan.
Oleh karena itu possibili Ty ada bahwa penelitian akan menghasilkan temuan
sampel khusus. Hal ini dapat menjadi hasil dari proses seleksi sampel non-
perwakilan atau fakta bahwa kombinasi yang tidak biasa dari berbagai masalah
validitas antar-nal telah menyebabkan hasil yang aneh untuk proyek penelitian
tertentu.
E x p dan r i m dan n t untuk l r dan s dan r c
h 113

Quasi-penelitian eksperimental

Eksperimen yang dilakukan di lapangan masih muncul sangat jarang dalam


literatur, terutama karena kendala yang diberlakukan oleh akses, pertimbangan etis
dan bahkan Serikat buruh. Kendala semacam itu sama sekali tidak membatasi dalam
1924, ketika serangkaian eksperimen dimulai yang telah menjadi salah satu contoh
yang paling terkenal dari eksperimen-di-lapangan, meskipun largEly untuk alasan
yang salah. Eksperimen Hawthorne (Mayo, 1933; Roethlisberger dan Dickson,
1939) tetap menjadi indikator klasik dari apa yang bisa salah di bawah kondisi
eksperimental ketika perencanaan tidak cukup mengantisipasi berbagai
kemungkinan tanggapan. Eksperimen ini dilakukan pada periode 1927 – 32 di
Western ELECTRICS ' Hawthorne bekerja di Chicago, dan meneliti hubungan
kausal yang seharusnya antara produktivitas, sebagai tergantung Vari-able, dan
kondisi kerja fisik. Yang terakhir ini didefinisikan dalam hal kombinasi
pencahayaan, suhu, kelembaban dan frekuensi waktu istirahat. Tingkat
produktivitas sebelum periode eksperimental digunakan untuk mencocokkan dua
kelompok – kelompok eksperimental dan kontrol – dan pengobatan alternatif
diterapkan untuk mengamati dampak dari variasi empat variabel dependen. Tapi
output dalam kelompok eksperimental meningkat untuk semua perawatan (bahkan
mereka dimaksudkan untuk menginduksi produktivitas yang lebih rendah), dan
output dari kelompok con-trol meningkat tanpa penerapan perawatan apapun.
Manipulasi lebih lanjut, termasuk memperpanjang hari kerja dan menghilangkan
waktu istirahat, juga gagal untuk membatasi peningkatan yang diamati dalam
produktivitas! Yang uncon-trolled menengahi variabel yang terkait dengan perilaku
karyawan (terutama atti-tudes, nilai dan norma), bersama-sama dengan
pelaksanaan percobaan, tampaknya berkolusi untuk menghasilkan hasil kebalikan
dari mereka yang diantisipasi. Sejumlah isu penting muncul dari ini, yang memiliki
implica yang lebih luas untuk penelitian eksperimental:

 The ' Pencocokan ' proses yang digunakan membawa kita untuk percaya bahwa
kita mungkin tidak membandingkan seperti dengan seperti. Randomisasi dalam
penugasan subyek ke kelompok lebih disukai, terutama jika kita ingin
 melakukan analisis statistik.
 Kegagalan untuk mengisolasi experimental dan kelompok kontrol di bawah
 kondisi eksperimental identik memberikan ancaman terhadap validitas internal.
 Eksperimen awal hanya mencakup enam personel perempuan (meskipun
jumlahnya lebih dari 40.000 orang dipekerjakan di Hawthorne), menyarankan
 agar sampel tersebut tidak representatif.
 Mata pelajaran unco yang berpotensi dikecualikan dari experi-ment sehingga
kita dapat berhadapan dengan kelompok yang bias dan tidak representatif.
114 researchMethodsinaccount ing

 Kematian eksperimental adalah masalah serius dengan studi longitudinal


semacam ini; absensi dan terminasi menghasilkan penghentian pengumpulan
 data.
 Sejumlah besar variabel campur tangan yang terkait dengan karyawan ' atti-tude
untuk bekerja dan satu sama lain telah diabaikan (misalnya, pengaruh keamanan
kerja).

Hasil eksperimental yang aneh mungkin sebagian akan dijelaskan oleh jenis
perilaku yang dirujuk oleh Weber dan Cook (1972); karyawan sangat senang bahwa
seseorang mengambil minat Activdalam pekerjaan mereka bahwa mereka berusaha
untuk memberikan apa yang para peneliti Cari-yaitu, peningkatan produktivitas. '
Mengejutkan ' hasil yang dialami oleh para peneliti, kemudian disebut ' Hawthorne
Effect ', telah menjadi terkait dengan Okurrences di mana perilaku kelompok
berasal dari mereka melihat diri mereka sendiri sebagai ' SPE-cial ' dalam situasi
baru. Hasilnya karena itu disebabkan oleh kondisi eksperimental, dengan mediasi
variabel mengaburkan hubungan kausal di bawah investigation dan mengancam
validitas internal percobaan. Kita mungkin berpendapat bahwa para peneliti
seharusnya tidak telah ' sur-prised ' oleh hasil ini karena Myers (1924, p. 28)
sebelumnya melaporkan hampir identik hasil dalam Contex substansial miript.
Dalam paralel akuntansi, Smith dan Taffler (1995) melaporkan perilaku subjek
yang tak terduga selama melakukan percobaan mereka dalam bahwa responden
semua memilih untuk mengadopsi keputusan-membuat heuristik untuk mengurangi
beban pengambilan keputusan di bawah con-ditions dalam formasi yang berlebihan.
Mereka telah diharapkan untuk mengevaluasi kembali hasil deci-Sion secara
terpisah, dan pengujian hipotesis mengharuskan mereka untuk melakukannya, tapi
tidak ada yang melakukannya. Analisis dari temuan eksperimental dan kesimpulan
karena itu dibatasi dengan cara yang mungkin nOT terjadi memiliki penulis
mengantisipasi kejadian ini dan merancang ulang dengan persetujuan-ingly. Lebih
lanjut, mereka memerlukan tambahan, dan tidak direncanakan, analisis dari
heuristik jangka waktu yang berbeda yang digunakan. Svenson (1979),
dalamliteratur Al psikologis, telah membayangi hanya semacam ini perilaku dalam
situasi yang berlebihan informasi.

Ancaman yang diamati untuk validitas yang terkait dengan ' Hawthorne Effect
' dapat dibagi dengan mudah dalam tiga cara:

 indexicality: variasi hari-hari behaviour oleh individu dalam percobaan Lon-


 gitudinal;
 Efek eksperimen: bias yang diperkenalkan dari peneliti berperilaku berbeda-
baik dari hari ke hari dan antar kelompok, menyediakan infor-mation yang tidak
 diinginkan yang menghasilkan hasil yang berbeda;
 subjek mediation: perbedaan yang terkait dengan individu menafsirkan
persyaratan tugas yang berbeda.

Implikasi untuk ketiga efek pada penelitian akuntansi dapat digambarkan masing-
masing sebagai:
E x p dan r i m dan n t untuk l r dan s dan r c
h 115

 ancaman validitas eksternal karena subjek tidak akan berperilaku sama dalam
konteks yang berbeda, atau bahkan dalam konteks yang sama pada periode
 waktu berikutnya;
 ancaman validitas internal yang terkait dengan penggunaan peneliti yang
berbeda untuk administrasi mantanperiment, ketika mereka tidak scripted atau
 pendekatan percobaan dalam mode identik (Lihat Rosenthal, 1966);
 ancaman validitas internal, berasal dari asumsi tentang karakteristik pribadi,
kemampuan dan motivasi mata pelajaran penelitian, dan thEIR pemahaman
tentang tugas eksperimental dan instrumentasi.

Jenis hasil yang diamati dalam studi Hawthorne memberikan peringatan perawatan
yang diperlukan jika kita merenungkan pencarian untuk validitas eksternal yang
lebih besar dalam pengaturan eksperimental. Quasi-eksperimental Desain, terkait
dengan bergerak keluar dari laboratorium, bertujuan untuk mengurangi kefasialan
situasi. Sebuah trade-off validitas internal tidak dapat dihindari, karena kurangnya
con-trol atas kedua variabel asing dan Grou PS berpartisipasidapat membuat
manipulasi perawatan yang mustahil, yang mungkin, sebagai konsekuensi,
mengancam validitas internal. Quasi-desain eksperimental biasanya menghalangi
penugasan acak subyek untuk kelompok pengobatan. Ketidakhadiran ini
memerlukan teori suara di luarset, dan penggunaan pra-tes sebelum manipulasi
perawatan, sehingga untuk membangun dasar untuk evaluasi penilaian. Penggunaan
kelompok kontrol-tanpa pengobatan-juga membantu, tetapi mungkin impossi-BLE
untuk mencapai.

Masalah tambahan, atas dan di atas yang sudah dicatat untuk eksperimen
benar, muncul di lapangan karena kebutuhan untuk berkolaborasi erat dengan
organisasi yang menyediakan akses. Manajer sering tidak terlalu con-cerned
tentang penelitian, tetapi tertarik lebih dalam temuan yang mungkin digunakan-
FUL untuk organisasi mereka. Mereka mungkin memperlakukan studi sebagai
latihan pemecahan masalah atau tugas konsultasi, dan acuh tak acuh terhadap riset.
Mereka mungkin bersikeras pada alokasi mereka karyawan untuk kelompok
pengobatan (dengan-Out tugas acak) dan melihat kelompok yang tidak menguji
beberapa kesempatan perbaikan sebagai pemborosan sumber daya (yang akan
berarti tidak ada kelompok con-trol baik).

Kesulitan tersebut dapat membujuk beberapa peneliti untuk mengadopsi


pendekatan rahasia, memimpin mereka untuk Introduce manipulasi tanpa
manajemen atau karyawan yang sepenuhnya menyadari mereka. Terlepas dari
masalah etika yang terjadi dengan tindakan seperti itu, hasil yang sering tidak
berharga karena manipulasi untuk pengobatan mungkin harus begitu kecil, agar
mereka untuk diperkenalkan secara rahasia, bahwa mereka pergi tanpa diketahui
dan tidak akan menghasilkan Efek. Lebih buruk lagi, jika kepercayaan hilang
dengan agen yang mensponsori, maka akses mungkin ditolak dan karyawan dapat
menolak untuk bekerja sama dengan tepat.
Mengingat kesulitan, sulit untuk tidak membaca beberapa laporan dari kuasi-
penelitian eksperimental dan membentuk kesan bahwa penelitian telah melarikan
diri dari peneliti! Temuan yang menarik, tetapi peneliti adalah strug-Gling untuk
membenarkan baik metode mereka dan derajat mereka kontrol over seluruh
Penelitian studi.
116 researchMethodsinaccounting

Perencanaan rinci pada tahap desain sangat penting dalam pengaturan


eksperimental. Meskipun demikian, sangat sulit untuk menjadi 100 persen tertentu
dari covering segala sesuatu yang dapat menyebabkan kesulitan, yang berarti bahwa
percobaan tambahan mungkin diperlukan untuk memperbaiki kekurangan. Dimana
akses ke subyek sangat dibatasi, berdasarkan waktu atau ketersediaan, ini dapat
problematis, dan setidaknya akan delay analisis.
7
Survey penelitian

CHAPTERCONTENTS

Survei mail 117


masalah desain dan perencanaan 120
Pengujian pilot 122
Pengumpulan data 123
Kesalahan pengukuran 126
Metode Interview 128

Metode survei sering dikritik sebagai ' eksperimen orang miskin ' karena
ketidakmampuan mereka untuk menetapkan mata pelajaran secara acak untuk
pengobatan, dan ketidakmampuan mereka untuk mengesampingkan hipotesis
saingan. Brownell (1995, hlm. 31), antara lain, mengakui ancaman validitas
internal, tetapi ia berpendapat bahwa studi survei dapat dirancang untuk
meminimalkan ancaman tersebut, sementara mengoptimalkan manfaat validitas
eksternal mereka. Dia menekankan perlunya teori yang baik dalam rangka untuk
mendukung spesifikasi hubungan sebab-akibatPS.
Survei dapat dilakukan melalui surat, telepon, e-mail, internet atau wawancara
tatap muka. Masih ada sangat sedikit literatur di domain akuntansi sehubungan
dengan e-mail atau penelitian berbasis Internet. Metode dominan tetap Surat survei
dan tatap muka wawancara, masing-masing dengan advan-Tages sendiri dan
kerugian. Kedua metode ini memberikan fokus bab ini, dengan penekanan pada
mantan.

Survei mail

Muda (1996, p. 55) menyoroti penurunan metode survei mail dalam akuntansi
manusia-agement, setelah periode lebih dari 25 tahun, di mana ia telah
118 researchMethodsinaccounting

menjadi metode penelitian unggulan yang digunakan dalam disiplin. Dia diupeti
penurunan untuk tiga faktor utama:

1 Sebuah minat yang berkembang dalam bentuk alternatif penelitian yang dapat
memberikan sumber data yang lebih kaya.
2 Meningkatnya kesulitan memiliki studi survei surat yang diterbitkan dalam
jurnal menjadi Wasit utama.
3 Keraguan tentang kegunaan penelitian survei dalam akuntansi karena telah
gagal untuk menghasilkan tubuh kohesif pengetahuan tentang praktek
akuntansi dan kontrol, meskipun 25 tahun mencoba untuk melakukannya.

Brownell (1995, p. 60) juga mempertanyakan dominasi survei iyaon-naires dalam


penelitian Akuntansi Manajemen, dan ketergantungan pada instrumen yang diambil
dari perilaku organisasi. Bersama-sama, kedua memberikan kelemahan yang
berpotensi serius, sehingga pertanyaan konteks ' biasanya ditangani baik atau tidak
sama sekali ' dalam studi survei eksperimental dalam akuntansi. Titik keempat
dapat ditambahkan ke daftar di atas – sulitnya mencapai tingkat respons yang
memadai terhadap survei email, meskipun mengikuti pedoman yang dinyatakan.
Sebagai contoh, Brown et al. (2000) melaporkan tikus tanggapane hanya 13%
meskipun menggunakan sampel yang telah di-alized dengan dukungan dari
organisasi yang mensponsori.
Muda analisis studi survei surat yang diterbitkan dalam jurnal besar (akuntansi
review, akuntansi organisasi dan masyarakat, jurnal penelitian Akuntansi
Manajemen dan Perilaku penelitian akuntansi) selama periode 1985 – 94
mengidentifikasi sejumlah kesulitan umum:

 populasi target rendah (rata-rata hanya 207);


 jumlah responden yang rendah (hanya 146-rata);
 beberapa studi menggunakan tindak lanjut prosedur untuk meningkatkan
 ukuran sampel;
 tidak adanya analisis bias non-respon;
 tidak adanya studi menggunakan ukuran subjektif dan obyektif dari kinerja;
 tidak adanya penggunaan prosedur sampling; Dan
 kegagalan untuk mengumpulkan baik data faktual dan psikologis dalam studi
yang sama, sehingga tidak mungkin untuk menghubungkan praktek dengan
variabel perilaku.

Kegagalan tersebut menyebabkan kesan bahwa penelitian survei jarang penelitian


yang baik, dan karena itu hanya dilengkapi dengan sangat lengkap untuk publikasi
di outlet paling bergengsi.
Muda (1996, p. 67) mengidentifikasi tujuh peluang peningkatan:

1 Program penelitian untuk menetapkan kerangka kerja untuk penelitian.


Masih ada kebutuhan mendesak untuk mengembangkan tubuh yang koheren
pengetahuan dalam Akuntansi Manajemen , untuk mencocokkan mereka yang
di bidang keuangan dan akuntansi keuangan. Penelitian oportunistik hingga
saat ini memiliki perkembangan yang terbatas dalam hal ini sehingga ' dampak
anggaran ' tetap menjadi area utama dalam saluran bantuan yang telah diteliti
secara ekstensif.
S Anda v e y r e s e a R c h 119

2 Metode sampling mengarah ke pengujian teori yang lebih kuat. Random


sampling biasanya tidak praktis sehingga kenyamanan sampling predomi-
nates. Kritik semacam itu berlaku untuk penelitian akuntansi pada umumnya,
dan membuat penerapan pengujian Statistik standar penuh dengan bahaya.

3 Penggunaan metode tipe Dillman untuk mencapai ukuran sampel yang


lebih besar. Tindak lanjut prosedur (Dillman (1978) menyarankan mengirim
dua pengingat) dan sponsor oleh organisasi yang berpartisipasi dapat
meningkatkan tanggapan, tetapi akan dikenakan biaya tambahan dan
kurangnya kontrol penelitian. Jika kita ingin guaran-Tee anonimitas dalam
pelaksanaan survei, sebagai pedoman etika memerlukan, maka respons survei
tidak boleh menyertakan nama atau posisi (atau per-perusahaan) dari
responden, untuk mencegah hubungan antara individu particu-Lar dan respons
survei tertentu. Hal ini akan meningkatkan biaya yang terkait dengan tindak
lanjut pengingat karena surat akan dikirim ke kedua responden dan non-
respondens (sering kali untuk gangguan dari mantan). Ada godaan untuk
mengadopsi sistem penomoran yang tidak etis, warna coding, atau bahkan tinta
tak terlihat (!) untuk mengidentifikasi peserta, sementara muncul untuk
memberikan anonimitas, tetapi penggunaan dual-respon mecha-NISM
(anonim kuesioner ditambah bernama kartu pos) biasanya memenuhi baik
biaya dan etika keprihatinan.

4 Mengatasi masalah bias non-respon. Tidak adanya referensi untuk non-


respon dalam banyak diterbitkan kertas, atau di mana-mana catatan kaki untuk
efek yang non-respon tidak dianggap sebagai masalah, adalah keprihatinan.
Mereka menyarankan bahwa tidak ada upaya serius telah dilakukan untuk
memeriksa masalah ini.

5 Bergerak menjauh dari instrumen survei yang ketinggalan zaman. Hal ini
masih umum untuk melihat makalah yang diterbitkan dalam 2002
menggunakan instrumen standar seperti mereka devel-oped oleh Mahoney et
al. (1963) untuk kinerja dilaporkan sendiri; Milani (1975) untuk partisipasi
anggaran; dan MacDonald (1970) untuk toleransi ambiguitas. Usia mereka
menunjukkan bahwa itu harus mungkin untuk menghasilkan yang lebih relevan
Current instrumen, tetapi insentif untuk melakukannya yang ramping. Sebuah
instrumen baru rentan dan membutuhkan pengujian ekstensif, dan tidak ada
studi yang bersifat korsatif menggunakan instrumen yang sama. Kami
mengamati trade-off klasik antara keandalan dan membangun validity, pilihan
instrumen yang diterima dengan baik dan dapat diandalkan yang mungkin
hanya sekitar menangkap konstruksi yang menarik. Dengan demikian
Merchant (di Brownell, 1995, p. 149) menggunakan LBDQ (Daftar perilaku
pemimpin kuesioner) diadaptasi oleh Aiken dan Hage (1968) frOM Halpin
instrumen yang dikembangkan pada tahun 1950-an. Lbdq mengukur dua
dimensi kepemimpinan (pertimbangan dan orientasi tugas) sementara
Merchant (1985) menggunakannya untuk mengukur ' orientasi detail ',
meskipun ia kemudian menunjukkan bahwa cerna inst tertentumungkin kurang
optimal.
6 Pengembangan survei atas dasar pengetahuan organisasi yang
ditingkatkan. Jika instrumen survei tidak sesuai dengan
120 researchMethodsinaccounting

' bahasa ' perusahaan yang terlibat, maka respon akan terbatas karena
dianggap tidak relevan survei.

7 Bergerak menjauh dari tindakan subjektif yang dilaporkan sendiri untuk


evaluasi yang lebih objektif. Young mengamati ketiadaan hampir Total, yang
bisa dibilang, peringkat unggul lebih objektif. Namun, penulis lain (terutama
Brownell, 1995, p. 44) menunjukkan bahwa kritik seperti kinerja yang dinilai
sendiri over-menyatakan, dan bahwa peringkat unggul hanya mungkin menjadi
kesalahan karena berbagai subordinates di bawah kendali satu oleh supervisor.

Masalah desain dan perencanaan

Sejumlah pertanyaan mendasar perlu dijawab pada tahap desain.

1 Apa jenis survei yang kita merenungkan? Persyaratan pertanyaan penelitian


dan dampak dari perbedaan biaya, misalnya, akan menjadi penting dalam
menentukan apakah survei Surat konvensional sesuai, atau jika survei yang
dilakukan melalui telepon, e-mail atau melalui Internet akan menghasilkan
lebih unggul dan/atau lebih hemat biaya hasils. mail kuesioner memungkinkan
sampel yang cukup besar untuk mengurangi kesalahan sampling ke tingkat
yang dapat diterima, dengan biaya jauh lebih rendah daripada baik telepon atau
tatap muka wawancara. Selain itu, survei mail tidak memberikan kesempatan
bagi bias pewawancara, masalah serius yang ampuhdalam wawancara tatap
muka dan telepon.

2 Apa jenis responden yang kami targetkan? Ini akan membuat banyak
perbedaan pada tahap perencanaan, tergantung pada apakah kita menargetkan
penduduk pada umumnya atau proporsi yang sangat sesuai Spesific-misalnya
kelompok profesional Parti-cular, atau bahkan CEO. Semakin sempit
pengelompokan, yang lebih penting adalah bahwa kita telah up-to-date rincian
mailing individu yang akan dihubungi. Jika kita ingin menghubungi anggota
yang sangat spesifiks dari populasi (misalnya, set kembar untuk studi
lingkungan di mana kita ingin menghilangkan dampak keturunan), kita
mungkin harus beriklan untuk peserta.

3 Pertanyaan apa yang kita inginkan jawaban? Ini mungkin tampak jelas,
tetapi hal ini membantu dalam hal ini jika kita telah dengan cermat
menentukan pertanyaan penelitian (s) dan hipotesis untuk mengarahkan respon
yang diharapkan. Terlalu sering dalam makalah penelitian dan disertasi
tampaknya bahwa survei telah dilakukan pertama, mungkin karena
ketersediaan oportunistik akses, tanpa pertanyaan penelitian benar-benar telah
dipikirkan melalui. Ini dengan cepat menjadi jelas ketika pertanyaan kunci yang
seharusnya diminta adalah
S Anda v e y r e s e a R c h 121

ditemukan tidak telah diminta di kemudian devedisusun pertanyaan penelitian.


Roberts (1999) menunjukkan bahwa praktik terbaik dalam pengembangan
instrumen dan kuesioner menentukan bahwa review ekstensif dari instrumen
terkait dilakukan pertama, dan bahwa di mana instrumen harus tujuan-
dibangun ataudapted, pengujian percontohan diperlukan untuk mengatasi
masalah relevansi dan susunan kata.

4 Apa respon kategori yang kita merenungkan? Misalnya , apakah kita


meminta pendapat, penilaian atau pengetahuan? Apakah kita menetapkan
pertanyaan yang ditutup (membutuhkan Yes/No, Skala Likert tanggapan atau
Tick-a-Box jawaban jenis) atau terbuka (yang memungkinkan respon narasi
dianggap)? Kita perlu mengatasi masalah ini sejak dini atau mereka bisa
kembali menghantui kita. Jika kita mengharapkan tanggapan narasi, misalnya,
maka kita harus Pro-vide responden dengan ruang yang cukup untuk
memberikannya; jika kita memiliki surat massal-Out, kita perlu sistem
pengkodean yang efisien untuk menangani semua pertanyaan tertutup; jika kita
meminta pengetahuan , maka pertanyaan harus mengacu pada item yang kita
dapat cukup berasumsi kembalispondent untuk mengetahui tanpa hav-ing
untuk mencari atau mencari rincian. Salah satu kritik yang paling serius dari
penelitian survei (misalnya, Chua, 1996) adalah bahwa pertanyaan yang
diajukan sering begitu kompleks sehingga kuesioner survei berhenti menjadi
yang paling appro-priate sayathod pengumpulan data.

5 Apa urutan pertanyaan yang hendaknya kita Kejar? Ada berbagai opin-
ion mengenai apakah pertanyaan termudah dan terpendek harus di awal
kuesioner atau di akhir. Beberapa penulis (misalnya, Parker, 1992)
menyarankanpada pertanyaan singkat dan mudah harus digunakan pada awal-
Ning, yang mengarah ke pertanyaan paling meatiest di tengah survei, diikuti
dengan pertanyaan yang relatif lebih pendek dan lebih mudah menjelang akhir
dalam rangka untuk mendorong penyelesaian seluruh dokumen survei; lain-
lain (misalnya, bryman, 2001, p. 117) menyarankan bahwa pertanyaan awal
harus jelas relevan dengan topik penelitian dan tidak boleh mengatasi masalah
pribadi seperti usia, pengalaman dan latar belakang pendidikan. Pada tahap ini
kita juga harus mempertimbangkan apakah akan ada efek pesanan, yaitu,
apakah kita telah menghasilkan jawaban yang berbeda dengan memesan
pertanyaan secara berbeda? Jika kita berpikir bahwa hal ini mungkin, kita harus
jalankan kembali survei dengan audiens percontohan yang lebih kecil untuk
menentukan apakah atau tidak ketakutan kita dibenarkan.

6 WHat tata letak instrumen survei? Kebanyakan penulis setuju bahwa survei
tidak boleh terlalu lama, tapi itu, yang lebih penting, harus dibuat menarik dan
relevan dengan target audiens. Kuesioner yang panjang lebih hemat biaya,
tetapi hanya jika mereka sebenarnya akankembali! Opti-mum panjang
tergantung pada format instrumen survei (misalnya, keinginan untuk
meninggalkan ruang putih, atau persyaratan untuk memberikan kesenjangan
untuk input Narra-tive), tetapi seharusnya tidak biasanya lebih besar dari empat
halaman untuk umum POpulation. Kelompok spesialis mungkin menoleransi
sesuatu yang sedikit
122 researchMethodsinaccounting

lagi, mungkin dari urutan enam halaman. Mempertahankan minat dan motivasi
yang berarti bahwa responden yang khas spemilihan dapat menyelesaikan
instrumen dalam waktu kurang dari 20 menit.

7 Bagaimana kita memilih sampel? Hal ini penting dan kelemahan dalam
banyak makalah, di mana masalah tampaknya telah disikat samping-mungkin
karena mereka belum cukup ditangani di tempat pertama. Ada beberapa
pertimbangan utama: Apakah kita tahu ukuran populasi dan item konstituen?
Dalam banyak proyek penelitian akuntansi jawaban atas pertanyaan ini adalah
tidak. Sebagai hasil metode ilmiah pilihan sampel menghalangi, dan kita perlu
untuk menarik sampel oportunistik atau kenyamanan begitu umum dalam
literatur-meskipun mereka mungkin ' berdandan ' untuk terlihat seperti sesuatu
yang lebih sistematis. Jika kita memiliki popula-tion yang diketahui, kita
mungkin akan memiliki sampling frame tersedia (sebuah buku tahunan
pertukaran saham, misalnya, untuk perusahaan, atau daftar pemilu untuk
individu). Kemudian, kami dapat melakukan sampel secara acak dari populasi
ini (per-kecelakaan menggunakan generator bilangan acak), atau memilih
setiap item ke-n untuk memberikan ukuran sampel yang diperlukan , atau
menstratifikasi populasi sesuai dengan karakteristiknya untuk memastikan
bahwa kami memberikan sampel representatif. Ada rumus matematika untuk
menghitung ukuran sampel yang diperlukan untuk memberikan akurasi statistik
yang diperlukan dari perkiraans, tetapi biasanya lebih mudah untuk kembali ke
pertanyaan penelitian dan hipotesis. Kita harus dapat menentukan tes yang
ingin kita lakukan, dan jumlah cara yang akan dibagi data; kita dapat
mengidentifikasi semua sel analisis dan kami ingin setidaknya sepuluh (20
lebih baik) item di masing-masing untuk memberi kami kepercayaan dalam
melakukan tes statistik yang dimaksud. Jika kami tidak dapat secara memadai
menyelesaikan masalah pesanan pada tahap uji coba survei, maka persyaratan
untuk versi multi-PLE dari instrumen akhir akan memperluas ukuran sampel
yang dibutuhkan oleh multipel yang sama. Sebagai contoh, kita tidak ingin
berada dalam posisi di mana kita ingin menguji efek gender, katakanlah,
dengan data pada individu, dan kemudian menemukan kita memiliki terlalu
sedikit perempuan dalam sampel (yang terjadi lebih often dari yang seharusnya
dengan data akuntansi). Demikian pula, ketika pengujian untuk efek industri
dengan data perusahaan, kita mungkin memiliki terlalu sedikit retail represen-
tatives, meskipun dengan beberapa negara (misalnya, Australia dan Selandia
Baru) populasi sendiri mungkin tidak besar enough untuk menghasilkan sampel
yang diperlukan untuk melakukan tes dari semua hubungan yang diinginkan.

Pengujian pilot

Ekstensif piloting dari instrumen survei sangat penting untuk menunjukkan bahwa
hal itu mampu menghasilkan tanggapan yang diperlukan dari target Audience.
Meskipun survei sering diuji pada kolega akademik atau mahasiswa tingkat sarjana,
ini membantu jika anggota populasi target, yang telah dikecualikan
S Anda v e y r e s e a R c h 123

dari sampel, digunakan untuk mengukur kelangsungan hidup. Instrumen


percontohan harus merupakan draf lanjutan dari dokumen yang secara memadai
mewakili perkembangan penelitian dari konsep abstrak, melalui pengembangan
con-structs yang valid, hingga Identifikasi pertanyaan eceranAl yang andal.
Sejumlah isu penting akan muncul pada tahap ini, yang harus ditangani secara
memuaskan:

 pertanyaan harus jelas, sederhana dan mudah dimengerti;


 pertanyaan dan surat pengantar harus ditargetkan terhadap sudut pandang
respon-Dent sehingga mereka jelas relevan dengan target audiens. Setiap jargon
atau terminologi industri yang digunakan harus spesifik teknologi sehingga
 dapat meningkatkan tingkat respons;
 pilihan kata harus berhati-hati, menghindari slang, singkatandan istilah apapun
 dengan makna yang berpotensi ambigu;
 tidak boleh ada ' berlaras ganda ' pertanyaan karena jika lebih dari satu
 jawaban tampaknya dicari, kebingungan akan hasil;
 negatif ganda harus dihindari, karena mereka akan sering misunderstood;
 Namun, pengkalimatan kata harus digunakan untuk mencegah responden dari
tidak terpikir ' mencentang kotak kanan ', katakanlah, tanpa membayar referensi
 untuk makna yang tepat dari pertanyaan;
 responden harus memiliki pengetahuan dan keterampilan untuk melengkapi
mereka untuk menjawab pertanyaan. Ini saat ini menjadi masalah dalam
penelitian audit yang ditargetkan pada bawahan di perusahaan akuntansi-tingkat
kompleksitas dalam beberapa survei menempatkan tuntutan yang tidak realistis
 pada mereka yang menanggapi survei;
 pertanyaan yang tidak mampu menghasilkan jawaban yang handal harus
dihilangkan. Dengan demikian, mempertanyakan individu dalam penelitian
sosial tentang perilaku seksual mereka, kebiasaan perjudian, penyalahgunaan
narkoba atau alkohol tidak mungkin untuk menghasilkan tanggapan yang akurat.
Dalam penelitian akuntansi , pertanyaan yang berkaitan dengan praktek
penipuan, perilaku disfungsional, pendapatan, dan bahkan posisi, dapat
menimbulkan jawaban yang menyesatkan. Demikian pula, pertanyaan yang
berkaitan dengan agama dapat menyebabkan kesulitan dalam penelitian lintas
 budaya;
 perhatian pada waktutidak en oleh responden percontohan dalam menyelesaikan
survei harus memberikan indikasi awal Apakah pertanyaan individu, atau
seluruh bagian, perlu dipangkas.

Untuk meningkatkan keandalan dan validitas pertanyaan individu seluruh Ques-


tionnaire harus Evaluated pada tahap percontohan sebelum melakukan survei yang
tepat. Sebuah studi percontohan besar juga akan memungkinkan evaluasi keandalan
dan validitas dari tindakan yang akan digunakan.

Pengumpulan data
Sejumlah pertimbangan lebih lanjut ARIse ketika kita fokus pada lebih rinci pada
koleksi data.
124 researchMethodsinaccounting

1 Daftar mailing yang relevan dan terbaru sangat penting. Penggunaan milis
yang ada mungkin memerlukan sponsor oleh organisasi host (misalnya, salah
satu badan akuntan profesional). The ' biaya ' dari sponsor dapat pengakuan dari
organisasi tuan rumah dalam setiap publikasi dan/atau beberapa kehilangan
kontrol dalam pelaksanaan survei dalam bahwa host Cantantibusation Han-
DLE penyelesaian dan kembali sehingga tidak ada jaminan untuk persis yang
telah menyelesaikan survei! Atau, pembelian database terkemuka mungkin
diperlukan. Ini bisa mahal untuk mailing list sempit yang terfokus. The
DevelopmentsNT dari milis dari satu sendiri dari ' awal ' adalah sangat
memakan waktu dan padat karya. Ini juga merupakan keterlibatan yang
berkelanjutan karena kewaspadaan harus dilakukan dalam mainte-Nance dari
milis. Tidak ada yang cenderung menyebabkan lebih conster-bangsa di antara
Penerima survei daripada jika salah satu target bernama sudah meninggal.

2 Survei harus menargetkan spesifik bernama responden. Ada banyak bukti


yang menunjukkan bahwa survei yang ditujukan kepada ' occu-Pant ' atau '
manajer ' atau beberapa individu yang tidak disebutkan namanya adalah
mereka yang paling mungkin diserahkan ke tempat sampah. Literatur penelitian
(misalnya, Dillman, 1978) menunjukkan bahwa survei harus ditargetkan
dengan nama dan Posi-tion, dan bahwa jika ada keraguan dalam hal ini mereka
harus dikonfirmasi di muka melalui telepon (misalnya, melalui pertukaran
perusahaan sebelum pengiriman survei. Dillman lebih lanjut menunjukkan
penggunaan Surat penutup yang jelas, idealnya pada kertas berkepala dan
ditandatangani oleh seorang pejabat yang diakui, yang spemilihan memberikan
instruksi jelas, jaminan kerahasiaan, dan demonstrasi tentang pentingnya survei
dan relevansinya dengan responden. Merchant (1985) cus-tomises instrumen
penelitiannya dengan memvariasikan istilah teknologi agar sesuai dengan
target Audience. Dengan demikian ia memastikan relevansi survei kepada
penerima, meningkatkan tingkat respons 95%, tetapi membahayakan relia-
bility melalui instrumen variabel.

3 Bagaimana kita mencatat jawabannya? Ini harus didirikan awal untuk Make
sebagian besar media yang dipekerjakan. Jika kita berurusan dengan survei
mail, maka metode manual akan mendominasi. Namun, jika kita memiliki
verbal (yaitu, wawancara atau respons telepon) atau tanggapan tertulis (yaitu,
jawaban narasi dalam survei manual, atau e-mail atau Internet Responses),
maka oppor-tunities ada untuk melakukan analisis kualitatif rinci narasi
melalui analisis konten teks, meskipun ini mungkin harus ditranskripsi dari
rekaman tape.

4 Umpan balik kepada responden? Tawaranhasil ggregated kepada responden


dapat memberikan insentif yang mendorong penyelesaian survei. Hal ini sering
lebih berhasil daripada tawaran hadiah atau imbalan nominal untuk kembali
survei. Dalam setiap peristiwa, Surat terima kasih kepada responden adalah
sopan santun, dan mungkin menimbulkan peningkatan kesediaan untuk lebih
lanjut
S Anda v e y r e s e a R c h 125

Keterlibatan. Sebagai contoh, mungkin mendorong responden untuk membuat


diri mereka tersedia untuk tindak lanjut wawancara, untuk memberikan baik
clarifica-tion dan detail. Jika respon masih tujuan utama, kemudian dicap
amplop ditangani, sebaiknya dengan perangko nyata daripada kode Bar, lebih
baik. Dillman (1978) merekomendasikan pengiriman dua pengingat tindak
lanjut untuk mendapatkan res ponses lebih lanjut, serta pemantauan cermat
periode liburan atau bisnis sibuk sehingga ini dapat dihindari untuk distribusi
survei (misalnya, menghindari survei perusahaan dekat dengan akhir tahun
keuangan, akhir tahun pajak, Natal atau Paskah).

5 OrganiSaSi. Lebih baik untuk berpikir ke depan. Pada tahap perencanaan kita
harus menyadari pengkodean yang diperlukan untuk jawaban tertutup, dan
juga dari metode analisis yang akan digunakan. Idealnya, tanggapan harus
dibaca-ily dapat ditransfer ke spreadsheet untuk manipul, atau untuk input spss,
untuk memfasilitasi analisis lebih rinci.

6 Masalah non-respon. Keprihatinan terbesar dalam penelitian survei adalah


kurangnya respon. Jika responden yang tidak representatif dan tingkat respons
yang sangat rendah, maka keraguan akan timbul tentang VAliditas temuan dan
potensi untuk bias diperkenalkan. Tingkat respons kurang dari 25% adalah
umum dalam penelitian akuntansi; pertanyaan yang sulit dijawab adalah
apakah responden berbeda secara signifikan dari non-responden. Non-respon
adalah hanya masalah jika kita dapat menunjukkan bahwa ada perbedaan sys-
tematic antara responden dan non-responden, dan bahwa perbedaan tersebut
akan berdampak pada temuan. Kondisi yang terakhir ini mungkin sulit untuk
ditunjukkan. Merchant (1985) menggunakan metode ' postcard ' untuk
menjamin anonimitas responden dan untuk membedakan antara responden dan
non-responden. Peserta diminta untuk melengkapi kuesioner dan kartu pos
terpisah, yang dikirimkan kembali ke peneliti secara independen. Dengan
asumsi bahwa responden memang mengembalikan kedua item, maka identitas
non-responden akan diketahui dan karakteristiknya dapat dibandingkan dengan
responden yang dikenal. Dengan tidak adanya perangkat semacam itu, kami
dipaksa untuk memperkirakan tindakanyang tidak dapat dilakukanoleh para
non-responden dengan melakukan proksi Karakteristik dari mereka yang
bertanggung jawab untuk merespon setelah pengingat terakhir. The implica-
tion adalah bahwa menit terakhir ini, hampir enggan, responden akan
menyerupai mereka yang tidak mengganggu to merespon sama sekali.

Dillman (1978) Total Design method (TDM) membayar atten-tion tertentu


dengan alasan non-response:

 Alamat yang salah di tempat pertama, atau pengiriman yang salah


 terpasang, mengakibatkan non-pengiriman;
 Surat yang belum dibuka dibuang karena terlihat terlalu banyak seperti
 Surat sampah melingkar atau lainnya;
 pengiriman adalah kepada orang yang tidak pantas, yang gagal untuk
meneruskannya dengan tepat;
126 researchMethodsinaccounting

 tidak ada motivasi untuk menyelesaikan survei ketika dibuka, sehingga


 dibuang;
 Penerima tidak dapat memahami instruksi penyelesaian dan/atau konten
 survei;
  instrumen survei untuk sementara ' disimpan ' karena tekanan waktu;
 Alamat kembali telah salah taruh, sehingga bahkan jika selesai, instrumen
survei tidak mendapatkan kembali.

Dia menangani setiap masalah ini dengan memastikan bahwa instrumen adalah
' benar ', bahwa mencapai orang yang benar, dan bahwa insentif untuk comple-
tion (hadiah atau imbalan moneter) disediakan. Dia juga lembaga serangkaian
rinci tindak lanjut:
 satu minggu setelah survei awal-dengan kartu pos pengingat (beberapa
peneliti menyarankan bahwa ini pengingat pertama harus dikirim segera
 setelah tiga hari setelah mailing asli!);
  tiga minggu setelah mailing awal-surat pengantar baru dan kuesioner;
 tujuh minggu setelah mailing awal – surat pengantar ketiga dan kuesioner.

Seluruh proses survei ini jauh lebih panjang dan lebih mahal daripada yang kita
mungkin biasanya merenungkan sebagai akibatnya, tapi Dillman dapat
menunjuk ke tingkat respons sebagai suatu kegembiraan.

Kesalahan pengukuran

Andrews (1984) menentukan tiga jenis kesalahan pengukuran: bias, kesalahan acak
dan terkorelasi (atau sistematis) kesalahan. Dia menyarankan bahwa desain
pertanyaan-naire yang lebih baik akan membantu mengatasi efek paling serius dari
kesalahan ini, termasuk:

 penggunaan banyak jawaban kategori skala mungkin, konsisten dengan


 kekikiran dan panjang survei;
  opsi ' tidak tahu ' jika sesuai;
 keeping jumlah item dikelompokkan bersama-sama (disebut ' panjang baterai ')
 kecil;
 penggunaan pertanyaan skala komparatif bilamana memungkinkan untuk
 memberikan dasar penilaian yang jelas;
 penggunaan skala peringkat linier, hanya dengan kategori ekstrem yang
 berlabel;
 peduli di panjang kedua ' baterai ' perkenalan dan pertanyaan (Recom-diperbaiki
sebagai antara 16 dan 24 kata-kata untuk mantan, dan lebih dari 16 kata-kata
untuk yang terakhir).
S Anda v e y r e s e a R c h 127

 memposisikan pertanyaan yang mudah dan kurang penting pada awal dan
akhir kuesioner.

Ukuran keandalan

Jika kita ingin menarik kesimpulan yang sah tentang hubungan di bawah investasi-
nya adalah penting bahwa ukuran variabel yang baik handal dan valid. Timbangan
multi-ITEm lebih disukai untuk timbangan satu item untuk dua alasan utama:

 banyak konstruksi merupakan konsep yang kompleks, dan kompleksitas ini


 lebih baik diatasi dengan mengajukan lebih dari satu pertanyaan;
 sejumlah item terkait dapat meningkatkan validitas karena kemungkinan bahwa
pertanyaan individu dapat disalahartikan atau disalahpahami, atau mereka
mungkin mengandung kata-kata terjawab pembalikan.

Ada beberapa metode yang umum digunakan untuk mengukur keandalan:

 Test-retest koefisien keandalan: instrumen yang sama adalah completed dua kali
oleh satu kelompok individu dalam jangka waktu singkat. Korelasi yang tinggi
antara tanggapan menunjukkan keandalan, tetapi hasil yang kedua kalinya
 sekitar mungkin telah dipengaruhi oleh penyelesaian pertama.
 Coeffic Reliability Split-Half: instrumen ini dilengkapi dengan satu kelompok
dan korelasi diukur antara dua bagian instrumen (biasanya antara pertama dan
terakhir untuk memeriksa efek kelelahan). Namun banyak kesalahan yang
disebabkan oleh pembalikan dalam kata tidak mengambil responden by,
menyarankan preferensi untuk pilihan acak dua bagian untuk tes-ing. Jika
korelasi antara kedua bagian tinggi, maka ini menunjukkan keandalan yang
tinggi pada dasar konsistensi internal; tetapi semakin lama pengujian, semakin
tinggi keandalan, dan cara pemisahan dilakukan cenderung berdampak pada
ukuran konsistensi/keandalan. Ekstensi logis untuk
ini kemudian merupakan generasi korelasi antar-item rata-
-

(r) didasarkan pada semua kemungkinan pairwise item.


 Alpha koefisien cronbach adalah ukuran yang paling banyak digunakan,
terutama untuk instrumen yang baru dikembangkan, dan mengatasi masalah
pemisahan, meskipun nilainya masih sepenuhnya tergantung pada jumlah item
(n) dalam instrumen. Dengan demikian kepekaan terhadap jumlah barang harus
dievaluasi untuk
menunjukkan keandalan.
- - (n!)
A= n (r) - dimana r dihitung dari rerata (No.2)! 2.
(1 (n - 1)- r) Koefisien korelasi .

Jadi untuk konstruksi empat-item, akan ada enam korelasi koefisien untuk
-

rata untuk menghasilkan (r). Alfa 0,8 biasanya dianggap memuaskan, meskipun
angka sedikit lebih rendah dari ini dapat diterima. Sejak Alfa cronbach tergantung
pada jumlah item yang disertakan, semakin banyak item yang lebih tinggi koefisien
cronbach. Koefisien yang sangat tinggi, yang dihasilkan dari terlalu banyak
128 researchMethodsinaccounting

pertanyaan, oleh karena itu dapat mencerminkan redundansi dalam instrumen.


Sebuah analisis sensitivitas dari Alfa untuk penghapusan item berturut-turut akan
mengungkapkan Apakah kita memiliki set yang penuh kekikalan yang konsisten
dengan keandalan.

Metode Interview

Banyak masalah yang terkait dengan diri penyelesaian kuesioner Surat juga berlaku
untuk metode wawancara, tetapi ada juga tambahan dan tak terelakkan ' orang '
masalah karena interaksi antara pewawancara dan diwawancarai. Namun, jika kita
dapatalegit kesulitan, wawancara menawarkan peluang yang lebih besar untuk
menangani masalah yang lebih kompleks dan luas daripada survei Surat
konvensional. Sejumlah format wawancara umum dalam literatur akuntansi, dan
ditujukan di sini. Studi kasus dan penelitian lapangan dianggap terpisah dalam bab
berikut.

1 Wawancara terstruktur. Ini adalah format yang paling erat resem-Bles bahwa
dari diri penyelesaian Surat kuesioner. Peluang untuk bias pewawancara
dibatasi dengan mencari konteks yang sama: pertanyaan yang sama, dalam
urutan yang sama, dengan isyarat dan prompt yang sama diizinkan, dan semua
dalam kerangka pertanyaan yang spesifik dan tertutup. Penggunaan pertanyaan
tertutup membuat pengkodean jawaban lebih mudah dan memiliki keuntungan
untuk selanjutnyanalisis. Pertanyaan tertutup juga menghilangkan peluang
untuk kesalahan yang terkait dengan pertanyaan terbuka, serta kesempatan '
terjawab ' pertanyaan di mana perbedaan pesanan diizinkan. Tapi pertanyaan
tertutup juga mengorbankan keuntungan komparatif dari metode interview
dengan gagal-ing untuk menyertakan fleksibilitas dan kekayaan respon yang
ditawarkan oleh pertanyaan terbuka. Dalam literatur akuntansi, Lowe dan Shaw
(1968) dan Onsi (1973) memberikan contoh adopsi pendekatan wawancara
terstruktur.

2 I-terstruktur SEM wawancara. Format ini memungkinkan serangkaian


pertanyaan yang akan ditanyakan, tetapi tanpa urutan tetap. Pertanyaan
tambahan juga dapat ditanyakan, karena pewawancara melihat kecocokan,
untuk meneliti masalah terkait yang muncul dalam perjalanan wawancara.
Lillis (1999) memberikan contoh penggunaan pendekatan semi-terstruktur.

3 Wawancara yang tidak terstruktur. Format ini dimulai dengan serangkaian


topik untuk diskusi, bukan pertanyaan spesifik yang harus ditanyakan. Ini dapat
berkembang menjadi percakapan yang diarahkan, dengan interviewer mampu
mengadopsi pendekatan ' bebas-Wheeling ', asalkan topik yang diperlukan
semua tertutup. Kata yang sebenarnya dan frase yang digunakan sehingga dapat
bervariasi secara signifikan antara wawancara, tapi pendekatan ini dapat
menempatkan diwawancarai pada cukup mudah untuk sayanduce mereka untuk
membuat pengungkapan yang tidak akan
S Anda v e y r e s e a R c h 129

muncul dalam kondisi yang berbeda. Pendekatan wawancara yang tidak


terstruktur diilustrasikan oleh Merchant (1985).

Beberapa bidang keprihatinan mungkin timbul, yang dapat menyebabkan hasil


dari proses wawancara untuk dipertanyakan:

 Pertanyaan worded buruk dapat menyebabkan kebingungan atau


kesalahpahaman di antara diwawancarai. Ada kemungkinan bahwa
pewawancara dan diwawancarai memiliki interpretasi yang berbeda dari istilah
yang digunakan oadalah penekanan diberikan kepada mereka-perpanjangan dari
jenis ' pengukuran makna ' isu yang dibesarkan dalam literatur akuntansi oleh
Houghton (1987, 1988) dan Hronsky dan Houghton (2001).

 Masalah memori di antara diwawancarai dapat membuat tanggapan instan unre-
LiaBLE. Hal ini mungkin terkait dengan pertanyaan yang terlalu permintaan-ing
 untuk mode ini penyelidikan.
 Pertanyaan dapat ditanyakan secara tidak konsisten atau antar-pemirsa tertentu
dapat berperilaku berbeda seiring waktu dan di antara responden. Signifi-cant
differences mungkin ada antara pewawancara meskipun tingkat pelatihan,
pedoman dan standarisasi pertanyaan. Inkonsistensi dalam dan di antara
pewawancara ini dapat menghasilkan hasil yang bias jika, misalnya, sikap yang
terlalu simetris atau agresif adalah linkEd ke kelompok tertentu dari
 diwawancarai.
 Masalah mungkin timbul dalam pencatatan dan pengolahan tanggapan. Hal ini
terjadi terutama dengan pertanyaan terbuka, di mana pewawancara mungkin
salah menafsirkan atau memperindah tanggapan dalam perjalanan terburu-buru
 transcribing apa yang telah dikatakan.
 Bias non-respon dapat muncul, seperti halnya dengan Surat survei, tetapi
penolakan diperparah oleh absenteeism. Persyaratan tatap muka mungkin
memerlukan sering panggilan balik (analog dengan Surat pengingat) dan
keberhasilan mereka mungkin tergantung pada jenis kelamin, pakaian-kode dan
sikap non-mengancam pewawancara.

Sebuah kategori khusus masalah bagi pewawancara muncul berkenaan dengan


kepedulian terhadap masalah etika. Sementara surat pengantar menunjukkan tujuan
penelitian dalam Surat survei, dan kembalinya instrumen itu sendiri merupakan izin
implisit untuk berpartisipasi, situasi wawancara berbeda. Beberapa kode etis bahkan
akan bersikeras bahwa yang diwawancarai ' tanda-off ' pada penyelesaian
wawancara untuk memverifikasi content tanggapan. Poin tertentu yang harus
diatasi meliputi:

 pewawancara harus dengan jelas mengidentifikasi diri mereka sendiri, status


 mereka, yang mereka repre-dikirim, dan tujuan wawancara;
 diinterviewees harus menyadari bagaimana dan mengapa mereka telah cHosen
 untuk berpartisipasi;
 kerahasiaan dan anonimitas tanggapan harus ditekankan;
 partisipasi sukarela adalah yang terpenting sehingga orang yang diwawancarai
bebas untuk dengan-menarik kerjasama mereka setiap saat;
130 researchMethod sinaccounting

 juga harus ada kesempatan untuk diwawancarai untuk mengajukan pertanyaan


dari pewawancara. Pewawancara harus berhati-hati di sini karena jika mereka
dari penjaga mereka, mereka mungkin akan diinduksi untuk mengungkapkan
pertanyaan penelitian di bawah examination. Pengungkapan tersebut dapat
mengancam validitas tanggapan dari diwawancarai berikutnya.

Survei yang dirancang dengan baik memungkinkan hubungan antara variabel yang
menarik untuk dipelajari dengan teliti. Namun, validitas internal tidak sekuat survei
seperti dalam penelitian eksperimental, meskipun realisme ekstra memberikan
validitas eksternal yang lebih tinggi. Karena survei sering merangkul banyak kasus,
yang tentu membatasi kedalaman, mereka sering tunduk pada kritik relatif terhadap
studi kasus.

Dalam chapter ini kami berharap untuk telah menentukan kedua keuntungan dari
survei dan keterbatasan mereka. Kuesioner yang sangat terstruktur, dibatasi untuk
pertanyaan non-kompleks, tidak dapat menyelidiki masalah secara mendalam, dan
tidak ada kesempatan baik untuk menanggapi pertanyaan atau meminta
menyetujuipertanyaan tindak lanjut. Limita-tions ini tidak signifikan selama
pertanyaan yang diformulasikan dengan baik dan relatif sempit dalam lingkup;
mereka kemudian dapat memberikan tanggapan yang valid untuk pertanyaan
penelitian. Seperti dengan semua metode penelitian yang kita periksa dalam
thadalah volume, pertanyaan teori tidak dapat bersahaja. Teori yang baik mendasari
segala sesuatu yang kita lakukan, dan memungkinkan pengembangan konstruksi
yang didefinisikan dengan jelas. Pengembangan instrumen penelitian yang dapat
dibuktikan untuk mengumpulkan data adalah salah satu kekuatan great dari
penelitian survei di bidang Akuntansi.
Ada banyak kebingungan dalam literatur antara survei, studi lapangan dan
studi kasus. Sebagai contoh, Merchant (1985) menjelaskan penelitiannya sebagai '
studi lapangan ' dan Smith (1994a, 1994b) mendeskripsikan dirinya sebagai 'antar-
penayangan semi-terstruktur ' ketika mereka dapat lebih tepat digambarkan sebagai
' antar-pandangan ' yang tidak terstruktur ' dan ' studi lapangan ' secara berurutan.
Brownell (1995, MS 156) menunjukkan bahwa perbedaan antara ' survei ' dan ' studi
lapangan ' dapat ditentukan oleh tingkat struktur dalam mempertanyakan, yang
diperlukan, tapi mungkin tidak cukup, kondisi untuk perbedaan. Masalah ini
dieksplorasi dalam bab berikut.

Anda mungkin juga menyukai