Anda di halaman 1dari 26

Telaah Kritis Artikel 8

An Examination of the Effect of Positive and Negative Performance on


the Relative Weighting of Strategically and Non-Strategically Linked
Balanced Scorecard Measures
Untuk memenuhi tugas mata kuliah Akuntansi Keperilakuan
Dosen Pengampu :Prof. Dr. R.A. Supriyono, S.U., CMA., CA., Ak.

KELOMPOK 1
Agnes K.B. Mudamakin

14/375561/PEK/19898

Farid Fajrin

15/387007/PEK/20557

Widowati Dian Permatasari

15/387077/PEK/20627

PROGRAM STUDI MAGISTER AKUNTANSI


FAKULTAS EKONOMIKA DAN BISNIS
UNIVERSITAS GADJAH MADA
YOGYAKARTA
2016

RESUME ARTIKEL

ABSTRAKSI
Kaplan dan Norton (1992, 1996) mendukung bahwa ukuran kinerja
dalam balanced scorecard (BSC) harus dikaitkan dengan strategi. Namun,
BSCs dari banyak perusahaan mencakup tindakan-tindakan strategis dan
non-strategis. Banker et al. (2004) memberikan bukti awal pada bobot
evaluator

'dari

langkah-langkah

Strategically

Linked

(SL)

dan

Non

Strategically Linked (NSL) ketika mengevaluasi kinerja dalam pengaturan di


mana manajer selalu melakukan lebih baik dari level target pada setiap
ukuran kinerja. Mereka menemukan bahwa ketika evaluator memiliki
pemahaman yang cukup tentang strategi perusahaan, bobot langkah SL
lebih dari langkah-langkah NSL ketika mengevaluasi kinerja. Tujuan dari
penelitian ini adalah untuk menguji evaluasi kinerja, relatif terhadap tingkat
target kinerja, kinerja manajer menunjukkan yang baik pada beberapa
langkah-langkah dan kinerja yang kurang baik pada langkah-langkah lainnya.
Kami berpendapat bahwa evaluator akan menunjukkan bias negatif sehingga
informasi kinerja negatif berbobot lebih berat daripada informasi kinerja
positif

untuk

kedua

SL

dan

langkah-langkah

NSL.

Akibatnya,

kami

memprediksi bahwa temuan dari Banker et al. (2004) tidak akan terus dalam
pengaturan yang melibatkan kinerja yang kurang baik. Secara khusus, ketika
kinerja pada langkah-langkah NSL tidak menguntungkan bagi seorang
manajer, kami menemukan bahwa tindakan NSL berbobot lebih dari langkahlangkah SL. Implikasi dari temuan ini dibahas untuk teori dan praktek.

PENDAHULUAN
Sistem pengukuran kinerja multi-atribut seperti balanced scorecard
(BSC) (Kaplan dan Norton 1992, 1996) semakin digunakan dalam bisnis
(Ittnerdan Larcker 2003; Kaplan dan Norton2006). Sebuah BSC biasanya
berisi jumlah ukuran kinerja yang relatif besar dan yang digunakan,
sebagian, untuk evaluasi kinerja. Kaplan dan Norton (1996, 2000, 2001)
menunjukkan bahwa ukuran kinerja termasuk dalam BSC harus dikaitkan
dengan tujuan strategis unit bisnis. Fokus dari penelitian ini adalah
bagaimana langkah-langkah yang berbeda dari evaluator dalam balanced
scorecard dengan tidak adanya pedoman khusus. .
Tujuan dari penelitian ini adalah untuk menguji evaluasi kinerja,
terhadap tingkat target kinerja, dimana manajer relatif menunjukkan kinerja
yang baik pada beberapa langkah-langkah dan kinerja yang kurang baik
pada langkah-langkah lainnya. Kami berpendapat bahwa temuan dari Banker
et al. (2004), di mana setiap manajer sub-unit dilakukan lebih baik dari level
target pada setiap kinerja di semua skenario, tidak akan menyelenggarakan
pengaturan yang melibatkan kinerja yang kurang baik. Secara khusus, ketika
kinerja pada SL langkah-langkah (penting) menguntungkan tapi kinerja pada
NSL (kurang penting) tindakan tidak menguntungkan, kami memperkirakan
bahwa langkah-langkah NSL akan berbobot lebih dari langkah-langkah SL.
Kami mendasarkan prediksi kami pada penelitian psikologi, yang telah
mendokumentasikan ''bias negatif''. Kami memprediksi dan menemukan
bahwa bias memegang peranan dalam pengaturan yang melibatkan hasil
3

yang berbeda-beda. Kami juga memperluas penelitian tentang bias negatif


dengan memprediksi bahwa bias akan lebih kuat bila hasil negatif
berhubungan dengan langkah-langkah SL dibandingkan dengan langkahlangkah NSL.
Penelitian ini memiliki implikasi untuk praktek dan teori. Pertama,
sementara penelitian psikologi telah menunjukkan bias negatif (di mana
informasi negatif berbobot lebih berat daripada informasi non-negatif)
(Baumeisteret al, 2001;. Skowronski dan Carlston 1989), penelitian ini belum
menyelidiki apakah bias ini berlaku dalam pengaturan yang melibatkan
langkah-langkah penting yang berbeda-beda. Kami memperluas penelitian
tentang bias negatif dengan memberikan bukti bahwa bias negatif terjadi
bahkan dalam pengaturan dengan langkah-langkah differentially. Secara
khusus, kami menemukan bahwa kinerja negatif pada langkah-langkah NSL
tertimbang lebih dari kinerja positif pada tindakan SL, meskipun langkahlangkah SL lebih penting daripada tindakan NSL.
Dari sudut pandang praktek, penelitian ini mengidentifikasi masalah
penting bagi perusahaan menggunakan BSC yang meliputi SL dan langkahlangkah NSL. Hasil kami menunjukkan bahwa manajer yang melakukan
sedikit di bawah tingkat target pada tindakan kurang penting tapi
kompensasi dengan kinerja yang kuat pada langkah-langkah yang lebih
penting akan dikenakan sanksi relatif terhadap manajer yang tidak
melakukan hampir sama juga pada tindakan yang lebih penting tetapi
melakukan di atas level target di semua tindakan. Dengan demikian, hasil
4

kami menunjukkan bahwa desainer BSC perlu menyadari kecenderungan


evaluator 'untuk ukuran kinerja lebih berbobot ketika target tidak terpenuhi,
dan untuk mempertimbangkan ini bias dalam memutuskan apakah dan
berapa banyak langkah-langkah NSL untuk memasukkan dalam BSC.
LATAR BELAKANG, BIAS NEGATIVITAS DAN PENGEMBANGAN HIPOTESIS
Latar Belakang
BSC dikembangkan oleh Kaplan dan Norton (1992, 1996), sebagian,
untuk pengukuran kinerja multidimensi. BSC biasanya berisi langkah-langkah
keuangan dan non-keuangan dari empat perspektif: keuangan, pelanggan,
proses internal, serta pembelajaran dan pertumbuhan. Sementara sistem
pengukuran kinerja multiattribute lain ada yang menggunakan berbagai
ukuran finansial dan non-keuangan (misalnya, KPI Scorecard, The Tableaux
de Bord), Kaplan dan Norton (2001) mencatat bahwa sistem pengukuran
kinerja lainnya tidak memilih tindakan yang terkait strategi. Dalam hal ini,
Kaplan dan Norton (1996, 8) menunjukkan bahwa langkah-langkah pada BSC
''yang berasal dari visi dan strategi organisasi.'' Untuk satu set langkahlangkah BSC, tingkat target kinerja yang ditetapkan, kinerja aktual di
langkah-langkah dilacak untuk periode, dan evaluator menilai kinerja
manajerial.
Ketika bobot eksplisit tidak ditugaskan untuk setiap ukuran kinerja,
evaluator menggunakan BSC menggabungkan hasil dari berbagai tindakan
ke

dalam

satu

set

evaluasi

dan

kompensasi
5

penilaian

keseluruhan

menggunakan proses subjektif . Bila menggunakan BSC, Kaplan dan Norton


(1996) tampaknya mendukung proses subjektif ketika mereka menyatakan
bahwa sistem reward subjektif yang ''lebih mudah dan lebih dipertahankan
untuk mengelola.. . Dan juga lebih rentan terhadap permainan bermain''
(Kaplandan Norton 1996, 220). Namun, penelitian telah menemukan bahwa
bobot subjektif evaluator 'dari jenis tertentu tindakan BSC untuk evaluasi
kinerja bias (Bankeret al 2004;. Ittner dan Larcker 2003; Libby et al. 2004;
Lipe dan Salterio 2000, 2002; Roberts et al.2004).
Bias Negativitas
Peneliti Psikologi telah menyelidiki dampak relatif dari hasil bervalensi
negatif dan positif dari jenis yang sama dan besarnya pada penilaian dan
keputusan individu (Baumeisteret al, 2001;. Rozin dan Royzman 2001;
Skowronski dan Carlston1989). Dalam meringkas temuan penelitian tentang
masalah ini, Baumeister et al. (2001, 323) menyatakan, ''Ketika ukuran yang
sama dari baik dan buruk yang hadir, namun, efek psikologis yang buruk
outweight mereka dari orang-orang yang baik.''
Literatur Psikologi mengacu pada kecenderungan umum sebagai bias
negatif (Skowronskidan Carlston 1989;. Kanouse dan Hanson 1972) Bias ini
didefinisikan sebagai kecenderungan untuk unit aktivasi untuk menghasilkan
perubahan besar dalam output dalam sistem motivasi negatif dibandingkan
dengan sistem motivasi positif (Cacioppoet al.1997). Dengan kata lain, ketika

orang dihadapkan dengan isyarat positif dan isyarat negatif, mereka


cenderung menempatkan lebih berat pada isyarat negatif.
Penelitian Psikologi menunjukkan bahwa bias negatif beroperasi saat
pengolahan informasi disengaja dan otomatis (Prattodan John1991). Ulasan
psikologi menunjukkan bahwa informasi negatif mempengaruhi pengolahan
informasi yang disengaja dengan meningkatkan jumlah perhatian mengarah
ke informasi negatif dan meningkatkan recall dari informasi negatif
(Baumeisteret al, 2001;. Rozin dan Royzman 2001;. Ito et al 1998). Informasi
negatif

disengaja

juga

mempengaruhi

pengolahan

informasi

melalui

pembangunan interpretasi kognitif yang lebih rumit dari informasi negatif


(Rozindan Royzman 2001; Baumeister et al. 2001). Bukti lebih lanjut dari
pengolahan informasi yang disengaja tercermin dalam temuan yang
menunjukkan relatif terhadap peristiwa positif, peristiwa negatif dianggap
lebih kompleks (Peetersdan Czapinski 1990) dan memicu atribusi lebih
kausal (Bohneret al.1988).
Selain informasi disengaja efek dari pengolahan informasi negatif,
penelitian psikologi juga menunjukkan bahwa ada komponen otomatis atau
bawah sadar untuk bias negatif.
Peneliti

Manajemen

pada

tahun

1970

awalnya

mengeksplorasi

pengaruh relatif dari informasi positif dan negatif dalam evaluasi kinerja
(Hollman1972; London dan Hakel 1974; London dan Poplawski1976).
Berdasarkan temuan-temuan awal, DeNisi et al. (1984, 386) mengusulkan
bahwa informasi negatif yang diberikan lebih berat daripada positif, atau
7

menguntungkan, informasi dalam evaluasi keseluruhan.'' Setelah penelitian


eksperimental oleh Brannick dan Brannick (1989) dan penelitian lapangan
oleh Ganzach (1995) memberikan lebih lanjut bukti bahwa bias negatif
memiliki efek signifikan pada evaluasi kinerja.

Hipotesis
Banker et al. (2004) menemukan bahwa ketika evaluator memiliki pemahaman yang kuat
dari strategi perusahaan (misalnya, peta strategi diberikan kepada evaluator), mereka
menempatkan lebih berat pada SL dari pada langkah-langkah NSL. Dalam rangka meningkatkan
komparabilitas temuan kami, kami awalnya mengusulkan, mirip dengan Banker et al. (2004),
bahwa ketika manajer pameran hanya perbedaan kinerja positif, tindakan SL akan berbobot lebih
dari langkah-langkah NSL ketika evaluator memahami strategi perusahaan. Dalam hal ini, dua
manajer akan menunjukkan hanya perbedaan kinerja positif jika kedua mencapai hasil di atas
target pada masing-masing ukuran kinerja mereka. Namun, salah satu manajer bisa mengungguli
manajer lainnya dengan melebihi target untuk tingkat yang lebih besar. Misalnya, seorang
manajer mungkin melebihi target sebesar 20 persen sementara manajer lain mungkin melebihi
target sebesar 10 persen. Hipotesis awal ini umumnya merupakan replikasi dari Banker et al.
(2004) dan dimaksudkan untuk menguatkan hasil mereka menggunakan satu set baru langkahlangkah kinerja BSC. Diskusi ini mengarah pada hipotesis berikut:
H1: Ketika manajer selalu tampil lebih baik dari target mereka, evaluator akan
menempatkan lebih berat pada langkah-langkah SL daripada ukuran NSL di evaluasi dari
manajer.
8

Selanjutnya, mempertimbangkan pengaturan di mana perbedaan kinerja antara dua manajer


melibatkan kedua kinerja positif (misalnya, kinerja yang lebih baik dari target) dan kinerja
negatif (misalnya, kinerja lebih buruk dari target). Misalnya, seorang manajer mungkin melebihi
target sebesar 5 persen (misalnya, di atas target kinerja) dan manajer lain mungkin kehilangan
target sebesar 5 persen (misalnya, di bawah target kinerja). Kinerja di bawah-target 5 persen
merupakan kinerja negatif. Dibandingkan dengan situasi yang dijelaskan di atas untuk H1, di
mana dua manajer melampaui target sebesar 20 persen dan 10 persen, perbedaan kinerja antara
manajer tetap konstan (misalnya, 10 persen perbedaan kinerja). Namun, dua situasi berbeda
dalam satu yang hanya melibatkan kinerja positif, dan satu melibatkan kedua kinerja positif dan
negatif.
Dalam kasus yang melibatkan kedua di atas target dan di bawah target kinerja, kami
berharap untuk mengamati bias negatif. Secara khusus, kami berharap di bawah target ukuran
kinerja akan berbobot lebih berat daripada ukuran kinerja di atas target terlepas dari kepentingan
strategis dari langkah-langkah.
Berdasarkan review kami dari literatur(Baumeisteret al, 2001;. Cacioppo et al 1997;.
Cacioppo dan Bernston 1994; Ito et al 1998;. Taylor1991),kami berpendapat bahwa bias negatif
adalah sebagian besar otomatis, proses yang tidak disengaja. Sampai-sampai bias negatif
sebagian besar otomatis, kita berharap bahwa evaluator akan berat langkah-langkah yang
melibatkan bawah target capaian lebih dari diatas target hasil, terlepas dari kepentingan strategis
ukuran ini. Respon otomatis untuk informasi negatif diharapkan menjadi lebih kuat dari
pengolahan kognitif yang disengaja dari pentingnya SL / informasi NSL. Diskusi ini mengarah
pada hipotesis berikut:

H2: Ketika salah satu manajer tidak selalu tampil lebih baik dari target, evaluator akan
menempatkan lebih berat pada SL atau tindakan NSL yang melibatkan kinerja yang
kurang (underperformance).
H2, evaluator diharapkan menunjukkan bias negatif terlepas dari apakah kinerja yang
melibatkan SL atau tindakan NSL. Selanjutnya, penelitian-psikologi berbasis sebelumnya belum
dieksplorasi faktor yang diharapkan dapat meningkatkan atau memperbesar bias negatif. Kami
berharap bahwa bobot ukuran kinerja akan dipengaruhi oleh proses disengaja dan tidak
disengaja. Sementara kita berharap banyak dari bias negatif menjadi proses otomatis, kami
berharap bahwa evaluator, menyadari dua jenis ukuran kinerja, sengaja akan berat langkahlangkah SL negatif lebih dari langkah-langkah NSL negatif. Dengan demikian, kami berharap
bahwa dibandingkan dengan langkah-langkah NSL, bias negatif akan lebih terasa ketika kinerja
yang kurang melibatkan langkah-langkah SL dan evaluator akan berat langkah-langkah SL
negatif lebih dari langkah-langkah NSL negatif. Secara keseluruhan, kami berharap langkahlangkah SL akan memperburuk kekuatan bias negatif. Diskusi ini mengarah pada hipotesis
berikut:
H3:. Ketika salah satu manajer tidak selalu tampil lebih baik dari target, bias negatif akan
semakin kuat ketika manajer hanya berkinerja buruk pada langkah-langkah SL
dibandingkan dengan ketika manajer hanya berkinerja buruk pada langkah-langkah NSL.
METODE DAN DESAIN EKSPERIMEN
Kami melakukan dua percobaan untuk menguji efek dari kinerja di bawah dan di atas
target seluruh set langkah-langkah BSC pada penilaian evaluasi. Dalam rangka untuk memeriksa
efek dari kinerja dibawah dan diatas target, mirip dengan penelitian sebelumnya(Lipedan Salterio
2000; Banker et al. 2004) tugas evaluator adalah untuk memberikan penilaian evaluasi untuk
10

masing-masing dua manajer. Pada percobaan pertama, kita menggunakan 2x 2 desain


eksperimen antara partisipan dengan dominasi (Manajer A melebihi Manajer B pada langkahlangkah SL atau tindakan NSL) dan negatif (kinerja yang kurang pada langkah-langkah tertentu
ada atau tidak) sebagai manipulasi eksperimental. Percobaan kedua dibahas pada bagian
berikutnya.

Materi dan Prosedur Kasus


Dijelaskan Toko Smithson, yang memiliki beberapa rantai ritel dan banyak toko. Peserta
diasumsikan posisi evaluator dari dua manajer regional (Manajer A dan manajer B) untuk Divisi
Toko Perempuan. Untuk menghindari umum / unik Bias tindakan dan potensi lainnya
mengacaukan, kedua manajer memiliki strategi yang sama, langkah-langkah, dan target. Bahan
termasuk deskripsi strategi untuk divisi, dan peta strategi menyoroti delapan kinerja langkahlangkah dan bagaimana mereka terkait satu sama lain. Lampiran A menyajikan contoh strategi
narasi dan strategi peta yang diberikan kepada peserta. Peserta kemudian diberi sampel BSC
yang terdaftar delapan SL dan delapan '''umum' (NSL) langkah-langkah yang termasuk deskripsi
dan target. Itu bahan menunjukkan bahwa delapan ''umum'' (NSL) langkah-langkah termasuk
dalam BSC telah diidentifikasi di tingkat perusahaan. BSC sampel bahwa peserta yang diterima
menunjukkan bahwa masing-masing dari empat kategori BSC termasuk dua SL dan dua langkah
NSL.
Selanjutnya, peserta diberi BSC dengan kinerja aktual manajer A dan B. Lampiran B
menyajikan contoh BSC yang menunjukkan hasil kinerja aktual untuk manajer A dan B. dengan
desain, seluruh kondisi, kinerja aktual dari setiap manajer dengan linear setara. Dengan setara
linear, kita berarti bahwa jumlah dari empat penyimpangan persentase dari empat target dalam

11

kategori BSC adalah kurang lebih sama. Misalnya, menggunakan BSC disajikan dalam
Lampiran B, jumlah dari empat penyimpangan persentase di bawah kategori keuangan untuk
manajer A, Chris Peters, adalah 20,76 persen (misalnya, -3.30% + -1,47% +14,33% + 11,20%)
dan 20,79 persen (misalnya, 1,38% + 9.27% + 3.60% + 6.54%) untuk manajer B,Taylor Graham.
Jadi, jika masing-masing dari 16 langkah BSC yang sama tertimbang, dua manajer akan
menerima evaluasi kinerja yang sama. Dalam menanggapi materi kasus, peserta mengevaluasi
kinerja masing-masing manajer dan menyelesaikan kuesioner pasca-percobaan.

Variabel Independen
Peserta dalam penelitian ini dievaluasi satu kasus yang termasuk salah satu dari dua
tingkat untuk masing-masing dua variabel independen, Dominasi dan Negatif. Dengan demikian,
desain penelitian dapat dicirikan sebagai 2 x 2 seperti yang ada total dari empat eksperimental
yang berbeda. Gambar 1 menyajikan ringkasan dari empat sel-sel ini. Kami lebih membahas
masing-masing dua variabel independen di bawah ini.
Dominasi
Di antara manipulasi peserta, peserta ditugaskan untuk memilih secara acak salah satu dari dua
kondisi yang mendominasi. Dominasi ini mengacu pada kinerja aktual untuk satu set ukuran
relatif kinerja manajer terhadap manajer lain. Dalam kondisi yang dominan NSL, Manager A
didominasi oleh kinerja manajer B pada ukuran NSL, tetapi manajer B mendominasi kinerja
Manajer A pada ukuran SL. Misalnya, seperti yang ditunjukkan pada Lampiran B, Manager B
lebih unggul dari Manajer A pada markup dari harga rata-rata barang dan pertumbuhan penjualan
dari toko yang ada, dua ukuran SL termasuk dalam kategori keuangan. Namun, Manager A lebih

12

unggul daripada manajer B di perputaran persediaan dan laba atas penjualan, dua langkah NSL
termasuk dalam kategori keuangan.
Negativitas
Dalam kondisi dominan SL, Manager A mendominasi kinerja manajer B pada ukuran SL,
tapi Manajer B mendominasi kinerja manajer A pada ukuran NSL. Kedua manipulasi
yang dioperasionalkan dengan memodifikasi hasil negativitas kinerja aktual untuk Manajer A. Di
antara manipulasi peserta, peserta secara acak ditugaskan untuk salah satu dari dua
kondisi negatif. Pada kondisi yang negatif sekarang ini, Manager A substansial overperformed
pada delapan ukuran kondisi dominan (SL atau NSL) dan sedikit underperformed tersisa di
delapan langkah. Misalnya, seperti yang ditunjukkan pada Lampiran B, persentase yang
lebihuntuk Manajer A pada perputaran persediaan dan pengembalian aset, dua ukuran yang
termasuk dalam kategori keuangan, adalah masing masing 14,33 persen dan 11,20 persen.
Namun, untuk markup dari rata-rata harga barang dagangan dan pertumbuhan penjualan
dari yang sudah ada di toko, dua langkah lainnya yang termasuk dalam categori keuangan oleh
Manajer A dengan masingmasing underperformed 3,30 persen dan 1,47 persen. Kinerja
Manajer B itu cukup di atas target untuk semua 16 langkah Misalnya, juga seperti yang
ditunjukkan pada Lampiran B, lebih banyak presentase untuk manajer B di empat langkah
keuangan sebesar 1,38 persen, 9,27 persen, 3,60 persen, dan 6,54 persen. Dalam kondisi yang
negatif saat ini, di seluruh 16 ukuran kinerja, Manager A target terhadap kinerjan relatifnya
berkisar dari A4 persen (misalnya, persentase penjualan kepada pelanggan baru) menjadi 15
persen (misalnya, diiklankan barang dalam stok) dengan varians total 0,70 persen. Manajer B
target terhadap kinerja relatifnya berkisar dari 1,38 persen (misalnya, rata-rata markup harga
barang) menjadi 10,03 persen (misalnya, toko komputerisasi) dengan varians total 0,09 persen.

13

Dalam kondisi absen yang negatif , manajer yang baik targetnya paling unggul di semua
ukuran kinerja. Dibandingkan dengan kondisi negatif sekarang ini, lima persen ditambahkan ke
masing masing persentase atas / bawah pada 16 langkah untuk Manajer A dan B. Dengan
demikian, Manager A sangat overperformed pada delapan langkah kondisi dominan (SL atau
NSL) dan sedikit overperformed pada delapan langkah yang tersisa. Misalnya, dibandingkan
dengan BSC ditampilkan pada Lampiran B, persentase untuk Manajer A lebih baik pada
perputaran persediaan dan return on asset-termasuk dua langkah
dalam katagori keuangan masing masing sebesar 19,33 persen dan 16,20 persen.
Untuk markup harga barang dagangan rata-rata dan pertumbuhan penjualan dari yang
sudah ada di toko-dua ukuran lain yang termasuk dalam katagori keuangan Manager A lebih
unggul dari target yang ada masing-masing sebesar 1,70 persen dan 3,53 persen. Manajer B
cukup overperformed pada semua 16 langkah. Sebagai contoh, di dibandingkan dengan BSC
ditampilkan pada Lampiran B, persentase lebih untuk manajer B pada empat ukuran keuangan
sebesar 6,38 persen, 14,27 persen, 8,60 persen, dan 11,54 persen. Dalam kondisi absen yang
negatif, seluruh 16 ukuran kinerja, kinerja Manager A relatif terhadap target berkisar dari 1
persen (misalnya, persentase penjualan untuk pelanggan baru) 20 persen (misalnya, diiklankan
barang dalam saham) dengan varians total 0,70 persen. Kinerja Manajer B relatif terhadap target
berkisar antara 6,38 persen (misalnya, harga rata-rata markup dari merchandise) ke 15,03 persen
(misalnya, toko komputerisasi) dengan varians total 0,09 persen.
Oleh karena itu, untuk kedua kondisi negatif absen dan hadir, hasil kinerja Manajer A
memiliki varians jauh lebih besar dari hasil kinerja manajer B. Namun, hasil varians dalam
kinerja manajer B dan Manager A sama untuk kedunya tidak ada yang berada pada kondisi
negatif ini. Mengontrol fitur desain varian dalam hasil kinerja di dua kondisi negatif.

14

Menggunakan fitur desain ini kita dapat menghilangkan varians sebagai alternatif penjelasan
yang potensial dengan menjaga konstanya varians dalam kedua kondisi negatif.

Pengukuran Dependen
Setiap peserta memberikan setiap manajer rating evaluasi dari 0 (menetapkan kembali) ke
12 (sangat baik), dengan jumlah yang lebih tinggi menunjukkan peringkat evaluasi yang lebih
baik. Sebuah deskripsi singkat menunjukkan untuk setiap label (misalnya, sangat baik: jauh
melampaui harapan, manajer unggul) untuk meminimalkan kebingungan antara peserta
mengenai arti dari setiap label. Sebuah perbedaan skor evaluasi dibangun oleh
mengurangkan evaluasi manajer B dari evaluasi Manajer A. Ini adalah ukuran yang sama
tergantung digunakan oleh Banker et al. (2004). Sebuah perbedaan skor evaluasi positif
menunjukkanbahwa manajer A dievaluasi lebih tinggi dari manajer B, sedangkan perbedaan skor
evaluasi negatif menunjukkan bahwa manajer A dievaluasi lebih rendah dari Manajer B.
Perbedaan skor evaluasi digunakan sebagai ukuran untuk menguji hipotesis kami.
Partisipan
Sebanyak 103 siswa malam MBA dari universitas metropolitan utama ikut berpartisipasi
dalam percobaan ini.Para mahasiswa baru-baru ini sedang mengambil kursus, termasuk tugas
membaca dan kuliah, pada peta strategi dan BSC. cakupan kelas dari BSC untuk penelitian ini
dimaksudkan agar meringankan keprihatinan yang diangkat oleh Dilla dan Steinbart (2005)
tentang evaluator yang tidak memiliki pengetahuan yang cukup tentang BSC. Para peserta
menghabiskan sekitar 20-25 menit di kelas untuk membaca dan mengisi kuesioner. Para peserta
menyelesaikan tugas ini sebagai kredit tambahan untuk kelas yang mereka tempuh, sehingga
partisipasi sebesar 100 persen siswa yang layak. Syarat menjadi peserta ' dengan usia rata-rata

15

adalah 30,8 tahun dan rata-rata pengalaman kerja adalah 9,0 tahun. Tujuh puluh persen adalah
laki-laki dan 77 persen memiliki karyawan dievaluasi sebelumnya.

HASIL EKSPERIMEN SATU


Uji Manpulasi dan Pengetahuan Umum mengenai BSC
Setelah menanggapi skenario, peserta dapat menjawab pertanyaan pembekalan untuk
menentukan apakah mereka mengetahui apa itu cek manipulasi negatif. Pertanyaan pertama
membaca, '' Chris Peters (Wilayah A) melebihi target nya pada semua ukuran kinerja. '' Peserta
diminta untuk memilih respon pada skala tujuh poin, di mana 1 adalah '' sangat tidak setuju '' dan
7 adalah '' sangat setuju. '' Untuk peserta dalam kondisi negatif sekarang ini, Chris Peters
(Manajer A) memang harus mempunyai hasil di bawah target, dan peserta yang menanggapi
lebih besar dijatuhkan dari titik tengah dengan skala (titik tengah 4 itu '' tidak setuju atau tidak
setuju ''). Peserta tidak berada dalam kondisi negatif, Chris Peters (Manajer A) tidak memiliki
hasil di bawah target, dan peserta yang kurang menanggapi dari titik tengah skala diberikan
pertanyaan kedua, '' Taylor Graham membaca (Region B) melebihi target nya pada semua ukuran
kinerja. '' Peserta diminta untuk memilih respon pada skala tujuh poin, di mana 1 adalah '' sangat
tidak setuju '' dan 7 adalah '' sangat setuju. ''
Untuk semua peserta, Taylor Graham (manajer B) tidak memiliki hasil di bawah target,
dan tanggapannya kurang dari titik tengah dari skala yang dianggap salah. Dari 103 peserta, 21
(20 persen) menanggapi adanya kesalahan setidaknya untuk salah satu diberikan pertanyaan
dan cek manipulasi. Menanggapi peserta yang '' tidak benar '' untuk salah satu dari dua item cek
manipulasi negatif yang menjatuhkan karena kurangnya '' inklusi kepentingan '' ( Yates1990,
376). Dalam hal ini, Tan dan Yates (1995, 315) berpendapat bahwa '' bahwa jika pembuat

16

keputusan tidak pernah mengakui keberadaan dimensi tertentu, pengambil keputusan tidak
mungkin menanggapi dimensi itu. '' Dalam konteks dari penelitian ini, kami membatasi sampel
untuk peserta yang hadir ke dan ditafsirkan eksplisit untuk mencoba memanipulasi negatif (atau
ketiadaan) dari Manajer A dan B sebagaimana dimaksud.
Analis statistik itu mengikuti berdasarkan pada tanggapan dari 82 peserta yang tersisa.
Peserta diminta untuk menjawab pertanyaan tentang keakraban dan pemahaman mereka
BSC dan pemahaman peta strategi. Mereka diminta untuk menggunakan tujuh point skala, di
mana 7 adalah '' sangat setuju '' bahwa mereka memiliki pemahaman yang baik tentang atau
cukup akrab dengan BSC(Atau peta strategi) dan respon dari 4 adalah '' tidak setuju atau tidak
setuju. '' Respon rata-rata untuk keakraban dan pemahaman tentang BSC yang 4.6 dan 5.0,
masing-masing (masing masing standar deviasi 1,8 dan 1,3,). tanggapan ini secara signifikan
lebih tinggi daripada respon titik tengah 4,0 (P, 0,002 untuk setiap pertanyaan).
Selain itu, berarti respon untuk memahami peta strategi berkisar 4,7 (standar deviasi 1,4).
Tanggapan ini secara signifikan lebih tinggi daripada titik tengah respon sekitar 4.0 (p, 0,001).
Dengan demikian, rata-rata, peserta sepakat bahwa mereka akrab dengan BSC dan memiliki
pemahaman yang baik dari keduanya yaitu BSC dan peta strategi. Sebagai bagian dari kuesioner
pasca-percobaan, peserta menanggapi pernyataan tersebut, '' ukuran yang terkait strategis yang
lebih penting daripada tindakan-tindakan terkait non-strategis. '' Peserta merespon lagi pada skala
mulai dari 1 ( '' sangat tidak setuju '') ke 7 ( '' sangat setuju''). Sebuah respon dari 4 adalah netral (
'' tidak setuju atau setuju ''). Jika peserta percaya SL yang
langkah-langkah yang lebih penting daripada ukuran NSL, mereka harus menanggapi secara
signifikan lebih besar dari respon netral 4. Skor rata-rata pada pertanyaan ini adalah 5.3 (standar
deviasi 1,52).

17

Hal ini secara signifikan berbeda dari titik tengah yaitu netral dari 4 (t-statistik 7.51, pvalue, 0,0001). Hal ini menunjukkan bahwa rata-rata, peserta percaya bahwa mengukur SL lebih
penting dari mengukur NSL. Kami juga menegaskan bahwa dirasakan pentingnya mengukur SL
menjadi tidak bermakna jika dikaitkan dengan variabel bebas (all-nilai p yang. 0,18). Dirasakan
pentingnya tindakan SL juga tidak terkait dengan variabel dependen kinerja Evaluasi perbedaan
(p-value. 0,55). Tanggapan terhadap pembekalan analisisi pertanyaan dalam upaya untuk
mengidentifikasi kovariat. Tidak ada pertanyaan pembekalan yang ditemukan menjadi kovariat,
dan akibatnya tidak termasuk dalam salah satu dari hasil analisis yang dilaporkan di bawah.
Hipotesis Tes
H1 memprediksi bahwa ketika absen negatif, evaluator akan menempatkan lebih berat
pada pengukuran SL daripada mereka akan pada pengukuran NSL. Sejauh evaluator ditempatkan
relatif lebih berat pada SL daripada ukuran NSL, manajer dengan kinerja kuat pada pengukuran
SL akan dievaluasi lebih tinggi dari manajer dengan kinerja kuat pada pengukuran NSL. Karena
kedua manajer yang sebenarnya kinerja relatif terhadap target setara linear, kita dapat
menggunakan tindakan tergantung untuk menyimpulkan apakah tindakan SL ditimbang lebih
dari ukuran NSL. Dalam hal ini, jika ukuran SL ditimbang lebih dari ukuran NSL, manajer
dengan kinerja yang lebih baik pada ukuran SL akan dievaluasi lebih tinggi.
Secara khusus, H1 memprediksi skor perbedaan evaluasi yang signifikan positif bagi
kondisi SL Dominasi dan secara signifikan negatif untuk kondisi NSL Dominasi.

18

Hasil kami untuk H1 konsisten dengan temuan dari Banker et al.(2004). Hasil kami
menunjukkan bahwa temuan dari Banker et al. (2004) meluas ke pengaturan yang melibatkan
manajer terlibat dalam kinerja varians tinggi. Penting untuk dicatat bahwa sementara varians
dalam kinerja untuk manajer A di bawah kondisi absen negatif lebih besar dari manajer dari
Banker et al. (2004), varians kinerja Manajer A dalam penelitian ini adalah sama di bawah
negatif absen dan kondisi negatif.
H2 memprediksi bahwa ketika negatif hadir, evaluator tidak akan menempatkan lebih
berat pada ukuran SL daripada mereka akan pada tindakan NSL, tetapi sebaliknya akan
menempatkan lebih berat pada ukuran yang melibatkan kinerja yang kurang oleh salah satu
manajer, bahkan ketika manajer hanya berkinerja buruk pada ukuran NSL. Secara khusus, H2
19

memprediksi perbedaan evaluasi yang signifikan negatif untuk SL Dominasi dan kondisi NSL
Dominasi. Hal ini menunjukkan bahwa ketika informasi kinerja negatif hadir, manajer yang
underperformed pada beberapa langkah tetapi sangat mengungguli pada beberapa tindakan
menerima evaluasi kinerja rendah dari manajer yang sedikit mengungguli semua tindakan. Oleh
karena itu, kami menemukan bahwa ukuran yang mencerminkan kinerja yang kurang berbobot
lebih dari ukuran yang mencerminkan overperformance di kedua kondisi dominasi. Pola hasil
mendukung H2.
H3 memprediksi bahwa bias negatif akan semakin kuat ketika manajer hanya berkinerja
buruk pada ukuran SL dibandingkan dengan ketika manajer hanya berkinerja buruk pada ukuran
NSL. Secara khusus, H3 memprediksi skor perbedaan evaluasi yang secara signifikan lebih
negatif di bawah kondisi NSL Dominasi dibandingkan dengan kondisi SL Dominasi. Hasil ini
mendukung H3.
HASIL EKSPERIMEN DUA
Penjelasan potensial untuk hasil kami untuk H2 adalah bahwa informasi negatif lebih
menonjol daripada informasi yang menunjukkan ukuran SL. Untuk kondisi negatif peserta
menerima hasil kinerja BSC sebenarnya, yang menunjukkan bahwa manajer A memiliki kinerja
negatif pada beberapa langkah tetapi BSC sendiri tidak mencakup informasi tentang apakah
suatu ukuran adalah SL atau NSL (misalnya, lihat Lampiran B). Sebaliknya, informasi yang
menunjukkan ukuran SL disertakan pada halaman terpisah menyajikan peta strategi. Oleh karena
itu, adalah mungkin bahwa hasil untuk H2 mungkin mencerminkan arti-penting diferensial dan
ketersediaan informasi negatif relatif terhadap informasi yang menunjukkan ukuran SL. Ini,
sedangkan H2 memprediksi bahwa pengolahan otomatis informasi negatif akan mendominasi
pengolahan disengaja pentingnya ukuran SL, hasilnya dapat didorong oleh informasi negatif

20

yang lebih menonjol daripada SL / NSL hanya karena informasi negatif pada BSC bahwa
manajer tapi SL / informasi NSL berada di halaman sebelumnya. Percobaan kedua dilakukan
untuk mengeksplorasi kemungkinan ini.
Kami memakai desain eksperimental 1x2. Pada BSC menunjukkan hasil kinerja aktual
(termasuk kinerja negatif), kami menambahkan kolom untuk ''jenis ukuran'' dan menunjukkan
apakah ukuran itu ''strategis'' atau ''non-strategis.'' Desain diperbolehkan negatif ini dan informasi
strategis berada di halaman yang sama dan mengesampingkan arti-penting tambahan informasi
negatif sebagai penjelasan alternatif.
Tiga puluh satu mahasiswa MBA berpartisipasi dalam percobaan dan mirip dengan satu
eksperimen pada BSC dan strategi. Usia rata-rata adalah 35,8, dengan rata-rata 14,6 tahun
pengalaman kerja. Tujuh puluh empat persen adalah laki-laki dan 84 persen karyawan. Peserta
menanggapi pertanyaan manipulasi yang sama menanyakan apakah setiap manajer telah
mengungguli semua target mereka. Empat peserta gagal untuk benar menanggapi kedua
pertanyaan (13 persen) dan, konsisten dengan percobaan satu, dikeluarkan dari analisis.
Menggunakan 27 peserta yang tersisa, kami menemukan bahwa ketika negatif hadir dan Manajer
A mendominasi pada langkah-langkah NSL. Kami menemukan bahwa ketika manajer berkinerja
buruk di kedua SL atau tindakan NSL, ukuran yang berbobot lebih berat daripada ukuran lain
menunjukkan kinerja di atas target. Hasil ini memberikan dukungan lebih lanjut untuk H2 dan
menghilangkan arti-penting sebagai penjelasan potensial untuk hasil kami.
RINGKASAN DAN DISKUSI
Kaplan dan Norton (1996, 2001) menggunakan BSC untuk menerapkan strategi dan
mengevaluasi kinerja, dan bahwa BSC hanya harus mencakup ukuran SL. Namun, bukti
menunjukkan bahwa perusahaan umumnya mencakup ukuran NSL generik serta ukuran SL di

21

BSC (Bryant et al. 2004; Burney dan Widener 2007; Ittner dan Larcker 2003; Malina dan selto
2001). Meskipun mungkin ada berbagai alasan untuk ukuran NSL dalam BSC, ketika mereka
dimasukkan, Banker et al. (2004) berpendapat bahwa tindakan SL harus lebih lebih dari ukuran
NSL ketika mengevaluasi kinerja manajerial. Dalam hal ini, Banker et al. (2004, 4) berpendapat
bahwa ''Karyawan lebih memahami strategi perusahaan, semakin baik mereka akan dapat
menggunakan ukuran kinerja strategis terkait untuk memandu keputusan dan tindakan mereka.''
Banker et al. (2004) memberikan bukti awal pada pembobotan evaluator 'dari SL dan NSL terkait
mengevaluasi kinerja manajerial dalam pengaturan di mana kinerja aktual melebihi tingkat target
kinerja pada setiap ukuran kinerja. Seperti yang diharapkan, mereka menemukan bahwa ketika
evaluator memiliki pemahaman yang cukup tentang strategi perusahaan, evaluator menetapkan
bobot yang lebih besar untuk ukuran SL dibandingkan dengan ukuran NSL ketika mengevaluasi
kinerja manajerial. Kesimpulan implisit mereka adalah bahwa kekhawatiran atas evaluator
overweighting ukuran kinerja NSL yang dikurangi ketika evaluator memiliki pemahaman yang
cukup tentang strategi perusahaan.
Tujuan dari penelitian ini adalah untuk memberikan bukti tambahan pada pembobotan
evaluator SL dan ukuran NSL termasuk dalam BSC pada evaluasi kinerja manajerial. Kami
memperpanjang Banker et al. (2004) dalam beberapa cara. Pertama, menggunakan kelompok
peserta yang berbeda dan ukuran kinerja yang berbeda, kami juga menemukan bahwa tindakan
SL berbobot lebih dari ukuran NSL ketika mengevaluasi kinerja dalam pengaturan yang
melibatkan perbedaan kinerja hanya positif. Kedua, kita menemukan bahwa tindakan NSL
berbobot lebih dari ukuran SL ketika mengevaluasi kinerja dalam pengaturan yang melibatkan
perbedaan kinerja positif pada tindakan SL dan perbedaan kinerja negatif pada ukuran NSL.
Terakhir, kami menemukan bahwa dalam pengaturan yang melibatkan perbedaan kinerja positif

22

dan negatif, perbedaan kinerja negatif pada ukuran SL yang berbobot lebih dari perbedaan
kinerja negatif pada ukuran kinerja NSL.
Dua keterbatasan harus dipertimbangkan mengenai penelitian kami. Pertama, peserta
dalam penelitian ini adalah mahasiswa MBA diminta untuk mengevaluasi kinerja manajerial
dalam pengaturan BSC. Umumnya, peserta memiliki pengalaman kerja profesional substansial,
tampaknya memiliki latar belakang kira-kira sebanding dengan yang digunakan dalam studi BSC
sebelumnya(Bankeret al 2004; Libby et al 2004; Lipe dan Salterio 2000, 2002; Kaplan dan
Wisner 2009; Liedtka et al. 2008; Roberts et al. 2004), dan multi-dimensi kinerja sistem
pengukuran dibahas dan dibahas di kelas sebelum percobaan terjadi. Namun, peserta mungkin
memiliki pengalaman yang terbatas dengan sistem pengukuran multi-dimensi seperti BSC, dan
adalah mungkin bahwa hasil kami mungkin tidak menggeneralisasi untuk mereka yang memiliki
pengalaman yang lebih besar dengan dan pengetahuan tentang BSC. Kedua, penggunaan
pendekatan eksperimental membatasi informasi yang tersedia untuk peserta. Hal ini dilakukan
untuk menahan konstan informasi yang tersedia untuk masing-masing peserta serta untuk
membatasi tuntutan waktu ditempatkan pada peserta. Agaknya, evaluator akan memiliki
informasi yang lebih kaya ditetapkan dalam praktek ketika mengevaluasi kinerja. Selanjutnya,
dalam operasionalisasi negatif kondisi sekarang, perbedaan rata-rata antara overperformance dan
kinerja yang kurang relatif besar, yang dapat membatasi generalisasi temuan kami. Ini masih
menjadi masalah untuk penelitian lebih lanjut.
Penelitian ini membuat dua kontribusi penting. Pertama, hasil kami menunjukkan bahwa
dalam pengaturan yang melibatkan perbedaan positif dan negatif kinerja, ukuran evaluator
dengan perbedaan kinerja negatif lebih dari perbedaan kinerja positif, terlepas dari kepentingan
strategis dari ukuran. Temuan kami menunjukkan masalah yang sebelumnya tidak dikenal ketika

23

kedua SL dan ukuran kinerja NSL termasuk dalam BSC. Batasan yang diberikan pada waktu dan
tugas ketidakpastian, ketika manajer harus membuat trade-off, organisasi akan mungkin lebih
baik ketika manajer sedikit underperform pada ukuran NSL jika memungkinkan mereka untuk
tampil di tingkat tinggi tentang ukuran SL. Hasil kami menunjukkan bahwa manajer
kemungkinan akan dihukum bahkan untuk perbedaan-perbedaan kinerja negatif sedikit pada
ukuran NSL. Artinya, ketika dihadapkan dengan keputusan tentang apakah untuk mengarahkan
upaya menuju pencapaian tinggi pada ukuran SL atau ke arah memenuhi target NSL, hasil kami
menunjukkan bahwa manajer akan dievaluasi lebih menguntungkan dengan menghindari kinerja
yang kurang pada ukuran NSL, bahkan jika ini berarti kinerja substansial lebih rendah dari SL
langkah-langkah. Jika ukuran SL adalah penting untuk mendorong keberhasilan perusahaan,
mengalihkan usaha jauh dari tindakan SL dan menuju NSLmeasures hanya untuk menghindari
melakukan di bawah ekspektasi pada ukuran NSL mungkin sub-optimal. Kecenderungan untuk
jenis perilaku sub-optimal terjadi memberikan dukungan untuk Kaplan dan Norton (2001)
melihat bahwa BSC hanya harus mencakup langkah-langkah SL. Namun, jika BSC termasuk
ukuran NSL, implikasi dari hasil kami akan mengatur langkah-langkah NSL non-stretch-sasaran.
Kedua, penelitian kami memperluas penelitian tentang bias negatif. Sementara banyak
bukti yang mendukung bias negatif, kurang perhatian telah diberikan untuk mengidentifikasi
kondisi batas atau mengurangi faktor. Studi kami menyediakan bukti bahwa bias negatif
memegang dalam pengaturan dengan dimensi berbeda-beda penting. Artinya, bias negatif ada
bahkan ketika hasil negatif melibatkan dimensi relatif tidak penting. Sejauh bias negatif adalah
karena faktor disengaja, bias negatif tidak harus beroperasi ketika hasil negatif dimensi
involverelatively penting. Dengan demikian, temuan kami adalah penting karena mereka
menunjukkan bahwa proses yang tidak disengaja atau otomatis yang cukup kuat untuk

24

mengamati bias negatif, dan akibatnya, kepentingan relatif dari dimensi bukanlah syarat batas
untuk bias negatif.

TELAAH KRITIS

1. Kelebihan dan kekurangan


Kelebihan
Secara Umum menurut kami artikel ini dibuat dengan baik dengan pemaparan
yang cukup jelas.
Kekurangan
1) Abstraksi terlalu panjang namun tidak mencakup sampel, hipotesis, metode
yang digunakan untuk menganalisis data
2) Tidak terdapat saran oleh peneliti untuk penelitian selanjutnya
2. Gap Teori
Penulis berpendapat bahwa temuan dari Banker et al. (2004), di mana
setiap manajer sub-unit dilakukan lebih baik dari level target pada
setiap kinerja di semua skenario, tidak akan menyelenggarakan
pengaturan yang melibatkan kinerja yang kurang baik. Secara khusus,
ketika kinerja pada SL langkah-langkah (penting) menguntungkan tapi
kinerja pada NSL (kurang penting) tindakan tidak menguntungkan,
sedangkan penulis memperkirakan bahwa langkah-langkah NSL akan
berbobot lebih dari langkah-langkah SL. Kami mendasarkan prediksi
kami pada penelitian psikologi, yang telah mendokumentasikan ''bias
negatif''. Dimana penulis memprediksi dan menemukan bahwa bias
memegang peranan dalam pengaturan yang melibatkan hasil yang
berbeda-beda. Selain itu penulis juga memprediksi bahwa bias akan

25

lebih kuat bila hasil negatif berhubungan dengan langkah-langkah SL


dibandingkan dengan langkah-langkah NSL.
3. Pengujian Hipotesis
Dalam penelitian ini ada dua percobaan yang dilakukan dan kedua percobaan tersebut
telah menjelaskan pengujian dan hasil yang diperoleh yaitu percobaan pertama dan kedua
telah menjelaskan tentang hasil dari uji yang dilakukan pada peserta dalam mengisi cek
manipulasi dan pengetahuan umum mengenai BSC. Dalam percobaan ini telah dijelaskan
metode yang digunakan oleh peneliti.
4. Hasil
Secara umum hasil dari penelitian ini telah dijelaskan dengan baik oleh peneliti
berdasarkan hasil uji statistik yang disertai juga dengan pernyataan yang menjelaskan
hasil uji statistik tersebut
5. Diskusi dan Kesimpulan
Dalam menyampaikan kesimpulan yang diperoleh oleh peneliti, peneliti sudah menarik
kesimpulan berdasarkan literature dan asumsi pribadi yang digunakan peneliti dalam
melakukan penelitian ini serta telah disampaikan keterbatasan dan kontribusi dari
penelitian ini. Namun belum ada saran oleh peneliti untuk penelitian selanjunta.
6. Replikasi
Penelitian bisa dilakukan di Indonesia namun dengan responden yang berbeda misalnya
respondennya menggunakan manajer perusahaan atau juga pada pimpinan SKPD di
sektor public.

26