Anda di halaman 1dari 7

Jurnal Ilmu Pertanian dan Perikanan Desember 2013 Available online at:

Vol. 2 No. 2 Hal : 127-133 http://umbidharma.org/jipp


ISSN 2302-6308

SKALA PENGUKURAN DAN JUMLAH RESPON SKALA


LIKERT
(The Measurement Scale and The Number of Responses in Likert Scale )

Weksi Budiaji1*
1Dosen Fakultas Pertanian Universitas Sultan Ageng Tirtayasa
Jl. Raya Jakarta Km 4 Pakupatan Serang Banten
*Korespondensi: budiaji@untirta.ac.id

Diterima: 10 September 2013 / Disetujui: 15 Oktober 2013

ABSRACT
The ease of likert scale on its contruction as a measurement scale of individual
traits must be cautioned to prevent some errors in the data analysis. Some
researchers consider likert scale as an interval scale, while the others mention likert
scale as an ordinal scale. After reviewing some papers from some different authors,
we argue that a likert scale using total score of all items is an interval scale. On the
other hand, items using likert format is an ordinal scale. The number of responses in
the likert scale suggested is 7 based on responden’s preference that of they like it
the most. Moreover, the 7 response format has a good reliability, validity,
discriminating power, and test-retest (stability) index.
Keywords: interval, likert, measurement, ordinal, scale

ABSTRAK
Kemudahan penyusunan skala likert sebagai alat ukur perilaku individu perlu
diperhatikan dengan hati-hati untuk menghindari kesalahan dalam analisis data.
Beberapa peneliti menggolongkan skala likert kedalam dua skala yang berbeda
yaitu ada yang mengolongkan kedalam skala ordinal dan yang lain menggolongkan
kedalam skala interval. Setelah mereview beberapa tulisan dari peneliti yang
berbeda, penulis berpendapat bahwa skala likert yang menggunakan skor total dari
semua butir pertanyaan adalah skala interval. Dilain pihak, butir pertanyaan yang
menggunakan tipe data likert mempunyai skala pengukuran ordinal. Jumlah titik
respon yang disarankan penulis adalah 7 berdasarkan atas preferensi responden
yang paling responden suka terhadap jumlah respon ini. Disamping itu, jumlah titik
respon 7 juga mempunyai reliabilitas, validitas, kekuatan diskriminasi, dan stabilitas
yang cukup baik.
Kata kunci: likert, skala, pengukuran, ordinal, interval

PENDAHULUAN alat ukur yang pasti. Alat ukur yang


digunakan adalah butir-butir pertanyaan
Penelitian-penelitian tentang perila-
yang dianggap sebagai indikator dari
ku personal yang mengukur sifat-sifat
perilaku tertentu misalnya pengetahuan
individu selalu menggunakan alat ukur
atau sikap. Butir-butir pertanyaan ter-
yang dirancang sendiri oleh peneliti,
sebut akan direspon oleh individu-
baik melalui pre-test maupun eliciting
individu yang akan diukur perilakunya.
(bertanya pada ahli) karena tidak ada
128 BUDIAJI JIPP

Penggunaan buti-butir pertanyaan Kemudahan yang ada pada penyu-


mengikuti pedoman skala pengukuran sunan skala likert harus diperhatikan
yang digunakan. dengan hati-hati agar analisis lanjutan
Ada beberapa skala pengukuran terhadap butir-butir respon tepat.
yang dapat digunakan dalam meran- Permasalahan yang sering terjadi
cang skala pengukuran pada penelitian adalah kebingunan dalam penggo-
perilaku misalnya skala thurstone, longan skala likert ke dalam dua skala
guttman, dan likert. Skala thurstone pengukuran yang berbeda yaitu dian-
dapat digunakan untuk menduga prefe- tara ordinal dan interval. Perdebatan
rensi individu dengan menggunakan antara penggolongan skala likert keda-
nilai frekuensi responnya. Posisi dari lam dua golongan skala yang berbeda
butir-butir pertanyaan dapat diperoleh telah berlangsung cukup lama karena
dengan mengambil rataan dari persentil penggolongan skala pengukuran yang
sebaran normal baku berdasarkan berbeda akan berdampak pada analisis
proporsi preferensi responden terhadap yang dapat digunakan pada skala likert.
sebuah butir pertanyaan (Lipovetsky Tujuan penelitian ini adalah untuk
2007). Skala guttman menggunakan mereview penggolongan skala likert
skala kumulatif dimana jika individu yang telah dikemukakan beberapa pe-
setuju pada butir pertanyaan tertentu, neliti. Kemudian, jumlah optimal titik
maka individu tersebut juga setuju pada respon pada skala likert juga akan
semua butir pertanyaan lain yang lebih dibahas, berjumlah genap atau ganjil.
lemah (pertanyaan sebelumnya). Skala
guttman jarang dipakai peneliti karena
METODE PENELITIAN
membutuhkan upaya yang lebih gigih
untuk mendapatkan butir-butir perta- Penelitian ini adalah penelitian
nyaan yang valid (Uhlaner 2002). Skala literatur. Literatur yang digunakan
yang paling mudah digunakan adalah sebagai sumber adalah literatur yang
skala likert. Skala likert menggunakan akan dihubungkan dengan masalah
beberapa butir pertanyaan untuk meng- yang ingin diteliti yaitu mengenai
ukur perilaku individu dengan merespon penggolongan skala likert dan jumlah
5 titik pilihan pada setiap butir perta- respon skala likert.
nyaan, sangat setuju, setuju, tidak
memutuskan, tidak setuju, dan sangat
tidak setuju (Likert 1932). HASIL DAN PEMBAHASAN
Kemudahan penggunaan skala Ordinal vs Interval
likert menyebabkan skala ini lebih ba- Pertama, skala likert digolongkan
nyak digunakan oleh peneliti. Kelly and kedalam skala ordinal. Jamieson (2004)
Tincani (2013), misalnya, menggunakan menyatakan bahwa kategori respon
skala likert untuk mengukur perilaku pada skala likert mempunyai tingkatan
kerjasama individu yaitu dengan meng- tetapi jarak diantara kategori tidak dapat
ukur variabel ideologi, perspektif, pela- dianggap sama, sehingga skala likert
tihan pribadi, dan pelatihan orang lain. adalah kelas skala ordinal. Jika analisis
Di bidang pertanian, skala likert juga statistik yang digunakan salah, peluang
sering digunakan untuk mengukur pre- kesimpulan salah juga meningkat. Jika
ferensi individu seperti pada preferensi skala likert dianggap sebagai skala
konsumen terhadap penerimaan produk ordinal, perhitungan rataan dan standar
makanan yang telah dimodifikasi deviasi tidak tepat. Pada kelas ini,
(Herath et al. 2013) dan preferensi statistik yang dapat digunakan adalah
petani terhadap karakteristik tanaman median atau modus untuk menghitung
gandum yang ingin diusahatanikan ukuran pemusatannya, sedangkan va-
(Nelson 2013). riasi data dapat dilihat menggunakan
frekuensi dari jawaban responden,
Vol. 2, 2013 Skala Pengukuran dan Jumlah Respon Skala Likert 129

sehingga statistika parametrik tidak sehat seperti pada Tabel 1. Analisis dari
dapat diterapkan pada data ini. Jika jawaban pertanyaan pada Tabel 1 dapat
skala ini dianalisis dengan statistika menggunakan skor total dari jumlah
parametrik, maka langkah ini adalah jawaban tiap pertanyaan, sehingga skor
salah, kesalahan pertama dari tujuh yang diperoleh berkisar antara 5 sampai
keselahan yang umum dilakukan dengan 25. Karena skor 5 sampai
(Kuzon et al. 1996). Barua (2013) juga dengan 25 tersebut berskala interval,
telah mengusulkan cara-cara dalam analisis data parametrik dapat
penentuan titik potong pada skala likert digunakan.
sebagai skala ordinal yang tidak Disisi lain, tipe/format data likert
mempunyai standar baku pada skala adalah satu pertanyaan yang berdiri
ordinal ini. sendiri yang menggunakan format
Dilain pihak, beberapa peneliti jawaban seperti pada skala likert. Jika
menganggap bahwa skala likert adalah seorang peneliti menggunakan butir
skala pengukuran interval. Carrafio and pertanyaan yang banyak tetapi berdiri
Rocco (2007) menyatakan bahwa skala sendiri (bukan merupakan suatu indi-
likert dapat menghasilkan skala peng- kator dari sifat tertentu misalkan sikap,
ukuran interval. Hal yang sama diung- kebiasaan atau pengetahuan), maka
kapkan oleh Boone and Boone (2012) peneliti tersebut tidak dapat mengga-
yang menjelaskan bahwa skala likert bungkan nilai dari jawaban tiap perta-
dapat dianalisis menggunakan statistika nyaan. Tabel 2 memperlihatkan contoh
parametrik misalkan ANOVA (analysis butir-butir pertanyaan yang berdiri sen-
of variance) maupun uji t. Carrafio and diri, sehingga penjumlahan dari jawaban
Rocco (2007) dan Boone and Boone tidak dapat dilakukan. Pada format data
(2012) mempunyai pendapat yang likert, penggunaan analisis data para-
sama karena ada perbedaan yang metrik tidak disarankan karena format
cukup mendasar antara skala likert dan data likert mempunyai skala kelas
data likert (tipe/ format data likert). ordinal. Analisis data yang dapat
Skala likert adalah skala peng- digunakan misalnya median, modus,
ukuran yang dikembangkan oleh Likert dan frekuensi.
(1932). Skala likert mempunyai empat Perbedaan yang mendasar dari
atau lebih butir-butir pertanyaan yang kedua golongan skala (interval dan
dikombinasikan sehingga membentuk ordinal) pada skala likert adalah peng-
sebuah skor/nilai yang merepresen- gunaan skor total butir pertanyaan dan
tasikan sifat individu, misalkan pengeta- skor masing-masing butir pertanyaan.
huan, sikap, dan perilaku. Dalam proses Skor total dari semua butir pertanyaan
analisis data, komposit skor, biasanya disebut test score yang merupakan hal
jumlah atau rataan, dari semua butir utama yang menjadi perhatian dalam
pertanyaan dapat digunakan. Peng- classical test theory (CTT) (McDonald
gunaan jumlah dari semua butir perta- 1999; Baker 2001). Penulis berpenda-
nyaan valid karena setiap butir perta- pat, merujuk pada CTT yang berkem-
nyaan adalah indikator dari variabel bang saat Likert (1932) muncul, bahwa
yang direpresentasikannya. Boone and skala likert (bukan tipe data likert)
Boone (2012) memberikan contoh skala adalah skala interval, sehingga factor
likert untuk mengukur sifat individu model (model yang menggunakan ana-
dalam hal kebiasan memakan makanan lisis faktor) dapat diterapkan.
130 BUDIAJI JIPP

Tabel 1 Contoh skala likert sebagai skala interval


Sangat
Tidak Sangat
No Pertanyaan Tidak Netral Setuju
Setuju Setuju
Setuju
1 Saya makan makanan sehat secara
teratur
2 Saat membeli makanan di
supermarket saya tidak
memperdulikan makan ‘sampah’
3 Saat menyiapkan makan, saya
memperhatikan kandungan lemak
dalam makanan
4 Saat menyiapkan makan, saya
memperhatikan kandungan lemak
dalam makanan
5 Diet makanan sehat penting bagi
keluarga saya
Sumber: Boone and Boone (2012)

Tabel 2 Contoh format data likert sebagai skala ordinal


Sangat
Tidak Sangat
No Pertanyaan Tidak Netral Setuju
Setuju Setuju
Setuju
1 Program pelatihan sangat baik
untuk menambah pengalaman saya
2 Orang tua saya mendukung
program pelatihan yang saya ikuti
3 Keterlibatan saya dalam pelatihan
akan memberikan perubahan pada
saya
4 Pembimbing pelatihan selalu ada
untuk membimbing saya
5 Teman-teman pelatihan akan
mempengaruhi pekerjaan saya
dimasa mendatang

Penulis tidak sependapat dengan sama pada semua butir pertanyaan


Carrafio and Rocco (2007) yang menya- (Ostini and Nering, 2006).
rankan agar menghindari analisis butir
pertanyaan. Pada modern test theory Jumlah Titik Respon
yaitu item response theory (IRT), butir
Skala likert dikembangkan pertama
pertanyaan dapat dibandingkan satu
kali menggunakan 5 titik respon yaitu
sama lain sehingga butir pertanyaan
sangat setuju, setuju, tidak memu-
dapat diurutkan berdasarkan tingkat
tuskan, tidak setuju, dan sangat tidak
kesulitannya (Embretson and Reise,
setuju (Likert 1932). Kemudian, bebe-
2000) dengan menggunakan model
rapa peneliti mencoba mengem-
IRT. Model-model IRT tersebut dapat
bangkan jumlah titik yang lain dan
diperoleh dengan menggunakan model
membandingkannya. Dawes (2002)
peluang dengan konsep yang berda-
membandingkan jumlah 5 titik dengan
sarkan jarak (Andrich 1988; Polak 2011;
11 titik yang menghasilkan rataan yang
Budiaji 2012). Skala likert sama dengan
sama setelah kedua skala tersebut
rating scale model pada IRT karena
diskala ulang. Jumlah titik 5 dan 11
mempunyai format jumlah respon yang
adalah sebanding, artinya respon yang
Vol. 2, 2013 Skala Pengukuran dan Jumlah Respon Skala Likert 131

menjawab pertanyaan dengan jumlah yaitu sensitivitas dan linearitas diberikan


titik respon 5 dapat dikonversi kedalam oleh Hofmans et al. (2007). Empat
jumlah titik respon 11 tanpa ada jumlah titik diuji dengan kedua kriteria
masalah. Tetapi, jumlah titik 11 ini yaitu jumlah titik 5, 7, 10, dan 15.
mempunyai variasi yang lebih tinggi Hasil yang diperoleh menunjukkan bah-
dibandingkan 5 titik, sehingga untuk wa sensitivitas dan linearitas jumlah titik
analisis regresi lebih disukai karena 5, 7, 10, dan 15 sama. Meskipun mem-
keragamannya yang tinggi. punyai sensitivitas dan linearitas yang
Dawes (2008) kemudian mem- sama, Hofmans et al. (2007) menya-
bandingkan jumlah titik 5, 7 dan 10. rankan jumlah titik 7 karena jumlah titik
Jumlah titik respon pada skala likert ini lebih disukai oleh responden.
akan berpengaruh pada rataan, ukuran Bias sosial menjadi pertimbangan
penyebaran, dan bentuk sebaran. Garland (1991) saat menentukan jumlah
Rataan yang sama diperoleh saat skala titik respon. Jumlah titik respon genap
likert menggunakan 5 titik dan 7 titik (jumlah titik 4) lebih disarankan dari-
ketika keduanya diskala ulang. Jumlah pada jumlah titik respon ganjil (jumlah
titik 5 dan 7 juga sebanding. Tetapi titik 5) karena bias sosial dapat
jumlah titik 5 dan 7 tidak dapat diban- dikurangi. Bias sosial yang dimaksud
dingkan dengan jumlah titik 10 karena adalah keinginan untuk menyenangkan
jumlah titik 5 dan 7 menghasilkan rataan interviewer atau perasaan agar diang-
yang lebih tinggi dibandingkan 10. gap penolong oleh interviewer karena
Pembahasan yang lebih lengkap mau menjadi responden. Responden
mengenai jumlah titik pada skala likert akan cenderung menjawab dengan
dijelaskan oleh (Preston and Colman memilih netral (titik ditengah). Penelitian
2000). Jumlah titik 2, 3, dan 4 meng- Garland (1991) perlu dikembangkan lagi
hasilkan indeks reliabilitas, validitas, karena menurut Preston and Colman
dan kekuatan diskriminasi yang jelek. (2000) jumlah titik kurang dari 5
Hasil ini berbeda nyata dibandingkan mempunyai kriteria yang jelek dalam hal
jumlah titik 5, 6, dan 7 yang mempunyai reliabilitas, validitas, kekuatan diskri-
indeks reliabilitas, validitas, dan kekua- minasi dan stabilitas.
tan diskriminasi lebih baik. Ukuran Hasil-hasil penelitian mengenai
stabilitas (test-retest validitas) menun- jumlah titik respon dari skala likert
jukkan jumlah titik 2, 3, dan 4 mempu- menunjukkan bahwa jumlah titik 5, 7, 11
nyai stabilitas yang paling buruk dan adalah sebanding. Jumlah titik 5, 7, 10,
semakin bagus saat jumlah titik mening- dan 15 juga sama dalam hal linearitas
kat menjadi 7, 8, 9 atau 10. Kemudian, dan sensitivitas. Penulis menyarankan
ukuran stabilitas cenderung turun pada penggunaan jumlah titik 7 karena indeks
jawaban responden dengan jumlah titik validitas, reliabilitas, kekuatan diskrimi-
lebih dari 10. Menurut responden, jum- nasi, dan stabilitasnya baik dan disukai
lah titik yang disukai adalah 10, 7, dan 9 oleh responden.
sedangkan jumlah titik 5, 7, dan 10 lebih
mudah dijawab. Jumlah titik 2, 3, dan 4
cukup cepat dijawab oleh responden, KESIMPULAN
tetapi menurut responden kurang mere- Skala likert (bukan tipe data likert)
presentasikan jawaban responden. yang mengukur sifat-sifat (traits)
Preston and Colman (2000) kemudian individu misalnya pengetahuan atau
menyarankan tingkatan jumlah titik yang sikap dengan menggunakan skor total
disarankan adalah 7 kemudian 9 dan 10 dari butir pertanyaan adalah skala
berdasar-kan kriteria yang telah pengukuran interval. Disisi lain, butir
disebutkan. pertanyaan yang menggunakan tipe
Selain menggunakan validitas dan data likert mempunyai skala peng-
reliabilitas, penggunaan kriteria lain ukuran ordinal. Jumlah titik respon pada
132 BUDIAJI JIPP

skala likert yang disarankan adalah 7 Herath HMTK, JMM Udugama and UK.
titik respon karena lebih disukai Jayasinghe-Mudalige. 2013.
responden dan mempunyai kriteria Women Consumer Preferences for
validitas, reliabilitas, kekuatan diskri- Socially Responsible Food
minasi, dan stabilitas yang cukup baik. Production Atributes: Evidence from
Urban Supermarket Setting in the
Anuradhapura District.. The Journal
DAFTAR PUSTAKA of Agricultural Sciences 8 (2) pp: 57
Andrich A. 1988. A Rating Formulation – 69
for Ordered Response Categories. Hofmans, Joeri, Peter Theuns, and O
Psychometrika 43:561 – 573 Mairesse. 2007. Impact of the
Baker FB. 2001. The Basic of Item Number of Response Categories on
Response Theory. ERIC: USA Linearity and Sensitivity of Self-
Anchoring Scales: A Functional
Barua A. 2013. Methods for Decision-
Measurement Approach.
Making in Survey Questionnaires
Methodology 3 (4) pp: 160–169
Based on Likert Scale. Journal of
Asian Scientific Research 3 (1) pp: Jamieson S. 2004. Likert scales: How to
35 – 38 (ab)use them. Medical education,
38(12): 1217-1218
Boone Jr, Harry N, and Deborah A.
Boone. 2012. Analyzing Likert Data. Kelly, Amy, and M Tincani. 2013.
Journal of Extension 50 (2) Collaborative Training and Practice
among Applied Behavior Analysts
Budiaji W. 2012. Item Response Models
who Support Individuals with
from A Distance Perspective
Autism Spectrum Disorder.
[Thesis]. Leiden University: Leiden
Education and Training in Autism
Carrafio J, and J Rocco. 2007. Ten and Developmental Disabilities
common misunderstandings, 48(1) pp: 120–131
misconceptions, persistent myths
Kuzon WM Jr, Urbanchek MG, and
and urban legends about likert
McCabe S. 1996. The seven deadly
scales and likert response formats
sins of statistical analysis. Ann
and their antidotes. Journal of
Plastic Surg 37 pp: 265–72
Social Sciences 3 (3) pp: 106-116
Likert RA. 1932. Technique for the
Dawes J. 2002. Five Point vs Eleven
measurement of attitudes. Archives
Point Scales: Does It Make
of Psychology, 140 pp: 1-55
Difference To Data Characteristics?
Australasian Journal of Market Liposvetsky S. 2007. Thurstone Scaling
Research 10 (1) in Order Statistics. Mathematical
and Computer Modelling 45 pp: 917
Dawes J. 2008. Do data characteristics
– 926
change according to the number of
scale points used? An experiment McDonald, Roderick P. 1999. Test
using 5 point, 7 point and 10 point Theory: A Unified Treatment.
scales. International Journal of Lawrence Erlbaum: New Jersey
Market Research 50 (1) Nelson, K Margaret. 2013. Analysis of
Embretson, Susan E, and Steven P Farmer Preferences for Wheat
Reise. 2000. Item Response Variety Traits in Ethiopia: A
Theory for Psychologists. Lawrence Gender-Responsive Study.
Erlbaum: New Jersey [Thesis]. Cornell University: New
York
Garland R. 1991. The Mid-Point on a
Rating Scale: Is it Desirable? Ostini, Remo, and Michael L. Nering.
Marketing Bulletin 2 Research Note 2006. Polytomous Item Response
3 pp: 66-70 Theory Models. Sage: California
Vol. 2, 2013 Skala Pengukuran dan Jumlah Respon Skala Likert 133

Polak M. 2011. Item Analysis of Single- Uhlnaer, Lorraine M. 2002. The Use of
Peaked Response Data: The the Guttman Scale in Development
Psychometric Evaluation of Bipolar of a Family Bussiness Index.
Measurement Scales [PhD thesis]. Research Report H2002003.
Leiden University: Leiden SCALES: Zoertemeer
Preston, Carolyn C, and Andrew M
Colman. 2000. Optimal number of
response categories in rating
scales: reliability, validity,
discriminating power, and
respondent preferences. Acta
Psychologica 104: 1-15

Anda mungkin juga menyukai