Jahja Umar
Fakultas Psikologi Universitas Islam Negeri Jakarta
Abstrak
Setidaknya ada empat sumber kesalahan yang dapat mengakibatkan tidak
validnya hasil penelitian, terutama sekali dalam analisis data dengan statistika,
yaitu: (a) kesalahan sampling (sampling error), (b) kesalahan pengukuran
(measurement error), (c) kesalahan spesifikasi/teori (specification error), dan
(d) sumber kesalahan lain yang belum diketahui dan dianggap bersifat random
(random error). Dalam penelitian psikologi khususnya dan ilmu sosial pada
umumnya dampak dari kesalahan pengukuran terhadap validitas hasil
penelitian adalah jauh lebih dominan dari pada jenis kesalahan lainnya karena
hampir semua variabel psikologi merupakan variabel laten yang tak dapat
diukur secara langsung. Dampak dari kesalahan pengukuran umumnya berupa
atenuasi yaitu under-estimasi terhadap koefisien statistik seperti korelasi,
regresi, muatan faktor, dan lain-lainnya. Secara tradisional peneliti di bidang
psikologi diwajibkan untuk melaporkan validitas dan reliabilitas alat ukur yang
digunakan untuk mengumpulkan data agar pembaca hasil penelitian tersebut
dapat memperkirakan dampak dari kesalahan pengukuran yang terjadi
terhadap kesimpulan penelitian. Namun pada saat ini, telah tersedia berbagai
metode statistika yang dapat digunakan untuk mengoreksi dampak negatif
tersebut, misalnya item response theory (IRT) dan confirmatory factor analysis
(CFA) yang dapat menghasilkan estimate dari true-score untuk kemudian
digunakan sebagai data yang akan dianalisis. Selanjutnya juga terdapat
analisis model persamaan struktural (SEM) dimana dampak kesalahan
pengukuran dapat dikoreksi secara langsung sehingga diperoleh koefisien
korelasi dan regresi yang murni (bebas dari kesalahan pengukuran). Dalam
tulisan ini disajikan ilustrasi (dengan pendekatan SEM) betapa seriusnya
kesalahan yang dapat terjadi jika tidak dilakukan koreksi.
Kata kunci:
Pengukuran, kesalahan pengukuran, variabel laten, regresi, structural
equation modeling.
memiliki titik nol (scale origin) dan dengan skor ”nol” pada sebuah tes
satuan ukuran (scaling unit). Jika Bahasa Inggeris bukan berarti sama
kedua hal ini belum ditetapkan, maka sekali tak memiliki pengetahuan
belum dapat dilakukan pengukuran. Bahasa Inggris bahkan satu patah kata
Ditinjau dari segi titik nol yang pun. Sebab itu, penafsiran hasil
ditetapkan, ada dua jenis skala ukuran pengukuran tak dapat dilakukan
yaitu: (1) skala ratio dan (2) skala secara ratio. Misalnya, seorang
interval. Suatu skala disebut skala dengan skor 50 tidak dapat ditafsirkan
ratio jika titik nol yang ditetapkan sebagai dua kali lebih banyak
benar-benar menunjukkan tidak ada- pengetahuannya dibandingkan dengan
nya kuantitas (besaran) dari aspek orang yang mendapat skor 25. Skala
yang di ukur. Titik nol seperti ini ukuran yang tidak menggunakan titik
disebut nol absolut. Misalnya ketika nol absolut ini dinamakan skala
mengukur panjang meja dimulai dari interval. Dalam analisis statistika,
salah satu ujungnya, atau mengukur tidak adanya titik nol absolut
tinggi badan dengan titik nol pada bukanlah merupakan halangan. Justru,
telapak kaki atau pada lantai saat ke-banyakan metoda statistika meng-
berdiri. Jika sebuah meja panjangnya gunakan angka rata-rata (mean)
12 kali panjang pensil, maka benda sebagai titik nol, bahkan pada data
lain yang panjangnya 36 pensil adalah dengan skala ratio. Yaitu dengan cara
tiga kali panjang meja tersebut. Jadi mengubah variabel X menjadi (X-Ẍ),
penafsiran hasilnya bersifat ratio. sehingga langsung dapat diketahui
Satuan ukurannya-pun bisa dibalik. apakah suatu nilai berada di bawah
Misalnya panjang pensil dikatakan atau di atas angka rata-rata (mean)
sebagai seperduabelas meja. Ada hanya dengan melihat tanda-nya,
kalanya orang tak dapat menetapkan apakah positif atau negatif. Perubahan
lokasi dari titik nol absolut untuk lokasi titik nol pada suatu
sebuah skala, karena atribut yang hen- skala dapat dilakukan dengan
dak diukur tidak kelihatan. Misalnya menambah atau mengurangi dengan
ketika hendak mengukur temperatur suatu konstan pada setiap kasus. Hal
(suhu). Di sini, pengukuran dilakukan ini tidak akan mengubah susunan
secara tidak langsung, yaitu dengan distribusi frekuensi maupun indeks
bantuan benda lain yang peka atau koefisien statistik seperti ranking,
terhadap perubahan suhu, misalnya range, varians, korelasi, dan
merkuri. Skala ukuran ditetapkan atas sebagainya. Yang terjadi hanyalah
dasar pengamatan terhadap perubahan pergeseran lokasi dari keseluruhan
volume pada benda tersebut. Pada distribusi frekuensi suatu variabel
skala ini angka nol bukan berarti tak pada garis kontinum skala.
adanya kuantitas suhu. Kadang-kadang ada literatur yang
Hampir semua pengukuran di menggunakan istilah skala ordinal
bidang psikologi dilakukan tanpa skala atau bahkan sebutan skala nominal.
dengan titik nol absolut. Seorang Pada dasarnya penggunaan istilah ini
Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012 51
tidak tepat karena dalam hal ini tidak akan mengalami ”atenuasi” (lebih
terdapat titik nol dan satuan ukuran, rendah dari yang semestinya/ under-
yang menjadi syarat untuk sebuah estimated) karena alat dan prosedur
skala. Oleh sebab itu tak dapat yang digunakan dalam pengukuran
dinamakan skala ukuran. Apa yang tidak dapat menghasilkan data yang
disebut sebagai skala ordinal sebetul- sepenuhnya valid dan reliabel. Ini
nya adalah upaya pengukuran atas terjadi karena pengukuran hanya dapat
suatu variabel kontinum dengan dilakukan secara tidak langsung
menggunakan kategori yang ber- karena atribut atau karakter yang
jenjang (ordered-categorical). Misal- hendak diukur umumnya berupa
nya kategori: baik sekali, baik, konsep atau konstruk yang tak dapat
sedang, kurang, dan kurang sekali. dilihat atau diobservasi secara fisik.
Data yang dihasilkan adalah bilangan Yang tampak dan terekam hanya
bulat positif (integer), yaitu frekuensi indikatornya saja.
kejadian pada setiap kategori tersebut. Kesalahan dalam pengukuran
Data seperti ini tak boleh dianalisis akan mengakibatkan diperolehnya
seakan ia bilangan riel pada skala data dengan ukuran variabilitas
interval. Namun demikian, kini telah (varians) yang lebih besar dari pada
tersedia metodologi untuk mentrans- yang semestinya. Misalkan ada 100
formasikan data yang berupa orang yang tingginya persis sama
frekuensi/proporsi pada setiap kate- yaitu 160 cm (yaitu varians = nol),
gori yang berjenjang tersebut menjadi tetapi terukur dengan kesalahan,
ukuran pada suatu skala interval. Andaikan kesalahan pengukuran yang
Justru inilah sebenarnya landasan terjadi bersifat random (tidak sis-
logika dari sebagian besar pengukuran tematik), maka sebagian orang akan
di bidang psikologi. Sebagian besar terukur kurang dari 160 cm dan
metode analisis data dengan statistika sebagian orang terukur lebih dari 160
menggunakan asumsi bahwa data cm, di mana kekurangan atau
yang dianalisis adalah hasil peng- kelebihan dalam ukuran tersebut juga
ukuran dalam skala interval. dapat bervariasi. Keadaan ini akan
mengakibatkan diperolehnya data
yang memiliki varians yang lebih
Dampak Kesalahan Pengukuran besar dari nol, padahal seharusnya
nol. Dengan kata lain, varians yang
Pada penelitian di bidang psikologi, terlihat pada data sebenarnya adalah
sosiologi, pendidikan, ekonomi, kese- varians palsu, dan dinamakan ”varians
hatan masyarakat, politik, dan ilmu ke-salahan pengukuran”. Selanjutnya,
sosial lainnya, salah satu ancaman andaikan ada 100 orang yang tinggi
terhadap kualitas analisis data jika badannya bervariasi dengan mean=
menggunakan statistika ialah 160 dan varians = 25 cm2. Jika terjadi
”kesalahan pengukuran” (measure- kesalahan pengukuran dan kesalahan
ment error). Koefisien statistik seperti itu bersifat random, maka data yang
korelasi, regresi, muatan faktor, dsb., akan diperoleh akan memiliki mean
52 Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012
yang sama yaitu 160 cm, tetapi akan Contoh 1: Koreksi Dengan SEM
memiliki varians yang jauh lebih
besar dari 25 cm2, misalnya 45 cm2. Structural Equation Modeling (SEM)
Dalam hal ini, selisih antara varians merupakan metode statistika yang
pada data yang diperoleh (observed sangat generik karena dapat diterap-
variance) dan varians yang sejatinya kan pada semua jenis analisis
harus di-peroleh jika tak terjadi statistika yang berbasiskan regresi. Di
kesalahan pengukuran (true variance), sini, LISREL adalah software yang
yaitu 45 cm2 - 25 cm2 = 20 cm 2, paling populer di kalangan peneliti
adalah merupakan variasi data karena ilmu sosial. Berikut adalah ilustrasi
kesalahan pengukuran, dan disebut dengan data riel (bukan simulasi)
”Varians Kesalahan Pengukuran” untuk menunjukkan betapa seriusnya
(Measurement Error Variance). dampak buruk dari ”measurement
Varians kesalahan pengukuran ini error” dalam setiap analisis statistika.
berdampak negatif terhadap berbagai Misalkan seorang peneliti bidang
koefisien statistik ketika data hasil kesehatan1 ingin mengetahui apakah
observasi dianalisis secara langsung kesadaran akan pentingnya makanan
tanpa koreksi. Seperti telah disebutkan bergizi (Awareness) ditentukan oleh
sebelumnya, dapat terjadi ”atenuasi” tingkat ketersediaan makanan di ru-
(underestimated) terhadap misalnya, mah (Availability). Ia berniat melaku-
koefisien regresi atau korelasi, sehing- kan analisis regresi sederhana dengan
ga suatu statistik yang sebenarnya variabel Availability (”Avail”) sebagai
signifikan menjadi dilaporkan sebagai Independent Variable dan Awareness
tidak signifikan. (”Aware”) sebagai Dependent Vari-
Setidaknya ada dua cara koreksi able. Kedua variabel ini diukur meng-
yang dapat dilakukan agar diperoleh gunakan skala rating tipe Likert
koefisien yang terbebas dari atenuasi dengan lima kategori pilihan, mulai
tersebut: (a) dilakukan estimasi ter- dari ”sangat setuju” sampai dengan
hadap ”true-scores” untuk setiap ”sangat tidak setuju” pada setiap item-
kasus (misalnya menggunakan soft- nya. Alat ukur masing-masing
ware seperti BILOG, MULTILOG, variabel terdiri dari lima item.
Mplus, dsb.) kemudian ”true-scores” Secara tradisional, peneliti
inilah yang dijadikan data dalam biasanya menjumlahkan skor setiap
analisis; dan (b) menggunakan model item sehingga diperoleh skor total
statistika yang memperhitungkan dan untuk kedua variabel, lalu dilakukan
mengkoreksi dampak dari ”measure- analisis regresi. Hasilnya, diperoleh
ment error” terhadap setiap koefisien R2 0.08 atau koefisien regresi
yang di ”estimate” (misalnya ”con- (standardized) β = 0.28. Dalam
firmatory factor analysis” dan
”structural equation modeling”
1
dengan software seperti LISREL, Terima kasih kepada Dr. Risa Kolopaking,
MPLUS, EQS, dsb). yang telah mengijinkan data uji coba
instrumennya untuk dianalisis di sini.
Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012 53
bentuk diagram dapat dilihat pada Likert dengan 4 tingkatan pilihan.
Gambar-1. Selanjutnya data yang Pertama dilakukan analisis regresi
sama dianalisis dengan pendekatan dengan TC sebagai dependent
SEM, menggunakan sofware LISREL. variable dan EM sebagai independent
Di sini, analisis regresi dilakukan pada variable, di mana keduanya diukur
tingkat true-score menggunakan dengan skor total dari menjumlahkan
model dengan struktur seperti pada skor item dan hasilnya dianggap
Gambar-2 di bawah, yang selain sebagai ukuran berskala interval.
memperhitungkan perbedaan reliabili- Sebagai hasilnya diperoleh ko-efisien
tas dari setiap item, juga meng- regresi (standardized, agar
akomodasi saling korelasi antara komparabel skalanya) sebesar 0.0989.
”measurement error” pada item yang Hal ini terlihat pada Gambar 3.
satu dengan lainnya. Hasilnya, Selanjutnya, dilakukan analisis reg-
ternyata diperoleh koefisien regresi resi yang sama tetapi antar-variabel
(standa-dized) β = 0.57 dengan laten EM dan TC di mana semua
R2 0.33 Ternyata dampak buruk item masing-masing dijadikan
dari “measurement error” cukup indikator untuk mengukur (dengan
dramatis !! analisis faktor). Sebagai hasilnya,
Pada sebuah penelitian yang diperoleh koefisien regresi
penulis lakukan dengan sampel (standardized) sebesar 0.33. Situasi
sebanyak 1855 orang, terdapat dua ini dapat dilihat pada Gambar 4. Jelas
variabel yang dapat dijadikan sebagai tampak di sini bahwa koefisien
ilustrasi dalam masalah ini, yaitu regresi sedemikian ter-atenuasi
”emphaty” (EM, diukur dengan 3 sehingga koefisien dalam ukuran ”true
item), dan ”task commitment” (TC, score” menghasilkan angka yang
diukur dengan 10 item). Semua hampir tiga setengah kali lipat
itemnya adalah dalam bentuk skala besarannya.
Referensi
Bentler, P. M. 2001. EQS Structural Thissen, D., Hung Chen, W., and
Equation Modeling Software. Bock, R.D. 2003. MULTILOG
Multivariate Software, Inc. Los Scientific Software International.
Angeles. www. mvsoft.com Chicago, IL www.ssicentral.com
Joreskog, K.G., & Sorbom, D. 1996. Zimowsky, M., Muraki, E., Mislevy,
LISREL 8: User‟s Reference R., & Bock, R.D., 2003. BILOG-
Guide. Scientific Software Inter- MG. Scientific Software Inter-
national. Chicago, IL. www. national Chicago, IL. www.
ssicentral.com ssicentral.com
Muthen, L.K. & Muthen, B.O. (1998–
2007). Mplus User‟s Guide. Fifth
Edition. Los Angeles. CA: Muthen
& Muthen. www.statmodel.com