Anda di halaman 1dari 11

Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012 47

Peran Pengukuran dan Analisis


Statistika dalam Penelitian Psikologi

Jahja Umar
Fakultas Psikologi Universitas Islam Negeri Jakarta

Abstrak
Setidaknya ada empat sumber kesalahan yang dapat mengakibatkan tidak
validnya hasil penelitian, terutama sekali dalam analisis data dengan statistika,
yaitu: (a) kesalahan sampling (sampling error), (b) kesalahan pengukuran
(measurement error), (c) kesalahan spesifikasi/teori (specification error), dan
(d) sumber kesalahan lain yang belum diketahui dan dianggap bersifat random
(random error). Dalam penelitian psikologi khususnya dan ilmu sosial pada
umumnya dampak dari kesalahan pengukuran terhadap validitas hasil
penelitian adalah jauh lebih dominan dari pada jenis kesalahan lainnya karena
hampir semua variabel psikologi merupakan variabel laten yang tak dapat
diukur secara langsung. Dampak dari kesalahan pengukuran umumnya berupa
atenuasi yaitu under-estimasi terhadap koefisien statistik seperti korelasi,
regresi, muatan faktor, dan lain-lainnya. Secara tradisional peneliti di bidang
psikologi diwajibkan untuk melaporkan validitas dan reliabilitas alat ukur yang
digunakan untuk mengumpulkan data agar pembaca hasil penelitian tersebut
dapat memperkirakan dampak dari kesalahan pengukuran yang terjadi
terhadap kesimpulan penelitian. Namun pada saat ini, telah tersedia berbagai
metode statistika yang dapat digunakan untuk mengoreksi dampak negatif
tersebut, misalnya item response theory (IRT) dan confirmatory factor analysis
(CFA) yang dapat menghasilkan estimate dari true-score untuk kemudian
digunakan sebagai data yang akan dianalisis. Selanjutnya juga terdapat
analisis model persamaan struktural (SEM) dimana dampak kesalahan
pengukuran dapat dikoreksi secara langsung sehingga diperoleh koefisien
korelasi dan regresi yang murni (bebas dari kesalahan pengukuran). Dalam
tulisan ini disajikan ilustrasi (dengan pendekatan SEM) betapa seriusnya
kesalahan yang dapat terjadi jika tidak dilakukan koreksi.

Kata kunci:
Pengukuran, kesalahan pengukuran, variabel laten, regresi, structural
equation modeling.

Penulis adalah Dekan Fakultas Psikologi UIN Jakarta.


Korespondensi tentang artikel ini dapat menghubungi
redaksi_jp3i@yahoo.co.id
48 Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012

Pembahasan mengenai pengukuran (counting) atas frekuensi/banyaknya


tak dapat dipisahkan dari konsep kejadian atau kasus pada setiap
tentang variabel, yaitu sesuatu yang kategori yang ditetapkan. Data yang
bervariasi dari satu kasus ke kasus dihasilkan berupa angka-angka dalam
lainnya. Sebagai lawan kata dari bentuk bilangan bulat positif (integer).
variabel ialah konstan, yaitu sesuatu Tidak pernah dihasilkan data dengan
yang selalu sama atau tidak bervariasi angka pecahan (fraction) ataupun
dari satu kasus ke kasus lain-nya. desimal. Juga tidak ada data dalam
Yang layak untuk diteliti atau di- bentuk bilangan negatif. Yang
analisis datanya adalah variabel, diperoleh hanyalah bilangan bulat
bukan konstan. Sebagai contoh, upaya positif mulai dari 0, 1, 2, 3, dan
untuk mendeskripsikan dan menjelas- seterusnya. Di sini, kualitas data
kan tentang bagaimana dan mengapa ditentukan oleh tiga hal yaitu: (1)
sesuatu bervariasi, adalah selalu men- kejelasan dari definisi tentang masing-
jadi pokok bahasan di dalam ilmu masing kategori, (2) setiap kategori
tentang metode analisis data seperti harus bersifat saling ”mutual
statistika. Seperti telah banyak diketa- exclusive” yang artinya tidak boleh
hui, statistika adalah ilmu tentang suatu kasus/kejadian termasuk ke
distribusi frekuensi dari satu atau dalam lebih dari satu kategori, dan (3)
beberapa variabel. Agar dapat dianali- kecermatan dalam memasukkan suatu
sis dengan statistika, data mengenai kasus ke dalam kategori yang sesuai
variabel harus dikumpulkan dalam dengan definisinya.
jumlah banyak, baik dalam arti kasus- Salah satu problem yang sering
nya yang banyak atau kejadiannya dihadapi dalam pengumpulan data
yang berulang-ulang pada satu kasus. variabel kategorik adalah ditemuinya
Pada dasarnya sesuatu dapat ber- kasus yang tak dapat dimasukkan ke
variasi hanya dengan dua cara, yaitu dalam kategori yang tersedia,
(1) bervariasi menurut jenis atau meskipun definisinya telah jelas.
kategorisasinya, atau (2) bervariasi Sebagai ilustrasi, misalkan pada
menurut besaran (magnitude)-nya. variabel kelompok etnis/suku bangsa.
Sesuatu yang bervariasi menurut Seorang subyek memiliki ibu yang
jenisnya dinamakan variabel kategorik berdarah campuran antara suku Bugis
atau variabel jenis. Kadang-kadang dan Jawa, serta memiliki bapak yang
disebut pula sebagai variabel nominal. berdarah campuran Batak dan
Variabel seperti jenis kelamin, latar Lampung. Termasuk kategori suku/
belakang etnis seseorang, agama yang etnis manakah subyek tersebut? Cara
dianut, jenis pekerjaan, jenis warna, yang lazim dilakukan untuk mengatasi
dan sebagainya, adalah contoh dari masalah seperti ini ialah dengan
variabel kategorik. Pengumpulan data membuat kategori tambahan yang
untuk variabel seperti ini tidak diberi label ”lain-lain” (others).
melibatkan proses pengukuran. Yang Problem lain yang kadang terjadi
dilakukan hanyalah penghitungan ialah kesalahan karena dimasukkan-
Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012 49
nya suatu kasus ke dalam lebih dari bervariasi menurut besaran
satu kategori (multiple counting). (magnitude), yang disebut sebagai
Kesalahan seperti ini akan sangat variabel kontinum. Dinamakan
mempengaruhi hasil analisis data. Jika demikian karena suatu besaran
ini terjadi, ibaratnya menghitung biasanya digambarkan dalam bentuk
jumlah kaki kucing di mana kaki kontinum pada suatu garis lurus.
depan ada dua, kaki belakang ada dua, Artinya, satu ujung garis tersebut
kaki kiri ada dua, dan kaki kanan ada menunjukkan besaran dengan angka
dua, sehingga totalnya ada delapan! yang tinggi dan ujung lainnya
Tentu saja analisis terhadap data menunjukkan besaran dengan angka
seperti ini akan sangat menyesatkan. yang rendah. Garis tersebut merupa-
Cara mengatasi masalah ini juga kan garis bilangan riel, dan kasus-
cukup sederhana, yaitu dengan kasus bervariasi dalam hal kedudukan
mencocokkan jumlah total kasus/ atau posisi mereka pada garis
kejadian sebelum dan sesudah kontinum tersebut. Pada garis
klasifikasi dilakukan. Kalau tidak kontinum ini dapat ditetapkan titik nol
sama, berarti telah terjadi kesalahan dan dapat dipilih suatu satuan ukuran
dalam melakukan klasifikasi. Jika (unit) untuk mengukur jarak suatu
jumlah kasus setelah klasifikasi lebih lokasi (pada garis) dari titik nol
besar, berarti telah terjadi ”multiple tersebut. Oleh sebab itu, dalam kon-
counting”. Sedangkan jika jumlahnya teks pengumpulan data variabel
lebih kecil, berarti ada kasus yang kontinum, garis bilangan ini disebut
belum terhitung. ”skala pengukuran”.
Pada tingkatan statistika dasar, Kegiatan pengumpulan data vari-
analisis yang dapat dilakukan terhadap abel kontinum dilakukan dengan cara
data kategorik amatlah terbatas, menentukan di mana posisi suatu kasus
karena seperti telah dikemukakan pada skala tersebut, dan kegiatan ini
sebelumnya, angka yang diperoleh disebut pengukuran. Jadi dapat
hanyalah bilangan bulat positif didefinisikan bahwa pengukuran adalah
(integer) dan bukanlah bilangan riel. kegiatan menetapkan posisi atau lokasi
Biasanya terbatas pada grafik atau dari suatu obyek atau kasus pada suatu
tabel berdasarkan frekuensi atau skala dengan menentukan berapa unit
proporsi/ persentase. Namun pada jaraknya dari titik nol pada skala
tingkatan statistika lanjut, sekarang tersebut. Dari kegiatan ini selalu
sudah cukup banyak tersedia metode dihasilkan angka dalam bentuk bilangan
analisis untuk melakukan prediksi riel karena suatu skala adalah garis
maupun eksplanasi terhadap variabel bilangan riel. Angka yang lebih besar
kategorik, terutama melalui model menunjukkan besaran yang lebih tinggi
yang bersifat probabilistik serta pada aspek yang diukur, dan
melalui berbagai bentuk transformasi sebaliknya, sesuai dengan definisi dari
atas data yang berbentuk proporsi skala yang ber-sangkutan. Hal yang
tersebut. Selanjutnya adalah pem- perlu diingat di sini ialah bahwa suatu
bahasan mengenai sesuatu yang skala harus
50 Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012

memiliki titik nol (scale origin) dan dengan skor ”nol” pada sebuah tes
satuan ukuran (scaling unit). Jika Bahasa Inggeris bukan berarti sama
kedua hal ini belum ditetapkan, maka sekali tak memiliki pengetahuan
belum dapat dilakukan pengukuran. Bahasa Inggris bahkan satu patah kata
Ditinjau dari segi titik nol yang pun. Sebab itu, penafsiran hasil
ditetapkan, ada dua jenis skala ukuran pengukuran tak dapat dilakukan
yaitu: (1) skala ratio dan (2) skala secara ratio. Misalnya, seorang
interval. Suatu skala disebut skala dengan skor 50 tidak dapat ditafsirkan
ratio jika titik nol yang ditetapkan sebagai dua kali lebih banyak
benar-benar menunjukkan tidak ada- pengetahuannya dibandingkan dengan
nya kuantitas (besaran) dari aspek orang yang mendapat skor 25. Skala
yang di ukur. Titik nol seperti ini ukuran yang tidak menggunakan titik
disebut nol absolut. Misalnya ketika nol absolut ini dinamakan skala
mengukur panjang meja dimulai dari interval. Dalam analisis statistika,
salah satu ujungnya, atau mengukur tidak adanya titik nol absolut
tinggi badan dengan titik nol pada bukanlah merupakan halangan. Justru,
telapak kaki atau pada lantai saat ke-banyakan metoda statistika meng-
berdiri. Jika sebuah meja panjangnya gunakan angka rata-rata (mean)
12 kali panjang pensil, maka benda sebagai titik nol, bahkan pada data
lain yang panjangnya 36 pensil adalah dengan skala ratio. Yaitu dengan cara
tiga kali panjang meja tersebut. Jadi mengubah variabel X menjadi (X-Ẍ),
penafsiran hasilnya bersifat ratio. sehingga langsung dapat diketahui
Satuan ukurannya-pun bisa dibalik. apakah suatu nilai berada di bawah
Misalnya panjang pensil dikatakan atau di atas angka rata-rata (mean)
sebagai seperduabelas meja. Ada hanya dengan melihat tanda-nya,
kalanya orang tak dapat menetapkan apakah positif atau negatif. Perubahan
lokasi dari titik nol absolut untuk lokasi titik nol pada suatu
sebuah skala, karena atribut yang hen- skala dapat dilakukan dengan
dak diukur tidak kelihatan. Misalnya menambah atau mengurangi dengan
ketika hendak mengukur temperatur suatu konstan pada setiap kasus. Hal
(suhu). Di sini, pengukuran dilakukan ini tidak akan mengubah susunan
secara tidak langsung, yaitu dengan distribusi frekuensi maupun indeks
bantuan benda lain yang peka atau koefisien statistik seperti ranking,
terhadap perubahan suhu, misalnya range, varians, korelasi, dan
merkuri. Skala ukuran ditetapkan atas sebagainya. Yang terjadi hanyalah
dasar pengamatan terhadap perubahan pergeseran lokasi dari keseluruhan
volume pada benda tersebut. Pada distribusi frekuensi suatu variabel
skala ini angka nol bukan berarti tak pada garis kontinum skala.
adanya kuantitas suhu. Kadang-kadang ada literatur yang
Hampir semua pengukuran di menggunakan istilah skala ordinal
bidang psikologi dilakukan tanpa skala atau bahkan sebutan skala nominal.
dengan titik nol absolut. Seorang Pada dasarnya penggunaan istilah ini
Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012 51
tidak tepat karena dalam hal ini tidak akan mengalami ”atenuasi” (lebih
terdapat titik nol dan satuan ukuran, rendah dari yang semestinya/ under-
yang menjadi syarat untuk sebuah estimated) karena alat dan prosedur
skala. Oleh sebab itu tak dapat yang digunakan dalam pengukuran
dinamakan skala ukuran. Apa yang tidak dapat menghasilkan data yang
disebut sebagai skala ordinal sebetul- sepenuhnya valid dan reliabel. Ini
nya adalah upaya pengukuran atas terjadi karena pengukuran hanya dapat
suatu variabel kontinum dengan dilakukan secara tidak langsung
menggunakan kategori yang ber- karena atribut atau karakter yang
jenjang (ordered-categorical). Misal- hendak diukur umumnya berupa
nya kategori: baik sekali, baik, konsep atau konstruk yang tak dapat
sedang, kurang, dan kurang sekali. dilihat atau diobservasi secara fisik.
Data yang dihasilkan adalah bilangan Yang tampak dan terekam hanya
bulat positif (integer), yaitu frekuensi indikatornya saja.
kejadian pada setiap kategori tersebut. Kesalahan dalam pengukuran
Data seperti ini tak boleh dianalisis akan mengakibatkan diperolehnya
seakan ia bilangan riel pada skala data dengan ukuran variabilitas
interval. Namun demikian, kini telah (varians) yang lebih besar dari pada
tersedia metodologi untuk mentrans- yang semestinya. Misalkan ada 100
formasikan data yang berupa orang yang tingginya persis sama
frekuensi/proporsi pada setiap kate- yaitu 160 cm (yaitu varians = nol),
gori yang berjenjang tersebut menjadi tetapi terukur dengan kesalahan,
ukuran pada suatu skala interval. Andaikan kesalahan pengukuran yang
Justru inilah sebenarnya landasan terjadi bersifat random (tidak sis-
logika dari sebagian besar pengukuran tematik), maka sebagian orang akan
di bidang psikologi. Sebagian besar terukur kurang dari 160 cm dan
metode analisis data dengan statistika sebagian orang terukur lebih dari 160
menggunakan asumsi bahwa data cm, di mana kekurangan atau
yang dianalisis adalah hasil peng- kelebihan dalam ukuran tersebut juga
ukuran dalam skala interval. dapat bervariasi. Keadaan ini akan
mengakibatkan diperolehnya data
yang memiliki varians yang lebih
Dampak Kesalahan Pengukuran besar dari nol, padahal seharusnya
nol. Dengan kata lain, varians yang
Pada penelitian di bidang psikologi, terlihat pada data sebenarnya adalah
sosiologi, pendidikan, ekonomi, kese- varians palsu, dan dinamakan ”varians
hatan masyarakat, politik, dan ilmu ke-salahan pengukuran”. Selanjutnya,
sosial lainnya, salah satu ancaman andaikan ada 100 orang yang tinggi
terhadap kualitas analisis data jika badannya bervariasi dengan mean=
menggunakan statistika ialah 160 dan varians = 25 cm2. Jika terjadi
”kesalahan pengukuran” (measure- kesalahan pengukuran dan kesalahan
ment error). Koefisien statistik seperti itu bersifat random, maka data yang
korelasi, regresi, muatan faktor, dsb., akan diperoleh akan memiliki mean
52 Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012

yang sama yaitu 160 cm, tetapi akan Contoh 1: Koreksi Dengan SEM
memiliki varians yang jauh lebih
besar dari 25 cm2, misalnya 45 cm2. Structural Equation Modeling (SEM)
Dalam hal ini, selisih antara varians merupakan metode statistika yang
pada data yang diperoleh (observed sangat generik karena dapat diterap-
variance) dan varians yang sejatinya kan pada semua jenis analisis
harus di-peroleh jika tak terjadi statistika yang berbasiskan regresi. Di
kesalahan pengukuran (true variance), sini, LISREL adalah software yang
yaitu 45 cm2 - 25 cm2 = 20 cm 2, paling populer di kalangan peneliti
adalah merupakan variasi data karena ilmu sosial. Berikut adalah ilustrasi
kesalahan pengukuran, dan disebut dengan data riel (bukan simulasi)
”Varians Kesalahan Pengukuran” untuk menunjukkan betapa seriusnya
(Measurement Error Variance). dampak buruk dari ”measurement
Varians kesalahan pengukuran ini error” dalam setiap analisis statistika.
berdampak negatif terhadap berbagai Misalkan seorang peneliti bidang
koefisien statistik ketika data hasil kesehatan1 ingin mengetahui apakah
observasi dianalisis secara langsung kesadaran akan pentingnya makanan
tanpa koreksi. Seperti telah disebutkan bergizi (Awareness) ditentukan oleh
sebelumnya, dapat terjadi ”atenuasi” tingkat ketersediaan makanan di ru-
(underestimated) terhadap misalnya, mah (Availability). Ia berniat melaku-
koefisien regresi atau korelasi, sehing- kan analisis regresi sederhana dengan
ga suatu statistik yang sebenarnya variabel Availability (”Avail”) sebagai
signifikan menjadi dilaporkan sebagai Independent Variable dan Awareness
tidak signifikan. (”Aware”) sebagai Dependent Vari-
Setidaknya ada dua cara koreksi able. Kedua variabel ini diukur meng-
yang dapat dilakukan agar diperoleh gunakan skala rating tipe Likert
koefisien yang terbebas dari atenuasi dengan lima kategori pilihan, mulai
tersebut: (a) dilakukan estimasi ter- dari ”sangat setuju” sampai dengan
hadap ”true-scores” untuk setiap ”sangat tidak setuju” pada setiap item-
kasus (misalnya menggunakan soft- nya. Alat ukur masing-masing
ware seperti BILOG, MULTILOG, variabel terdiri dari lima item.
Mplus, dsb.) kemudian ”true-scores” Secara tradisional, peneliti
inilah yang dijadikan data dalam biasanya menjumlahkan skor setiap
analisis; dan (b) menggunakan model item sehingga diperoleh skor total
statistika yang memperhitungkan dan untuk kedua variabel, lalu dilakukan
mengkoreksi dampak dari ”measure- analisis regresi. Hasilnya, diperoleh
ment error” terhadap setiap koefisien R2  0.08 atau koefisien regresi
yang di ”estimate” (misalnya ”con- (standardized) β = 0.28. Dalam
firmatory factor analysis” dan
”structural equation modeling”
1
dengan software seperti LISREL, Terima kasih kepada Dr. Risa Kolopaking,
MPLUS, EQS, dsb). yang telah mengijinkan data uji coba
instrumennya untuk dianalisis di sini.
Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012 53
bentuk diagram dapat dilihat pada Likert dengan 4 tingkatan pilihan.
Gambar-1. Selanjutnya data yang Pertama dilakukan analisis regresi
sama dianalisis dengan pendekatan dengan TC sebagai dependent
SEM, menggunakan sofware LISREL. variable dan EM sebagai independent
Di sini, analisis regresi dilakukan pada variable, di mana keduanya diukur
tingkat true-score menggunakan dengan skor total dari menjumlahkan
model dengan struktur seperti pada skor item dan hasilnya dianggap
Gambar-2 di bawah, yang selain sebagai ukuran berskala interval.
memperhitungkan perbedaan reliabili- Sebagai hasilnya diperoleh ko-efisien
tas dari setiap item, juga meng- regresi (standardized, agar
akomodasi saling korelasi antara komparabel skalanya) sebesar 0.0989.
”measurement error” pada item yang Hal ini terlihat pada Gambar 3.
satu dengan lainnya. Hasilnya, Selanjutnya, dilakukan analisis reg-
ternyata diperoleh koefisien regresi resi yang sama tetapi antar-variabel
(standa-dized) β = 0.57 dengan laten EM dan TC di mana semua
R2  0.33 Ternyata dampak buruk item masing-masing dijadikan
dari “measurement error” cukup indikator untuk mengukur (dengan
dramatis !! analisis faktor). Sebagai hasilnya,
Pada sebuah penelitian yang diperoleh koefisien regresi
penulis lakukan dengan sampel (standardized) sebesar 0.33. Situasi
sebanyak 1855 orang, terdapat dua ini dapat dilihat pada Gambar 4. Jelas
variabel yang dapat dijadikan sebagai tampak di sini bahwa koefisien
ilustrasi dalam masalah ini, yaitu regresi sedemikian ter-atenuasi
”emphaty” (EM, diukur dengan 3 sehingga koefisien dalam ukuran ”true
item), dan ”task commitment” (TC, score” menghasilkan angka yang
diukur dengan 10 item). Semua hampir tiga setengah kali lipat
itemnya adalah dalam bentuk skala besarannya.

Gambar-1: Koefisien regresi menggunakan data “raw-scores”


hasil penjumlahan skor item
54 Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012

Gambar-2: Koefisien regresi menggunakan True-Score

Contoh 2: Koreksi Dengan SEM

Gambar 3: Regresi Dengan Raw Score


Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012 55

Gambar 4: Regresi Dengan True Score

Ilustrasi di atas hanyalah pada semua variabelnya adalah dalam


analisis yang sangat sederhana. Bisa bentuk konsep atau konstruk yang
dibayangkan bagaimana seriusnya sangat abstrak (latent variables),
kesalahan yang mungkin terjadi pada sehingga validitas dan reliabilitas
model analisis yang lebih kompleks pengukurannya selalu merupakan
dengan banyak variabel (multi- masalah. Pada situasi ini, penggunaan
variate), mengingat dampak yang metode seperti SEM dengan software
terjadi dapat saling berkait dan seperti LISREL, Mplus, EQS, atau
bersifat kumulatif. Terlebih lagi pada sejenisnya, kiranya merupakan suatu
penelitian bidang psikologi, pen- keharusan !!
didikan, dan sosiologi, yang nyaris
56 Jurnal Pengukuran Psikologi dan Pendidikan Indonesia, Vol I, No 1, Januari 2012

Referensi

Bentler, P. M. 2001. EQS Structural Thissen, D., Hung Chen, W., and
Equation Modeling Software. Bock, R.D. 2003. MULTILOG
Multivariate Software, Inc. Los Scientific Software International.
Angeles. www. mvsoft.com Chicago, IL www.ssicentral.com
Joreskog, K.G., & Sorbom, D. 1996. Zimowsky, M., Muraki, E., Mislevy,
LISREL 8: User‟s Reference R., & Bock, R.D., 2003. BILOG-
Guide. Scientific Software Inter- MG. Scientific Software Inter-
national. Chicago, IL. www. national Chicago, IL. www.
ssicentral.com ssicentral.com
Muthen, L.K. & Muthen, B.O. (1998–
2007). Mplus User‟s Guide. Fifth
Edition. Los Angeles. CA: Muthen
& Muthen. www.statmodel.com

Anda mungkin juga menyukai