Anda di halaman 1dari 14

Psympathic, Jurnal Ilmiah Psikologi

2010, Vol. III, No.1: 107 - 120

PENGUKURAN DALAM PENELITIAN PSIKOLOGI

Rosleny Marliani
Fakultas Psikologi UIN Sunan Gunung Djati Bandung
Jl. Raya Cipadung No. 105 Bandung 10614 Telp (022) 7800525 email: rose_marlia2yahoo.com

Psychology is the science of human and animal behavior. It is also intended to get a clear
description of any evidence or behavior of any population. For example,we want to know the
correlation of teenagers’ intelligence and their creativity. It is an example of such case that can be
described and measured by using some indicators.
Measurement in psychology is very important because it is not only an art but also a science. As
science it is empirical. It is of course relies on experiment and observation, rather than argument,
opinion or belief.
Moreover, Morgan (1961) said that the progress of in science often depends upon the
development of quantitative methods. Without such methods,science is limited to crude observation
and classification. By using them we are able to refine data-based conclusions.
There are so many kinds of measurement that can be used in psychological field, such as test,
personality inventory,attitude scale,etc. There are some important aspect that should be noted in
measurement, such as reliability and validity.

Keywords: measurement, reliability, validity

Pendahuluan variabel-variabel yang lain. Kita dapat meng-


Salah satu dari tujuan penelitian dalam gunakan indikator-indikator untuk mendefini-
bidang psikologi adalah untuk memperoleh sikan konstruk inteligensi atau kreatifitas.
pemahaman yang lebih luas tentang hubungan Indikator-indikator tersebut merupakan cara
antara gejala, karakteristik, atau variabel dari pendekatan dengan menggunakan contoh-con-
suatu kelompok atau populasi tertentu. Sebagai toh perilaku aktual yang dapat diamati secara
contoh, kita mungkin ingin mengetahui ada langsung yang dapat diterima sebagai suatu
tidaknya hubungan antara inteligensi dan krea- indeks yang valid dari konstruk psikologis,
tifitas pada kelompok siswa remaja madya atau seperti inteligensi, kreatifitas, motivasi, pres-
pada kelompok individu yang berusia antara tasi, sikap, minat, dsb.
15 hingga 18 tahun. Kita tak dapat mengamati Penggunaan indikator guna mendefinisi-
secara langsung baik inteligensi maupun krea- kan suatu konstruk psikologis merupakan salah
tifitas. demikian pula kita dapat melakukan aspek pengukuran dalam penelitian. Pengu-
pengamatan terhadap semua individu yang ber- kuran itu sendiri merupakan aspek penting
usia antara 15 hingga 18 tahun. Meskipun de- dalam penelitian. Indikator merupakan jabaran
mikian, itu tidak berarti bahwa kita tak dapat operasional dari suatu konstruk psikologis
memperoleh jawaban tentang ada tidaknya hu- yang hendak diukur dan diteliti. Indikator juga
bungan antara inteligensi dan kreativitas, mau- merupakan acuan darimana butir-butir alat
pun tentang hubungan antara gejala atau ukur dikembangkan atau disusun.
Psympathic, 2010, Vol. III, No.1: 107 - 120

Setelah memilih suatu konstruk yang roade, 1988; Elmes, Kantowitz, & Roedriger
hendak diteliti dan kemudian menjabarkannya III, 1992; Nunnally, 1978). Pengukuran me-
ke dalam indikator-indikator dan butir-butir rupakan aspek penting dalam penelitian psi-
pengukuran, langkah selanjutnya yang harus kologis maupun penelitian-penelitian dalam
dilakukan oleh peneliti adalah memilih atau bidang lainnya. Seperti dikemukakan oleh
menetapkan alat ukur atau instrumen penelitian. Boring, seorang tokoh psikologi yang terkenal
Dalam penelitian, istilah alat ukur atau instru- (Elmes, Kantowitz, & Roedriger III),
men penelitian digunakan untuk menunjuk “...a science grows and progresses to
the extent that it uses measure-
pada berbagai macam alat pengumpul data.
ment ...testable hypotheses imply that
Beberapa jenis alat ukur tersebut bisa berupa the predicted outcomes can be mea-
sured....empirical observations in psy-
tes atau alat ukur kepribadian (inventory) ter-
chology are based on the measurement
standar atau yang dikembangkan sendiri oleh of dependent variables. Measurement
then is an importantaspect of scientific
peneliti, pedoman observasi, atau alat perekam
psychology (1992:75).
data yang sudah tersedia (Gay, 1987).
Baltes, Reese, & Nesselroade (1988)
Di samping mendefinisikan konstruk
juga menyatakan bahwa pengukuran merupa-
psikologis yang akan diukur dan menjabar-
kan salah satu landasan (cornerstone) dalam
kannya ke dalam indikator-indikator penguku-
penelitian empiris dari berbagai disiplin ilmiah.
ran, aspek penting yang lain dalam pengukuran
Pengukuran secara langsung merepresentasi-
adalah menetapkan jenis ukuran (data hasil
kan suatu cara yang dipilih oleh peneliti untuk
pengukuran) yang akan dikumpulkan, apakah
mendefinisikan konsep-konsep penting. Dike-
kuantitatif atau kualitatif. Jika data penelitian
mukakan lebih lanjut oleh Baltes, Reese, &
akan diekspresikan dalam bentuk kuantitas,
Nesselroad, melalui pengukuran kita dapat
misalnya, perlu dipikirkan juga apakah data
menggambarkan dan merangkumkan variabel-
kuantitas tersebut akan diekspresikan dalam
varaibel ke dalam angka, nama, atau indeks-
bentuk skala nominal, ordinal, interval, atau
indeks yang lain sehingga mudah untuk meng-
rasio. Tulisan ini akan memberikan kajian se-
komunikasikan kepada orang lain. Hasil pe-
cara ringkas berkenaan dengan aspek-aspek
ngukuran (misalnya angka) juga memberikan
pengukuran tersebut.
material kasar bagi kepentingan analisis sta-
tistik dan matematika untuk maksud menetap-
Pembahasan
kan hubungan antara variabel-variabel yang
Hakikat Pengukuran
diteliti.
Pengukuran (measurement) merupakan
Pengukuran suatu konstruk psikologis
suatu cara yang sistematis untuk menetapkan
(misalnya pengukuran motivasi, sikap, atau
secara pasti bilangan-bilangan (angka-angka)
konsep diri), bagaimanapun, relatif lebih rumit
atau nama-nama terhadap suatu obyek dan
jika dibandingkan dengan pengukuran dalam
atribut-atributnya (Baltes, Reese & Nesesel-

108
Pengukuran dalam Penelitian Psikologi (Rosleny Marliani)

bidang eksakta atau fisik. Sebab, berbagai matematis tertentu yang diterapkan oleh pe-
atribut dalam bidang fisik, seperti tinggi badan, neliti dalam suatu pengukuran psikologis.
berat badan, panjang rambut, dsb. dapat diukur Misalnya, apakah suatu alat ukur inteligensi
secara langsung dalam arti jarak fisik, di sam- setara dengan meteran, dapatkah hasil pengu-
ping aturan untuk menetapkan angka-angka kuran psikologis dianalisis secara sama seperti
yang mewakili atribut-atribut tersebut relatif hasil pengukuran fisik, dsb. Dalam penelitian
lebih tegas dan sederhana. Sedangkan atribut- psikologis (juga dalam penelitian bidang lain-
atribut karakteristik psikologis pada umumnya nya), terdapat empat skala pengukuran, yakni:
bersifat abstrak dan aturan pengukurannya re- nominal, ordinal, interval, dan rasio (Ary,
latif kurang tegas. Pengukuran beberapa kon- Yacob, & Razavieh, 1985; Baltes, Reese, &
sep psikologis seperti ketergantungan, kekua- Nesselroad, 1988; Gay, 1987; McMillan &
tan ego, ekstroversi, kemandirian, dsb. Meru- Schumacher, 2002). Berikut adalah penjelasan
pakan suatu konsep-konsep yang tidak bisa secara garis besar dari empat skala pengukuran
diukur secara langsung, tetapi harus diter- tersebut.
jemahkan lebih dahulu ke dalam bentuk 1. Skala nominal
perilaku-perilaku khusus yang dapat diamati. Skala nominal hanya memilahkan obyek
Dalam hal ini, terdapat variasi yang luas dalam atau atribut ke dalam kategori-kategori yang
bagaimana peneliti mendefinisikan konsep- berbeda, seperti: jenis kelamin (laki-perem-
konsep tersebut tergantung pada kerangka pikir puan), tingkat pendidikan (dasar, menengah,
atau landasan teoretis yang digunakannya. Be- tinggi), umur (0-6 tahun; 7 – 12 tahun; 13 – 18
berapa konsep psikologis juga tampak lebih tahun); jenis pekerjaan ( pegawai negeri, wira-
rumit. Misalnya, konsep attachment, merupa- swasta, BUMN, dsb). Menurut Elmis, Kanto-
kan salah satu contoh konsep psikologis yang witz, & Rodriger III (1992), skala nominal
tidak hanya abstrak tetapi juga rumit karena memiliki kelemahan dalam arti bahwa kita tak
melibatkan kombinasi antara organisme, seper- dapat melakukan banyak operasi matematis
ti ibu dan anak. pada bilangan-bilangan nominal. Dicontohkan,
ketika kita menempatkan orang ke dalam suatu
Skala Pengukuran
kategori khusus, misalnya memberinya nama,
Penelitian dalam bidang psikologi, de-
nama tersebut hanya memberi informasi bahwa
mikian pula dalam bidang-bidang yang lainnya,
orang tersebut berbeda dari orang lain. Suatu
selalu melibatkan isu tentang skala pengukuran
bilangan nominal tidak membentuk kita dalam
(types of measurement scales). Penerapan ska-
mengukur atribut-atribut orang tersebut secara
la pengukuran ini berkenaan dengan isu ten-
lebih mendalam.
tang interpretasi yang dapat diberikan terhadap
2. Skala ordinal
bilangan-bilangan yang dihasilkan dari suatu
Skala ordinal mengukur perbedaan da-
pengukuran psikologis, dan legitimasi prosedur
lam besaran atau jarak (magnitude) suatu ob-

109
Psympathic, 2010, Vol. III, No.1: 107 - 120

yek atau atribut. Tipe skala ini dapat kita prestasi belajar siswa, tidak ada informasi
peroleh jika kita menempatlan obyek atau atri- menyangkut seberapa besar prestasi belajar
but ke dalam suatu urutan ranking. Misalnya, dari siswa yang satu berbeda dengan siswa
kita menempatkan siswa-siswa ke dalam suatu lainnya, kecuali informasi bahwa siswa per-
urutan ranking atas dasar prestasi hasil bela- tama > siswa kedua > siswa ketiga > siswa
jarnya. Siswa pertama dari urutan ranking ter- keempat dan seterusnya.
sebut adalah siswa yang paling tinggi capaian 3. Skala interval
prestasi akademik, siswa kedua adalah nomor Dalam skala interval terdapat perbedaan
dua dari atas dalam pencapaian prestasi belajar, (interval) yang sama dan tegas menyangkut
dan seterusnya. Demikian pula kita dapat me- suatu atribut tertentu antara obyek yang satu
nempatkan seseorang ke dalam urutan ranking dengan lainnya. Jadi dalam skala interval lebih
kekayaan, sikap prososial, tingkat motivasi, banyak operasi matematis yang dapat dilaku-
daya tarik, dsb. Jika kita membuat ranking kan, seperti menambah, mengurangi, membagi,
suatu obyek atau atribut, satu hal yang perlu mengalikan, mencari rata-rata, atau nenemu-
dicatat adalah bahwa perbedaan antara nilai kan simpangan bakunya. Dengan kata lain,
skala yang berdekatan atau berbatasan tidak skala interval memiliki sifat perbedaan, urutan,
harus selalu sama untuk semua obyek atau atri- dan interval yang sama. Sebagai contoh, per-
but yang diranking. Sebagai contoh, siswa da- bedaan skor IQ antara 100 dan 110 adalah
lam ranking pertama dan kedua mungkin sama dengan perbedaan skor IQ antara 120 dan
hampir berdekatan dalam tingkat capaian pres- 130. Demikian pula, perbedaan prestasi belajar
tasi belajarnya, tetapi siswa kelima dan ke- dari 5-6 adalah sama dengan perbedaan pres-
enam mungkin berbeda agak jauh. Dengan tasi belajar dari 8-9. Skor IQ dan prestasi be-
kata lain, skala ordinal tidak memiliki interval lajar tersebut merupakan dua bentuk contoh
yang sama dan dengan demikian kita juga tak dari skala interval.
dapat melakukan banyak operasi matematis 4. Skala rasio
terhadap jenis skala ini, misalnya dicari rata- Skala rasio memiliki empat karakteristik
ratanya atau simpangan bakunya. Dapat dika- pengukuran: perbedaan, jarak, interval sama,
takan bahwa skala ordinal merupakan : (1) dan nol mutlak (Ary, Yacob, & Razavieh,
pengurutan seperangkat obyek kedalam suatu 1985; Baltes, Reese, & Nesselroad, 1988; Gay,
“ranking” (dari paling atas hingga paling ba- 1987; McMillan & Schumacher, 2002). Skala
wah, atau sebaliknya) menurut atribut tertentu; rasio dapat memberikan banyak informasi dan
(2) tidak ada indikasi berkenaan dengan “se- selalu dinilai sebagai bentuk skala yang sangat
berapa banyak” suatu atribut dimiliki oleh bermanfaat dalam pengukuran psikologis. Ka-
obyek; dan (3) tidak ada indikasi mengenai rena skala rasio memiliki nilai nol mutlak (true
jarak atau perbedaan atribut dari obyek yang zero), maka skala ini memungkinkan kita
diamati/diukur. Jadi, dalam contoh pengurutan untuk menetapkan rasio dari nilai-nilai skala

110
Pengukuran dalam Penelitian Psikologi (Rosleny Marliani)

(oleh karena itu skala ini disebut skala rasio). menerapkan pengetahuan yang dimiliki dalam
Bahkan jika skor IQ diukur dalam skala inter- berbagai macam konteks; tes prestasi (achieve-
val, kita dapat mengatakan bahwa IQ 120 a- ment test), yaitu tes yang digunakan untuk
dalah dua kali lebih besar dari IQ 60, atau mengukur kemampuan skolastik subjek; dan
lebih besar dari IQ 100. tes kepribadian (projective test), yakni suatu
tes yang digunakan untuk mengukur sifat-sifat
Jenis-Jenis Alat Ukur Psikologis
atau karakteristik kepribadian subjek. Suatu tes
Terdapat beberapa jenis alat ukur psi-
dikatakan terstandar jika telah memiliki be-
kologis yang biasanya digunakan dalam pene-
berapa properti (karakteristik) tes baku seperti:
litian psikologis, antara lain: tes, inventori ke-
standar norma, validitas dan reliabilitas, dan
pribadian, skala sikap, observasi, dan wawan-
petunjuk dalam mengadministrasikan dan pen-
cara (Ary, Yacob, & Razavieh, 1985; Baltes,
skorannya (Friedenburg, 1995).
Reese, & Nesselroad, 1988; Gay, 1987; Mc-
Millan & Schumacher, 2002). Berikut adalah 2. Inventori kepribadian (personality inventory)
penjelasan secara garis besar tentang jenis- Karakteristik kepribadian di samping da-
jenis alat ukur tersebut. pat diukur melalui tes projektif, juga dapat
1. Tes diukur melalui tes non proyektif, yakni yang
Menurut Ary, Jacobs, & Razavieh biasa di sebut dengan inventori kepribadian.
(1985), tes merupakan alat ukur yang sangat Salah satu bentuk inventori ini adalah laporan
penting dalam penelitian psikologi. Tes meru- (self report), dan salah satu bentuk laporan diri
pakan seperangkat stimuli yang disajikan ke- tersebut adalah angket (questionnaire). Dalam
pada individu untuk mendatangkan atau mem- inventori, subjek disajikan sejumlah pernyata-
peroleh respon-respon yang diekspresikan da- an yang menggambarkan pola-pola perilaku
lam bentuk skor angka. Skor ini didasarkan tertentu dan diminta untuk menyatakan apakah
pada sampel perilaku individu yang represen- pola-pola perilaku yang dinyatakan tersebut
tatif atau pada indikator-indikator dari atribut merupakan karakteristik perilakunya atau bu-
yang diukur oleh suatu tes. Dalam penelitian kan, dengan menjawab ya atau tidak, atau de-
psikologi, dikenal adanya tes terstandar (tes ngan memberikan cek pada salah satu pilihan
baku) dan tes tak terstandar (disusun dan di- jawaban yang disediakan. Seperti halnya tes,
kembangkan sendiri oleh peneliti guna me- inventori ada yang terstandar dan tak ter-
ngukur atribut yang sedang diamati). Terma- standar. Beberapa contoh inventori terstandar
suk dalam tes terstandar antara lain adalah tes antara lain adalah: California F-Scale, yang
inteligensi (intelligence test), yaitu tes yang digunakan untuk mengukur autoritarianisme;
digunakan untuk mengukur tingkat kecerdasan dan Cattell’s Sixteen Personality Factor Ques-
subjek, dalam arti kemampuannya untuk mem- tionnaire, yang digunakan untuk mengukur
persepsi hubungan, memecahkan masalah, dan sejumlah sifat. Beberapa inventori lain yang

111
Psympathic, 2010, Vol. III, No.1: 107 - 120

banyak digunakan dalam penelitian antara lain vidu dalam suatu kontinum positif (favourable)
adalah Minnesota Multiphasic Personality – negatif (unfavourable) terhadap suatu obyek
Inventory, the Guilford-Zimmerman Tempera- sikap.
ment Survey, the Mooney Problem Check List,
Terdapat beberapa bentuk skala sikap
dan the Edwards Personal Schedule. Iventori
yang dapat digunakan oleh peneliti sebagai
telah banyak digunakan dalam penelitian-
acuan dalam mengembangkan skala sikap, ya-
penelitian untuk mengetahui hubungan antara
itu: (1) summated rating scales (skala Likert);
karakteristik kepribadian dengan beberapa va-
(2) equal-appering intervals scales (skala
riabel seperti inteligensi, prestasi, sikap, under-
Thurstone); (3) cumulative scales (skala Gutt-
achievement dari beberapa kelompok populasi
man); dan semantic differential scales (Ary at
atau subjek tertentu (Ary, Yacobs, & Razavief,
al., 1985; Gay, 1987; Friedenberg, 1995). Dari
1985).
empat model skala sikap tersebut, skala Likert
3. Skala sikap (attitude scale) merupakan tipe yang paling banyak digunakan.
Menurut beberapa penulis (Ary at al., Skala Likert mengukur sikap subjek ter-
1985; gay, 1987; Friedenburg, 1995), skala si- hadap suatu obyek sikap (topik) dengan cara
kap merupakan suatu alat ukur yang digunakan meminta subjek untuk menyatakan apakah ia
untuk mengukur sikap, nilai, dan karakteristik sangat setuju, setuju, tidak tahu, tidak setuju,
lain. Dalam skala sikap berisikan nilai-nilai atau sangat tidak setuju. Topik atau obyek si-
bilangan untuk menilai subjek, obyek, atau pe- kap tersebut disajikan melalui pernyataan-per-
rilaku-perilaku untuk maksud mengkuantifi- nyataan yang diekspresikan dalam bentuk kali-
kasikan atau mengukur kualitas-kualitas. Skala mat positif (favorable) dan kalimat negatif (un-
sikap berbeda dengan tes, sebab tidak seperti favorable). Respon subjek selanjutnya diskor
halnya hasil tes, hasil pengukuran skala sikap dengan cara memberikan bobot. Misalnya, un-
tidak menyatakan kekuatan atau kelemahan, tuk respon terhadap pernyataan positif, skor
keberhasilan atau kegagalan. Skala sikap me- yang diberikan adalah 5, 4, 3, 2, dan 1 untuk
ngukur seberapa jauh individu memiliki karak- pernyataan sangat setuju, setuju, tidak tahu,
teristik nilai, keyakinan, minat, atau pandangan tidak setuju, dan sangat tidak setuju. Sedang-
terhadap sesuatu. Sebagai contoh, skala sikap kan untuk pernyataan negatif, pemberian skor-
dapat digunakan untuk mengukur sikap remaja nya dilakukan dengan cara sebaliknya.
terhadap partai politik, pemilu, atau penggu- Jika skala Likert mengukur sikap de-
suran untuk kepentingan pembangunan. Ba- ngan cara meminta subjek untuk menyatakan
nyak peneliti mendefinisikan sikap sebagai tingkat kesetujuan atau ketidak setujuannya
afek (perasaan) positif atau negatif terhadap terhadap suatu pernyataan, skala Thurstone
suatu kelompok, institusi, konsep, atau obyek mengukur sikap dengan cara menyajikan suatu
sosial tertentu. Dengan kata lain, pengukuran pernyataaan tentang suatu topik yang meren-
sikap pada dasarnya adalah menempatkan indi- tang dari sangat positif (very favorable), netral

112
Pengukuran dalam Penelitian Psikologi (Rosleny Marliani)

(neutral), hingga sangat negatif (very unvfavo- seterusnya. Subjek yang menyetujui butir-butir
rable), dan meminta subjek untuk memilih dari khusus dalam model skala ini akan mem-
pernyataan-pernyataan tersebut yang sangat perlihatkan skor tinggi pada total skala diban-
sesuai dengan sikapnya. dingkan subjek yang tidak menyetujui.
Skala Guttman juga disebut sebagai Skala diferensial semantik merupakan
teknik kumulatif. Skala ini dimaksudkan untuk pendekatan lain dalam mengukur sikap. model
mengatasi kelemahan yang ada pada skala skala ini dikembangkan oleh Osgood, Suci,
Likert maupun Thurstone. Kritik yang dituju- dan Tannenbaum (Ary at al., 1985; Frie-
kan terhadap skala Likert maupun Thurstone denberg, 1995). Skala ini didasarkan pada
adalah bahwa kedua skala tersebut berisikan asumsi bahwa obyek sikap memiliki dua ben-
pernyataan-pernyataan yang heterogen tentang tuk makna yang berbeda bagi individu, yakni:
berbagai macam dimensi obyek sikap (Ary at denotatif (makna harfiah dari suatu kata) atau
al., 1985). Sebagai contoh, skala Thurstone konotatif (makna yang ditunjuk). Dua makna
mengukur sikap terhadap perang, tidak memi- tersebut dapat dinilai secara bebas (indepen-
sahkan pernyataan jika dari pernyataan-per- dent). Orang pada umumnya lebih mudah
nyataan yang menyangkut dampak ekonomi untuk menyatakan makna denotatif dari suatu
yang disebabkan oleh perang, atau mereflek- obyek alih-alih makna konotatif. Meskipun
sikan kemungkinan aspek-aspek lain dari sikap demikian, menurut Ary at al., (1985), kita
terhadap perang. Oleh karena itu, skala ter- dapat mengukur makna konotatif dari suatu
sebut tampak mengkombinasikan beberapa di- obyek secara tidak langsung dengan cara me-
mensi pada satu skala dan memunculkan prob- minta individu untuk menilai obyek dengan
lem dalam membuat interpretasi yang tegas menggunakan sejumlah kata sifat bipolar. Ber-
dari skor yang diperoleh. Untuk mengatasi dasarkan pada studi analitik yang dilakukannya,
problem yang terdapat skala Likert dan Thur- Osgood at al. menemukan tiga kluster kata
stone, Guttman mengembangkan suatu skala sifat: (1) evaluatif, berisikan beberapa kata
yang menekankan hanya pada satu dimensi sifat seperti baik atau buruk, berguna atau tak
(unidimensional scale), dan dimaksudkan un- berguna; (2) potensi, meliputi kata-kata sifat
tuk mengukur sikap subjek terhadap satu di- seperti kuat atau lemah, berat atau ringan; dan
mensi obyek. Suatu sikap dipandang sebagai (3) aktivitas, berkaitan dengan kata sifat seperti
unidimensional hanya jika sikap tersebut aktif atau pasif, cepat atau lambat. Di antara
menghasilkan suatu skala kumulatif – yakni tiga kluster tersebut, dimensi evaluatif tampak
skala dimana butir-butirnya memiliki hubu- paling signifikan untuk mengukur sikap.
ngan satu satu lain. Misalnya, jika subjek
4. Beberapa teknik pengukuran lain
setuju dengan butir nomor 2, ia juga setuju
Di samping berbagai macam alat ukur
dengan butir 1; subjek yang setuju dengan
seperti telah dikemukakan, terdapat beberapa
butir 3 juga setuju dengan butir 1 dan 2, dan
teknik lain yang sering digunakan dalam

113
Psympathic, 2010, Vol. III, No.1: 107 - 120

penelitian psikologi, yakni: observasi dan terlibatan subjek dalam memecahkan suatu
wawancara. masalah dalam kelompok, peneliti ikut terlibat
Dalam banyak kasus, melakukan obser- dalam kegiatan tersebut, misalnya dengan
vasi atau pengamatan langsung terhadap peri- menjadi anggota kelompok. Jika observasi dil-
laku individu merupakan metode pengukuran akukan dengan cara non partisipatif, peneliti
yang sangat krusial (Ary at al., 1985; Elmes at hanya mengamati dari jarak tertentu terhadap
al., 1992). Dalam teknik observasi, peneliti perilaku subjek. Cara ini tampak misalnya
mengidentifikasi perilaku-perilaku yang ingin dalam suatu pengamatan yang menggunakan
dikaji dan menggunakan suatu prosedur yang one way screen dalam suatu laboratorium.
sistematis untuk mengindentifikasi, mengkate- Untuk dapat melakukan observasi de-
gorikan, dan merekam perilaku subjek dalam ngan cermat dan teliti, peneliti perlu meru-
cara yang terencana dan netral. Secara khusus, muskan aspek-aspek apa saja yang akan di-
metode observasi telah banyak digunakan amati ke dalam suatu alat yang disebut dengan
untuk secara luas dalam penelitian yang me- pedoman observasi. Terdapat dua bentuk pedo-
libatkan subjek bayi dan anak-anak pra sekolah. man observasi, yakni daftar cek (ceck list) dan
Menurut McMillan & Schumacher (2001), se- skala penilaian (rating scale). Jika peneliti
mua teknik pengumpulan data pada dasarnya menggunakan daftar cek, maka ia mengamati
melibatkan beberapa bentuk observasi. Dalam munculnya aspek-aspek perilaku subjek seba-
artian umum, kata observasi digunakan untuk gaimana telah tercantum dalam pedoman dan
menggambarkan data yang dikumpulkan, tanpa kemudian memberikan cek pada aspek peri-
memperhatikan teknik yang digunakan dalam laku tersebut. Jika peneliti menggunakan skala
penelitian. Meskipun demikian, metode-meto- penilaian, hanya ia tidak hanya merekam
de penelitian observasional menunjuk pada munculnya perilaku yang diamati tetapi juga
mode khusus dalam mengumpulkan informasi frekuensi (seberapa sering)dari munculnya
dan yang sangat berbeda dengan metode lain perilaku tersebut.
seperti wawancara atau laporan diri (angket). Wawancara pada dasarnya merupakan
Sebagai suatu teknik pengumpulan data, me- suatu metode pengumpul data yang tidak
tode observasi sangat menyandarkan pada ke- berbeda dengan metode laporan diri atau
pekaan pengamatan dan pendengaran peneliti- angket, tetapi tidak seperti halnya dalam me-
an dalam merekam data yang diinginkan. tode angket, metode wawancara melibatkan
Observasi dapat dilakukan secara par- komunikasi langsung secara lisan antara pene-
tisipatif dan non partisipatif. Jika observasi liti dengan subjek sumber data atau responden
dilakuan secara partisipatif, peneliti ikut terli- (McMillan & Schumacher, 2001). Karena dila-
bat bersama subjek dalam suatu aktivitas yang kukan melalui komunikasi langsung, maka me-
sedang diamati. sebagai contoh, jika peneliti tode wawancara memiliki kelebihan dibanding
ingin mengumpulkan data tentang tingkat ke- metode lain, dalam arti bahwa wawancara da-

114
Pengukuran dalam Penelitian Psikologi (Rosleny Marliani)

pat mengungkap data secara lebih mendalam besar subjek; dan kurang anonim karena ham-
tentang aspek-aspek perilaku subjek. Demikian pir semua identitas subjek dapat dikenali oleh
pula – bagi para peneliti yang mahir – melalui peneliti. di samping itu, wawancara tidak dapat
wawancara akan dapat diketahui apakah subjek dilaksanakan oleh semua orang, kecuali oleh
memberikan jawaban dengan jujur atau tidak mereka yang telah terlatih dan memiliki ke-
jujur. ahlian khusus.
Agar wawancara berjalan lebih terarah
Isu Tentang Validitas Dan Reliabilitas Alat Ukur
dan sistematis, seperti halnya dalam teknik ob-
Validitas (validity) dan reliabilitas (reli-
servasi, dalam teknik wawancara peneliti perlu
ability) merupakan salah satu karakteristik
untuk menggunakan suatu pedoman wawan-
(property) penting dalam setiap alat ukur psi-
cara. Dalam pedoman wawancara tersebut ber-
kologis (Ary at al., 1985; Baltes at al., 1988;
isikan pokok aspek perilaku yang akan dieks-
Elmes at al., 1992; Fridenberg, 1995). Me-
plorasi. Pengembangan suatu pedoman wa-
nurut beberapa penulis tersebut, validitas me-
wancara tidak berbeda dengan pengembangan
nunjuk pada seberapa jauh suatu alat ukur
alat ukur lainnya, yaitu: menetapkan tujuan
mengukur apa yang hendak diukur. Sedangkan
wawancara, menuliskan pertanyaan, menetap-
reliabilitas menunjuk pada seberapa jauh suatu
kan format umum dan khusus, dan uji coba
alat ukur memberikan hasil yang konsisten
(McMillan & Schumacher, 2001). Dibanding-
tentang apa yang diukur.
kan dengan metode observasi dan angket, me-
1. Validitas
tode wawancara lebih bersifat adaptif dan
Baltes at al. (1988) dan Friedenberg
fleksibel. Artinya, metode ini dapat digunakan
(1995) menyebutkan adanya empat bentuk va-
untuk berbagai macam problem yang berbeda
liditas, yakni validitas muka (face validity),
dan tipe orang yang berbeda. Peneliti juga
validitas isi (content validity), validitas empiris
dapat mengelaborasi atau membuat klarifikasi
(emperical validity), dan validitas konstruk
lebih jauh terhadap respon-respon subjek, se-
(construct validity).
hingga peneliti dapat memperoleh data yang
a. Validitas muka. Validitas muka menunjuk
lebih lengkap dan lebih mendalam. Peneliti ju-
menyatakan bahwa suatu alat ukur tampak
ga dapat merekam perilaku non verbal dari
mengukur apa yang ingin diukur. Suatu tes
subjek ketika sedang diwawancarai.
aritmatik, misalnya, kurang memiliki vali-
Meskipun wawancara memiliki bebera-
ditas muka sebagai tes kosa kata, dan tes
pa kelebihan, ia juga memiliki beberapa ke-
kosa kata kata kurang memiliki validitas
lemahan, antara lain: peneliti sulit menghindar-
muka sebagai tes aritmetik. Tes aritmetik
kan diri dari subjektivitasnya dalam memberi-
tampak memiliki validitas muka jika untuk
kan penilaian terhadap respon subjek; meng-
mengukur kemampuan memecahkan prob-
konsumsi banyak waktu dan tenaga, khususnya
lem aritmetik, demikian pula tes kosa kata
jika penelitian dilakukan terhadap sejumlah
tampak memiliki validitas muka jika ia

115
Psympathic, 2010, Vol. III, No.1: 107 - 120

digunakan untuk mengukur penguasaan diksikan diberikan setelah alat ukur


dalam kosa kata. prediktor
d. Validitas konstruk. suatu alat ukur dika-
b. Validitas isi. Suatu alat ukur dikatakan
takan memiliki validitas konstruk jika ber-
memiliki validitas isi jika alat ukur tersebut
isikan butir-butir yang merupakan jabaran
berisikan butir-butir yang dapat mewakili
operasional dari domain atau karakteristik
domain dari atribut yang diteliti atau diukur.
psikologis yang diukur, atau hasil yang
Sebagai contoh, suatu tes kosa kata di-
diperoleh adalah konsisten dengan yang di-
katakan memiliki validitas isi berisikan bu-
preskripsikan oleh teori yang digunakan se-
tir-butir tes yang mengandung semua kosa
bagai acuan. Sebagai contoh, suatu teori
kata dalam bahasa yang diteliti.
menyatakan bahwa terdapat suatu hubu-
c. Validitas empirik. Validitas empirik memi-
ngan antara beberapa variabel dan beberapa
liki dua macam bentuk, yakni: prediktif dan
kriterion, misalnya antara inteligensi dan
konkuren (concurrent). Keduanya berhubu-
kecepatan dalam belajar. Jika suatu alat
ngan dengan hubungan empirik antara skor
ukur dimaksudkan untuk mengukur inteli-
hasil pengukuran dengan suatu kriteria (kri-
gensi, alat ukur tersebut dikatakan memiliki
terion) tetapi berbeda dalam waktu pe-
validitas konstruk jika hasil pengukuran da-
ngumpulan data kriterion (Ary at al., 1985).
ri alat ukur tersebut dapat memprediksikan
Validitas prediktif menunjuk pada seberapa
kecepatan dalam belajar. Validitas konstruk
jauh skor-skor pada suatu alat ukur dapat
pada dasarnya merupakan validitas empirik,
digunakan untuk memprediksikan skor-skor
tetapi tidak seperti halnya validitas prediktif
pada alat ukur yang lain. Validitas ini dapat
dan validitas konkuren, validitas konstruk
ditetapkan dengan cara mengkorelasikan
lebih didasarkan pada suatu prediksi yang
dua perangkat skor dari dua perangkat tes.
dinyatakan oleh suatu teori.
Suatu alat ukur dapat memiliki beberapa
Validitas konstruk merupakan tipe validitas
macam validitas prediktif; artinya, suatu
yang banyak dihitung dalam pengembangan
alat ukur mungkin sangat valid sebagai pre-
alat ukur psikologis. Sebagaimana dikemu-
diktor dalam beberapa situasi, agak valid
kakan oleh Friedenberg (1995), pemerik-
sebagai prediktor dalam situasi yang lain;
saan (studi) tentang validitas alat ukur psi-
dan kurang valid pada situasi yang lain lagi.
kologis (konstruk psikologi) mayoritas me-
Validitas konkuren berbeda dari validitas
musatkan perhatian pada validitas konstruk.
prediktif hanya dalam waktu pengukuran.
Salah satu pendekatan yang paling umum
Dalam validitas konkuren, suatu alat ukur
digunakan untuk menghitung validitas kon-
diberikan secara simultan, dan dalam vali-
struk adalah dengan mengkorelasikan skor
ditas prediktif suatu alat ukur yang dipre-
pada setiap butir suatu alat ukur dengan
skor total (item-total correlation) (Frieden-

116
Pengukuran dalam Penelitian Psikologi (Rosleny Marliani)

berg, 1995). Koefisien korelasi antara skor ngan telah diberikan untuk peristiwa-peristiwa
butir dan skor total dapat menunjukkan atau atribut yang diamati dalam cara yang
kemampuan dari suatu butir alat ukur untuk akurat, persis, dan konsisten. Meskipun demi-
memprediksikan skor total butir, atau de- kian, menurut Baltes at al., selalu terdapat
rajat kesesuaian/keterpaduan antara suatu hambatan untuk mencapai kriteria ideal ter-
butir dengan perangkat butir yang lain sebut, dan hambatan tersebut merupakan sum-
dalam keseluruhan alat ukur (Friedenberg, ber kesalahan pengukuran.
1995). Landasan berpikir dari pendekatan Dalam konteks pengukuran psikologis,
ini adalah: jika butir alat ukur dan kese- para penulis seperti Anastasi (1968) dan Nun-
luruhan butir alat ukur mengukur atribut nally (1967, 1970) telah mendaftar secara eks-
yang sama, maka skor pada suatu butir da- plisit berbagai macam pengaruh yang dapat
pat dikorelasikan dengan skor total. Jika memperendah realiabilitas suatu alat ukur da-
suatu konstruk psikologis terdiri atas bebe- lam lingkungan khusus. Nunnally (1970), mis-
rapa faktor atau atribut, menurut Frieden- al-nya, menyebutkan faktor-faktor seperti ku-
berg (1995), untuk menghindari terjadinya rangnya instruksi yang jelas dan rinci dalam
bias dalam perolehan koefisien korelasi, tes terstandar, kesalahan dalam penskoran, ke-
maka dalam prosedur ini peneliti sebaiknya salahan yang berhubungan dengan pengaruh
tidak mengkorelasikan skor butir dengan subjektivitas, lingkungan tempat dilakukannya
skor total butir dari seperangkat alat ukur, pengukuran, cara pengambilan sampel, dan
tetapi mengkorelasikan skor butir dengan fluktuasi individu sebagai faktor yang dapat
skor total dari masing-masing atribut (kore- memperendah reliabilitas alat ukur.
lasi butir-total faktor/aspek). b. Menetapkan reliabilitas
Reliabilitas suatu alat ukur dapat dite-
2. Reliabilitas
tapkan dengan cara menggunakan indeks relia-
a. Pengertian
bilitas. Indeks reliabilitas ini dapat diperoleh
Dalam artian yang sangat luas, reliabi-
melalui tiga pendekatan, yakni: test-retest,
litas menunjuk pada konsistensi suatu alat ukur;
equivalent-form atau alternate-form, dan split-
artinya, jika suatu alat ukur digunakan untuk
half (Friedenberg, 1995). Dalam teknik per-
mengukur aspek atau atribut yang sama seha-
tama, suatu alat ukur diadministrasikan dua
rusnya hasil yang diperoleh relatif tidak ber-
kali kepada sekelompok subjek yang sama
beda (Baltes at al., 1988). Baltes at al. juga
pada waktu yang berbeda. Ini akan mengha-
mengutip pernyataan Anastasi (1968) bahwa,
silkan dua perangkat skor. Indeks reliabilitas
sekurang-kurangnya dalam domain penguku-
dapat ditemukan dengan cara mengkorelasikan
ran psikologis, konsistensi merupakan esensi
dua perangkat skor tersebut.
dari reliabilitas. Dalam pengukuran, peneliti
Dalam teknik kedua, equivalent-forms
seharusnya telah yakin bahwa nilai-nilai bila-
atau sering disebut juga dengan istilah alter-

117
Psympathic, 2010, Vol. III, No.1: 107 - 120

nate-form, digunakan jika terdapat kemung- signifikan atau tidak. Jika koefisien korelasi
kinan bahwa subjek akan mengingat responnya yang ditemukan signifikan, maka alat ukur
pada butir-butir alat ukur. Dalam teknik ini, dikatakan reliabel, dan jika tidak signifikan,
peneliti tidak mengkorelasikan dua perangkat alat ukur dikatakan tidak reliabel. Signifikansi
skor yang dihasilkan dari dua kali pengukuran dari koefisien korelasi ditetapkan secara sta-
dengan menggunakan alat ukur dan kelompok tistik, yakni dengan cara membandingkan nilai
subjek yang sama, tetapi peneliti mengkore- koefisien korelasi yang ditemukan dengan har-
lasikan hasil pengukuran dengan hasil pengu- ga kritiknya. Harga kritik tersebut dapat dite-
kuran dari alat ukur yang lain yang dinilai mukan pada tabel-tabel statistik pada level
ekivalen (sama). Jadi, disamping mengadmi- taraf signifikansi (misalnya 99% atau 95%)
nistrasikan alat ukur yang akan dilihat reliabili- atau taraf probabilitas (misalnya .01 atau .05)
tasnya, peneliti juga mengadministrasikan alat yang diinginkan, dan pada derajat kebebasan
ukur lain yang ekivalen dan telah dinyatakan yang terhitung (ditetapkan berdasarkan jumlah
valid dan reliabel. Dua perangkat skor hasil sampel).
pengukuran tersebut kemudian dikorelasikan.
Simpulan
Dalam teknik ketiga, peneliti hanya
Salah satu tugas penting bagi peneliti
mengadminitrasikan satu alat ukur kepada
dalam bidang psikologi adalah memilih instru-
sekelompok individu kemudian membelah alat
men pengumpul data atau alat ukur yang me-
ukur tersebut ke dalam dua bagian sama besar.
madai untuk tujuan mengkuantifikasikan infor-
Pembagian ini bisa dilakukan atas dasar nomor
masi atau data penelitian. Dalam mengkuan-
butir, misalnya ganjil atau genap atau dengan
tifikasikan data penelitian, peneliti dapat me-
membaginya secara acak. Indeks reliabilitas
milih untuk mengekspresikannya kedalam ben-
dapat ditemukan dengan cara mengkorelasikan
tuk skala nominal, ordinal, interval, atau rasio.
perangkat skor pada belahan yang satu dengan
Untuk mengumpulkan data penelitian, peneliti
perangkat skor pada belahan yang lain. Teknik
dapat memilih alat ukur psikologi dalam ben-
ketiga ini merupakan pendekatan yang paling
tuk tes, inventori, skala sikap, atau teknik pe-
banyak digunakan. Terdapat beberapa formula
ngumpul data lain seperti observasi atau wa-
terkenal untuk menghitung indeks reliabilitas
wancara. Peneliti dapat menggunakan alat ukur
dari teknik ketiga ini, antara lain adalah Kuder,
yang telah tersedia atau mengembangkannya
Spearman Brown, dan Alpha Cronbach, tetapi
sendiri.
formula Alpha Cronbach dipandang paling
Salah satu aspek penting yang tidak bisa
baik karena didasarkan pada varian skor butir
dipisahkan dari suatu alat ukur adalah validitas
(Friedenberg, 1995).
dan reliabilitas dari alat ukur yang dipilih atau
Reliabilitas dari suatu alat ukur selan-
digunakan dalam penelitian. Validitas menun-
jutnya didasarkan apakah indeks reliabilitasnya
juk pada tingkat seberapa jauh suatu alat ukur
– koefisien korelasi yang ditemukan –

118
Pengukuran dalam Penelitian Psikologi (Rosleny Marliani)

mengukur apa yang hendak atau seharusnya


diukur, sedangkan reliabilitas menunjuk pada
seberapa jauh suatu alat ukur menghasilkan
hasil pengukuran yang konsisten. Terdapat em-
pat macam validitas, yakni: validitas muka,
validitas isi, validitas empirik, dan validitas
konstruk. Validitas konstruk merupakan ma-
cam validitas yang banyak diperhatikan. Salah
satu teknik untuk menetapkan validitas kon-
struk adalah dengan mengkorelasikan skor
butir dengan skor total, atau antara skor butir
dengan skor total. Reliabilitas suatu alat ukur
dapat ditetapkan sekurang-kurangnya melalui
tiga teknik, yakni: test-retest, equivalent-form,
dan split- half.

Daftar Pustaka
Ary, D., Jacobs, L.C., & Razavieh, A. (1985).
Introduction to Research in Education.
3rd. ed. New York: Holt, Rinehart and
Winston.
Baltees, P.B., Reese, H.W., & Nesselroads, J.R.
(1988). Introduction to research Me-
thods in Life-span Developmental Psy-
chology. New Jersey: Lawrence Erl-
baum Associates, Publishers.
Elmes, D.G., Kantowitz, B.H., & Roedriger III,
H.L. (1992). Research methods in
Psychology. 4th. ed. New York: West
publishing Company.
Friedenberg, Lisa. (1995). Psychological
Testing. Design, Analysis, and Use.
Boston: Allyn and Bacon.
Gay, L.R. (1987). Educational Research.
Competencies for Analysis and Ap-
plication. 3rd. ed. Colombus: Merrill
Publishing Company.
McMillan, J.H., & Schumacher, S. (2001).
Research in Education. A Conceptual
Introduction. 5th. ed. New York: Long-
man.

119
Psympathic, 2010, Vol. III, No.1: 107 - 120

120

Anda mungkin juga menyukai