Diagnosa keadaan psikis dari suatu individu dapat dilakukan melalui metode-
metode seperti introspektif, ekstropektif/observasi, eksperimen, atau pengumpulan
data melalui angket. Yang sering menjadi masalah dalam interpretasi skor dari
suatu tes psikologi adalah masalah kerangka acuan yang digunakan untuk
menafsirkan skor yang diberikan. Berdasarkan tujuannya, interpretasi hasil tes
bergantung pada satu atau kedua sumber informasi berikut untuk memperoleh
kerangka acuan dalam memaknai skor.
1. Norma
Jenis interpretasi tes ini berguna terutama ketika kita perlu membandingkan
individu satu sama lain atau dengan kelompok referensi untuk mengevaluasi
perbedaan di antara mereka pada karakteristik tertentu yang ingin diukur melalui
tes. Istilah norma mengacu pada kinerja tes atau perilaku khas satu atau lebih
kelompok referensi. Kelompok referensi yang dimaksud ialah kelompok yang
yang performanya dijadikan sumber informasi/standar dalam mengartikan skor.
Norma biasanya disajikan dalam bentuk tabel dengan statistik deskriptif—seperti
rata-rata, standar deviasi, dan distribusi frekuensi—yang merangkum kinerja atau
performa kelompok yang dimaksud. Ketika norma dikumpulkan dari uji kinerja
kelompok orang (within-group norms), kelompok referensi ini diberi label sampel
normatif atau standar. Berikut ini istilah-istilah skor yang digunakan dalam norma
grup.
a. Skor Mentah
Tingkat informasi paling dasar yang dihasilkan oleh tes psikologi
adalah skor mentah. Sebagai contoh, dalam tes kepribadian, skor mentah
kerap berupa jumlah pertanyaan yang di jawab sesuai kecenderungan yang
di tetapkan dalam suatu skala. Dalam tes kemampuan, skor mentah
umumnya berisi jumlah soal yang dijawab dengan benar, kerap dengan
penambahan poin bonus untuk waktu penyelesaian yang cepat. Karena itu,
hasil awal tes hampir selalu berupa perhitungan numerik seperti 17 dari 44
soal dijawab sesuai dengan kecenderungan yang ditentukan pada suatu
skala depresi, atau 29 dari 55 poin skor mentah diperoleh dari sub skala
susun balok tes intelegensi.
Namun harus dijelaskan kepada para pembaca bahwa skor mentah itu
sendiri mutlak tidak bermakna. Sebagai contoh, manfaat apa yang dapat
diperoleh dengan mengetahui bahwa seorang subjek mengerjakan dengan
benar 12 dari 20 soal penalaran abstrak? Apa maknanya bahwa seorang
peserta tes menjawab sesuai kecenderungan yang di tetapkan pada 19 dari
33 pertanyaan benar-salah dalam skala pikiran psikologi?
Sulit untuk hanya memikirkan pertanyaan-pertanyaan semacam itu
tanpa beralih ke suatu jenis perbandingan. Kita ingin mengetahui
bagaimana kinerja orang lain dalam tes-tes tersebut, apakah skor yang
diperoleh tinggi atau rendah bila dibandingkan dengan kelompok subjek
representatif. Dalam kasus tes kemampuan, kita ingin mengetahui apakah
soal-soalnya mudah, sulit terutama terkait dengan umur subjek.
Kenyataanya nyaris tidak dapat disangkal lagi bahwa skor mentah
benar-benar menjadi tidak bermakna terutama ketika berkaitan dengan
norma, dan kerangka rujukan yang ditetapkan secara independen yang
diturunkan dari suatu sampel standarisasi. Untuk saat ini cukuplah
mengetahui bahwa norma ditetapkan secara empiris melalui tes pada suatu
sampel besar dan representatif. Skor seorang peserta tes kemudian
dibandingkan dengan distribusi skor yang didapat oleh sampel
standarisasi. Dengan cara ini, kita dapat menentukan berdasarkan norma
apakah skor yang diperoleh itu rendah, rata-rata, atau tinggi. Sebagian
besar tes psikologi diinterpresentasikan dengan menggunakan norma-
norma rujukan; seperti telah disampaikan, instrumen-instrumen itu disebut
norma (norm-referenced test). Namun, pembaca harus ingat bahwa
terdapat tes rujukan jenis-jenis intrumen lainnya. Secara khusus, tes-tes
rujukan kriteria yang membantu menentukan apakah seseorang dapat
mencapai kriteria objektif yang telah ditetapkan seperti menjumlahkan
sepasang angka dua digit dengan akurasi sebesar 97 persen. Dalam tes
rujukan kriteria, norma tidaklah penting. Terdapat berbagai jenis norma,
namun kesemuanya memiliki satu karakteristik yang sama: Masing-
masing mencakup rangkuman statistik atas sekumpulan besar skor. Karena
itu, guna memahami norma, pembaca harus menguasai statistik deskriptif
dasar.
b. Persentil
Persentil menunjukkan persentase orang dalam sampel standarisasi
yang memiliki skor dibawah skor mentah tertentu. Perhatikan bahwa
persentil yang lebih tinggi menunjukkan skor yang lebih tinggi. Dalam
kasus exstrem, seorang peserta tes memperoleh skor mentah lebih tinggi
dari semua skor dalam sampel standarisasi akan memiliki persentil 100.
Ingat bahwa persentil hanya menunjukkan posisi seseorang peserta tes
bila dibandingkan dengan sampel standarisasi dan tidak menunjukkan
persentase soal yang dijawab dengan benar. Persentil juga bisa dipandang
sebagai peringkat dalam kelompok 100 subjek representatif, dimana 1
merupakan peringkat terendah dan 100 merupakan yang tertinggi.
Perhatikan bahwa peringkat persentil merupakan kebalikan total prosedur
pemeringkatan biasa. Peringkat persentil (percentil rank) 1 berada di dasar
sampel, sedangkan persentil 99 hampir berada diposisi teratas.
Persentil mudah dihitung dan secara intuitif menarik bagi orang awam
dan juga professional. Jadi, tidak mengherankan bahwa persentil
merupakan jenis transformasi skor mentah yang paling umum dalam tes
psikologi. Hampir semua jenis hal tes dapat dilaporkan sebagai persentil,
meskipun jenis transformasi lainnya merupakan tujuan utama tes. Sebagai
contoh, tes-tes intelegensi biasanya digunakan untuk memperoleh skor IQ
130 setara dengan persentil 98, yang berarti bahwa skor tersebut tidak
hanya berada jauh diatas rata-rata namun, lebih tepatnya, juga berada
diatas 98 persen sampel standarisasi. Namun skor persentil memiliki satu
kelemahan utama: mendistorsi skala pengukuran dasar, terutama pada
kasus-kasus ekstrem.
c. Skor Standar
Kendati persentil merupakan jenis transformasi skor yang paling
populer, skor standar memiliki sifat psikometris yang paling diinginkan.
Skor standar menggunakan deviasi standar dari distribusi total skor
mentah sebagai unit dasar pengukuran. Skor standar menunjukan jarak
dari mean dalam unit deviasi standar. Sebagai contoh skor mentah tepat
satu deviasi standar diatas mean dikonversi menjadi skor standar +1,00.
Skor mentah yang tepat setengah deviasi standar dibawah mean dikonversi
menjadi skor standar -0,50. Penghitungan skor standar peserta tes (disebut
juga skor z) bersifat sederhana: skor mentah peserta tes dikurangi mean
kelompok normatif dan kemudian hasilnya dibagi dengan deviasi standar
kelompok normatif. Skor standar memiliki sifat psikometrik yang
diinginkan yakni mempertahankan besaran relatif jarak antara nilai-nilai
yang berurutan yang terdapat dalam skor mentah dasar. Ini karena
distribusi skor standar tidak mendistorsi skala pengukuran dasar.
Kesesuaian skala pengukuran trasnformasi ini merupakan keunggulan
utama skor standar dibandingkan dengan persentil dan peringkat persentil.
Seperti yang telah disampaikan, skor persentil sangat mendistorsi,
terutama pada kasus-kasus ekstrem. Suatu contoh spesifik akan
menggambarkan sifat suatu skor standar yang tidak mendistorsi. Ambil
contoh empat skor mentah 55,60,70, dan 80 pada tes dengan mean 50 dan
deviasi standar 10, dua skor pertama memiliki perbedaan sebesar 5 poin
skor menrah, sedangkan dua skor terakhir memiliki perbedaan sebesar 10
poin skor mentah dua kali lebuh besar dari perbedaan antara dua skor
pertama.
Banyak psikolog dan pendidik menghargai sifat-sifat psikometrik skor
standar namun menganggap pecahan desimal dan tanda positif/negatif
(misalnya, z=- 2,32) sebagai penggangu tidak perlu. Sebagai respons atas
masalah ini, para spesialis tes telah menyusun sejumlah variasi skor
standar yang secara kolektif disebut skor terstandarisasi.
Dari sudut pandang konseptual, skor terstandarisasi (standarized
scores) identik dengan skor standar (standard scores). Kedua jenis skor itu
mengandung informasi yang persis sama, bentuk distribusi skor tidak
terpengaruh, dan alur hubungan antara skor standar dan skor
terstandarisasi selalu berupa garis lurus.
Interpretasi skor tes yang berdasarkan norma terbagi menjadi dua, yaitu dan
norma kelompok (within-group norms) yang telah dijelaskan pada paragraf-
paragraf sebelumnya serta norma perkembangan (developmental norms). Norma
perkembangan mengindikasikan sebanyak/sejauh/sesesuai manakah individu telah
berkembang sesuai jalur perkembangan yang normal. Dalam bentuk skala ordinal,
norma perkembangan berupa teori-teori tahapan perkembangan yang dipelajari
dalam psikologi. Selain itu, norma perkembangan dapat pula berupa tinjauan usia
mental, juga ekuivalen kelas (kesesuaian antara kemampuan dengan kelas yang
normalnya diduduki dengan kemampuan tersebut di masa sekolah).
2. Kriteria Kinerja/Performa
Bila hubungan antara item atau tugas tes dan standar kinerja dapat ditunjukkan
dan didefinisikan dengan baik, nilai tes dapat dievaluasi melalui interpretasi
referensi kriteria. Jenis interpretasi ini menggunakan prosedur, indikator perilaku,
dan sejumlah keriteria seperti pengambilan sampel dari domain konten atau
perilaku yang terkait dengan pekerjaan, yang dirancang untuk menilai apakah dan
sejauh mana tingkat penguasaan yang diinginkan atau kriteria kinerja telah
dipenuhi.
Informed Consent
b. Perpaduan
Perpaduan atau penggabungan yang relevan memiliki arti bahwa
perilaku pertama atau masalah eksperimental dari pasien telah
memberikan konteks yang berfungsi sebagai semacam peta di mana
rincian masalah yang relevan dapat dibuat terlihat dan terkait satu sama
lain. Dalam laporan akhir, keluhan yang di sampaikan sudah tidak lagi
acak, tidak dijelaskan, atau fenomena yang tidak tepat, melainkan ini bisa
di mengerti berhubungan dengan kepribadian komprehensif.
c. Kebermaknaan / Usefulness
Laporan dikatakan bermakna jika pembaca menemukan bahwa itu jelas
dan memahaminya. Tujuan laporan sebagai alat komunikasi adalah untuk
mengubah misteri, kompleksitas, atau kebingungan menjadi bermakna.
Tetapi kemanfaatannya bukan hnya untuk klien saja, melainkan juga
diharapkan bermanfaat lebih luas lagi sepeti di dunia pendidikan atau
industri.
Reliabilitas
rxx = st2
s2
Dengan kata lain, jika semua varian skor tes adalah varian benar,
reliabilitas skor akan sempurna (1,00). Koefisien reliabilitas dapat dilihat
sebagai angka yang memperkirakan proporsi varians dalam kelompok skor
tes yang dicatat oleh kesalahan yang berasal dari satu atau lebih sumber.
Dari perspektif ini, evaluasi skor reliability melibatkan dua langkah proses
yang terdiri dari (a) penentuan sumber-sumber kesalahan apa yang
mungkin dimasukkan ke dalam nilai tes dan (b) memperkirakan besarnya
kesalahan-kesalahan itu.
Seperti yang telah kita lihat, kesalahan dapat masuk kedalam skor tes
psikologis karena sejumlah besar alasan, yang kebanyakan dari luar bidang
perkiraan reliabilitas psikometrik. Secara umum, bagaimanapun, kesalahan
yang masuk kedalam hasil test mungkin dikategorikan berasal dari salah
satu atau lebih dari ketiga sumber berikut :
a. Konteks dimana tepat berlangsungnya test, termasuk dengan faktor
yang terkait dengan administrator tes, alat penghitung test, lingkungan
ujian, serta alasan pengujian dilakukan.
b. Peserta ujian
c. Test itu sendiri
Beberapa dari sumber kesalahan diatas dapat di minimalisasikan atau
dihilangkan asalkan tepat dalam melakukan test yang diikuti oleh pihak-
pihak yang terlibat dalam proses pengembangan, pemilihan, administrasi,
dan penilaian skor.
Selain sumber kesalahan di atas, perbedaan dari Interscorer juga
mempengaruhi kesalahan dalam memberikan nilai test psikologis.
Perbedaan Interscorer (penilai) adalah label yang ditetapkan untuk
kesalahan yang dapat masuk ke dalam skor setiap kali elemen subjektivitas
memainkan peran dalam penilaian tes. Ini berarti bahwa penilai yang
berbeda tidak akan selalu memberikan skor atau peringkat yang sama
persis untuk kinerja tes yang diberikan bahkan jika arah untuk pemberian
skor yang ditentukan dalam uji manual bersifat eksplisit dan terperinci dan
juga para penilai teliti dalam menerapkan arahan tersebut. Metode dasar
untuk memperkirakan kesalahan karena perbedaan penilai terdiri dari
memiliki setidaknya dua individu yang berbeda dalam menilai set tes yang
sama, jadi sehingga untuk setiap kinerja peserta tes, dua atau lebih skor
independen dihasilkan. Korelasi diantara set skor yang dihasilkan dengan
cara ini adalah indeks scorer reliability. Korelasi positif dan sangat tinggi,
dalam urutan 0,90 atau lebih tinggi, menunjukkan bahwa proporsi
kesalahan yang diperhitungkan oleh perbedaan interscorer adalah 10%
atau kurang, karena 1 - (≥ .90) = ≤ .10.
Reliabilitas skor adalah pertimbangan abadi dalam pengujian psikologis
karena kemungkinan yang ada saat ini bahwa kesalahan dari berbagai
sumber akan masuk ke dalam hasil tes. Namun, cara di mana reliabilitas
skor dianggap berbeda di berbagai titik dalam proses pengembangan tes
serta dalam aplikasi tes yang sebenarnya. Dari perspektif pengguna tes,
yang paling relevan untuk tujuan ini, perkiraan reliabilitas harus
dipertimbangkan dengan hati-hati dan diterapkan dalam tahap pemilihan
tes dan interpretasi skor tes.
Setelah tes dipilih, diadministrasikan, dan diberi skor, data reliabilitas
diterapkan dalam proses interpretasi tes untuk dua tujuan yang berbeda
tetapi tetap terkait. Yang pertama adalah mengetahui dan mengukur batas
kesalahan dalam skor tes yang diperoleh. Tujuan kedua adalah untuk
mengevaluasi signifikansi statistik dari perbedaan antara skor yang
diperoleh untuk membantu menentukan makna perbedaan tersebut dalam
hal apa skor tersebut diwakili.
Validitas
Definisi pertama dari validitas sebagai “sejauh mana test mengukur apa yang
akan diukur” yang di kemukakan pada 1921 oleh National Association of the
Directors of Educational Research (T.B. Rogers, 1995). Tetapi untuk konsep yang
menjelaskan tentang validitas sekarang tidak ada yang sebaik dari Samuel
Messick, yang menyatakan bahwa Validitas adalah penilaian evaluatif terintegrasi
dari tingkat di mana bukti empiris dan rasional teoritis mendukung kecukupan dan
kesesuaian kesimpulan dan tindakan berdasarkan skor tes atau mode penilaian
lainnya.
Sumber dari bukti validitas dapat di dapatkan dari beberapa hal, berikut ini
merupakan sumber dari bukti validitas :
c. Diferensisasi Usia
Hasil tes yang konsisten dengan tren perkembangan yang mapan
lintas kelompok umur sering dilihat sebagai bukti skor validitas.
Nyatanya, kriteria diferensiasi usia adalah salah satu sumber bukti
tertua dari validasi tes kemampuan. Keberhasilan skala Binet-Simon
yang diukur terutama melalui studi yang membuktikan bahwa
pengambilan sampel fungsi kognitif mereka menghasilkan hasil yang
dapat digunakan untuk menggambarkan tingkat kemampuan anak-anak
secara kuantitatif, dalam hal tingkat usia yang sesuai dengan kinerja
mereka. Dalam kebanyakan tes kemampuan, kinerja anak-anak dan
remaja dalam sampel normatif biasanya menunjukkan kenaikan pada
usia kronologis yang berurutan. Sebaliknya pada akhir dari spectrum
umur, penurunan kinerja diamati di antara sampel orang dewasa yang
lebih tua pada instrumen yang mengukur kemampuan yang cenderung
berkurang dengan bertambahnya usia, seperti tes memori dan tes yang
menilai kecepatan kinerja.
d. Hasil Eksperimen
Sumber tidak langsung bukti lain yang dapat berguna dalam
validasi skor tes disediakan oleh investigasi yang menggunakan skor
tes psikologis sebagai variabel dependen untuk mengukur efek
intervensi eksperimental. Dalam bidang pengujian kemampuan, bukti
ini terutama berasal dari perbedaan skor sebelum dan sesudah tes
setelah intervensi yang bertujuan memperbaiki kekurangan atau
meningkatkan kinerja dalam berbagai keterampilan kognitif dan
intelektual.
Kerahasiaan Data
Untuk kerahasiaan data hasil tes psikologi sendiri telah diatur dalam kode etik
psikologi pasal 24 yang harus dipatuhi oleh baik psikolog itu sendiri maupun
orang yang memberikan layan psikologi, yang hendaknya mematuhi hal – hal
sebagai berikut :
a. Dapat diberikan hanya kepada yang berwenang mengetahuinya dan hanya
memyat hal-hal yang langsung berikatan dengan tujuan pemberian layanan
psikologi.
b. Dapat didiskusikan hanya dengan orang-orang atau pihak yang secara
langsung berwenang atas diri pengguna layanan Psikologi.
c. Dapat dikomunikasikan dengan bijaksana secara lisan atau tulis kepada
pihak ketiga hanya bila pemberitahuan ini diperlukan untuk kepentingan
pengguna layanan psikologi, profesi, dan akademisi.
Dalam kondisi tersebut indentitas orang yang menjalani pemeriksaan psikologi
tetap dijaga kerahasiaannya.
DAFTAR PUSTAKA