Anda di halaman 1dari 12

BAB I

PENDAHULUAN

1.1. Latar Belakang


Tes psikologi kerap juga dikenal dengan istilah assesmen psikologi. Kedua istilah tersebut
memiliki makna yang hampir sama. Tes psikologi menjadi satu kebutuhan penting dalam
ruang kehidupan manusia. Tidak semata terkait dengan hal-hal yang bersifat klinis, tes
psikologi juga digunakan di ruang kerja.
Meski tes psikologi dan asesmen psikologi kerap disamakan, namun masih terdapat
perbedaan fundamental dari kedua istilah tersebut. Asesmen psikologi bersifat lebih
komprehensif dengan melibatkan beberapa pendekatan lain di luar tes psikologi secara
umum, seperti pengamatan, wawancara dan penggalian informasi dari pihak-pihak yang
terkait dengan klien.
Di ruang kebencanaan, tes psikologi klinis banyak digunakan. Momentum traumatis
seperti bencana berpotensi mengakibatkan gangguan mental pada korbannya. Kondisi
tersebut membutuhkan pendekatan psikologis yang dapat menyasar kondisi mental
korban bencana. Pada konteks kebencanaan, tes psikologi dibutuhkan untuk memetakan
efek psikologis pada korban dan menentukan pendekatan terbaik dalam penanganan
trauma.
Tes psikologi juga digunakan pada konteks penyelidikan kejahatan. Psikologi forensi
digunakan untuk beberapa hal dalam pembuktian kejahatan. Pertama, tes psikologi
digunakan untuk memastikan bahwa pelaku kejahatan tidak sedang berada dalam
gangguan mental. Kedua, tes psikologi digunakan untuk membuktikan kecenderungan
pelaku kejahatan untuk berpura-pura mengalami gangguan mental.

1.2. Rumusan Masalah


1. Apa yang dimaksud syarat tes yang baik?
2. Apa yang dimaksud kriterium dan norma?

1.3. Tujuan Masalah


1. Untuk mengetahui apa yang dimaksud syarat tes yang baik.
2. Untuk mengetahui apa yang dimaksud kriterium dan norma.

1
BAB II
PEMBAHASAN

2.1 Syarat Tes yang baik


1. Valid
Validitas berarti kualitas yang paling terpenting dalam suatu tes. Validitas tes
menunjuk kepada pengertian apakah hasil sesuai dengan kriteria yang telah
dirumuskan dan hingga mana tes tersebut telah mengukurnya. Suatu tes dikatakan
valid jika tes tersebut dapat tepat mengukur kemampuan testee dengan benar dan
sesungguhnya.
Terdapat 4 jenis validitas, yaitu:
a. Validitas Isi
Yaitu untuk mengetahui kajituan dari suatu instrumen ditinjau dari segi isi
instrumen tersebut yang dilakukan dengan jalan membandingkan isi instrumen
dengan komponen-komponen yang harus diukur.
b. Validitas Susunan
Untuk mengetahui apakah suatu instrumen memenuhi syarat-syarat validitas
susunan atau tidak, maka harus membandingkan susunan instrumen tersebut
dengan syarat-syarat penyusunan instrumen yang baik
c. Validitas Bandingan
Kejituan suatu instrumen dilihat dari korelasinya terhadap keadaan yang
sebenarnya dari responden tersebut saat pengukuran dilakukan
d. Validitas Ramalan
Kejituan dari suatu instrumen ditinjau dari kemampuan instrumen tersebut
meramalkan keadaan individu pada masa yang akan datang.
2. Rellable
Reliabilitas menunjuk kepada ketetapan dari nilai yang diperoleh sekelompok
individu dalam kesempatan yang berbeda dengan tes yang sama ataupun yang
itemnya ekuivalen.
Konsep reliabilitas mendasari kesalahan yang mungkin terjadi pada nilai tunggal
tertentu sebagai susunan dari kelompok itu mungkin berubah karenanya
Hal-hal yang perlu diperhatikan dalam reliabilitas adalah:
a. Sebelum mengadakan tes harus diperhatikan terlebih dahulu keadaan fisik dan
lingkungan di sekitar testi

2
b. Jika korelasi mendekati satu atau kurang dari satu maka ketetapannya reliable
tapi kalau korelasi lebih dari satu maka tidak reliable
3. Standart
Tujuan utama standardisasi tes adalah untuk menentukan distribusi skor mentah
pada sampel terstandarisasi (kelompok norma). Skor mentah yang diperoleh
tersebut kemudian dikonversikan ke beberapa bentuk skor turunan atau norma.
Tipe utama ini berupa ekuivalen usia, ekuivalen tingkat, peringkat persentil, dan
skor standar.
Ciri pemillihan sampel terstandardisasi dari populasi bervariasi dari pengambilan
sampel secara acak sederhana (simple random sampling) sampai strategi pemilihan
sampel yang lebih rumit, seperti pengambilan sampel acak secara terstratifikasi
(stratified random sampling) dan pengambilan sampel acak secara cluster (cluster
sampling). Pada pengambilan sampel acak sederhana, setiap orang dalam populasi
sasaran memiliki peluang setara untuk dipilih.
Akan tetapi, acak tidak menjamin keterwakilan. Akibatnya, cara lebih tepat untuk
menstandardisasi tes adalah mulai dengan membuat kategori, ataumembuat
strata (stratifying), populasi berdasar serangkaian variable demografi (jenis
kelamin, usia, status social ekonomi, wilayah geografi, dan lain-lain yang
barangkali berkaitan dengan pemberian skor tes. Kemudian, jumlah individu
dipilih secara acak dari setiap kategori atau strata dibuat proporsional dengan
jumlah total orang pada populasi yang masuk ke strata tersebut. Jika prosedur
pengambilan sampe secara acak terstratifikasi ini dipergunakan, kecenderungan
pemilihan sampel yang bias atau tidak lazim ini diminimalisir.
4. Obyektif
Penilaian dengan objektivitas disebut dengan penilaian objektif. Suatu tes yang
objektif akan memberikan hasil yang sama bila dinilai oleh tester yang berbeda. Tipe
tes yang objektif yang paling lazim adalah beri pertanyaan multiple choice, semua
jawabannya bersifat khas dan telah ditentukan sebelumnya. Tipe lainnya yaitu tes
yang berisi pertanyaan-pertanyaan “true and false” dimana seseorang akan mengisi
blangko dengan suatu cara atau ungkapan-ungkapan yang telah ditetapkan
sebelumnya.
5. Komprehensif
Tes komprehensif berarti tes tersebut dapat sekaligus menyelidiki banyak hal
misalnya kita harus menyelidiki prestasi individu dalam bahan ujian tertentu,maka

3
tes yang cukup komprehensif akan mampu mengungkapkan pengetahuan testi
mengenai hal yang dipelajari,juga hal yang mencegah dorongan berspekulasi.
6. Diskriminatif
Tes harus mampu menunjukan perbedaan-perbedaan yg kecil mengenai sifat (faktor)
tertentu pada individu yg berbeda-beda. Indeks yg menunjukan diskriminasi disebut
daya pembeda. Dalam analisis beda, arah kecendrungan alternatif jawaban pada item
dipilih menjadi dua, jawaban satu dan dua. Pembagian arah jawaban tes tidak
mengandung arti bahwa jawaban satu lebih baik daripada jawaban dua. Pembagian
tersebut hanya sebagai kode. Bila kemungkinan jawaban suatu item terdiri dari dua
alternatif, maka penentuan arah jawaban dapat dilakukan dengan mudah.
7. Efektif dan efesien
Dapat berarti waktu yang diperlukan untuk menjawab item-item atau pertanyaan
dalam melaksanakan tes dipergunakan dengan secepat mungkin

2.2 Kriterium dan Norma


Proses asesmen psikologi diawali dengan kegiatan pengukuran yang akan
menghasilkan data yang dideskripsikan dalam bentuk angka. Selanjutnya dilakukan
perbandingan hasil pengukuran dengan suatu kriteria agar dapat menarik kesimpulan
hasil pengukuran yang berkenaan dengan atribut yang diukur. Proses perbandingan
tersebut dinamakan evaluasi atau penilaian, dan memerlukan suatu kriteria yang
digunakan sebagai pembandingnya.
Istilah pengukuran (measurement) sangat berkaitan dengan istilah penilaian
(evaluation). Pengukuran adalah istilah yang merujuk pada upaya untuk
mendeskripsikan data, sedangkan penilaian merujuk pada pengertian proses
perbandingan hasil pengukuran dengan suatu kriteria. Pengukuran yang tidak diikuti
dengan langkah penilaian tidak akan menghasilkan deskripsi data yang mengandung
arti yang jelas. Skor hasil pengukuran hanya mendeskripsikan sebagaimana adanya
atribut yang diukur dalam bentuk angka. Misalkan angka kecerdasan seorang
mahasiswa dengan menggunakan suatu tes adalah 84. Angka ini tidak bermakna jelas,
apakah mahasiswa tersebut adalah individu yang sangat cerdas, ataukah yang agak
cerdas. Barulah angka tersebut punya arti jika kita memiliki data lain dari individu
yang berbeda yang diukur dengan tes yang sama misalkan 98. Individu pertama yang
kurang cerdas dibandingkan dengan individu kedua. Atau individu kedua memiliki
kuallitas atribut yang lebih baik daripada individu kedua. Dapat pula kita

4
menggunakan pembanding lain misalkan klasifikasi angka kecerdasan menurut Louis
Terman bahwa kecerdasan berada pada taraf normal atau rata-rata jika mendapat skor
antara 90-110. Dengan menggunakan kriteria ini maka kita dapat menarik kesimpulan
bahwa kecerdasan individu pertama berada pada taraf di bawah rata-rata. Sedangkan
individu kedua memiliki kecerdasan yang sama dengan kebanyakan orang pada
tingkat usia yang sama atau memiliki kecerdasan pada taraf rata-rata. Dengan
menggunakan suatu kriteria atau pembanding maka hasil pengukuran dapat
disimpulkan atau dapat diinterpretasikan.
Asesmen seperti diuraikan diatas merupakan proses lanjutan dari kegiatan pengukuran
dan penilaian, atau dengan perkataan lain dapat dinyatakan bahwa keseluruhan
prosedur itulah yang disebut dengan asesmen. Asesmen adalah proses penarikan
kesimpulan berdasarkan data deskriptif dan hasil perbandingan dengan suatu kriteria.
Melalui proses asesmen inilah kita dapat memahami karakteristik individu sehingga
dapat dilakukan kegiatan lanjutan berupa penetapan diagnosis bahkan prognosis.
Dalam proses pemberian bantuan psikologi terhadap individu yang mengalami
masalah psikologi, proses seperti ini dinamakan psikodiagnostika. Ketepatan dalam
merumuskan tindakan pemberian bantuan atau saran ataupun yang biasa dianamakan
teknik intervensi, sangat tergantung pada ketepatan diagnosis dan prognosisnya.
Selanjutnya jika diurut kebelakang, maka ketepatan diagnosis tergantung pada kriteria
yang digunakan, bahkan tergantung pula pada tingkat ketepatan instrument yang
digunakan dalam pengukuran.
Pemilihan kriteria yang tepat akan menentukan kualitas kesimpulan yang dibuat. Jika
yang digunakan adalah kriteria kelompok maka dasar kesimpulan adalah kelompok
dimana individu yang dinilai menjadi anggota kelompok tersebut, sehingga
kesimpulannya tidak berlandaskan pada ukuran ideal. Apalagi jika kriterianya adalah
individu lain maka kesimpulannya hanya akan dapat menemukan apakah individu
yang dinilai lebih atau kurang dibandingkan dengan individu lain yang digunakan
sebagai kriteria. Jika kita menggunakan kriteria kecerdasan dari Louis Terman
tersebut diatas, dalam menarik kesimpulan tentang taraf kecerdasan mahasiswa kita,
kemungkinan saja krtiteria itu terlalu tinggi atau terlalu rendah dan tidak sesuai
dengan ukuran rata-rata orang Indonesia. Timbulah pertanyaan kriteria seperti apa
yang tepat untuk digunakan dalam proses asemen yang kita lakukan, dan ternyata
banyak pilihan tersedia dalam penetapan kriteria tersebut.

5
Kriteria kelompok atau seringkali juga disebut dengan norma, adalah suatu
pembanding berupa pencapaian kelompok dimana subjek yang diukur menjadi
anggota dari kelompok tersebut. Norma merupakan performance sekelompok orang
yang ditampilkan dalam data suatu tes berupa distribusi skor yang diperoleh dari hasil
pengukuran terhadap sekelompok orang. Data yang membentuk norma secara ideal
seharusnya merupakan data yang representative dari suatu populasi dimana tes
tersebut dirancang untuk digunakan. Sehingga subjek yang dinlai dengan norma
tersebut benar-benar memiliki karakteristik yang sama dengan populasi tadi. Norma
yang dikembangkan melalui prosedur seperti ini dinamakan norma yang standard.
Disamping norma yang standard dapat ditemukan pula norma yang berlaku local.
Artinya kelompok acuan yang digunakan sebagai dasar pembentukan norma adalah
kelompok kecil dan terbatas. Misalkan satu kelas mahasiswa yang berjumlah 80 orang
menjalani tes. Maka hasil tes setiap subjek dibandingkan dengan performance
sekelompok mahasiswa tersebut. Pada umumnya penetapan norma berlandaskan pada
rata-rata hitung seperti mean, median, atau modus. Fungsi dari norma adalah untuk
mendapatkan informasi tentang skor tes dari suatu populasi. Sehingga nantinya skor
itu dapat ditransformasikan ke dalam suatu set data yang memiliki arti atau dapat
diinterpretasikan. Kedua fungsi dari norma adalah untuk menentukan kedudukan
individu dalam kelompok. Beberapa jenis norma atau kriteria kelompok yang sering
digunakan adalah:
a. Grade Norm
Anastasi menyebutkan dengan Grade Equivalent (1997) dan
menyatakan bahwa kriteria ini merupakan pembanding yang dibentuk
berdasarkan pada segi ekivalensi kelas. Artinya skor yang
mengelompok pada grade/kelas tingkatan tertentu, dan pengelompokan
skor itu berdasarkan pada mean, median, atau modus. Subjek yang
diukur dalam suatu atribut, mendapatkan skor tertentu, maka dalam
penilaian skor itu termasuk atau ekivalen dengan skor kelompok
subjek pada grade/tingkatan yang mana.
Norma berdasarkan tingkat atau grade dibentuk melalui
perhitungan mean, median, atau modus dari skor sejumlah subjek pada
setiap tingkat, yang merupakan sampel representative. Dengan
demikian jika rata-rata skor yang diperoleh siswa kelas 4 dalam tes
aritmatika adalah 23 maka skor 23 berhubungan dengan ekivlen

6
kelas/tingkat 4 sekolah dasar. Skor ekivalen pada kelas/grade lain juga
dapat diperoleh dengan menguji sejumlah siswa yang menjadi sampel,
kemudian menghitung rata-rata skor dari kelas/grade tersebut. Prosedur
pembentukan grade norm adalah sebagai berikut:
- Berikan tes kepada sekelompok subjek sebagai sampel
- Subjek terdiri kelompok pada beberapa grade yang berbeda
- Hitung skor rata-rata pada setiap grade

Contoh grade norm dari suatu tes.

Mean Grade Equivalents


19 3
27 4
35 5
43 6

Siswa yang memeroleh skor 27 berarti kemampuannya setara


dengan pada umumnya siswa yang berada pada tingkat atau grade 4
karena skor itu berada pada Grade Equivalents (GE) 4.
b. Age Equivalents atau Age Norm
Dalam skala umur, item persoalan tes dikelompokan ke dalam
tingkatan usia. Misalkan sejumlah item yang dapat diselesaikan dengan
tepat oleh sekelompok anak berusia 7 tahun atau dengan kata lain skor
rata-rata pada kelompok usia itu adalah 45. Skor inilah yang menjadi
pembanding bagi setiap anak yang diukur jika berusia 7 tahun.
Contohnya adalah anak usia 7 tahun hanya mendapat skor 40, berarti
anak tersebut memiliki kemampuan di bawah kemampuan anak lain
yang seusia dalam atribut yang diukur. Atau contoh lainnya jika anak
berusia 9 tahun mendapat skor 45pada tes tersebut artinya anak itu
memiliki kemampuan yang setingkat dengan anak yang berusia 7
tahun.
Contoh norma umur:
80
70

7
60
50
40
30
20
10
0 5 6 7 8 9 10

c. Percentile Norm
Skor-skor persentil diungkapkan dalam kaitan dengan persentase
orang dalam sampel yang berada di bawah skor tertentu. Misalkan
terdapat 28% orang hanya dapat menyelesaikan dengan benar kurang
dari 15 soal dalam penalaran aritmatika, maka skor mentah itu dapat
disamakan dengan persentil ke 28.
Skor persentil menunjukan posisi relatif individu dalam sampel.
Persentil dapat dianggap sebagai peringkat dalam suatu kelompok
subjek yang jumlah anggotanya 100 orang. Dengan catatan bahwa
dalam penentuan peringkat biasnya orang mulai menghitung dari atas,
subjek terbaik menduduki peringkat satu. Sebaliknya subjek yang
mendapat skor terendah akan menduduki peringkat 100. Namun dalam
persentil kita menghitung dari bawah dimulai dari skor terendah. Maka
subjek yang mendapat skor buruk berada pada posisi di bawah dan
makin tinggi skor yang diperoleh subjek maka posisinya akan makin
tinggi. Skor pada suatu titik persentil misalkan 45, memisahkan 45
persen subjek berada di bawah posisi individu yang mendapatkan skor
tersebut dan 56 persen subjek berada pada posisi diatas skor tersebut.
Contoh norma persentil:
Persentil Skor pada Atribut X
90 77-90
. .
. .
97 73-76
. .
. .
. .
. .
. .
50 41-43
. .
48 38-40

8
. .
. .
. .
. .
. .
10 0-14

d. Standard Score Norm


Norma yang paling banyak digunakan sekarang ini adalah norma
skor standar yang merupakan tipe norma yang paling memuaskan.
Pembentukan norma ini berdasarkan pada suatu proses yang diawali
dengan pengukuran atribut psikologis tertentu pada sekelompok subjek
sebagai sampel yang representatif dari suatu pupolasi. Skor yang
ditampilkan dalam norma ini menunjukan jarak skor individu dari rata-
rata dalam kaitan dengan simpangan baku dari distribusi skor.
Biasanya norma skor standar diperoleh melalui transformasi linier
maupun non linier dari sekumpulan skor mentah. Skor standar
dinamakan skor-z. untuk menghitung skor-z dilakukan dengan
menemukan perbedaan antara skor mentah individu dengan skor rata-
rata kelompok, kemudian membagi perbedaan ini dengan simpangan
baku kelompok itu.
Jika M = 60 dan SD = 5, maka skor standar untuk subjek yang
mendapat skor mentah 65 adalah:
𝑋−𝑀 65 − 60
𝑍= =
𝑆𝐷 5
z = +1,00
Jika subjek mendapat skor mentah 58, maka z nya = -0,40. Perhitungan
skor-z diatas adalah untuk dua subjek, subjek pertama berada +1 SD di
atas kelompok rata-rata, sedangkan subjek kedua berada pada posisi
0,40 SD di bawah rata-rata kelompok. Skor mentah yang tepat berada
pada posisi ekivalen dengan skor rata-rata adalah z = 0.
Nampak dari prosedur diatas bahwa individu yang mendapat skor di
bawah rata-rata akan mendapat skor z di bawah 0 atau memiliki tanda
negatif. Kebanyakan rentang skor SD yang digunakan adalah -3,00 di
atas atau bertanda + dan 3,00 di bawah atau bertanda negatif.
Berdasarkan tentang skor SD yang digunakan ini ditetapkan skor

9
standar berjenjang 5 atau 6, 7, 9 atau 11 dst. Sehingga ditemukan
adanya istilah stanfive, stanine, staneleven, dan sebagainya.
Proses penyusunan norma standar lainnya dihitung berdasarkan
penyimpangan (deviasi) dari mean. Misalkan dari distribusi skor hasil
pengukuran terhadap sejumlah subjek ditetapkan menjadi 5 kategori,
diperoleh mean = 55 dn standar deviasi 10. Maka batas atas kategori 1
dinyatakan pada M -2 SD, kategori 2 diantara -2 SD sampai dengan M
-1 SD, kategori 3 antara -1 SD sampai dengan M +1 SD, kategori 4
antara M +1 SD sampai dengan M +2 SD dan kategori 5 dengan batas
bawah pada M +2 SD.

10
BAB III
PENUTUP

3.1 Kesimpulan
Tes adalah serangkaian cara atau prosedur-prosedur yang digunakan untuk
memperolehdata atau informasi yang akurat tentang suatu obyek dalam rangka
pengukuran dan penilaian,yang nantinya akan digunakan untuk mengembangkan dan
meningkatkan hal-hal yang berkaitan dengan pendidikan. Sebagai suatu alat
pengukur yang digunakan untuk mengukur, membandingkan
danmemperoleh suatu informasi yang akurat, mak suatu tes yang baik harus memiliki
karakteristik-karakteristik tertentu

11
DAFTAR PUSTAKA

Dewa Ketut Sukardi. 1997. Analisis Tes Psikologis. Jakarta: Rinneka Cipta.

Aiken, Lewis R. dan Gary G-M.2008. Pengetesan dan Pemeriksaan Psikologi. PT Macanan
Jaya Cemerlang

Anastasi Anne dan Susana Urbina. 1997. Tes Psikologi. New Jersey: Prentice Hall

Beaton, D. E., Bombardier, C., Guillemin, F., & Ferraz, M. B. (2000). Guidelines for the
process of cross-cultural adaptation of self-report measures. Spine, 25(24), 3186–3191.

Hambleton, R.K ., Merenda, P.F., & Spielberger, C.D. (Eds) (2005). Adapting Educational
and Psychological Tests for Cross-Cultural Assessment. New Jersey: Lawrence Erlbaum
Associates.

12

Anda mungkin juga menyukai