PENDAHULUAN
1
BAB II
PEMBAHASAN
2
b. Jika korelasi mendekati satu atau kurang dari satu maka ketetapannya reliable
tapi kalau korelasi lebih dari satu maka tidak reliable
3. Standart
Tujuan utama standardisasi tes adalah untuk menentukan distribusi skor mentah
pada sampel terstandarisasi (kelompok norma). Skor mentah yang diperoleh
tersebut kemudian dikonversikan ke beberapa bentuk skor turunan atau norma.
Tipe utama ini berupa ekuivalen usia, ekuivalen tingkat, peringkat persentil, dan
skor standar.
Ciri pemillihan sampel terstandardisasi dari populasi bervariasi dari pengambilan
sampel secara acak sederhana (simple random sampling) sampai strategi pemilihan
sampel yang lebih rumit, seperti pengambilan sampel acak secara terstratifikasi
(stratified random sampling) dan pengambilan sampel acak secara cluster (cluster
sampling). Pada pengambilan sampel acak sederhana, setiap orang dalam populasi
sasaran memiliki peluang setara untuk dipilih.
Akan tetapi, acak tidak menjamin keterwakilan. Akibatnya, cara lebih tepat untuk
menstandardisasi tes adalah mulai dengan membuat kategori, ataumembuat
strata (stratifying), populasi berdasar serangkaian variable demografi (jenis
kelamin, usia, status social ekonomi, wilayah geografi, dan lain-lain yang
barangkali berkaitan dengan pemberian skor tes. Kemudian, jumlah individu
dipilih secara acak dari setiap kategori atau strata dibuat proporsional dengan
jumlah total orang pada populasi yang masuk ke strata tersebut. Jika prosedur
pengambilan sampe secara acak terstratifikasi ini dipergunakan, kecenderungan
pemilihan sampel yang bias atau tidak lazim ini diminimalisir.
4. Obyektif
Penilaian dengan objektivitas disebut dengan penilaian objektif. Suatu tes yang
objektif akan memberikan hasil yang sama bila dinilai oleh tester yang berbeda. Tipe
tes yang objektif yang paling lazim adalah beri pertanyaan multiple choice, semua
jawabannya bersifat khas dan telah ditentukan sebelumnya. Tipe lainnya yaitu tes
yang berisi pertanyaan-pertanyaan “true and false” dimana seseorang akan mengisi
blangko dengan suatu cara atau ungkapan-ungkapan yang telah ditetapkan
sebelumnya.
5. Komprehensif
Tes komprehensif berarti tes tersebut dapat sekaligus menyelidiki banyak hal
misalnya kita harus menyelidiki prestasi individu dalam bahan ujian tertentu,maka
3
tes yang cukup komprehensif akan mampu mengungkapkan pengetahuan testi
mengenai hal yang dipelajari,juga hal yang mencegah dorongan berspekulasi.
6. Diskriminatif
Tes harus mampu menunjukan perbedaan-perbedaan yg kecil mengenai sifat (faktor)
tertentu pada individu yg berbeda-beda. Indeks yg menunjukan diskriminasi disebut
daya pembeda. Dalam analisis beda, arah kecendrungan alternatif jawaban pada item
dipilih menjadi dua, jawaban satu dan dua. Pembagian arah jawaban tes tidak
mengandung arti bahwa jawaban satu lebih baik daripada jawaban dua. Pembagian
tersebut hanya sebagai kode. Bila kemungkinan jawaban suatu item terdiri dari dua
alternatif, maka penentuan arah jawaban dapat dilakukan dengan mudah.
7. Efektif dan efesien
Dapat berarti waktu yang diperlukan untuk menjawab item-item atau pertanyaan
dalam melaksanakan tes dipergunakan dengan secepat mungkin
4
menggunakan pembanding lain misalkan klasifikasi angka kecerdasan menurut Louis
Terman bahwa kecerdasan berada pada taraf normal atau rata-rata jika mendapat skor
antara 90-110. Dengan menggunakan kriteria ini maka kita dapat menarik kesimpulan
bahwa kecerdasan individu pertama berada pada taraf di bawah rata-rata. Sedangkan
individu kedua memiliki kecerdasan yang sama dengan kebanyakan orang pada
tingkat usia yang sama atau memiliki kecerdasan pada taraf rata-rata. Dengan
menggunakan suatu kriteria atau pembanding maka hasil pengukuran dapat
disimpulkan atau dapat diinterpretasikan.
Asesmen seperti diuraikan diatas merupakan proses lanjutan dari kegiatan pengukuran
dan penilaian, atau dengan perkataan lain dapat dinyatakan bahwa keseluruhan
prosedur itulah yang disebut dengan asesmen. Asesmen adalah proses penarikan
kesimpulan berdasarkan data deskriptif dan hasil perbandingan dengan suatu kriteria.
Melalui proses asesmen inilah kita dapat memahami karakteristik individu sehingga
dapat dilakukan kegiatan lanjutan berupa penetapan diagnosis bahkan prognosis.
Dalam proses pemberian bantuan psikologi terhadap individu yang mengalami
masalah psikologi, proses seperti ini dinamakan psikodiagnostika. Ketepatan dalam
merumuskan tindakan pemberian bantuan atau saran ataupun yang biasa dianamakan
teknik intervensi, sangat tergantung pada ketepatan diagnosis dan prognosisnya.
Selanjutnya jika diurut kebelakang, maka ketepatan diagnosis tergantung pada kriteria
yang digunakan, bahkan tergantung pula pada tingkat ketepatan instrument yang
digunakan dalam pengukuran.
Pemilihan kriteria yang tepat akan menentukan kualitas kesimpulan yang dibuat. Jika
yang digunakan adalah kriteria kelompok maka dasar kesimpulan adalah kelompok
dimana individu yang dinilai menjadi anggota kelompok tersebut, sehingga
kesimpulannya tidak berlandaskan pada ukuran ideal. Apalagi jika kriterianya adalah
individu lain maka kesimpulannya hanya akan dapat menemukan apakah individu
yang dinilai lebih atau kurang dibandingkan dengan individu lain yang digunakan
sebagai kriteria. Jika kita menggunakan kriteria kecerdasan dari Louis Terman
tersebut diatas, dalam menarik kesimpulan tentang taraf kecerdasan mahasiswa kita,
kemungkinan saja krtiteria itu terlalu tinggi atau terlalu rendah dan tidak sesuai
dengan ukuran rata-rata orang Indonesia. Timbulah pertanyaan kriteria seperti apa
yang tepat untuk digunakan dalam proses asemen yang kita lakukan, dan ternyata
banyak pilihan tersedia dalam penetapan kriteria tersebut.
5
Kriteria kelompok atau seringkali juga disebut dengan norma, adalah suatu
pembanding berupa pencapaian kelompok dimana subjek yang diukur menjadi
anggota dari kelompok tersebut. Norma merupakan performance sekelompok orang
yang ditampilkan dalam data suatu tes berupa distribusi skor yang diperoleh dari hasil
pengukuran terhadap sekelompok orang. Data yang membentuk norma secara ideal
seharusnya merupakan data yang representative dari suatu populasi dimana tes
tersebut dirancang untuk digunakan. Sehingga subjek yang dinlai dengan norma
tersebut benar-benar memiliki karakteristik yang sama dengan populasi tadi. Norma
yang dikembangkan melalui prosedur seperti ini dinamakan norma yang standard.
Disamping norma yang standard dapat ditemukan pula norma yang berlaku local.
Artinya kelompok acuan yang digunakan sebagai dasar pembentukan norma adalah
kelompok kecil dan terbatas. Misalkan satu kelas mahasiswa yang berjumlah 80 orang
menjalani tes. Maka hasil tes setiap subjek dibandingkan dengan performance
sekelompok mahasiswa tersebut. Pada umumnya penetapan norma berlandaskan pada
rata-rata hitung seperti mean, median, atau modus. Fungsi dari norma adalah untuk
mendapatkan informasi tentang skor tes dari suatu populasi. Sehingga nantinya skor
itu dapat ditransformasikan ke dalam suatu set data yang memiliki arti atau dapat
diinterpretasikan. Kedua fungsi dari norma adalah untuk menentukan kedudukan
individu dalam kelompok. Beberapa jenis norma atau kriteria kelompok yang sering
digunakan adalah:
a. Grade Norm
Anastasi menyebutkan dengan Grade Equivalent (1997) dan
menyatakan bahwa kriteria ini merupakan pembanding yang dibentuk
berdasarkan pada segi ekivalensi kelas. Artinya skor yang
mengelompok pada grade/kelas tingkatan tertentu, dan pengelompokan
skor itu berdasarkan pada mean, median, atau modus. Subjek yang
diukur dalam suatu atribut, mendapatkan skor tertentu, maka dalam
penilaian skor itu termasuk atau ekivalen dengan skor kelompok
subjek pada grade/tingkatan yang mana.
Norma berdasarkan tingkat atau grade dibentuk melalui
perhitungan mean, median, atau modus dari skor sejumlah subjek pada
setiap tingkat, yang merupakan sampel representative. Dengan
demikian jika rata-rata skor yang diperoleh siswa kelas 4 dalam tes
aritmatika adalah 23 maka skor 23 berhubungan dengan ekivlen
6
kelas/tingkat 4 sekolah dasar. Skor ekivalen pada kelas/grade lain juga
dapat diperoleh dengan menguji sejumlah siswa yang menjadi sampel,
kemudian menghitung rata-rata skor dari kelas/grade tersebut. Prosedur
pembentukan grade norm adalah sebagai berikut:
- Berikan tes kepada sekelompok subjek sebagai sampel
- Subjek terdiri kelompok pada beberapa grade yang berbeda
- Hitung skor rata-rata pada setiap grade
7
60
50
40
30
20
10
0 5 6 7 8 9 10
c. Percentile Norm
Skor-skor persentil diungkapkan dalam kaitan dengan persentase
orang dalam sampel yang berada di bawah skor tertentu. Misalkan
terdapat 28% orang hanya dapat menyelesaikan dengan benar kurang
dari 15 soal dalam penalaran aritmatika, maka skor mentah itu dapat
disamakan dengan persentil ke 28.
Skor persentil menunjukan posisi relatif individu dalam sampel.
Persentil dapat dianggap sebagai peringkat dalam suatu kelompok
subjek yang jumlah anggotanya 100 orang. Dengan catatan bahwa
dalam penentuan peringkat biasnya orang mulai menghitung dari atas,
subjek terbaik menduduki peringkat satu. Sebaliknya subjek yang
mendapat skor terendah akan menduduki peringkat 100. Namun dalam
persentil kita menghitung dari bawah dimulai dari skor terendah. Maka
subjek yang mendapat skor buruk berada pada posisi di bawah dan
makin tinggi skor yang diperoleh subjek maka posisinya akan makin
tinggi. Skor pada suatu titik persentil misalkan 45, memisahkan 45
persen subjek berada di bawah posisi individu yang mendapatkan skor
tersebut dan 56 persen subjek berada pada posisi diatas skor tersebut.
Contoh norma persentil:
Persentil Skor pada Atribut X
90 77-90
. .
. .
97 73-76
. .
. .
. .
. .
. .
50 41-43
. .
48 38-40
8
. .
. .
. .
. .
. .
10 0-14
9
standar berjenjang 5 atau 6, 7, 9 atau 11 dst. Sehingga ditemukan
adanya istilah stanfive, stanine, staneleven, dan sebagainya.
Proses penyusunan norma standar lainnya dihitung berdasarkan
penyimpangan (deviasi) dari mean. Misalkan dari distribusi skor hasil
pengukuran terhadap sejumlah subjek ditetapkan menjadi 5 kategori,
diperoleh mean = 55 dn standar deviasi 10. Maka batas atas kategori 1
dinyatakan pada M -2 SD, kategori 2 diantara -2 SD sampai dengan M
-1 SD, kategori 3 antara -1 SD sampai dengan M +1 SD, kategori 4
antara M +1 SD sampai dengan M +2 SD dan kategori 5 dengan batas
bawah pada M +2 SD.
10
BAB III
PENUTUP
3.1 Kesimpulan
Tes adalah serangkaian cara atau prosedur-prosedur yang digunakan untuk
memperolehdata atau informasi yang akurat tentang suatu obyek dalam rangka
pengukuran dan penilaian,yang nantinya akan digunakan untuk mengembangkan dan
meningkatkan hal-hal yang berkaitan dengan pendidikan. Sebagai suatu alat
pengukur yang digunakan untuk mengukur, membandingkan
danmemperoleh suatu informasi yang akurat, mak suatu tes yang baik harus memiliki
karakteristik-karakteristik tertentu
11
DAFTAR PUSTAKA
Dewa Ketut Sukardi. 1997. Analisis Tes Psikologis. Jakarta: Rinneka Cipta.
Aiken, Lewis R. dan Gary G-M.2008. Pengetesan dan Pemeriksaan Psikologi. PT Macanan
Jaya Cemerlang
Anastasi Anne dan Susana Urbina. 1997. Tes Psikologi. New Jersey: Prentice Hall
Beaton, D. E., Bombardier, C., Guillemin, F., & Ferraz, M. B. (2000). Guidelines for the
process of cross-cultural adaptation of self-report measures. Spine, 25(24), 3186–3191.
Hambleton, R.K ., Merenda, P.F., & Spielberger, C.D. (Eds) (2005). Adapting Educational
and Psychological Tests for Cross-Cultural Assessment. New Jersey: Lawrence Erlbaum
Associates.
12