Oleh :
Puji syukur kami panjatkan kepada Tuhan Yang Maha Esa, karena atas berkat dan
rahmatNya, kami dapat menyelesaikan makalah adaptasi dan penormaan tes standar ini.
Kami telah menyusun makalah ini se-baik mungkin, dengan bantuan dari berbagai pihak,
yang melancarkan penyelesaian makalah ini. Untuk itu, kami sampaikan banyak terima kasih,
khususnya kepada semua pihak yang telah terlibat langsung dalam proses pembuatan
makalah ini.
Kami sadar bahwa makalah ini masih memiliki banyak kekurangan dan kesalahan,
dari segi isi, materi, maupun segi tata bahasanya. Oleh karena itu, kami dengan lapang dada,
dan hati yang terbuka, menerima segala kritik dan saran dari pembaca, agar dapat
memerbaiki makalah ini.
Akhir kata, kami berharap, semoga makalah adaptasi dan penormaan tes standar ini,
dapat berguna dan bermanfaat, bagi pembaca sekalian.
Penyusun
ii
Daftar Isi
Kata Pengantar..........................................................................................................................i
Daftar Isi...................................................................................................................................ii
Bab I Pendahuluan...................................................................................................................1
1.1 Latar Belakang.....................................................................................................................1
1.2 Rumusan Masalah................................................................................................................1
1.3 Tujuan...................................................................................................................................1
1.4 Manfaat.................................................................................................................................2
Bab II Pembahasan..................................................................................................................3
2.1 Pengertian Adaptasi dan Penormaan Tes Standar ...............................................................3
2.1.1 Pengertian Adaptasi ..................................................................................................................3
2.1.2 Pengertian Penormaan ..............................................................................................................4
2.2 Pedoman Adaptasi Tes Standar ...........................................................................................5
2.2.1 Konteks.....................................................................................................................................5
2.2.2 Pengembangan Tes dan Adaptasi..............................................................................................5
2.2.3 Administrasi .............................................................................................................................6
2.2.4 Dokumentasi/Interpretasi Skor..................................................................................................6
2.3 Prosedur Adaptasi Tes Standar.............................................................................................7
2.3.1 Analisis posisi teoritis awal penulis.....................................................................................7
2.3.2 Terjemahan indikasi untuk operasi tes, item tes, instruksi dan nama tes dalam bahasa
pengguna..........................................................................................................................................7
2.3.3 Menguji tes dan verifikasi karakteristik psikometrik dari masing-masing item.............8
2.3.4 Pembentukan versi tes akhir dan evaluasi keandalan dan validitasnya............................8
2.3.5 Standarisasi tes untuk populasi masing-masing..................................................................9
2.3.6 Verifikasi hubungan struktural antara skala yang terdiri dari tes (hanya tentang
multifaktorial kuesioner)..............................................................................................................10
2.3.7 Elaborasi indikasi metodis untuk penerapan tes dengan membuat manual...................10
2.4 Konsep Validitas dan Reliabilitas ......................................................................................10
2.4.1 Validitas .................................................................................................................................10
2.4.2 Reliabilitas .............................................................................................................................12
2.5 Penormaan Tes Standar .....................................................................................................14
2.5.1 Norma Perkembangan.............................................................................................................14
2.5.2 Norma Dalam Kelompok .......................................................................................................15
2.5.3 Relativitas Norma...................................................................................................................16
Bab III Penutup .....................................................................................................................17
3.1 Kesimpulan ........................................................................................................................17
DAFTAR PUSTAKA .............................................................................................................18
ii
Bab I
Pendahuluan
1.3 Tujuan
Tujuan penulisan makalah ini adalah untuk :
1. Mengetahui pengertian adaptasi dan penormaan tes standar
2. Mengetahui apa saja pedoman dalam adaptasi tes standar
3. Mengetahui bagaimana prosedur adaptasi tes standar
4. Mengetahui konsep validitas dan reliabilitas
5. Mengetahui tentang penormaan tes standar
1
1.4 Manfaat
Manfaat dari penulisan makalah ini yaitu:
1. Untuk memenuhi tugas yang diberikan oleh dosen mata kuliah asesmen psikologis
teknik tes Ibu Ari Khusumadewi, S. Pd., M. Pd.
2. Berdasarkan latar belakang dan tujuan tersebut, manfaat dibuatnya makalah ini
adalah agar pembaca dapat memahami tentang adaptasi dan penormaan tes standar.
2
Bab II
Pembahasan
Salah satu kesalahan umum dalam proses adaptasi adalah bahwa adaptasi hanya
dilakukan dengan menerjemahkan alat ukur dari bahasa asing ke bahasa Indonesia. Padahal
jika dipelajari lebih dalam lagi, adaptasi bukan semata-mata menerjemahkan alat ukur, namun
juga menyesuaikan apakah tes tersebut kontekstual dengan kondisi sosial budaya masyarakat
tujuan. Adaptasi alat ukur meliputi aktivitas dari menentukan apakah alat ukur dapat
mengukur konstruk yang sama dalam bahasa dan budaya yang berbeda, memilih penerjemah,
memutuskan akomodasi yang sesuai, sampai mengecek kesetaraannya dalam bentuk yang
diadaptasi (Hambleton, Merenda, & Spielberger 2005).
Upaya pengimplementasian alat – alat tes di Indonesia seharusnya tidak berhenti pada
pembelian alat – alat tes tersebut dari luar negeri dan kemudian melakukan penerjemahan ke
bahasa Indonesia. Usaha yang lebih diperlukan adalah dengan melakukan adaptasi alat – alat
tes tersebut. Dalam adaptasi tes, proses penerjemahan tidak hanya sensitif pada faktor bahasa,
namun juga untuk faktor non – bahasa, seperti budaya dan relevansi pengetahuan mengenai
target populasi dari suatu tes. Proses ini menjadi sebuah hal yang penting karena sebuah tes
tidak dapat diimplementasikan dengan baik apabila konten alat tes tersebut tidak sesuai
dengan budaya Negara Indonesia, seperti penggunaan gambar salju yang memang tidak akrab
dengan budaya masyarakat Indonesia. Apabila sebuah alat tes mengandung soal ini, maka
efektivitas alat tes tersebut tidak akan merata dan akan terjadi sebuah bias. Dimana akan ada
peserta tes yang diuntungkan sekaligus juga dirugikan. Kemudian ada kosakata dalam bahasa
inggris yang memiliki padanan kata yang berbeda-beda dalam bahasa Indonesia. Contohnya
adalah kata “upset” yang dapat berarti kecewa, mengganggu, mengacaukan, dan seterusnya
permasalahan mengenai padanan kata kerap muncul dalam adaptasi tes kepribadian.
Adaptasi tes sudah mendapat perhatian khusus dan dibahas di organisasi tingkat
international seperti International Test Comission (ITC). ITC mengeluarkan pedoman untuk
melakukan penerjemahan dan adaptasi suatu tes (International Test Comission 2005). Hal ini
dimaksudkan agar kualitas dari tes yang diadaptasi tetap bisa memiliki nilai manfaat yang
memadai, sesuai dengan di Negara asalnya. Pedoman ini meliputi pedoman konteks,
pedoman pengembangan dan adaptasi tes, pedoman administrasi, serta pedoman dokumentasi
atau intrepetasi skor. Secara singkat pada pedoman konteks perlu diperhatikan mengenai
kemungkinan perbedaan budaya yang dapat bertentangan dengan tujuan utama dari
pengukuran dan kejelasan atribut yang ingin diukur. Kemudian, pada pedoman
pengembangan dan adaptasi tes, perlu diperhatikan mengenai bahasa yang digunakan dalam
petunjuk pengerjaan soal dan soal-soal itu sendiri juga teknik pengetesan, serta bentuk format
soal. Pada pedoman administrasi, perlu diperhatikan mengenai materi stimulus, prosedur
administrasi, dan cara-cara merespon pertanyaan peserta tes. Kemudian hal-hal yang perlu
diperhatikan dalam pedoman dokumentasi atau interpretasi skor ialah ketersediaan informasi
3
ketika sebuah tes diadaptasi untuk digunakan dalam populasi yang berbeda dokumnetasi
terhadap perubahan-perubahan yang dilakukan harus disertakan juga adanya pemberian saran
mengenai prosedur untuk memperhitungkan efek konteks social-budaya dalam interpretasi
hasil.
Norma merupakan rata-rata atau kekhasan pada tes tertentu yang dibuat berdasarkan
spesifikasi populasi, Misalnya rata-rata skore test intelegensi pada kelompok anak ang
berusia 10 tahun. Ada beberapa karakteristik dari norma, yaitu sebagai berikut.
1. Dalam standarisasi tes psikologi, norma dan distribusi skor dipengaruhi oleh
keterwakilan populasi sampel, yaitu proporsi dari setiap jenis kelamin (laki-laki dan
perempuan), distribusi geografis mereka, status sosial-ekonomi dan distribusi usia
mereka.
2. Dalam merancang tes prestasi pendidikan, faktor-faktor yang mempengaruhi data
normatif, sebagai tambahan dari data sebelumnya, adalah kualitas sekolah dan jenis
kurikulum yang diambila dari standardisasi populasi.
3. Norma-norma tes bakat, seperti menulis atau pekerjaan mekanis, dipengaruhi oleh
standardisasi populasi dari tingkat pengalaman, jenis pekerjaan yang pernah mereka
lakukan dan keterwakilan dari kelompok.
Untuk itu, norma yang telah diperoleh dari beberapa klasifikasi yang hampir sama,
dimaksudkan untuk tujuan yang sama belum tentu bisa dibandingkan. Hal ini dilakukan
untuk mengetahui karakteristik standarisasi dari penduduk sebelum memutuskan norma mana
yang akan dipilih dan digunakan dalam tes. . Informasi ini sangat penting untuk menentukan
apakah instrumen tepat dalam situasi tertentu atau tidak.
Dari pengertian adaptasi dan penormaan tes diatas dapat disimpulkan bahwa kita tidak
bisa begitu saja mengadaptasi alat tes yang berasal dari luar negeri yang masuk kenegara kita,
penyesuaian bahasa, konteks, dan kesetaraan adalah hal yang mendasar yang harus menjadi
perhatian kita dalam mengadaptasi sebuah alat tes. Ketelitian dalam pengadaptasian suatu alat
tes akan membawa kefektifitasan penggunaan nya pada masyarakat di Negara mana yang
menggunakan alat tes tersebut. Kesimpulan dari penormaan sendiri menurut kelompok kami
merujuk pada performa yang dilakukan oleh kelompok yang sudah ditentukan pada test
tertentu. Norma pada sebuah tes didasarkan pada distribusi skor yang diperoleh oleh beberapa
sampel individu yang telah ditentukan.Kapanpun kita disajikan norma sebuah tes, kita harus
menanyakan dulu, bagaimana norma itu diperoleh. Norma diperoleh dengan
mengadminsitrasikan sebuah test kepada sampel orang-orang dan mendapatkan distribusi
skor dari kelompok itu.
4
Pada tahun 1992 Komisi Uji Internasional (International Test Commission
(ITC)) memulai sebuah proyek untuk mempersiapkan pedoman untuk menerjemahkan
dan mengadaptasi tes dan instrument psikologis, dan membangun kesetaraan skor
lintas Bahasa dan / atau kelompok budaya. Beberapa organisasi yang membantu ITC
dalam mempersiapkan pedoman antara lain European Association of Psychological
Assessment, European Test Publisher Group, International Association for Cross-
Cultural Psychology, International Association of Applied Psychology, and
International Association for the Evaluation of Educational Achievement,
International Language Testing Association and International Union of Psychological
Science. Komite dari 12 perwakilan organisasi-organisasi ini bekerja selama beberapa
tahun untuk menyiapkan 22 pedoman, dan kemudian pedoman ini diuji di lapangan.
Kemudian, pedoman ini diakui dan diterima oleh ITC untuk didistribusikan pada
kelompok sosial psikologis nasional, penerbit tes, dan para peneliti. Pedoman ini
disusun dalam empat kategori:
2.2.1 Konteks
Pengaruh perbedaan budaya yang tidak relevan atau tidak penting bagi tujuan
utama dari penelitian harus diminimalkan sejauh mungkin.
Jumlah tumpang tindih dalam konstruk, diukur dengan tes atau instrument
dalam populasi yang diminati harus dinilai.
5
Pengembang/penerbit tes harus memberikan informasi tentang evaluasi
validitas di semua populasi target yang menjadi tujuan versi adaptasi.
Pengembang/penerbit tes harus memberikan bukti statistik kesetaraan
pertanyaan untuk semua populasi yang dituju.
Pertanyaan yang tidak setara antara versi yang ditujukan untuk populasi yang
berbeda tidak boleh digunakan dalam menyiapkan skala umum atau dalam
membandingkan populasi ini. Namun, mungkin akan berguna dalam
meningkatkan validitas konten dari skor yang dilaporkan untuk setiap populasi
secara terpisah.
2.2.3 Administrasi
Pengembang dan administrator tes harus mencoba mengantisipasi jenis
masalah yang tidak dapat diduga, dan mengambil tindakan yang sesuai untuk
memperbaiki masalah tersebut melalui persiapan bahan dan instruksi yang
sesuai.
Administrator harus peka terhadap sejumlah faktor yang terkait dengan bahan
stimulus, prosedur administrasi, dan mode respons yang bisa memoderasi
validitas kesimpulan yang diambil dari skor.
Aspek – aspek lingkungan yang mempengaruhi administrasi tes atau
instrument harus dibuat semirip mungkin dengan populasi yang diminati.
Instruksi administrasi tes harus dalam sumber dan bahasa yang digunakan
target untuk meminimalkan pengaruh dari sumber yang tidak diinginkan dari
seluruh populasi.
Manual tes harus menentukan administrasi yang membutuhkan pengawasan
dalam konteks budaya baru.
Administrator harus tidak mengganggu dan interaksi antara administrator-
peserta harus diminimalkan. Aturan eksplisit yang dijelaskan dalam manual
untuk administrasi harus diikuti.
Ketika suatu tes atau instrument disesuaikan untuk digunakan dalam populasi
lain, dokumentasi perubahan harus disediakan, bersama dengan bukti
kesetaraan.
Perbedaan skor antara sampel populasi yang diberikan tes atau instrument
tidak harus diambil dengan nilai nominal. Peneliti memiliki tanggung jawab
untuk membuktikan perbedaan dengan bukti empiris lainnya.
Perbandingan antar populasi hanya bisa dilakukan pada tingkat invarian yang
telah ditentukan untuk skala dimana skor dilaporkan.
Pengembang tes harus memberikan informasi spesifik tentang cara dimana
konteks sosial-budaya dan ekologis populasi dapat mempengaruhi kinerja, dan
harus menyarankan prosedur untuk memperhitungkan efek ini dalam
interpretasi hasil.
6
Proses adaptasi tes psikologi terjemahan dengan kondisi sosial-budaya tertentu
melibatkan tahapan berikut:
Tahap ini lebih informatif daripada empiris. Dengan cara itu psikolog
melakukan adaptasi memperoleh informasi tentang sifat fenomena psikis yang diteliti
dengan tes masing-masing, yang akibatnya memberi mereka pedoman penting dalam
tahap penerjemahan dan validasi.
2.3.2 Terjemahan indikasi untuk operasi tes, item tes, instruksi, dan nama tes
dalam Bahasa pengguna
Tujuan dari tahap ini adalah penyesuaian kosa kata dan tata bahasa tes dengan
usia dan karakteristik sosial-budaya dari populasi yang akan diterapkan, itulah
sebabnya kondisi penting selama penerjemahan tidak tunduk pada makna literal item,
tetapi oleh isi nosionalnya. Misalnya, perlu untuk mencapai kesetaraan substansial
dan psikologis dengan yang asli daripada kesetaraan semantik.
Persyaratan tentang ketepatan terjemahan ini menegaskan bahwa terjemahan
itu dilakukan bukan oleh satu orang, tetapi oleh sekelompok profesional termasuk
peneliti-psikologis, serta ahli bahasa. Perlu untuk mempersiapkan setidaknya dua
terjemahan oleh tim independen, sementara setelah dilakukan diskusi, versi umum
tercapai. Beberapa psikolog merekomendasikan juga kinerja terjemahan terbalik
dalam bahasa tes asli untuk eliminasi akhirnya terjadi ketidakakuratan.
7
dihilangkan dari tes atau dibuat ulang. Setelah tahap ini, versi terakhir dari tes
tercapai.
Melalui analisis item, tiga karakteristik item dievaluasi, yaitu kesulitan,
kekuatan diskriminatif (diferensial), dan fungsionalitas para pengganggu.
o Kesulitan soal ditentukan melalui analisis persentase distribusi jawaban
tentang item masing-masing;
o Kekuatan diskriminatif (diferensial) menunjukkan sejauh mana item
tersebut membedakan individu dengan prestasi tinggi dari mereka yang
prestasi rendah;
o Fungsionalitas para pengganggu - karakteristik ini juga disebut "daya tarik
alternatif", karena merupakan penilaian kuantitatif dari daya tarik versi
jawaban yang diusulkan; ditentukan dengan menghitung dan menganalisis
persentase individu yang diteliti yang memilih masing-masing alternatif
sebagai jawaban.
2.3.4 Pembentukan versi tes akhir dan evaluasi reliabilitas dan validitasnya
8
Ada beberapa jenis validitas, yaitu: bermakna (jelas); kriteria, yang menurut
jenis kriteria yang dipilih adalah kebetulan, prognostik dan diagnostik; dan validitas
konstruktif, dibagi lagi menjadi konvergen dan diskriminatif.
Paling sering tentang kuesioner psikologis seseorang memverifikasi validitas
konstruktif konvergen. Dan pada evaluasinya perlu untuk melakukan pengujian
paralel terhadap individu yang diteliti dengan tes lain, yang mengukur fenomena
psikis yang sama atau yang terkait erat dengannya. Satu menghitung koefisien
korelasi antara keduanya kutipan dan itu diterima sebagai kriteria untuk validitas tes.
2.3.6 Verifikasi hubungan struktural antara skala yang terdiri dari tes (hanya
tentang multifaktoral kuesioner)
9
variabel yang berbeda, diturunkan secara bertahap. Prosesnya membutuhkan
pembentukan primer dari satu faktor, yang menjelaskan bagian terbesar dari dispersi
variabel awal; kemudian sebuah faktor independen, yang menjelaskan bagian terbesar
dari dispersi yang tersisa, dicari dan seterusnya. Prosedur ini berlangsung hingga
faktor yang baru diturunkan menjelaskan lebih dari satu variabel.
Analisis faktorial adalah metode matematika dan statistik yang kompleks, sulit
diterapkan tanpa kehadiran perangkat lunak statistik khusus. Ini membutuhkan
analisis data dan koefisien dari berbagai prosedur statistik dan melewati beberapa
tahap: verifikasi analitis untuk kecukupan aplikasi metode ini, penentuan jumlah dan
isi faktor-faktor penting; verifikasi reliaabilitas dan pendirian norma tentang masing-
masing faktor turunan.
2.3.7 Elaborasi indikasi metodis untuk penerapan tes dengan membuat manual
(pedoman/panduan)
Panduan tes harus mencakup: deskripsi singkat oleh penulis tentang tujuan dan
penunjukan tes, termasuk konsepsi yang digunakan sebagai dasar untuk
penjabarannya; nomor dan deskripsi dari subskala (jika ada); data tentang
karakteristik psikometrik dari tes; norma berdasarkan usia dan indikator sosial-
demografis lainnya; indikasi pengguna untuk peneliti; instruksi kepada individu yang
diteliti; bentuk tes yang disiapkan.
2.4.1 Validitas
10
-Validitas Internal : Mengukur bagaimana kesesuaian hasil penelitian
dan keadaan yang sebenarnya dalam implementasiannya peniliti
menggunakan instrumen dengan kriteria ilmiah tertentu dalam
pengambilan data.
- Validitas Eksternal : Mengukur bagaimana kesesuaian hasil penelitian
dan keadaan yang sebenarnya dalam implementasinya peneliti akan
dengan cermat menyusun sampling.
2. Validitas Soal
Ukuran yang digunakan untuk menyesuaikan suatu soal dengan
perangkat soal lain. Muatan validitas soal terdapat pada daya pembeda
antar soal, jadi bukan pada tesnya tetapi pada soalnya.
3. Validitas Tes
Mengukur seberapa jauh alat ukur mampu mengukur apa yang diukur.
Terdapat tiga macam dari validitas tes, yaitu :
- Validitas Isi
Lebih menekankan pada isi dari tes/ soal tesnya. Melalui pendapat
profesionl yang telah melalui analisis yang logis dapat diambil
kesimpulan apakah soal tes sudah benar menunjukkan sejauh mana
pertanyaan/tugas dalam suatu tes mencerminkan konten atau materi
yang diujikan.
- Validitas Konstruksi Teoretis
Sejauh mana skor dari hasil pengukuran dapat mencerminkan sifat
teoretis yang menjadi dasar alat ukur tersebut. Dengan kata lain, sejauh
mana isi tes dapat mengukur variabel yang hendak diukur sesuai
dengan definisi konseptual yang telah ditetapkan. Perumusan dari
konstruk sendiri harus berdasar pada teori tentang konsep dari variabel
yang akan diukur. Konstruk tersebut meliputi kecepatan dalam belajar,
bakat dan juga kecemasan. Metode dalam validiasi konstruk adalah :
a. Analisis faktor
Terknik yang digunakan dalam analisis hubuga antara variabel dari
perilakunya dengan tujuan menyederhanakan deskripsi perilaku dengan
mereduksi jumlah kategori dari banyak variabel tes ke beberapa faktor /
sifat umum saja.
b. Konvergen dan Diskriminan
Menurut D.T. Campbell (1960) Konvergen merupakan korelasi
tertinggi antara suatu tes dan variabel teorinya. Diskriminan adalah
tidak adanya hubungan antara tes dengan variabel –variabel yang
secara teori tidak berhubungan.
c. Validitas berdasar Kriteria/ Validitas Empiris
Ukuran Validitas dengan mengukur/ membandingkan skor tes dengan
kinerja tertentu yang kemudian dikorelasikan. Contohnya : korelasi
antara tes intelegensi dengan nilai akademis, apabila seorang anak
memiliki intelegensi yang tinggi, maka nilai akademisnya juga bagus.
11
2.4.2 Reliabilitas
Reliabilitas berasal dari kata reliability artinya sejauh mana hasil suatu
pengukuran dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila
beberapa pengukuran pada kelompok dengan subyek yang sama, diperoleh
dari hasil pengukuran yang relatif sama, selama aspek yang diukur dalam diri
subyek belum berubah.
Nur (1987: 47) menyatakan bahwa reliabilitas ukuran menyangkut
seberapa jauh skor deviasi individu, atau skor-z, relatif konsisten apabila
dilakukan pengulangan pengadministrasian dengan tes yang sama atau tes
yang ekuivalen. Azwar (2003 : 176) menyatakan bahwa reliabilitas merupakan
salah-satu ciri atau karakter utama instrumen pengukuran yang baik. Arifin
(1991: 122) menyatakan bahwa suatu tes dikatakan reliabel jika selalu
memberikan hasil yang sama bila diteskan pada kelompok yang sama pada
waktu atau kesempatan yang berbeda.
Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat
dengan masalah kesalahan pengukuran. Kesalahan pengukuran menunjukkan
bahwa sejauh mana ketidak cocokan hasil pengukuran yang terjadi apabila
pengukuran ulang dilakukan terhadap kelompok dengan subyek yang sama.
Sedangkan konsep reliabilitas dalam arti reliabilitas hasil ukur berkaitan erat
dengan kekeliruan dalam pengambilan sampel yang mengacu pada ketidak
cocokan hasil ukur apabila pengukuran ulang dilakukan pada kelompok yang
berbeda.
Sudjana (2004: 16) menyatakan bahwa reliabilitas alat penilaian adalah
ketepatan atau keajegan alat tersebut dalam menilai apa yang dinilainya.
Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan hasil
yang relatif sama.
Syarat agar hasil dari suatu tes dapat dipercaya adalah tes tersebut
harus memiliki reabilitas yang memadai.Maka dari itu Jaali dan Pudji (2008)
membedakan reabilitas menjadi 2 macam,yaitu :
1. Reabilitas Konsistensi Tanggapan
Reabilitas ini mengenai tanggapan responden terhadap tes tersebut
apakah konsisten atau tidak. Apabila tes tersebut dilakukan pengukuran
kembali terhadap obyek yang sama,apakah hasilnya masih tetap sama
dengan pengukuran sebelumnya.Jika hasil dari pengukuran kedua
menunjukan ketidak konsistenan maka hasil pengukuran tersebut tidak
menggambarkan keadaan objek yang sesungguhnya.
Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden
terhadap tes (Jaali ; 2008) yaitu :
12
Teknik test-retest ialah pengetesan dua kali dengan menggunakan
suatu tes yang sama pada waktu yang berbeda.
Teknik belah dua ialah pengetesan (pengukuran) yang dilakukan
dengan dua kelompok item yang setara pada saat yang sama.
Bentuk ekivalen ialah pengetesan (pengukuran) yang dilakukan dengan
menggunakan dua tes yang dibuat setara kemudian diberikan kepada
responden atau obyek tes dalam waktu yang bersamaan.
Skor dalam tes psikologis pada umumnya diinterpretasikan dengan mengacu pada
norma-norma yang mewakili kinerja tes sampel standarisasi. Norma-norma secara empiris
ditetapkan dengan menentukan apa yang sebenarnya dilakukan oleh sekelompok orang yang
representatif dalam tes. Agar lebih akurat dalam menentukan posisi sebenarnya dengan
mengacu pada sampel standarisasi, skor mentah dikonversikan pada beberapa pengukuran
relatif. Skor turunan ini dirancang untuk digunakan pada tujuan ganda. Pertama, mereka
mengindikasi pendirian relatif individu dalam sampel normatif dan mengijinkan adanya
evaluasi kinerja mengacu pada orang lain. Kedua, mereka menyediakan pengukuran
sebanding yang mengijinkan perbandingan langsung kinerja individu pada tes yang berbeda.
13
Salah satu kegunaan skor tes adalah untuk menunjukkan seberapa jauh
individu telah berkembang menurut jalur perkembangannya.
Usia mental secara luas dipopulerkan melalui berbagai terjemahan dan
adaptasi dari skala Binet-Simon, meskipun Binet sendiri telah menggunkan istilah
yang lebih netral “tingkat mental (mental level).” Padas skala usia seperti pada Binet
dan revisinya, item-item dikelompokkan menurut tingkat usia. Contoh item yang
berhasil dilalui oleh mayoritas berusia 7 tahun pada sampel standarisasinya
ditempatkan pada tingkat usia 7 tahun, dan yang berhasil dilampaui oleh meyoritas
berusia 8 tahun ditempatkan pada tingkat usia 8 tahun, dan seterusnya. Harus
diperhatikan bahwa unit usia mental tidak selalu konstan dengan usia, tetapi
cenderung menurun dengan bertambahnya usia. Seperti perkembangan usia satu tahun
dari usia 3 hingga 4 setara dengan perkembangan 3 tahun dari usia 9 hingga 12 tahun.
Kesetaraan kelas/tingkat. Skor pada tes pencapaian akademik sering di
interpretasikan dalam istilah kesetaraan kelas. Praktik ini dapat dipahami karena tes
tersebut digunakan dalam lingkungan akademik. Norma kelas ditemukan dengan
menghitung rata-rata skor mentah yang diperoleh anak-anak pada setiap kelas.
Meskipun populer, norma kelas memiliki beberapa kekurangan. Yang pertama
adalah konten/isi dari instruksi agak bervariasi dari kelas ke kelas. Karenanya, norma
kelas hanya sesuai untuk mata pelajaran umum yang diajarkan di seluruh tingkat
kealas yang dicakup oleh tes. Umumnya tidak berlaku pada tingkat sekolah
menengah, di mana banya mata pelajaran yang hanya dipelajari dalam satu atau dua
tahun saja. Dengan kata lain, unit kelas jelas tidak setara dan ketidaksetaraan ini
terjadi secara tidak menentu pada subyek yang berbeda.
Norma kelas juga dapat menjadi subyyek salah tafsir, kecuali jika pengguna
tes tetap mengingat bagaimana cara norma tersebut diturunkan.
Skala ordinal. Pendekatan lain pada norma perkembangan diturunkan dari
riset terhadap psikologi anak. Observasi secara empiris pada perkembangan perilaku
bayi dan anak kecil mengarahkan pada penjelasan perilaku khas usia berturut-turut
dalam fungsi seperti penggerak, sensori, diskriminasi, komunikasi linguistik, dan
pembentukan konsep. Penggunaan istilah “skala ordinal” memiliki bentuk ang
berbeda dengan yang ada pada statistic, di mana sebuah skala ordinal adalah salah
satu yang memungkinkan ururtan peringkat individu tanpa pengetahuan tentang
jumlah perbedaan antara mereka; dalam arti statistik skala ordinal dikontraskan
dengan skala interval unit yang sama.
Hampir semua tes memiliki norma dalam kelompok, dengan norma seperti ini,
kinerja individu dievalusi bedasar kinerja kelompok terstandarisasi yang paling bisa
dibandingkan, seperti ketika membandingkan skor mentah seorang anak dengan skor
mentah anak-anak yang punya usia sama, atau dalam sekolah (kelas). Skor kelompok
memiliki arti kuantitatif yang seragam dan terdefinisikan dengan jelas. Dan dapat
digunakan dengan cukup memadai kebanyakan jenis analisis statistik.
14
Persentil. Skor persentil dinyatakan dalam persentase seseorang dalam sampel
standarisasi yang berada dibawah skor mentah yang diberikan. Misal, jika 28 persen
orang mendapatkan benar lebih sedikit dari total 15 permasalahan dalam tes
permasalahan aritmetika, maka skor mentah dari 15 koresponden pada persentil ke 28
(P28). Sebuah persentil mengidikasikan posisi relatif individu pada sampel
standarisasi. Persentil ke 50 (P50) dikenal sebagai median, sedangkan persentil ke 25
dan 75 dikenal sebagai poin kuartil pertama dan ketiga (Q1 dan Q3).
Skor standar. Tes masa kini meningkatkan penggunaan skor standar, yang
merupakan jenis skor turunan paling memuaskan dari sebagian besar sudut pandang.
Skor standar menunjukkan jarak individu dari rata-rata dalam hal distribusi standar
deviasi. Skor standar bisa didapatkan baik dengan transformasi linear maupun
nonlinear dari skor mentah asli.
Penurunan linier skor standar seringkali disebut dengan “skor standar” atau “z
scores (skor z).”
Perbandingan minat. IQ atau skor lain, harus selalu disertai dengan nama tes
yang diperolehnya. Skor tes tidak dapat ditafsirkan dengan benar dalam abstrak; harus
dirujuk pada tes tertentu. Sama halnya, kedudukan relatif seorang individu dalam
fungsi yang berbeda dapat secara keliru disalahartikan karena kurangnya
komparabilitas norma-norma tes.
Sampel normatif. Norma apa pun, diungkapkan sebagaimana pun, terbatas
pada populasi normative tertentu daari mana ia berasal. Dalam terminology statistic,
perbedaan dibuat antara sampel dan populasi. Pada pengembangan dan aplikasi norma
tes, perhatian yang cukup besar harus diberikan pada sampel standarisasi. Mengaitkan
15
erat dengan pertanyaan keterwakilan sampel, adalah kebutuhan untuk mendefinisikan
populasi spesifik di mana norma berlaku.
Norma spesifik. Pendekatan lain pada ketidakseimbangan antar norma yang
ada – dan kemungkinan yang lebih realistis untuk sebagian besar tes – adalah untuk
menstandarkan tes pada populasi yang didefinisikan secara lebih sempit, sehingga
dipilih sesuai dengan tujuan spesifik dari setiap tes. Disebutkan bahwa peru juga
dibuat norma local, seringkali dikembangkan oleh pengguna tes sendiri dalam suatu
setting/keadaan tertentu.
Referensi tetap kelompok. Meskipun sebagian besar skor turunan dihitung
sedemikian rupa untuk memberikan interpretasi normatif langsung dari kinerja tes,
ada beberapa pengecualian penting. Satu jenis skala non-normatif menggunakan
referensi tetap kelompok untuk memastikan komparabilitas dan
keberlanjutan/kontinuitas skor, tanpa memberikan evaluasi kinerja normatif. Dengan
skala yang seperti itu, interpretasi normatif memerlukan referensi untuk secara
mandiri mengumpulkan norma dari populasi yang cocok. Norma lokal atau norma
spesifik lain seringkali digunakan untuk tujuan ini.
Bab III
Penutup
3.1 Kesimpulan
16
Terjemahan dan adaptasi tindakan psikologis dari bahasa Inggris ke bahasa lain saat
ini merupakan aktivitas yang meluas. Upaya ini membutuhkan sensitivitas bahasa dan
budaya. Dalam beberapa tahun terakhir, beberapa tindakan hanya diterjemahkan secara
bahasa. Penyesuaian ukuran perbedaan budaya seperti dikesampingkan. Dalam beberapa
kasus, langkah-langkah tersebut harus dilakukan, karena isu adaptasi budaya dapat
menyulitkan untuk menerjemahkan dan menggunakan item dari keseluruhan tindakan secara
tepat. Langkah-langkah yang direkomendasikan untuk tindakan adaptasi akan membantu
memastikan penggunaan yang tepat dari tindakan yang disesuaikan.
DAFTAR PUSTAKA
Anastasi, A. (1976). Psychological Testing fourth edition. New York: Macmillan Publishing
Co., Inc.
Arifin, Z. (1991). Evaluasi Instruksional. Bandung: PT. Remaja Rosdakarya.
Arikunto, S. (2010). Dasar-Dasar Evaluasi Pendidikan. Yogyakarta: Bumi Aksara.
Djali, & Muljono, P. (2008). Pengukuran Dalam Bidang Pendidikan. Jakarta: PT. Gramedia.
International Test Commission. (2010). International Test Commission Guidlines for
Translating and Adapting Tests. ITC Guidlines, 1-5.
Matondang, Z. (2009). Validitas dan Reliabilitas Suatu Instrumen Penelitian. Jurnal
Tabularasa PPS UNIMED, Vol. 6, No. 1, 87-97.
17
Nursalam. (2003). Konsep & Penerapan Metodologi Penelitian Ilmu Keperawatan:
Pedoman Skripsi, Tesis, dan Instrumen Penelitian Keperawatan. Jakarta: Salemba
Medika.
Peneva, I., Yordzhev, K., & Ali, A. S. (2013). The Adaptation of Translation Psychological
Test as a Necessary Condition for Ensuring the Reliability of Scientific Research.
International Journal of Engineering Science and Innovative Technology (IJESIT),
Vol. 2, No. 4, 557-560.
Rochmad. (2011). Model Pengembangan Perangkat Pembelajaran Matematika. Semarang:
UNNES.
Sudjana, D. (2004). Manajemen Program Pendidikan Untuk Pendidikan Nonformal dan
Pengembangan Sumber Daya Manusia. Bandung: Falah Production.
Sukadji, S. (2000). Menyusun dan Mengevaluasi Laporan Penelitian. Jakarta: UI-Press.
Suwartono, C. (2016). Alat Tes Psikologi Konteks Indonesia : Tantangan Psikologi di Era
MEA. Jurnal Psikologi Ulayat, Vol. 3, No. 1, 1-6.
Yazid, A. (2011). Kevalidan, Kepraktisan, dan Efek Potensial Suatu Bahan Ajar.
Pascasarjana Pendidikan Matematika Universitas Sriwijaya.
18