Anda di halaman 1dari 4

Langkah-langkah umum Konstruksi tes

Dalam melakukan penyusunan kontruksi tes terdapat sejumlah model yang menjelaskan
langkah-langkah umum penyusunan tes. Memanfaatkan unsur-unsur yang baik dari berbagai model
tersebut, langkah-langkah umum penyusunan kontruksi tes yaitu: 1) mendefinisikan tes, 2)
menyusun tabel spesifikasi tes, 3 atau memilih metode penskalaan, 4 ) menyusun item-item, 5)
memintakan review atas item-item dari sejumlah pakar terkait, dan melakukan revisi seperlunya, 6)
merakit item-item menjadi bentuk semifinal tes yang siap diujicobakan, 7) melakukan uji coba
terhadap sampel yang mewakili populasi khalayak yang menjadi sasaran tes, 8) memeriksa ciri-ciri
psikometrik skor-skor item melalui analisis item, melakukan seleksi item: item-item yang bisa
ditetapkan menjadi calon bentuk final skala dan item-item yang masih perlu direvisi atau bahkan
digugurkan, 9) melakukan pemeriksaan reliabilitas, validitas, dan daya diskriminasi bentuk final tes,
10) menyusun manual atau buku pedoman tes dan menerbitkan tes.

1) Mendefenisikan tes

Proses mendefenisikan tes mencakup minimal tiga sublangkah, yaitu:

Langkah pertama yaitumenetapkan khalayak yang akan menjadi sasaran tes. Penentuan khalayak
yang menjadi sasaran tes merupakan bagian langkah perdana dalam upaya mengonstruksi sebuah
tes yang valid. Penetapan uang baik terhadap sasaran tes akan sangat membantu dalam menentukan
antara lain jenis tugas atau stimulus yang dipakai sebagai item-item tes, format item, dan bahasa
atau media lain yang akan digunakan dalam menyusun item.

Langkah kedua yaitu, menetapkan jenis skor yang kan digunakan. Dalam menentukan jenis skor yang
akan digunakan dalam sebuah tes, perlu mempertimbangkan beberapa faktor penting. Pertama,
harus dipertimbangkan berapa komponen psikologis yang dapat diukurnya. Kedua, jika tes hanya
mengukur satu atribut psikologis, perlu dipertimbangkan apakah hasilnya akan dibandingkan dengan
norma kelompok yang bersifat relatif (norm-referenced scoring) atau dengan suatu kriteria yang
bersifat mutlak (criterion-referenced testing) yang telah ditetapkan sebelumnya. Ketiga, jika tes
hanya mengukur satu atribut, penskoran normatif digunakan untuk menunjukkan jumlah atau
kuantitas atribut tersebut secara absolut dalam individu yang diuji.

Dan yang terakhir yaitu merumuskan content domain atau ranah isi tes. Jika ranah isi memiliki
batasan yang jelas, seperti dalam tes prestasi mata pelajaran sekolah, identifikasi isi yang akan diukur
cukup mudah karena dapat ditemukan dalam buku teks yang digunakan. Namun, jika konstruk yang
diukur adalah konstruk teoretis dengan batasan ranah isi yang tidak jelas, diperlukan metode
eksplorasi konstruk. Eksplorasi konstruk melibatkan identifikasi berbagai keyakinan, sikap, atau
perilaku yang dapat mendukung atau menentang keberadaan atribut psikologis yang akan diukur..

2) Menyusun Tabel Spesifikasi Tes

Setelah dilakukannya identifikasi domain konten atribut yang akan diukur hingga ke tingkat
komponennya. Selanjutnya, langkah berikutnya adalah menyusun sebuah tabel spesifikasi tes, yang
juga disebut sebagai table rencana untuk menentukan penekanan relatif yang harus diberikan pada
setiap komponen ini dalam tes. Artinya, tabel spesifikasi atau blueprint tes atau kisi-kisi tes adalah
sejenis panduan atau rencana untuk menentukan sejauh mana setiap komponen harus diberi bobot
dalam tes tersebut, sehingga menghasilkan sebuah tes keseluruhan dengan struktur yang akurat
mencerminkan domain konten konstruk yang sedang diukur.

3) memilih metode penskalaan


pengertian dari pengukuran psikologis yaitu mengasosiasikan bilangan dengan respon yang
diberikan dalam suatu tes untuk mengukur sejauh mana tes tersebut mencerminkan atribut
psikologis yang diukur oleh tes tersebut. Fokus utama penskalaan yaitu adalah menentukan
bagaimana memberikan bilangan pada berbagai respon tes untuk mencerminkan pemilikan atribut
psikologis dalam berbagai tingkat yang berbeda di antara individu yang diuji. Pentingnya penskalaan
terkait erat dengan jenis skala yang digunakan, yaitu nominal, ordinal, interval, atau rasio, yang
menentukan jenis analisis statistik yang sesuai.

4) menyusun item-item

Setelah ditetapkannya metode penskalaan, Langkah berikutnya dalam penyusunan tes yaitu
melakukan item writing( menysun item-item). Dalam penyususnan item-item yang digunkan
terdahap 2 tahapan yang penting .Tahap pertama yaitu tahap menyusun item pool untuk tes. Item
pool merupakan stock item dari mana item-item untuk bentuk final tesnya akan diambil. Jumlah item
yang terbentuk pada saat final tes ini ditentukan content domain dari konstruk yang diukur dan
khalayak yang akan menjadi kelompok sasaran tes. Tahap kedua yaitu tahap pilihan jenis skala yang
akan menentukan format item yang sesuai.

5) Review Atas Item-Item serta Revisi Item-item

Proses penyusunan item-item dalam tabel spesifikasi dan pedoman penulisan adalah bahwa
setelah item-item berhasil disusun, langkah selanjutnya adalah meminta review dari nara sumber
terkait. Review ini mencakup aspek ketepatan, relevansi, kesalahan teknis, tata bahasa, pilihan kata,
dan kesulitan bahasa dalam item-item. Ada dua saran praktis yang perlu dikemukakan pada tahapan
ini yaitu, Pertama,yaitu untuk memudahkan para narasumber melakukan review atau telaah,
sebaiknya draft item pool disajikan secara sistematis mengikuti pembagian baik kisi content maupun
kisi prosesnya sesuai tabel spesifikasi dan juga draft lengkap rancangan tes mulai dari definisi sampai
dengan tabel spesifikasi sebaiknya juga disertakan. Kedua, yaitu dapat mengikutsertakan narasumber
atau pakar untuk mendiskusikan terkait item yang dijukan Semua masukan dari narasumber harus
diterima dengan baik dan digunakan untuk melakukan perbaikan atau revisi terhadap draft item
pool. Sikap terbuka terhadap masukan kritis dari nara sumber sangat penting untuk memastikan
kualitas item tes yang lebih baik.

6) Merakit Item

Merakit item dilakukan setelah diperoleh item pool yaang secara konseptual dipandang sudah
memenuhi standar kualitas yang diharapkan. Tujuan dari merakit item yaitu agar item-item tersebut
menjadi bentuk semifinal tes yang siap untuk diuji-cobakan baik dalam skala kecil maupun besar.
Terdapat 2 tahapan dalam merakit Item

Tahapan pertama yaitu pemberian petunjuk pengerjaan tes. Petunjuk di dalam penggunaan
tes terbagi atas tiga bagian yaitu petunjuk umum yang disajikan diawal tes, petunjuk pengerjaan item
secara keseluruhan dan petunjuk khusus dalam menjawab item tertentu. Dalam petunjuk umum
pengerjaan tes, harus memuat beberapa konten yaitu informasi tentang tujuan tes, tugas yang harus
dikerjakan dalam tes, termasuk jumlah item dan waktu yang tersedia, cara menjawab item, sikap
yang harus dilakukan saat mengerjakan tes, kewajiban peserta dalam mengerjakan tes, dan
informasi terkait dari dampak hasil tes pada kehidupan peserta.

Tahapan kedua yaitu perakitan item menjadi bentuk semifinal tes. langkah ini mengalami
sebuah kendala yaitu tentang bagaimana cara terbaik untuk mengurutkan item-item sehingga
membentuk bentuk semi-final tes yang siap diuji. Secara umum, persoalan-persoalan tersebut akan
berkisar pada sejumlah pertanyaan seperti apakah item-item akan dikelompokkan per komponen?
apakah item-item akan dikelompokkan per format item? apakah item-item perlu diurutkan
mengikuti sistematika tertentu, misal taraf kesukarannya? Dan apakah item-item tersebut secara
keseluruhan akan langsung diurutkan secara acak.

7) Melakukan Uji Coba

Hasil dari rakitan semifinal item yang dilakukan sebelumnya perlu diuji agar dapat layak digunkan.
Proses pengujian pada rakitan semifinal tersebut terjadi dalam 2 tahapan, yaitu dengan uji coba
dengan sampel kecil (uji coba pendahuluan) kemudian dilanjutkan dengan uji coba dengan sampel
besar (uji coba sebenarnya).

Uji coba pendahuluan merupakan coba yang dilakuakan untuk mendapatkan masukan awal.
Uji coba pendahuluan ini disarankan dilaksanakan pada pada kelompok kecil sekitar 15-30 orang dan
dilakukan secara informal, agar pengaturan waktu yang dilakukan lebih longgar. Jenis masukan yang
ingin dikumpulkan pada uji coba pendahuluan terdiri dari efektifitas petunjuk pengerjaan tes,
efektifitas item-item dalam tes, rata-rata waktu yang digunkan dalam tes dan respon terhadap
keefektifitasan masing-masing item.

Uji coba sesungguhnya merupakan bentuk dari final tes terhadap item pool yang sudah
disempurnakan. Pada uji sesungguhnya ini dilaksankan dalam kelompok yang lebih besar dengan
kisaran 50-200 orang. Tujuan dari Langkah ini yaitu untuk mendapatkan mendapatkan sebuah tes
dengan durasi yang minimal namun mampu menghasilkan pengukuran dengan taraf reliabilitas dan
validitas yang memadai sesuai tujuannya..

8) Analisis Item

Analisis item adalah proses evaluasi dan pemeriksaan terhadap setiap item. Tujuan utama analisis
item adalah untuk memeriksa karakteristik statistik respon peserta tes pada setiap item dalam uji
coba sesungguhnya. Hal ini dilakukan untuk keperluan seleksi item, yakni menentukan item-item
mana yang langsung dapat dimasukkan ke dalam bentuk tes akhir, mana yang perlu direvisi dan diuji
ulang sebelum dimasukkan, serta mana yang harus dihapus karena karakteristik statistiknya tidak
memenuhi syarat.

9) Memeriksa Reliabilitas, Validitas, & Daya Diskriminasi

Setelah mendapatkan kumpulan item sesuai dengan rencana untuk menjadi bentuk tes akhir,
langkah terakhir yaitu memastikan bahwa tes akhir tersebut benar-benar memberikan pengukuran
yang dapat diinterpretasikan sebagai mencerminkan kepemilikan atribut psikologis pada tingkat
tertentu sesuai yang dimaksud. Hal ini biasanya dilakukan dengan mengumpulkan bukti tentang
reliabilitas, validitas, dan daya pembeda dari seluruh item dalam bentuk tes akhir tersebut.

Reliabilitas adalah ukuran ketepatan pengukuran, yang mencakup konsistensi dan stabilitas.
Reliabilitas dianggap memadai jika koefisien reliabilitas mencapai 0,70 atau lebih, di bawah angka ini,
tes dianggap kurang memadai untuk digunakan pada tingkat individual karena kesalahan pengukuran
yang signifikan. Meskipun reliabilitas merupakan syarat penting untuk tes yang baik, tes yang benar-
benar baik harus juga memiliki validitas yang baik, yaitu mampu mengukur apa yang dimaksudkan
dengan akurat.

validitas adalah taraf sejauh mana penafsiran terhadap hasil suatu tes sebagaimana
dimaksudkan oleh tes yang bersangkutan sungguh-sungguh dapat dipertanggungjawabkan.
Pertanggungjawaban ini memerlukan pengumpulan berbagai bukti atau evidensi dari berbagai aspek
tes yang melibatkan proses jangka panjang, berkesinambungan, dan kumulatif. Ada lima jenis
evidensi yang perlu dikumpulkan untuk memeriksa validitas tes: yaitu

1) Evidensi terkait isi tes, yang mencakup relevansi isi item dengan konstruk yang diukur.
2) Evidensi terkait proses respon testi, yang melibatkan pemeriksaan respon testi dan
menghindari pengaruh response sets.
3) Evidensi terkait struktur internal tes, yang menilai konsistensi internal atau homogenitas tes.
4) Evidensi terkait hubungan antara tes yang sedang dibuat dengan tes atau tingkah laku lain
sebagai kriteria eksternal.
5) Evidensi terkait konsekuensi atau dampak dari penerapan tes, yang bisa dibedakan menjadi
dampak yang direncanakan dan yang tidak direncanakan.

Pengumpulan evidensi ini melibatkan berbagai langkah dalam penyusunan tes, seperti pendefinisan
ranah isi tes, analisis item, analisis faktor konfirmatori, teknik DIF, pemeriksaan efektivitas tes dalam
memprediksi kriterianya, metode multitrait-multimethod, dan group-comparison studies.

Daya diskriminasi merupakan sebuah konsep yang digunakan dalam konteks pengukuran
atau penilaian. Ini mengacu pada kemampuan suatu alat ukur untuk membedakan antara dua atau
lebih konstruk atau variabel yang seharusnya berbeda satu sama lain.

10) Menyusun Manual & Menerbitkan Tes

Sesudah diperoleh bentuk final tes yang kurang lebih memuaskan, langkah terakhir adalah
menyusun manual tes dan menerbitkan tes tersebut beserta manualnya. Manual merupkan
pedoman tentang tes sebagai supporting documentation atau dokumen pendukung berfungsi
penting sebagai media bagi penyusun, penerbit, dan distributor tes untuk mengkomunikasikan
perihal tes tersebut kepada para pemakai tes. Manual menjadi pendukung tes bertujuan
memberikan informasi yang diperlukan kepada para pemakai tes agar memiliki penilaian yang tepat
tentang seluk-beluk dan kualitas tes, skor-skor yang dihasilkan, serta cara merumuskan penafsiran
hasil tes berdasarkan skor-skor. Manual yang baik harus memenuhi kriteria lengkap, tepat, tidak basi,
dan jelas

Anda mungkin juga menyukai