Disusun Oleh:
Agus Mianta, S.Si
NIM. 13708259007
bahwa
penilaian
benar-benar
sesuai
dengan
tujuan
membaca sekolah. Skor dari uji hipotesis mungkin memiliki tingkat validitas yang
tinggi untuk salah satu tujuan tetapi mungkin tidak untuk tujuan yang lain.
Ketika mendiskusikan validitas penilaian hasil, perlu diingat hal-hal berikut:
1. Konsep validitas berlaku untuk cara kita menafsirkan dan menggunakan
hasil penilaian, bukan prosedur penilaian itu sendiri. Dengan demikian,
kita mungkin tidak mengatakan, "Apakah Test Membaca ABC valid?"
kecuali sebagai cara singkat berbicara tidak formal. Sebaliknya, kita harus
mengajukan pertanyaan yang lebih spesifik seperti, "Apakah valid untuk
menafsirkan skor dari Tes Membaca ABC untuk mengukur pemahaman
bacaan? " atau " Apakah berlaku untuk menggunakan nilai Tes Membaca
ABC untuk menempatkan siswa dalam kelompok membaca?"dan
seterusnya.
2. Hasil penilaian memiliki derajat validitas berbeda untuk tujuan yang
berbeda dan untuk situasi yang berbeda. Skor dari hipotetis Tes Memabaca
ABC misalnya, mungkin sangat valid bila digunakan untuk mengevaluasi
program membaca sekolah di suatu daerah karena itemnya cocok dengan
tujuan program membaca kabupaten yang baik. Di sisi lain, skor dari tes
yang sama mungkin memiliki validitas yang jelek untuk mengevaluasi
program membaca kabupaten lain karena item sesuai dengan yang tujuan
program membaca kabupaten tersebut kurang baik.
3. Membuat penilaian tentang validitas interpretasi atau penggunaan hasil
penilaian hanya setelah mempelajari dan menggabungkan beberapa jenis
bukti validitas. Sebagai contoh, sebelum sampai pada sebuah kesimpulan
tentang validitas interpretasi yang diajukan atau menggunakan skor
Membaca Uji ABC, dikumpulkan bukti tentang beberapa aspek yang
relevan dari seberapa baik sampel domain membaca. Apakah keterampilan
yang dinilai mewakili ketepatan membaca "sebenarnya" ? Apakah skor
dipengaruhi oleh faktor-faktor yang tidak relevan seperti suasana hati
siswa atau motivasi mereka untuk diuji? Seberapa dekat keteapatan
melakukan uji keterampilan membaca suatu sekolah? Apakah skor
terpercaya?
memvalidasi penggunaan lebih lanjut dari nilai tes yang didasarkan pada asumsi
pengukuran kemampuan membaca pemahaman.
Nilai yang tepat
Interpretasi hasil penilaian siswa muncul dari nilai-nilai pendidikan dan
sosial. Apa Nilai-nilai tersirat ketika staf Lincoln School menafsirkan skor tes
membaca
ABC
Hiram
sebagai
mengukur
pemahaman
membaca
dan
membaca
yang
berbeda
menunjukkan
bahwa
mereka
nilai
menggunakan
skor.
Ini
menggambarkan
bahwa
Anda
harus
yang
Anda
lakukan
memiliki
konsekuensi.
Anda
harus
1.
2.
3.
4.
pertama waktu pengujian untuk mencoba untuk mengajarkan konsepkonsep ini dan kemudian memberi tes. Tentu saja, penilaian ini tidak hanya
kurang valid tetapi membuat frustrasi siswa.
2. Apakah tugas penilaian saya secara akurat mewakili hasil-hasil yang
ditentukan di sekolah saya dan kerangka kurikulum negara? Nilai siswa
akan dicatat dan akhirnya akan ditafsirkan oleh orang-orang yang telah
melihat kurikulum tetapi yang tidak akrab dengan apa yang Anda ajarkan
di kelas tersebut. Mereka akan mengharapkan nilai untuk mencerminkan
target pembelajaran kabupaten dan standar negara. Karena nilai didasarkan
pada penilaian Anda,
pembelajaran.
3. Apakah penilaian tugas sesuai dengan arus berpikir tentang apa yang harus
diajarkan dan bagaimana seharusnya dinilai? Pendidik, filsuf, ahli teori
kurikulum, peneliti, dan lain-lain terus-menerus mendefinisikan ulang apa
yang yang dimaksud belajar. Guru profesional terus mengikuti
perkembangan ini dan menerapkannya dalam pengajaran dan penilaian.
4. Apakah konten dalam penilaian saya penting dan perlu untuk dipelajari?
konten termasuk dalam penilaian belajar harus bernilai besar atau
signifikansi untuk kehidupan lanjut keterampilan siswa. Kurikulum dan
konten Anda mengajar mengandung banyak spesifikasi. Pastikan bahwa
konten yang dinilai berhubungan langsung kepada target pembelajaran
siswa.
Kebanyakan penilaian belajar melibatkan siswa dalam menerapkan
kombinasi keterampilan dan konten daripada menggunakan keterampilan
atau menghafal konten. Pengajaran dan penilaian oleh karena itu juga
harus memerlukan siswa untuk menerapkan beberapa aspek pengetahuan,
keterampilan.
Representasi Proses Berpikir dan Keterampilan
10
Anda
harus
mengumpulkan
informasi
tentang
11
12
15
berbagai
kelompok
untuk
mewakili
keragaman
masyarakat
dan
pandangan.
16. Apakah penilaian relatif mudah dan tidak terlalu rumit untuk digunakan
mengevaluasi siswa? Ada kesenjangan antara bagaimana mudahnya untuk
membuat tugas penilaian dan betapa mudahnya untuk mendapatkan
peringkat kualitas atau nilai. Hal ini mudah untuk mengembangkan
pertanyaan esai, daripada mengembangkan tugas kinerja pemecahan
masalah kompleks atau soal pilihan ganda. Namun setelah dikembangkan,
item pilihan ganda lebih mudah untuk mendapatkan skor dan digunakan
kembali untuk kelas tahun berikutnya.
17. Apakah waktu yang dibutuhkan untuk penilaian menjadi lebih baik
dihabiskan
langsung
dengan
mengajar
siswa?
Penilaian
terbaik
17
dan
lembaga
yang
menghasilkan
penilaian
lainnya
validitas hasil. Guru memiliki peluang dan sumber daya paling sedikit;
administrator sekolah tingkat kabupaten dan tingkat nasional memiliki
peluang lebih. Fakta ini tidak membiarkan guru dengan sumber daya
yang lebih sedikit untuk tidak memvalidasi interpretasi hasil penilaian
yang digunakan. Ada kewajiban profesional untuk mengangkat isu-isu
tentang validitas penilaian yang digunakan dan untuk membantu dalam
membangun validitas mereka.
VALIDITAS DIDUKUNG OLEH BUKTI
Ahli pengukuran merekomendasikan bahwa validitas digunakan
sebagai konsep kesatuan (Amerika Educational Research Association).
Buku ini mengikuti rekomendasi tersebut, dengan demikian, Anda
harus berpikir jenis bukti yang mendukung validitas penilaian.
Jenis bukti
3. Hubungan antara
a. Apakah semua penilaian tugas kerja sama sehingga setiap
penilaian tugas atau
tugas memberikan kontribusi positif terhadap penilaian
bagian penilaian
kualitas pembelajaran?
(disebut bukti
b. Jika bagian yang berbeda dari prosedur penilaian yang
struktur lnternal)
seharusnya memberikan keterangan yang unik, lakukan
hasil yang mendukung keunikan ini?
c. Jika bagian yang berbeda dari prosedur penilaian yang
19
Memper
harus d
untuk m
dan has
relevans
penilaia
keterwa
seluruh
Mengan
mengun
dibutuhk
sukses.
diajarka
Siswa
melakuk
dihasilk
berpikir
keseluru
diingink
relevan
a. Men
total
semu
b. Skor
berko
hubu
c. Men
20
a.
b.
c.
d.
dan p
untuk
terma
yang
Mela
dan
meny
Tuga
karak
Band
kriter
Men
predi
Men
meny
dari
ketik
siswa
diskr
Melakuk
(reliabil
a. Guna
peng
baga
berub
jenis
deng
b. Mela
eksp
mem
a. Mela
hasil
penil
mana
b. Mela
konsekuensial)
21
diant
telah
prose
terten
Analisis
data uji
keputus
keprakti
hasil
penilaian
adalah
valid.
Pendekatan
untuk
validitas
bukti terhadap
22
5. Skor tes penempatan dapat diandalkan (yaitu, skor siswa yang konsisten di
berbagai sampel item tes, Cara pengujian yang berbeda, dan orang berbeda
yang melakukan tes).
6. Hal ini tidak akan membantu siswa dengan kemampuan tinggi dalam aljabar
untuk mengambil kursus aljabar remedial (yaitu, siswa yang mendapat skor
tinggi pada tes penempatan tidak akan secara signifikan meningkatkan peluang
keberhasilan dalam kalkulus dengan terlebih dahulu mengambil kursus aljabar
perbaikan).
7. Nilai tes penempatan tidak terpengaruh oleh sistematika kesalahan yang akan
menurunkan validitas penafsiran tes penempatan pengetahuan aljabar dan
kemampuan berpikir.
Konten Keterwakilan dan Relevansi:
Bukti keterwakilan konten dan relevansi berlaku untuk segala macam
penilaian: tes prestasi, tes bakat, tes kepribadian, observasi kinerja guru-siswa,
penilaian kinerja, dan sebagainya. Bagian ini berfokus terutama pada tes prestasi
skala besar.
Definisi ranah seperti ditunjukkan dalam Gambar 3.2, jenis bukti berasal
dari menilai konten tugas atau item instrumen. Bukti konten keterwakilan
penilaian datang dari penilaian informasi yang berfokus pada tugas penilaian
adalah perwakilan sampel dari ranah yang lebih besar. Penilaian hanyalah sebuah
contoh dari item yang bisa disampaikan kepada siswa. Karena mungkin kita tidak
bisa hadir dalam setiap tugas untuk siswa, kita harus mengambil sampel dari ranah
sedemikian rupa sehingga sampel cukup mewakili domain. Bukti konten relevansi
penilaian berasal dari penilaian yang fokus pada berapa banyak definisi domain
pengguna tes.
Satu pertanyaan yang muncul adalah apakah definisi domain sesuai:
penilaian pengembangan atau penilaian penggunaan? Misalnya Tes Membaca
ABC, mungkin menekankan kosakata dan membaca kalimat tetapi tidak mungkin
terpisah mengukur keterampilan membaca kata atau kosa kata. Petugas sekolah
memilih tes membaca dapat melihat kedua hal tersebut relevan dengan definisi
domain membaca. Apabila pengembang tes dan pengguna tes tidak setuju pada
definisi domain maka penilaian tidak dimasukkan. Membuat penilaian tersendiri
tentang bagaimana baik tugas-tugas pada penilaian mewakili (a) domain
pengembang dan (b) pengguna akan mengklarifikasi apakah domain bukti
23
membantu
nilai
rata-rata
siswa
sekolah,
tunggu
sampai
mereka
dapat diperkirakan dari kinerja mereka saat ini pada instrumen penilaian. Sebagai
contoh, siswa belajar sudah di perguruan tinggi, memberi mereka khusus tes
bakat, dan mengumpulkan kelas mereka nilai rata-rata saat ini. Hubungan antara
nilai dan bukti validitas tes konkuren karena dua langkah dikumpulkan pada
waktu yang sama. Perbedaan ini penting karena interval waktu antara pemberian
instrumen penilaian dan mendapatkan kriteria hasil mempengaruhi kekuatan
hubungan antara dua hasil: Biasanya semakin lama interval waktu antara dua
hasil, semakin rendah korelasi antara mereka.
Koefisien korelasi
Koefisien korelasi merupakan indeks statistik yang mengkuantifikasi
tingkat hubungan antar skor dari satu penilaian dan nilai dari lain. Indeks ini
dilaporkan pada skala -1 sampai +1. (Bagian ini berfokus pada konsep.
Perhitungan yang diilustrasikan dalam Lampiran I.)
Skor siswa pada tes yang berbeda. Contoh yang menunjukkan hubungan
antara skor dari beberapa tes akan membantu menjelaskan korelasi. Contoh pada
Gambar 3.4 menunjukkan nilai dari 11 siswa pada masing-masing tes. Para siswa
telah diatur dalam urutan menurun menurut mereka skor bakat verbal (l).
Hubungan antara skor verbal dan aritmatika (A) kurang kuat: Urutan siswa pada
tes ini tidak sama seperti pada tes verbal dan membaca.
Gambar 3.4 Hypolhetical skor untuk 11 murid pada bakat lisan menguji bacaan
tes, dan tes aritmatika. Sumber: Diadaptasi dari Mengukur Prestasi dan Bakat
Siswa, C. M. Lindvall dan A. J. Nitko. 2nd ed. New York: Harcourt Brace
Jovanovich, @ 1975 oleh C. M. Lindvall A. J. Nitko
29
30
32
bentuk distribusi pada dua penilaian sama, dan (e) interval waktu antara
pemberian dua penilaian singkat. Gambar 3,8 meringkas faktor-faktor ini dan
memberikan contoh masing-masing. Seringkali lebih dari satu faktor-faktor ini
beroperasi pada waktu yang sama. Membaca bukti korelasional laporan harus
hati-hati, mengingat faktor-faktor ini sebagai kemungkinan menjelaskan nilai
numerik korelasi yang ditafsirkan.
Koefisien Validitas
Prosedur biasa ketika mengumpulkan input bukti validasi atau bersamaan
adalah untuk menghitung korelasi antara nilai dari instrumen penilaian dan kriteria
nilai. Korelasi tersebut kadang-kadang disebut sebagai koefisien validitas,
meskipun, karena Anda dapat dengan mudah melihat dari gambar 3.6, satu nomor
tepat untuk menilai validitas hasil penilaian. Dalam situasi pilihan Koefisien
validitas yang tinggi biasanya adalah bukti kuat bahwa seleksi berguna untuk
memilih orang-orang yang akan berhasil. Ini karena korelasi yang tinggi
merupakan bukti bahwa prediksi keberhasilan akan cukup akurat.
Faktor
Kesamaan ciri-ciri
Reliabilitas skor
Jangkauan
penyebaran skor
35
Tabel Harapan
Cara lain untuk menampilkan validitas prediktif data adalah membuat tabel
harapan. Tabel harapan adalah grid atau dua arah yang memungkinkan prediksi
tentang seberapa besar kemungkinan untuk orang tertentu dengan hasil penilaian
untuk mencapai tingkat skor kriteria. Gambar 3.9 menggambarkan bagaimana
sebuah tabel harapan dikembangkan untuk menunjukkan probabilitas bahwa siswa
pada bakat tertentu akan mencapai tingkat skor masing-masing kelas dalam suatu
kursus.
Pertama tabel dibuat, seperti pada Gambar .9 (A), di mana setiap sel
mengandung jumlah orang dengan skor tertentu yang mencapai masing-masing
grade (tingkat skor kriteria). Sebagai contoh, 15 siswa memiliki skor tes bakat
antara 60 dan 69. Nomor ini ditampilkan dalam margin baris kanan dari 60-69.
Tiga dari 15 ini mencapai kursus kelas D, 5 kelas C, 6 kelas B, dan 1 kelas A.
Kedua, masing-masing frekuensi sel pada Gambar 3.9 (A) dibagi dengan
total baris yang sesuai, dikonversi untuk persentase dan dimasukkan ke dalam
tabel harapan seperti Gambar 3.9 (B). Persentase ini diartikan sebagai probabilitas
atau kemungkinan dari 100 sampai menjawab pertanyaan-pertanyaan seperti, "Di
sekolah ini, apa yang probabilitas seseorang dengan tes bakat skor 65 akan
berhasil dalam kursus ini? "Pertama, catatan bahwa orang dengan skor 65
merupakan anggota dari kelompok yang nilainya antara 60 dan 69. Kedua, jika
kita mendefinisikan sukses berarti nilai C atau lebih baik, kemudian 33% + 40% +
36
7% = 80% dari siswa dengan skor bakat antara 60 dan 69 berhasil. Karena orang
dengan skor bakat dari 65 adalah anggota kelompok ini, jawaban atas pertanyaan
adalah, "seseorang dengan skor bakat dari 65 memiliki 80% kesempatan untuk
menjadi sukses dalam kursus ini.
Tabel harapan dapat membantu orang tua dan siswa menginterpretasikan
hasil penilaian. Misalnya, tabel harapan dibuat perguruan tinggi untuk
menunjukkan bagaimana nilai tes penerimaan yang terkait dengan indeks prestasi
rata-rata tahun pertama mahasiswa.
Jika Anda menginterpretasikan hasil penilaian menggunakan tabel harapan,
Anda harus memperhatikan beberapa pertimbangan. Sebagai contoh, instrumen
penilaian yang digunakan untuk memprediksi keberhasilan jarang memperhatikan
ukuran inisiatif siswa, ketekunan, atau motivasi.
Kriteria
Penilaian Anda tentang apakah penilaian pengembang telah memberikan
validitas bukti yang tepat sebagian bergantung pada apakah penilaian hasil telah
berkorelasi dengan kriteria yang relevan.
Jenis Kriteria
Berbagai kriteria digunakan untuk memberikan bukti validitas. Klasifikasi
personil dan seleksi penelitian di pemerintah dan industri menggunakan empat
jenis kriteria: produksi (kuantitas dan kualitas barang, penjualan), data pribadi
(kecelakaan di pekerjaan, masa kerja, keanggotaan kelompok, nilai pelatihan),
sampel aktual atau simulasi prestasi kerja, dan penilaian oleh orang lain (daftar
periksa, peringkat supervisor). Di bidang pendidikan, kriteria jatuh menjadi tiga
jenis: (1) nilai tes prestasi; (2) peringkat, nilai, dan penilaian kuantitatif lainnya
guru; dan (3) Data karir. Sebuah contoh umum adalah tes kesiapan membaca yang
diberikan pada awal kelas satu. Skor sering divalidasi dengan menghubungkan
mereka dengan skor prestasi membaca (kriteria) diberikan pada akhir.
Menggunakan indeks prestasi rata-rata untuk memvalidasi skor dari tes bakat dan
tes penerimaan. Terkadang peringkat guru dari konsep diri siswa, sosialisasi, dan
sebagainya digunakan sebagai ukuran kriteria.
Menilai Kelayakan Kriteria
Langkah-langkah yang digunakan dalam validitas penelitian dievaluasi
dalam empat bidang: (1) relevansi jangka panjang, (2) tingkat reliabilitas, (3)
37
tingkat bias terhadap individu atau kelompok, dan (a) masalah praktis
ketersediaan dan kemudahan.
Batas Validitas Kriteria Reliabilitas Rendah
Jika hasil memiliki reliabilitass yang rendah akan berkorelasi rendah
dengan langkah-langkah lain daripada jika memiliki reliabilitas yang tinggi.
Bahkan jika instrumen prediksi memiliki reliabilitas yang baik tidak akan mampu
memprediksi skor kriterium yang tidak reliabel.
Kesalahan sistematis
Kesalahan sistematis dalam kriteria pengukuran dapat membawa pada
kesimpulan yang salah tentang validitas skor instrumen tersebut. Misalnya, sebuah
studi validitas skor tes dapat berkorelasi dengan penilaian guru siswa. Jika
penilaian ini mendukung anak laki-laki daripada anak perempuan, atau siswa
dengan keterampilan lisan tinggi atas orang-orang dengan kemampuan verbal
lebih rendah, mungkin tidak mengukur kriteria. Bias sistematis seperti ini
menunjukkan faktor-faktor yang berpengaruh dalam proses validasi "mencemari"
skor kriteria. Dengan demikian, sebelum menerima hasil korelasi sebagai bukti
validitas prediktif, pikirkan baik-baik tentang kemungkinan bahwa skor pada
kriteria terjadi bias atau tidak valid.
Pertimbangan praktis idealnya, nilai dari instrumen harus divalidasi
menggunakan data dari kriteria akhir kehidupan nyata. Namun, pertimbangan
praktis membatasi sejauh mana pengembang dapat melakukan hal ini. Kepraktisan
tidak harus menjadi satu-satunya penentu dalam pengembang memutuskan untuk
memilih langkah-langkah kriteria.
Reliabilitas Waktu, Asesor, Domain Konten: Reliabilitas Bukti
Reliabilitas mengacu pada konsistensi penilaian hasil dari waktu ke waktu,
jika dan ketika mereka diulang, di penilai, atau lebih berbagai bentuk penilaian.
Sebagai contoh, skor dari tes membaca ABC diberikan hari ini berkorelasi 0.00
dengan skor dari pengujian yang sama ini diberikan minggu depan. Korelasi ini
adalah bukti bahwa skor tidak memiliki konsistensi selama periode ini. Anda akan
mempertanyakan validitas tes ini jika nilai siswa memiliki sedikit atau tidak ada
konsistensi dari satu minggu ke depan karena Anda percaya bahwa kemampuan
membaca stabil dalam waktu singkat. Jika instrumen penilaian menghasilkan hasil
yang tidak konsisten atau tidak stabil, Anda dapat memiliki sedikit kepercayaan
hasil tersebut. Oleh karena itu, reliabilitas hasil penilaian membatasi validitasnya.
Generalisasi Interpretasi Orang, Kondisi, atau Instruksi Khusus dan
Intervensi: Generalisasi Bukti
38
menjawab
pertanyaan-pertanyaan
tanpa
membaca
bagian
ini.
pembangunan itu.
Meningkatkan fokus dan sifat bagaimana siswa dipersiapkan untuk penilaian.
Meningkatkan siswa, guru, administrator, dan kesadaran masyarakat tentang
nilai standar, kriteria, dan penilaian untuk mengevaluasi sekolah.
Bukti tentang seberapa baik konsekuensi yang dimaksudkan dicapai
menjadi bagian dari kasus untuk memvalidasi penilaian program negara. Hal ini
tidak cukup, namun, untuk mengumpulkan bukti hanya tentang apakah
konsekuensi dimaksudkan suatu program telah dicapai. Penilaian negara dan
usaha validasi program akuntabilitas harus mencari bukti negatif, konsekuensi
yang tidak diinginkan seperti berikut (Lane & Stone, 2002):
Sebuah penyempitan kurikulum dan kelas mengajar untuk fokus hanya pada
apa yang termasuk dalam penilaian negara, sementara mengabaikan tujuan
yang lebih luas dan tujuan kurikulum. Mempersiapkan siswa hanya untuk
mengambil tes tanpa meningkatkan prestasi mereka lolos dari standar negara
Menggunakan praktek persiapan ujian tidak etis seperti membagikan
pertanyaan sebelumnya
Peningkatan prestasi hanya beberapa siswa (misalnya, siswa di sekolahsekolah yang memiliki tinggi sosial ekonomi tinggi) sedangkan prestasi orang
lain (misalnya, siswa di sekolah-sekolah dari tingkat sosial ekonomi rendah)
40
instrumen
penilaian
akan
membaik
jika
diberikan
dan
waktu karena [memberikan alasan Anda]. Ini menekankan poin yang kita buat
sebelumnya dalam hal ini bab: Validitas mengacu pada interpretasi Anda terhadap
skor.
Bagaimana seharusnya Skor norma yang direferensikan terakomodasi
dilaporkan? Masalah apakah melaporkan informasi norma-direferensikan tentang
kinerja siswa ketika ujian melanggar kondisi pengujian standar (misalnya, gagal
untuk menjaga batas waktu) masih kontroversial. Jika kondisi administrasi standar
tes dilanggar, beberapa akan melihat hal berikut sebagai sesuatu yang tidak patut:
(a) melaporkan jenis informasi norma-referensi untuk siswa terakomodasi dan (b)
termasuk rata-rata hasil sekolah dari siswa yang memiliki administrasi tes
diakomodasi (Phillips, komunikasi pribadi, 2001). Apakah hasil individu bagi
siswa diberikan tes dalam kondisi diakomodasi harus diidentifikasi atau ditandai
dalam catatan atau laporan juga tetap kontroversial (Sireci, 2005). persyaratan
hukum, seperti persyaratan pelaporan NCLB Act, bahwa negara persentase siswa
mencapai tingkat mahir atau lebih baik pada kebutuhan standar suatu negara harus
dilaporkan, terlepas dari akomodasi.
Bagaimana Seharusnya Criterion-Direferensikan
diakomodasi
Skor
kriteria
direferensikan
perlu
dinyatakan
dengan
cara
yang
43
2. Apakah nilai peserta ujian diuji di bawah kondisi standar memiliki makna
yang berbeda dari skor untuk peserta ujian diuji dengan membutuhkan
akomodasi?
3. Akankah peserta ujian yang tidak membutuhkan akomodasi menguntungkan
jika mereka tetap diberikan akomodasi sama?
4. Apakah peserta ujian yang meminta atau diberikan akomodasi memiliki
kapasitas untuk menyesuaikan diri dengan tes kondisi standar?
5. Apakah alasan kecacatan atau pengujian akomodasi berdasarkan prosedur
kebijakan diragukan validitas dan reliabilitasnya? (Diadaptasi dari Phillips,
1994, p.1.04)
Phillips berpendapat bahwa jika Anda menjawab ya untuk salah satu
pertanyaan ini, akomodasi tes tidak tepat karena akan membahayakan validitas
hasil tes. Dia menunjukkan potensi konflik antara memberikan partisipasi
maksimum bagi kelompok para penyandang cacat dan menjaga validitas tes.
Tidak semua akan setuju, dengan kesimpulan Phillips. Sebagai contoh,
meskipun akomodasi dapat mengubah keterampilan dinilai atau makna dari nilai
(lihat Pertanyaan 1 dan 2), seperti perubahan mungkin lebih, daripada kurang,
valid. Pendapat Phillips menganggap bahwa pemberian tes dalam kriteria kondisi
standar terhadap yang diakomodasi harus dinilai. Ini juga mengasumsikan bahwa
skill atau kemampuan yang dinilai oleh tes dalam kondisi standar adalah relevan
dengan keterampilan dan kemampuan yang akan dinilai.
Asumsi ini mungkin tidak benar. Misalnya, membaca kata-kata pendek dan
menjawab pertanyaan dalam kondisi standar waktunya bukanlah tujuan di akhir
pembelajaran, dan juga hal tersebut bukan penilaian langsung dari membaca.
Akomodasi dengan kondisi uji standar dapat berubah baik keterampilan yang
diperlukan dan makna hasil ke arah yang lebih positif. Pada gilirannya, dapat
membuat hasil tes yang diakomodasi lebih seperti target pembelajaran paling
dalam nyata dunia-terutama bagi siswa penyandang cacat tertentu. Hal ini lebih
mungkin terjadi sebagaimana Amerika dengan Disabilities Act of 1990 terus
mengubah pola kondisi akomodasi, dan sikap di tempat kerja. Dasar untuk menilai
validitas hasil penilaian berubah seiring waktu seperti kita belajar lebih banyak
tentang kemampuan dan kontribusi para penyandang cacat. Misalnya, untuk
banyak pekerjaan dan situasi dunia nyata, membaca dengan akomodasi tetap
diperbolehkan dan diterima.
KESIMPULAN
44
Validitas hasil penilaian kelas dan penilaian skala besar tergantung pada
tujuan yang dimaksudkan dan penggunaannya. Telah diuraikan berbagai jenis
bukti yang harus dipertimbangkan dalam alasan yang khusus hasil penilaian yang
berlaku untuk tujuan tertentu atau penggunaannya.
45