PENDAHULUAN
A. Latar Belakang
Kemampuan pada dasarnya terbagi menjadi dua macam, yaitu :
1. Aptitude test (Tes Bakat)
2. Achievement tes (Tes Prestasi)
Perbedaan antara dua tes ini sebenarnya tidak tegas, soal soal mengenai kedua tes
tersebut sering kali saling melingkupi (overlap). Untuk kedua macam tes ini biasanya
menggunakan hitung hitungan dan perbendaharaan kata kata dan sekelompok tes dari
kedua macam tes ini biasanya juga menguji tentang keterampilan membaca. Kesamaan
yang lain adalah bahwa keduanya telah digunakan untuk meramalkan hasil untuk yang
masa akan dating, walaupun pada umumnya jika kita menggunakan tes prestasi penilai
melihat apa yang telah diperoleh setelah siswa ( tercoba ) itu diberi suatu pelajaran.
Tes adalah salah satu bentuk instrumen evaluasi untuk mengukur seberapa besar
kemampuan siswa dalam memahami dan menguasai pokok-pokok materi yang sudah
diajarkan.Tes ada yang dibuat oleh seorang guru yang kemudian disebut tes buatan guru
dan ada tes yang sudah memenuhi standar suatu satuan pendidikan maupun lembaga
pendidikan yang kemudian disebut tes terstandar.
Dalam menilai, baik tes terstandar maupun tes buatan guru ada beberapa hal yang
perlu diperhatikan yang berkaitan dengan analisis hasil tes tersebut. Dalam makalah ini
akan diuraikan tentang banyak hal yang berkaitan dengan tes standar dan tes buatan guru.
Serta dijelaskan juga tentang analisis hasil tes.
Reliabilitas berhubungan dengan maslah kepercayaan. Suatu tes dapat mempunyai
taraf kepercayaan tinggi jika tes tersebut dapat memberika hasil yang tetap. Maka
pengertian realibilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau hasilnya
berubah ubah, perubahan yang terjadi dapat dikatakan tidak berarti.
Konsep tentang realibilitas ini tidak akan sulit dipahamai apabila pembaca
memahami konsep validitas. Tuntutan bahawa ninstrumen evaluasi harus valid
menyangkut harapan diperolehnya data yang valid, sesuai dengan kenyataan.Dalam hal
1
reliebilitas ini tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan objek
yang tidak lain adalah tidak menyimpangnya data dari kenyataan.
Artinya, bahwa data tersebut benar, maka konsep reliabilitas terkait dengan pemotretan
berkali kali. Instrument yang baik dalah instrument yang dapat dengan konsisten
memberikan data yang sesuai dengan kenyataan.
B. Rumusan Masalah
Dalam makalah ini masalah yang akan dirumuskan yaitu:
a. Apa saja macam-macam jenis pengukuran dan penilaian dalam pendidikan?
b. Perbedaan antara tes kecakapan dan prestasi?
c. Bagimana Peran guru dalam menyiapkan tes standar?
d. Apa saja isu-isu dalam tes standar?
2
BAB II
PEMBAHASAN
Pertama, marilah kita tinjau perbedaan antara tes standar dengan tes buatan guru
ini. Perbedaannya adalah sebagai berikut:
3
dianalisis dan direvisi sebelum 5) Mempunyai reliabilitas sedang atas
menjadi sebuah tes.
4
Jika sekolah hendak beralih ke program pendidikan yang baru, administrasi sekolah
harus tahu seberapa efektifkah program tersebut yakni dengan menggunakan program
baru itu. Salah satunya dengan menggunakan tes standar.
f) Memberikan akuntabilitas
Sekolah dan guru diharapkan bertanggung jawab atas pengajaran muridnya. Artinya
bahwa guru bertanggung jawab atas pencapaian selama proses pembelajaran dengan
adanya tes standar.
5
lain. Validitas kriteria dapat bersifat concurrent and predictive (Gregory, 2000;
Krunger, 2000).
Concurrent validity adalah relasi antara nilai tes dengan kriteria lain yang ada
saat ini.
Predictive validity adalah relasi antara nilai tes dengan kinerja masa depan
murid. Selanjutnya
construct validity yaitu sejauh mana ada bukti bahwa sebuah tes mengukur
tertentu. Sebuah konstruk adalah ciri atau karakteristik yang tidak bisa dilihat
dari seseorang, seperti intelegensi (kecerdasan), gaya belajar, personalitas, atau
lecemasan.
Reliabilitas, berarti sejauh mana sebuah prosedur tes bisa menghasilkan nilai yang
konsisten dan dapat direproduksi. Agar bisa disebut reliabel, nilai harus stabil,
dependable, dan relatif bebas dari kesalahan pengukuran (Fekken, 2000; Popham,
2002). Reliabilitas dapat diukur dengan beberapa cara antara lain test restest
reliability, alternate forms reliability, dan split half reliabilty.
a) Test retest reliability adalah sejauh mana sebuah tes menghasilkan kinerja
yang sama ketika seorang siswa diberi tes yang sama dalam dua kesempatan
yang berbeda. Jadi, jika sebuah tes sains standar kelas empat diberikan kepada
kelompok murid hari ini dan kemudian diberikan lagi sebulan kemudian, tes
itu akan dianggap rliabel apabila nilai murid konsisten dalam dua tes itu.
b) Alternate form reliability ditentukan dengan memberikan bentuk yang
berbeda dari tes yang sama pada dua kesempatan yang berbeda untuk
kelompok murid yang sama dan mengamati seberapa konsistenkah skornya.
c) Split half reliabilty, membagi item tes menjadi dua bagian, seperti item
bernomor genap dan ganjil. Nilai pada dua set itu itu dibandaingkan guna
menentukan seberapa konsistenkah kinerja murid di kedua set itu. Validitas
dan reliabilitas adalah saling terkait. Sebuah tes yang valid itu reliabel, tetapi
sebuah tes yang reliabel tidak selalu valid.
Keadilan, tes yang adil (fair) adalah tes yang tidak bias (unbiased) dan tidak
diskriminatif (McMillan, 2001). Tes itu tidak dipengaruhi oleh faktor-faktor seperti
gender, etnis, atau faktor subyektif seperti bias penilai.
6
B. TES KECAKAPAN DAN PRESTASI
Ada dua tipe utama tes standar yaitu tes kecakapan (aptitude) dan tes prestasi
(achievement). Tes kecakapan (aptitude test) didesign guna memprediksi kemampuan
murid untuk mempelajari suatu keahlian atau menguasai suatu keahlian atau menguasai
sesuatu dengan pendidikandan training tingkat lanjut. Tes kecakapan ini mencakup tes
kemampuan mental umum seperti tes kecerdasan (Stanford-Binet, Wechsler Scales, dan
sebagainya). Tes prestasi dimaksudkan untuk mengukur apa yang telah dipelajari atau
keahlian apa yang telah dikuasai murid (Andrews, Sakloske & Janzen, 2001; Haladyna,
2002; Smith, 2001). Namun perbedaan antara tes prestasi dengan tes kecakapan terkadang
kabur. Kedua jenis tes ini menilai status murid, pertanyaan yang dipakai kebanyakan
mirip, dan biasanya hasil dari dua jenis tes ini mempunyai korelasi yang tinggi.
Jenis-jenis tes prestasi standar, ada bebarapa tepe tes prestasi standar. Salah satu
cara umumuntuk mengklasifikasikannya adalah sebagai survey batterie, spesific subject
test, or diagnostic tests (Payne, 1997). Survey battery (baterai survei) adalah sekelompok
tes pokok persoalan individual yang didesign untuk murid level tertentu. Survey batteries
adalah tes standar nasional yang banyak digunakan (McMillan, 2001). Tes untuk subyek
spesifik, dimaksudkan untuk menilai keahlian di bidang tertentu seperti membaca atau
matematika. Karena tes ini difokuskan pada area spesifik, tes ini biasanya menialai suatu
keahlian secara lebih mendetail dan ekstensif ketimbang survey battery. Tes diagnostik,
adalah fungsi penting dari tes standar. Diagnostic testing terdiri dari evaluasi area
pembelajaran spesifik secara mendalam. Tujuannya adalah menetukan kebutuhan
pembelajaran spesifik dari murid sehingga kebutuhan itu dapat dipenuhi melalui instruksi
reguler atau remidial. Membaca dan matematika adalah dua area di mana tes standar
paling banyak dipakai untuk diagnosis (Berniger, dkk., 2001).
7
Sebelum 1990-an, isinya tidak berhubungan erat dengan apa yang diajarkan dan dipelajari
di kelas. Ujian negara hanya memberikan tinjauan umum atas seberapa baik murid di suatu
negara bagian dalam mata pelajaran tertentu, terutama membaca dan matematika.
Tahun 1990-an, dimulailah usaha untuk menghubungkan ujian negara dengan
sasaran instruksional yang didukung negara. Kebanyakan negara bagian di AS punya atau
sedang dalam proses identifikasi sasaran yang harus dicapai oleh setiap murid di suatu
negara. Sasaran ini menjadi basis bukan hanya untuk ujian negara, tetapi juga untuk
menjadi pedoman aktivitas seperti pendidikan guru dan penentuan kurikulum (Whitford &
Jones, 2000).
Adapun format ujian negara ditinjau dari sudut pandang konstruktivis, ujian yang
diwajibkan negara ini menggunakan format yang salah, terdiri dari soal pilihan berganda.
Hanya tujuh negara bagian yang belakangan ini menggunakan soal model esai atau soal
kinerja (Quality Couns, 2001). Ketika penilaian berbasis konstruksi dipakai, penilaian itu
biasanya menggunakan soal jawaban pendek atau soal menulis. Hanya sedikit negara
bagian yang memasukkan pertofolio sebagai bagian dari penilaiannya. Hampir semua
negara bagian menggunakan penilaian yang mengacu pada kriteria, yang berarti bahwa
nilai murid dievaluasi berdasarkan standar yang telah ditetapkan. Kebanyakan negara
menggunakan nilai dasar (seperti jawaban benar sampai 70 persen) yang harus dicapai
murid agar lulus. Tes semacam itu juga memberikan nilai komparatif.
Keuntungan dan penggunaan tes beresiko tinggi. Sejumlah pembuat kebijakan
berpendapat bahwa ujian negara berisiko tinggi (high stakes) memberikan sejumlah efek
posistif diantaranya :
a) Meningkatkan kinerja murid
b) Lebih banyak waktu untuk mengajarkan pelajaran yang diujikan
c) Ekspektasi tinggi untuk semua murid
d) Identifikasi sekolah, guru, dan administrasi yang berkinerja payah
e) Meningkatkan rasa percaya diri di sekolah setelah nilai ujian naik.
Kritik terhadap ujian negara. Kritik terhadap ujian yang diwajibkan negara ini
menyatakan bahwa ujian negara akan menimbulkan akibat negatif (McMillan, 2002) yaitu
:
8
a) Menumpulkan kurikulum dengan penekanan lebih besar pada hafalan
ketimbang pada keahlian berpikir dan memecahkan masalah. Dalam sebuah
analisis, kebanyakan ujian negara lebih difokuskan pada pengetahuan dan
keahlian yang cenderung gampang ketimbang kognitif yang lebih kompleks
(Quality Counts, 2001). Ini akan mempersempit kurikulum dan lebih fokus
pada keahlian kognitif yang rendah (Linn, 2000).
b) Mengajar demi ujian, guru akan mengajar pengetahuan dan keahlian yang
akan diujikan saja (Gallagher, 2000). Mereka menghabiskan banyak waktu
untuk berlatih soal-soal ujian. Dalam sebuah survei, lebih dari enam dari
sepuluh guru sekolah publik mengatakan bahwa ujian negara ini
menyebabkan pengajaran difokuskan pada ujian (Quality Counts, 2001).
c) Diskriminasi terhadap murid dari status sosioekonomi (SES) rendah dan
minoritas. Hal ini terjadi ketika jumlah anak-anak dari kelompok ini tidak
memenuhi standar negara ini sangat besar, sedangkan murid SES yang lebih
tinggi dan kulit putih bisa memenuhi standar. Para riset telah menemukan
bahwa murid yang ditempatkan di jalur lambat atau program remidial,
murid dari keluarga muskin dan etnis minoritas, lebih mungkin
mendapatkan pengajaran yang buruk dan berprestasi berprestasi rendah
(Cooper & Sherk, 1989 ; Oakes, 1990).
9
pelajaran matematika, sains, studi global, dan sejarah dan pemerintahan AS (diberikan di
SMA untuk murid yang tidak mengikuti Regent Test); Scholastic Assessment Tes (SAT)
dan American Collage Test (ACT), diberikan kepada murid yang berencana masuk ke
universitas atau akademik dan Advance Placement Test untuk bidang sejarah AS, biologi,
kimia, sastra dan bahasa Inggris, Perancis, Spanyol, kalkulus, dan teori musik yang dapat
diikuti oleh murid untuk memasuki kelas tertentu berdasarkan level pengetahuan dan
kemampuan yang mereka miliki. Pada tahun 1999, Spenceport juga mulai menilai
kemampuan murid untuk mengaplikasikan pengetahuan dan keahlian memecahkan
masalah dalam sejumlah bidang. Tes tipe standar dapat bervariasi antardistrik. Akan
tetapi, seperti dalam dalam sekolah distrik Spencerport, jumlah keseluruhannya banyak.
Penilaian Nasional dan Standar Kelas Dunia, pemerintah federal juga dilibatkan
dalam menstandarisasikan ujian melalui National Assessment of Educational Progress
(NAEP). Negara bagian tidak diwajibkan ikut berpatisipasi dalam penilaian naional,
walaupun banyak yang ikut (misalnya, lebih dari 40 negara bagian telah mewajibkan
murid di sana untuk mengikuti ujian). NAEP adalah penelitian mirip sensus terhadap
pengetahuan, keahlian, pemahaman, dan sikap generasi muda Amerika (Bourque, 1999;
Payne, 1997). Area subyek mencakup bidang membaca, menulis, sastra, matematika,
sains, studi sosial, seni, kewarganegaraan, dan perkembangan karier dan pekerjaan. Murid,
sekolah, kota, atau negara bagian tidak disebutkan dalam kajian ini, walaupun negara
bagian boleh meminta agar namanya dicantumkan. Setiap murid yang mengikuti NAEP
hanya merespons sebagian dari seluruh penilaian.
Temuan dari NAEP (2000) menunjukkan trend sebagai berikut :
a) Membaca. Tidak ada peningkatan dari tahun 1992 sampai 2000 untuk anak
grade empat dan tidak ada perkembangan untuk anak grade delapan sampai
dua belas dari 1992 sampai 1998.
b) Matematika. Dari tahun 1990 sampai 2000 terdapat kenaikan nilai untuk
anak grade empat dan grade delapan, tetpi menunjukkan penurunan pada
tahun 2000 untuk anak grade 12.
c) Sains. Tidak ada perubahn nilai dari 1996 sampai 2000 untuk anak grade
empat dan delapan, namun nilai anak grade dua belas menurun dalam
rentang waktu tersebut.
10
C. PERAN GURU
Peran guru dalam tes standar ini adalah :
1. Mempersiapkan Murid Untuk Mengikuti Ujian
Menurut McMillan (2001) dalam Santrock (2004) adalah penting bagi semua murid
untuk diberi kesempatan untuk mengeluarkan apa yang terbaik dari diri mereka. salah
satu caranya adalah memastikan murid punya keahlian mengerjakan tes prestasi.
Guru diharapkan memberikan sikap positif terhadap tes kepada murid serta menjelaskan
sifat dan tujuan dari tes. Teknik coaching atau training murid agar bisa mengerjakan soal
ujian, ternyata hanya sedikit saja menaikkan nilai murid.
Jadi, Peran penting guru dalam mempersiapkan murid untuk ujian adalah memberikan
dukungan dan tidak menjatuhkan mental murid, membantu murid untuk mengurangi rasa
takut akan ujian serta membekali murid dengan ilmu. Asumsi bahwa guru melaksanakan
pembelajaran yang arahannya memberikan pengetahuan kepada murid sebanyak-
banyaknya.
Dalam menjalankan tes standar, guru harus memperhatikan hal-hal seperti cara
mengatur ruang tes, apa yang harus dilakukan murid saat mengerjakan tes, bagaimana
memdistribusikan tes lembar soal dan jawaban dan bagaimana mengatur waktu tes.
Lingkup fisik saat dilakukan tes harus tenang, pastikan menulis waktu awal dan akhir tes
di papan tulis. Pada waktu mulai beritahu murid untuk memulai dan pastikan murid
berhenti saat waktu habis.
11
variabilitas dan distribusi normal. Dalam distribusi normal terdapat beberapa jenis nilai
yang dapat dipilih oleh guru untuk membantunya menginterpretasi nilai. Jenis nilai
tersebut antara lain nilai mentah, nilai percentile rank, nilai stanine, nilai grade-
equevalent, nilai stand9ar, nilai Z, nilai T.
Nilai Stanine
Sebuah nilai stanine mendeskripsikan kinerja tes murid pada skala 9 poin mulai dari
1 sampai 9. Skor 1,2, dan 3 biasanya dianggap di bawah ini rata-rata; 4,5, dan 6
sebagai rata-rata; dan 7,8,9 di atas rata-rata. Seperti dalam kasus nilai percentile-rank
murid, nilai stanine dalam satu mata pelajaran (semisal sains) dapat dibandingkan
dengan nilai stanine murid pada mata pelajaran lain (semisal matematika,
membacadan studi social)
Sebuah stanine mengacu kepada persentase spesifik dari area kurva normal.
Korepondensi antara nilai stanine dan percentile-rank ditunjukkan dalam gambar
berikut. Nilai stanine memberikan indeks umum dari kinerja murid sedangkan nilai
percentile-rank memberikan estimasi yang lebih tepat.
12
Nilai Stanine Nilai Percentile-Rank
9 > 96
8 89 - 95
7 77 - 88
6 60 76
5 40 59
4 23 39
3 11 22
2 4 10
1 <4
Nilai grade-Equivalent
Sebuah nilai grade-equivalent mengindikasikan kinerja murid dalam hubungannya
dengan level grade dan bulan-bulan satu tahun ajaran dengan asumsi 10 bulan setiap
tahun ajaran. Jadi, nilai grade-equivalent 4,5 mengacu pada grade 4, bulan kelima di
sekolah. Grade-equivalent 6,0 adalah bulan pertama grade 6, dalam beberapa laporan tes,
tanda desimal dihilangkan sehingga 45 sama dengan 4,5 dan 60 sama dengan 6,0
Nilai grade-equivalent hanya dapat digunakan untuk menginterpretasikan kemajuan
murid, bukan untuk penempatan grade. Banyak pendidik percaya bahwa karena nilai
grade-equivalent sering kali menyesatkan dan disalahartikan, maka tipe nilai lain, seperti
nilai standar, lebih tepat untuk dipakai.
Nilai Standar
Suatu nialai standar diekspresikan sebagai deviasi dari mean, yang menggunakan deviasi
standar yang telah kita bahas. Istilah standar dalam nilai standar bukan mengacu pada
level kinerja atau ekspektasi tetapi pada kurva normal standar (McMillan, 2002).
13
Nilai Z
Memberikan informasi tentang berapa banyak deviasi standar nilai mentah di atas atau
di bawah mean. Perhitungan nilai z menggunakan rumus berikut ini:
x
Nilai z =
Dimana X = nilai mentah, x =mean nilai mentah, dan SD adalah deviasi standar dari
distribusi nilai mentah,
Ambil kembali contoh nilai 21 murid diatas, beberapa nilai z apabila nilai mentah murid
adalah 86? Dengan menggunakan rumus tersebut di aras, maka:
8682,6
= 0,37
8,57
Jadi nilai mentah 86 adalah 0,37 dari deviasi standar diatas mean. Mean nilai Z adalah 0
dan deviasi standar adalah 1
Nilai T
Adalah nilai standar di mana mean-nya ditetapkan sebesar 50 dan deviasi standarnya
sebesar 10. Rumus di bawah ini adalah untuk menghitung nilai T.
Nilai T + 50 + 10(z)
Misalnya, nilai T dari 70 sama dengan nilai Z=2, dan nilai T dari 40 sama dengan nilai Z
dari -1. Untuk nilai mentah 86, nilai T-nya adalah 54.
Ujian SAT untuk masuk perguruan tinggi didasarkan pad acara penilaian yang serupa.
Mean-nya adalah 500 dan deviasi standarnya 100. Nilai terendah 200 dalam SAT
disesuaikan agar muncul pada tiga deviasi standar di atas mean. Jadi hanyasedikit
persentase murid (sekitar (1/10 dari satu persen ) berada pada nilai ekstrem ini.
14
4) Menggunakan tes standar untuk merencanakan dan meningkatkan instruksi
Tes standar merupakan sesuatu yang kontrovesial karena berkaitan dengan metode
penilaian. Isu utama dalam tes standar adalah mengenai apakah tes standar
mendiskriminasi murid etnis minoritas dan murid dari kalangan miskin. Isu lain yaitu
mengenai mana yang lebih baik untuk menilai kemampuan murid tes standar yang
terutama berdasarkan pada pertanyaan pilihan ganda ataukah penilaian alternatif.
Pakar Penilaian Grant Wiggins (1992) dalam Santrock (2004) berpendapat bahwa yang
dibutuhkan adalah tes kemampuan atau kinerja bukan tes standar yang terutama
menggunakan pertanyaan pilihan ganda. Tes standar hanya merupakan bagian dari
penilaian keseluruhan. Beberapa negara bagian amerika menarik kembali upayanya
untuk memasukkan kembali penilaian alternative dan ujian negara. Sebagian ini
disebabkan oleh studi awal yang menunjukkan bahwa penilaian alternative tidak
memberikan hasil yang sekonsisten soal pilihan ganda juga penilaian alternatif
membutuhkan banyak waktu dan biaya ketimbang tes standar pada umumnya.
Blaine Worthen dan Vicki Spandel (1991) mengatakan bahwa jika dipakai dalam secara
benar, tes standar juga benar. Namun tes itu hanya memberikan penilaian parsial dan
15
karenanya punya keterbatasan. Mereka percaya bahwa tes standar sangat berguna untuk
memberikan informasi tentang komparabilitas dari perspektif gambar besar.
Membandingkan kelas dengan kelas lain yang tidak akan memberikan informasi tentang
posisi peserta didik di antara populasi peserta didik yang lebih luas.
Oleh karena itu, Worthen dan spandel meminta guru untuk menghindari penyalagunaan
keduanya juga mengatakan bahwa tes standar hanya salah satu dari sekian banyak
penilaian utnuk mengevaluasi peserta didik.
Selain isu isu yang tersebut di atas, diversitas atau penilaian juga menjadi salah satu isu
yang berkembang pada tes standar. Isu yang berhubungan dengan diversitas atau
penilaian,contoh diambil dari Santrock (2004) peserta didik afrika-amerika dan latino
mendapat nilai sekitar 15 poin dibawah rata-rata peserta didik kulit putih pada tes
intelegensi. Kesenjangan ini dihubungkan dengan masalah lingkungan bukan karena
faktor hereditas. Selain itu, menurut hasil penelitian peserta didik afrika-amerika,latino
dan suku Indian asli menunjukkan level profesiensi atau kecapakan yang rendah di antara
semua kelompok peserta didik untuk mata pelajaran matematika, sains dan lainnya.
Perhatian khusus adalah pada bias cultural dalam tes dan arti penting dari pembuatan tes
yang responsif secara cultural untuk keperluan diagnostic dan isntruksional. Karena ada
potensi bias kultural dalam tes standar maka penting untuk menilai peserta didik dengan
menggunakan berbagai macam metode seperti banyak pakar percaya bahwa penilaian
kinerja dan portopolio akan mengurangi ketidakadilan yang menjadi ciri tes standar
untuk murid minoritas dan miskin.
16
BAB III
PENUTUP
Kesimpulan:
Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim ahli, atau disusun
oleh lembaga yang khusus menyelenggarakan secara professional. membandingkan tingkat
prestasi siswa dalam keterampilan di berbagai bidang studi untuk individu atau kelompok,
membandingkan prestasi siswa antara berbagai sekolah atau kelas, dan mempelajari
perkembangan siswa dalam suatu periode waktu tertentu.
Perbandingan antara tes standar dengan tes buatan guru, tes standar ini disusun dalam tipe-
tipe soal yang sama dan meliputi bahan atau pengetahuan yang sama banyak dengan bahan atau
pengetahuan yang dicakup oleh tes buatan guru. Sedangkan perbedaannya diantaranya didasarkan
atas bahan dan tujuan, serta reliabilitasnya.
Tes kecakapan ini mencakup tes kemampuan mental umum seperti tes kecerdasan
(Stanford-Binet, Wechsler Scales, dan sebagainya). Tes prestasi dimaksudkan untuk mengukur
apa yang telah dipelajari atau keahlian apa yang telah dikuasai murid. Contohnya Tes Ujian Negara
Beresiko Tinggi dan Tes Distrik Nasional.
Peran penting guru dalam mempersiapkan murid untuk ujian adalah memberikan dukungan
dan tidak menjatuhkan mental murid, membantu murid untuk mengurangi rasa takut akan ujian
serta membekali murid dengan ilmu. Asumsi bahwa guru melaksanakan pembelajaran yang
arahannya memberikan pengetahuan kepada murid sebanyak-banyaknya. Dalam distribusi normal
terdapat beberapa jenis nilai yang dapat dipilih oleh guru untuk membantunya menginterpretasi
nilai. Jenis nilai tersebut antara lain nilai mentah, nilai percentile rank, nilai stanine, nilai grade-
equevalent, nilai stand9ar, nilai Z, nilai T
17
DAFTAR PUSTAKA
Jakarta : Aksara.
Graha Ilmu.
Media Group
18