Makalah Psikologi Tes (Final)

BAB I
PENDAHULUAN
A. Latar Belakang
Kemampuan pada dasarnya terbagi menjadi dua macam, yaitu :
1. Aptitude test (Tes Bakat)
2. Achievement tes (Tes Prestasi)
Perbedaan antara dua tes ini sebenarnya tidak tegas, soal soal mengenai kedua tes
tersebut sering kali saling melingkupi (overlap). Untuk kedua macam tes ini biasanya
menggunakan hitung hitungan dan perbendaharaan kata kata dan sekelompok tes dari
kedua macam tes ini biasanya juga menguji tentang keterampilan membaca. Kesamaan
yang lain adalah bahwa keduanya telah digunakan untuk meramalkan hasil untuk yang
masa akan dating, walaupun pada umumnya jika kita menggunakan tes prestasi penilai
melihat apa yang telah diperoleh setelah siswa ( tercoba ) itu diberi suatu pelajaran.
Tes adalah salah satu bentuk instrumen evaluasi untuk mengukur seberapa besar
kemampuan siswa dalam memahami dan menguasai pokok-pokok materi yang sudah
diajarkan.Tes ada yang dibuat oleh seorang guru yang kemudian disebut tes buatan guru
dan ada tes yang sudah memenuhi standar suatu satuan pendidikan maupun lembaga
pendidikan yang kemudian disebut tes terstandar.
Dalam menilai, baik tes terstandar maupun tes buatan guru ada beberapa hal yang
perlu diperhatikan yang berkaitan dengan analisis hasil tes tersebut. Dalam makalah ini
akan diuraikan tentang banyak hal yang berkaitan dengan tes standar dan tes buatan guru.
Serta dijelaskan juga tentang analisis hasil tes.
Reliabilitas berhubungan dengan maslah kepercayaan. Suatu tes dapat mempunyai
taraf kepercayaan tinggi jika tes tersebut dapat memberika hasil yang tetap. Maka
pengertian realibilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau hasilnya
berubah ubah, perubahan yang terjadi dapat dikatakan tidak berarti.
Konsep tentang realibilitas ini tidak akan sulit dipahamai apabila pembaca
memahami konsep validitas. Tuntutan bahawa ninstrumen evaluasi harus valid
menyangkut harapan diperolehnya data yang valid, sesuai dengan kenyataan.Dalam hal
1
reliebilitas ini tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan objek
yang tidak lain adalah tidak menyimpangnya data dari kenyataan.
Artinya, bahwa data tersebut benar, maka konsep reliabilitas terkait dengan pemotretan
berkali kali. Instrument yang baik dalah instrument yang dapat dengan konsisten
memberikan data yang sesuai dengan kenyataan.
B. Rumusan Masalah
Dalam makalah ini masalah yang akan dirumuskan yaitu:
a. Apa saja macam-macam jenis pengukuran dan penilaian dalam pendidikan?
b. Perbedaan antara tes kecakapan dan prestasi?
c. Bagimana Peran guru dalam menyiapkan tes standar?
d. Apa saja isu-isu dalam tes standar?
2
BAB II
PEMBAHASAN
A. Macam-Macam Jenis Pengukuran dan Penilaian Dalam Pendidikan

1. Tes Standar
Tes yang dibakukan mengandung prosedur yang seragam untuk menentukan nilai dan
administrasinya. Tes standar bisa membandingkan kemampuan murid dengan murid lain
pada usia atau level yang sama, dan dalam banyak kasus perbandingan ini dilakukan di
tingkat nasional. Soal tes buatan guru cenderung difokuskan pada tujuan instruksional
untuk kelas tertentu. Sedangkan tes standar mencakup berbagai materi yang lazimnya
diajarkan di kebanyakan kelas (Airasian, 2001; Chatterji, 2003). Adapun perbedaan lain
antara tes standar dengan tes buatan guru adalah banyak tes standar yang memiliki aturan
umum dan kebanyakan telah dievaluasi validitas dan reliabilitasnya.
Pertama, marilah kita tinjau perbedaan antara tes standar dengan tes buatan guru
ini. Perbedaannya adalah sebagai berikut:
Tes Standar Tes Buatan Guru

1) Didasarkan atas bahan dan tujuan 1) Didasarkan atas bahan dan tujuan
umum dari sekolah-sekolah di khusus yang dirumuskan oleh guru
seluruh negara. untuk kelasnya sendiri.
2) Mencakup aspek yang luas dan 2) Dapat terjadi hanya mencakup
pengetahuan atau keterampilan pengetahuan atau keterampilan yang
dengan hanya sedikit butir tes untuk sempit.
setiap keterampilan atau topik. 3) Biasanya disusun sendiri oleh guru
3) Disusun dengan kelengkapan staf dengan sedikit atau tanpa bantuan
profesor, pembahas, editor, butir tes. oranng lain/tenaga ahli.
4) Menggunakan butir-butir tes yang 4) Jarang-jarang menggunakan butir-
sudah diujicobakan (try out), butir tes yang sudah diujicobakan,
dianalisis, dan direvisi.
3
dianalisis dan direvisi sebelum 5) Mempunyai reliabilitas sedang atas
menjadi sebuah tes.
Tes Standar Tes Buatan Guru

5). Mempunnyai reabilitas yang tinggi. 5). Mempunyai reliabilitas sedang atau
6) Dimungkinkan menggunakan norma rendah.
untuk seluruh negara. 6) Norma kelompok terbatas kelas
tertentu.
1.1 Tujuan Tes Standar:

a) Memberikan informasi tentang kemajuan murid
Test standart adalah sumber informasi tentang seberapa baik prestasi dan kemampuan
murid.
b) Mendiagnosis kekuatan dan kelemahan murid.
Tes standar jugadapat memberikan informasi tentang kekuatan dan kelemahan
pembelajaran murid (Popham, 2002). Misalnya, murid yang kurang bagus dalam
pelajaran membaca mungkin diberi satu atau lebih tes standar untuk mengetahui letak
kelamahan secara tepat. Apabila tes standar digunakan untuk diagnosis. Test itu
biasanya diberikan individual, bukan secara kolektif.
c) Memberikan bukti untuk penempatan murid dalam program khusus
Tes standar juga dapat dipakai untuk membuat keputusan tentang apakah murid
diizinkan masuk ke program spesifik atau tidak. Murid juga dapat mengikuti tes standar
untuk mengetahui kecocokan mereka dalam mengikuti karir
d) Memberi informasi untuk merencanakan dan meningkatkan pengajaran atau instruksi
Bersama dengan informasi lain, nilai dari tes standar dapat dipakai oleh guru dalam
membuat keputusan instruksi. Misalnya, skor murid pada tes awal membaca
memberikan informasi untuk membantu guru untuk menentukan pada level manakah
murid harus diberi pengajaran membaca.
e) Membantu administrator mengevaluasi program.
4
Jika sekolah hendak beralih ke program pendidikan yang baru, administrasi sekolah
harus tahu seberapa efektifkah program tersebut yakni dengan menggunakan program
baru itu. Salah satunya dengan menggunakan tes standar.
f) Memberikan akuntabilitas
Sekolah dan guru diharapkan bertanggung jawab atas pengajaran muridnya. Artinya
bahwa guru bertanggung jawab atas pencapaian selama proses pembelajaran dengan
adanya tes standar.
1.2 Kriteria Untuk Mengevaluasi Tes Standar

Norma, untuk memahami kinerja individual dalam suatu tes, kinerjanya perlu
dibandingkan dengan kinerja dari kelompok norma (norm group) yakni kelompok
dari individu yang sama seblumnya telah diberi ujian oleh penguji. Tes ini dikatakan
didasarkan pada norma nasional (national norms) apabila kelompok norma itu terdiri
dari representasi murid secara nasional. Selain norma nasional, tes standar juga dapat
mengandung norma kelompok spesial dan norma lokal. Norma kelompok spesial
terdiri dari nilai tes untuk sub kelompok dari sampel nasional. Misalnya norma
kelompok spesial mungkin tersedia untuk murid dari kelompok sosioekonomi
rendah, menengah, dan atas, untuk murid perkotaan, sub urban, dan perdesaan, untuk
sekolah swasta dan negeri, untuk siswa perempuan dan laki-laki, dan untuk murid
dari kelompok etnis yang berbeda-beda. Norma lokal terkadang disediakan untuk tes
standar. Norma ini membandingkan kinerja murid dengan murid lain dari kelas yang
sama, sekolah yang sama, atau distrik yang sama. Jadi evaluasi kinerja tes murid
mungkin akan berbeda-beda tergantung kepada norma kelompok yang dipakai.
Validitas, adalah sejauh mana sebuah tes mengukur apa-apa yang hendak diukur dan
apakah inferensi nilai tes itu akurat atau tidak. Tes standar yang valid harus
mengandung validitas isi yang baik, yakni kemampuan tes untuk mencakup sampel
(to sample) isi yang hendak diukur. Konsep ini sama dengan fakta yang berkaitan
dengan isi. Bentuk lain dari validitas adalah validitas kriteria, yakni kemampuan tes
untuk memprediksi kinerja murid saat diukur dengan penilaian atau dengan kriteria
5
lain. Validitas kriteria dapat bersifat concurrent and predictive (Gregory, 2000;
Krunger, 2000).
Concurrent validity adalah relasi antara nilai tes dengan kriteria lain yang ada
saat ini.
Predictive validity adalah relasi antara nilai tes dengan kinerja masa depan
murid. Selanjutnya
construct validity yaitu sejauh mana ada bukti bahwa sebuah tes mengukur
tertentu. Sebuah konstruk adalah ciri atau karakteristik yang tidak bisa dilihat
dari seseorang, seperti intelegensi (kecerdasan), gaya belajar, personalitas, atau
lecemasan.
Reliabilitas, berarti sejauh mana sebuah prosedur tes bisa menghasilkan nilai yang
konsisten dan dapat direproduksi. Agar bisa disebut reliabel, nilai harus stabil,
dependable, dan relatif bebas dari kesalahan pengukuran (Fekken, 2000; Popham,
2002). Reliabilitas dapat diukur dengan beberapa cara antara lain test restest
reliability, alternate forms reliability, dan split half reliabilty.
a) Test retest reliability adalah sejauh mana sebuah tes menghasilkan kinerja
yang sama ketika seorang siswa diberi tes yang sama dalam dua kesempatan
yang berbeda. Jadi, jika sebuah tes sains standar kelas empat diberikan kepada
kelompok murid hari ini dan kemudian diberikan lagi sebulan kemudian, tes
itu akan dianggap rliabel apabila nilai murid konsisten dalam dua tes itu.
b) Alternate form reliability ditentukan dengan memberikan bentuk yang
berbeda dari tes yang sama pada dua kesempatan yang berbeda untuk
kelompok murid yang sama dan mengamati seberapa konsistenkah skornya.
c) Split half reliabilty, membagi item tes menjadi dua bagian, seperti item
bernomor genap dan ganjil. Nilai pada dua set itu itu dibandaingkan guna
menentukan seberapa konsistenkah kinerja murid di kedua set itu. Validitas
dan reliabilitas adalah saling terkait. Sebuah tes yang valid itu reliabel, tetapi
sebuah tes yang reliabel tidak selalu valid.
Keadilan, tes yang adil (fair) adalah tes yang tidak bias (unbiased) dan tidak
diskriminatif (McMillan, 2001). Tes itu tidak dipengaruhi oleh faktor-faktor seperti
gender, etnis, atau faktor subyektif seperti bias penilai.
6
B. TES KECAKAPAN DAN PRESTASI
Ada dua tipe utama tes standar yaitu tes kecakapan (aptitude) dan tes prestasi
(achievement). Tes kecakapan (aptitude test) didesign guna memprediksi kemampuan
murid untuk mempelajari suatu keahlian atau menguasai suatu keahlian atau menguasai
sesuatu dengan pendidikandan training tingkat lanjut. Tes kecakapan ini mencakup tes
kemampuan mental umum seperti tes kecerdasan (Stanford-Binet, Wechsler Scales, dan
sebagainya). Tes prestasi dimaksudkan untuk mengukur apa yang telah dipelajari atau
keahlian apa yang telah dikuasai murid (Andrews, Sakloske & Janzen, 2001; Haladyna,
2002; Smith, 2001). Namun perbedaan antara tes prestasi dengan tes kecakapan terkadang
kabur. Kedua jenis tes ini menilai status murid, pertanyaan yang dipakai kebanyakan
mirip, dan biasanya hasil dari dua jenis tes ini mempunyai korelasi yang tinggi.
Jenis-jenis tes prestasi standar, ada bebarapa tepe tes prestasi standar. Salah satu
cara umumuntuk mengklasifikasikannya adalah sebagai survey batterie, spesific subject
test, or diagnostic tests (Payne, 1997). Survey battery (baterai survei) adalah sekelompok
tes pokok persoalan individual yang didesign untuk murid level tertentu. Survey batteries
adalah tes standar nasional yang banyak digunakan (McMillan, 2001). Tes untuk subyek
spesifik, dimaksudkan untuk menilai keahlian di bidang tertentu seperti membaca atau
matematika. Karena tes ini difokuskan pada area spesifik, tes ini biasanya menialai suatu
keahlian secara lebih mendetail dan ekstensif ketimbang survey battery. Tes diagnostik,
adalah fungsi penting dari tes standar. Diagnostic testing terdiri dari evaluasi area
pembelajaran spesifik secara mendalam. Tujuannya adalah menetukan kebutuhan
pembelajaran spesifik dari murid sehingga kebutuhan itu dapat dipenuhi melalui instruksi
reguler atau remidial. Membaca dan matematika adalah dua area di mana tes standar
paling banyak dipakai untuk diagnosis (Berniger, dkk., 2001).
1. Ujian Negara Beresiko Tinggi (high stakes)

Setelah publik dan pemerintah menuntut pertanggungjawaban terhadap efektivitas
sekolah dalam mendidik anak-anak bangsa, tes atau ujian yang diwajibkan negara (ujian
negara) semakin kuat perannya (Hambleton, 2002;Olson, 2001). Negara telah lama
mewajibkan ujian atau tes, tetapi penekanannya berubah belakangan ini (Airasian, 2001).
7
Sebelum 1990-an, isinya tidak berhubungan erat dengan apa yang diajarkan dan dipelajari
di kelas. Ujian negara hanya memberikan tinjauan umum atas seberapa baik murid di suatu
negara bagian dalam mata pelajaran tertentu, terutama membaca dan matematika.
Tahun 1990-an, dimulailah usaha untuk menghubungkan ujian negara dengan
sasaran instruksional yang didukung negara. Kebanyakan negara bagian di AS punya atau
sedang dalam proses identifikasi sasaran yang harus dicapai oleh setiap murid di suatu
negara. Sasaran ini menjadi basis bukan hanya untuk ujian negara, tetapi juga untuk
menjadi pedoman aktivitas seperti pendidikan guru dan penentuan kurikulum (Whitford &
Jones, 2000).
Adapun format ujian negara ditinjau dari sudut pandang konstruktivis, ujian yang
diwajibkan negara ini menggunakan format yang salah, terdiri dari soal pilihan berganda.
Hanya tujuh negara bagian yang belakangan ini menggunakan soal model esai atau soal
kinerja (Quality Couns, 2001). Ketika penilaian berbasis konstruksi dipakai, penilaian itu
biasanya menggunakan soal jawaban pendek atau soal menulis. Hanya sedikit negara
bagian yang memasukkan pertofolio sebagai bagian dari penilaiannya. Hampir semua
negara bagian menggunakan penilaian yang mengacu pada kriteria, yang berarti bahwa
nilai murid dievaluasi berdasarkan standar yang telah ditetapkan. Kebanyakan negara
menggunakan nilai dasar (seperti jawaban benar sampai 70 persen) yang harus dicapai
murid agar lulus. Tes semacam itu juga memberikan nilai komparatif.
Keuntungan dan penggunaan tes beresiko tinggi. Sejumlah pembuat kebijakan
berpendapat bahwa ujian negara berisiko tinggi (high stakes) memberikan sejumlah efek
posistif diantaranya :
a) Meningkatkan kinerja murid
b) Lebih banyak waktu untuk mengajarkan pelajaran yang diujikan
c) Ekspektasi tinggi untuk semua murid
d) Identifikasi sekolah, guru, dan administrasi yang berkinerja payah
e) Meningkatkan rasa percaya diri di sekolah setelah nilai ujian naik.
Kritik terhadap ujian negara. Kritik terhadap ujian yang diwajibkan negara ini
menyatakan bahwa ujian negara akan menimbulkan akibat negatif (McMillan, 2002) yaitu
:
8
a) Menumpulkan kurikulum dengan penekanan lebih besar pada hafalan
ketimbang pada keahlian berpikir dan memecahkan masalah. Dalam sebuah
analisis, kebanyakan ujian negara lebih difokuskan pada pengetahuan dan
keahlian yang cenderung gampang ketimbang kognitif yang lebih kompleks
(Quality Counts, 2001). Ini akan mempersempit kurikulum dan lebih fokus
pada keahlian kognitif yang rendah (Linn, 2000).
b) Mengajar demi ujian, guru akan mengajar pengetahuan dan keahlian yang
akan diujikan saja (Gallagher, 2000). Mereka menghabiskan banyak waktu
untuk berlatih soal-soal ujian. Dalam sebuah survei, lebih dari enam dari
sepuluh guru sekolah publik mengatakan bahwa ujian negara ini
menyebabkan pengajaran difokuskan pada ujian (Quality Counts, 2001).
c) Diskriminasi terhadap murid dari status sosioekonomi (SES) rendah dan
minoritas. Hal ini terjadi ketika jumlah anak-anak dari kelompok ini tidak
memenuhi standar negara ini sangat besar, sedangkan murid SES yang lebih
tinggi dan kulit putih bisa memenuhi standar. Para riset telah menemukan
bahwa murid yang ditempatkan di jalur lambat atau program remidial,
murid dari keluarga muskin dan etnis minoritas, lebih mungkin
mendapatkan pengajaran yang buruk dan berprestasi berprestasi rendah
(Cooper & Sherk, 1989 ; Oakes, 1990).
2. Tes Distrik dan Nasional

Selain ujian negara, sebuah distrik atau kabupaten mungkin mewajibkan tes
standar, murid mungkin juga harus mengikuti ujian naisonal.
Ujian Distrik (Lokal). Di Spencerport, New York, distrik sekolah mengumpulkan
isnformasi tentang kinerja murid dengan tes berikut ini : Standford Achievement Test in
Reading (grade 2-8) and Math (grade 1-8); New York Satae Pupil Evaluation Test in
Reading (grade 3-6), Written Expression (grade 5), and Mathematics (grade 3 dan 6);
New York State Program Evaluation Test, yang menilai program sainsdan studi ssosial;
New York Preliminary Competency Test, yang dipakai untuk memprediksi kesuksesan
masa depan di pelajaran membaca, menulis, dan matematika (diberikan untuk setiap
grade); New York States Regents Competency Test, yang menilai kompetensi untuk
9
pelajaran matematika, sains, studi global, dan sejarah dan pemerintahan AS (diberikan di
SMA untuk murid yang tidak mengikuti Regent Test); Scholastic Assessment Tes (SAT)
dan American Collage Test (ACT), diberikan kepada murid yang berencana masuk ke
universitas atau akademik dan Advance Placement Test untuk bidang sejarah AS, biologi,
kimia, sastra dan bahasa Inggris, Perancis, Spanyol, kalkulus, dan teori musik yang dapat
diikuti oleh murid untuk memasuki kelas tertentu berdasarkan level pengetahuan dan
kemampuan yang mereka miliki. Pada tahun 1999, Spenceport juga mulai menilai
kemampuan murid untuk mengaplikasikan pengetahuan dan keahlian memecahkan
masalah dalam sejumlah bidang. Tes tipe standar dapat bervariasi antardistrik. Akan
tetapi, seperti dalam dalam sekolah distrik Spencerport, jumlah keseluruhannya banyak.
Penilaian Nasional dan Standar Kelas Dunia, pemerintah federal juga dilibatkan
dalam menstandarisasikan ujian melalui National Assessment of Educational Progress
(NAEP). Negara bagian tidak diwajibkan ikut berpatisipasi dalam penilaian naional,
walaupun banyak yang ikut (misalnya, lebih dari 40 negara bagian telah mewajibkan
murid di sana untuk mengikuti ujian). NAEP adalah penelitian mirip sensus terhadap
pengetahuan, keahlian, pemahaman, dan sikap generasi muda Amerika (Bourque, 1999;
Payne, 1997). Area subyek mencakup bidang membaca, menulis, sastra, matematika,
sains, studi sosial, seni, kewarganegaraan, dan perkembangan karier dan pekerjaan. Murid,
sekolah, kota, atau negara bagian tidak disebutkan dalam kajian ini, walaupun negara
bagian boleh meminta agar namanya dicantumkan. Setiap murid yang mengikuti NAEP
hanya merespons sebagian dari seluruh penilaian.
Temuan dari NAEP (2000) menunjukkan trend sebagai berikut :
a) Membaca. Tidak ada peningkatan dari tahun 1992 sampai 2000 untuk anak
grade empat dan tidak ada perkembangan untuk anak grade delapan sampai
dua belas dari 1992 sampai 1998.
b) Matematika. Dari tahun 1990 sampai 2000 terdapat kenaikan nilai untuk
anak grade empat dan grade delapan, tetpi menunjukkan penurunan pada
tahun 2000 untuk anak grade 12.
c) Sains. Tidak ada perubahn nilai dari 1996 sampai 2000 untuk anak grade
empat dan delapan, namun nilai anak grade dua belas menurun dalam
rentang waktu tersebut.
10
C. PERAN GURU
Peran guru dalam tes standar ini adalah :
1. Mempersiapkan Murid Untuk Mengikuti Ujian
Menurut McMillan (2001) dalam Santrock (2004) adalah penting bagi semua murid
untuk diberi kesempatan untuk mengeluarkan apa yang terbaik dari diri mereka. salah
satu caranya adalah memastikan murid punya keahlian mengerjakan tes prestasi.
Guru diharapkan memberikan sikap positif terhadap tes kepada murid serta menjelaskan
sifat dan tujuan dari tes. Teknik coaching atau training murid agar bisa mengerjakan soal
ujian, ternyata hanya sedikit saja menaikkan nilai murid.
Jadi, Peran penting guru dalam mempersiapkan murid untuk ujian adalah memberikan
dukungan dan tidak menjatuhkan mental murid, membantu murid untuk mengurangi rasa
takut akan ujian serta membekali murid dengan ilmu. Asumsi bahwa guru melaksanakan
pembelajaran yang arahannya memberikan pengetahuan kepada murid sebanyak-
banyaknya.
2. Menjalankan Tes Standar
Dalam menjalankan tes standar, guru harus memperhatikan hal-hal seperti cara
mengatur ruang tes, apa yang harus dilakukan murid saat mengerjakan tes, bagaimana
memdistribusikan tes lembar soal dan jawaban dan bagaimana mengatur waktu tes.
Lingkup fisik saat dilakukan tes harus tenang, pastikan menulis waktu awal dan akhir tes
di papan tulis. Pada waktu mulai beritahu murid untuk memulai dan pastikan murid
berhenti saat waktu habis.
3. Memahami dan Menginterprestasi Hasil Tes
Kegunaan interpretasi hasil tes adalah memudahkan guru dalam menjelaskan

keadaan nilai murid pada orang tua maupun guru yang lain. Oleh karena itu, dalam
pelaporan nilai, guru menggunakan statistik deskriptif. Menurut Kiess (2002) dalam
santrock (2004) statistik deskriptif merupakan prosedur matematika yang dipakai untuk
mendeskripsikan dan meringkas data dengan cara yang bermakna. Dalam statistik
deskriptif akan dipelajari distribusi frekuensi, pengukuran tendensi sentral , pengukuran
11
variabilitas dan distribusi normal. Dalam distribusi normal terdapat beberapa jenis nilai
yang dapat dipilih oleh guru untuk membantunya menginterpretasi nilai. Jenis nilai
tersebut antara lain nilai mentah, nilai percentile rank, nilai stanine, nilai grade-
equevalent, nilai stand9ar, nilai Z, nilai T.
Nilai mentah (raw score)

Jumlah soal ujian yang diwajibkan murid dengan benar. Nilai mentah itu sendiri tidak
banyak gunanya karena tidak memberi informasi tentang seberapa sulit atau
mudahkah ujian itu atau bagaimana perbandingan satu murid dengan murid lainnya
Nilai percentile rank

Nilai ini juga menginformasikan tentang posisi nilai dibandingkan dengan nilai
lainnya. Urutan percentile ini berkisar dari 1 sampai 99. Percentile-rank untuk tes
standar ditentukan oleh perbanding dengan distribusi kelompok norma. Kelompok
perbandingan berbeda bisa dipakai dalam menghitung percentile-rank, seperti norma
urban atau norma suburban
Nilai Stanine
Sebuah nilai stanine mendeskripsikan kinerja tes murid pada skala 9 poin mulai dari
1 sampai 9. Skor 1,2, dan 3 biasanya dianggap di bawah ini rata-rata; 4,5, dan 6
sebagai rata-rata; dan 7,8,9 di atas rata-rata. Seperti dalam kasus nilai percentile-rank
murid, nilai stanine dalam satu mata pelajaran (semisal sains) dapat dibandingkan
dengan nilai stanine murid pada mata pelajaran lain (semisal matematika,
membacadan studi social)
Sebuah stanine mengacu kepada persentase spesifik dari area kurva normal.
Korepondensi antara nilai stanine dan percentile-rank ditunjukkan dalam gambar
berikut. Nilai stanine memberikan indeks umum dari kinerja murid sedangkan nilai
percentile-rank memberikan estimasi yang lebih tepat.
12
Nilai Stanine Nilai Percentile-Rank
9 > 96
8 89 - 95
7 77 - 88
6 60 76
5 40 59
4 23 39
3 11 22
2 4 10
1 <4
Nilai grade-Equivalent
Sebuah nilai grade-equivalent mengindikasikan kinerja murid dalam hubungannya
dengan level grade dan bulan-bulan satu tahun ajaran dengan asumsi 10 bulan setiap
tahun ajaran. Jadi, nilai grade-equivalent 4,5 mengacu pada grade 4, bulan kelima di
sekolah. Grade-equivalent 6,0 adalah bulan pertama grade 6, dalam beberapa laporan tes,
tanda desimal dihilangkan sehingga 45 sama dengan 4,5 dan 60 sama dengan 6,0
Nilai grade-equivalent hanya dapat digunakan untuk menginterpretasikan kemajuan
murid, bukan untuk penempatan grade. Banyak pendidik percaya bahwa karena nilai
grade-equivalent sering kali menyesatkan dan disalahartikan, maka tipe nilai lain, seperti
nilai standar, lebih tepat untuk dipakai.
Nilai Standar
Suatu nialai standar diekspresikan sebagai deviasi dari mean, yang menggunakan deviasi
standar yang telah kita bahas. Istilah standar dalam nilai standar bukan mengacu pada
level kinerja atau ekspektasi tetapi pada kurva normal standar (McMillan, 2002).
13
Nilai Z
Memberikan informasi tentang berapa banyak deviasi standar nilai mentah di atas atau
di bawah mean. Perhitungan nilai z menggunakan rumus berikut ini:
x
Nilai z =

Dimana X = nilai mentah, x =mean nilai mentah, dan SD adalah deviasi standar dari
distribusi nilai mentah,
Ambil kembali contoh nilai 21 murid diatas, beberapa nilai z apabila nilai mentah murid
adalah 86? Dengan menggunakan rumus tersebut di aras, maka:
8682,6
= 0,37
8,57
Jadi nilai mentah 86 adalah 0,37 dari deviasi standar diatas mean. Mean nilai Z adalah 0
dan deviasi standar adalah 1
Nilai T
Adalah nilai standar di mana mean-nya ditetapkan sebesar 50 dan deviasi standarnya
sebesar 10. Rumus di bawah ini adalah untuk menghitung nilai T.
Nilai T + 50 + 10(z)
Misalnya, nilai T dari 70 sama dengan nilai Z=2, dan nilai T dari 40 sama dengan nilai Z
dari -1. Untuk nilai mentah 86, nilai T-nya adalah 54.
Ujian SAT untuk masuk perguruan tinggi didasarkan pad acara penilaian yang serupa.
Mean-nya adalah 500 dan deviasi standarnya 100. Nilai terendah 200 dalam SAT
disesuaikan agar muncul pada tiga deviasi standar di atas mean. Jadi hanyasedikit
persentase murid (sekitar (1/10 dari satu persen ) berada pada nilai ekstrem ini.
14
4) Menggunakan tes standar untuk merencanakan dan meningkatkan instruksi
Menurut McMillan (2002) dalam Santrock (2004) mengatakan guru dapat

menggunakan nilai tes standar dari akhir tahun sebelumnya untuk merencanakan
instruksi tahun selanjutnya dan mengevaluasi efektivitas instruksi setelah isi materi
diajarkan. Hasil tes standar memberikan kemampuan umum dari murid dikelas, hal ini
dapat membantu guru dalam memilih level instruksi dan materi yang tepat untuk
mengawali pelajaran selama setahun. Tes standar sendiri diberikan setelah pengajaran
dapat dipakai untuk mengevaluasi efektivitas instruksi/pengajaran dan kurikulum. Tes
standar juga relevan dalam pemutusan untuk penempatan, yang harus dilakukan
berdasarkan informasi dari berbagai sumber, observasi dan penilaian lainnya. Perlu
digarisbawahi bahwa untuk mengevaluasi murid tidak hanya dengan menggunakan satu
tes saja namun penting pula untuk melihat nilai tes sudah merefleksikan penilaian yang
adil.
D. Isu isu dalam Tes Standar
Tes standar merupakan sesuatu yang kontrovesial karena berkaitan dengan metode
penilaian. Isu utama dalam tes standar adalah mengenai apakah tes standar
mendiskriminasi murid etnis minoritas dan murid dari kalangan miskin. Isu lain yaitu
mengenai mana yang lebih baik untuk menilai kemampuan murid tes standar yang
terutama berdasarkan pada pertanyaan pilihan ganda ataukah penilaian alternatif.
Pakar Penilaian Grant Wiggins (1992) dalam Santrock (2004) berpendapat bahwa yang
dibutuhkan adalah tes kemampuan atau kinerja bukan tes standar yang terutama
menggunakan pertanyaan pilihan ganda. Tes standar hanya merupakan bagian dari
penilaian keseluruhan. Beberapa negara bagian amerika menarik kembali upayanya
untuk memasukkan kembali penilaian alternative dan ujian negara. Sebagian ini
disebabkan oleh studi awal yang menunjukkan bahwa penilaian alternative tidak
memberikan hasil yang sekonsisten soal pilihan ganda juga penilaian alternatif
membutuhkan banyak waktu dan biaya ketimbang tes standar pada umumnya.
Blaine Worthen dan Vicki Spandel (1991) mengatakan bahwa jika dipakai dalam secara
benar, tes standar juga benar. Namun tes itu hanya memberikan penilaian parsial dan
15
karenanya punya keterbatasan. Mereka percaya bahwa tes standar sangat berguna untuk
memberikan informasi tentang komparabilitas dari perspektif gambar besar.
Membandingkan kelas dengan kelas lain yang tidak akan memberikan informasi tentang
posisi peserta didik di antara populasi peserta didik yang lebih luas.
Oleh karena itu, Worthen dan spandel meminta guru untuk menghindari penyalagunaan
keduanya juga mengatakan bahwa tes standar hanya salah satu dari sekian banyak
penilaian utnuk mengevaluasi peserta didik.
Selain isu isu yang tersebut di atas, diversitas atau penilaian juga menjadi salah satu isu
yang berkembang pada tes standar. Isu yang berhubungan dengan diversitas atau
penilaian,contoh diambil dari Santrock (2004) peserta didik afrika-amerika dan latino
mendapat nilai sekitar 15 poin dibawah rata-rata peserta didik kulit putih pada tes
intelegensi. Kesenjangan ini dihubungkan dengan masalah lingkungan bukan karena
faktor hereditas. Selain itu, menurut hasil penelitian peserta didik afrika-amerika,latino
dan suku Indian asli menunjukkan level profesiensi atau kecapakan yang rendah di antara
semua kelompok peserta didik untuk mata pelajaran matematika, sains dan lainnya.
Perhatian khusus adalah pada bias cultural dalam tes dan arti penting dari pembuatan tes
yang responsif secara cultural untuk keperluan diagnostic dan isntruksional. Karena ada
potensi bias kultural dalam tes standar maka penting untuk menilai peserta didik dengan
menggunakan berbagai macam metode seperti banyak pakar percaya bahwa penilaian
kinerja dan portopolio akan mengurangi ketidakadilan yang menjadi ciri tes standar
untuk murid minoritas dan miskin.
16
BAB III
PENUTUP
Kesimpulan:
Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim ahli, atau disusun
oleh lembaga yang khusus menyelenggarakan secara professional. membandingkan tingkat
prestasi siswa dalam keterampilan di berbagai bidang studi untuk individu atau kelompok,
membandingkan prestasi siswa antara berbagai sekolah atau kelas, dan mempelajari
perkembangan siswa dalam suatu periode waktu tertentu.
Perbandingan antara tes standar dengan tes buatan guru, tes standar ini disusun dalam tipe-
tipe soal yang sama dan meliputi bahan atau pengetahuan yang sama banyak dengan bahan atau
pengetahuan yang dicakup oleh tes buatan guru. Sedangkan perbedaannya diantaranya didasarkan
atas bahan dan tujuan, serta reliabilitasnya.
Tes kecakapan ini mencakup tes kemampuan mental umum seperti tes kecerdasan
(Stanford-Binet, Wechsler Scales, dan sebagainya). Tes prestasi dimaksudkan untuk mengukur
apa yang telah dipelajari atau keahlian apa yang telah dikuasai murid. Contohnya Tes Ujian Negara
Beresiko Tinggi dan Tes Distrik Nasional.
Peran penting guru dalam mempersiapkan murid untuk ujian adalah memberikan dukungan
dan tidak menjatuhkan mental murid, membantu murid untuk mengurangi rasa takut akan ujian
serta membekali murid dengan ilmu. Asumsi bahwa guru melaksanakan pembelajaran yang
arahannya memberikan pengetahuan kepada murid sebanyak-banyaknya. Dalam distribusi normal
terdapat beberapa jenis nilai yang dapat dipilih oleh guru untuk membantunya menginterpretasi
nilai. Jenis nilai tersebut antara lain nilai mentah, nilai percentile rank, nilai stanine, nilai grade-
equevalent, nilai stand9ar, nilai Z, nilai T
17
DAFTAR PUSTAKA
Arikunto, Suharsimi. (1988). Dasar-dasar Evaluasi Pendidikan. Penerbit Bina
Jakarta : Aksara.
Bahri Djamarah, Syaiful. 2002. Psikologi Belajar. Jakarta : Rineka Cipta.
Khodijah, Nyayu. 2014. Psikologi Pendidikan. Jakarta : RajaGrafindo Persada.
Kusaeri & Suprananto. 2012. Pengukuran dan Penilaian Pendidikan. Yogyakart :
Graha Ilmu.
Nasution, 2013. Berbagai Pendekatan dalam Proses Belajar & Mengajar.
Bandung : Bumi Aksara.
Rusyan,T.1993.Evaluasi Dalam Proses Belajar Mengajar.Bandung: Bina Budaya
Santrock, John W. 2004. Psikologi Pendidikan edisi kedua. Jakarta : Prenada
Media Group
Thoha, Chabib. 2001. Teknik Evaluasi Pendidikan. Jakarta: PT RajaGrafindo Persada.
18

Makalah Psikologi Tes (Final)

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Makalah Psikologi Tes (Final)

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB I

A. Macam-Macam Jenis Pengukuran dan Penilaian Dalam Pendidikan

Tes Standar Tes Buatan Guru

Tes Standar Tes Buatan Guru

1.1 Tujuan Tes Standar:

1.2 Kriteria Untuk Mengevaluasi Tes Standar

1. Ujian Negara Beresiko Tinggi (high stakes)

2. Tes Distrik dan Nasional

2. Menjalankan Tes Standar

3. Memahami dan Menginterprestasi Hasil Tes

Kegunaan interpretasi hasil tes adalah memudahkan guru dalam menjelaskan

Nilai mentah (raw score)

Nilai percentile rank

Menurut McMillan (2002) dalam Santrock (2004) mengatakan guru dapat

D. Isu isu dalam Tes Standar

Arikunto, Suharsimi. (1988). Dasar-dasar Evaluasi Pendidikan. Penerbit Bina

Bahri Djamarah, Syaiful. 2002. Psikologi Belajar. Jakarta : Rineka Cipta.

Khodijah, Nyayu. 2014. Psikologi Pendidikan. Jakarta : RajaGrafindo Persada.

Kusaeri & Suprananto. 2012. Pengukuran dan Penilaian Pendidikan. Yogyakart :

Nasution, 2013. Berbagai Pendekatan dalam Proses Belajar & Mengajar.

Bandung : Bumi Aksara.

Rusyan,T.1993.Evaluasi Dalam Proses Belajar Mengajar.Bandung: Bina Budaya

Santrock, John W. 2004. Psikologi Pendidikan edisi kedua. Jakarta : Prenada

Thoha, Chabib. 2001. Teknik Evaluasi Pendidikan. Jakarta: PT RajaGrafindo Persada.

Anda mungkin juga menyukai