Anda di halaman 1dari 41

Bahan Ajar

TES PRESTASI DAN PENEGASAN KAWASAN UKUR

Tim Penyusun:

 Luh Kadek Pande Ary Susilawati  Naomi Vembriati


 Supriyadi  Luh Made Karisma Sukmayati
 Adijanti Marheni Suarya
 David Hizkia Tobing  Made Diah Lestari
 Dewi Puri Astiti  Ni Made Swasti Wulanyani
 I Made Rustika  Putu Wulan Budisetyani
 Komang Rahayu Indrawati  Ni Made Ari Wilani
 Putu Nugrahaeni Widiasavitri  Yohanes Kartika Herdiyanto

Program Studi Psikologi


Fakultas Kedokteran
UNIVERSITAS UDAYANA
2017
PRAKATA

Puji syukur atas rahmat Tuhan Yang Maha Esa penulis ucapkan sehingga buku ini
dapat terselesaikan. Bahan ajar Tes Prestasi dan Penegasan Kawasan Ukur ini secara
khusus disusun sebagai materi ajar yang digunakan dalam kegiatan belajar mengajar
pada mata kuliah Konstruksi Alat Ukur bagi mahasiswa Program Studi Psikologi
Fakultas Kedokteran Universitas Udayana dan secara umum bagi pembaca yang
memiliki minat dalam materi Konstruksi Alat Ukur dalam implementasi bidang
Psikologi. Buku ini berisi mengenai teori-teori dalam merancang / mengkonstruksi alat
ukur psikologi ke dalam suatu bentuk kerja penyusunan skala psikologi yang
sesungguhnya, khususnya tes prestasi.

Denpasar, 20 September 2017

Tim Penyusun
Program Studi Psikologi

Fakultas Kedokteran Universitas Udayana

Satuan Acara Perkuliahan (SAP)

Nama Dosen : Luh Kadek Pande Ary Susilawati, S.Psi, M.Psi, Psi (KD)

Drs. Supriyadi, M.S (SP)

Program Studi : Psikologi

Kode Mata Kuliah : 13350511 (PSU 23304 – I)

Nama Mata Kuliah : Konstruksi Alat Ukur/ Jumlah SKS: 3

Kelas/Semester : 5 (Lima) / Setiap hari Rabu

Alokasi Waktu : 220 menit (Kuliah 50/Individual 60/SGD 60/Pleno 50)

Total pertemuan : 15 (+ UTS dan UAS)

Deskrispsi Mata Kuliah : Mata kuliah Konstruksi Alat Ukur mempelajari teori-teori
(TIU) perancangan alat ukur psikologi. Dengan mempelajari mata kuliah
ini mahasiswa diharapkan dapat sepenuhnya mandiri dalam
mengaplikasikan teori-teori konstruksi alat ukur psikologi kedalam
suatu bemtuk kerja penyusunan skala psikologi yang
sesungguhnya

Pertemua
Materi Kuliah/Topik Content Perkuliahan Dosen
n

- Definisi tes
- Klasifikasi tes
1. Tes, Angket dan Skala - Karakter Skala Psikologi L. K. Pande Ary
- Perbedaan Skala dan Angket
Psikologi sebagai Alat - Langkah-langkah Dasar Susilawati
6 Sept
Ukur Konstruksi
2017
1. Test sebagai pengukur prestasi
2. Test sebagai motivator dalam
2. Tes Prestasi belajar L. K. Pande Ary
3. Keterbatasan test prestasi
4. Prinsip dasar pengukuran Susilawati
13 Sept
prestasi
2017

1. Identifikasi tujuan ukur


2. Membatasi cakupan isi test
3. 3. Menentukan tingkat kompetensi
Perencanaan Test yang akan diungkap L. K. Pande Ary
20 Sept Prestasi 4. Menentukan tipe item Susilawati
5. Menentukan banyaknya item
2017 6. Tabel spesifikasi

1. Atribut Psikologi sebagai L. K. Pande Ary


Konstruk Hipotetik
Susilawati
4. 2. Definisi Atribut dan Indikator
Penegasan Kawasan Ukur perilaku
27 Sept 3. Menyajikan Blue-Print

2017

Pertemuan Materi Kuliah/Topik Content Perkuliahan Dosen

1. Penulisan item tipe pilihan


ganda
Penulisan Item 2. Penulisan item tipe benar salah L. K. Pande Ary
3. Penulisan item tipe jawaban
pendek Susilawati
5. 4. Format penulisan item skala
psikologi
4 Okt 2017 5. Format Respon
6. Beberapa Kaidah Penulisan

6. 1. Pemberian skor (skoring)


Pemberian skor tes 2. Pemberian nilai
11 Okt 3. Penskalaan Stimulus, Respon Supriyadi
prestasi
dan Subyek
2017

7. Analisis Item Tes 1. Taraf kesukaran item


2. Daya diskriminasi item Supriyadi
Prestasi 3. Validasi item
Tanggal
4. Pola penyebaran jawaban
ditentukan
kemudian

UTS

16 Okt – 27 Okt 2017

8. 1. Uji Coba Item


2. Parameter Item Untuk Skala
1 Nov Psikologi
Analisis Item Skala 3. Koreksi terhadap Spurious Overlap
2017 4. Memilih Item Berdasarkan Supriyadi
Psikologi
Koefisien Korelasi
Libur 5. Atribut tunggal vs atribut Komposit
galungan

9. Tampilan dan 1. Format dan Tata letak


2. Penggunaan warna
Administrasi
8 Nov 2017 3. Lembar Jawaban
4. Data Identitas Supriyadi
5. Instruksi / Petunjuk Mengerjakan

10. 1. Beberapa tipe validitas


2. Beberapa pendekatan reliabilitas
15 Nov Validitas dan Realibitas 3. Arti koefisien reliabilitas Supriyadi
4. Error standar dalam pengukuran
2017 5. Arti koefisien validitas

11. 1. Validasi Multitrait-Multi Method


2. Validasi Konkuren
22 Nov Validasi Skala 3. Makna Koefisien Validitas Supriyadi

2017

1. Kategorisasi berdasar Kurva Normal


2. Kategorisasi berdasar Beda
12. Interpretasi Skor Signifikasi
3. Pertimbangan Error Standar Supriyadi
29 Nov Pengukuran

2017

Minggu Tenang (11 – 13 Des 2017)

UAS (14 Des - 29 Des 2017)


Referensi :

1. Azwar, S. 1995. Sikap Manusia. Yogyakarta : Pustaka Pelajar.


2. Azwar, S. 1988. Reliabilitas dan Validitas, Yogyakarta : Liberty.
3. Azwar, S. 1999. Penyusunan Tes Prestasi. Yogyakarta : Pustaka Pelajar
4. Azwar, S. 1999. Penyusunan Skala Psikologi. Yogyakarta : Pustaka Pelajar

Penilaian/Evaluasi

1. UTS: pilihan ganda (35%)


2. UAS: pilihan ganda (35%)
3. Tugas kelompok: melakukan pembuatan – uji coba skala psikologis (10%)
4. Tugas individu: membuat desain skala psikologis (blue print) penelitian (20%)

Demikian kontrak perkuliahan ini dibuat, agar disetujui dan ditaati oleh semua pihak.

Menyetujui

Dosen pengampu MK

Mahasiswa Konstruksi Alat Ukur

(……………………………) (..............................................)
MATERI 1
PENGANTAR KONSTRUKSI ALAT UKUR

A. SUB MATERI I
Perbedaan Tes Dengan Ujian
Istilah tes telah sedemikian populernya di berbagai kalangan masyarakat kita
sehingga bukan lagi merupakan sesuatu yang asing. Boleh dikatakan hampir setiap orang
pernah mendengar, membicarakan atau bahkan pernah mengalami dikenai tes dalam situasi
dan keperluan yang berbeda.
Namun apabila ditanya mengenai apakah sebenarnya tes itu, kiranya tidak banyak
orang yang benar-benar memahami dan dapat menjelaskannya secara baik. Apa yang
terbayang dalam pikiran masing-masing orang apabila mendengar kata “tes” belum tentu
merupakan konsep aau gambaran yang tepat, walaupun biasanya memang menggambarkan
situasi yang kurang lebih serupa.
Sebagian orang menyamakan pengertian tes dengan pengertian ujian, sebagian lagi
tidak.perbedaan itu barangkali lebih banyak disebabkan oleh pemberian konotasi yang
tidak sama dari setiap orang pada istilah tes, bukan disebabkan perbedaan pengertian
antara tes dan ujian itu sendiri
Dalam mata kuliah konstruksi alat ukur, yang digunakan adalah istilah tes dalam arti
tes nonfisik atau dengan kata lain mengacu pada pengertian tes psikologis, yaitu tes yang
dimaksudkan untuk mengungkap aspek-aspek psikologis dalam diri manusia. Sebagian
individu menyamakan pengertian tes dengan ujian, namun terdapat beberapa perbedaan
antara tes dengan ujian, antara lain:
No Tes Ujian
1 Belum mengetahui dengan jelas apa Mengetahui dengan jelas apa yang
yang diukur diukur.
2 Tidak ada batasan terkait dengan Materi yang harus dipelajari sudah ada
materi yang akan dipelajari. batas-batasnya.
3 Tidak mengetahui bagaimana tes Mengetahui bagaimana ujian tersebut
ditempuh sebelum ada instruksi dari akan ditempuh, termasuk cara
tester (kecuali sudah sering mengerjakannya.
menempuh tes psikologi)
Tes Dan Pengukuran

Dilihat dari wujud fisiknya, tes merupakan sekumpulan pertanyaan yang harus
dijawab dan/atau tugas yang harus dikerjakan yang akan memberikan informasi mengenai
aspek psikologis tertentu berdasarkan jawaban terhadap pertanyaan-pertanyaan atau cara
dan hasil subjek dalam melakukan tugas-tugas tersebut.
Batasan dari definisi ini masih sangat sederhana karena pada kenyataannya tidak
semua kumpulan pertanyaan cukup berharga untuk dinamakan tes. Terdapat banyak syarat
kualitas yang harus dipenuhi oleh rangkaian pertanyaan agar dapat disebut sebagai tes.
Terdapat beberapa definisi mengenai tes, antara lain:
1. Suatu pengukuran yang objektif dan standar terhadap sampel perilaku (Anastasi,
1976).
2. Prosedur yang sistematik guna mengukur sampel perilaku seseorang (Brown, 1976).
3. A systematic procedure for observing a person’s behavior and describing it with the
aid of a numerical scale or a category system (Cronbach, 1970).
Dari berbagai macam batasan mengenai tes, dapat ditarik beberapa kesimpulan
pengertian, antara lain:
1. Tes adalah prosedur yang sistematik, artinya:
a. Aitem disusun menurut cara dan aturan tertentu.
b. Administrasi dan skoring harus jelas dan terperinci.
c. Setiap orang yang menjalani tes harus menerima aitem yang sama dengan
kondisi sebanding (terstandarisasi)
2. Berisi sampel perilaku, artinya:
a. Tetap tidak dapat mencakup seluruh perilaku, hanya sampel perilakunya saja.
b. Kelayakan suatu tes tergantung pada sejauhmana aitem-aitem dalam tes
mewakili secara representatif kawasan (domain) perilaku yang diukur.
3. Tes mengukur perilaku, artinya aitem-aitem dalam tes menghendaki agar subjek
menunjukkan apa yang diketahui atau apa yang telah dipelajari subjek dengan cara
menjawab pertanyaan-pertanyaan atau mengerjakan tugas-tugas yang dikehendaki
oleh tes.
Sedangkan terdapat beberapa hal yang tidak tercakup dalam pengertian tes, yaitu:
1. Definisi tes tidak memberikan spesifikasi mengenai formatnya, artinya tes dapat
disusun dalam berbagai bentuk dan tipe sesuai dengan tujuan dan maksud
penyusunan tes.
2. Definisi tes tidak membatasi materi yang dapat dicakupnya, artinya tes dapat
dirancang untuk melakukan pengukuran terhadap hasil belajar, terhadap kemampuan
atau abilitas, terhadap kemampuan khusus atau bakat, inteligensi, dan sebagainya.
3. Subjek yang dikenai tes tidak selalu perlu dan tidak selalu pula harus tahu kalau ia
sedang dikenai tes, dan subjek tidak perlu tahu aspek psikologis apa yang sedang
diungkap dalam dirinya.

Pengukuran

Pengukuran memiliki arti yang sering dipertukarkan dengan pengertian tes. Hal
demikian adalah lazim dikarenakan pemakaian istilah tes dan istilah pengukuran seringkali
tidak mengandung arti yang berbeda dalam situasi-situasi tertentu. Sebagian ahli
psikometri membatasi tes sebagai suatu prosedur khusus yang merupakan bagian dari
pengukuran secara keseluruhan. Tyler (1971) mengatakan bahwa pengukuran adalah
“…assignment of numerals according to rules”. Jadi pemberian angka seperti dilakukan
dalam tes memang merupakan suatu bentuk pengukuran.
Ciri pokok pengukuran adalah:
1. Adanya pembandingan atribut dengan alat ukur secara deskriptif.
2. Deskriptif artinya menyatakan hasl ukur secara kuantitatif hanya dengan satuan atau
besar ukurnya saja tanpa memberikan penilaian kualitatif.
Karena tes merupakan alat pengukuran, maka istilah pengetesan sering diganti
dengan istilah pengukuran. Yang terpenting dalam hal ini adalah penggunaan kedua istilah
tersebut dapat dipertukarkan atau saling menggantikan dan kapan kedua istilah tersebut
harus dibedakan agar tidak menimbulkan salah pengertian.
Dalam halnya tes prestasi belajar, pengertian pengukuran prestasi adalah sama
dengan pengertian pengetesan prestasi. Akan tetapi istilah tes lebih banyak dan lebih
populer digunakan dalam konteks belajardi kelas atau di sekolah. Hal ini mungkin sekali
disebabkan karena tes prestasi mengandung pengertian situasi yang lebih formal, tertib dan
lebih terencana daripada pengukuran prestasi. Pengukuran prestasi lebih sering digunakan
pada situasi di luar kelas yang kadang-kadang sifatnya tidak begitu formal dan tampaknya
lebih banyak dikenakan pada kawasan prestasi motorik seperti pengukuran prestasi atletik,
misalnya.

B. SUB MATERI II
Klasifikasi Tes
Cronbach (1970) membagi tes menjadi dua kelompok besar, yaitu tes yang
mengukur performansi maksimal dan tes yang mengukur performansi tipikal.
1. Tes yang mengukur Performansi Maksimal.
a. Tes ini dirancang untuk mengungkap apa yang mampu dilakukan oleh
seseorang dan seberapa baik ia mampu melakukannya.
b. Stimulus yang disajikan harus jelas struktur dan tujuannya, sehingga subjek
tahu arah jawaban yang dikehendaki.
c. Jawaban dipilah salah – benar.
d. Petunjuk pengerjaan harus dibuat sederhana dan jelas.
e. Cara skoring diberitahukan kepada subjek, termasuk waktu pengerjaannya.
f. Hanya pendekatan dan strategi penyelesaian saja yang tidak diinformasikan
kepada subjek.
g. Dalam penyajian tes ini, individu yang dites selalu didorong untuk berusaha
sebaik-baiknya agar memperoleh skor setinggi mungkin. Kesiapan, motivasi,
keinginan berusaha, dan bahkan kondisi subjek sangat menentukan
keberhasilan dalam menghadapi tes jenis ini.
h. Contoh tes ini adalah tes bakat, tes prestasi belajar, dan berbagai tes
kemampuan lainnya

2. Tes yang mengukur Performansi Tipikal.


a. Tes ini dirancang untuk mengukur kecenderungan reaksi dan perilaku individu
ketika berada dalam situasi-situasi tertentu.
b. Stimulus berstruktur ambigu dan memungkinakan untuk diinterpretasikan
secara subjektif.
c. Jawaban tidak dipilah benar-salah, melainkan didiagnosis menurut norma-
norma tertentu.
d. Subjek tidak mengetahui hal yang diharapkan darinya, sehingga akan terjadi
reaksi projektif dari diri subjek yang dikenai tes kedalam bentuk respons
(jawaban) yang diberikannya.
e. Yang tergolong dalam kelompok tes yang mengukur performansi tipikal adalah
tes yang mengungkap minat, sikap, dan berbagai bentuk skala kepribadian.

Ditinjau dari cara klasifikasi lain, tes dapat pula dikelompokkan sebagai tes yang
mengungkap atribut kognitif dan tes yang mengungkap atribut non-kognitif. Diagramnya
adalah sebagai berikut:

Berdasarkan bagan diatas, dapat dilihat bahwa tes kognitif dapat mengukur abilitas
potensial dan abilitas aktual
a. Abilitas potensial merupakan atribut yang diasumsikan sebagai suatu bentuk
kemampuan bawaan yang belum tampak dalam performansi. Atribut bawaan ini
terdapat dalam diri individu dengan kadar yang berbeda-beda.
Abilitas potensial yang berupa kemampuan menghadap persoalan yang bersifat
umum, yaitu menghendaki pengerahan strategi pemecahan masalah secara
umum, atau dikenal dengan nama inteligensi. Abilitas potensial yang dimiliki
manusia juga ada yang bersifat sangat khusus, artinya merupakan kemampuan
yang dapat dikembangkan pada bidang-bidang tertentu, yang biasanya disebut
dengan bakat
b. Abilitas kognitif meliputi pula abilitas aktual, yaitu abilitas yang telah
diterjemahkan dalam bentuk performansi nyata. Performansi nyata yang disebut
dengan prestasi ini merupakan fungsi dari abilitas potensial dan hasil belajar.
Tes Prestasi Belajar
Benyamin S. Bloom dkk. membagi kawasan belajar menjadi tiga bagian, yaitu
kognitif, afektif dan psikomotor. Tes prestasi belajar berupa tes yang disusun secara
terencana untuk mengungkap performansi maksimal subjek dalam menguasai bahan-bahan
atau materi yang telah diajarkan.
Tes prestasi belajar dibedakan dari tes kemampuan lain bila dilihat dari tujuannya,
yaitu mengungkap keberhasilan seseorang dalam belajar. Tujuan ini membawa keharusan
dalam konstruksinya untuk selalu mengacu pada perencanaan program belajar yang
dituangkan dalam silabus masing-masing materi pelajaran.
Sebagaiman halnya pada bentuk-bentuk tes yang lain, hakikat penyelenggaraan
testing sebenarnya adalah usaha menggali informasi yang dapat digunakan sebagai dasar
dalam pengambilan keputusan. Dalam kaitannya dengan tugas seorang teaga pengajar, tes
prestasi belajar merupakan salah satu alat pengukuran di bidang pendidikan yang sangat
penting artinya sebagai sumber informasi guna pengambilan keputusan.
Tes prestasi belajar berupa tes yang disusun secara terencana untuk mengungkap
performansi maksimal subjek dalam menguasai bahan-bahan atau materi yang telah
diajarkan. Tes prestasi dalam kegiatan pendidikan formal di kelas dapat berbentuk
ulangan-ulangan harian, tes formatif, tes sumatif, bahkan ebtanas dan ujian-ujian masuk
perguruan tinggi. Seorang tenaga pengajar haruslah mengetahui dasar-dasar penyusuan tes
prestasi belajar yang baik agar dapat memperoleh hasil ukur yang akurat (valid) dan
reliabel (dapat dipercaya). Ia harus pula mengetahui aspek-aspek penggunaannya yang
layak di kelas, mengetahui cara-cara pemberian angka dan yang paling penting adalah
mengetahui pula cara interpretasi hasil pengukuran tersebut.
Tes Prestasi Dalam Sistem Pendidikan
Dalam proses pendidikan dan pengajaran setiap saat akan selalu ada situasi yang
memerlukan pengambilan keputusan. Setiap orang yang terlibat dalam proses pendidikan
pada suatu ketika akan harus mengambil suatu bentuk keputusan pendidikan, yaitu
keputusan-keputusan yang menyangkut berbagai hal dalam pendidikan sebagai suatu
sistem.
Keputusan-keputusan tersebut dapat berupa keputusan didaktik yang diperlukan guna
memenuhi kebutuhan pengajaran, seperti keputusan yang menyangkut ketepatan
kurikulum yang berlaku. Keputusan pendidikan dapat berupa keputusan administratif guna
memenuhi kebutuhan administrasi seperti misalnya keputusan mengenai nilai yang hendak
diberikan pada subjek atau keputusan mengenai kelulusan. Keputusan pendidikan juga
dapat berupa keputusan bimbingan penyuluhan guna memberikan bimbingan dalam
penjurusan dan penentuan karir.
Apapun bentuknya, agar suatu keputusan pendidikan menjadi bermanfaat haruslah
didasari oleh informasi-informasi yang tepat, akurat, dan reliabel yang berkaitan dengan
permasalahannya. Sebagai contoh, keputusan untuk memberikan nilai tertentu terhadap
hasil ujian mahasiswa tidaklah dapat dilakukan semata-mata berdasarkan pertimbangan
subjektif dosen dikarenakan pertimbangan subjektif adalah tidak akurat dan tidak relevan
dalam penilaian prestasi belajar mahasiswa. Untuk memberikan bimbingan dan pengarahan
kepada mahasiswa mengenai jurusan atau pelajaran yang akan diambilnya dalam suatu
program studi, tidaklah dapat disandarkan hanya pada keinginan dan minat si mahasiswa
itu saja, akan tetapi haruslah pula didasari oleh informasi lain mengenai bakat dan
kemampuannya.
Seorang tenaga pengajar, baik sebagai guru maupun sebagai dosen, merupakan salah
satu komponen penting dalam sistem pendidikan. Pentingnya fungsi tenaga pengajar tidak
saja dikarenakan ia harus berdiri langsung berhadapan dengan para anak didik dalam
menyampaikan bahan pelajarannya, tidak saja karena ia adalah yang paling berperanan
dalam kelancaran proses belajar mengajar, akan tetapi karena dialah yang akan paling
banyak membuat keputusan-keputusan pendidikan yang pada gilirannya akan banyak
menentukan arah dan kemajuan belajar anak didiknya. Oleh karena itu, seorang tenaga
pengajar haruslah dapat menentukan mana informasi yang relevan dan akurat dalam setiap
keputusan yang harus diambilnya.
Banyak sekali keputusan pendidikan yang diambil berdasarkan hasil tes prestasi
belajar. Sebagai contoh antara lain adalah pemberian nilai suatu mata pelajaran, penentuan
lulus tidaknya seorang siswa, perlu tidaknya penyelenggaraan kegiatan belajar tambahan,
perlu tidaknya pengulangan suatu bagian pelajaran tertentu, penempatan mahasiswa pada
suatu program, banyaknya kredit mata kuliah yang dapat diambil pada semester
berikutnya, dll.
Berbagai macam keputusan pendidikan tersebut menempatkan tes prestasi belajar
dalam beberapa fungsi, antara lain:
1. Fungsi penempatan; merupakan penggunaan hasil tes prestasi belajar untuk
klasifikasi individu ke dalam bidang atau jurusan yang sesuai dengan kemampuan
yang telah diperlihatkan pada hasil belajar sebelumnya. contohnya adalah
penggunaan nilai rapor kelas 2 SMA untuk menentukan jurusan studi di kelas 3.
2. Fungsi formatif; merupakan penggunaan hasil tes prestasi belajar untuk melihat
sejauhmana kemajuan belajar yang telah dicapai oleh siswa dalam suatu program
pelajaran. Dalam hal ini, hasil tes prestasi belajar merupakan hasil feedback dan
biasanya diselenggarakan di tengah jangka waktu suatu program sedang berjalan.
Contoh tes prestasi adalah ujian tengah semester di perguruan tinggi atau setiap
semester di SMA.
3. Fungsi diagnostik; tes yang bersangkutan digunakan untuk mendiagnosis kesukaran-
kesukaran dalam belajar, mendeteksi kelemahan-kelemahan siswa yang dapat
diperbaiki dengan segera, dan sebagainya. Contohnya adalah penyelenggaraan kuis
atau ulangan harian.
4. Fungsi sumatif; merupakan penggunaan hasil tes prestasi untuk memperoleh
informasi megenai penguasaan pelajaran yang telah direncanakan sebelumnya dalam
suatu program pembelajaran. Tes ini merupakan pengukuran akhir dalam suatu
program dan hasilnya dipakai untuk menentukan apakah siswa dapat dinyatakan
lulus dari program tersebut, atau apakah siswa dinyatakan dapat melanjutkan ke
jenjang program yang lebih tinggi. Contohnya adalah ujian nasional.
Suatu tes prestasi sumatif pada program tertentu dapat dipandang sebagai ter yang
berfungsi formatif bagi suatu proses pengajaran yang lebih luas yang merupakan
rangkaian program-program pengajaran bertahap. Contohnya, tes sumatif di kelas
untuk menetapkan kenaikan kelas yang sekarang dikenal dengan nama EBTA dapat
dipandang sebagai memiliki fungsi formatif bagi rangkaian pendidikan di sekolah
tingkat lanjutan atas.
C. Kesimpulan
Tes dan pengukuran memiliki arti yang berbeda namun memiliki fungsi yang sama.

D. Latihan soal mandiri (quiz)


Temukanlah masing-masing contoh klasifikasi tes menurut atribut yang diungkap.
Temukanlah contoh dari angket dan skala.
E. Daftar Pustaka
Buku/bacaan pokok dalam perkuliahan ini adalah:
Azwar, S. (2015). Tes prestasi: Fungsi pengembangan pengukuran prestasi belajar,
Edisi kedua. Yogyakarta: Pustaka Pelajar.
MATERI 2
TES PRESTASI

A. SUB MATERI

Tes Sebagai Pengukur Prestasi


Sebagaimana ditunjukkan oleh namanya, tes prestasi belajar bertujuan untuk mengukur
prestasi atau hasil yang telah dicapai oleh siswa dalam belajar. Dalam dunia pendidikan,
pentingnya pengukuran prestasi belajar tidaklah dapat disangsikan lagi. Sebagaimana kita
ketahui, pendidikan formal merupakan suatu sistem yang kompleks yang
penyelenggaraannya memerlukan waktu, dana, tenaga, dan kerjasama berbagai pihak.
Berbagai faktor dan aspek terlibat dalam proses pendidikan yang secara sendirinya berhasil
mencapai tujuan yang digariskan tanpa adanya interaksi berbagai faktor pendukung dari
luar dan dalam sistem yang bersangkutan.
Betapapun jelasnya penggarisan tujuan pendidikan, tanpa adanya usaha pengukuran
mustahil hasilnya dapat diketahui. Tidaklah layak untuk menyatakan adanya suatu
kemajuan atau keberhasilan program pendidikan tanpa memberikan bukti peningkatan atau
pencapaian yang telah diperoleh. Bukti adanya peningkatan atau pencapaian inilah yang
antara lain harus diambil dari pengukuran prestasi terencana.
Setiap orang yang terlibat dalam proses pendidikan sebagai guru, dosen, siswa,
orangtua, pejabat sekolah, pengamatan pendidikan, dan orang-orang lain yang
berkepentingan harus dapat mengetahui sejauhmana usaha pendidikan telah membuahkan
hasil. Dengan demikian mereka akan tahu mana program yang boleh diteruskan
pelaksanaannya, mana yang masih perlu ditingkatkan lagi, dan mana yang harus
ditinggalkan karena tidak efisien atau tidak banyak memberikan hasil yang diharapkan.
Robert L. Ebel (1979) menyatakan bahwa fungsi utama tes prestasi di kelas adalah
mengukur prestasi belajar para siswa. Adalah suatu kesalahpahaman bila menganggap
bahwa apa yang dapat dilakukan oleh tes prestasi semata-mata memberikan angka untuk
dimasukkan ke dalam rapot murid atau kedalam laporan hasil studi siswa. Sesungguhnya
prosedur tes guna mengukur prestasi mengandung nilai-nilai pendidikan yang penting.
Seringkali tes membantu guru memberikan nilai yang akurat (valid) dan dapat dipercaya.
Dengan demikian, akan dapat pula diperoleh kesimpulan yang lebih pada tempatnya.
Walaupun tes merupakan cerminan apa yang telah dapat dicapai oleh siswa dalam
belajarakan tetapi merupakan tanggung jawab pihak pengajar untuk selalu menekankan
agar para siswa tidak belajar semata-mata untuk mendapatkan nilai yang tinggi dalam tes.
Hal ini telah menjadi permasalahan sejak lama. Pada pihak siswa, nilai tes prestasi
seringkali menjadi tujuan utama yang harus diperoleh dengan cara apapun. Suatu hasil tes
yang diperoleh dengan cara yang tidak jujur tentu tidak dapat menjadi cerminan yang
benar mengenai prestasi siswa yang bersangkutan dan karenanya hasil tes seperti itu akan
memberikan indormasi yang keliru mengenai keberhasilan belajar siswa tersebut.
Di pihak lain, usaha yang dilakukan oleh siswa dengan sebaik-baiknya dalam belajar
tentu tidak akan dapat dideteksi dengan cermat apabila tes yang digunakan tidak dirancang
dan ditulis dengan baik pula. Menanamkan kesadaran diri anak didik bahwa apa yang
diharapkan dari mereka adalah penguasaan pelajaran dan pemahaman yang berarti
bukanlah hal yang mudah. Terdapat persepsi yang kuat dalam diri siswa bahwa suatu nilai
yang baik merupakan tanda keberhasilan belajar yang tinggi, sedangkan nilai tes yang
rendah merupakan kegagalan dalam belajar. Karena nilai tes dianggap sebagai satu-
satunya indikator yang mempunyai arti penting maka nilai tes itulah biasanya yang
menjadi target usaha mereka dalam belajar.

Tes Sebagai Motivator Dalam Belajar


Hampir semua ahli teori belajar, baik konsep behaviorisme, kognitif, dan psikologi
belajar menekankan pentingnya umpan balik berupa nilai penting untuk meningkatkan
belajar. Pengalaman menunjukkan bahwa siswa akan belajar lebih giat dan berusaha lebih
keras apabila mereka mengetahui bahwa di akhir program yang sedang ditempuh akan
diadakan tes untuk mengetahui nilai dan prestasi mereka. Paling tidak, para siswa yang
mengetahui akan adanya tes cenderung untuk belajar dan mempelajari apa yang
diperkirakannya akan ditanyakan dalm tes. Dalam hal ini dapat dikatakan bahwa tes
merupakan faktor yang memotivasi dan mengarahkan siswa dalam belajarapabila tes yang
digunakan itu memang mengukur prestasi secara benar maka unsure motivasi dan
penghargaan yang dimiliki oleh tes tersebut adalah sangat berharga.
Robert L. Ebel (1979) mengemukakan bahwa tes seringkali dianggap jenis motivator
esktrinsik, bukan motivasi intrinsik. Disisi lain, teori psikologi mengatakan efek motivator
ekstrinsik biasanya tidak dapat bertahan lama dan segera hilang apabila tujuan telah
tercapai atau apabila tujuan semula terlalu sulit untuk dicapai.
Disamping antisipasi akan adanya tes itu sendiri dapat sebagai motivasi untuk belajar,
teori psikologi behaviorisme memandang bahwa hasil tes yang baik dan yang segera
diketahui oleh siswa akan menjadi pengalaman yang menyenangkan dan memperkuat
dorongan untuk belajar kembali.

B. SUB MATERI
Keterbatasan Tes Prestasi
Berbeda dengan pengukuran atribut fisik yang dapat dilakukan dengan akurasi dan
kecermatan yang tinggi dan dengan alat yang pada umumnya jauh lebih mudah dibuat,
pengukuran aspek psikologis tidak pernah dapat mencapai ketepatan yang sangat tinggi.
Objek ukur tes prestasi adalah aspek mental psikologis atau atribut nonfisik dan
karenanya tidak dapat diharapkan hasil pengukuran yang akurat sekali. Dalam hal ini, tidak
dapat digunakan satuan pengukuran nol secara mutlak dikarenakan pengertian nol dalam
tes prestasi belajar bersifat nisbi dan tidak jelas maknanya. Meskipun untuk hasil
interpretasi tes prestasi belajar digunakan mean, deviasi standar, dan angka-angka korelasi,
namun skala pengukuran yang digunakan dalam tes ini biasanya tidak dapat dinyatakan
dalam satuan ukur yang mengandung arti kuantitatif atau kualitatif yang bermakna pasti
Skor tes yang dimaksud belum tentu dapat digunakan sebagai indikator penguasaan
materi pelajaran tertentu karena:
1. Konsep yang harus dikuasai belum dirumuskan secara baik dan operasional.
2. Isi yang diujikan belum ada batas cakupan secara spesifik.
3. Aitem-aitem yang disajikan dalam tes belum cukup komprehensif dan belum
mewakili kawasan (domain) pengetahuan yang hendak diukur.
4. Aitem-aitem dalam tes ditulis hanya pada tingkat penguasaan (kompetensi) yang
rendah sehingga tidak mencerminkan tingkatan kompetensi yang lebih tinggi.

Prinsip-Prinsip Pengukuran Prestasi Belajar


Seperti telah dikemukakan terdahulu, hasil tes prestasi merupakan salah satu
informasi penting guna pengambilan keputusan pendidikan. Namun perlu diingat bahwa
apakah informasi tersebut merupakan informasi yang benar dan dapat dipercaya tergantung
pada sejauhmana tes yang digunakan itu memenuhi kriteria sebagai tes prestasi yang layak.
Tes prestasi yang layak tentulah dapat diperoleh apabila penyusunannya didasari oleh
prinsip-prinsip pengukuran yang berlaku sehingga menjadi sarana yang positif dalam
proses belajar mengajar.
(Gronlund, 1977) dalam bukunya mengenai penyusunan tes prestasi merumuskan
beberapa prinsip dasar dalam pengukuran tes prestasi sebagai berikut:
1. Tes prestasi harus mengukur hasil belajar yang dibatasi secara jelas sesuai dengan
tujuan instruksional.
Prinsip ini menjadi langkah pertama dalam penyusunan tes prestasi belajar, yaitu
langkah pembatasan tujuan ukur. Identifikasi dan pembatasan tujuan ukur harus
bersumber dan mengacu pada tujuan instruksional yang telah digariskan bagi suatu
program.
2. Tes prestasi harus mengukur suatu sampel yang representatif dari hasil belajar dan
dari materi yang dicakup oleh program instruksional atau pengajaran.
Maksud sampel hasil belajar dalam hal ini adalah perwujudan soal tes dalam
bentuk aitem-aitem yang mewakili kesemua pertanyaan mengenai materi pelajaran
yang secara teoritik mungkin ditulis. Suatu tes tentu tidak mungkin dapat memuat
seluruh aitem dan menanyakan seluruh permasalahan mengenai materi pelajarannya.
Keterbatasan waktu, keterbatasan kemampuan penulis soal, dan berbagai
pertimbangan praktis menyebabkan penyajian tes hanya terbatas pada sebagian kecil
saja dari seluruh kemungkinan pertanyaan.
Untuk dapat dikatakan mengukur hasil belajar materi pelajaran secara
keseluruhan, sampel pertanyaan yang termuat dalam tes harus representatif yakni
harus menanyakan semua bagian materi yang dicakup oleh suatu program secara
proporsional.
3. Tes prestasi harus berisi aitem-aitem dengan tipe yang paling cocok guna mengukur
hasil belajar yang diinginkan.
Hasil belajar yang hendak diukur akan menentukan tipe perilaku yang harus
diterima sebagai bukti tercapainya tujuan instruksional yang telah ditetapkan. Tes
prestasi memiliki berbagai tipe dan format aitem yang dapat digunakan sesuai
dengan tujuan pengukuran. Apabila tujuan pengukuran adalah pengungkapan proses
mental atau kompetensi tingkat tinggi guna pemecahan masalah maka dapat dipilih
tipe aitem esai, atau tipe pilihan ganda misalnya. Apabila tujuan ukurnya adalah
pengungkapan proses pengingatan fakta dan prinsip sederhana terutama untuk level
pendidikan rendah, maka dapat dipilh tipe benar salah atau tipe jawaban pendek.
4. Tes prestasi harus dirancang sedemikian rupa agar sesuai dengan tujuan
penggunaan hasilnya.
Hal ini berkaitan dengan fungsi evaluasi yang dimiliki oleh masing-masing tes
seperti telah diuraikan terdahulu. Untuk tes yang hasilnya akan digunakan sebagai
dasar penempatan (placement), biasanya diperlukan aitem yang tidak terlalu tinggi
taraf kesukarannya dan cakupannya pun tidak terlalu luas.
Bagi tes yang dimaksudkan berfungsi sumatif guna mengukur kemajuan belajar
tertentu harus disusun aitem yang mencakup bagian-bagian penting tertentu dari
keseluruhan materi pelajaran. Tes sumatif yang mengacu pada kriteria penguasaan
materi harus berisi aitem-aitem yang secara komprehensif mengungkap seluruh
bagian materi pelajaran dengan tingkat kesukaran yang rendah sedangkan tes sumatif
yang dimaksudkan untuk melihat posisi relatif siswa dalam kelompoknya hendaknya
terdiri atas aitem yang mempunyai taraf kesukaran bervariasi.
Tes yang berfungsi diagnostik akan berisi aitem dalam jumlah besar dari setiap
bagian kawasan materi pelajaran. Dalam hal ini perhatian lebih lebih ditunjukkan
pada respons atau jawaban yang diberikan siswa pada aitem-aitem tertentu
sedangkan skor keseluruhan menjadi kurang penting peranannya. Pusat perhatian
akan tertuju pada kesalahan-kesalahan yang biasa dilakukan oleh siswa dan bukan
pada usaha membuat aitem guna mengukur efektivitas program pengajaran. Karena
tes seperti ini tujuan utamanya adalah untuk mendeteksi masalah – masalah
kesukaran belajar maka taraf kesukaran aitem-aitemnya pun dibuat rendah.
5. Reliabilitas harus diusahakan tinggi dan hasil ukur ditafsirkan dengan hati-hati.
Reliabilitas atau keterpercayaan hasil ukur merupakan salah satu ciri kualitas tes
yang tidak dapat diabaikan. Sejauhmana pengukuran yang dilakukan oleh tes dapat
diandalkan dan dipercaya akan banyak berpengaruh terhadap penafsiran hasil
ukurnya. Tes yang tidak dapat memberikan hasil yang konsisten atau reliabel akan
memberikan penafsiran yang keliru mengenai aspek yang diungkapnya.
Ketidakreliabelan ini dapat terjadi karena adanya kesalahan atau error pengukuran
yang bersumber dari dalam tes itu sendiri. Sumber eror dapat dikurangi apabila
dalam penyusunannya tes itu dirancang dan ditulis menurut aturan penyusunan tes
yang benar. Di samping itu, peningkatan jumlah aitem yang disertai oleh peningkatan
kualitas aitem akan banyak berarti dalam meningkatkan reliabilitas tes.
Informasi mengenai reliabilitas suatu tes haruslah menjadi salah satu
pertimbangan penting dalam melakukan interpretasi hasil ukur tes yang
bersangkutan. Untuk itulah, biasanya selain adanya laporan mengeai koefisien
reliabilitas setiap tes perlu juga dilengkapi dengan laporan besarnya eror standar
dalam pengukuran.
6. Tes prestasi harus dapat digunakan untuk meningkatkan belajar pada anak didik.
Manfaat inilah yang sebenarnya lebih penting daripada penggunaan hasil tes
prestasi sekedar untuk mengisi rapor para siswa atau memberi nilai ujian semester
pada para mahasiswa. Bila hasil tes prestasi ini secara akurat dapat mencerminkan
pencapaian tujuan instruksional dan bila tes prestasi dapat mengukur sampel hasil
belajar dengan layak maka pengaruh positif pengadaan tes prestasi bagi peningkatan
belajar akan dapat diharapkan secara maksimal.
Bahwasannya tujuan utama pengukuran prestasi belajar, baik formatif maupun
sumatif adalah membantu mereka dalam belajar haruslah dapat dikomunikasikan
kepada para siswa. Bila para siswa telah dapat memandang tes sebagai sarana yang
menolong mereka disamping sebagai dasar pemberian angka atau nilai rapot, maka
fungsi tes sebagai motivator dan pengarah dalam belajar telah tercapai.

C. Kesimpulan
Tes prestasi memiliki fungsi sebagai pengukur prestasi dan motivasi dalam belajar,
disisi lain tes prestasi juga memiliki keterbatasan dan prinsip-prinsip pengukuran.

D. Latihan soal mandiri (quiz)


Pilihlah 1 topik dari satu mata pelajaran siswa SD kelas 5 atau 6.
Berlatihlah membuat soal model pilihan ganda sebanyak 10 aitem.

E. Daftar istilah yang penting


F. Daftar Pustaka
Azwar, S. (2015). Tes prestasi: Fungsi pengembangan pengukuran prestasi belajar,
Edisi kedua. Yogyakarta: Pustaka Pelajar.
MATERI 3
STATISTIK DASAR UNTUK TES PRESTASI

A. SUB MATERI
Statistika digunakan untuk menyusun, menganalisis, menyajikan, dan memberikan
interpretasi data yang berwujud angka. Dengan ringkas dapat dikatakan bahwa statistika
adalah ilmu mengenai pengolahan dan penafsiran data kuantitatif.
Statistika deskriptif adalah pengolahan data yang meliputi menyusun dan menyajikan
data, serta menghitung besaran-besaran yang dapat menunjukkan karakteristik kumpulan
data sehingga akan diperoleh gambaran yang jelas mengenai keadaan data tersebut dan
mudah diinterpretasikan.
Statistika inferensial adalah pengolahan data lebih lanjut dengan menggunakan teknik-
teknik analisis tertentu guna melakukan estimasi terhadap besaran-besaram populasi
(parameter) berdasarkan besaran-besara yang dihitung pada sata sampel (statistik).
Statistika inferensial diawali oleh suatu hipotesis mengenai parameter populasi, diikuti
oleh analisis terhadap data sampel, dilanjutkan dengan penolakan atau penerimaan
hipotesis, dan kemudian diakhiri oleh penyimpulan yang berlaku bagi populasi.
Dalam kaitannya dengan tes prestasi, khususnya tes prestasi belajar di kelas,
pengetahuan mengenai statistika adalah sangat penting. Pengetahuan dan aplikasi teknik-
teknik statistika sudah mulai digunakan sejak proses pengembangan tes yaitu pada
prosedur analisis aitem dan pengujian reliabilitas, sampai dengan tahap interpretasi hasil
tes prestasi yakni pada prosedur pemberian skor dan pemberian nilai.
Beberapa konsep statistika dasar sudah sangat memadai apabila dikuasai dengan baik.
Bagi mereka yang terlibat dalam pengembangan tes prestasi maupun yang terlibat
langsung dalam penggunaan tes dalam kelas tapi masih mengalami kesulitan melakukan
komputasi angka pun tidak perlu khawatir. Saat ini segala macam program komputer telah
tersedia untuk membantu proses komputasi data sedangkan perhitungan dengan
komputerpun tidak harus dilakukan sendiri karena kita dapat meminta bantuan mereka
yang ahli. Hal yang terpenting adalah memahami konsep dan penerapan statistikanya
sehingga kalaupun perhitungan yang menggunakan kalkulator atau komputer tersebut
dilakukan oleh orang lain kita tetap mampu menafsirkan hasilnya.
B. SUB MATERI: DISTRIBUSI FREKUENSI

Kumpulan data yang kita peroleh dari sekelompok subjek atau sampel dapat berupa
data kuantitatif (angka) dan kualitatif. Contohnya, terdapat data mengenai nilai Bahasa
Inggris siswa kelas 6 SD. Bila dilihat seadanya saja, maka kumpulan angka tersebut tidak
akan memberikan informasi seperti rata-rata nilai, angka tertinggi, dan pertanyaan lain
yang dikenal dengan istilah statistik kelas.
Untuk memudahkan menjawab pertanyaan-pertanyaan tentang statistik kelas, data
akan disusun dari yang terkecil sampai angka yang terbesar yang diurutkan dari atas ke
bawah. Bagi setiap angka kemudian dicantumkan banyaknya pemilik angka masing-
masing. Susunan inilah yang disebut dengan distribusi frekuensi.
Dalam tabel distribusi frekuensi, dicantumkan pula beberapa data seperti :
1. Frekuensi (f) : banyaknya siswa yang memperoleh angka tertentu
2. Frekuensi kumulatif (fk) : banyaknya mahasiswa yang memiliki angka tersebut dan
yang memiliki angka yang lebih rendah
3. Proporsi (p) : dihitung dengan rumusan p = f/N
4. Proporsi kumulatif (pk) : proporsi mahasiswa yang memiliki angka bersangkutan dan
yang lebih rendah. Dihitung dengan rumus pk = fk/N

Persentil (Pn) dan Jenjang Persentil (PR)


Persentil ke n adalah angka yang n% dari seluruh distribusi berada di bawahnya.
Misalnya, P30 adalah suatu angka yang 30% dari seluruh distribusi frekuensi yang ada lebih
rendah daripada angka itu. Apabila dikatakan bahwa P30 itu adalah x, maka dalam
distribusi yang bersangkutan terdapat 30% angka lain yang lebih kecil daripada x.
Jenjang persentil suatu angka adalah besarnya persentase frekuensi yang lebih kecil
daripada angka tersebut. Jika dikatan bahwa PR (X=11) adalah 63, maksudnya adalah
bahwa angka 11 lebih besar daripada 63% angka yang ada dalam distribusi frekuensi yang
bersangkutan.

Ukuran-ukuran Tendensi Sentral


1. Mode
Mode, yang sering juga disebut modus, adalah ukuran tendensi sentral yang paling
jelas dan paling mudah ditentukan. Mode dalam suatu distribusi didefinisikan
sebagai angka yang paling tinggi frekuensinya.
2. Median
Median didefinisikan sebagai angka yang membatasi 50% (0,50 proporsi) frekuensi
angka terendah dan 50% (0,50 proporsi) angka tertinggi dalam suatu distribusi.
Pengertian ini sama saja dengan pengertian persentil ke 50 karena memang median
adalah sama dengan P50, yaitu angka yang lebih besar daripada 50% angka-angka
lain dalam suatu distribusi.
3. Mean
Mean adalah rata-rata matematik yang harus dihitung dengan cara tertentu dan dapat
didefinisikan sebagai jumlah semua angka dibagi dengan banyaknya angka yang
dijumlahkan. Rumusannya adalah:
M = ∑fX / N
Ukuran-ukuran Variabilitas
1. Jarak Sebaran
Jarak sebaran atau range merupakan selisih antara angka yang tertinggi dan angka
yang terendah. Cara menghitungnya adalah menggunakan rumus: JS = Xterbesar -
Xterkecil
2. Deviasi Rata-rata
Deviasi rata-rata merupakan rata-rata penyimpangan angka dari mean. Dalam suatu
distribusi frekuensi, penyimpangan angka dari mean adalah selisih antara angka
tersebut dan mean, yaitu (X-M)
Untuk dapat menghitung deviasi rata-rata maka penyimpangan angka dari mean
didasarkan pada harga mutlaknya, sehingga jumlah penyimpangannya tidak akan
sama dengan nol. Rumusannya sebagai berikut :
Deviasi rata-rata = ∑f | X-M | / N
3. Varians
Varians yang diberi symbol s2 merupakan jumlah kuadrat deviasi angka dibagi oleh
N-1. Deviasi angka adalah penyimpangan angka dari mean, sehingga dapat
dituliskan rumusannya sebagai berikut:
s2 = ∑f (X-M)2 / (N-1)
Distribusi Normal
Dalam statistika dikenal berbagai bentuk model penyebaran atau distribusi skor yang
dikaitkan dengan model kurvanya. Bentuk kurva distribusi ditentukan oleh suatu
persamaan yang disebut fungsi distribusi yang menentukan tinggi ordinat kurva pada setiap
titik X yang berada di sepanjang garis horizontal.salah satu model distribusi yang paling
penting adalah distribusi normal yang digambarkan oleh kurva yang berbentuk lonceng
simetrik.
Distribusi Normal Standar
Pada umumnya distribusi normal merupakan distribusi angka atau skor X yang
diperoleh langsung dari pengukuran yang sifat skalanya ditentukan antara lain oleh metode
pengukuran yang kita gunakan dan cara pemberian skor tersebut. Angka ini dikenal dengan
nama angka mentah (raw scores).
Seringkali, satuan angka yang ada dalam distribusi normal perlu diubah ke dalam
satuan angka standar sehingga mempunyai mean sama dengan nol dan deviasi standar
sama dengan satu. Satuan angka standar yang dihasilkan dari konversi ini disebut skor z.
Korelasi Linier
Istilah korelasi menunjuk pada konsep saling hubungan diantara beberapa variabel.
Korelasi dinyatakan dalam angka yang disebut koefisien korelasi dan diberi symbol rxy.
Koefisien korelasi mengandung dua makna, yaitu kuat lemahnya hubungan dan arah
hubungan antar variabel.
Kuat lemahnya hubungan antara dua variabel diperlihatkan oelh besarnya harga
mutlak koefisien korelasi yang bergerak dari 0 sampai dengan 1. Semakin mendekati
angka 1, maka hubungan semakin kuat.
Arah hubungan diperlihatkan oleh tanda positif (+) atau tanda negatif (-) di depan
koefisien korelasi. Tanda positif berarti hubungannya searah, dan tanda negatif yang
berarti hubungannya berlawanan arah.
Salah satu formula untuk menghitung besarnya koefisien korelasi antara dua variabel
yang masing-masing berskala interval adalah korelasi product-moment Pearson.
Rumusannya adalah sebagai berikut:

Keterangan : X = Angka pada variabel pertama


Y = Angka pada variabel kedua
N = banyaknya subjek
Korelasi Point-Biserial
Kadangkala, salah satu variabel yang hendak dikorelasikan bukan merupakan skala
yang bersifat interval, melainkan berupa variabel dikotomi, yaitu memiliki dua macam
angka saja. Sehingga yang digunakan adalah rumus dari korelasi Point-Biserial, yaitu
sebagai berikut:

Keterangan : Mi = Mean skor variabel interval bagi subjek yang yang mendapat skor
1 pada pada variabel dikotomi
Mt = Mean skor variabel interval bagi seluruh subjek
st = deviasi standar variabel interval bagi seluruh subjek
p = banyaknya skor 1 pada variabel dikotomi dibagi n
q = 1-p
C. Kesimpulan
Statistika digunakan untuk menyusun, menganalisis, menyajikan, dan memberikan
interpretasi data yang berwujud angka dalam tes prestasi.

D. Latihan soal mandiri (quiz)


Rangkumlah statistik dasar dalam penggunaan analisis untuk tes prestasi dan sertakan
rumusnya.

E. Daftar istilah yang penting


F. Daftar Pustaka
Azwar, S. (2015). Tes prestasi: Fungsi pengembangan pengukuran prestasi belajar,
Edisi kedua. Yogyakarta: Pustaka Pelajar.

26
MATERI 4
PENEGASAN KAWASAN UKUR

A. SUB MATERI
Perencanaan merupakan langkah yang mengawali penyusunan tes prestasi guna
menuju terciptanya tes yang memenuhi syarat kualitas yang semestinya. Pada langkah
perencanaan inilah dipertimbangkan segala aspek yang menyangkut karakteristik tes yang
diinginkan dengan mengingat tujuan penyusunan tes yang bersangkutan. Pengembangan
tes prestasi belajar mengikuti langkah-langkah standar dalam konstruksi tes yang
diilustrasikan sebagai berikut:

27
B. SUB MATERI

Identifikasi Tujuan dan Kawasan Ukur


Identifikasi tujuan merupakan penegasan tujuan pengukuran yang akan dicapai oleh
tes yang diikuti oleh pembatasan kawasan ukur, yakni pendefinisian lingkup materi ukur
yang hendak diungkap. Bagi tes prestasi yang akan digunakan sebagai pengukur kecakapan
yang disyaratkan di awal suatu program pendidikan, aitem-aitemnya haruslah meliputi
sampel perilaku yang luas yang dianggap sebagai indikator penguasaan kecakapan yang
disyaratkan tersebut. Perancangan tes harus membatasi tujuan ukurnya dengan mengacu
pada silabus program yang bersagkutan secara menyeluruh sebagaimana ditunjukkan oleh
tujuan istruksionalnya. Aitem-aitem dibuat dalam taraf kesukaran yang bervariasi dan
penilaiannya lebih disandarkan pada norma kelompok.
Tes prestasi yang berfungsi diagnostik yang dimaksudkan untuk mendeteksi
kesukaran belajar dan sebab-sebabnya, maka aitem-aitemnya harus ditulis dengan tingkat
kesukaran yang rendah. Tes prestasi yang berfungsi sebagai pengukuran sumatif guna
menentukan nilai akhir dari suatu program atau penentu kelulusa, aitemnya harus mewakili
secara menyeluruh kawasan tujuan instruksional yang telah ditetapkan semula.

Penguraian Komponen Isi


Penguraian isi tes bukan saja berarti mengusahakan agar tes yang akan ditulis itu
tidak keluar dari lingkup materi yang telah ditentukan oleh batasan kawasan ukur, namun
mengusahakan agar tidak ada bagian yang penting yang terlewatkan dan tidak tertuang
dalam tes.
Tes prestasi yang baik haruslah komprehensif dan berisi aitem-aitem yang relevan.
Komprehensif artinya tes itu mencakup keseluruhan isi atau bahan pelajaran yang telah
diidentifikasi sebagai tujuan ukur, secara representatif dan dalam jumlah aitem yang
proporsional untuk setiap bagian sesuai dengan urgensi dan bobot masing-masing bagian
tersebut. Relevan artinya hanya aitem-aitem yang akan ditulis benar-benar menanyakan
materi yang diidentifikasi dan dianggap perlu guna memahami materi tersebut.
Dalam tes prestasi, pembobotan dan pengelompokan bagian-bagian materi si
didasarkan pada penting tidaknya materi yang dilihat dari TIU/TUK. Semakin tinggi bobot
yang diberikan pada bagian materi tertentu, maka jumlah aitemnya akan semakin banyak.
Contoh penguraian isi dan pembobotan tes prestasi adalah sebagai berikut:

28
Batasan Perilaku dan Kompetensi
Batasan perilaku merupakan operasionalisasi tujuan instruksional. Dalam silabus,
biasanya terdapat penguraian tujuan instruksional umum dan tujuan instruksional khusus.
Pada dasarnya, indikator perilaku dibuat sebagai penerjemahan tujuan instruksional umum
ke dalam bentuk yang paling konkret sehingga dapat diukur.
Keseluruhan aitem dalam tes yang direncanakan biasanya dibagi atas beberapa taraf
kompetensi yang berbeda-beda. Pada dasarnya suatu tes hendaknya berisi soal yang
menuntut taraf kompetensi kognitif yang tinggi, tidak berisi soal yang dapat dijawab hanya
dengan proses kognitif yang sederhana.
Salah satu pedoman dalam menentukan tingkat kompetensi aitem tes adalah
taksonomi tjuan pendidikan yang dirumuskan oleh Boom dkk (1956). Taksonomi ini
secara luas mencakup sistem klasifikasi tujuan pendidikan dalam tiga kawasan perilaku
yaitu afektif, kognitif, dan psikomotor. Bloom dkk menyusun konsep taraf kompetensi
kognitif ke dalam enam jenjang atau tingkatan yang kompleksitasnya beringkat, yaitu:

29
30
31
Masing-masing tingkat kompetensi dalam taksonomi kawasan kognitif biasanya
dioperasinalkan dalam bentuk kata kerja khusus agar lebih memungkinkan para penulis
soal membuat aitem yang sesuai dengan tujuan ukur tes, contohnya:

No Tingkat Kompetensi Contoh Kata Kerja


1 Knowledge Mengenali, mendeskripsikan, menamakan,
mendefinisikan, memasangkan, memilih
2 Comprehension Mengklasifikasikan, menjelaskan, mengikhtisarkan,
meramalkan, membedakan
3 Application Mendemonstrasikan, menghitung, menyelesaikan,
menyesuaikan, menghubungkan, menyusun
4 Analisis Menemukan perbedaan, memisahkan, membuat
diagram, membuat estimasi, mengambil kesimpulan,
menyusun urutan
5 Sintesis Menggabungkan, menciptakan, merumuskan,
merancang, membuat komposisi, menyusun kembali.

6 Evaluation Menimbang, mengkritik, membandingkan, memberi


alasan, menyimpulkan, memberi dukungan

Tipe-Tipe Aitem dalam Tes Prestasi


Menurut prosedur pemberian angka (scoring), aitem dalam tes prestasi dapat dibagi
menjadi dua tipe besar, yaitu tipe objektif dan tipe esai atau karangan. Cirri utama aitem
tipe objektif adalah mempunyai hanya satu jawaban yang dianggap benar atau terbaik.
Sedangkan aitem tipe karangan menghendaki siswa merumuskan jawabannya sendiri, jadi
siswa tidak memilih jawaban dengan kata-katanya sendiri. Jawaban terhadap aitem tipe
karangan dapat pendek dan dapat panjang tergantung pada arah dan cakupan yang
dikehendaki oleh soal.
Dikarenakan jawaban terhadap aitem karangan diberikan oleh siswa dengan kata-
katanya sendiri, maka jawaban tersebut hanya dapat diperiksa oleh mereka yang menulis
aitem atau oleh mereka yang tahu persis mengenai masalah yang ditanyakan oleh soal.
Jawaban terhadap aitem karangan harus dibaca satu persatu, dibandingkan dengan jawaban
yang dikehendaki oleh penulis aitem, kemudian diberikan skor menurut pedoman skoring
yang telah ditetapkan lebh dahulu. Hal ini menuntut waktu dan tenaga yang tidak sedikit
dari pemberi tes.

32
Pembagian tipe aitem menurut kelasnya dilakukan oleh Brown (1971) kedalam
empat kelompok, yaitu:
1. Tipe memilih alternatif
Dengan tipe ini, siswa diminta memilih satu jawaban diantara beberapa pilihan
jawaban yang dianggapnya terbaik, contohnya adalah tipe pilihan ganda, tipe benar
salah, dan tipe memasangkan.
Contoh soal tipe memasangkan:

2. Tipe jawaban pendek


Pada tipe ini siswa memberikan jawabannya dalam bentuk kalimat pendek. Tipe
aitem ini lebih mudah diberikan skor dibandingkan aitem tipe karangan, contohnya
adalah tipe melengkapi.
Contoh:

33
3. Tipe karangan
Berupa pertanyaan atau perintah yang menghendaki jawaban terurai dari siswa
berupa karangan yang bahan jawabannya diramu dari banyak materi dari berbagai
sumber.
Contoh:

4. Tipe problem
Menghendaki agar siswa merumuskan lebih dahulu suatu prosedur yang akan
digunakan dan kemudian menerapkannya guna penyelesaian problem yang dihadapi.
Aitem tipe ini biasanya banyak dijumpai di bidang matematika atau di bidang
pengetahuan kuantitatif lainnya.
Contoh:

34
Menentukan Tipe Aitem yang Akan Digunakan
Dalam penyusunan tes prestasi, masalah menentukan format dan tipe aitem yang
akan digunakan adalah penting untuk diperhatikan karena ada beberapa pertimbangan,
antara lain:
1. Hakikat belajar, yaitu suatu aitem haruslah mengukur hasil belajar secara langsung.
2. Kualitas aitem yang mungkin dibuat. Aitem pilihan ganda akan menghasilkan aitem
berkualitas terbaik dalam arti mempunyai fungsi pegukuran yang lebih efektif
dibandingkan tipe yang lainnya.

Banyak orang menyangka bahwa aitem tipe pilihan ganda tidak dapat mengungkap
kemampuan berpikir tingkat tinggi karena hanya menghendaki siswa memilih jawaban
yang telah tersedia. Perkiraan tersebut tidaklah benar. Aitem pilihan ganda yang dirancang
dengan seksama dengan memperhatikan batasan isi tes serta ditulis sesuai dengan tujuan
ukur menurut tingkat kompetensi yang tinggi tidaklah dapat dijawab oleh siswa yang
mempunyai kompetensi taraf rendah dan pemahaman terbatas yang tidak disertai
kemampuan berpikir kompleks. Pada kenyataannya, justru aitem tipe pilihan ganda inilah

35
yang mempunyai variasi tingkat penguasaan yang paling luas mulai dari yang sederhana
sampai kepada yang paling tinggi. Kecaman terhadap aitem tipe pilihan ganda seharusnya
ditujukan kepada tes prestasi yang dibuat tidak berdasarkan perencanaan yang matang dan
ditulis tanpa memperhatikan kaidah kaidah penulisan aitem.
Sebetulnya tipe aitem yang terbaik adalah yang paling sesuai dengan materi tes,
tingkat kompetensi yang ingin diungkap, dan tingkat pendidikan siswa yang akan dites.
Perancang tes harus dapat menentukan sendiri tipe aitem yang sesuai dengan tes yang
sedang dibuatnya.
Sebagai bagian dari pertimbangan dalam penentuan tipe aitem, berikut ini disajikan
beberapa diantara keunggulan dan kelemahan tipe-tipe pilihan jawaban aitem:
1. Tipe Pilihan Ganda
Contoh:

Keunggulan:
 Komprehensif.
 Skoring mudah dan cepat.
 Lembar jawaban efisien.
 Kualitas item dapat dianalisis secara empirik.

36
 Objektivitas tinggi.
 Reliabilitas memuaskan.
Kelemahan
 Membuatnya sulit, butuh waktu, dan tenaga.
 Tidak mudah jika ingin mengungkap kompetensi tinggi.
 Benar hanya karena menebak.
2. Tipe Esai
Contoh:

Keunggulan
 Mudah dibuat.
 Lebih mudah untuk mengungkap kompetensi tinggi.
 Bagus untuk mengungkap kemampuan yang berkaitan dengan ekspresi verbal-
menulis.

37
Kelemahan
 Kurang komprehensif.
 Skoring menyita waktu dan tenaga.
 Skoring oleh penulis aitem.
 Subjektivitas sulit dihindari.
 Pertimbangan pemberian skor lebih kompleks.
 Reliabilitas kurang memuaskan.

3. Tipe Jawaban Benar – Salah


Contoh:

Keunggulan
 Komprehensif, objektivitas tinggi, dan mudah dibuat
 Skoring mudah.
 Lembar jawaban efisien dan hemat bahan.
 Kualitas aitem dapat dianalisi secara empirik.
Kelemahan
 Mengungkap tingkat kompetensi yang rendah.
 Jawaban benar bisa saja merupakan hasil dari menebak.

Menentukan Banyaknya Aitem


Berapa banyak aitem yang harus dimuat dalam sebuah tes? Pertanyaan ini selalu
muncul sewaktu kita merencanakan penyusunan suatu tes. Bahkan dalam kuliah mengenai
konstruksi tes dan tes prestasi, mahasiswa seringkali menanyakan masalah jumlah aitem

38
yang sebaiknya dimuat dalam suatu tes. Biasanya pertanyaan mereka berkisar mengenai
jumlah minimal aitem yang harus ada.
Sebetulnya batasan jumlah aitem dalam suatu tes tidak dapat ditentukan secara
umum. Menentukan banyaknya aitem menyangkut beberapa pertimbangan, baik
pertimbangan teoritik maupun pertibangan praktis.
Secara teoritik, suatu tes haruslah berisi sebanyak-banyaknya aitem yang independen
satu sama lain. Independen maksudnya bahwa masing-masing aitem mengungkap bagian
terkecil bahan tes yang mengenai suatu permasalahan, telah ditanyakan oleh sebuah aitem
yang baik maka tidak ada alasan untuk membuat aitem lain yang menanyakan ide serupa
pula.
Apabila penulis aitem mapu menulis aitem yang independen seperti yang
dimaksudkan, maka ada dua alasan untuk memasukkan sebanyak-banyaknya aitem dalam
suatu tes.
Alasan pertama adalah dasar pikiran bahwa suatu tes yang berisi aitem yang
independen dalam julah yang besar akan lebih komprehensif cakupannya daripada tes yang
hanya berisi sedikit aitem, jadi isi tes itu akan lebih mewakili keseluruhan bahan tes.
Alasan kedua adalah mengenai konsistensi hasil pengukuran tes tersebut yang
berkaitan dengan jumlah aitem. Konsistensi ini dinyatakan sebagai reliabilitas tes yang
secara teoritik dapat ditunjukkan bahwa suatu tes yang berisi aitem yang lebih banyak akan
epunyai reliabilitas yang lebih tinggi dibandingkan tes yang berisi sedikit aitem.
Dengan demikian, pada dasarnya tes haruslah berisi aitem dalam jumlah besar. Akan
tetapi kemudian terdapat beberapa alasan praktis yang juga tidak dapat terlepas dari
pertimbangan para perancang tes. Alasan tersebut antara lain menyangkut masalah tujuan
diadakannya tes, waktu yang tersedia bagi siswa untuk menjawab tes, dan sebagainya. Hal
yang tidak dapat diabaikan pula adalah kondisi atau keadaan siswa yang akan dikenai tes.
Kelompok siswa yang sangat muda, seperti siswa kelas 1-3 sekolah dasar, tentu tidak
dapat dikenai tes yang panjang yang memerlukan waktu pengerjaan sampai dua jam
dikarenakan faktor kelelahan yang sangat mungkin memengaruhi hasil tes ereka sehingga
hasil ukurnya menjadi bias. Apalagi bila tes tersebut terdiri atas aitem-aitem yang sulit.
Tipe aitem yang digunakan juga ikut menentukan jumlah aitem. Kadang, bahan
pelajaran tertentu hanya mungkin diujikan lewat aitem tipe tertentu, misalnya tipe
karangan. Suatu tes yang berisi aitem tipe karangan tentu tidak dapat berisi banyak aitem,
karena setiap aitem akan meminta waktu yang lebih banyak dari siswa untuk membaca,

39
memahami dan menulis jawabannya. Tes yang berisi aitem tipe benar-salah tentulah dapat
terdiri dari aitem yang jumlahnya besar.
Seorang perancang tes prestasi juga harus mempertimbangkan banyak hal dalam
menentukan jumlah aitem yang harus dimuat dalam tes. Jumlah aitem yang layak bagi
setiap format dan kesukaran yang berbeda adalah relatif. Dua puluh aitem dalm tes tipe
benar salah tentulah merupakan jumlah yang terlalu sedikit apalagi jika tes tersebut
memiliki taraf kesukaran yang rendah. Sebaliknya, lima belas aitem soal tipe essay akan
dianggap terlalu banyak apabila setiap aitem menghendaki jawaban-jawaban yang terurai
dan panjang.
Apabila jumlah aitem yang harus dimuat sudah ditentukan, jumlah ini dikembalikan
pada bobot relatif setiap bagian pada blue print sehingga diperoleh gambaran yang jelas
mengenai banyaknya aitem yang harus ada pada setiap bagian isi maupun kategori
kompetensi.

C. Kesimpulan
Penegasan kawasan ukur menjadi langkah yang mengawali penyusunan tes prestasi
guna menuju terciptanya tes yang memenuhi syarat kualitas yang semestinya dengan
tahapan langkah-langkahnya.

D. Latihan soal mandiri (quiz)


Buatlah rancangan tes prestasi dalam bentuk tahapan kawasan ukur.

E. Daftar Pustaka
Azwar, S. (2015). Tes prestasi: Fungsi pengembangan pengukuran prestasi belajar,
Edisi kedua. Yogyakarta: Pustaka Pelajar.

40
DAFTAR PUSTAKA

Azwar, S. 1995. Sikap Manusia. Yogyakarta : Pustaka Pelajar.

Azwar, S. 1988. Reliabilitas dan Validitas, Yogyakarta : Liberty.

Azwar, S. 1999. Penyusunan Tes Prestasi. Yogyakarta : Pustaka Pelajar

Azwar, S. 1999. Penyusunan Skala Psikologi. Yogyakarta : Pustaka Pelajar

41

Anda mungkin juga menyukai