Anda di halaman 1dari 84

1

BAB I
FUNGSI PENGUKURAN DAN PENILAIAN DALAM PENDIDIKAN
1. Pengertian Pengukuran dan Penilaian
Untuk mengetahui berhasil tidaknya tujuan dalam proses belajar mengajar,
maka perlu adanya kegiatan evaluasi.
Sebab evaluasi merupakan suatu tindakan atau suatu proses untuk
menentukan nilai sesuatu dalam skup kependidikan atau segala sesuatu yang ada
hubungannya dengan masalah pendidikan.
Dalam kegiatan evaluasi ini ada dua kegiatan pokok yang tidak dapat
dipisahkan yaitu : kegiatan pengukuran dan kegiatan penilaian. Pengukuran
cenderung menunjukan luas atau kwantitas daripada sesuatu, sedangkan penilaian
cenderung menunjukkan kwalitas daripada sesuatu yang diukur. misalnya, jika
kita ingin mengetahui apakah daya serap siswa terhadap bidang studi tertentu baik
atau buruk, maka jelas harus diadakan pengukuran melalui tes. Dari hasil
pengukuran tersebutlah baru bisa diramalkan bahwa daya serap siswa terhadap
bidang studi tertentu baik atau buruk.
Dengan demikian proses pengukuran dan penilaian merupakan suatu
proses yang saling berkaitan dan tak dapat dipisahkan.
2. Latar Belakang Pengukuran dan Penilaian Individu
Bertitik tolak dari pengertian di atas bahwa evaluasi bermaksud untuk
mengetahui keberhasilan dari suatu kegiatan. Diketahui bahwa guru mempunyai
tugas sangat komplek dengan segala tuntutan yang harus dipertanggungjawabkan.
Salah satu tugas guru adalah melaksanakan / menciptakan kondisi belajar
yang paedagogis. Dalam kegitan tersebut sudah tentu dituntut adanya suatu
penilaian yang intensif dan obyektif.

Masalah pengukuran dan penilaian pendidikan merupakan masalah yang


selalu terkandung dalam pekerjaan pendidikan keguruan, karenanya sudah
seharusnyalah ia menjadi satu kesatuan yang penting dalam kelengkapan keahlian
seorang guru. Bahkan bukan hanya sekedar bagian pelengkap,melainkan
merupakan bagian yang integral, yang tak terpisahkan, dari proses belajar
mengajar. Kerap kali muncul anggapan-anggapan bahwa : 1) Untuk melaksanakan
pengukuran dan penilaian pendidikan tidak perlu adanya suatu persiapan, 2)
pelaksanaan pengukuran dan penilaian merupakan kegiatan yang terpisah dengan
proses belajar mengajar.
Dari masalah di atas nampak adanya kesenjangan-kesenjangan yang dapat
memberikan dampak negatif. Karena itu materi evaluasi (pengukuran dan
penilaian pendidikan) dipandang perlu untuk diterapkan, disebarluaskan kepada
setiap individu yang memerlukan.
Tidak dapat dipungkiri bahwa angka-angka sebagai hasil pengukuran dan
penilaian pendidikan mempunyai arti yang penting yaitu : ia berfungsi
memberikan kesaksian terhadap keberhasilan seseorang. Kesaksian mana banyak
diperlukan dalam berbagai peristiwa dalam kehidupan antara lain: kesaksian
dalam kenaikan kelas, melanjutkan sekolah, mencari pekerjaan dan sebagainya.

3. Tujuan Pengukuran dan Penilaian


Pengukuran dan penilaian dalam pendidikan dan pengajaran, mempunyai
beberapa tujuan antara lain :

a. Untuk mengetahui taraf kesiapan siswa dalam menempuh suatu


pendidikan dan pengajaran tertentu.
b. Untuk mengetahui seberapa jauh hasil yang diperoleh atau dicapai dalam
proses pendidikan dan pengajaran yang telah dilaksanakan.
c. Untuk mengetahui apakah mata pelajaran tertentu telah dapat dilanjutkan
ataukah masih perlu diulang.
d. Untuk mengetahui apakah metode pengajaran guru, dilaksanakan secara
efektif atau belum efektif.
e. Untuk memperoleh suatu informasi dalam memberikan atau pekerjaan
yang cocok bagi siswa.
f. Untuk memperoleh informasi tentang siswa apakah mereka dapat
dinaikkan atau tidak.
g. Untuk membandingkan apakah prestasi belajar siswa sesuai dengan
standar yang diharapkan.
h. Untuk menafsirkan apakah siswa telah siap untuk menghadapi pekerjaan
dalam masyarakat
i. Untuk mengadakan seleksi.

BAB II
MENYUSUN ITEM TES

1. Pengertian Tes
Tes adalah suatu cara untuk menadakan penilaian yang berbentuk suatu
tugas atau serangkaian tugas yang harus dikerjakan oleh anak atau kelompok,

sehingga menghasilkan suatu nilai tentang tingkah laku atau prestasi anak yang
dapat dibandingkan dengan nilai standar yang ditetapkan.
Dari pengertian di atas dapat disimpulkan bahwa :
a. Tes berbentuk suatu tugas yang terdiri dari pertanyaan-pertanyaan atau
perintah.
b. Tes diberikan kepada seseorang atau kelompok
c. Respon anak / kelompok dinilai.
2. Jenis Tes
Tes sebagai alat ukur mempunyai bentuk atau jenis yang berbeda-beda.
Perbedaan tersebut dapat dilihat dari :
a. Jumlah peserta atau pengikut tes
1. Tes individual, yaitu tes yang diberikan hanya pada seorang anak.
2. Tes kelompok, yaitu tes yang diberikan kepada sekelompok individu
dalam waktu bersamaan.
b. Dari segi penyusunan tes
1. Tes buatan guru, yaitu tes yang disusun sendiri oleh guru bidang studi
yang bersangkutan.
2. Tes buatan orang lain yang tidak distandarisasi.
3. Tes standar, atau baku.
c. Dari segi bentuk jawaban atau respon siswa
1. Tes tindakan, apabila jawaban anak berupa tingkah laku
2. Tes verbal, yaitu apabila jawaban atau respon yang diberikan oleh peserta
tes berbentuk bahasa, baik lisan maupun tulisan.
d. Dari segi bentuk pertanyaan tes
1. Tes obyektif
2. Tes essay
Dalam uraian berikut ini akan dibicarakan jenis tes diihat dari bentuk
pertanyaan yaitu ; tes obyektif dan tes essay.
Tes Obyektif

Jenis tes ini sering disebut tes jawaban pendek (short answer), karena tiaptiap persoalan hanya memerlukan jawaban pendek. Jawaban telah disediakan
berbentuk alternatif-alternatif.
Peserta tes hanya memiliki satu jawaban dari alternatif tersebut.
Tes obyektif hanya memiliki beberapa tipe yaitu :
1. True false (benar salah)
Tipe tes ini terdiri dari statement statement, dimana sebagian dari
statement ada yang benar adapula yang tidak benar. Siswa disuruh memilih
mana statement yang benar dan tidak benar. Misalnya : Berilah tanda silang
(x) pada huruf (B) jika pertanyaan benar pada (S) jika pernyataan salah.
2. Multiple Choice (Pilihan Ganda)
Tipe tes ini terdiri dari statement yang belum lengkap (Stem). Untuk
melengkapinya disediakan beberapa alternatif (option). Option dapat diabgi
dua yaitu ; option kunci dan option pengecoh (distraktor). Tugas siswa adalah
memilih satu diantara option yang disediakan sebagai jawaban.
Misalnya : Pilihlah salah satu jawaban yang paling benar dari option yang
tersedia dengan memberi tanda silang (X) pada huruf a, b, c, pada lembar
jawaban. Bentuk atau tipe tes pilihan ganda ini dapat dikembangkan dengan
berbagai variasi (variasi bentuk tes ini dibicarakan pada BAB berikutnya).
3. Matching (Menjodohkan)
Matching adalah tipe tes yang terdiri dari dua kolom yang paralel,
dimana masing-masing kolom berisi statemen. Kolom sebelah kiri berisi
statemen soal sedangkan kolom sebelah kanan berisi statemen jawaban. Tugas
siswa adalah menjodohkan statement soal dengan salah satu statement
disebelah kanan (jawaban). Misalnya: Jodohkan statement sebelah kiri dengan
salah satu statement yang paling benar yang terdapat disebelah kanan.
4. Completion (melengkapi)

Item tes ini terdiri dari statement atau pernyataan yang belum lenkgap
atau sempurna. Tugas siswa adalah melengkapi statement (kalimat) tersebut
supaya menjadi lengkap. Pernyataan atau soal dari tipe ini dapat berbentuk
pertanyaan langsung, atau mengunakan titik-titik.
Misalnya : Jawablah pertanyaan berikut ini dengan singkat dan tepat !
a. Tahun berapakah Indonesia merdeka?
b. Jika guru ingin menyampaikan informasi kepada sekelompok siswa,
metode yang tepat digunakan adalah.

Tes Essay
Berbeda dengan bentuk tes obyektif, dimana tes obyektif terdiri dari
beberapa tipe tes, sedangkan tes essay hanya satu bentuk. Tes essay adalah suatu
bentuk tes yang terdiri dari suatu pertanyaan atau suruhan yang memerlukan
jawaban panjang. Sehingga tes ini sering disebut (long answer) atau tes subyektif,
sebab analisa jawaban dipengaruhi oleh subyek yang menjawab.
Bentuk pertanayan dapat berupa :

Meminta penjelasan
Membandingkan suatu masalah dengan masalah lain
Mencari perbedaan
Mencari hubungan
Mengintepretasikan / menafsirkan
Menyimpulkan

Semua bentuk-bentuk pertanyaan di atas menuntut pemikiran pemahaman,


pengalaman terhadap suatu materi atau pelajaran.

3. Langkah-langkah Penyusunan Tes


Secara garis besarnya, bentuk ujian yang diberikan kepada siswa/
mahasiswa dapat dibedakan menjadi dua yaitu :
Ujian essay dan
Ujian bentuk objektif (objektif tes)

Dalam tulisan ini hanya akan disajikan langkah-langkah penyusunan tes objektif.
Kegiatan menyiapkan tes objektif secara garis besarnya dapat digambarkan dalam
langkah sebagai berikut;
Menyiapkan blue print
Menulis soal dan
Menguji kwalitas soal ujian.
a. Blue Print
Blue print juga disebut tabel spesifikasi atau tabel kisi-kisi. Blue print
berisi tentang informasi tentang tes yang akan ditulis. Misalnya menunjukkan
bagian mata pelajaran yang akan diukur, taraf kompetensi yang akan diukur,
banyaknya soal untuk masing-masing kompetensi dan untuk seluruh satu mata uji,
taraf kesukaran masing-masing mata soal dan jenis / bentuk tes yang akan
digunakan.
Mata pelajaran yang akan diukur diperinci ke dalam bentuk sautna-satuan
yang lebih kecil. Bisa juga diperinci melalui bab per bab sampai pada sub masingmasing bab. Namun suatu hal yang tak boleh dilupakan bahwa arah materi yang
diukur jangan lepas dari kompetensi.
Kompetensi yang sering digunakan adalah yang dikembangkan oleh
Bloom yang terkenal dengan Taxonomy Bloomnya. Menurut Bloom, kompetensi
kognitif siswa / mahasiswa itu, yaitu sejauh mana siswa / mahasiswa menguasai
hal yang dipelajarinya, digambarkan dalam 6 taraf yang sifatnya berjenjang
(hierchical).
Taraf tersebut dari yang paling rendah sampai ke yang paling tinggi
adalah;
1. Pengetahuan
2. Pemahaman
3. Aplikasi atau penerapan

4. Analisis
5. Sintesis dan
6. Evaluasi
Semakin banyak kompetensi yang mampu diukur semakin baik. Namun
jangan lupa bahwa mengukur semua kompetensi di atas bukanlah mudah, kadangkadang tidak semua, kadang-kadang tidak semua pelajran dapat diukur dengan
semua cara itu.
Untuk itu hendaknya dipilih secara cermat dengan mempertimbangkan
kemampuan yang ada, fasilitas, waktu serta tujuan yang ingin dicapai.
Untuk jelasnya berikut ini diberikan tabel Blue-print atau tabel kisi-kisi.
Contoh : I
1. Mata kuliah yang diukur
2. Semester
3. Jumlah materi yang diukur

: Psikologi Pendidikan
: IV/STKIP AH Singaraja
: 10 Bab (Bab I s/d X)
Jumlah item = 40.

4. Bobot/taraf kesukaran masing-masing


Bab
5. Jenis tes

: 10%
: (Hanya satu jenis yaitu pilihan
ganda)
: - pengetahuan = 30%
-Pemahaman
= 25%
-Aplikasi
= 25%
-Analisis
= 1-%
-Sintesis
= 5%
- Evaluasi
= 5%

6. Propisi masing-masing kompetensi

Total

= 100%

Selanjutnya digambarkan sebagai berikut :


Tabel 01.
TABEL KISI-KISI SOAL UJIAN AKHIR SEMESTER V
BIDANG STUDI PSIKOLOGI PENDIDIKAN
Materi
yang
diukur
1

Taraf Komponen
Penge
Pemahaman
tahuan
2
3

Total

Aplikasi

Analisis

Sintesis

Evaluasi

10

II

10

III

10

IV

10

10

VI

10

VII

10

VIII

10

IX

10

X
Total:

2
30

1
25

1
25

10

4
-

10
100

f%
Total :

12

10

10

10

f komp

Contoh II
1.
2.
3.
4.

Mata kuliah yang diukur


Semester
Materi yang diukur
Bobot / proporsi tiap bab

5. Kompetensi yang diukur


6. Bentuk tes
7. Jumlah tes

:
:
:
:

Psikologi Pendidikan
V / STKIP AH Singaraja
4 Bab (Bab I s/d V)
- Bab I
= 14%
- Bab II
= 32%
- Bab III
= 33%
- Bab IV
= 21%
Total
= 100%
: - Pengetahuan factual
-Pemahaman
-Aplikasi
: - Benar salah (true false)
- Multiple choice
- Matching
: 40 item

Tabel 02
TABEL KISI-KISI SOAL UJIAN SEMESTER V
BIDANG STUDI PSIKOLOGI PENDIDIKAN

10

Mater
i yang Proporsi
Taraf kompetensi
diukur
I
14%
Pengetahuan factual
Pemahaman
Aplikasi
II
32%
Pengetahuan factual
Pemahaman
Aplikasi
III
33%
Pengetahuan factual
Pemahaman
Aplikasi
IV
21%
Pengetahuan factual
Pemahaman
Aplikasi
Total
100%
-

Bentuk soal/Tes
T-F

M-C

Matching

Jumlah
Item

1
1
2
1
1
1
1
1
1
10

1
1
2
2
1
2
2
1
1
1
1
15

1
1
2
2
1
1
2
2
1
2
15

3
3
4
6
3
4
5
4
2
4
2
40

Contoh III.
TABEL KISI-KISI (BLUE PRINT)
Bidang Studi
Kelas
Perkiraan Waktu
Kurikulum

Materi/
Kompe- tensi
Knowledge
(ingatan)
Konprehentt
(pemahaman
)
Application
(penerapan)
Analysis
(analisis)
Syntesis
(sistesi)
Evaluation
(evaluasi)
Total

Galaks
i

Tata
Sury
a

Peredara
n Benda
langit

2
-

1+
(1)
3
1+
(1)

2
2

7+
(2)

10

Catatan : (+ ) = cadangan

Tata
Koor
dinat
2+
(1)
4
3+
(1)
2+
(1)
11 +
(3)

: IPA
: I Semester I SMA
: 60 Menit
: SMA Th. 1975

Perpe
- taan

Alat
astrn
+
meteo
r

Flora
&
Faun
a

Ekolog
i

Pendudu
k + sdm

Penel
ruang
angk
s

Total

1+(1)

1+(1)

11+(3)

1+ (1)

15+(2)

2+ (1)

3+ (1)

1+(1)

2+(1)

20+(5)

1+(1)

6+(2)

1+(1)

5+(2)

1+(1)

3+(1)

5+ (1)

7+(2)

3+(3)

5+(3)

3+(1)

60+(15)

11

b) Menulis Soal (Tes Obyektif)


Soal ditulis berdasarkan blue print yang telah disusun. Jumlah soal
hendaknya selalu memperhatikan alokasi waktu yang tersedia dan tujuan evaluasi.
Soal hendaknya ditata sedemiian rupa agar dari segi strutkur dapat memberi kesan
psikologis yang menyenangkan bagi peserta tes. Struktur soal dapat diatur sebagai
berikut.
1. Pola pertama: soal disusun mulai dari yang paling sukar dan berakhir dari
yang paling mudah.
2. Pola kedua: soal disusun dari yang paling mudah dan berakhir dari yang
paling sukar.
3. Pola ketiga: mulai dari soal yang mudah, menuju soal yang lebih sukar sampai
yang paling sukar, kemudian secara teratur berakhir pada yang mudah lagi.
Hal lain yang sangat penting dalam penulisan soal adalah :
1) Penggunaan bahasa Indonesia yang tepat
2) Syarat-syarat merumuskan / menyusun item.

1. Penggunaan Bahasa Indonesia dalam penulisan soal.


Dalam uraian berikut ini penulis mencoba merumuskan penggunaan
bahasa Indonesia yang didasarkan atas Ejaan Bahasa Indonesia Yang
Disempurnakan (EYD), serta petunjuk dari Departemen Pendidikan dan
Kebudayaan, Direktorat Jenderal Pendidikan Dasar dan Menengah tahun 1984,
tentang Kaedah Bahasa Indonesia Dalam Penulisan Soal Tes Prestasi Belajar.
I. Penulisan Huruf
A. Huruf Besar
1. Huruf Besar selalu dipakai di awal stem
2. Huruf besar dipakai diawal option bila :
Stem diakhiri dengan tanda tanya (?) atau tanda seru (!)

12

Penulisan huruf besar yang lainnya dapat dilihat pada ejaan yang
disempurnakan.
B. Huruf Kecil
Huruf kecil selalu dipakai diawal option, kecuali pada ketentuan A diatas.
Contoh : Ahli psikiatri disebut,
a. Psikolog
b. Conselor
c. Psikiater
d. Evaluator
II. Tanda Baca :
A. Tanda Tanya (?)
1. Tanda tanya dipakai pada akhir stem atau option yang berbentuk
pertanyaan.
2. Setelah tanda tanya (?) atau tanda seru (!) diperkenankan memberi
tanda tiitk.
B. Tada Titik (.)
1. Jumlah titik pada akhir stem yang tidak diakhiri dengan tanda tanya
atau tanda seru adalah empat titik (tiga titik untuk elips dan satu titik
untuk mengakhiri kalimat)
Contoh: Dasar negara kita adalah
a. Pancasila
b. UUD 1945
c. Burung Garuda
d. Bhinneka Tunggal Ika
2. Jumlah titik pada bagian kalimatyang dihilangkan sebanyak tiga titik
ditengah kalimat, dan empat titik di akhir kalimat
Contoh : tengah kalimat
Kegiatanyang belum ditemukan dalam fase pendahuluan bimbingan
konseling.
a. membuat kontak yang baik dengan konseli
b. memberi keyakinan / kepercayaan kepada konseli
c. secara periodik dan teliti mengolah data
d. mengenal identitas konseli
3. Tanda titik dipakai pada akhir option bila:
a. Option berbentuk kalimat
b. Option berpribahasa
c. Stem diakhiri tanda tanya atau tanda seru

13

4. Tanda titik tidak dipakai pada akhir judul yang merupakan kepala
karangan atau kepala ilustrasi, tabel, dan sebagainya.
Contoh:
Bhagawad Gita
Kunjungan Mendikbud
C. Garis Bawah
1. Garis bawah dipaka untuk nama buku, majalah dan surat kabar yang
dikutip.
Contoh: majalah Horison
2. Garis bawah dipakai pada penekanan maksud soal
Contoh: skor tertinggi dalam norma relatif skala sebelas adalah
a. 10
c. 11
b. 9
d. 12
3. Kata tidak atau bukan ditulis bergaris bawah pada pernyataan soal
berbentuk nefatif.
Contoh: Berikut ini yang bukan termasuk aspek psikologis:
a. kepribadian
b. sikap sosial
c. intelektual
d. lingkungan
4. Kata kecuali dalam stem ditulis dengan huruf kecil, dan bergaris
bawah.
Contoh: berikut ini adalah karya-karya Hamka, kecuali
a. keadilan Ilahi
b. dibawah lindungan Kabah
c. menunggu beduk Berbunyi
d. dosa atas manusia
5. Kata sebab (dalam bentuk soal hubungan antar hal), ditulis dengan
huruf kecil dan bergaris bawah. Pada pernyataan kedua (setelah kata
sebab) dimulai dengan huruf kecil dan diakhiri dengan tanda titik pada
akhir kalimat.
D. Tanda Koma (,)
Tanda koma (,) dipakai sebelum kata :
1. Sebab (dalam bentuk hubungan antar hal)
2. Kecuali (dalam bentuk pilihan ganda)
E. Tanda Petik (..)
Tanda eitk dipakai untuk memperjelas maksud soal pada stem.
Contoh: Sinonim kata evaluasi yang tepat pada kalimat Evaluasi Belajar
Tahap Akhir ialah
a. penilaian

14

b. penapsiran
c. pengira-ngiraan
d. pendugaan
III. Penulisan Kata
a. Menghindarkan penggunaan kata tersebut pada soal / stem. Gunakan kata
diatas, dibawah, sebagai gantinya.
b. Menghindarkan perulangan kata / ungkapkan pada stem dan option yang
memberikan petunjuk ke arah jawaban yang benar.
c. Menghindari penggunaan kata / ungkapan yang bermakna luas / tidak
tentu pada stem. Seperti : kebanyakan pada umumnya, seringkali, kadangkadang dan sejenisnya.
d. Penggunaan nama orang, nama tempat harus yang sudah dikenal umum
atau telah diajarkan, ada pada diktat / buku bacaan.
e. Kata Depan dan Awalan
1. Kata depan di, ke, dari harus ditulis terpisah dari kata yang
mengikutinya, karena kata depan itu mempunyai kedudukan sebagai
2.

kata dan fungsinya menyatakan tempat.


di, ke, dan dari selalu ditulis seringkali pada kata pendeta, daripada,
kemari.

2. Syarat-syarat Merumuskan / Menyusun Item.


Penyusunan item tes yang dibicarakan di bawah ini terbatas pada syarat
penyusunan item tes obyektif. Dalam menyusun item tes obyektif akan
dibicarakan : a) petunjuk secara umum dan b) petunjuk secara khusus.
a) Petunjuk Umum
Petunjuk umum merupakan pedoman yang berlaku secara umum untuk
semua tipe tes obyektif antara lain :
1. Janganlah menggunakan susunan kata / kalimat yang sukar, kecuali untuk
mengukur kemampuan bahasa.

15

2. Jangan menggunakan kalimat yang langsung diambil dari buku / teks book,
sebab dapat menibulkan verbalisme.
3. Apabila suatu item didasarkan atas suatu pendapat tertentu, harus disebutkan
dari siapa pendapat tersebut.
4. Item suatu tes hendaknya jangan memberikan petunjuk terhadap jawaban item
yang lain
5. Jawaban dari suatu item, janganlah merupakan kondisi dariapda item
berikutnya.
6. Susunan jawaban benar hendaknya disusun secara random.
Ada beberapa teknik random yang dapat digunakan yaitu : 1. Teknik
undian, 2. Teknik abjad, 3. Teknik bilangan random.

b) Petunjuk khusus
Petunjuk khsuus adalah suatu pedoman untuk menyusun item tes dalam
tipe tertentu tes obyektip.
1. Syarat / petunjuk item tes benar salah :
a. Item benar salah hendaknya ditulis secara jelas dan difinitif, sehingga
tidak meragukan.
b. Hindari penggunaan kata yang merupakan penentu penentu khusus
seperti : selalu, semua, kadang-kadang tidak pernah kecuali bermaksud
untuk mengukur logika (teknik berpikir atau analisa pikiran).
c. Hindari penggunaan negatif rangkap
d. Jangan mempergunakan dua konsep atau masalah dalam satu item.
e. Hindari penentuan jawaban yang hanya tergantung kepada satu huruf saja,
kecuali digunakan untuk mengukur kemampuan ejaan.
2. Syarat item menjodohkan (matching)
a. Stem-stem merupakan satuan dalam pasangan hendaknya bersifat sejenis,
misalnya : nama orang, tanggal / tahun kejadian, tempat dan sebagainya.
b. Jumlah jawaban hendaknya lebih banyak daripada stem. Hal ini
bermaksud menghindari jebakan dari anak.
c. Option jawaban disusun secara random.

16

d. Stem ditulis disebelah kiri dengan nomor urut, dan option disebelah kanan
dengan huruf abjad.
e. Hindari penulisan yang bersambung kehalaman berikutnya.
3. Syarat item melengkapi (complition)
a. Hindari penggunaan statemen yang dapat menimbulkan lebih dari satu
jawaban.
b. Ruang yang

dikosongkan

hendaknya

merupakan

tempat

untuk

memberikan jawaban dari suatu fakta.


c. Jangan terlalu banyak ruang isian dalam satu item.
d. Sedapat mungkin isian diletakkan bagian akhir statemen.
Catatan : semua jawaban dikerjakan pada lembar jawaban dengan bentuk
sebagai berikut :
1. ____________________________________
2. ____________________________________
3. ____________________________________
4. ____________________________________dst.
4. Syarat item tes pilihan ganda (multiple choice)
Dalam prakteknya, tipe tes pilihan ganda merupakan bentuk yang palig
banyak digunakan oleh seorang pendidik / guru. Sebab dengan variasi bentuk
tes ini, dapat melatih kemampuan kognitif dalam taraf tinggi seperti : aplikasi,
analisis, sintesis, dan sebagainya. Untuk jelasnya maka akan dijelaskan
tentang :
A) Variasi bentuk tes pilihan ganda (multiple choice)
B) Syarat item tes pilihan ganda (multiple choice)

A. Variasi Bentuk Tes Pilihan Ganda (Multiple Choice)


Variasi bentuk tes ini ada beberapa bentuk yaitu :
1. Melengkapi dengan beberapa pilihan
2. Analisa hubungan antar hal
3. Melengkapi berganda
4. Pemakaian diagram gambar dan grafik
5. Analisa khusus
Dibawah ini akan dijelaskan masing-masing variasi di atas
1. Melengkapi dengan beberapa pilihan

17

Bentuk ini tediri dari stem yang merupakan suatu pernyataan yang
belum

lengkap,

kemudian

disediakan

beberapa

alternatif,

atau

kemungkinan jawaban yang benar.


Dari kemungkinan jawaban tersebut hanya satu ada jawaban yang
benar/paling benar.
Contoh :
Petunjuk :untuk soal berikut (nomors/d) pilihlah salah satu jawaban
yang paling tepat.
a. Variasi ke-1
Orang yang lebih mudah menangkap dan menyimpan kesan edngan
jalan melihat disebut mempunyai tipe
a. motoris
b. visualis
c. ouditif
d. komplektif
b. Variasi ke-2
Termasuk kecakapan sebagai hasil belajar adalah sebagai berikut,
kecuali
a. prestasi belajar
b. perubahan sikap dan tingkah laku
c. intelegensi (iq)
c. Variasi ke-3
Diantara hal-hal di bawah ini yang bukan merupakan tujuan
pembelajaran adalah yang berorientasi kepada
a. materi pengajaran
b. tingkah laku siswa
c. kemampuan siswa
d. hasil belajar siswa
2. Analisa Hubungan Antar Hal (Relation Ship Analysis)
Jenis variasi bentuk ini sering disebut Hubungan sebab akibat.
Soal ini terdiri dari dua pernyataan. Dari kedua pernaytaan itu dapat
ditanyakan apakah keduanya benar atau tidak. Lebih lanjut dapat
dipikirkan apakah diantara pernyataan itu terjalin hubungan sebab akibat
atau tidak sama sekali.
Contoh :
Petunjuk : Untuk soal-soal berikut ini (nomors/d) pilihlah :

18

A) Jika pernyataan betul, alasan beutl dan keduanya menunjukan


hubungan sebab-akibat.
B) Jika pernyataan betul, alasan betul tapi keduanya tidak menunjukkan
sebab-akiabt.
C) Jika pernaytaan betul alasan salah
D) Jika pernaytaan salah dan alasan betul
E) Jika pernyataan dan alasan salah.
Contoh soal :
Untuk menolong penderita muntah berak dapat digunakan garam diarhee,
Sebab
Diarhee dapat mengganggu keseimbangan elektrolit dalam tubuh (A)
3. Melengkapi Berganda (Multiple Complition)
Pada dasarnya bentuk ini sama dengan bentuk pertama, yaitu
melengkapi dengan beberapa pilihan. Bedanya adalah dalam bentuk
pertama hanya ada satu jawaban benar, tetapi dalam bentuk ini jawaban
benar bisa lebih dari satu.
Contoh :
Petunjuk : untuk soal-soal berikut ini (s/d) pilihlah :
A) Jika (1), (2), dan (3) betul
B) Jika (1), dan (3) betul
C) Jika (2), dan (4) betul
D) Jika (4) betul
E) Jika semuanya betul
Contoh soal :
Tujuan penggajaran berorientasi kepada
1.
2.
3.
4.

tingkah laku siswa


kemampuan siswa (A)
hasil belajar siswa
kemampuan guru

4. Pemakaian Diagram Gambar dan Grafik

19

Bentuk soal yang dipakai disini adalah bentuk perama yang


melengkapi dengan beberapa pilihan, tetapi masalahnya diwujudkan dalam
bentuk gambar, diagram, atau grafik.
Contoh :
Petunjuk : Untuk soal-soal berikut (s/d) sesuaikanlah jawaban anda
dengan nomor yang ada pada masing-masing komponen pada gambar.
Gambar Sosiogram :
7

4
1

6
9

8
10

13

11

12

Soal :
Dalam gambar hubungan analisa sosial di atas, anak yang terisolir adalah:
a. 1
d. 4
b. 2
e. 7
c. 3
5. Analisa Kasus
Masalah yang diungkap dalam stem ini merupakan keadaan nyata,
sehingga peserta ujian seakan-akan berhadapan dengan keadaan
sebenarnya.
Contoh :
Petunjuk : Untuk soal nomors/ddisediakan suatu tes yang harus
dipahami

secara

cermat.

Kemudian

menyusul

soal-soal

yang

memasalahkan hal-hal yang berhubungan dengan isi tes. Pilihlah satu


jawaban yang tepat soal-soal yang mengiringi tes.
Soal :

20

Sebuah benda digantung dengan pegas, dengan H0 adalah tinggi benda dari
tanah. Bila sekarang benda ditarik sedikit ke bawah kemudian dilepaskan,
benda akan berayun naik turun secara harmonis dengan frekwensi ayunan
per detik.
Ayunan dari benda disebabkan oleh
A) Tarikan searah dari gravitasi
B) Tarikan searah dari pegas
C) Interaksi antara pegas dan gaya gesekan udara
D) Interaksi antara gaya grafitasi dan gaya gesekan udara
E) Interaksi antara gaya pegas dan gravitasi (kuci E)
B. Syarat Item Tes Pilihan Ganda (Multiple Choice)
Sebelum dijelaskan beberapa syarat penulisan item tes ini, maka perlu
diperkenalkan bentuk soal sebagai berikut:
Pada soal terdapat dua komponen yaitu :
1. Stem, adalah suatu pernyataan uang mengungkap secara deskriptip tentang
permasalahan yang akan ditanyakan. Kalimat stem dapat berbentuk, kalimt
tanya, kalimat suruh, kalimat utuh (pernyataan) dan kalimat tidak utuh.
Contoh :
a. Siapakah nama Presiden Republik Indonesia yang pertama? (kalimat
tanya)
b. Tunjukkan alat peraga yang mudah ditangkap melalui indra
pendengaran ! (Kalimat suruh)
c. Hak setiap warga negara untuk memperoleh pendidikan dan
pengajaran dalam UUD 1945, (kalimat utuh)
d. Susunan UUD 1945 terdiri dari.bagian,(kalimat tak utuh) atau
Susunan UUD 1945 terdiri dari (kalimat tidak utuh).
2. Option; ialah suatu kata atau kalimat yang merupakan kelengkapan dari
komponen Stem, yang berfungsi sebagai alternatif jawaban. Option dapat
dibedakan menjadi dua yaitu: option kunci dan option pengecoh
(dstractions).
Contohsoal :
Susunan UUD 1945 terdiri dari : --- STEM,
a. satu bagian

21

b. dua bagian ----- pengeceh Distractions


c. tiga bagian ----- Options
d. empat bagian ----- Option kunci
Setelah kita kenal bentuk tes seperti di atas, maka

barulah kita

membicarakan syarat penyusun tes pilihan ganda yang berlaku untuk semua
variasinya.
Adapun syaratnya adalah :
1. Seluruh komposisi hendaknya betul-betul mengungkapkan permasalahan
yang layak dikemukakan sebagai suatu stem atau soal, bukan hanya
sekedar deretan kata atau kalimat yang tidak bernilai sebagai suatu soalan.
Hindari kalimat yang subyekti dan puitis.
2. Diskripsi masalah yang diungkap stem hendaknya jelas, terutama dalam
tata kalimat yang benar, dan tidak mengundang maksud untuk menjebak
peserta tes (yang diuji).
3. Gunakan sedapat mungkin bentuk kalimat positif. Apabila digunakan
bentuk ingkar atau menyangkal, tulislah dengan garis bawah seperti :
(tidak, bukan, kecuali).
4. Dalam mengungkap permasalahan hendaknya dihindari penggunaan
ungkapan yang bersifat indenfinite seperti : kebanyakan, sering kali,
kadang-kadang, paling dan sejenisnya sehingga menimbulkan tafsiran
yang subyektif bagi peserta ujian.
5. Dalam menyusun soal hendaknya dapat diusahakan agar tidak terdapat
suatu ungkapan atau susunan kalimat yang memberikan petunjuk kepada
peserta ujian tentang kuncinya.
6. Kata-kata atau ungkapan yang digunakan sebagai pilihan jawaban
hendaknya seimbang baik kandungan makna maupun susunan katakatanya.

22

7. Untuk setiap soal hanya terdapat satu jawaban benar atau hanya satu
nomor benar dari nomor-nomor option yang disediakan.
8. Usahakan agar umpan (distractor) mirip betul dengan kunci (key) sehingga
derajat derajat kesukaran soal dapat mencerminkan kemampuan peserta
ujian.
9. Kunci jawaban di buat secara randomisasi, baik jumlahnya, maupun
tempat atau letaknya dalam lembar jawaban.
10. Hal-hal yang berhubungan dengan permaslaahan dan dapat menunjukkan
arah jawaban, hendaknya jangan dipergunakan.
11. Hindarkan interpendency antar soal satu dengan yang lainnya.
12. Cegah kesalahan dalam penggunaan kata-akta / kalimat (gunakan bahasa
sesuai dengan EYD)
13. Perhatikan taraf isi soal, hendaknya cocok seperti tabel kisi-kisi yang
memuat beberapa kompetensi.
14. Option hendaknya diusahakan mungkin benar (plaussible). Makin
homogin optionnya semakin tinggi taraf knowledge yang diukur.
15. Sedapat mungkin hindari penggunaan semua di atas benar atau semua
di atas salah pada option.
16. Jumlah option masing-masing soal dari satu ungkapan soal hendaknya
sama.
17. Hindari penulisan soal yang terpisah atau terpotong kehalaman berikutnya.
18. Option hendaknya disusun secara jelas dan secara vertikal.
(Suprapto, tahun 1982, hal 14).

23

BAB III
MEMBERI SKOR (SCORING)

1. Tes Essay
Pemberian skor tes essay dapat ditempuh dua cara yaitu : a) dengan
menggunakan metode analisa (analitycal method), b) metode sortir (sorting
method).
a) Metode Analisa (Analytical Method)

24

Ialah suatu cara menilai dengan menyiapkan sebuah acuan atau model
tertentu dari tiap-tiap nomor soal atau jawaban. Tiap-tiap jawaban dianalisa
menjadi beberapa elemen, kemudian masing-masing elemen disiapkan skor sesuai
dengn skala tau norma yang digunakan. Kemudian jawaban anak dicocokkan
dengan acuan tersebut tadi.
Misalnya :
Sebuah tes essay, dengan bobot lima (5) artinya jika tes tersebut dijawab
benar anak dapat skor = 5 (lima). Jawaban tes tersebut dianalisa menjadi lime
elemen yaitu I, II, III, IV, dan V. Kemudian jawaban anak dibandingkan dengan
elemen yang telah disiapkan. Jika jawaban anak hanya memuat 4 (empat) elemen
dan benar maka anak memperoleh skor untuk nomor tersebut 4 (empat). Demikian
seterusnya untuk semua soal.
b) Metode Sortir (Soting Method)
Cara ini tidak diabgi menjadi beberapa elemen tetapi pemeriksa harus
memabca seluurh jawaban masing anak, setelah itu baru diletakkan pada masingmasing klasifikasi,misal : sangat baik, baik, sedang, kurang, sangat kurang. Cara
seperti ini dikerjakan terus menerus sampai pada semua jawaban anak. Metode ini
akan lebih baik jika pemeriksa dapat mengulang atau mengecek kembali apakah
klasifikasi di atas tadi sudah tepat atau belum. Setelah itu barulah diberi skor
sesuai dengan klasifikasinya.
Skor yang diperoleh anak atas klasifikasi ini adalah skor dari seluruh tes.
Bilamana acuan norma yang digunakan adalah penilaian Acuan Patokan dengan
skala 5 (lima) maka dapat dijabarkan sebagai berikut ;
Sangat baik,

diberi skor = 4 atau A

25

Baik,

diberi skor = 3 atau B

Sedang,

diberi skor = 2 atau C

Kurang,

diberi skor = 1 atau D

Jika kita ingin menggunakan penilaian acuan patokan dengan skor tertinggi adalah
10 (sepuluh), maka masing-masing klasifikasi di atas tadi dibagi dua lagi yaitu:
a = 10
SB
b=9
c=8
B
d=7
e=6
SD
f=5
---------5,5
g=4
KR
h=3
i=2
SK
j=1

2. Tes Obyektif
Setelah jawaban anak diperiksa dengan menggunakan sistim kunci maka
skor yang diperoleh dianalisa dengan mengguankan rumus sebagai berikut:
a. Rumus untuk tipe Tes Benar Salah (B S)
SK = (B S) x Bt
Keterangan :
= Jumlah
Sk = Skor
B = Benar
S = Salah
Bt = Bobot
b. Rumus untuk tipe Tes Menjodohkan (Matching Tyepe)
Sk = B x Bt

26

Keterangan :
Sk = Skor
B = Jumlah benar
Bt = Bobot
c. Rumus untuk tipe Tes Melengkapi (Complition)
Sk = B x Bt
Sk = Skor
B = Jumlah benar
Bt = Bobot
d. Rumus untuk tipe Tes Pilihan Ganda (Multiple Choice)
( BS)
x bt
Sk =
n1
Keterangan :
Sk
= skor
B
= jumlah jawaban benar
S
= jumlah jawaban salah
n
= jumlah option
1
= Bil. Tetap
Bt
= Bobot
Rumus ini dapat digunakan untuk semua variasi tipe pilihan ganda.

27

BAB IV
MENGUBAH SKO MENTAH MENJADI SKOR STANDAR

Mengubah skor mentah menjadi skor standar yang dibicarakan berikut ini
terbatas untuk tipe tes obyektif. Sebab tes essay sesuai dengan fungsinya maka
akan lebih tepat diukur dengan menggunakan PAP, seperti telah diuraikan didepan
dengan variasi yang tidak terlalu banyak. Sedangkan dalam tipe tes obyektif
memiliki variasi skor yang sangat heterogen sebab masing-masing tipe memiliki
rumus skoring tersendiri, kadang-kadang satu rangkaian soal memuat berbagai
variasi tes obyektif serta jumlah soal yang relatif banyak. Dengan kemungkinan
itu sudah tentu diperoleh siswa. Dengan kata lain skor mentah perlu dianalisa,
sebab skor tersebut tidak akn berarti apa-apa sebelum diolah.
Misalnya : Erma memperoleh skor psikologi = 47. Apakah artinya?
Sudah tentu akan tidak terjawab, jika tidak diolah/dirubah.
Untuk mengubah skor mentah menjadi skor standar ada dua pendekatan
yaitu : 1) Pendekatan Acuan Patokan (PAP) dan 2) Pendekatan Acuan Norma
(PAN).

1. Penilaian Acuan Patokan


Penilaian acuan patokan adalah suatu cara penilaian dengan jalan
membandingkan skor yang dicapai anak atau siswa dengan nilai yang telah

28

ditetapkan. Skor patokan ini didasarkan atas tingkat penguasaan kompetensi


bidang studi yang didapat dilihat dari :
a. Prosentase tingkat penguasaan materi
b. Patokan yang disusun berdasarkan Mean ideal (Mi), dan Standar Deviasi ideal
(Sdi)

a. PAP dilihat dari prosentase tingkat penguasaan materi. Cara ini menggunakan
rentangan prosentase dari 0% - 100%, yang diklasifikasikan menadi beberapa
kelompok.
Dalam cotoh dibawah ini diuraikan PAP skala lima sebagai berikut:
Tingkat penguasaan materi
90 % - 100 %
80 % - 89 %
65 % - 79 %
55 % - 64 %
0 % - 54 %

Nilai
Angka
4
3
2
1
0

Huruf
A
B
C
D
E

Contoh penggunaannya :
Tes evaluasi pendidikan terdiri dari ; 85 item, dengan demikian maka skor
maksimal ideal adalah 85 (bobot soal adalah 1). Erma mampu mengerjakan
betul dengan skor 55.
Berapakah skor standarnya ?
Jawab :
Pedoman konversi dapt dibuat sebagai berikut :
90
Penguasaan 90 % = 100 x 85 = 76,50 (71)
Penguasaan 80 % =

80
100

x 85 = 68,00

Penguasaan 65 % =

65
100

x 85 = 55,25 (55)

Penguasaan 55 % =

55
100

x 85 = 46,75 (47)

Selanjutnya disusun bentuk konversi sebagai berikut:

29

Tingkat penguasaan materi


71 - 85
68 - 70
55 - 67
47 - 54
0 - 46

Nilai
Angka
4
3
2
1
0

Huruf
A
B
C
D
E

Cara menyusun; baris disebelah kiri didapat dari perhitungan prosentase, yang
disebelah kanan dicari dengan cara: tuliskan skor maksimal idial paling atas
(85) selanjutnya mengurangi 1 angka disebelah kiri yang berada di atas kelas
intervalnya ( lihat tanda panah). Berdasarkan tabel konversi di atas maka Erma
memperoleh skor mentah 55 standarnya adalah (2) C.
Standar PAP dapat dirubah sesuai dengan tujuan evaluasi, materi yang diukur dan
pertimbangan lain yang berorientasi pada mutu atau kebermanfaatan untuk peserta
didik.
Contoh standar yang bisa digunakan:
Tingkat penguasaan materi
85 % - 100 %
75 % - 84 %
65 % - 74 %
55 % - 64 %
0 % - 54 %

Nilai
Angka
4
3
2
1
0

Huruf
A
B
C
D
E

Mengingat bahwa penilaian pendidikan pada tingkat SMA ke bawah


sangat jarang menggunakan penilaian skala lima, melainkan yang digunakan
adalah skala sebelas artinya skor tertinggi adalah 10 dan terendah adalah 0.
Sehubungan dengan hal itu, penulis mencoba memberikan acuan patokan yang
tingkat penguasaan materinya dapat diequvalensikan dengan PAP.

30

ST =

X
SMI

x 100

ST =

X
SMI

x 10

(untuk nilai puluhan)

(untuk nilai satuan)

Keterangan :
ST
= Skor standar
X
= Skor mentah (skor yang diperoleh siswa)
SMI
= Skor maksimal ideal

= Sigma / jumlah
Rumus di atas dapat diguankan untuk bobot soal yang berbeda-beda.
Setelah dianalisa dengan rumus di atas skor yang diperoleh diequivalensikan
dengan batas kelulusan pada PAP yaitu 65%. Semua siswa memperoleh skor (ST)
65% ke atas, lulus sedangkan dibawah itu tidak lulus.
Contoh penggunannya :
Bidang studi yang dievaluasi adalah : PMP. Jumlah soal / item adalah 90.
Bobot soal adalah 1 untuk tiap-tiap item.
Peserta testing adalah : Erma, Era, Eka, Edi, dan Eva. Setelah diperiksa ternyata
masing-amsing peserta tes memperoleh skor sebagai berikut :
Erma = 70

Eka

= 50

Era

= 65

Edi

= 85

Eva

= 80

Berapakah skor standarnya?


Jawab :
Jumlah item

= 90

Bobot soal

=1

SMI

= 90 x 1

31

= 90
Skor standar Erma

Skor standar Era

Skor standar Eka

Skor standar Edi

Skor standar Eva

70
90

x 100 = 77,8 (78)

65
90

x 100 = 72,2 (72)

50
90

x 100 = 55,5 (56)

85
90

x 100 = 94,4 (94)

80
90

x 100 = 88,8 (89)

Melihat dari skor standar di atas, maka Eka tidak lulus karena ST-nya masih di
bawah standar kelulusan 65%.

b. Nilai Patokan Yang Disusun Berdasarkan Mean Ideal (Mi) dan Standar
Deviasi (SDi)
Norma ini juga didasarkan atas penguasaan kompetensi yang diajarkan. Norma
yang disusun sangat erat hubungannya dengan jumlah item dan bobot untuk tiaptiap item. Berdasarkan atas jumlah item dan bobot itu akan diperoleh skor yang
diperoleh siswa, kemudian dapat dicari berturut-turut : Skor Maksimal Ideal
(SMI), mean ideal (MI) dan Standar Deviasi Ideal (SDI).
Adapun langkah-langkah yang ditempuh dalam menyusun nilai patokan
ini adalah sebagai berikut :
1. Menentukan Skor Maksimal Ideal (SMI), adalah suatu skor yang diperoleh
oleh siswa jika semua soal dijawab dengan betul.
Dengan kata lain dapat dikatakan bahwa SMI adalah penjumlahan hasil kali
masing-masing item dengan bobotnya.

32

2. Menentukan angka rata-rata ideal (Mi), dengan menggunakan rumus sebagai


berikut :
Mi = x SMI
3. Menentukan standar deviasi ideal (SDi), dengan rumus sebagai berikut :
1
SDi = 3 x Mi
4. Menyusun pedoman konversi / patokan sebagai berikut :
------ 10
M + 2,25 SD
------ 9
M + 1,75 SD
------ 8
M + 1,25 SD
------ 7
M + 0,75 SD
------ 6
M + 0,25 SD
------ 5
M - 0,25 SD
------ 4
M - 0,75 SD
------ 3
M - 1,25 SD
------ 2
M - 1,75 SD
------ 1
M - 2,25 SD
------ 0
Contoh penggunaannya :
Suatu tes hasil belajar bidang studi yang terdiri dari :
15 item benar salah dengan bobot 2
15 item pilihan ganda dengan bobot 1
30 soal item menjodohkan (matching) dengan bobot 1
2 item tes essay masing-masing dengan bobot 5
Jika salah seorang peserta tes memperoleh skor 85, berapakah skor
sntadarnya?
Jawab :
a. Skor maksimal ideal dicari dengan berikut :
Skor untuk benar salah
= 15 x 2 = 30
Skor untuk piilhan ganda
= 15 x 2 = 30
Skor untuk menjodohkan
= 30 x 1 = 30

33

Skor untuk tes essay


= 2 x 5 = 10
Jumlah (SMI) =
100
b. Menentukan Mi = x SMI
Mi = x 100
= 50
1
c. Menentukan SDi
= 3 x Mi
=

1
3

x 50

= 16,67
d. Membuat tabel konversi
Mi = 50,
SDi = 16,67
-----10
M + 2,25 SD = 50 + (2,25 x 16,67) = 50 + 37,51 = 87,51 (88)
-----9
M + 1,75 SD = 50 + (1,75 x 16,67) = 50 + 29,17 = 79,17 (79)
-----8
M + 1,25 SD = 50 + (1,25 x 16,67) = 50 + 20,84 = 70,84 (71)
-----7
M + 0,75 SD = 50 + (0,75 x 16,67) = 50 + 12,50 = 62,50 (63)
-----6
M + 0,25 SD = 50 + (0,25 x 16,67) = 50 + 4,17 = 54,17 (54)
-----5
M 0,25 SD = 50 (0,25 x 16,67) = 50 4,17 = 45,83 (46)
-----4
M 0,75 SD = 50 (0,75 x 16,67) = 50 12,50 = 37,50 (38)
-----3
M 1,25 SD = 50 (1,25 x 16,67) = 50 20,84 = 29,16 (29)
-----2
M 1,75 SD = 50 (1,75 x 16,67) = 50 29,17 = 20,83 (21)
-----1
M 2,25 SD = 50 (2,25 x 16,67) = 50 37,51 = 12,49 (12)
------0
88- = 10
79-87 = 9
71-78 = 8
63-70 = 7
54-62 = 6
46-53 = 5
38-45 = 4
29-37 = 3
21-28 = 2
12-20 = 1

34

0-11 = 0
Jadi siswa yang mendapat skor 85, memperoleh skor standar = 9.
2. Penilaian Acuan Norma
Panilaian acuan norma adalah suatu cara penilaian dengan cara
membandingkan skor yang diperoleh siswa dengan skor rata-rata yang dicapai
oleh kelompoknya.
Adapun langkah-langkah yang ditempuh adalah :
a. Menyusun tabel data
b. Menyusun tabel kerja untuk mencari Mean (M) dan Standar Deviasi
(SD)
c. Menyusun tabel konversi.
Contoh penggunaannya :
Hasil EBTA dari suatu SMA adalah sebagai berikut :
a. Tabel tentang hasil EBTA SMA
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Nama
Asih
Ariani
Gariani
Budarsa
Arta
Dewi
Dama
Yusuf
Joni
Kusuma
Melyawati
Lely
Mastri
Sariati
Puspa
Sutarmi

Skor
45
37
51
42
34
39
24
49
30
14
32
38
40
35
28
31

No
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

Nama
Surya
Setia
Sudi
Tini
Jaya
Suri
Sundari
Umbara
Trsina
Astini
Widia
Wina
Yuni
Toni
Erda
Erma

b. Menyusun tabel kerja untuk mencari M dan SD


Diketahui skor tertinggi = 58, skor terendah = 14 maka :
R = 58,5 3,5
= 45
R
i maksimum
= 7

Skor
58
45
36
27
43
17
41
35
33
32
48
25
20
53
44
38

35

45
7

= 6,43
R
= 15

i minimum

45
15

= 3,0
Jadi interval yang dipakai adalah 3.
Tabel kerja untuk mencari M dan SD
Kls
Interval
57 59
54 56
51 53
48 50
45 47
42 44
39 41
36 38
33 35
30 32
27 29
24 26
21 23
18 20
15 17
12 14
-

fX

X1

fX1,2

58
55
52
49
46
43
40
37
34
31
28
25
22
19
16
13
-

1
0
2
2
2
3
3
4
4
4
2
2
0
1
1
1
N = 32

58
0
104
98
92
129
120
148
136
124
56
50
0
19
16
13
1163

21,66
18,66
15,66
12,66
9,66
6,66
3,66
0,66
-2,34
-5,34
-8,34
-11,34
-14,34
-17,34
-20,34
-23,34
-

469,16
0
490,47
320,50
186,63
133,07
40,19
1,74
21,90
144,06
139,11
257,19
0
100,68
413,72
544,76
3464,23
fX1,2

fX
M

=
=

fX
N

1163
32

= 36,34
SD

fX 1.2

3464,23
N 32

36

108,25718

= 10,40
c. Menyusun pedoman konversi
-----10
M + 2,25 SD = 36,34 + (2,25 x 10,40) = 36,34 + 23,40 = 59,74
-----9
M + 1,75 SD = 36,34 + (1,75 x 10,40) = 36,34 + 18,20 = 54,54
-----8
M + 1,25 SD = 36,34 + (1,25 x 10,40) = 36,34 + 13,00 = 49,34
-----7
M + 0,75 SD = 36,34 + (0,75 x 10,40) = 36,34 + 7,80 = 44,14
-----6
M + 0,25 SD = 36,34 + (0,25 x 10,40) = 36,34 + 2,60 = 38,94
-----5
M - 0,25 SD = 36,34 - (0,25 x 10,40) = 36,34 2,60 = 33,74
-----4
M - 0,75 SD = 36,34 - (0,75 x 10,40) = 36,34 7,80 = 28,54
-----3
M - 1,25 SD = 36,34 - (1,25 x 10,40) = 36,34 13,00 = 23,24
-----2
M - 1,75 SD = 36,34 - (1,75 x 10,40) = 36,34 18,20 = 18,14
-----1
M - 2,25 SD = 36,34 - (2,25 x 10,40) = 36,34 23,40 = 12,94
-----0
Berdasarkan tabel konversi di atas dapat dibandingkan skor yang
diperoleh siswa dengan skor standar norma. Siswa yang dinyatakan lulus adalah
skor 44,14 dibulatkan = 44 ke atas.
Secara umum pelaksanaan penilaian dalam proses belajar sering berakhir
setelah diperoleh skor standar dari masing-masing siswa. Sebenarnya penilaian

37

tidaklah berhenti sampai disana. Skor yang diperoleh dalam bentuk angka atau
kwanitas itu perlu diinterpretasikan dalam penilaian yang berifat kwalitas. Sebab
bagaimanapun seorang guru dituntut untuk dapat memberikan berbagai
interpretasi terhadap keberhasilan siswa.
Misalnya seorang siswa memperoleh skor 50. Apakah artinya?. Sudah
tentu akan menuntut berbagai jawaban antara lain : siswa itu pintar, siswa itu
berhasil sangat baik, cukup, kurang dan sebagainya.
Agar estimasi yang diberikan guru tidak terlalu subyektif, maka
diperlukan adanya suatu cara untuk mengkonversikan skor kwantitas.
Salah satu cara yang dapat ditempuh dalam sistem perpencaran skor
menurut area kurva normal.
Pencaran Skor Standar Dalam Kurva Normal

Percent of cases under


portions of the normal
curve
standard deviation
commulative
0,13%
percentages
rounded
-4

2,14%

13,59% 34,13% 34,13% 13,59%

2,14% 0,13%

-3

-2

-1

+1

+2

+3

0,1%

2,3%
2%

15,0%
16%

50,0%
50%

84,1%
84%

97,7%
98%

99,9%

Percentile
equivalents
1

5 10

203040 50 60 70

80 90 95

99

typical standard
scores
z scores
-40

-30

-20

-10

+10

+20

+30

T scores

20

30

40

50

60

70

80

Ceed scores

200

300

400

500

600

700

800

38

ACT scores

40

Stanine

60
1

80
3

Percent in stanine

4%

7% 12%

Deviation IQs

55

70

100

120

5 6

17%

20% 17% 12% 7%


100

140
8

160

115

9
4%
130

145

Stanley, Tahun 1964, hal 74


Keterangan
0
= titik tengah (Mean) daerah kurva normal

= standard deviasi (SD)


+
= daerah positif kurva normal (0 s/d + 40)
= daerah negatif kurva normal (0 s/d -40)

Dari kurva normal diatas kita bisa menyusun pedoman konversi dari skor
kwantitas kepada skor kwalitas kepada skor kwalitas diketaui -40 dan + 40
merupakan daerah kurva yang terlalu jauh dari kenormalan. Karena itu dalam
konversi berikut ini angka tersebut di atas tidak disertakan.
Beberapa model konversi yang dapat disusun adalah sebagai berikut:
1. Konversi Berjenjang (Klasifikasi) Lima
M + 2 SD N M + 3 SD = sangat baik
M + 1 SD N < M + 2 SD = baik
M 1 SD N < M + 1 SD = sedang
M 2 SD N < M 1 SD = kurang
M 3 SD N < M 2 SD = sangat kurang
Contoh penggunaannya :
Perhatikan data tentang hasil EBTA di depan
Diketahui : M = 36,34
SD = 10,40
Setelah dicari M dan SD barulah dimasukan ke dalam konversi sebagai
berikut:
M + 2 SD N M + 3 SD
M + 1 SD N < M + 2 SD
M 1 SD N < M + 1 SD

39

M 2 SD N < M 1 SD
M 3 SD N < M 2 SD
36,34 + (2 x 10,40) N 36,34 + (3 x 10,40)
36,34 + (1 x 10,40) N < 36,34 + (2 x 10,40)
36,34 - (1 x 10,40) N < 36,34 + (1 x 10,40)
36,34 - (3 x 10,40) N < 36,34 - (2 x 10,40)
57,14 N 67,54 = sangat baik
46,74 N < 57,14 = baik
25,94 N < 46,74 = sedang
15,54 N < 25,94 = kurang
5,14
N < 15,54 = sangat kurang
Jadi siswa yang memperoleh skor 50 tergolong baik
2. Konversi Berjenjang (Klasifikasi) Tiga
M + 1 SD N M + 3 SD = baik
M 1 SD N < M + 1 SD = sedang
M 3 SD N < M 1 SD = kurang
3. Konversi Berjenjang Dua
M N M + 3 SD
= baik
M 3 SD N < M
= kurang
Contoh penggunaan nomor 2 dan 3 sama dengan nomor 1 di atas

Keterangan : X (M)
= angka rata-rata
(SD)

= standar deviasi

Acuan Norma Persentil


Penilaian dengan menggunakan norma persentil PAN dirasakan lebih
banyak manfaatnya, sebab nilai tersebut dapat diequvalensikan dengan skor
standar lainnya seperti Z-skor, T-skor, berdasarkan pencaran skor skor standar
normal.
Adapun rumus untuk Persentil sebagai berikut :
P=

cfb+1 /2 fp
x 100
N

Keterangan :
P

= Persentil

Cfb

= Cumulatif frekwensi below, yaitu jumlah frekwensi yang mendapat skor


di bawah skor yang akan dicari persentilnya.

40

Fp

= frekwensi daerah persentil, yaitu jumlah frekwensi yang mendapat skor


sama dengan skor yang akandicari persentilnya.

= Jumlah subyek

Contoh :
Diketahui nilai raport anak-anak kelas 1 SMA sebagai berikut :
10
1
6
9
9
9
8
8
8
7
7
7
6
6
6
5
5
5
4
4
4
4
4
4
3
3
3
5
5
5
Berapakah persentil skor 8?

6
9
8
7
6
5
4
4
3
5

10
7
7
7
6
5
4
2
2
5

Jawab : Tabel kerja untuk mencari f dan cf


X
10

C
2

Cf
50

48

44

40

33

10

26

16

1
Total

1
50

1
-

Memasukkan data ke dalam rumus :

41

cfb+1 /2 fp
x 100
N

1
40+ (4)
2
x 100
50 N

40+2
x 100
50

42
x 100
50

= 84
Jadi persentil skor 8 adalah 84. P = 84, maka Z-skornya kurang lebih =

+1,0 sedangkan T-skornya kurang lebh = 60. (Perhatikan pencaran skor standar
dalam kurva normal).
ANALISIS DESKRIPTIF DENGAN SPSS

BAB V
PEMBAKUAN ALAT UKUR
(Tes Prestasi Belajar)

Diketahui bahwa skor yang diperoleh siswa dari hasil pengukuran,


mempunyai makna yang sangat penting baik dari segiguru yang mengajar, anak
atau siswa yang bersangkutan serta lembaga pengelola pendidikan. Agar skor
yang diperoleh siswa itu bermakna secara tepat, maka salah satu faktor yang perlu
diperhaitkan adalah faktor alat ukur (tes yang digunakan).
Tes yang tersusun hendaknya baku, agar dapat berfungsi yaitu
membedakan antara anak yang pandai dengan anak yang tidak pandai, anak yang

42

siap dalam pelajaran tertentu dengan anak yang tidak siap. Mengingat bahwa
pelaksanaan pembakuan tes adalah suatu pekerjaan yang tidak mudah, sehingga
tidak semua guru dapat melaksanakan pembakuan ini.
Sehubungan dengan hal itu, penulis mencoba menganjurkan hal-hal
sebagai berikut :
1. Tes yang tersusun hendaknya sesuai dengan tujuan pengajaran
2. Tes evaluasi belajar disusun berdasarkan tabel kisi-kisi, sebab melalui
tabel tersebut telah tersusun rencana atau materi yang akan diukur.
3. Teknik pembakuan tes dapat dipilih satu dari yang dianjurkan, serta dipilih
berdasarkan atas tujuan pengajaran, kemampuan, biaya dan waktu.
Ada beberapa cara yang dapat ditempuh dalam pembakuan tes ini adalah :
1.
2.
3.
4.
5.

Mencari Derajat Kesukaran suatu tes (DK)


Mencari Daya Beda suatu tes (DB)
Mencari Efektifitas Option
Mencari Reliabiiltas Tes
Validitas tes

1. Mencari Derajat Kesukaran Suatu Tes (DK)


Item tes tidak boleh terlalu sukar dan tidak boleh terlalu mudah. Sebuah
item yang terlalu mudah memungkinkan semua anak dapat menjawab dengan
benar. Item seperti itu bukanlah suatu item yang baik. Jadi item yang baik adalah
item yang mempunyai derajat kesukaran tertentu, dan biasanya ditentukan
berdasarkan prosentase. Derajat kesukaran yang baik adalah derajat kesukaran
yang bergerak antara :
25% sampai dengan 75%

Item yang memperoleh DK 75% adalah item yang terlalu sukar

43

Item yang memperoleh DK 25% adalah item yang terlalu mudah


Angka tersebut diatas dapat dicari dengan menggunakan rumus sebagai berikut:

DK =

( W L+W H )
N

x 100%

Keterangan :
DK

= Derajat kesukaran

WL

= Jumlah kelompok bawah yang menjawab salah

WH

= Jumlah kelompok atas yang menjawab salah

= Jumlah kelompok atas dan kelompok bawah (N = nh + n1)


Dengan demikian dapat disimpulkan bahwa derajat kesukaran berarti :

sejauhmana suatu tes mengukur kemampuan anak yang masih dirasakan


manfaatnya dalam bidang pendidikan.
Langkah-langkah Mencari DK
1. Buatlah tabel data, yang memuat semua skor dari hasil testing dan disusun
berurutan dari skor tertinggi sampai skor terendah. Tabel dapat memuat
kolom: No urut, nama siswa/testee, nomor pokok dan kolom keterangan.
2. Menentukan kelompok atas dan kelompok bawah, dengan jalan menghitung
27% dari jumlah peserta tes atau 27% dari N. Sedangkan yang 46% ditengahtengah dibuang, dalam arti tidak dipersoalkan dalam analisis karena tidak
pintar dan tidak bodoh.
3. Memasukkan data kedalam tabel kerja. Tabel kerja memuat kolom :
No Item, WL, WH, WL + WH dan WL - WH

44

Contoh tabel kerja :


No item
1

WL

WH

WL + WH

WL + WH

2
3
4
5
Dst

4. Memasukkan data kedalam rumus


5. Menarik kesimpulan (kesimpulan analisis). Kesimpulan Analisis diperoleh
dengan angka batas derajat kesukaran item yang tidak ditentukan.
Dari hasil membandingkan akan diperoleh sebagai berikut :
a. 25% N 75%
b. N < 25%
c. N > 75%

= item baik
= item ditolak (mudah)
= item ditolak (sukar)

Contoh penggunaannya :
Suatu tes hasil belajar terdiri dari 15 item dalam bentuk tes obyektif masingmasing berbobot 1, diberikan kepada 21 orang siswa SPG negeri di Singaraja.
Hasilnya ditabulasikan dalam tabel 01. Carilah derajat kesukaran (DK) masingmasing itemnya!
Jawab
Tabel : 01. Tabel Data Hasil Testing
N
o

Nama

NRP

Item Tes
1 2 3 4 5 6 7 8 9 1

Skor

45

1
2
3
4
5
6
7
8
9
1
0
1
1
1
2
1
3
1
4
1
5
1
6
1
7
1
8
1
9
2
0
2
1
N

Agung
Mahmud
Bakri
Rusmini
Yusuf
Idrus
Bagus Mas
Indrawati
Aminah

215
221
230
225
212
218
227
219
223

1
1
1
1
1
1
1
0
1

1
1
1
1
1
1
1
1
0

0
1
1
1
1
1
1
0
1
0

Amir

213

1 1 1 1 1 1 1 0 0

Anwar

214

0 0 1 1 1 0 0 1 0

Sunadi

231

1 0 0 0 1 1 0 0 1

Abdulah

211

1 1 1 1 1 1 0 0 0

Gandri

216

1 0 0 0 0 1 1 0 0

Suryadi
Yasa
Wibawa

224

1 1 0 0 0 1 0 0 0

228

1 1 1 1 1 0 0 0 0

Jayarsa

220

1 1 1 1 0 0 0 0 0

Saminah

226

1 1 1 0 0 0 0 0 0

Niraini

229

0 0 1 1 0 0 0 1 0

Hermin

217

1 1 0 0 0 1 0 0 0

Ahmad
W

222
WH
WL

1 0 0 0 0 1 0 0 0
0 0 0 0 0 2 0 0 0
1 2 2 3 5 4 6 5 6

0
0
6

0
1
6

0
2
6

0
3
5

0
6
3

0
5
6

1
1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
0
1

1
1
1
1
1
1
1
0
1

1
1
1
1
1
1
1
0
1

1
1
1
0
0
1
1
1
1

1
1
1
1
1
1
1
0
1

1
1
1
1
1
1
1
0
1

1
1
1
1
1
1
0
0
0
0

2
1
1
1
1
0
0
0
1
0

3
1
1
1
0
0
0
0
1
0

4
0
0
0
0
0
0
0
1
0

5
1
0
0
0
0
0
0
1
0

14
13
13
11
10
10
9
8
8

2. Mencari Kelompok Atas dan Kelompok Bawah


Kelompok Atas dan Kelompok Bawah dapat dicari dengan rumus :
27
100

x 1N

N = 21, maka :

27
100

x 21 =

617
100

x 6,17 = 6

46

Jadi : a. Jumlah kelompok atas = 6 orang


b. Jumlah kelompok bawah = 6 orang sesuai dengan hasil skor yang
diurut mulai dari yang tertinggi sampai terendah.
A. Nama-nama yang tergolong kelompok atas adalah :
1. Agung

Nrp : 215

2. Mahmud

Nrp : 221

3. Bakir

Nrp : 230

4. Rusmini

Nrp : 225

5. Yusuf

Nrp : 212

6. Idrus

Nrp : 218

B. Nama-nama yang tergolong kelompok bawah adalah :


1. Yasa Wibawa

Nrp : 228

2. Jayarsa

Nrp : 220

3. Saminah

Nrp : 226

4. Niraini

Nrp : 229

5. Hermin

Nrp : 217

6. Ahmad

Nrp : 222

3. Membuat Tabel Kerja


Tabel kerja ini memuat hal-hal sebagai berikut :
- Kolom nomor item
- WL = jumlah kelompok bawah
- WH = jumlah kelompok atas, dst
Tabel : 02. Tabel Kerja
No Item
1
2
3

WL
1
2
2

WH
0
0
0

WL + WH
1
2
2

WL - WH
1
2
2

47

4
5
6
7
8
9
10
11
12
13
14
15
-

3
5
4
6
5
6
6
6
6
5
3
6
-

0
0
2
0
0
0
0
1
2
3
6
5
-

3
5
6
6
5
6
6
7
8
8
9
11
-

4. Memasukkan Data ke Dalam Rumus

DK =

W L +W H
N

x 100%

Keterangan :
N = Jumlah kelompok atas dan kelompok bawah (N = n1 + nh)
Item nomor 1

: Dk = 1/12 x 100 = 8,33%

Item nomor 2

: Dk = 2/12 x 100 = 16,67%

Item nomor 3

: Dk = 2/12 x 100 = 16,67%

Item nomor 4

: Dk = 3/12 x 100 = 25,00%

Item nomor 5

: Dk = 5/12 x 100 = 41,67%

Item nomor 6

: Dk = 6/12 x 100 = 50,00%

Item nomor 7

: Dk = 6/12 x 100 = 50,00%

Item nomor 8

: Dk = 5/12 x 100 = 41,67%

Item nomor 9

: Dk = 6/12 x 100 = 50,00%

3
5
2
6
5
6
6
5
4
2
3
1
-

48

Item nomor 10

: Dk = 6/12 x 100 = 50,00%

Item nomor 11

: Dk = 7/12 x 100 = 58,33%

Item nomor 12

: Dk = 8/12 x 100 = 66,67%

Item nomor 13

: Dk = 8/12 x 100 = 66,67%

Item nomor 14

: Dk = 9/12 x 100 = 75,00%

Item nomor 15

: Dk = 11/12 x 100 = 91,67%

5. Menarik Kesimpulan Analisis


Bandingkan nilai (N) yang diperoleh dengan nilai penolakan item.
Kemudian tunjukanlah item-item mana yang diterima dan yang ditolak.

2. Mencari Daya Beda Suatu Tes (DB)


Suatu tes hendaknya mampu membedakan anak yang satu dengan yang
lainnya. Jika tidak, maka tes itu bukanlah tes yang baik. Misalnya dari 21 orang
peserta tes semuanya memperoleh skor 10 atau semuanya memperoleh skor 0.
Untuk mengatasi hal seperti itu perlu diketahui daya beda suatu tes, artinya
sejauhmana suatu tes mampu membedakan kemampuan anak / individu yang
masih dirasakan manfaatnya dalam bidang pendidikan. Ada beberapa sumber
menyebutkan bahwa daya beda (DB) yang baik adalah 0,40 ke atas dan 0,20 ke
atas. Dalam tulisan ini penulis cenderung menggunakan kedua-duanya, dengan
catatan bahwa penggunannya hendaknya memperhitungkan :

49

1. Tujuan pengajaran atau tujuan penggunaan tes, apakah untuk seleksi


siswa teladan, penerima beasiswa, untuk mengukur kemampuan
belajar akhir semester, ulangan harian atau hanya sekedar motivasi
belajar.
2. Bobot mata kuliah / bidang studi yang ditentukan oleh besarnya angka
kredit.
Berdasarkan pertimbangan di atas kita dapat memilih salah satu
diantaranya, misalnya tujuan pengukuran adalah memperoleh nilai raport akhir
semester (ulangan umum) untuk bidang studi mayor dengan kredit 4 maka daya
beda tes yang dipilih adalah 0,40 ke atas.
Langkah-langkah yang ditempuh mencari DB :
Adapun langkah-langkah yang ditempuh pada dasarnya sama, hanya
berbeda dalam rumus yang digunakan yaitu :

DB =

( W LW H )
N

DB = Daya Beda
WL = Jumlah kelompok bawah yang menjawab salah
WH = Jumlah kelompok atas yang menjawab salah
N = Jumlah individu kelompok bawah dan atas (N = n1 + nh)
Skor yang diperoleh berdasarkan rumus di atas dibandingkan dengan skor
penolakan yang ditentukan tadi yaitu :
a. N 0,40
N < 0,40
b. N 0,40
N < 0,20

= baik (diterima)
= kurang (ditolak)
= kurang (ditolak)
= kurang (ditolak)

50

Contoh penggunaanya : (perhatikan tabel 01 dan tabel 02)


Daya beda (DB) dari masing-masing item dapat dicari dengan rumus
sebagai berikut :

DB =

W L W H
N

Item nomor 1
: DB = 1/12 = 0,08
Item nomor 2
: DB = 2/12 = 0,17
Item nomor 3
: DB = 2/12 = 0,17
Item nomor 4
: DB = 3/12 = 0,25
Item nomor 5
: DB = 5/12 = 0,42
Item nomor 6
: DB = 2/12 = 0,17
Item nomor 7
: DB = 6/12 = 0,50
Item nomor 8
: DB = 5/12 = 0,42
Item nomor 9
: DB = 6/12 = 0,50
Item nomor 10
: DB = 6/12 = 0,50
Item nomor 11
: DB = 5/12 = 0,42
Item nomor 12
: DB = 4/12 = 0,33
Item nomor 13
: DB = 2/12 = 0,17
Item nomor 14
: DB = 3/12 = 0,25
Item nomor 15
: DB = 1/12 = 0,08
Jika penolakan DB : 0,20, berapa item yang diterima? Sedangkan angka
penolakan DB : 0,40, Berapa item yang diterima?

3. Mencari Efektivitas Option


Berdasarkan analisa di atas, maka dapat diketahui item-item mana yang
memenuhi syarat dan item mana yang tidak memenuhi syarat. Item yang tidak
memenuhi syarat berarti perlu diadakan perbaikan atau revisi. Salah satu hal yang
perlu diketahui dalam mengadakan suatu revisi adalah efektivitas daripada
masing-masing option.
Langkah-langkah yang ditempuh menguji efektivitas option :

51

1. Menyusun tabel data


2. Menentukan kelompok atas dan bawah
3. Memasukkan data ke dalam tabel kerja

Tabel kerja dibuat sejumlah item yang akan diuji efektivitasnya.


Kelompok

Option
C

Atas
Bawah
4. Menarik kesimpulan (kesimpulan analisis)
Kesimpulan analisis didasarkan perbandingan data yang diperoleh dalam
penelitian dengan kreteria sebagai berikut;
a. Option Kunci
1. Jumlah pemilih kelompok atas dan bawah tidak kurang dari 25% tetapi
tidak lebih dari 75% atau
25% P 75%
= efektif
P < 25%
= tidak efektif
P > 75%
= tidak efektif
2. Frekwensi pilihan-pilihan kelompok atas harus lebih banyak dari
kelompok bawah atau PKA > PKB
b. Option pengecoh (Distractor)
Jumlah pemilih kelompok atas dan bawah minimal 25% kali satu
perdua kali jumlah option pengecoh, kali jumlah kelompok atas ditambah
kelompok bawah.

PKA + PKB { 0,25 x

Keterangan :
0,25

= 255

1
2x

x (n1 + n2) }

52

= jumlah option pengecoh

n1

= jumlah individu kelompok atas

n2

= jumlah individu kelompok bawah

PKA

= jumlah pilihan kelompok atas

PKB

= jumlah pilihan kelompok bawah

Contoh soal :
Misalnya murid yang dites sebanyak 50 orang, dengan bentuk tes piilhan
ganda 5 option. Untuk item nomor 1, option kuncinya adalah b, sedangkan
pengecohnya adalah a, c, d, dan e.
Setelah ditabulasi ke dalam tabel data, kemudian ditentukan 27% (0,27) kelompok
atas dan bawah yaitu masing-masing sebanyak 14 orang (dibulatkan) maka
diperoleh data sebagai berikut :
Penyebaran pilihan kelompok atas
Option a = 3 orang
Option b = 8 orang
Option c = 3 orang
Option d = 0 orang
Option e = 0 orang
Penyebaran pilihan kelompok bawah
Option a = 5 orang
Option b = 3 orang
Option c = 4 orang
Option d = 2 orang

53

Option e = 0 orang
Kemudian data dimasukkan ke dalam tabel kerja sebagai berikut :
Kelompok
Atas
Bawah

A
3
5

Option
C
3
4

B
8
3

D
0
2

E
0
0

Berdasarkan tabel di atas dapat diuji efektivitasnya sebagai berikut :


a. Option kunci (b)
Prosentase pilihan =
=

8+ 3
n1+ n2
11
28

x 100 %

x 100 %

= 39%
Kemudian diuji dalam rentangan :

25% P 75%
25% < 39% < 75%
39% < 25% atau
39% < 75%

Jadi option kunci efektif


Disamping itu jumlah pilihan kelompok atas lebih besar dari kelompok bawah
(PKA > PKB atau 8 > 3).
b. Option Pengecoh
1. Option a
PKA + PKB {0,25 x
3 + 5 {0,25 x
8

{0,25 x

1
2X

x (n1 + n2)}

1
2X 4
1
8

x (14 + 14)}

x 28}

8 > 0,875
Jadi option a efektif
2. Option c
Berdasarkan rumus di atas maka diperoleh ;
7 > 0,85
Jadi option c efektif
3. Option d
Data yang diperoleh adalah 2 > 0,875 sehingga option d adalah efektif.
4. Option e

54

Dimana diketahui bahwa 0 < 0,875 sehingga option e tidak efektif.

4. Validitas Tes
Suatu tes dapat dikatakan valid jika tes tersebut betul-betul mengukur apa
yang hendak diukur. Apabila tes tersebut tidak mengukur apa yang hendak diukur
maka tes tersebut tidak dapat dipercaya. Menurut Sambas dkk.,(2007:30)
menyatakan bahwa suatu instrument pengukuran dikatakan valod jika instrument
dapat mengukur sesuatu dengan tepat apa yang hendak diukur. Ada dua jenis
validitas yaitu validitas logis (logical validity) dan validitas emperik (empirical
validity). Arikunto (1993:219) menjelaskan bahwa, validitas logis adalah validitas
yang dinyatakan berdasarkan hasil penalaran. Instrument dinyatakan valid apabila
telah dirancang dengan baik dengan mengikuti teori dan ketentuan lain seperti
model atau pola tertentu yang diikutinya.
Validitas emperik (empirical validity) adalah validitas yang didasarkan
atas hasil uji-coba (try out) terhadap responden. Jumlah responden yang
digunakan dalam uji-coba instrument minimal 30 orang, semakin besar jumlah
responden untuk uji-coba instrument semakin memberi peluang item-item tersebut
untuk valid. Sugiyono, 2006 (dalam Paramartha 2010:146) menyatakan bahwa
bila dalam penelitian akan melakukan analisis multivariat, maka jumlah anggota
sampel minimal 10 kali dari jumlah variabel yang diteliti. Sedangkan Nunnally
(dalam Fernandes,1984:14) dijelaskan, the sample of 300 to 400 students should
be drawn a broad range of schools as is possible. There should be at least five
times as many persons as items otherwise the results will be misleading. Jumlah
sampel yang besar antara 300 sampai 400 orang atau sedikitnya lima kali jumlah

55

butir dari suatu alat ukur akan memberi peluang yang lebih besar item atau butir
tersebut valid dan reliabel, dan sebaliknya sampel yang kecil kemungkinan
peluang untuk valid dan reliabel lebih kecil.
Validitas tes dapat ditinjau dari beberapa segi yaitu :
a. Content Validity (validitas isi)
Suatu tes dikatakan memiliki validitas isi apabila isi tes (soalan)
mencakup seluruh isi mata pelajaran yang akan diujikan. Salah satu cara yang
dapat ditempuh dengan cara ini adalah menyusun tabel kisi-kisi soal
(Perhatikan tabel kisi-kisi soal di depan).
b. Creterion related validity
Creterion related validity suatu validitas ditinjau dari segi hubungan
dengan alat pengukur lain yang dipandang sebagai kreteria atau pedoman
untuk menentukan validitas suatu tes.
Dilihat dari kreteria yang diguankan maka creterion related ini dapat
dibedakan menjadi dua yaitu :
1. Concurent validity (validitas bandingan)
Yaitu suatu validitas yang dapat dilihat dari hasil korelasi antara
dua buah tes yaitu tes yang dicari validitasnya dengan tes yang telah
dimiliki kriteria validitas yang diberikan kepada testee dalam waktu yang
bersaman (perbedaan waktu pelaksanaan tes tidak boleh terlalu jauh atau
lama) misalnya : tes yang dibuat oleh guru kelas, sedangkan kreteria
pembandingnya adalah tes PMP yang telah diakui memiliki validitas.
Kemudian kedua tes tersebut dalam waktu bersamaan atau berselang satu
hari

diberikan

kepada

sekelompok

individu,

kemudian

hasilnya

dikorelasikan. Koefisien korelasi menunjukkan valid tidaknya tes.


2. Predictive Validity (validitas ramalan)
Suatu tes dapat dikatakan memiliki validitas ramalan apabila
prestasi yang dicapai oleh tes tersebut dapat meramalkan keberhasilan

56

untuk yang akan datang, misalnya alat ukurnya adalah tes seleksi masuk
SMA, sebagai tes yang dicari validitasnya, dikorelasikan dengan indeks
prestasi belajarnya di SMA sebagai kriterianya. Koefisien korelasinya,
menunjukkan sejauhmana tes tersebut memiliki validitas ramalan.
Jenis korelasi seperti (c.1 dan c.2) didasarkan atas perhitunganperhitungan yang bersifat empiris, sehingga sering disebut validitas
empiris.
Skema Validitas
a. content validity
Valdity

b. contruct validity

1. Concurrent validity

c. cretarion validity

2. Predictive validity

Menghitung validitas Instrumen Tes dengan Menggunakan Excel


1. Menyebarkan tes kepada responden, tentukan jumlah responden minimal
30 orang (semakin banyak semakin baik). Pada saat penyebaran tes
diusahakan responden tidak bekerjasama dengan lainnya agar hasil yang
diperoleh menggambarkan kemampuan peserta didik (objektif).
2. Memeriksa hasil tes.
3. Memasukkan data ke dalam table kerja (lihat table terlampir).
Tabel Kerja Untuk Analisis Validitas Butir
Rpd
n
1
2
3
4
5
6
7
8

1
1
1
1
1
1
1
1
1

2
1
1
1
1
1
1
1
1

3
1
1
1
1
1
0
1
1

Nomor Butir
4
5
6
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
0
1
0
1
0
0
0
1

Jumla
h
7
1
0
0
1
1
1
1
1

8
1
1
1
1
1
1
1
1

9
1
1
1
1
1
1
0
0

10
0
1
1
0
0
0
1
0

9
9
9
9
8
7
7
6

57
9
10
11
12
13
14
15
16
17
18
19
20
pi
qi
Mi
Mt
SD
rpbi
r-t
St
btr

1
0
1
1
1
1
0
0
0
1
1
0
0.7
50
0.2
50
7.0
67
6.5
00
1.9
33
0.5
08
0.4
44
Vali
d

1
1
1
1
0
1
0
0
0
1
0
0
0.7
00
0.3
00
7.2
86
6.5
00
1.9
33
0.6
21
0.4
44
Vali
d

1
1
1
0
0
1
0
1
0
0
0
0
0.6
00
0.4
00
7.4
17
6.5
00
1.9
33
0.5
81
0.4
44
Vali
d

1
0
1
1
1
0
1
0
1
0
1
1
0.7
00
0.3
00
6.9
29
6.5
00
1.9
33
0.3
39
0.4
44
dro
p

1
1
1
0
1
0
0
0
1
1
1
0
0.6
00
0.4
00
7.2
50
6.5
00
1.9
33
0.4
75
0.4
44
Vali
d

0
1
1
1
1
0
0
1
1
0
0
1
0.7
00
0.3
00
7.0
00
6.5
00
1.9
33
0.3
95
0.4
44
dro
p

1
0
1
1
0
1
1
0
1
0
1
1
0.7
00
0.3
00
6.5
00
6.5
00
1.9
33
0.0
00
0.4
44
dro
p

1
0
0
1
1
0
1
1
1
1
0
1
0.8
00
0.2
00
6.6
25
6.5
00
1.9
33
0.1
29
0.4
44
dro
p

1
1
1
0
0
0
0
1
1
1
1
0
0.6
50
0.3
50
7.3
08
6.5
00
1.9
33
0.5
69
0.4
44
Vali
d

0
1
1
0
0
0
0
1
0
0
0
0
0.3
00
0.7
00
7.5
00
6.5
00
1.9
33
0.3
39
0.4
44
dro
p

Langkah-langkah analisis butir menggunakan fasilitas excel, ada 9 (sembilan)


langkah yang harus diikuti yaitu:
1. Mencari jumlah skor masing-masing responden:
tempatkan kursor pada cel terakhir (L3) kemudian ketik =SUM(B3:K3)
tekan enter
tekan ctrl kemudian drag kursor dari responden ke 1 sampai terakhir
2.

3.

kemudian lepas secara bersamaan.


Mencari proporsi butir ke-i (pi) yaitu butir yang dijawab benar:
tempatkan kursor pada cel B23 kemudian ketik =SUM(B3:B22)/20
tekan enter
Blok cel B23 sampai K23, kemudian tekan
Ctrl-R. Catatan angka 20 adalah jumlah responden (N)
Mencari proporsi qi yaitu butir yang dijawab salah:
Tempatkan kursor pada cel B24 kemudian ketik =1-B23

8
6
9
6
5
4
3
5
6
5
5
4

58

Tekan enter
Blok cel B24 sampai cel K24
Tekan Ctrl-R
4. Mencari rerata butir ke-i (Mi)
Tempatkan
kursor
pada

cel

B25

kemudian

ketik

=SUMIF(B3:B22,">0",$L$3:$L$22)/SUMIF(B3:B22,">0")
Tekan enter
Blok cel B25 sampai K25
Tekan Ctrl-R
5. Mencari rerata total (Mt)
Tempatkan kursor pada cel B26
kemudian

ketik

=AVERAGE($L$3:$L$22)
Tekan enter
Blok cel B26 sampai K26
Tekan Ctrl-R
6. Mencari Standar Deviasi (SD)
Tempatkan kursor pada

ketik

cel

B27

kemudian

=STDEV($L$3:$L$22)
Tekan enter
Blok cel B27 sampai K27
Tekan Ctrl-R
7. Menghitung koefisien korelasi point biserial (r-pbi)
Tempatkan kursor pada cel B28 kemudian ketik
=((B25-B26)/B27)*(SQRT(B23/B24))
Tekan enter
Blok cel B28 sampai K28
Tekan Ctrl-R
8. Menentukan koefisien r-kritis
Cari r-kritis pada table r-product moment dengan N = 20. Ada dua
jenis nilai t-tabel yaitu untuk signifikansi 5% (0,05) dan 1% (0,01).
Pilih salah satu, yang 5% lebih rendah dari 1%. Berikut dipilih 5%
maka diperoleh r-t sebesar 0,444 kemudian ketik pada cel B29
Blok cel B29 sampai K29
Tekan Ctrl-R
9. Menentuka status butir
Tempatkan
kursor
pada
cel
B30
kemudian
ketik

=IF(B28>B29,"Valid","drop")
Lalu tekan enter

59

Blok cel B30 sampai K30


Terakhir tekan Ctrl-R
Pertanyaan:
1. Sebutkan butir/item tes yang valid dan drop!
2. Mengapa item/butir tes tersebut valid atau drop?
3. Apa tindakan kita terhadap butir/item yang drop?

Tugas
1. Buatlah 25 tes prestasi belajar objektif dengan 5 option dan bobot
masing-masing 1 (satu).
2. Analisislah validitas item-itemnya!

4. Reliabilitas Tes
Reliabilitas suatu tes adalah keajegan atau konsistensi dari instrument,
artinya jika instrument/tes tersebut diteskan terhadap suatu objek yang sama pada
waktu yang berbeda maka hasilnya akan tetap sama (ini disebut konsiten).
Sambas, dkk (2007:37) menjelaskan bahwa, uji reliabilitas instrument dilakukan
dengan tujuan untuk mengetahui konsistensi dari instrument sebagai alau ukur,
sehingga hasil suatu pengukuran dapat dipercaya. Dwi Endra Suanthara (2009:60)
menyatakan bahwa, suatu tes dikatakan reliabel apabila

mantap, kemantapan

mana dapat diihat dari beberapa segi yaitu:


1. Sebagai kemantapan hasil mengukur ulangan dengan tes yang sama, yang
menghasilkan indeks stabilitas.
2. Sebagai kemantapan hasil mengukur dengan dua tes yang paralel, yang
dianggap sama yang menghasilkan indeks ekuialensi atau kesamaan.

60

3. Kemantapan hasil mengukur dari amsing-masing soal dihubungkan


dengan kemantapan tes secara keseluruhan yang menghasilkan indeks
konsistensi internal.
Reliabel sering disebut dapat dipercaya atau ajeg atau sama dengan
konsistensi (consitency). Cara yang digunakan untuk menyelidiki reliabilitas suatu
teks adalah sama yang digunakan dalam waktu yang berbeda, atau antara alat
pengukur yang setara, atau antar bagian-bagian alat ukur yang sama yang
digunaakn dalam waktu yang sama.
Pada umumnya cara-cara penyelidikan reliabilitas itu dapat dibedakan
menjadi tiga macam yaitu : 1) metode tes ulang, 2) metode bentuk sejajar, 3)
metode belah dua.
1. Metode Tes Ulang (Test resest method)
Dalam metode ini tes yang sama diberikan kepada suatu kelompok yang
sama dalam dua kesempatan yang berlainan. Misalnya : minggu pertama tes
diberikan kepada kelompok / kelas A, kemudian beberapa minggu berikutnya
diberikan tes pertama dikorelasikan dengan hasil tes kedua. Koefisien korelasi
antara skor-skor tersebut diuji dengan nilai-nilai r-standar. Kemungkinan hasil
pengujian adalah sebagai berikut :
rh r1 (ts = 0,01) sangat reliabel
rh rt (ts = 0,05) reliabel
rh < rt (ts = 0,05) tidak reliabel
2. Metode Bentuk Sejajar (pararelform method, equivalent method)
Dalam metode ini digunakan dua tes yang sejenis atau equivalen, baik dari
segi isi, bentuk (form) maupun aspek-aspek lainnya. Kedua tes ini diberikan
kepada kelompok subyek tanpa adanya tenggang waktu (waktu bersamaan). Skor
yang diperoleh dari kedua tes tersebut dikorelasikan.
3. Metode Belah Dua (Split half)

61

Metode ini sebenarnya metode satu kali tes. Sebab metode belah dua berasal
dari satu tes yang dibelah dua. Sehingga tes yang diteliti reliabilitasnya dianggap
dua tes.
Cara yang digunakan dalam membelah dua adalah:
a. Cara

nomor ganjil dan genap, artinya item yang bernomor ganjil

dikelompokkan

menjadi

satu

bagian

dan

yang

bernomor

genap

dikelompokkan menjadi bagian kedua.


b. Cara randomisasi, artinya dapat menggunakan cara-cara random seperti : lotre
atau undian bilangan random.
Setelah tes terbelah dua dengan menggunakan salah satu cara di atas
kemudian dikorelasikan. Koefisien korelasinya akan menunjukkan reliabilitas
setengah tes. Untuk mencari reliabilitas seluruh tes dapat digunakan rumus
Spearman Brown sebagai berikut :

N . r 1.2
rn 1+(N1) r 1.2

Keterangan :
rn

= koefisien korelasi seluruh tes

= perbandingan antara panjang tes seluruhnya dengan panjang tes yang


dikorelasikan.

R1.2

= koefisien korelasi antara sebagian tes dengan bagian tes lainnya.

Contoh :

62

Suatu tes terdiri 60 item.

Secara random diambil 30 item sebagai

kelompok atau belahan pertama dan 30 item berikutnya sebagai belahan kedua.
Skor-skor yang diperoleh antara kedua tes tersebut adalah 0,996.
Berapakah koefisien korelasi seluruh tes?
Adalah sebagai berikut :
Rn =

N . r 1.2
1+(N1)r 1.2

60
30 x 0,996
60
1+
1 x 0,996
30

1,992
1,996

= 0,998
Nilai rn = 0,998 kita uji, sedangkan N yang diperhitungkan adalah N dari masingmasing belahan yaitu 30
rh rt (ts =0,01)

sangat reliabel

0,998 > 0,463 (ts = 0,01) sangat reliabel


Metode belah dua ini mempunyai kelemahan-kelemahan karena mungkin
faktor penyebabnya adalah :
1. Derajat kesuakran (DK) dari masing-masing item tidak seimbang
2. Isi soal mungkin tidak seimbang antara belahan pertama dengan belahan
kedua
3. Kemungkinan item-item yang belekangan tidak dikerjakan dengan waktu yang
sama seperti item-item pada awal tes.

63

Untuk mengatasi kekurangan tersebut penulis cenderung menggunakan


metode analisis dengan teknik korelasi Kuder-Richardson 20 (KR-20). Sebab KR
20 pada pokoknya menunjukkan homoginitas soal-soal yang terdapat dalam tes
yang bersangkutan.
Adapun rumus KR 20 adalah :

r KR 20 =

SD 1 p . q
n
x
2
n1
SD 1

Keterangan :
n

= banyaknya item dalam tes

SDt

= standar deviasi skor keseluruhan dari peserta tes

= propoinsi individu peserta tes yang menjawab benar atau untuk setiap
soal, dicari dengan jumlah penjawab benar dibagi jumlah peserta tes atau
jumlah penjawab benar
jumlah peserta tes( N )

= propinsi penjawab tidak benar atau bisa diperoleh dengan jalan : q = (1


p)
Misalkan suatu evaluasi belajar yang terdiri dari 60 soal, diberikan kepada

siswa SPG Negeri Singaraja kelas III sebanyak 85 orang, setelah diperiksa dengan
teliti, kemudian dicari pq dan SDt diperoleh :
Pq

= 12,34

SDt

= 8,50

Maka koefisien korelasi r KR 20 dapat dicari :

64
2

R KR 20 =

SD 1 p . q
n
x
2
n1
SD 1
2

(8,50) 12,34
60
x
601
( 8,50)2

60 72,2512,34
x
59
72,25

60 59,91
x
59 72,25

= 1,017 x 0,829
= 0,843
Kesulitan yang nampak dalam menggunakan rumus di atas aalah dalam
pq, sebab setiapitem kita harus mencari p dan q. terlebih-lebih bila item tes dan
peserta tes terlalu banyak. Sehubungan denan hal itu digunakan rumus lain yang
merupakan taksiran terhadap rumus KR 20 :

n. SD t X t ( n X t )
r. est . KR 20 =

SD2t (n1)

Keterangan :
r . est. KR 20

= estimasi terhadap r . KR 20

= banyaknya item dalam tes

Xt

= angka rata-rata skor keseluruhan tes

(Baca pengukuran dan penilaian pendidikan oleh T. Raka Joni, hal 95, th. 1977)

65

Misalkan soal dalam contoh di atas tadi, setelah dicari SDt dan Xt diperoleh data
sebagai berikut : Xt = 26,70
SDt = 8,50
Dengan menggunakan rumus di atas dapat dianalisa :
n. SD2t X t ( n X t )
r. est . KR 20

SD 2t (n1)

60.( 8,50)2 26,70(6060,70)


(8,50)2( 601)

60 ( 72,25 ) 26,70(33,33)
( 72,25 ) (59)

4335889,11
4262,75

= 0,808 (diuji dengan nilai r tabel)

Menghitung Reliabilitas Menggunakan Excel


Dalam analisis reliabilitas menggunakan excel kita harus menyiapkan data yang
diperoleh dari hasil uji coba tes (sama dengan uji validitas di atas). Perhatikan
table kerja berikut:
Resp

Nomor Butir

Jumlah

10

10

10

10

66
4

10

11

12

13

14

15

16

17

18

19

20

21

22

10

0.90

0.727

0.68

0.36

0.90

0.90

0.90

0.90

0.863

0.272

0.09

0.272

0.31

0.63

0.09

0.09

0.09

0.09

0.136

0.727

0.08

0.198

0.21

0.23

0.08

0.08

0.08

0.08

0.117

0.198

1.37

1.293

1.09

0.87

0.64

0.56

0.48

0.39

0.316

0.198

vartot
p
q
pq
p*q
KR-20

2.73
593

909

091

264

603

0.55
228

27
73
35
39

182

818
694

504

364
636
14
81

91
09
26
67

909
091

264
405

91
09
26
14

909
091

264
876

64

36
77
12

73
27
35
35

67

Langkah-langkah menghitung reliabilitas perangkat tes:


1. Mencari jumlah skor masing-masing responden:
Tempatkan kursor pada cel terakhir (L3) kemudian ketik =SUM(B3:K3)
Tekan enter
Tekan ctrl kemudian drag kursor dari responden ke 1 sampai terakhir
kemudian lepas secara bersamaan.
2. Tuliskan k pada cel A25 kemudian ketik jumlah item/butir pada cel B25
3. Menghitung varian total
Pada cel B26 ketik =VAR(L3:L24)
Tekan enter
4. Menghitung p dengan cara:
Pada cel B27 tulis =SUM(B3:B24)/22. Angka 22 adalah jumlah

5.

6.

7.

8.

sampel/responden.
Blok cel B27 sampai K27
Tekan Ctrl-R
Menghitung q:
Pada cel B28 tuliskan = 1-B27
Tekan enter
Blok cel B28 sampai K28
Tekan Ctrl-R
Menghitung pq dengan cara:
Pada cel B29 tuliskan =B27*B28
Tekan enter
Blok B29 sampai K29
Tekan Ctrl-R
Menghitung sigma pq
Pada cel B30 tuliskan =SUM(B29:K29)
Tekan enter
Blok cel B30 sampai K 30
Tekan Ctrl-R
Menghitung koefisien KR-20:
Tuliskan pada cel B31 =(B25/(B25-1))*((B26-B30)/(B26))
Tekan enter

Koefisien KR-20 menunjukkan reliabitas perangkat tes yaitu 0.55228. untuk


menentukan derajat reliabilitas digunakan kriteria sebagai berikut.
Koefisien Reliabilitas
0,80 1,00
0,60 0,80
0,40 0,60

Klasifikasi
Sangat Tinggi
Tinggi
Sedang

68

0,20 0,40
Rendah
0
0,20
Sangat rendah
Dimodifikasi dari (Koyan, 2011:136)
Jadi reliabilitas perangkat tes di atas tergolong sedang (0,55).

Tugas
Buat perangkat tes prestasi belajar dengan jenis tes objektif sebanyak 25 item
dengan option adalah 5 (a,b,c,d,e) dan bobot masing-masing item adalah 1.

ANALISIS VALIDITAS DAN RELIABILITAS TES MENGGUNAKAN


SPSS
Disamping menggunakan program excel dapat juga digunakan bantuan program
Statistical Product and Service Solution (SPSS). Program ini terus mengalami
perubahan nama seperti SPSS for Windows 10.0, berubah menjadi SPSS for
Windows 11,0, SPSS for Windows 12,0 dan setrusnya sekarang sudah SPSS for
Windows 17,0. Perubahan nama tersebut tidak mempengaruhi tatacara
pengoprasiannya.
Langkah-langkah kerja sbb:
1. Siapkan program SPSS pada layar computer anda dengan tampilan sbb.

69

2. Kelik variable view kemudian tuliskan nama butir atau item semua
tes/instrument, kemudian lanjutkan kelik menu data variable. Pada data
variable isikan data yang diambil dari table kerja validitas atau reliabilitas
instrument. Maka akan tampak tampilan sbb.

3. Klik menu Analyze, Scale, Reliability Analysis, maka tampak seperti


tampilan berikut.

70

Masukkan semua item yang ada pada kotak sebelah kiri ke dalam kotak
yang ada disebelah kana,
4. Pilih Alpha pada kotak bagian bawah
5. Pilih menu statistic, beri tanda chek () pada kotak dialog: Item, Scale,
Scale if item deleted, kemudian Continue, lalu OK. Kemudian muncul
Output:

Output SPSS

71

6. Uji Validitas
Untuk menafsirkan hasil uji validitas, kriteria yang digunakan adalah:
a. Jika koefisien r-hitung (rh) > dari nilai r-tabel (rt) maka item tersebut
dinyatakan valid.
b. Jika koefisien r-hitung (rh) < dari nilai r-tabel (rt) maka item tersebut
dinyatakan drop (tidak valid), item seperti ini tidak dapat digunakan
atau harus diganti. Dalam pengujian dapat digunakan taraf signifikansi
1% (0,01) atau 5% (0,05). Koefisien r-tabel dapat dilihat pada table
tentang Nilai-nilai r Product Moment, dengan N adalah 20.
7. Menafsikan hasil analisis SPSS
a. Validitas
Rekap hasil analisis validitas dengan bantuan program SPSS dapat ditulis
pada table di bawah ini.
Tabel Rekap Hasil Analisis Validitas Tes Prestasi Belajar
No. Item
1
2
3
4
5
6
7
8

r-hitung
(rh)
0,955**)
0.948**)
0,942**)
0,938**)
0,934**)
0,931**)
0,931**)
0,929**)

r-tabel (rt)
(1%)
0,651
0,651
0,651
0,651
0,651
0,651
0,651
0,651

r-tabel
(rt)(5%)
0,444
0,444
0,444
0,444
0,444
0,444
0,444
0,444

Keterangan
Valid
Valid
Valid
Valid
Valid
Valid
Valid
Valid

72

9
0,651
0,929**)
10
0,651
0,934**)
Catatan: **) Valid untuk 1% dan 5%.

0,444
0,444

Valid
Valid

b. Reliabilitas
Menafsikan reliabilitas hasil analisis SPSS, kriteria yang digunakan
adlah:
a) Jika koefisien Alpha > dari koefisien r-tabel maka tes/instrument
tersebut dinyatakan reliable.
b) Jika koefisien Alpha < dari koefisien r-tabel maka tes/instrument
tersebut dinyatakan tidak reliable.
Semakin tinggi koefisien reliabilitas semakin baik tes/instrument tersebut.
Berdasarkan analisis di atas dengan taraf signifikansi 5% diketahui r-alpha
sebesar 0,944 > 0,444 (rt) maka tes/instrument tersebut reliable.

73

BEBERAPA ISTILAH PENTING DALAM PENGUKURAN DAN


PENILAIAN PENDIDIKAN

1. Ability : kemampuan mengerjakan sesuatu dengan stimulasi yang diberikan,


kemampuan ini bisa bersifat potensial atau aktual, bersifat keturunan maupun
diperoleh karena sesuatu proses belajar, yang penting kemampuan tersebut
telah ada pada saat pengukuran dilaksanakan.
2. Achievment Test : tes yang mengukur prestasi seseorang dalam sesuatu bidang
sebagai hasil proses belajar yang spesifik yang disengaja, biasanya dalam
bentuk pengetahuan dan atau keterampilan.
3. Arithmetic Mean : rata-rata hitung, yaitu rata-rata yang diperoleh dengan
menjumlahkan semua scores dalam sesuatu kelompok dan kemudian membagi
jumlah tersebut dengan banyaknya scores dalam kelompok itu.
4. Battery : sejumlah tes yang disatukan dan distandardisir kepada sesuatu
kelompok, kadang-kadang juga dipergunakan untuk menunjuk kepada
sejumlah tes yang diberikan bersama-sama meskipun tes-tes tersebut
distandardisir pada kelompok yang berlain-lainan.
5. Ceiling : Batas ata (plafond) daripada kemampuan yang terukur oleh sesuatu
tes.
6. Coefficient of Correlation : ukuran atau indeks yang menunjukan seberapa
jauh dua variabel atau lebih berubah, baik searah maupun berlawanan,
bersama-sama, perubahan pada variabel yang satu disertai oleh perubahan
pada variabel yang lain.

74

7. Correction for guessing : pengukuran score (nilai hukuman) untuk setiap


kesalahan yang diperbuat testee, yang dihukum sebenarnya bukan penerkaan
akan tetapi jawaban yang salah, terlepas daripada sebab-sebab mengapa
kesalahan tersebut diperbuat.
8. Creterion : suatu standar, ukuran, patokan atau pertimbangan yang
dipergunakan sebagai pembanding, baik secara kwantitatif maupun kwalitatif,
scores, hasil rating dan sebagainya yang diramalkan dalam penyelidikan
tentang tes.
9. Difficulty level : Tingkatan kesukaran sesuatu soal atau item, umumnya
dinyatakan dalam % - tase testee yang menjawab item tersebut dengan benar
bisa disimpulkan P, bisa juga dinyatkan dalam bentuk terstandardisir berupa
delta ( )
10. Discrimination power : kemampuan sesuatu item membedakan testee yang
berprestasi tinggi dari yang berprestasi rendah, biasa dinyatakan dalam bentuk
%-tase perbedaan jumlah anggota kelompok atas dengan anggota kelompok
bawah yang benar menjawab item tersebut, biasa disimpulkan D. Cara linnya
adalah dalam bentuk r-biserial yang menunjukkan kecenderungan testee yang
mempunyai prestasi tinggi menjawab sesuatu item tertentu dengan benar.
11. Distribution (frequency distribution) : Tabulasi pencaran score dari yang tinggi
sampai dengan yang rendah atau sebaliknya darimana bisa dilihat jumlah
testee yang mencapai masing-masing score.
12. Equivalent form : bentuk yang ekuivalent yaitu keparalelan dua atau lebih tes
dengan isi serta tingkatan kesukaran sama sehingga kalau diberikan kepada
satu kelompok, maka akan menghasilkan pencaran scores yang serupa.
13. Halo effect : pemihakan (bias) dalam penilaian yang disebabkan oleh karena
ikut dieprtimbangkan hal-hal lain yang tidak termasuk dalam acara penilaian
yang sebenarnya.

75

14. Item Analysis : proses penilaian soal-soal (items) secara individual atau satu
persatu, yaitu dalam arti menemukan bagaiamna sesuatu soal berfungsi ketika
dicobakan pada kelompok testee. Proses ini biasanya menghasilkan indeks
tentang tingkatan kesukaran serta kemampuan diskriminasi masing-masing
soal tersebut. Kriteria untuk menentukan keberhasilan atau ketidakberhasilan
testee umumnya diambil berdasarkan total scores masing-masing testee.
15. Kuder-Richarson Formula (s) : Rumus untuk menghitung reliabilitas suatu tes
berdasarkan informasi tentang masing-masing item mean SD dan banyaknya
item dalam suatu soal, tidak cocok untuk tes yang speeded
16. Multiple-choice item : sekumpulan jenis-jenis soal dimana testee harus
memilih satu atau lebih dai kesemua alternatif jawaban yang disediakan untuk
masing-masing soal.
17. Normal distribution : suatu distribusi teoritis yang didasarkan kepada teori
kebetulan, dinamakan juga kurva normal yang apabila dilukiskan, mean,
median serta modenya berhimpit. Banyak pecahan sifat-sifat biologis
(misalnya tinggi badan) dan psikologis (misalnya intelligensi) yang
mempunyai sifat-sifat seperti pencaran yang dilukiskan oleh kurva ini.
18. Power Test : suatu tes untuk mengukur tingkatan kemampuan, bukan
kecepatan me-respons, oleh karena itu batas waktunya longgar sekali.
19. Random sample : pengambilan sampel dimana masing-masing anggota sampel
memperoleh kesempatan yang sama besar dan tetap untuk terpilih sebagai
anggota sample tersebut.
20. Range : Perbedaan antara score yang tertinggi dengan yang terendah dalam
suatu kelompok.
21. Reliability : kemantapan hasil mengukur suatu tes, besar kecilnya kesalhaan
mengukur dinyatakan dengan koefisien korelasi.
22. Representative sample : sampel yang menyerupai populasi dalam ciri-ciri
yang akan diselidiki.

76

23. Practice effect : pengaruh pengalaman dengan suatu tes yang bersifat
menguntungkan testee dalam mengerjakan tes itu untuk kedua kalinya 9atau
tes lain yang bersamaan dengan tes yang pertama.
24. Sampel : sejumlah kecil individu-individu yang diambil dari keseluruhan
individu serupa yang ada dan mungkin serta pernah ada, dalam penyelidikan
sampel untuk mewakili kelompok yang lebih besar yang dinamakan populasi.
25. Spearman Brown formula : Rumus yang menyatakan hubungan antara
reliability sesuatu tes dengan banyaknya item dalam tes tersebut, biasanya
dipergunakan untuk menaksir reliability yang diperoleh dengan teknik
splithalf.
26. Speed test : suatu tes dimana yang dipentingkan adalah kecepatan bekerja
biasanya diukur dalam bentuk banyaknya satuan tugas yang biasa diselesaikan
dalam suatu satuan waktu tertentu.
27. Split-half coeficient : koefisien reliabilitas yang diperoleh dengan membagi
tes menjadi dua sub tes yang diperkirakan pararel atau equivalent, biasanya
dengan mengumpulkan soal-soal bernomor genap disatu pihak dan soal-soal
bernomor ganjil di pihak lain.
28. Standard deviation (SD) : Indeks yang menyatakan banyak sedikitnya score
menyimpang dari mean, semakin score cenderung berdekatan dengan mean,
semakin kecil pula SD.
29. Validity : ukuran sejauh mana suatu tes mengukur apa yang hendak diukur
30. Variability : kecenderungan scores untuk menyimpang dari mean, biasa
dinyatkan dalam standar deviation, range, atau quartile deviation.
31. Variable : sesuatu yang berubah, yaitu barang, faktor atau dimensi yang
diukur.

77

SOAL-SOAL

I. Kerjakan dengan teliti dan Benar!


1. Sekelompok siswa SMA diberikan tes subyektif, masing-masing : benar
salah 25 dengan bobot 1, pilihan ganda 40 dengan bobot 1, menjodohkan 15
dengan bobot 1 dan melengkapi dengan bobot 2. Tes tersebut dikerjakan
dengan baik, setelah diperiksa salah seorang siswa yaitu Arma memperoleh
hasil sebagai berikut : benar-salah dikerjakan dengan betul sebanyak 20 yang
lainnya tidak dikerjakan, pilihan ganda salah 2, menjodohkan betul 10 dan
melengkapi salah pada nomor-nomor ganjil.
Hitunglah : skor standar yang diperoleh Arma, jika digunakan PAP skala 11
dan 5
2. Diketahui data sebagai berikut :

78

a. Hasil seleksi masuk STKIP AH Singaraja


12

19

36

14

34

21

14

23

16

25

18

17

17

32

17

17

28

21

26

20

24

20

30

23

18

14

18

31

22

20

b. Nilai akademik semester genap siswa STKIP AH Singaraja


25

23

26

31

13

24

20

16

32

19

32

20

18

36

27

26

17

22

38

19

19

18

23

21

23

18 27
30
19
14
c. Skor mentah midel tes Pendidikan Agama Hindu
46

39

32

58

43

37

24

40

45

17

50

49

35

36

15

42

30

28

20

41

34

11

31

21

35

44

38

38

27

24

79

3. Hitunglah skor standar dengan PAN skala 11 dan 5, dan 2.a, kemudian
tentukan berapa orang yang lulus
4. Hitunglah persentil masing-masing skor (data 2.b)
5. Rubahlah data kwantitas (2.c) ke dalam data kwalitas berjenjang, klasifikasi :
tiga dan lima
6. Ujilah validitas tes yang digunakan untuk mengumpulkan data (2.a dengan
2.b). Golongkan jenis mana validitasnya.

DAFTAR PUSTAKA

Arikunto,. 1993. Dasar-dasar Evaluasi Pendidikan. Yogyakarta: Bumi Aksara.


Jakarta.
Buning, James L, 1977. Compulational Hand Book of Statistics. Second Edition.
Ohio University: United States of America.
Departemen Pendidikan dan Kebudayaan Direktorat Jenderal Pendidikan Dasar
dan Menengah. 1984. Kaedah Bahasa Indoneia Dalam Penulisan Soal Tes
Prestasi Belajar.
Dantes, I Nyoman. 1981. Beberapa Contoh Tentang Pembuktian Normalitas
Data. Singaraja : FIP UNUD.
Fernandes, H.J.X. 1984. Testing and Measurement. Jakarta : National Education
Planning Evaluation and Curriculum Develepoment.
Guilford, J.P. 1973. Fundamental Statistics in Psychology and Education. Sydney:
McGraw-Hill, LTD.
Nana Sudjana, 2001. Penilaian Hasil Belajar Mengajar. Bandung: PT. Remaja
Rosdakarya.
Nurkancana, Wayan, PPN Sunartana. 2000. Evaluasi Pendidikan. Surabaya:
Usaha Nasional.

80

Nurkancana, Wayan. 1983. Penyusunan dan Analisis Tes. Makalah Disampaikan


dalam Penetepan Dosen Kopertis Wilayan VIII Denpasar.
Netra, Ida Bagus. 1979. Statistik Inferensial. Singaraja: Biro Penerbitan FIP
UNUD.
Purwanto Ngalim. 1985. Prinsip-prinsip dan Teknik Evaluasi Pengajaran.
Bandung: Remaja Karya CV.
Puskom IKIPN Singaraja, 2005. Pedoman Praktikum Aplikasi Komputer,
Kalibrasi Instrumen, Pengolahan Data.
Raka Joni T. 1979. Pengukuran dan Penilaian Pendidikan. Malang: Bank
Evaluasi IKIP Malang.
Stenly IC. 1964. Measurement in Todays School. Englewood Cliffs Inc.
Sumady Suryabrata. 1984. Pengukuran dan Evaluasi Pendidikan. Yogyakarta:
UGM.
Suprapto. 1982. Pedoman Penyusunan Tes Prestasi Belajar. Jakarta: P2LPTK-PS.
I.
Siahaan, dkk. 1992. Taksonomi Tujuan Pendidikan Aspek Kognitif. Jakarta:
P2LPTK-PS.I.
Suanthara, DE.NGH. 1988. Teori Pengukuran dan Penilaian Pendidikan. Diktat.
Singaraja: STKIP AH.

81

KATA PENGANTAR

Berkat rahmat Tuhan Yang Maha Esa, Ida Sang Hyang Widhi Wasa yang
dilimpahkanNya kepada kami sehingga kami dapat menyusun materi pengajaran
perkuliahan ini dalam waktu yang relatif singkat.
Ada beberapa hal yang mendasar yang dapat mendorong kami untuk
mencoba menyusun materi perkuliahan ini antara lain :
1. Perguruan Tinggi Swasta (STKIP AH) Singaraja, sangat miskin akan
bahan bacaan yang dapat menunjang kesuksesan studi mahasiswa.
2. Terbatasnya literatur yang dapat digunakan atau dibaca oleh mahasiswa,
khususnya dalam mata kuliah Teori Pengukuran dan Penilaian Pendidikan.
Sampai saat ini literatur yang dapat dijadikan pedoman oleh mahasiswa
pada perpustakaan STKIP AH Singaraja hanya Evaluasi Ilmu
Pendidikan oleh Drs. Wayan Nurkancana dan Drs. PPN Sunarthana
dalam jumlah yang sangat sedikit.
3. Sebagai konsekwensi di atas maka mau tidak mau mahasiswa banyak
belajar dari catatan hasil kuliah. Sudah dapat dibayangkan jika catatan
kuliah mereka tidak teratur atau semrawut, maka mereka akan mengalami
kesulitan.

82

Bertitik tolak dari ketiga hal diatas kami membukukan materi perkuliahan
ini agar dapat dijadikan pedoman untuk mencapai tujuan minimal dalam
perkuliahan ini.

Kami menyadai bahwa keterbatasan selalu ada pada diri kami, sehingga
segala kritik yang membangun sangat kami hargai.
Terimakasih

Penyusun

83

DAFTAR ISI
Halaman
KATA PENGANTAR.......................................................................................
DAFTAR ISI.....................................................................................................
BAB I.

FUNGSI PERGURUAN DAN PENILAIAN DALAM


PENDIDIKAN
1. Pengertian Pengukuran dan Penilaian........................................
2. Latar Belakang Pengukuran dan Penilaian dalam Pendidikan...
3. Tujuan Pengukuran dan Penilaian Pendidikan...........................

BAB II

BEBERAPA HAL YANG PERLU DIPERHATIAKN DALAM


MENYUSUN ITEM TES
1. Pengertian Tes............................................................................
2. Jenis Tes......................................................................................
3. Langkah-langkah Penyusunan Tes.............................................
a. Blue-Print / Tabel Kisi-kisi...................................................
b. Menulis Soal (Tes Obyektif)................................................
1. Penggunaan Bahasa Indonesia yang Tepat.....................
2. Syarat-syarat Menyusun Item Tes..................................

BAB III MEMBUAT SKOR (SCORING)


1. Tes Essay....................................................................................
2. Tes Obyektif...............................................................................
BAB IV MENGUBAH SKOR MENTAH MENJADI SKOR STANDAR
1. Penilaian Acuan Patokan (PAP).................................................
2. Penilaian Acuan Norma (PAN)..................................................
BAB V

PEMBAKUAN ALAT UKUR

84

1.
2.
3.
4.
5.

Mencari Derajat Kesukaran (DK)..............................................


Mencari Daya Beda Suatu Tes (DB)..........................................
Mencari Efektivitas Option........................................................
Mencari Reliabilitas Tes.............................................................
Validitas Tes................................................................................

BEBERAPA ISTILAH PENTING....................................................................


SOAL-SOAL....................................................................................................

Anda mungkin juga menyukai