DISUSUN OLEH :
UNIVERSITAS LABUHANBATU
2023/2024
KATA PENGANTAR
Segala puji bagi Allah SWT yang telah memberikan nikmat serta hidayah-Nya
terutama nikmat kesempatan dan kesehatan sehingga penulisan makalah ini dapat selesai
tepat pada waktunya.
Dalam penulisan makalah ini kami sadari bahwa masih banyak terdapat kekurangan
dalam penulisannya, maka dari itu kami mengharapkan kritik dan saran yang konstruktif dari
para pembaca demi kesempurnaan makalah ini.
Penulis
i
DAFTAR ISI
KATA PENGANTAR................................................................................................... i
DAFTAR ISI.................................................................................................................. ii
BAB I PENDAHULUAN
A. Latar Belakang................................................................................................... 1
B. Rumusan Masalah.............................................................................................. 1
C. Tujuan................................................................................................................ 1
BAB II PEMBAHASAN
A. Kesimpulan.................................................................................................. 13
DAFTAR PUSTAKA.................................................................................................... 14
ii
BAB I
PENDAHULUAN
A. Latar Belakang
Usaha yang lebih baik yaitu untuk selalu meningkatkan mutu tes yang disusun oleh
seorang tenaga pendidik, namun hal ini tidak dilaksanakan karena kecenderungan seseorang
untuk beranggapan bahwa hasil karyanya adalah yang terbaik atau setidak – tidaknya sudah
cukup baik.
Tenaga pendidik yang sudah banyak berpengalaman mengajar dan menyusun soal –
soal tes, juga masih sukar menyadari bahwa tesnya masih belum sempurna. Oleh karena itu,
cara yang paling baik adalah secara jujur melihat hasil yang diperoleh oleh siswa, masalah
inilah yang melatarbelakangi penulisan makalah ini yang berjudul Analisis Tes.
B. Rumusan Masalah
1. Apa pengertian Analisis Tes?
2. Bagaimana cara mengetahui Validitas Tes?
3. Bagaimana cara mengetahui Reliabitas Tes?
4. Bagaimana cara mengetahui Analisis Butir Soal (item analysis)?
C. Tujuan Penulisan
1. Untuk mengetahui pengertian analisis tes;
2. Untuk mengetahui cara validitas tes;
3. Untuk mengetahui cara reliabitas tes;
4. Untuk mengetahui analisis butir soal (item analysis).
1
BAB II
PEMBAHASAN
2
5) Apakah soal itu dapat dikerjakan oleh sebagaian bbesar siswa?
b. Cara kedua adalah mengadakan analisis soal (item analysis). Analisis soal adalah suatu
prosedur yang sistematis, yang akan memberikan informasi-informasi yang sangat khusus
terhadap butir tes yang kita susun.
c. Cara ketiga adalah mengadakan checking validitas. Validitas yang paling penting dari tes
buatan guru adalah validitas kurikuler (content validity). Untuk mengadakan checking
validitas kurikuler, kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan
jelas sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut.
3
Pembahasan analisis tes di sini akan terbatas pada tes buatan guru/dosen, dan bukan
psikotes yang dibuat para ahli atau THB yang dibakukan.
4
Khusus atau dengan kompetensi yang hendak diukur atau dengan indikator keberhasilan
siswa. Cara yang lazim ialah mencocokkan tiap butir soal dengan kisi-kisi yang disusun
berdasarkan GBPP (Garis Besar Program Pengajaran). Pengujian validitas isi dilakukan
dengan menjawab pertanyaan berikut.
a) Apakah keseluruhan tes telah sesuai dengan kisi-kisi?
Kisi-kisi adalah suatu bagian atau matrik yang menggambarkan penyebaran soal-soal sesuai
dengan aspek atau pokok bahasan yang hendak diukur, tingkat kesukaran dan jenis soal.
Kisi-kisi itu harus disusun sedemikian rupa sehingga mencakup seluruh bahan pelajaran
yang akan diteskan.
Tingkat kesesuaian seluruh butir soal dengan kisi-kisi (dengan bahan yang akan diteskan)
menunjukkan tingkat validitas isi.
b) Apakah terdapat butir soal yang menyimpang, atau menuntut jawaban di luar bahan
pelajaran bersangkutan?
Misalnya soal dalam mata pelajaran fisika menjurus/menyimpang ke hitungan matematika
atau kemampuan di luar pokok bahasan yang diajarkan.
Penyimpangan yang tidak kentara itu perlu dihilangkan. Semakin banyak soal yang
menyimpang, semakin rendah tingkat validitas isi. Untuk melakukan analisis validitas isi
diperlukan adanya kisi-kisi tes yang disusun sebelum soal-soal ditulis.
5
4. Validitas ramalan (predictive validity)
Validitas ini menunjukkan sejauh mana skor tes bersangkutan dapat digunakan meramal
keberhasilan siswa dimasa mendatang dalam bidang tertentu. Cara menghitungnya sama
seperti validitas kriteria, dalam hal ini skor tes dikorelasikan dengan keberhasilan siswa di
masa dating. Misalnya antara nilai UAN ( Ujian Akhir Nasional ) di SMA, dengan prestasi
belajar di perguruan tinggi dalam mata pelajaran yang sama.
Suatu tes yang baik biasanya memiliki angka validitas 0,50 atau lebih; tentu saja angka itu
makin tinggi makin baik. Suatu tes dengan angka validitas kurang dari 0,50 belum tentu
buruk. Mungkin kriterianya yang buruk atau keliru menentukan kriteria.[5]
6
Contoh:
Tes Pertama Tes Kedua
Siswa
Skor Ranking Skor Ranking
A 15 3 20 3
B 20 1 25 1
C 9 5 15 5
D 18 2 23 2
E 12 4 18 4
Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh semua siswa.
Metode ini disebut self-correlation method (korelasi diri sendiri) karena mengkorelasikan
hasil dari tes yang sama.
Salah satu cara untuk memperbaiki proses belajar-mengajar yang paling efektif ialah
dengan jalan mengevaluasi test hasil belajar yang diperoleh hasil belajar dari proses belajar-
mengajar itu sendiri. Dengan kata lain, hasil test itu kita oleh sedemikian rupa sehingga dari
hasil pengolahan itu dapat diketahui kompenan-kompenan manakakah dari proses belajar-
mengajar itu yang masih lemah.
Pengolahan test hasil belajar dalam rangka memperbaiki proses belajar-mengajar
dapat dilakukan dengan berbagai cara, antara lain:
a. Dengan membuat analisis soal (item analysis)
b. Dengan mennghitung validitas dan kaeandalan tes.
c. Dalam pasal ini khusus akan di bicarakan cara yang pertama,yaitu teknik analisis soal atau
yang biasa disebut item analisis. Cara yang kedua, yaitu menghitung validititas dan keandalan
tes.
Menurut thorndike dan hagen(1977), analisis terhadap soal-soal (items) tes yang telah
di jawab oleh murid-murid mempunyai dua tujuan penting. Pertama, jawaban-jawaban soal
itu merupakan informasi diagnostik untuk meneliti pelajaran dari kelas itu dan kegagalan-
kegagalan belajarnya, serta selanjutnya untuk membimbing ke arah belajar yang lebih baik.
8
Kedua, jawaban-jawaban terhadap soal-soal yang terpisah dan perbaikan
(review) soal-soal yang didasarkan atas jawaban-jawaban itu merupakan basis bagi penyiapan
tes-tes yang lebih baik untuk tahun berikutnya.[9]
Jadi, tujuan khususnya dari items analysis ialah mencari soal tes mana yang baik dan
mana yang tidak baik,dan mengapa items atau soal itu di katakan baik atau tidak
baik. Dengan mengetahui soal-soal yang tidak baik itu selanjutnya kita dapat mencari
kemungkinan sebab-sebab mengapa item itu tidak baik. Dengan membuat analisis
soal, sedikitnya kita dapat mengetahui tiga hal penting yang dapat di peroleh dari tiap
soal,yaitu:
Sampai dimana tingkat atau taraf kesukaran soal itu (difficulty levelof an item).
Apakah soal itu mempunyai daya pembeda (discriminating power) sehingga dapat
membedakan kelompok siswa yang pandai dengan kelompok siswa yang bodoh.
Apakah semua alternatif jawaban (options) menarik jawaban-jawaban ataukah ada yang
demikian tidak menarik tidak menarik sehingga tidak tidak perlu dimasukkan ke dalam soal.
a. Taraf Kesukaran
Asumsi yang digunakan untuk memperoleh kualitas soal yang baik, disamping
memenuhi validitas dan reliabitas, adalah adanya keseimbangan dari tingkat kesulitan soal
tersebut. Keseimbangan yang dimaksudkan adalah adanya soal-soal yang termasuk mudah,
sedang, sukar secara proporsional. Tingkat kesukaran soal dipandang dari kesanggupan atau
kemampuan siswa dalam menjawabnya, bukan dilihat dari sudut guru sebagai pembuat soal.
Persoalan yanng penting dalam melakukan analisis tingkat kesukaran soal adalah penentuan
proporsi dan kriteria soal yang termasuk mudah, sedang, dan sukar.[10]
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal
yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya.
Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak
mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.[11]
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal tersebut indeks
kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0.
Indeks kesukaran ini menunjukan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0
menunjukan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukan bahwa soalnya
terlalu mudah.[12]
9
Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P (p besar), singkatan
dari kata “proporsi”. Dengan demikian maka soal dengan P = 0,70 lebih mudah jika
dibandingkan dengan P = 0,20. Sebaliknya soal dengan P = 0,30 lebih sukar dengan P = 0,80.
Melihat besarnya bilangan indeks maka lebih cocok jika bukan disebut sebagai
indeks kesukaran tetapi indeks kemudahan atau indeks fasilitas, karena semakin mudah soal
itu, semakin besar pula bilangan indeksnya. Akan tetapi telah disepakati bahwa
walaupunseemakin tinggi indeksnya menunjukan soal yang semakin mudah, tetapi tetap
disebut indeks kesukaran.
b. Daya Pembeda
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara
siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh (berkemampuan
rendah).
Angka yang menunjukan besarnya daya pembeda disebut indeks diskriminasi,
disingkat D (d besar). Seperti hanya indeks kesukaran, indeks diskriminasi (daya pembeda)
ini berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda
negatif (-), tetapi pada indeks diskriminasi digunakan jika sesuatu soal “terbalik” menunjukan
kualitas testee. Yaitu anak pandai disebut bodoh dan anak bodoh disebut pandai. Dengan
demikian ada tiga titik pada daya pembeda, yaitu:
-1,00 0,00 1,00
. daya pembeda daya pembeda daya pembeda
negatif rendah tinggi (positif)
Bagi soal yang dapat dijawab benar oleh siswa pandai maupun siswa bodoh, maka
soal itu tidak baik karena tidak mempunyai daya pembeda. Demikian pula jika semua siswa
baik pandai maupun bodoh tidak dapat menjawab dengan benar. Soal tersebut tidak baik juga
karena tidak mempunyai daya pembeda. Soal yang baik adalah soal yang dapat dijawab benar
oleh siswa-siswa pandai saja.
Analisis daya pembeda mengkaji butir-butir soal dengan tujuan untuk mengetahui
kesanggupan soal dalam membedakan siswa yang tergolong mampu (tinggi prestasinya)
dengan siswa yang tergolong kurang atau lemah prestasinya. Artinya, bila soal tersebut
diberikan kepada anak yang mampu, hasilnya menunjukan prestasi yang tinggi; dan bila
diberikan kepada siswa yang lemah, hasilnya rendah. Tes dikatakan tidak memiliki daya
pembeda apabila tes tersebut, jika diujikan kepada anak berprestasi, hasilnya rendah, tetapi
10
bila diberikan kepada anak yang lemah hasilnya lebih tinggi. Atau bila diiberikan kepada
kedua kategori siswa tersebut, hasilnya sama aja. Dengan demikian, tes yang tiidak memiliki
daya pembeda, tidak akan menghasilkan gambaran hasil yang sesuai dengan kemampuan
siswa yang sebenarnya. Sungguh aneh bila anak pandai tidak lulus, tetapi anak bodoh lulus
dengan baik tanpa dilakukan manipulasi oleh si penilai atau di luar faktor kebetulan.[13]
Cara yang biasa dilakukan dalam analisis daya pembeda adalah dengan
menggunakan tabel atau kriteria dari Rose dan Stanley seperti berikut:
SR - ST
Di mana:
SR = Siswa yang menjawab salah dari kelompok rendah
ST = Siswa yang menjawab salah dari kelompok tinggi
Contoh:
Tes pilihan ganda atau option 4 diberikan kepada 30 orang siswa. Jumlah soal 15.
Setelah diperiksa, datanya adalah sebagai berikut:
11
11 3 1 2
12 6 1 2
13 2 1 5
14 6 1 1
15 5 2 3
12
BAB III
PENUTUP
A. Kesimpulan
Analisis tes adalah salah satu kegiatan dalam rangka mengkonstruksi tes untuk
mendapatkan gambaran tentang mutu tes, baik mutu keseluruhan tes maupun mutu tiap butir
soal/tugas.
Kegiatan analisis tes meliputi empat hal yakni :
Analisis validitas tes
Analisis reliabilitas tes
Analisis butir soal
Analisis teknik kegunaan tes
Validitas tes adalah tingkat keabsahan atau ketepatan suatu tes. Tes yang valid (absah
= sah) adalah tes benar-benar mengukur apa yang hendak diukur.
Reliabilitas tes adalah tingkat keajegan (konsistensi) suatu tes, yakni sejauh mana
suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg/konsisten (tidak berubah-ubah).
Dengan membuat analisis soal, sedikitnya kita dapat mengetahui tiga hal penting yang
dapat di peroleh dari tiap soal,yaitu:
Sampai dimana tingkat atau taraf kesukaran soal itu (difficulty levelof an item).
Apakah soal itu mempunyai daya pembeda (discriminating power)
Apakah semua alternatif jawaban (options) menarik jawaban-jawaban ataukah ada yang
demikian tidak menarik tidak menarik sehingga tidak tidak perlu dimasukkan ke dalam
soal.
13
DAFTAR PUSTAKA
Arikunto, Suharsimi. 2012. Dasar-dasar Evaluasi Pendidikan (Edisi 2). Jakarta: Bumi
Aksara
Arikunto, Suharsimi. 2011. Dasar-dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta: Bumi
Aksara
Purwanto, Ngalim. 2012. Teknik Evaluasi Pembelajaran. Bandung: Rosda
Sudjana, Nana. 2009. Penilaian Hasil Proses Belajar Mengajar. Bandung: PT Remaja
Rosdakarya
http://mahmud09.blogspot.com/2012/06/tingkat-kesukaran dan-daya-beda.html
biomatectona.blogspot.com/2011/04/mengenal-analisis-tes.html
14