Anda di halaman 1dari 8

ANALISIS UJI COBA INSTRUMEN TES

Disusun untuk Memenuhi Tugas Ujian Akhir Semester Matakuliah Evaluasi Pembelajaran
Dosen Pengampu: Mutiara Arlisyah Putri Umami, M.Pd.

Oleh:
Achmad Firmansyah 200108110057

JURUSAN TADRIS MATEMATIKA


FAKULTAS ILMU TARBIYAH DAN KEGURUAN
UNIVERSITAS ISLAM MAULANA MALIK IBRAHIM MALANG
2022
A. STUDI KASUS
Pak Ibrahim adalah seorang guru matematika kelas 12, pada saat pembelajaran materi
limit fungsi trigonometri, pak ibrahim akan melaksanakan uji kompetensi untuk
mengetahui daya serap materi kepada salah satu kelas yang ada di sekolah tersebut. Pak
ibrahim ingin juga menganalisis butir soal yang sudah diujikan kepada siswa di kelas
tersebut. Ada sekitar 25 siswa yang mengerjakan soal uji kompetensi yang sudah
diberikan oleh pak ibrahim. Berikut adalah jawaban dari hasil pekerjaan siswa tersebut.

Tabel rekap jawaban siswa


1 2 3 4 5 6 7 8 9 10
Kunci E C C B B B A D E A
Id01 E D D D D C C A E C
Id02 B C E B B A A C C A
Id03 B E D A D B D B A A
Id04 B D C A E A B E A A
Id05 A B B B A E D A B A
Id06 C B C E E C D B C D
Id07 D C D C B C B D B C
Id08 E A A A B D A E D C
Id09 D C B A B B A C D C
Id10 A C E B E C B E C E
Id11 D A B B B C D C C A
Id12 B B D B C B B D B C
Id13 A A C C D B C D C E
Id14 D B A E B D D B B D
Id15 A E D B C C C C A D
Id16 E D D E E E A A B A
Id17 D D E B B E A B A E
Id18 D A B A C D D D A A
Id19 D D D C C C D B C E
Id20 B B E D B E E C A E
Id21 E A C C B D B A D A
Id22 A C D C B E C B E D
Id23 E B D E B A C C A B
Id24 E D E B E B D E C B
Id25 E C B B D B C B D D
B. Kriteria Pendekatan Teori Klasik
• Kriteria Koefisien Reliabilitas
Koefisien Reliabilitas Makna
𝑟 ≤ 0,20 Sangat Rendah
0,20 < 𝑟 ≤ 0,40 Rendah
0,40 < 𝑟 ≤ 0,60 Sedang
0,60 < 𝑟 ≤ 0,80 Tinggi
0,80 < 𝑟 ≤ 1,00 Sangat Tinggi

• Kriteria Tingkat Kesukaran


Kriteria 𝑃 Keterangan
𝑃 > 0,70 Mudah
0,30 ≤ 𝑃 ≤ 0,70 Sedang
𝑃 < 0,30 Sukar

• Kriteria Daya Beda


Kriteria 𝑃 Keterangan
0,40 − 1,00 Sangat Memuaskan
0,30 − 0,39 Memuaskan
0,20 − 0,29 Belum Memuaskan
𝑁𝑒𝑔𝑎𝑡𝑖𝑓 − 0,19 Jelek
C. Interpretasi Hasil Output Dari Iteman 4.3
• Hasil Output dari reliabilitas, tingkat kesukaran, daya beda, efektivitas pengecoh
tiap soal
Table 1: Specifications

Specification Value Specification Value


Number of examinees 25 Total Items 10
Scored Items 10 Pretest Items 0
Multiple Choice Items 10 Polytomous Items 0
Number of domains 1 External scores No
Minimum P 0,00 Maximum P 1,00
Minimum item mean 0,00 Maximum item mean 15,00
Minimum item correlation 0,00 Maximum item correlation 1,00
ITEMAN 3.0 Header No Exclude omits from option No
statistics
Number of ID columns 4 ID begins in column 1
Responses begin in column 5 Omit character O
Not Admin character N Produce quantile tables Yes
Correct for spuriousness Yes Produce quantile plots Yes
Save data matrix No Include omit codes in matrix N/A
Include Not Admin codes in N/A Include scaled scores for Total
matrix Score
Scaling function N/A Scaled score setting 1 N/A
Scaled score setting 2 N/A Dichotomous Classification No
Classify based on N/A Cutpoint N/A
Low group label Low High group label High
Data is delimited by N/A Test for DIF No
Group status is in column N/A Ability levels for DIF N/A
Group 1 code N/A Group 2 code N/A
Group 1 label N/A Group 2 label N/A

Summary statistics
Table 2 presents the summary statistics of the test, for the scored items. Definitions
of these statistics are found in the Iteman manual.
Table 2: Summary statistics

Score Items Mean SD Min Max Mean P Mean


Score Score Rpbis

Scored Items 10 2,120 1,013 0 4 0,212 -0,160


Scaled Total 10 0,000 0,000 0,000 0,000 - -

• Berdasarkan tabel 2 di atas menjelaskan item yang dianalisis ada 10 butir soal
dan rata-rata 2,120 dan standar baku 1,013 serta Skor minimal 0 dan skor
maksimal 4.
• Tingkat kesukaran (Mean P) Pada tabel di atas didapat Mean P sebesar 0,212
berdasarkan tabel tingkat kesukaran, nilai tersebut soal yang dianalisis memiliki
tingkat kesukaran yang sukar.
• Daya beda (Rpbis) Pada tabel di atas didapat Mean Rpbis sebesar -0,160,
berdasarkan tabel Tingkat Daya Beda nilai tersebut soal yang dianalisis memiliki
daya beda yang jelek.

Table 3 presents a reliability analysis of the tests. Alpha (also known as KR-20) is
the most commonly used index of reliability, and is therefore used to calculate the
standard error of measurement (SEM) on the raw score scale. Also presented are
three configurations of split-half reliability, first as uncorrected correlations, and
then as Spearman-Brown (S-B) corrected correlations. This is because an
uncorrected split-half correlation is referenced to a "test" that only contains half as
many items as the full test, and therefore underestimates reliability.

Table 3: Reliability
Score Alpha SEM Split- Split-Half Split-Half S-B S-B First- S-B Odd-
Half (First- (Odd- Random Last Even
(Rando Last) Even)
m)
Scored items -0,627 1,293 -0,200 -0,360 -0,401 -0,500 -1,127 -1,337

• Reliabilitas
Reliabilitas (Alpha) Pada tabel di atas didapat Alpha sebesar -0627 , berdasarkan
tabel Koefisien Reliablitas nilai tersebut soal yang dianalisis memiliki reliabilitas
sangat rendah dengan standard error of meusurement 1,293
Table 4 presents the item statistics and flags for the item(s) that were flagged
during the analysis

Table 4: Summary Statistics for the Flagged Items


Item ID P / Item R Flag(s)
Mean
01 0,280 -0,177 K, LR
02 0,200 -0,261 K, LR
03 0,320 0,062 K
04 0,280 -0,337 K, LR
05 0,280 -0,177 K, LR
06 0,040 -0,221 K, LR
07 0,160 -0,205 K, LR
08 0,240 -0,129 K, LR
09 0,160 0,148 K
10 0,160 -0,305 K, LR
D. Ringkasan Hasil Analisis masing-masing Butir Soal
Untuk ringkasan analisis tiap butir soal diambil 1 item sampel dari 10 item yang di
analisis, yaitu item nomor 01. Berikut hasil interpretasinya;

Diagram Hasil Analisis Soal No. 1.

Item information
Seq. ID Key Scored Num Domain Flags
Options
1 01 E Yes 5 1 K, LR

Item statistics
N P Total Total Alpha
Rpbis Rbis w/o
25 0,280 -0,177 -0,236 -0,499

Option statistics
Option N Prop. Rpbis Rbis Mean SD Color
A 7 0,280 -0,083 -0,110 1,714 0,951 Maroon
B 3 0,120 0,712 1,000 3,667 0,577 Green
C 4 0,160 -0,157 -0,236 1,500 0,577 Blue
D 4 0,160 -0,157 -0,236 1,500 1,000 Olive
E 7 0,280 -0,177 -0,236 2,571 1,205 Gray **KEY*
*
Omit 0
Not Admin 0
Quantile plot data

Option N 0-20% 20-40% 40-60% 60-80% 80-100% Color


A 7 1,000 0,167 0,000 0,444 0,111 Maroon
B 3 0,000 0,000 0,000 0,000 0,333 Green
C 4 0,000 0,333 0,000 0,222 0,000 Blue
D 4 0,000 0,500 0,000 0,000 0,111 Olive
E 7 0,000 0,000 0,000 0,333 0,444 Gray **KEY*
*

Berdasarkan tabel hasil analisis tes dan tabel kriteria dapat disimpulkan hasil interpretasi
dari analisis item soal nomor 1 sebagai berikut;
• Tingkat kesukaran (P) item no. 1. Pada tabel item statistic didapat P sebesar 0,280,
berdasarkan tabel tingkat kesukaran nilai tersebut soal yang dianalisis memiliki
tingkat kesukaran yang sukar
• Daya beda (Rpbis) Pada tabel item statistic didapat Rpbis sebesar -0,177, berdasarkan
tabel tingkat daya beda, nilai tersebut soal yang dianalisis memiliki daya beda
tergolong jelek.
• Prop (Pengecoh) Pada item ini setiap opsi jawaban dijawab tidak ada yang kurang dari
5% dari seluruh jumlah peserta tes, maka pengecoh tergolong efektif.

E. Rekap Hasil Analisis Masing-Masing Butir Soal


Item TK Ket DP Ket Opsi Reliabel
Item 1 0,280 Sukar -0,177 Jelek 0,280 0,120 0,160 0,160 0,280 -0,499
Item 2 0,200 Sukar -0,261 Jelek 0,120 0,160 0,200 0,280 0,240 -0,386
Item 3 0,320 Sedang 0,062 Jelek 0,160 0,160 0,320 0,120 0,240 -0,958
Item 4 0,280 Sukar -0,337 Jelek 0,200 0,280 0,240 0,080 0,200 -0,261
Item 5 0,280 Sukar -0,177 Jelek 0,320 0,280 0,080 0,200 0,120 -0,499
Item 6 0,040 Sukar -0,221 Jelek 0,240 0,040 0,320 0,160 0,240 -0,513
Item 7 0,160 Sukar -0,205 Jelek 0,160 0,200 0,280 0,240 0,120 -0,467
Item 8 0,240 Sukar -0,129 Jelek 0,160 0,080 0,240 0,240 0,280 -0,573
Item 9 0,160 Sukar 0,148 Jelek 0,360 0,120 0,280 0,080 0,160 -0,971
Item 0,160 Sukar -0,305 Jelek 0,160 0,240 0,360 0,040 0,200 -0,349
10

Anda mungkin juga menyukai