Anda di halaman 1dari 22

UJIAN AKHIR SEMESTER GENAP

MATA KULIAH TEORI RESPON BUTIR


Dosen Pengampu : Dr. Edi Istiyono, M.Si.

ATYASA ANINDITA
12316244016

PROGRAM STUDI PENDIDIKAN FISIKA


JURUSAN PENDIDIKAN FISIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSTAS NEGERI YOGYAKARTA
2016

Kerjakan soal-soal berikut dengan teliti!


1. Pada kegiatan uji coba instrumen (1 jenis) bangkitkan data yang sesuai dan
selanjutnya selidikilah :
a. Efek panjang tes (banyaknya butir) terhadap karakteristik tes (antara lain :
parameter butir (a, b, dan c), goodness of fit dan fungsi informasi) pada
data : 2) Politomus 2 PL model penskalaan M-GRM
b. Efek banyaknya responden terhadap karakteristik tes (antara lain :
parameter butir (a, b, dan c), goodness of fit dan fungsi informasi) pada
data : 2) Politomus 2 PL model penskalaan M-GRM
2. Bangkitkan data hasil belajar Fisika peserta didik dari dua set tes X dan Y
dengan 20% itemnya berupa anchor item, selanjutnya lakukan analisis untuk
mengestimasi kemampuan peserta didik 3 PL model penskalaan GPCM
dengan software Parscale
3. Susunlah artikel singkat tentang Penerapan GRM dalam Penilaian
Pembelajaran Fisika, meliputi :
a. Pendahuluan (berisi latar belakang dan rumusan masalah)
b. Diskusi
c. Simpulan
d. Daftar Pustaka

Data bangkitan diperoleh dari uji coba instrumen penilaian tes adaptif
berbasis komputer. Instrumen tersebut diujikan kepada 269 responden. Untuk
memperoleh respon subjek, peneliti menyusun instrumen angket untuk
mengumpulkan data. Angket menggunakan skala Likert dengan range 1 sampai 4.
Terdapat 20 indikator penilaian dalam angket tersebut. Data perolehan angket
disimpan dalam file data.dat dan dianalisis menggunakan program Parscale 4.1
Trial Version.
Berikut ini disajikan data respon peserta tes atau responden :
DPK00134123411231244211234

DPK02832423211123212322112

DPK00233123412331411231123

DPK02923234123231232133321

DPK00311123112313412312123

DPK03012234122232123123232

DPK00434122311232213123213

DPK03134142322212323231423

DPK00512313441231231312231

DPK03212141232322342231232

DPK00642132341232412321232

DPK03341232312323112324123

DPK00712312421211123222131

DPK03434121232342324323211

DPK00843123213211232323413

DPK03512112344213123412321

DPK00912314221323244123212

DPK03612211231113234112321

DPK01033123123421231231244

DPK03732142311323212313213

DPK01141232311232132412323

DPK03831242311112321323132

DPK01212124312312443231232

DPK03942321231222342213221

DPK01314312323123414232323

DPK04021324232312312321231

DPK01441223123231232312341

DPK04134213424231232321232

DPK01543123123123412321112

DPK04224313123123243412323

DPK01642132421323441232312

DPK04332324211123231313243

DPK01721232312314212332123

DPK04412121324312323132321

DPK01842323112323241231232

DPK04512324213213123231123

DPK01932312432424241232321

DPK04642321312323242313231

DPK02023131242323231232311

DPK04742312323123123132312

DPK02132423232311323134123

DPK04842321321322112323123

DPK02242323231231324221221

DPK04912344231232321312324

DPK02312121123132311232412

DPK05012323124232324243234

DPK02434123232131423232123

DPK05144444442444234444124

DPK02512324123242333212321

DPK05232312223112421232111

DPK02621314123211232312442

DPK05324313123111323222332

DPK02723232423123123111321

DPK05434231434423123221123

DPK05523132334412323241212

DPK09232424211232312324211

DPK05612423123124231232131

DPK09342432311232423231231

DPK05723232444123231232314

DPK09444232131232221232311

DPK05823123223132142222222

DPK09523124213213242323123

DPK05942131234242333442123

DPK09623224242131243124232

DPK06022133312423232423424

DPK09533123242312132211232

DPK06123322213222213142312

DPK09644421312312324423132

DPK06244133344234442312444

DPK09721432342312312423123

DPK06322232441222232412221

DPK09823124232312423333211

DPK06443333312324232232432

DPK09912312333132412312311

DPK06543144321232423213122

DPK10013232132313221321344

DPK06642313221233342421132

DPK10123124232321333123242

DPK06732224132334442323131

DPK10223242323244231231231

DPK06842311121211131314131

DPK10344413231232423123123

DPK06912121331131442313141

DPK10431242323123144421232

DPK07044231311223212323231

DPK10544231231242312323221

DPK07122313131413212132323

DPK10634232312323123231231

DPK07222331313143123424212

DPK10744231231322231323214

DPK07344213232424442123231

ANG00123312424241242424121

DPK07422312312314232334131

ANG00234231312423122421123

DPK07542321323122312321323

ANG00344231232323123231232

DPK07634421312342424232132

ANG00433441232423412323123

DPK07743212312323442312322

ANG00542132312312432413411

DPK07842312323444431123123

ANG00641232312421312312311

DPK07943432123132132132132

ANG00742131231231234231231

DPK08032123212321432342123

ANG00844421312423123124123

DPK08142312331232323241242

ANG00921431123214213213131

DPK08221223212323134423112

ANG01042132142231423131231

DPK08333312323213413123242

ANG01133444212322231242111

DPK08432142423231242422323

ANG01234442124212224123213

DPK08542132131112324234231

ANG01334421312312221423123

DPK08644321232131423232131

ANG01433312423122423231241

DPK08742332123232132323121

ANG01541231244231231232223

DPK08811231321321312333342

ANG01644123232321344312421

DPK08923242421232414424224

ANG01744231233232323214243

DPK09022312422444221232132

ANG01834123213232424123123

DPK09133214241222213424121

ANG01941243231231233243221

ANG02032142312324323124124

ANG05744213231232131232321

ANG02132142421223242323213

ANG05811231242312421312312

ANG02233442321423214232131

ANG05933214243242132131231

ANG02332142423232322223123

ANG06034213213124242323123

ANG02412121323113242312423

ANG06123124241242312312321

ANG02541231231232423222312

ANG06233312423213123124231

ANG02641231232423123111232

ANG06344213123124231231231

ANG02731232141232423211232

ANG06444123123212221232312

ANG02844232323242312321231

ANG06542131322231242421312

ANG02941232133331241231231

ANG06644423132123123211231

ANG03024123123242333123123

ANG06711213242443412312311

ANG03131242133312312312421

ANG06831231242112342142131

ANG03233214232142231234241

ANG06941223123211123242311

ANG03342131232423123124123

ANG07021323123414341112341

ANG03444213123214213123123

ANG07111212312424412323124

ANG03544423311232323122321

ANG07233124232142221241214

ANG03633321324234214124231

ANG07333124242132132124213

ANG03744341231223242312311

ANG07434123123131231112312

ANG03833124213242432121311

ANG07511212432412312423123

ANG03943223213124231231241

ANG07612112312424242431231

ANG04023242324231231231231

ANG07744213214412323123213

ANG04133124241241234242421

ANG07823123242332131232131

ANG04244232312424232312322

ANG07944213123223123213213

ANG04344231231241231212323

ANG08034123223123243242312

ANG04412121123231242312312

ANG08141231223123242342321

ANG04544232131232324213131

ANG08212112423123123123123

ANG04644232132332132323242

ANG08331232142321312323213

ANG04744231223123213213213

ANG08444231231231231232131

ANG04832312423242423213131

ANG08534231221231232131321

ANG04934123333213123231113

ANG08644412312312444213123

ANG05011123242312324423132

ANG08712123421342142131312

ANG05112312424234314312313

ANG08812324232312312321323

ANG05222324213212324242431

ANG08912321423123214242312

ANG05333312424212321424214

ANG09012323242441213123123

ANG05444213124232142142412

ANG09133214244232134431221

ANG05544421323121232223123

ANG09221232142141232142412

ANG05644131232333123213122

ANG09333123124123123331231

ANG09432132141232312421212

ANG12942131232132131232132

ANG09532144412311123232421

ANG13033242131234214214123

ANG09644412312311112323123

ANG13121324421312312312311

ANG09744213312321232312321

ANG13233312421312312312311

ANG09833312324243231242121

ANG13333213232312323241231

ANG09933412312123212312321

ANG13442323123123132312321

ANG10032333313444213123123

ANG13544213123122231232312

ANG10133124231234242143213

ANG13633214242312312312321

ANG10243124312412423124231

ANG13722241241244423123123

ANG10344423123333232312321

ANG13844231233331242312421

ANG10434441232312323123241

ANG13944412323123244222231

ANG10544212312323232423213

ANG14034232442131231232412

ANG10644421231231232222311

ANG14131232221323111442222

ANG10741231231242312321342

ANG14233312333312323232323

ANG10844213123111232323123

ANG14334444213212312321321

ANG10941233112212311112323

ANG14433131222324122442111

ANG11034123331232423123123

ANG14544312132424241231232

ANG11121221231243242331231

ANG14642333123122333332131

ANG11234441231232324231231

ANG14744424123123344412312

ANG11344231233242312312412

ANG14844231231111111231233

ANG11444231232211113231232

ANG14934421312424242141241

ANG11522312423242312312313

ANG15044421312333324231231

ANG11644423112323232132113

ANG15133142142141242344232

ANG11744421312321321311222

ANG15233314122334442313333

ANG11833231412312423212312

ANG15344423231242412423123

ANG11931234442311112324321

ANG15442131244423232333321

ANG12031412323331242312314

ANG15534413122131414143214

ANG12112321423333124242132

ANG15644412312311123242312

ANG12233412423213123333213

ANG15742312222233124214244

ANG12333124242424232211231

ANG15844234123123123232333

ANG12442321312232142312311

ANG15944213123123123331231

ANG12544231222123213123231

ANG16044231211232444312311

ANG12644312323123222123123

ANG16142131242311112324242

ANG12734412312313123123123

ANG16244423123142424124231

ANG12833123214123124232443

Sintaks atau perintah yang digunakan untuk dapat menjalankan program Parscale
adalah sebagai berikut :
M-GRM 2 PL Analysis

>COMMENTS
>FILE DFNAME='data.DAT', SAVE;
>SAVE PARM='data.PAR', SCORE='data.SCO';
>INPUT NIDW=6, NTOTAL=20, NTEST=1, LENGTH=(20), NFMT=1;
(6A1, 20A1)
>TEST1 TNAME=SCALE1, ITEM=(1(1)20), NBLOCK=1;
>BLOCK1 BNAME=SBLOCK1, NITEMS=20, NCAT=4, CADJUST=0.0;
>CALIB GRADED, LOGISTIC, SCALE=1.7, NQPTS=30, CYCLES=(25, 2, 2, 2,
2),NEWTON=5,
CRIT=0.005, ITEMFIT=10, SPRIOR, TPRIOR, GPRIOR;
>SCORE EAP, NQPTS=30, SMEAN=0.0, SSD=1.0, NAME=EAP, PFQ=5;

Dari proses yang telah dijalankan, didapatkan hasil dari fase 0 sebagai berikut :
PARSCALE V4.1

MAXIMUM LIKELIHOOD ITEM ANALYSIS AND TEST SCORING: POLYTOMOUS MODEL


PROGRAM COPYRIGHT HELD BY SCIENTIFIC SOFTWARE INTERNATIONAL,INC., 19852007
7383 N Lincoln Avenue, Suite 100
Lincolnwood, IL 60712
Phone:(800) 247-6113
(847) 675-0720
Fax: (847) 675-2140
Website: http://www.ssicentral.com

[ PHASE 0 ]

CURRENT DATE: 6-10-2016


CURRENT TIME: 05:51:55

*** POLYTOMOUS MODEL ITEM ANALYSER ***


*** PHASE 0 ***

M-GRM 2 PL Analysis

>COMMENTS

>FILE DFNAME='data.DAT', SAVE;


>SAVE PARM='data.PAR', SCORE='data.SCO';
>INPUT NIDW=6, NTOTAL=20, NTEST=1, LENGTH=(20), NFMT=1;
SINGLE MAIN TEST IS USED.
NUMBER OF ITEMS:

20

FORMAT OF DATA INPUT IS


(6A1, 20A1)

>TEST1 TNAME=SCALE1, ITEM=(1(1)20), NBLOCK=1;


BLOCK CARD: 1
>BLOCK1 BNAME=SBLOCK1, NITEMS=20, NCAT=4, CADJUST=0.0;
>CALIB

GRADED,

LOGISTIC,

SCALE=1.7,

NQPTS=30,

2),NEWTON=5,
CRIT=0.005, ITEMFIT=10, SPRIOR, TPRIOR, GPRIOR;
MODEL SPECIFICATIONS
======================

CYCLES=(25,

2,

2,

2,

LOGISTIC - GRADED ITEM RESPONSE MODEL IS SPECIFIED.


SCALE CONSTANT 1.70 FOR SLOPE PARAMETERS.
CALIBRATION PARAMETERS
======================

MAXIMUM NUMBER OF EM CYCLES:

25

MAXIMUM INNER EM CYCLES:

MAXIMUM CATEGORY ESTIMATION CYCLES:

MAXIMUM ITEM PARAMETER ESTIMATION CYCLES:

MAXIMUM NUMBER OF NEWTON CYCLES:

CONVERGENCE CRITERION FOR EM CYCLES:

0.0050

CONVERGENCE CRITERION FOR SLOPE:

0.0050

CONVERGENCE CRITERION FOR THRESHOLD:

0.0050

CONVERGENCE CRITERION FOR CATEGORY:

0.0050

CONVERGENCE CRITERION FOR GUESSING:

0.0050

ORDER OF INNER EM CYCLES:

CATEGORY - ITEM PARAMETERS

ESTIMATION ACCELERATOR:

NO (DEFAULT)

RIDGE METHOD:

NO (DEFAULT)

PRIOR DISTRIBUTION ON SLOPES:

YES

PRIOR DISTRIBUTION ON THRESHOLD:

YES

PRIOR DISTRIBUTION ON GUESSING:

YES

SOURCE OF HYPERPARAMETERS FOR ITEMS:

DEFAULT VALUES

THE FIXED PRIOR DISTRIBUTION FOR LATENT TRAITS


MEAN
S.D.
QUADRATURE

POINTS

AND

: 0.0000
: 1.0000
PRIOR

WEIGHTS

(PROGRAM-GENERATED

APPROXIMATION):
1
POINT
WEIGHT

WEIGHT

WEIGHT

0.3692E-04 0.1071E-03 0.2881E-03 0.7181E-03 0.1659E-02


7

10

-0.2621E+01 -0.2345E+01 -0.2069E+01 -0.1793E+01 -0.1517E+01


0.3550E-02 0.7042E-02 0.1294E-01 0.2205E-01 0.3481E-01
11

POINT

-0.4000E+01 -0.3724E+01 -0.3448E+01 -0.3172E+01 -0.2897E+01


6

POINT

12

13

14

15

-0.1241E+01 -0.9655E+00 -0.6897E+00 -0.4138E+00 -0.1379E+00


0.5093E-01 0.6905E-01 0.8676E-01 0.1010E+00 0.1090E+00

NORMAL

16
POINT

19

20

0.1090E+00 0.1010E+00 0.8676E-01 0.6905E-01 0.5093E-01


21

22

23

24

25

0.1517E+01 0.1793E+01 0.2069E+01 0.2345E+01 0.2621E+01

WEIGHT

0.3481E-01 0.2205E-01 0.1294E-01 0.7042E-02 0.3550E-02


26

POINT

18

0.1379E+00 0.4138E+00 0.6897E+00 0.9655E+00 0.1241E+01

WEIGHT
POINT

17

27

28

29

30

0.2897E+01 0.3172E+01 0.3448E+01 0.3724E+01 0.4000E+01

WEIGHT

0.1659E-02 0.7181E-03 0.2881E-03 0.1071E-03 0.3692E-04

TOTAL WEIGHT: 1.00000


MEAN
S.D.

: 0.00000
: 0.99970

PRIOR DISTRIBUTIONS ON ITEM PARAMETERS


(THRESHOLDS, NORMAL; SLOPES, LOG-NORMAL)
+---------------------------------------------------------------------+
|

THRESHOLDS

|ITEM MU

SLOPES(LOG)

SIGMA MU

SLOPES(ARITH) ASYMPTOTES

SIGMA MU

SIGMA ALPHA BETA

+=====+=======+=======+=======+=======+=======+=====
==+=======+=======+
|0001 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0002 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0003 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0004 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0005 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0006 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0007 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0008 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0009 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|

+---------------------------------------------------------------------+
|0010 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0011 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0012 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0013 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0014 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0015 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0016 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0017 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0018 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0019 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+
|0020 | 0.000| 2.000| 0.000| 0.500| 1.000| 0.500| 5.000| 17.000|
+---------------------------------------------------------------------+

>SCORE EAP, NQPTS=30, SMEAN=0.0, SSD=1.0, NAME=EAP, PFQ=5;

PARAMETERS FOR SCORING AND TEST AND ITEM INFORMATION


====================================================

METHOD OF SCORING SUBJECTS:

EXPECTATION A POSTERIORI

(EAP; BAYES ESTIMATES)


TYPE OF PRIOR:

NORMAL APPROXIMATION

NUMBER OF QUADRATURE POINTS

30

SCORES WRITTEN TO OUTPUT


SCORES WRITTEN TO FILE

data.SCO

QUADRATURE

POINTS

AND

PRIOR

WEIGHTS

(PROGRAM-GENERATED

APPROXIMATION):
1
POINT
WEIGHT

WEIGHT

WEIGHT

WEIGHT

WEIGHT

WEIGHT

10

12

13

14

15

-0.1241E+01 -0.9655E+00 -0.6897E+00 -0.4138E+00 -0.1379E+00


0.5093E-01 0.6905E-01 0.8676E-01 0.1010E+00 0.1090E+00
17

18

19

20

0.1379E+00 0.4138E+00 0.6897E+00 0.9655E+00 0.1241E+01


0.1090E+00 0.1010E+00 0.8676E-01 0.6905E-01 0.5093E-01
22

23

24

25

0.1517E+01 0.1793E+01 0.2069E+01 0.2345E+01 0.2621E+01


0.3481E-01 0.2205E-01 0.1294E-01 0.7042E-02 0.3550E-02
26

POINT

0.3550E-02 0.7042E-02 0.1294E-01 0.2205E-01 0.3481E-01

21
POINT

-0.2621E+01 -0.2345E+01 -0.2069E+01 -0.1793E+01 -0.1517E+01

16
POINT

0.3692E-04 0.1071E-03 0.2881E-03 0.7181E-03 0.1659E-02

11
POINT

-0.4000E+01 -0.3724E+01 -0.3448E+01 -0.3172E+01 -0.2897E+01


6

POINT

27

28

29

30

0.2897E+01 0.3172E+01 0.3448E+01 0.3724E+01 0.4000E+01


0.1659E-02 0.7181E-03 0.2881E-03 0.1071E-03 0.3692E-04

TOTAL WEIGHT: 1.00000


MEAN
S.D.

: 0.00000
: 0.99970

SET NUMBER

SCORE NAME

: EAP

NUMBER OF ITEMS : 20
RESCALE CONSTANT: MEAN =
ITEMS

: 1

0.00 S.D. =
5

1.00

9 10

11 12 13 14 15 16 17 18 19 20

0001 0002 0003 0004 0005 0006 0007 0008 0009 0010
0011 0012 0013 0014 0015 0016 0017 0018 0019 0020

NORMAL

Fase 1 dari program Parscale berkaitan dengan statistika secara klasik untuk
setiap butir.

PARSCALE V4.1

MAXIMUM LIKELIHOOD ITEM ANALYSIS AND TEST SCORING: POLYTOMOUS MODEL

[ PHASE 1 ]

CURRENT DATE: 6-10-2016


CURRENT TIME: 05:51:57

*** POLYTOMOUS MODEL ITEM ANALYSER ***

*** PHASE 1 ***


M-GRM 2 PL Analysis

MAINTEST: SCALE1

271 OBS.(WEIGHTS: 271.000) WERE READ FROM MGRM_2PL.MFL

271 OBS.(WEIGHTS: 271.000) WERE READ FROM MGRM_2PL.MFL


SUMMARY ITEM STATISTICS
=======================

BLOCK NO.: 1

NAME: SBLOCK1

--------------------------------------------------------------ITEM | TOTAL

NOT

OMIT |

CATEGORIES

Fase 2 merupakan estimasi parameter butir

PARSCALE V4.2

MAXIMUM LIKELIHOOD ITEM ANALYSIS AND TEST SCORING: POLYTOMOUS MODEL

[ PHASE 2 ]

CURRENT DATE: 6-10-2016


CURRENT TIME: 05:51:57

*** POLYTOMOUS MODEL ITEM ANALYSER ***


*** PHASE 2 ***
M-GRM 2 PL Analysis

MAINTEST: SCALE1
******************************
CALIBRATION OF MAINTEST
SCALE1
******************************

[E-M CYCLES] GRADED RESPONSE MODEL


CATEGORY AND ITEM PARAMETERS AFTER CYCLE

LARGEST CHANGE= 0.000


-2 LOG LIKELIHOOD =

16768.295

CATEGORY AND ITEM PARAMETERS AFTER CYCLE

LARGEST CHANGE= 3.047 ( 3.979-> 0.932) at Location of Item: 7 0007

Sedangkan fase 3 berisi tentang estimasi peserta tes.

3. Graded Response Model (GRM)


Latar Belakang
Pada suatu uji instrumen terkadang peneliti memerlukan instrumen
berupa angket. Angket yang disajikan memiliki beberapa bentuk. Salah satu
bentuk angket yang sering digunakan disusun menggunakan skala Likert.
Dalam bentuk ini terdiri dari beberapa kriteria yang harus dijawab oleh
responden. Skala Likert memiliki range 1 hingga 4 atau lebih tergantung
peneliti. Model penskalaan yang mendukung untuk butir yang memiliki
respon kategorikal seperti pada skala Likert salah satunya adalah model
respon bergradasi atau Graded Response Model.
Terdapat dua jenis pendekatan di dalam model politomi respon butir
yaitu pendekatan langsung dan pendekatan tidak langsung. GRM termasuk
dalam pendekatan tidak langsung. Pada pendekatan langsung kita harus
mendapatkan

operating

characterstic

function

(OCF)

untuk

dapat

menentukan category response function (CRF). Persamaan yang digunakan


adalah :

dengan keterangan,
i

: parameter lereng (slope)

ij : ambang batas (threshold) pada item dengan kategori j

: level trait

Rumusan Masalah
Dari latar belakang yang telah dikemukakan, model penskalaan GRM
dapat digunakan pula untuk melakukan penilaian pembelajaran fisika. Dalam
hal ini rumusan masalah yang disajikan adalah :
1. Apakah model penskalaan GRM mampu mengukur keberhasilan
pembelajaran fisika?
2. Dapatkah model penskalaan GRM menghasilkan tes untuk penilaian
pembelajaran fisika?
Diskusi

Berikut disajikan penelitian yang berkaitan dengan model penskalaan


GRM yang menghasilkan tes pengetahuan. Penelitian dilakukan oleh Saiful
Ridlo. Pengembangan item menggunakan pendekatan teori respons butir
politomus (TRBP) sesuai Stark, Chemyschenko, Chuah, et al. (2001).
Persyaratan

penggunaan

TRBP

sangatlah

ketat.

Mula-mula

telah

dikembangkan/ dibongkar pasangkan 24 item setelah dilakukan konsultasi,


review ahli dan diskusi. Selanjutnya, dilakukan ujicoba dengan 80 dan 177
subjek (ujicoba skala kecil) dan penskoran oleh dua orang rater. Analisis
item dengan pendekatan teori klasik. Item yang dikehendaki didasarkan pada
hasil perhitungan reliabilitas dengan

-Cronbach >0,6. Uji korelasi skor

antara rater 1 dan 2 terbukti erat dan nilai t berpasangan nonsignifikans yang
membuktikan persepsi dua orang rater terhadap rubrik sama. Nilai koefisien
generalizability >0,75 agar desain setiap peserta tes dinilai oleh seorang rater
dan rater tersebut menilai seluruh peserta tes pada decision study layak
dilaksanakan. Item terbukti valid pada uji goodness of fit (GOF) pada first
order dan second order. Karakteristik item yang dikehendaki dengan selang
indeks kesulitan p = 0,3 0,8 dan indeks diskriminasi D minimal 0,2 sesuai
kriteria Nina Deng & Hambleton (2008:5). Hal-hal tersebut dilakukan untuk
memenuhi validitas, reliabilitas, dan menemukan karakteristik item yang
dikehendaki. Setelah mendapatkan perangkat soal sesuai kriteria tersebut di
atas, selanjutnya diaplikasikan. Subjek ujicoba pada uji model item yang
telah dikembangkan diambil dari siswa lima SMP kelas VII akhir mewakili
peringkat SMP di Kota Yogyakarta sebanyak 1030 siswa. Sebelum
dikalibrasi menggunakan TRBP, telah dilakukan uji asumsi unidimensi
dengan exploratory factor analysis (EFA). Data hasil penelitian diperoleh
dari output PARSCALE dan deskripsi hubungan fungsional antara respons
peserta tes dengan tingkat kemampuannya yang dinyatakan dalam TIC.
Kinerja GRM dan GPCM dilihat dari hasil kalibrasi menggunakan
PARSCALE. Hasil kalibrasi dilihat untuk mengetahui karakteristik item dan
orang/ kemampuan siswa. Hasil penaksiran parameter butir soal berupa daya
beda butir (parameter a atau slope) dan tingkat kesukaran butir (parameter b-

global) dapat dibaca dari output fase 2 atau file *.PAR. Pada file *.PAR juga
dapat dibaca parameter d atau parameter kategori. Hubungan parameter bglobal dan parameter d digunakan untuk menghitung parameter kesukaran
relatif atau parameter b. Sedangkan hasil penaksiran parameter kemampuan
dapat dibaca pada keluaran fase 3 atau file *.SCO. Item yang memenuhi
kriteria, yaitu parameter a nilainya > 0,25 pada skala logit dan parameter bglobal dan b nilainya pada selang -3 sampai 3 skala logit. Item yang terpilih
dimasukkan

dalam

bank

soal.

Selain

menggunakan

kinerja

hasil

parametrisasi, pembandingan kesesuaian model pengembangan item dilihat


berdasarkan TIC. Model yang menghasilkan TIC pada selang -3 sampai 3
skala logit dengan akurasi yang lebih baik dianggap sebagai model yang
lebih cocok dengan data. Model tes terbaik juga didasarkan pada kurva
karakteristik total (total characteristic curve/TCC). Model terbaik dipilih jika
memiliki TCC yang mengindikasikan diskriminasi antar peserta tes yang
lebih baik.
Setelah melalui ujicoba skala kecil maka didapat hasil sebagai berikut.
Satu item dari 24 item tidak valid dan secara umum pengembangan model
konseptual

didukung

oleh

data

empirik

(P-value=0,564

dan

RMSEA=0,000). Reliabilitas tes menunjukkan harga Cronbachs Alpha =


0,760 yang berarti perangkat tes memiliki reliabilitas yang cukup tinggi. Uji
korelasi berpasangan (rater 1 dan rater 2) pada semua item memiliki nilai
korelasi yang signifikans (p<0,05). Artinya korelasi antara skor yang
diberikan rater 1 dan 2 adalah sangat erat dan benar-benar berhubungan
secara nyata. Hasil uji t menunjukkan ada 23 butir soal yang memiliki nilai t
yang tidak signifikans (p>0,05) yang berarti pada 23 item tersebut rater
memberikan persepsi yang tidak berbeda terhadap rubrik. Taksiran koefisien
generalizability =0,79 yang berarti setiap peserta tes dinilai oleh seorang
rater

dan

rater

tersebut menilai seluruh peserta tes pada

D-study

menaikkan nilai reliabilitas relatif secara klasik maka layak apabila tes
dengan kondisi yang sama ujicoba skala kecil diskor oleh seorang rater.

Didapatkan 17 item yang dikehendaki dengan selang p = 0,3 0,8 dan D


minimal 0,2.
Hasil penelitian pada subjek uji target menunjukkan bahwa 17 item
yang digunakan layak untuk dianalisis dengan TRBP karena memenuhi
asumsi unidimensi sesuai pendapat Hattie (1985) dan unidimensionalitas
esensial dari Stout (Kyong Hee Chon, Won-Chan Lee & Ansley, 2007).
Besarnya variasi yang diterangkan oleh komponen pertama = 26,245%
yang berarti tidak kurang dari 15%, perbandingan total nilai eigen 1 dan 2 =
1: 2,6129

dan perbandingan nilai selisih nilai eigen pertama dan ke-2

banding ke-3 dan ke-4 = (4,199 1,607) / (1,186 1,064) = 21,24.


Meskipun dari total nilai eigen 1 tidak ada 3 kali total nilai eigen 2 tetapi dari
besarnya variasi yang diterangkan oleh komponen pertama lebih dari 15%
dan perbandingan nilai selisih nilai eigen diketahui nilainya lebih dari 10.
Berdasarkan scree plo-tnya terlihat ada satu dimensi dominan dan 3 dimensi
minor. Dari ke 17 item yang dikalibrasi dengan GRM dan GPCM terpilih 16
item dan sebuah item disisihkan karena memiliki nilai daya beda rendah pada
selang 0 0,25 dan nilai kesulitan item berada di luar selang -3 sampai +3.
Ke 16 item yang tersisa selanjutnya dikalibrasi kembali dengan kedua model
tersebut di atas. Reparametrisasi 16 item memiliki karakteristik parameter
daya beda pada selang 0,25 1,5 dan parameter kesulitan item berada pada
selang -3 sampai +3.
Butir terbaik sesuai hasil kalibrasi kedua model adalah butir 11 dengan
kode TPPB 18 karena memiliki nilai parameter a paling baik. Butir tersebut
memiliki banyak kategori 3. Butir TPPB 18 digunakan untuk mengukur
konstruk mengklasifikasikan makhluk hidup berdasarkan ciri-ciri yang
dimiliki dengan indikator siswa mampu menuliskan nama ilmiah dengan
benar. Batang soal dan rubrik butir tersebut adalah sebagai berikut. Catatan:
pada perangkat tes lengkap telah disediakan gambar berbagai spesies
Triangulum dan kunci dikotomisnya.

Kesimpulan
Penelitian ini menghasilkan 16 butir untuk bank soal dengan
karakteristik masing-masing butir memiliki nilai daya beda yang tidak rendah
(>0,25 skala logit) dan nilai kesulitan butir pada selang -3 sampai 3 skala
logit. Berdasarkan informasi yang dihasilkan, kedua macam model penskoran
GRM dan GPCM cocok memodelkan penskoran Tes Pengetahuan Praktikum
Biologi yang diadministrasikan. GPCM mungkin lebih merefleksikan realitas
bagaimana data dihasilkan sehingga dari TIC dan TCC tampak lebih akurat
menaksir kemampuan

dan diindikasikan lebih dapat membedakan

kemampuan peserta tes dibanding GRM.