Anda di halaman 1dari 7

II-1

Teori Reliabilitas

Secara teknis, berbagai teori tes memberikan kerangka kerja umum yang menghubungkan antara
variabel yang tampak (observed variables), seperti skor aitem dan skor tes, dengan arable yang tidak
tampak (unobservable variables), seperti skor abilitas atau skor laten. Dalam kerangka kerja teon
tersebut kemudian disusunlah model tes tertentu sesuai dengan spesifikasi hubungan di antara
konsep-konsep teoretik yang dipergunakan beserta berbagai asumsi yang melandasinya.

Teori tes klasik (Classical Test Theory CTT) beserta modelnya telah diteliti dan dipergunakan dengan
sangat berhasil sejak lebih dari 80 tahun yang lalu, dan sampai sekarang banyak sekali program
testing yang tetap dilakukan dengan berlandaskan pada metode dan model pengukuran klasik,
sekalipun sejak tahun 1990an para ahli pengukuran memiliki pilihan untuk menggunakan kerangka
kerja teori klasik atau kerangka kerja teori respons aitem (Item-Response Theory disingkat IRT), atau
menggunakan kombinasi keduanya (Hambleton & Jones, 1993).

Teori tes klasik bekerja pada tataran skor tes dengan menggunakan model linier dalam menjelaskan
model skor. Tanpa membicarakan ingan antara aitem dan abilitas secara spesifik, Teori ini dilandasi
oleh berbagai asumsi yang lemah (yaitu asumsi-asumsi yang mudah dipenuhi oleh data tes), dan
dapat dengan layak meskipun hanya dengan sampel yang berukuran tidak terlalu besar (sekitar 200
sampai 500 subjek).

ASUMSI TEORETIK MENGENAT SKOR

Performansi individu, yaitu respons subjek terhadap aitem-aitem dalam skala pengukuran atau tes
psikologi, dinyatakan dalam bentuk angka yang disebut skor (scores). Skor tidak lain daripada Parga
suatu jawaban terhadap pertanyaan dalam tes yang meskipun tidak sempurna- merupakan
representasi dari suatu atribut laten. Skor kuantitatif yang langsung diperoleh sebagai hasil proses
pengukuran dan belum diolah atau belum diderivasikan ini merupakan skor perolehan (obtained
scores atau observed scores) yang selanjutnya disebut sebagai skor-tampak dan diberi simbol huruf

Bersamaan dengan itu, bagi setiap individu atau subjek yang mendapat skor-tampak X, terdapat pula
angka lain yang merupakan skor sesungguhnya. Skor Sesungguhnya adalah angka, performansl yang
benar dan merupakan representasi murni dan atribut laten, yang tidak pernah dapat diketahui
besarnya oleh karena tidak dapat diungkap secara langsung oleh tes apapun. Skor yang
sesungguhnya tersebut selanjutnya disebut skor-mumi (true scores) yang dilambangkan oleh huruf
T.

Kemudian, menyertai sedap hasil pengukuran, diteorikan pula adanya suatu komponen kesalahan
dalam pengukuran atau komponen eror (error yang besaran kuantitasnya bagi setiap Individu dalam
setiap tes juga tidak dapat diketahui. Komponen eror dalam pengukuran ini disimbolkan dengan
huruf E.

Ketiga komponen skor tes di atas, dalam Teori Skor klasik diasumsikan memiliki hubungan
sebagaimana diuraikan les Allen dan yan (1979) berikut ini:

Asumsi 1: X=T + E

Asumsi ini menyatakan bahwa hubungan yang berlaku diantara skor tampak, skor-mumi, dan eror
adalah bersifat adatif. Besarnya skor tampak X bagi setiap individu ditentukan bersama oleh
besarnya skor-murni T individu tersebut dan besarnya error pengukuran E. Dengan kata lain,
bilamana dalam pengukuran tidak terjadi eror (yaitu bilamana E = 0) maka skor tampak X akan
identik dengan skor mumi T. Sebaliknya, bila dalam Pengukuran terjadi eror, maka eror negatif akan
menyebabkan Understimatsi terhadap skor murni sedangkan eror positif akan menghasilkan skor-
tampak yang merupakan suatu overenimasi terhadap skor-mumi.

Seseorang yang memiliki skor IQ yang murni atau yang sesungguhnya sebesar Tig = 104, dan dari
pengukuran dengan suatu tes IQ ia memperoleh skor sebesar X = 110, maka hasil pengukuran
tersebut mengandung eror sebesar +6. Bila pada kesmpatan lain orang yang sama dites kembali
dengan tes yang sama dan kemudian diperoleh hasil sebesar X = 100, maka pada pengukuran yang
ke dua ini terjadi eror sebesar E = -1 Dapat pula terjadi pada kesempatan lain- diperoleh X 104 yang
berart eror pengukurannya adalah E = 0. Salah-satu di antaranya macam hasil yang dicontohkan
tersebut akan terjadi pada setiap kali pengukuran dilakukan.

Karena besarnya skor murni seseorang asumsikan tetap pada setiap pengukuran yang diulang
(dengan asumsi setiap pengulangan pengukuran bersifat Independen satu sama lain). Maka
besarnya Varians skor tampak X yang diperoleh individu akan tergantung pada variasi error
pengukuran E yang terjadi.

Asumsi 2 : €(X) = T

Asumsi ini menyatakan bahwa skor-murni nilai harapan x(expected value of x), yaitu e(x) merupakan
harga rata rata dan distribusi teoretik Individu yang sama dikenal tes yang sama berulang kali
dengan asumsi pengulangan tes itu dilakukan tidak terbatas sedangkan setiap pengulangan tes
adalah Independen satu sama lain.

Dengan ilustrasi terdahulu, dapat dikatakan bahwa skor-murni IQ sebesar T iq= 104 merupakan rata-
rata teoretik atau suatu distribusi teoretik skor-tampak IQ bagi individu yang bersangkutan, andai ia
dites berulangkali sampai tak terbatas banyaknya (sekali lagi hal ini berlaku hanya dengan asumsi
tidak adanya pengaruh kelelahan dan hasil tes yang satu tidak mempengaruhi dengan hasil yang
lain).

Asumsi 3: Pet= 0

Korelasi antara eror pengukuran dan skor-murni adalah 0. Menurut asumsi ini-bagi suatu kelompok
populasi subjek yang dikenai tes distribusi eror pengukuran E dan distribusi skor-murni T adalah
independen satu sama lain. Variasi eror tidak tergantung pada variasi skor-murni.

Implikasinya adalah bahwa skor-murni yang tinggi (abilitas subjek tinggi) tidak akan mempunyai eror
yang selalu positif ataupun selalu negatif. Hal yang serupa juga berlaku bagi skor-mumi yang rendah
(abilitas subjek rendah), mereka juga tidak akan cenderung mengandung eror yang selalu positif
ataupun selalu negatif. Dengan kata lain, overestimasi tidak dapat terjadi terhadap skor-murni yang
rendah tapi juga dapat terjadi terhadap skor-mumi yang tinggi. Sebaliknya, underestimasi tidak
hanya dapat terjadi pada skor murni yang tinggi tapi dapat terjadi pada skor murni yang rendah.

Asumsi 4 : Pete2 = 0

Bila E1 melambangkan eror pada pengukuran atau pada tes pertama dan E2 melambangkan eror
pada tes yang kedua maka asusmsi ini mengatakan bahwa distribusi eror pengukuran pada kedua tes
tersebut, yaitu E1 dan E2,tidak berkorelasi satu sama lain Artinya, besarnya eror pada suatu tes tidak
tergantung pada eror tes lain.

Seseorang yang skor tampaknya pada tes yang pertama mengandung eror besar tidak berarti akan
mempunyai eror yang besar pula pada skor tampak tes yang ke dua, begitu juga sebaliknya. Asumsi
ini berlaku dengan pengertian bahwa pada tes pertama dan pada tes yang ke dua tidak ada
pengaruh kelelahan, pengaruh latihan, dan pengaruh semacamnya. Adanya faktor-faktor luar yang
secara sistematik mempengaruhi skor pada kedua tes secara bersamaan akan menyebabkan adanya
korelasi di antara eror dari kedua tes yang bersangkutan

Asumsi 5:

Pett2 = 0

Asumsi ke lima mengatakan bahwa eror pada suatu tes (E1) tidak berkorelasi dengan skor-murni
pada tes lain (T2). Artinya, eror pada satu tes tidak tergantung pada skor-murni pada tes lain. Asumsi
ini tidak berlaku apabila salah satu tes yang bersangkutan ternyata mengukur atribut yang dapat
berpengaruh terhadap terjadinya eror pada pengukuran yang lainnya.

Itulah lima asumsi pokok mengenai skor tes dalam teori skor-murni klasik. Dalam teori ini, apa yang
dimaksudkan dengan eror dalam pengukuran adalah penyimpangan skor tampak dari skor harapan
teoretik yang terjadi secara randon tidak secara sistematik, sedangkan penyimpanan secara
sistematik tidaklah dianggap sebagai sumber eror.

Berkaitan dengan asumsi-asumsi di atas, dirumuskan pula konsep mengenai tes yang paralel.
Menurut teori ini tes disebut paralel satu sama lain apabila skor-murni dari setiap subiek adalah
sama pada kedua tes tersebut (yaitu T=T'), bagi setiap populasi subjek yang dikeriar tes-tes tersebut
erornya adalah sama besar yaitu Qe2= Qe'² Batasan tersebut mengandung arti bahwa dua tes yang
paralel akan memiliki mean dan varians skor-tampak yang setara serta keduanya memilih korelasi
dengan skor-tampak tes lain yang setara pula. Walaupun demikian, distribusi skor-tampak subjek
pada dua tes yang paralel tidak harus berkorelasi sempurna.

Batasan lain yang dirumuskan oleh teori skor-murni klasik adalah pengertian mengenal dua bentuk
tes yang memiliki sifat essentially T-equivalent (pada dasarnya memiliki skor-murni yang setara). Dua
bentuk tes mempunyai sifat essentially T-equivalent apabila besamya perbedaan skor-murni setiap
individu pada kedua tes tersebut, selalu tetap. Jadi, bila skor-murni seseorang pada tes yang
pertama besarnya adalah T1 dan skor-murninya pada tes yang ke dua besarnya adalah T2, maka
berlaku T1 = T2+C, di mana C merupakan suatu bilangan konstan. Dua tes yang bersifat essentially T-
equivalent dapat saja memiliki varlans eror yang berbeda karena keduanya belum tentu merupakan
tes yang paralel, namun sebaliknya setiap dua bentuk tes yang paralel tentu memenuhi syarat untuk
disebut sebagai tes yang bersifat essentially T-equivalent.

RELIABILITAS DAN EROR PENGUKURAN

Salah-satu asumsi dalam teori skor klasik yang telah dikemukakan terdahulu menyatakan bahwa
skor-tampak X terdiri atas komponen skor-murni T dan komponen eror E dalam kadar tertentu,
yaitu X = T + E. Dalam kasus dengan n yang tidak terbatas diamsumsikan bahwa eror pengukuran
akan memiliki suatu distribusi dengan angka rata-rata eror (ue) sebesar 0 dan varians error sebesar
Qe2. Semakin besar porsi varians eror maka semakin kurang reliabel, sebaliknya semakin kecil porsi
varians eror maka hasil pengukuran tes dikatakan semakin reliabel. Bila dari suatu populasi individu
varians skor-murninya Qt2 dan bila varians eror Qt2 adalah sama bagi setiap skor dalam populasi
tersebut, maka besarnya reliabilitas hasil dapat dirumuskan sebagai Pxx' = Qat2/(Qat2 + Qe2).

Jadi variabilitas keseluruhan dari skor individual, yaitu (Qt2 + Qe2), disebabkan oleh dua hal, yaitu
pertama disebabkan perbedaan yang sesungguhnya di antara individu (diperlihatkan oleh Qt2) dan
yang ke dua disebabkan oleh variabilitas eror (yang diperlihatkan oleh Qe2). Dari sini dapat
dikatakan bahwa reliabilitas hasil ukur adalah proporsi variabilitas skor tes yang disebabkan oleh
perbedaan yang sebenarnya di antara individu, sedangkan ketidakreliabelan hasil ukur adalah
proporsi variabilitas skor tes yang disebabkan oleh eror pengukuran. Selanjutnya, berdasarkan
asumsi-asumsi teoretik mengenai skor yang diuraikan di atas, koefisien reabilitas hasil pengukuran
Pxx' dapat diinterpretasikan sebagai berikut (Allen & Yen, 1979).

Interpretasi 1: Pxx'= korelasi skor-tampak antara dua tes yang paralel

Interpretasi ini mengatakan bahwa besarnya koefisien reliabilitas hasil ukur ditentukan oleh
sejauhmana distribusi Skor-ampak pada dua tes yang paralel, berkorelasi. Bila setiap individu, pada
dua tes yang parallel, memperoleh skor-tampak X dan X' yang masing-masing identik atau masing-
masing memiliki perbedaan yang sama dan pada masing-masing distribusi skor tes terdapat variasi,
yaitu varians skor-tampaknya tidak sama dengan 0, maka kedua tes tersebut mempunyai reliabilitas
yang sempurna dengan koefisien sebesar Pxx' = 1,00. Sebaliknya skor-tampak pada suatu tes tidak
berkorelasi sama sekali dengan distriusi skor-tampak pada tes paralelnya maka tes tersebut tidak
reliabel dan koefisien reliabilitasnya Pxx' = 0.

Koefisien korelasi antara skor X dengan skor X' sebesar 0,90 berarti koefisien reliabilitas hasil ukur
tes tersebut (baik X maupun X') adalah 0,90. Interpretasi ini menjadi asumsi dasar dalam prosedur
estimasi reliabilitas dengan pendekatan bentuk-paralel (parallel-forms) dan prosedur estimasi
reliabilitas pengukuran dengan pendekatan bentuk sejajar (alternate-forms).

Interpretasi 2: Pxx'² = besarnya proporsi varians X yang dijelaskan oleh hubungan liniernya dengan x'

Kuadrat koefisien reliabilitas adalah sama dengan besarnya proporsi varians skor X yang dapat
dijelaskan oleh hubungan linlernya dengan skor X'. Interpretasi ini sama dengan pengertian koefisien
determinasi sebagaimana dilakukan terhadap hasil komputasi koefisien korelasi linier Pearson.

Jadi, besarnya kuadrat koefisien reliabilitas dapat diartikan sebagai besarnya proporsi varians suatu
tes yang dapat dijelaskan oleh varians skor pada tes lain yang paralel dengannya. Dengan koefisien
reliabilitas Pxx' = 0,90 berarti proporsi varians skor X yang dapat dijelaskan oleh skor X' adalah 0,81
atau 81%.

Qx2

Qx’²

Besamya proporsi varians skor tes X yang dijelaskan oleh varians skor test

X' yang paralel

Interpretasi 3: Pxx' = Qt² | Qx²

Koefisien reliabilitas adalah perbandingan antara varians skor-mumi dan varians Skor-tampak pada
hasil ukur suatu tes. DapatDapat juga dikatakan bahwa koefisien reabilitas adalah besarnya proporsi
varians skor-murni yang terkandung dalam varians skor-tampak. Suatu koefisien reliabilitas sebesar
Pxx’= 0,80 berarti 80 persen dari varians skor-tampak merupakan varians skor-murni.

Varians skor-tampak = Q²x

80%

Varians skor-murni = Q²t


Ketika semua perbedaan yang terjadi pada skor-tampak merefleksikan perbedaan skor-murni
diantara subjek, yaitu Qx² = Q²t maka reliabilitas hasil ukur tersebut adalah sempurna dengan
koefisien Pxx'= 1,00. Dalam hal ini perbedaan setiap skor-tampak yang diperoleh subjek yang satu
dengan yang lainnya memang mencerminkan perbedaan skor-mumi yang ada diantara mereka,
bukan merupakan perbedaan yang disebabkan oleh faktor-faktor lain sebagai sumber eror dalam
pengukuran itu.

Bila reliabilitas hasil pengukuran tidak sempurna, yaitu bila besarnya koefisien reliabilitas dinyatakan
sebagai Pxx1 < 1,0 berarti pengukuran yang dilakukan oleh tes yang bersangkutan yang sejumlah
eror. Besar-kecilnya eror dicerminkan oleh seberapa jauh jarak Pxx’ dari angka 1,0. Semakin kecil
koefisien reliabilitas, yaitu semakin jauh dari angka 1,0 berarti semakin besar variasi eror
pengukuran yang terjadi.

Koefisien reliabilitas yang besarnya mendekati atau sama dengan 0 menunjukkan keseluruhan skor-
tampak dalam tes itu hanya merefleksikan eror pengukuran semata-mata dari perbedaan di antara
skor-tampak yang terjadi tidak menunjukkan perbedaan yang sebenarnya ada diantara skor-murni
subjek melainkan menunjukkan adanya eror yang timbul secara random.

Interpretasi ini sangat penting artinya dalam menilai dan memutuskan apakah suatu koefisien
reliabilitas dapat dianggap sebagai cukup bermakna atau tidak dan apakah hasil ukur tes yang
bersangkutan cukup memuaskan atau tidak.

Interpretasi 4: Pxx’ = Pxt²

Konfisien reliabilitas merupakan kuadrat koefisien korelasi antara skor-tampak dan skor-murni. Jadi,
bila koefisien reliabilitas Pxx’ = 0,64 maka Pxt= √0,64 = 0,80. Bila besarnya koefisien Pxx’ = 0,49 maka
Pxt = √0,49 = 0,70.

Dari kedua contoh di atas tampak bahwa koefisien korelasi antara skar-tampak dengan skor-murni
selalu akan lebih besar daripada koefisien reliabilitasnya, selama koefisien reliabilitas itu tidak sama
dengan 0 atau 1,0. Adalah fakta dan kebenaran logis pula bahwa koefisien korelasi antara skor suatu
tes dengan skor pada tes atau pada variabel lain tidak akan lebih tinggi daripada koefisien korelasi
skor-tampak tes itu dengan skor-murninya sendiri. Kalau skor-tampak pada tes atau variabel lain itu
diberi simbol Y maka kenyataan tersebut mendukung pernyataan bahwa PX ≥ Pxy yaitu korelasil
antara X dan Y adalah pxt.

Menurut interpretasi ini, yaitu Pxx’ = Pxt² atau √Pxx’ = Px£ maka √Pxx’ ≥ Px£. Dalam simbolisası
validitas, skor X sendiri merupakan skor tes dan skor Y merupakan skor kriteria validasi sedangkan
kofisien validitas disimbolkan oleh Pxy. Oleh karena itu nyatalah bahwa besarnya koefisien validitas
hasil ukur (Pxy) tidak akan melebihi besarnya akar kuadrat koefisien reliabilitasnya (√Pxx’), sehingga
dapat disimpulkan bahwa rendahnya reliabilitas akan membatasi validitas.

Interpretasi 5: Pxx’ = 1 - Pxe²

Interpretasi kelima menyatakan bahwa koefisien reliabilitas adalah sama dengan satu dikurangi oleh
kuadrat koefisien korelasi antara skor-tampak dengan eror pengukuran. Semakin tinggi kolerasi
antara skor-tampak dan eror pengukuran, akan semakin kecil koefisien reliabilitasnya. Interpretasi
seperti ini erat berkaitan dengan suatu pengertian bahwa sejauhmana varians skor-tampak
mencerminkan eror pengukuran dapat dilihat pada penurunan besaran koefisien reliabilitas.

Besarnya proporsi varians skor-tampak yang berkaitan dengan varians eror dilambangkan oleh Pxe².
Semakin besar proporsi varians eror tersebut maka semakin eratlah kaitan antara skor-tampak yang
diperoleh subjek dengan eror pengukuran dan koefisien reliabilitas hasil tes semakin rendah.
Idealnya, antara skor-tampak dan eror pengukuran sama sekali tidak berkorelasi (Pxe = 0), yang
artinya reliabilitas pengukuran adalah sempurna.

Interpretasi 6: Pxx’ = 1 - Qe²|Qx²

Sebagaimana interpretasi 5, interpretasi ini mengaitkan koefisien reliabilitas dengan besarnya


proporsi varians eror yang terkandung dalam varians skor-tampak. Telah diketahui bahwa besarnya
varians eror akan mempengaruhi tingginya koefisien reliabilitas. Bila varians eror sangat kecil maka
skor hasil tes akan mempunyai koefisien reliabilitas yang tinggi.

Di sisi lain dapat dilihat bahwa derajat heterogenitas skor subjek yang ditunjukkan oleh besarnya Qx²
mempunyai pengaruh penting terhadap koefisien reliabilitas. Di bawah asumsi varians eror tetap,
tinggi-rendahnya koefisien reliabilitas akan tergantung pada besar kecilnya varians skor-tampak dari
kelompok subjek yang bersangkutan. Pada kelompok subjek yang skor-tampaknya homogen yaitu
yang memiliki Qx², kecil- harga rasio Qe²|Qx² akan relatif lebih besar dibandingkan dengan harganya
pada kelompok subjek yang heterogen (yang terdistribusi dengan Qx² besar). Oleh sebab itu,
koefisien reliabilitas hasil ukur suatu tes yang dihitung dari data suatu kelompok yang homogen akan
relatif lebih rendah dibandingkan dengan koefisien reliabilitasnya bila dihitung berdasarkan data
kelompok yang heterogen. Sebagai ilustrasi estimasi dilakukan terhadap reliabilitas pengukuran
suatu tes IQ berdasarkan data kelompok mahasiswa (kemampuan mental umum mereka dapat
dianggap relatif homogen) maka koefisien reliabilitas yang diperoleh cenderung akan lebih rendah
dibanding kalau tes IQ tersebut dikenakan pada kelompok remaja campuran dari berbagai tingkat
pendidikan dan usia dan menyertakan pula mereka yang tidak bersekolah, dikarenakan varians skor
IQ pada kelompok campuran ini akan lebih besar.

Demikianlah enam di antara cara interpretasi koefisien reliabilitas menurut teori skor-murni klasik.
Koefisien reliabilitas yang diperoleh sebagai hasil komputasi terhadap data skor-tampak merupakan
suatu estimasi terhadap reliabilitas hasil pengukuran sedangkan reliabilitas skor yang sesungguhnya
tidak dapat diketahui.

Besaran koefisien reliabilitas diteorikan berkisar antara 0 sampai dengan 1,0 akan tetapi dalam
kenyataannya koefisien reliabilitas hasil ukur psikologi yang mencapai angka 1,0 tidak pernah dapat
diperoleh. Koefisien reliabilitas yang berada diantara 0 dan 1,0 dapat diartikan sebagai berikut:

a. Hasil pengukuran yang dilakukan oleh tes yang bersangkutan mengandung sejumlah eror

b. X=T + E.

c. Qx² = Qt² + Qe², yaitu varians skor-tampak terdiri atas varians skor-murni dan varians eror

d. Perbedaan skor-tampak yang diperoleh subjek sebagian memang mencerminkan adanya


perbedaan skor-murni dan sebagian lain mencerminkan adanya eror.

e. Pxt = √Pxx² yaitu korelasi antara skor tampak dan skor-murni sama dengan akar kuadrat
reliabilitas.

f. Pxe = √(1- Pxx'), yaitu korelasi antara skor-tampak dengan eror adalah sama dengan akar kuadrat
dari (1 dikurangi koefisien reliabilitas).

g. Pxx’ = Qt² | Qx²

h. Semakin tinggi koefisien reliabilitas rxx' berarti estimasi X terhadap T semakin dapat dipercaya
dikarenakan varians erornya semakin kecil.
VARIANS EROR DAN SKOR-MURNI

Salah-satu interpretasi reliabilitas yang telah diuraikan diatas dirumuskan dengan mengaitkan
varians eror dan varians skor-tampak, yang dinyatakan sebagai Pxx’ = 1- Qe² | Qx². Dengan
belakunya asumsi konsentrasi varians eror bagi setiap individu dapat dilihat bahwa perbedaan
koefisien reliabilitas semata-mata, tergantung pada perbedaan varians skor tampak. Semakin besar

Anda mungkin juga menyukai