Anda di halaman 1dari 21

MAKALAH PSIKOMETRI

“RELIABILITAS LANJUTAN”

Disusun Oleh

Kelompok 9

Isna Sabrina 2015040016

Mainisa Abdi Utami 2015040027

Wiwil Putri Aprillia 2015040104

Dosen Pengampu:

Dr. Reza Fahmi S.sos, MA

Nurhamidah S. Psi. M.Psi

PROGRAM STUDI PSIKOLOGI ISLAM

FAKULTAS USHULUDDIN DAN STUDI AGAMA

UNIVERSITAS ISLAM NEGERI (UIN)

IMAM BONJOL PADANG

2022 M / 1443 H
KATA PENGANTAR
Assalamu’alaikum Warahmatullahi Wabarakatuh

Segala puji bagi Allah SWT yang telah memberikan pertolongan dan kemudahan sehingga
kami mampu menyelesaikan makalah serta yang berjudul “Reliabilitas Lanjutan” ini dengan
tepat waktu. Shalawat serta salam semoga terlimpah curahkan kepada Nabi Muhammad SAW,
keluarga, dan sahabatnya hingga akhir zaman.

Makalah ini disusun untuk memenuhi tugas dari Bapak Dr. Reza Fahmi S.sos, MA dan Ibu
Nerhamidah S.Psi. M.Psi. Pada mata kuliah Psikometri untuk menambah pengetahuan penulis
dan pembaca tentang Reliabel lebih lanjut lagi, yang dimana di dalamnya memuat tentang
definisi, fungsi skor, asumsi dan hubungan pengukuran dengan skor murni.

Kami mengucapkan terima kasih kepada Bapak Dr. Reza Fahmi S.sos, MA dan Ibu
Nerhamidah S.Psi. M.Psi. atas arahan dan bimbingannya sehingga kami dapat menyelesaikan
tugas ini dengan baik. Kami menyadari bahwa makalah ini masih jauh dari kata sempurna,
dengan begitu kami mengharapkan kritik serta saran untuk perbaikan makalah agar makalah
dapat lebih baik lagi kedepannya. Semoga makalah ini dapat memberikan manfaat buat kita
semua. Akhirul kalam atas segala kesalahan kami mohon maaf, terima kasih.

Wassalamu’alaikum warahmatullahi wabarakaatuh

Pariaman, 14 Mai 2022

Pemakalah

I
DAFTAR ISI

KATA PENGANTAR...................................................................................................................

DAFTAR ISI.................................................................................................................................II

BAB I PENDAHULUAN..............................................................................................................1

A. Latar Belakang...................................................................................................................1

B. Rumusan Masalah...............................................................................................................1

C. Tujuan Masalah..................................................................................................................2

BAB II PEMBAHASAN...............................................................................................................3

A. Definisi Reliabilitas............................................................................................................3

B. Fungsi Skor dalam Reliabilitas...........................................................................................4

C. Asumsi dan Hubungan Pengukuran dengan Skor Murni....................................................5

D. Metode-Metode Estimasi....................................................................................................8

E. Teknik Pengukuran Reliabilitas........................................................................................12

BAB III PENUTUP.....................................................................................................................17

A. Kesimpulan.......................................................................................................................17

B. Penutup.............................................................................................................................17

DAFTAR PUSTAKA

II
BAB I

PENDAHULUAN

A. Latar Belakang

Dalam mengumpulkan data sebuah penelitian dengan apa pun caranya, maka akan selalu
memerlukan alat atau disebut juga dengan instrumen penelitian. Penentuan alat atau
instrumen penelitian yang digunakan tergantung dari jenis dan tujuan penelitian. Jika sudah
dilakukan penentuan pada instrumen penentuan maka diperlukan kereliabelan alat ukur yang
digunakan. Dimana instrumen dalam mengukur suatu atribut psikologis haruslah reliabel dan
tingkat kereliabelan dalam pengukuran sangatlah penting dan diperlukan. Hal ini agar tidak
terjadi bias atau keambiguan dalam mengukur suatu konstruk atau atribut penelitian. Selain
itu pengukuran pada suatu penelitian yang tidak reliabel bisa saja bertentangan dengan
kelaziman.

Reliabilitas sendiri merupakan suatu instrumen yang jika digunakan beberapa kali untuk
mengukur objek yang sama akan menghasilkan data yang sama. Ini menunjukkan sejauh
mana konsistensi hasil suatu pengukuran. Suatu kuisioner dapat dikatakan reliabel apabila
jawaban dari kuisioner tersebut konsisten atau stabil dari waktu ke waktu. Jadi, hasil
instrumen dari suatu penelitian itu harus memiliki reliabilitas yang tinggi. Jika instrumen
penelitian yang digunakan memiliki reliabilitas yang rendah maka kesimpulan dari
pengukuran atau pengujian tersebut tidak tepat.

Reliabel ialah syarat yang mutlak untuk mendapatkan hasil penelitian yang terhindar dari
bias. Tetapi, hal ini masih dipengaruhi oleh kondisi objek yang diteliti serta kemampuan
peneliti dalam menggunakan instrumen pada saat pengumpulan data. Jadi, reliabilitas ini
merujuk pada ketetapan pengukuran pada suatu pengujian. Reliabilitas ialah syarat yang
sangat diperlukan, reliabilitas yang rendah dianggap membatasi nilai validitas yang diperoleh.

B. Rumusan Masalah
a. Apa yang dimaksud dengan reliabilitas?
b. Apa fungsi skor dalam reliabilitas?
c. Bagaimana asumsi dan hubungan pengukuran dengan skor murni?
d. Apa saja metode-metode estimasi?
e. Apa saja teknik pengukuran reliabilitas?

1
C. Tujuan Masalah
a. Untuk mengetahui apa itu reliabilitas.
b. Untuk mengetahui fungsi skor dalam reliabilitas.
c. Untuk mengetahui asumsi dan hubungan pengukuran dengan skor murni.
d. Untuk mengetahui metode-metode estimasi.
e. Untuk mengetahui teknik pengukuran reliabilitas.

2
BAB II

PEMBAHASAN

A. Definisi Reliabilitas

Reliabilitas berasal dari bahasa inggris yaitu reability atau reliable yang artinya dapat
dipercaya. Menurut Sukadji (2000) reliabilitas merupakan seberapa besar tingkat
kekonsistenan pengukuran pada suatu penelitian. Menurut Nursalam (2003), reliabilitas ialah
kesamaan pada hasil pengukuran atau pengamatan dari suatu fakta atau kenyataan hidup yang
telah diukur secara berulang dalam waktu yang berbeda.

Sedangkan menurut Sugiyono, reliabilitas ialah serangkaian pengukuran atau alat ukur
yang mempunyai konsistensi apabila pengukuran yang dilakukan secara berulang dengan
menggunakan alat ukur. Reliabilitas tes adalah tingkat konsistensi terhadap suatu tes yaitu
sejauh mana tes dapat dipercaya untuk menghasilkan skor konsisten yang relatif tidak
berubah walaupun diuji atau diteskan pada situasi yang berbeda. Azwar (2011) juga
berpendapat bahwa reliabilitas berasal dari kata reability yang artinya sejauh mana hasil
pengkuran mempunyai keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan, yang
bisa dipercaya. Hasil ukur bisa dipercaya apabila dilakukan beberapa kali pengukuran pada
suatu subjek yang sama tetap memperoleh hasil yang relatif sama. Allen dan Yen (1979)
menyatakan bahwa suatu tes dapat dikatakan reliabel apabila skor-skor yang diperoleh dari
suatu instrumen memiliki tinggi nilai atau skor yang sebenarnya dimiliki oleh subjek
penelitian.

Reliabilitas tes adalah proporsi variabilitas skor tes yang disebabkan oleh perbedaan
yang sebenarnya di antara individu. Koefisien reliabilitas yang diperoleh dari perhitungan
skor-tampak yang merupakan suatu estimasi terhadap tingginya reliabilitas tes, sedangkan
besarnya reliabilitas yang sesungguhnya tidak dapat diketahui. Secara teoritik koefisien,
reliabilitas berkisar antara antar 0 sampai 1. Akan tetapi secara empirik koefisien reliabilitas
tes yang mencapai angka 1,0 tidak pernah dijumpai.

Berdasarkan beberapa pendapat tentang reliabilitas di atas, maka dapat diambil


kesimpulan bahwa reliabilitas adalah tingkat konsistensi skor yang dicapai oleh orang yang
sama dengan tes yang sama namun pada waktu yang berbeda. Atau konsistensi skor juga
dapat diperoleh dengan pertanyaan yang berbeda namun memiliki aspek yang sama
kesamaan dari berbagai aspek.

3
B. Fungsi Skor dalam Reliabilitas

Angka yang diperoleh sebagai hasil dari suatu prosedur pengukuran yang mengggunakan
tes atau skala disebur skor (score). Skor individual (yang diberikan pada responden atas
jawabannya) pada suatu tes atau pengukuran diberi simbol huruf misalnya huruf X, huruf Y,
huruf X’, huruf Y’, dan semacamnya.

Ada beberapa macam fungsi skor dalam reliabilitas antara lain, yaitu:

1. Untuk mengukur stabilitas


Adalah berkaitan dengan usaha memperoleh nilai yang sama pada setiap orang atau
unit yang diukur disaat sedang melakukan pengukuran. Tes atau pengukuran yang
diberikan sama, pada dua kali di grup yang sama dengan jeda waktu di antara dua
tes tersebut dalam waktu 7 hari sampai 7 bulan. Untuk memperoleh reliabilitas yang
stabil maka setiap unit yang diukur skornya harus memperoleh hasil yang sama atau
hampir sama.
2. Untuk mengukur stabilitas dan ekivalen
Yaitu memberikan dua tes pada grup yang sama dalam jangka waktu yang
berdekatan, tes tersebut diberikan dua bentuk ke dalam grup siswa dengan
menambah interval.
3. Untuk mengukur kesulitan internal
Dengan memberikan tes sekali pada sebagian skors tes, diperoleh korelasi sebagian
dengan formula spearman brown.
4. Reliabilitas terwakili
Mengarah pada keterandalan masing-masing grup. Yaitu menguji apakah
penyampaian suatu indikator sama jawabannya saat disampaikan terhadap kelompok
yang berbeda.
5. Reliabilitas seimbang
Ialah upaya yang dilakukan dalam memperoleh suatu nilai yang relatif sama dengan
jenis ukuran yang berbeda namun pada waktu yang seimbang.

4
C. Asumsi dan Hubungan Pengukuran dengan Skor Murni
Performans individual pada suatu tes psikologi dinyatakan dalm bentuk kuantitatif yang
disebut skor (score). Skor tidak lain daripada harga suatu jawaban terhadap pertanyaan dalam
tes. Skor ini merupakan skor perolehan (obtained scores atau disebut juga observed scores)
yang selanjutnya disebut skor-tampak dan diberi simbol huruf X.
Skor-tampak X yang diperoleh seseorang pada suatu tes yang mengukur kecerdasan
misalnya, belum tentu mencerminkan tingkat kecerdasan orang tersebut yang sesungguhnya.
Skor yang menunjukkan tingkat kecerdasan sesungguhnya merupakan angka performans
yang murni dan tidak pernah dapat diketahui besarnya oleh karena tidak dapat diungkap
secara langsung oleh tes. Karena itu, selain memiliki skor-tampak, secara teoritik setiap
individu yang menjawab soal tes memiliki pula suatu skor sesungguhnya (true-scores) yang
selanjutnya disebut sebagai skor-murni dan sdilambangkan oleh huruf T.
Karena skor-tampak belum tentu sama besar dengan skor-murni maka terdapat selisih
antara keduanya yang disebut eror pengukuran (measurement error) yang besarnya bagi
setiap subjek dalam setiap tes juga tidak dapat diketahui secara langsung. Eror pengukuran
disimbolkan dengan huruf E.
Dalam Teori Skor-Murni Klasik, eror dalam pengukuran adalah penyimpangan skor-
tampak dari skor harapan teoritik yang terjadi secara acakk (random) atau terjadi tidak secara
sistematik, sedangkan penyimpangan yang terjadi secara sistematik tidaklah dianggap sebagai
sumber eror.
Hubungan di antara ketiga komponen skor tersebut dapat digambarkan sebagai suatu
hubungan aditif, yaitu X = T+E. Bahwasanya skor yang langsung diperoleh dari pengukuran
(X) bukan angka sebenarnya dari suatu atribut, melainkan terdiri dari skor murni (T) yang
tidak pernah diketahui secara langsung dan skor E yang juga tidak dapat diketahui dengan
tepat.
Hubungan antara eror pengukuran (E) dan skor murni (T) diuraikan oleh Allen & Yen
(1979) dalam beberapa asumsi berikut :

1.

Hasil pengukuran hanya akan menginformasikan besarnya skor tampak X, yang


sebenarnya merupakan jumlah antara skor murni T dan skor error E.

Contoh : Si A dites IQ. Memperoleh skor murni (T) 104 , skor tampak X 110, maka hasil
pengukurannya mengandung E = +6 .

5
Jadi besarnya skor tampak X akan tergantung antara lain pada besarnya eror pengukuran
E, sedangkan besarnya skor murni T bagi setiap individu pada setiap pengulangan
pengukuran yang sama diasumsikan sebagai tetap.

2.

Asumsi ini menyatakan bahwa skor murni T merupakan nilai harapan X (expected value
of X) yaitu έ(X). Jadi T merupakan harga rata-rata dari distribusi teoritik skor X apabila orang
yang sama dikenai tes yang sama berulang kali dengan asumsi pengulangan tes ini dilakukan
tidak terbatas banyaknya sedangkan setiap pengulangan tes adalah independen satu sama lain.
Karena besar skor murni diasumsikan tetap dalam setiap pengukuran, maka besar
varians skor tampak akan tergantung pada variasi eror pengukuran.

3.

Asumsi ini menyatakan bahwa bagi suatu kelompok populasi subjek yang dikenai tes
distribusi eror pengukuran E dan distribusi skor murni T tidak berkorelasi satu sama lain.
Korelasi antara eror pengukuran dan skor murni adalah nol. Variasi eror tidak tegantung pada
variasi skor murni.

4.

Asumsi ini menyatakan bahwa bila E1 dan E2 tidak berkorelasi satu sama lain. Artinya
besarnya eror pada suatu tes tidak tergantung pada eror pada tes lain.

5.

Asumsi ini menyatakan bahwa eor pada suatu tes tidak berkorelasi dengan skor murni
pada tes lain. Artinya, eror pada suatu tes tidak tergantung pada skor murni di tes lain.

Allen & Yen (1979) menguraikan enam cara untuk menginterpretasikan koefisien
reliabilitas tes :

 Interpretasi 1

Pxx’ = korelasi skor tampak antara dua tes yang pararel.

6
Interpretasi mengatakan bahwa realibilitas tes ditentukan oleh sejauh mana distribusi skor
tampak pada suatu tes yang pararel berkorelasi

 Interpretasi 2

Pxx² = besarnya proporsi varians yang dijelaskan oleh hubungan liniernya dengan X

Interpretasi mengatakan bahwa besarnya kuadrat koefisien realibilitas dapat diartikan seabagi
besarnya proporsi varians suata tes yang dapat dijelaskan oleh variasi skor pada tes lain yang
pararel dengannya.

 Interpretasi 3

Pxx = όt² / όt²

Bahwa koefisien relibilitas merupakan perbandingan antara varians skor murni dan varians
skor tampak pada suatu tes

 Interpretasi 4

Pxx = Pxt²

Koefisien relibilitas merupakan kuadrat koefisien korelasi antara skor tampak dan skor murni,
ada fakta bahwa koefisien korelasi antara skor suatu tes dengan skor pada tes atau variabel
lain tidak akan lebih tinggi dari pada koefisien korelasi skor tampak tes itu dengan skor
murninya sendiri.

 Interpretasi 5

Pxx = 1 ~ Pxe²

Bahwa koefisien relibilitas adalah sama dengan datu dikurangi oleh kuadrat koefisien
korelasi antara skor-tampak dengan eror pengukuran. Semakin besar korelasi antara skor
tampak dan eror pengukuran, akan semakin kecil koefisien realibitasnya.

 Interpretasi 6

Pxx = 1 . όe² / όx²

Bahwa derajat heterogensi skor subjek yang ditunjukan oleh besarnya

7
όx² mempunyai pengaruh penting terhadap koefisien relibilitas. Dibawah asumsi varians eror
tetap, tinggi rendahnya koefisien relibilitas akan tergantung pada besar kecilnya varians skor
tampak dari kelompok subjek yang bersangkutan.

D. Metode-Metode Estimasi

Tujuan dari reliabilitas ialah untuk menunjukkan konsistensi skor-skor yang diberikan
skorer satu dengan skorern yang lainnya. Namun reliabilitas alat ukur juga menunjukkan
derajat kekeliruan pengukuran yang tidak dapat ditentukan dengan pasti melainkan hanya
bisa di estimasi (Suryabrata: 2000). Estimasi reliabilitas alat ukur dapat dicapai dengan
menggunakan tiga metode. Ketiga metode tersebut ialah metode test-retest atau tes ulang,
alternate-forms atau tes paralel, dan split half atau konsistensi internal (Guilford, 1954;
Thorndike, 1997; Azwar, 2000; Suryabrata, 2000).

1. Tes-Ulang (Test-Retest)

Metode tes-ulang dilakukan dengan menyajikan satu tes pada satu kelompok subjek
dua kali dengan tenggang waktu yang cukup diantara kedua penyajian tersebut. Jadi,
dalam hal ini alat ukurnya sama, respondennya sama, dalam waktu yang berbeda.
Reliabilitas diukur dari koefisien korelasi antara percobaan pertama dengan yang
berikutnya. Bila koefisien korelasi positif dan signifikan, maka instrumen tersebut sudah
dinyatakan reliabel.

Metode ini merupakan perhitungan yang paling baik untuk mengetahui penyebab
timbulnya kesalahan yang berkaitan dengan waktu. Pada teknik ini kita memberikan
pertanyaan/kuesioner kepada responden yang sama dan waktu berbeda dengan
menggunakan kalimat yang sama. Misalnya: Pada minggu I ditanyakan: Bagaimana
tanggapan saudara terhadap kualitas dosen di Universitas Persada Indonesia?. Pada
minggu III ditanyakan: Ditanyakan lagi pada responden yang sama dengan pertanyaan
yang sama.

Oleh karena itu, metode tes-ulang lebih cocok untuk digunakan sebagai prosedur
estimasi reliabilitas bagi skor tes yang mengukur aspek psikologis yang relatif stabil dan
tidak mudah berubah.

8
2. Bentuk-Paralel (Alternate-Forms)

Dalam metode bentuk-paralel, tes yang akan diestimasi reliabilitasnya harus tersedia
paralelnya, yaitu tes lain yang sama tujuan ukurnya dan setara isi aitemnya baik secara
kualitas maupun kuantitasnya. Dengan bahasa sederhana dapat dikatakan bahwa harus
tersedia dua tes yang kembar. Metode bentuk-paralel dilakukan dengan cara memberikan
sekaligus dua bentuk tes yang paralel satu-sama lain, kepada sekelompok subjek.

Dalam pelaksanaannya, bila aitem dalam tes tidak sangat banyak, kedua tes yang
paralel tersebut dapat digabungkan terlebih dahulu sehingga seakan-akan merupakan
satu bentuk tes. Setelah seluruh tes selesai dikerjakan oleh subjek barulah masing-masing
aitem dipisahkan dan dikembalikan pada tes semula untuk diperiksa dan diberi skor,
sehingga diperoleh dua distribusi skor. Keuntungan penggabungan ini adalah tidak
terkesannya beban mengerjakan dua tes bagi subjek dan bila urutan nomor aitem
gabungan itu diletakkan sedemikian rupa dapat mengurangi efek carry-over dari satu
bentuk ke bentuk tes yang lain. Kalau penggabungan kedua tes tidak dimungkinkan
karena masing-masing tes itu sendiri sudah panjang (berisi banyak aitem) maka kedua
tes tersebut hendaknya diberikan berturut-turut dengan tenggang waktu yang singkat.

3. Konsistensi Internal (Split Half)

Dalam pendekatan konsistensi internal data skor diperoleh melalui prosedur yang
menggunakan satu bentuk tes yang dikenakan hanya sekali saja pada satu kelompok
subjek (single-trial administration / penyajian tunggal), sehingga metode ini mempunyai
nilai praktis dan efisiensi yang tinggi dibandingkan prosedur tes-ulang dan bentuk
paralel.

Metode ini bertujuan untuk melihat konsistensi antar-aitem atau antar-bagian dalam
tes, sehingga komputasi koefisien reliabilitas dilakukan bukan terhadap skor tes tapi
terhadap skor aitem dalam tes atau terhadap skor bagian-bagian tes. Untuk itu, item-
aitem dipisahkan menjadi paling tidak dua kelompok. Pengelompokan itu disebut sebagai
pembelahan dan setiap kelompok disebut sebagai bagian atau belahan tes.

9
Tes yang akan diestimasi reliabilitasnya dapat dibelah menjadi dua bagian, tiga,
empat, bahkan dapat dibelah menjadi belahan-belahan yang jumlahnya sebanyak jumlah
aitemnya sehingga setiap belahan berisi hanya satu aitem saja. Bila suatu tes dibelah
menjadi belahan-belahan yang masing-masing berisi lebih daripada satu aitem saja,
adalah sangat penting untuk menjadikan banyaknya aitem dalam masing-masing belahan
sama sehingga kesemua belahan itu seimbang. Keseimbangan belahan-belahan itu tidak
saja menyangkut banyaknya aitem akan tetapi hendaknya juga meliputi aspek isi dan
karakteristik aitem-aitemnya.

Beberapa Cara Pembelahan Tes

Membelah suatu tes menjadi beberapa bagian yang setara parameter dan isi,
maksudnya adalah mengusahakan agar antara belahan yang satu dengan yang lain
memiliki jumlah aitem yang sama banyak, taraf kesukaran yang seimbang, isi yang
sebanding, dan sedapat mungkin memenuhi ciri-ciri paralel sebagaimana yang telah
dikemukakan terdahulu. Walaupun tersedia rumusan guna mengestimasi reliabilitas tes
yang belahannya tidak paralel akan tetapi estimasi terhadap bagian-bagian yang paralel
itu akan lebih meyakinkan bahwa hasil estimasi yang diperoleh mendekati harga
reliabilitas yang sesungguhnya, bukan merupakan underestimasi (estimasi yang terlalu
rendah) bukan pula overestimasi (estimasi yang terlalu tinggi).

a) Pembelahan Cara Random

Membelah tes menjadi dua atau tiga bagian secara random dilakukan dengan
undian sederhana terhadap aitem dalam tes guna menentukan aitem-aitem nomor
berapa sajakah yang dimasukkan ke dalam kelompok atau belahan pertama dan
mana yang diikutkan ke dalam belahan ke dua atau ke tiga.

Pembelahan tes secara random hanya boleh dilakukan bila tes yang dibelah
berisi aitem-aitem yang homogen. Pengertian homogen dalam hal ini harus
dipandang dari segi isi (content) dan segi daya diskriminasi, serta dari segi taraf
kesukarannya apabila tes yang bersangkutan mengukur aspek kemampuan. Suatu tes
yang berisi aitem-aitem yang sifatnya heterogen bila dibelah secara random dapat
menghasilkan belahan-belahan yang tidak setara sațu sama lain, kecuali bila tes
tersebut berisi aitem yang berjumlah sangat besar.

10
Bila tes yang akan dibelah terdiri dari beberapa komponen, randomisasi
penempatan aitem ke dalam setiap, belahan harus dilakukan terhadap aitem dalam
setiap komponen masing-masing, bukan terhadap aitem secara keseluruhan sehingga
keseimbangan belahan mencakup juga kesetaraan komponennya.

b) Pembelahan Gasal-Genap

Pembelahan tes dengan cara gasal-genap (odd-even splits) sangat populer dan
tidak sulit dilakukan. Dalam cara ini, seluruh aitem yang bernomor urut gasal
dijadikan satu kelompok menjadi belahan pertama dan seluruh aitem yang bernomor
urut genap dijadikan satu kelompok menjadi belahan kedua. Jadi, belahan pertama
berisi aitem bernomor 1, 3, 5, 7, .. dan seterusnya, sedangkan belahan ke dua berisi
aitem bernomor 2, 4, 6, 8, .. dan seterusnya. Dengan pembelahan secara gasal-genap
diharapkan dapat diperoleh dua bagian tes yang setara dari segi isi dan dari segi taraf
kesukaran aitem-aitemnya.

Cara pembelahan semacam ini menghindari kemungkinan terjadinya


pengelompokan aitem yang berkarakter sama kedalam salah-satu belahan tertentu.
Walaupun semula urutan aitem-aitem sengaja disusun dalam pola tertentu akan
tetapi sewaktu dilakukan pemisahan gasal-genap maka aitem-item yang berurutan
tadi akan dengan sendirinya jadi terpisah kedalam belahan yang berbeda.

Untuk membelah tes menjadi tiga belahan, pembelahan gasal-genap dapat


dianalogikan yaitu dengan cara menempatkan aitem-aitem bernomor 1, 4, 7, 10,..
dan seterusnya kedalam belahan pertama; aitem-aitem bernomor 2, 5, 8, 11,... dan
seterusnya kedalam belahan ke dua; dan aitem-aitem bernomor 3, 6, 9, 12,… dan
seterusnya kedalam belahan ke tiga.

c) Pembelahan Matched-Random Subsets

Untuk tes yang mengukur aspek kemampuan, yang indeks kesukaran aitem dan
koefisien korelasi aitem dengan skor total tesnya telah diketahui, Gulliksen (1950)
mengusulkan suatu cara pembelahan yang disebutnya matched-random subsets.
Dengan cara ini, setiap aitem dalam tes seakan diletakkan pada satu posisi tertentu
atau titik koordinat dalam grafik berdasarkan besamya angka koefisien korelasi
antara aitem yang bersangkutan dengan skor tes (rix) dan indeks kesukaran aitem (p).

11
Dengan melihat posisi aitem pada grafik dapat diketahui bahwa setiap aitem
yang letaknya berdekatan berarti memiliki karakteristik yang relatif sama atau mirip
satu sama lain. Setiap pasangan dua aitem yang posisinya berdekatan lalu diundi
untuk menentukan aitem mana yang akan dimasukkan kedalam belahan pertama dan
mana yang akan diikutkan kedalam belahan ke dua.

E. Teknik Pengukuran Reliabilitas

Ada beberapa teknik yang dapat digunakan untuk mengukur reliabilitas suatu instrumen
penelitian, tergantung dari skala yang digunakan. Teknik-teknik pengukuran reliabilitas,
antara lain sebagai berikut.

1. Formula Spearman Brown (Belah Dua)

Formula Spearman Brown digunakan pada pembelahan tes yang menghasilkan dua
belahan yang paralel, yang dapat dilakukan dengan pembelahan gasal-genap atau dengan
pembelahan matched-random subsets. Formula ini bisa diterapkam pada instrumen tes yang
skor-skor itemnya dikotomi (skor 0 atau 1) ataupun tidak dikotomi (skor 0 s/d skor 4).
Koefisien reliabilitas diperoleh dari korelasi dua hasil skor dalam kedua belahan yang
terbentuk.

Instrumen penelitian yang reliabilitasnya diuji dengan teknik Spearman Brown adalah
instrumen penelitian yang mempunyai beberapa kriteria, seperti:

a. Pilihan jawaban untuk setiap pertanyaan hanya ada dua jawaban. Misalnya jawaban Ya
diisi dengan nilai 1 dan jawaban Tidak diisi dengan nilai 0.

b. Jumlah instrumen penelitian harus genap, agar dapat dibelah. Antara belahan pertama
dan kedua harus seimbang.

Formula Spearman-Brown dinyatakan sebagai:

2. Formula Alpha-α (Cronbach)

12
Teknik atau rumus ini dapat digunakan untuk menentukan apakah suatu instrumen
penelitian reliabel atau tidak, bila jawaban yang diberikan responden berbentuk skala seperti
1-3, dan 1 -5, serta 1-7 atau jawaban responden yang menginterpretasikan penilaian sikap.
Misalnya responden memberikan jawaban sebagai berikut:

1. Sangat Memuaskan (SM) =5

2. Memuaskan (M) =4

3. Netral (N) =3

4. Tidak Memuaskan (TM) =2

5. Sangat Tidak Memuaskan (STS) = 1

Kriteria suatu instrumen penelitian dikatakan reliabel dengan menggunakan teknik ini,
bila koefisien reliabilitas (r11) > 0,6.
Formula koefisien alpha untuk estimasi terhadap reliabilitas skor tes yang dibelah
menjadi dua bagian sama panjang, adalah:

Formula koefisien alpha untuk belah-tiga, yaitu:

3. Formula-Formula Kuder-Richardson

Jika suatu tes mempunyai jumlah item soal yang tidak terlalu banyak dan pemberian
skornya dengan dikotomi, maka pembelahan tes menjadi dua bagian cenderung akan
menghasilkan bagian yang tidak setara. Akan tetapi jika dilakukan pembelahan yang lebh
banyak, akan mengakitbakan jumlah item dalam tiap belahan menjadi sedikit. Hal ini bisa
mengakibatkan estimasi reliabilitasnya menjadi tidak akurat.

Salah satu alternatif yang bisa dilakukan adalah membelah tes menjadi sebanyak item
soal. Jadi setiap belahan hanya memuat satu butir soal saja. Estimasi reliabilitasnya dilakukan
dengan rumus alpha yang telah disesuaikan, dan dikenal dengan nama formula Kudher-

13
Richardson-20 atau KR-20, atau koefisien α-20. Koefisien ini menggambarkan sejauh mana
kesetaraan butir-butir atau item-item dalam suatu instrumen tes.

Instrumen penelitian yang reliabilitasnya diuji dengan teknik Kuder dan Richardson (K-
R 20) adalah instrumen penelitian yang mempunyai beberapa kriteria, yaitu:

a. Pilihan jawaban untuk setiap pertanyaan hanya ada dua jawaban. Misalnya jawaban Ya
diisi dengan nilai 1 dan jawaban Tidak diisi dengan nilai 0.

b. Jumlah instrumen penelitian (pertanyaan) harus ganjil, sehingga tidak bisa dibelah.

c. Kriteria pengujian, jika nilai reliabilitas instrumen (r11) > 0,7 maka instrumen penelitian
dinyatakan reliabel (sahih).

Rumus:

Instrumen penelitian yang reliabilitasnya diuji dengan teknik Kuder dan Richardson (K-
R 21) prinsipnya sama dengan Kuder dan Richardson (K-R 20) bedanya hanya terletak pada
saat mengaplikasikan rumus reliabilitas instrumen, bila pada rumus (K-R 20) menggunakan
variabel p dan q , sedangkan pada rumus (K-R 21) variabel p dan q diganti dengan variabel
(rata-rata skor total).

Rumus:

4. Formula Rulon

Rulon memberikan formula untuk pembelahan tanpa harus berasumsi bahwa kedau
belahan memiliki varians yang sama. Perbedaan skor atau nilai dari kedau hasil pembelahan
tes akan memiliki distribusi perbedaan skor dengan varian. Besarnya akan dpengaruhi oleh
varian eror dari masing-masing belahan. Karena varians eror dari tiap belahan menentukan
varians eror keseluruahan tes, maka varians eror tes bisa diestimasi melalui besarnya
perbedaan skor diantara dua belahan tersebut. Formula Rulon dirumuskan sebagai:

14
Formula Ruon dapat diterapkan pada instrumen tes yang memiliki skor dikotomi.
Koefisien reliabilitas Rulon yang dikenakan pada tes yang sudah dilakukan pembelahan
menjadi dua merupakan estimasi reliabilitas untuk keseluruhan tes.

5. Formula Belah-Dua dengan Panjang Berbeda

Jika suatu tes hanya bisa dibelah menjadi dua belahan akan tetapi banyaknya item pada
kedua belahan itu tidak dapat sama maka koefisien alpha tidak dapat lagi digunakan untuk
mengestimasi reliabilitasnya. Hal itu dikarenakan kedua belahan yang terjadi tidak akan
memenuhi asumsi τ-requivalent. Belahan tes yang berisi item dalam jumlah berbeda disebut
belahan yang tidak sama panjang.

Apabila kedua belahan yang dihasilkan tidak mempunyai panjang yang sama atau
mempunyai jumlah item yang berbeda akan tetapi isinya masih homogen, dan data diperoleh
dari subjek penelitian dalam jumlah yang besar, rumus yang diusulkan oleh Feldt untuk
mengestimasi reliabilitasnya adalah sebagai berikut:

6. Formula Kristof untuk Belah-Tiga

Tes yang mempunyai jumlah butir soal atau item tidak genap, tidak bisa dibelah menjadi
dua bagian. Jika dibelah menjadi dua akan menghasilkan dua belahan soal dengan jumlah
butir soal yang tidak sama, sehingga tidak dapat memenuhi asumsi τ-aquivalent. Oleh karena
itu rumusan atau formula alpha tidak dapat diterapkan dalam hal ini. Salah satu alternatif
solusinya adalah membelah soal menjadi tiga bagian apabila soal tersebut memiliki jumlah
item soal yang banyak. Asalkan soal berisi item-item yang homgen. Perhitungan untuk

15
mendapatkan koefisien korelasinya berdasarkan pada estimasi skor yang ditemukan oleh
Kristof, yaitu:

Kristof menunjukkan bahwa mengsetimasi varians skor murni tes dapat dilakukan
dengan cara memperhitungkan kovarians antar ketiga belahan tes tanpa perlu
mempertimbangkan besarnya varians masing-masing. Untuk perhitungan koefisien
reliabilitasnya, digunakan rumusan dasar reliabilitas yaitu:

7. Formula Hoyt

Tes yang berisi aitem dalam jumlah tidak banyak atau tes yang tidak dapat dibelah
dua atau belah tiga dengan sama panjang, akan tidak sesuai bila diestimasi reliabilitas hasil
ukurnya oleh formula-formula sebelumnya. Dalam kondisi demikian, formula Hoyt (1941)
yang didasarkan pada desain analisis varians (anova) dua-jalan menjadi solusi yang tepat.

Konsep estimasi reliabilitas pengukuran dalam pendekatan analisis varians Hoyt adalah
memandang distribusi aitem-aitem keseluruhan subjek sebagai data pada suatu desain
eksperimen faktorial dua-jalan tanpa replikasi, yang dikenal pula sebagai item by subject
design. Setiap aitem dianggap seakan bagian dari suatu treatment atau perlakuan yang
berbeda sehingga setiap kali subjek dihadapkan pada suatu aitem seakan-akan ia berada pada
suatu perlakuan. Dalam hal ini banyaknya aitem merupakan banyaknya perlakuan sehiingga
dapat dikatakan bahwa desain ini membelah tes menjadi belahan sebanyak jumlah aitem-
aitemnya. Maka dirumuskan koefisien reliabilitas Hoyt sebagai:

16
BAB III

PENUTUP

A. Kesimpulan

Reliabilitas adalah tingkat konsistensi skor yang dicapai oleh orang yang sama dengan tes
yang sama namun pada waktu yang berbeda. Atau konsistensi skor juga dapat diperoleh
dengan pertanyaan yang berbeda namun memiliki aspek yang sama kesamaan dari berbagai
aspek. Angka yang diperoleh sebagai hasil dari suatu prosedur pengukuran yang
mengggunakan tes atau skala disebur skor (score). Ada beberapa fungsi skor dalam
reliabilitas diantaranya: untuk mengukur stabilitas, untuk mengukur stabilitas dan ekivalen,
untuk mengukur kesulitan internal, reliabilitas terwakili, dan reliabilitas seimbang.

Skor yang langsung diperoleh dari pengukuran (X) bukan angka sebenarnya suatu
atribut, melainkan terdiri dari skor murni (T) yang tidak pernah diketahui secara langsung dan
skor E yang juga tidak dapat diketahui dengan tepat. Hubungan di antara ketiga komponen
skor tersebut dapat digambarkan sebagai suatu hubungan aditif, yaitu X = T+E. Adapun 5
asumsi terkait hubungan antara skor murni (T) dan eror pengukuran (E).

Reliabilitas alat ukur juga menunjukkan derajat kekeliruan pengukuran yang tidak dapat
ditentukan dengan pasti melainkan hanya bisa di estimasi. Terdapat tiga metode estimasi
yaitu, metode test-retest atau tes ulang, alternate-forms atau tes paralel, dan split half atau
konsistensi internal. Adapun teknik pengukuran reliabilitas yaitu dengan formula Spearman-
Brown, formula Alpha Cronbach, formula-formula Kuder-Richardson, formula Rulon,
formula belah-dua dengan panjang berbeda, formula Kristof untuk belah-tiga, dan formula
Hoyt.

B. Penutup

Semoga dengan makalah ini dapat menambah pengetahuan pembaca tentang Reliabilitas
dan bermanfaat bagi kehidupan pembaca sehari-hari. Namun di sini kami menyadari bahwa
makalah ini masih jauh dari kata sempurna, oleh sebab itu kami mohon maaf atas kesalahan
yang terdapat dalam makalah ini. Untuk itu kami membutuhkan kritik dan saran dari
pembaca agar kami dapat memperbaiki kesalahan yang terdapat dalam makalah ini
kedepannya.

17
DAFTAR PUSTAKA

Allen, M.J., & Yen. IM. (1979). Introduction to Moesuremont Theory. Califomia: Brooks,
Cole Publishing Company.

Azwar, Saifuddin. (2003). Sikap Manusia Teori dan Pengukurannya. Yogyakarta: Pustaka
Pelajar.

Azwar, Saifuddin. (2019). Reliabilitas dan Validitas Edisi 4. Yogyakarta: Pustaka Pelajar.

Siregar, Syofian. (2014). Statistika Deskriptif untuk Penelitian: Dilengkapi Perhitungan


Manual dan Aplikasi SPSS Versi 17. Jakarta: PT RajaGrafindo Persada.

Sugiyono. (2006). Metode Penelitian Pendidikan, Pendekatan Kuantitatif, Kuantitatif dan


R&D. Bandung: Alfabeta.

Sugiyono. (2014). Statistika untuk Penelitian. Bandung: Alfabeta.

Sukadji, S. (2000). Menyusun dan Mengevaluasi Laporan Penelitian. Jakarta: UI-Press.

Suryabrata, Sumadi. (2000). Pemgembangan Alat Ukur Psikologis. Yogyakarta

http://rizkialdinata.blogspot.com/p/teori-skor-murni-klasik.html?m=1 diakses pada 15 Mei


2022

https://559840/mod_folder/content/0/PERTEMUAN%25204%2520RELIABILITAS
%2520INSTRUMEN%2520PENELITIAN.pdf diakses pada 15 Mei 2022

Anda mungkin juga menyukai