Anda di halaman 1dari 16

MAKALAH

PSIKOMETRI
Dosen Pengampu: Meike E. Hartati, S.H., S.Psi., M.Si.

Disusun Oleh:
Alisya Febrini Magdalena Korompis
20101109

PROGRAM STUDI PSIKOLOGI


FAKULTAS ILMU PENDIDIKAN
UNIVERSITAS NEGERI MANADO
2022
KATA PENGANTAR

Puji syukur saya panjatkan kehadirat Tuhan YME yang telah melimpahkan
rahmat dan hidayah-Nya kepada saya sehingga bisa menyelesaikan makalah
tentang Psikometri.
Tidak lupa juga saya mengucapkan terima kasih kepada semua pihak yang
telah turut membantu menyelesaikan makalah ini dan terima kasih kepada dosen
pengampuh mata kuliah ini khususnya dosen pengampuh untuk kelas C. Tentunya
makalah ini tidak akan bisa maksimal jika tidak mendapat dukungan dari berbagai
pihak.
Sebagai penyusun, saya menyadari bahwa masih terdapat kekurangan baik
dari penyusunan hingga tata bahasa penyampaian dalam makalah ini.
Oleh karena itu, saya dengan rendah hati menerima saran dan kritik dari
pembaca agar dapat memperbaiki makalah ini. Saya berharap semoga makalah
yang kami susun ini memberikan manfaat dan juga inspirasi untuk pembaca.

Penulis

Tomohon, 19 Maret 2022


DAFTAR ISI

KATA PENGANTAR ............................................................................................1


DAFTAR ISI ............................................................................................................2
BAB I PENDAHULUAN
A. LATAR BELAKANG
........................................................................................................................
3
........................................................................................................................
B. TUJUAN PENELITIAN
........................................................................................................................
4
BAB II PEMBAHASAN
A. PENGERTIAN RELIABILITAS...............................................................5
B. KOEFISIEN KORELASI...........................................................................6
C. JENIS-JENIS RELIABILITAS..................................................................7
D. RELIABILITAS YANG DIPERCEPAT...................................................11
E. KETERGANTUNGAN KOEFISIEN RELIABILITAS..........................11
F. KESALAHAN STANDAR PENGUKURAN............................................11
G. RELIABILITAS DITERAPKAN PADA TES DAN SKOR....................12
BAB III PENUTUP
A. KESIMPULAN
........................................................................................................................
14
B. SARAN
........................................................................................................................
14
DAFTAR PUSTAKA
BAB I
PENDAHULUAN
A. Latar Belakang
Salah satu aspek positif kemajuan dari dunia penelitian yang ada di Indonesia, adalah muncul
banyaknya para peneliti-peneliti muda yang kini lebih kritis lagi dalam meneliti objek-objek
yang ada. Di Indonesia, banyak sekali para peneliti ataupun bukan peneliti yang banyak
melakukan sebuah riset guna memenuhi tugas ataupun sebagai pembuktian dari sebuah kejadian.
Yang dimana setiap penelitian tersebut biasanya memerlukan sebuah pengujian agar nantinya
mampu menjadi sebuah hasil ilmiah yang benar-benar valid dan bersifat riel tanpa adanya
kebohongan ataupun ketidaknyataan yang mengesankan data yang diperoleh bersifat dibuat-buat.
Agar kajian kita bisa bersifat riel maka kita sebagai seorang peneliti harus menguji terlebih
dahulu hasil penelitian kita yang disebut dengan uji reabilitas.
Kebanyakan dari kita mengira bahwa jika kita mempunyai kesimpulan dari hasil penelitian
kita terhadap kejadian-kejadian yang terbatas, maka kesimpulan itu berlaku dengan sempurna
untuk seluruh kejadian yang sejenis. Perkiraan semacam itu sama sekali tidak benar dan sangat
menyesatkan (Sutrisno, 1981). Nah untuk menghindari hal-hal yang semacam itu maka kita
harus melakukan reabilitas, yang berguna untuk menunjukkaan kevalidtan dari hasil sebuah
penelitian yang kita lakukan.
Uji reliabilitas mampu menunjukkan tingkat kepercayaan terhadap sekor atau tingkat
kecocokan sekor dengan sekor sesungguhnya. Rebilitas ini bisa dicapai melalui tingkat
kecocokan di antara sekor pada lebih dari sekali pengukuran. Jika makin cocok dengan sekor
sesungguhnya maka makin tinggi tingkat reliabilitasnya. Kalaupun ada ketidakcocokan itu
merupakan kekeliruan yang acak. Jadi kemungkinan munculnya kesalahan masih tetap ada,
namun kemungkinan itu sangatlah kecit sekali dan tidak akan banyak berpengaruh terhadap hasil
akhir dari sebuah pengujian.

B. Tujuan Penelitian
Mengkonsep satu variable dengan jelas. Setiap pengukuran harus merujuk pada satu dan
hanya satu konsep /variable. Sebuah variable harus spesifik agar dapat menguragiintervensi
informasi dari variable lain. Menggunakan level pengukuran yang tepat. Semakin tinggi atau
semakin tepat level pengukuran, maka variable yang dibuat akan semakin reliable karena
informasi yang dimiliki semakin mendetail.
Prinsip dasarnya adalah mencoba melakukan pengukuran pada level paling tepat yang
mungkin diperoleh. Gunakan lebih dari satu indicator. Dengan adanya lebih dari satu
indikatoryang spesifik , peneliti dapat melakikan pengukuran dari range yang lebih luas
terhadapkonten definisi konseptual. Gunakan tes pilot, yakni dengan membuat satu atau lebih
draftatau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam
penggunaan pilot studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh
peneliti terdahulu dari literature-literatur yag berkaitan.
Selanjutnya, pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran
yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara
sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.
Pada konstruksi alat ukur, perhitungan reliabilitas berguna untuk melakukan perbaikan pada
alat ukur yang dikonstruksi. Dimana perbaikan alat ukur dilakukan melalui analisis butir untuk
mengetahui butir mana yang perlu diperbaiki. Namun pada pengukuran sesungguhnya,
perhitungan reliabilitas dilakukan untuk memberi informasi tentang kualitas sekor hasil ukur
kepada mereka yang memerlukannya. Tentunya perolehan tersebut bisa di jadikan acuan bagi
peneliti untuk menghasilkan penelitian yng bisa dipertanggung jawabkan di kemudian hari.
BAB II
PEMBAHASAN

A. Pengertian Reliabilitas
Reliabilitas, atau keandalan merupakan konsistensi dari serangkaian pengukuran atau
serangkaian alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes dengan
tes ulang akan memberikan hasil yang sama, atau untuk pengukuran yang lebih subjektif, apakah
dua orang penilai memberikan skor yang mirip (reliabilitas antar penilai).
Pada penelitian reliabilitas tak lepas dari ketergantungan (dependabiliti). Konsep
ketergantungan ini sangat berkaitan erat dengan keterandalan. Hasil dari pengujian awal
diharapkan akan konsisten dangan pengujian-pngujian berikutnya. Hasil selalu berupa numerik
dan tidak boleh berubah-ubah, karena merupakan karakteristik dari proses ukuran.
Reliabilitas selalu menunjukan keandalan instrument penelitian dalam berbagai bentuk,yakni
hasil pengujian yang sama jika dilakukan oleh orang yang berbeda (inter-penilai), hasil
pengujian yang sama jika dilakukan oleh orang yang sama dalam waktu berbeda (pengetesan
ulang),hasil pengujian yang sama jika dilakukan oleh orang yang berbeda dalam waktu yang
bersamaan dengan tes yang berbeda (bentuk pralel), dan hasil pengujian yang sama dengan
menggunakan berbagai pernyatan-pernyataan membangun (konsistensi internal).
Reliabilitas merupakan konsistensi skor yang dicapai oleh orang yang sama ketika mereka
diuji ulang dengan tes yang sama dalam kesempatan berbeda, atau dengan seperangkat item yang
ekuivalen, atau juga dapat berada dalam kondisi pengujian yang berbeda. Dalam pengertian luas,
reliabilitas tes menunjukkan sejauh mana perbedaan-perbedaan individu dalam skor tes dapat
dianggap sebagai penyebab dari perbedaan atau penyebab dari kesalahan dalam pencarian
peluang. Dewasa ini, para psikolog menerima variabilitas sebagai segi instrinsik semua perilaku
dan berusaha menyelidiki serta memilah banyak sumber variabilitas semacam itu.
Reliabilitas skor bergantung pada definisi varian kesalahan. Faktor-faktor yang dapat
dianggap sebagai varian kesalahan untuk satu tujuan dapat dianggap sebagai varian kebenaran
dalam tujuan lain. Contoh, jika kita ingin mengukur fluktuasi suasana hati, maka perubahan dari
hari ke hari pada skor kegembiraan-depresi akan relevan bagi maksud tes ini dan karenanya,
akan menjadi bagian dari varian kebenaran skor yang ada.
Setiap tes seharusnya didampingi oleh pernyataan reliabilitas. Ketika penguji berusaha
mempertahankan kondisi-kondisi pengetesan dengan mengendalikan lingkungan pengetesan,
instruksi, batas waktu, rapport, dan faktor lainnya, mereka berusaha mengurangi varian
kesalahan dan membuat skor-skor tes lebih dapat dipercaya. Meskipun telah dikondisikan tes
dengan kondisi pengetesan maksimum, tak satu tes pun dapat dipercaya seratus persen.
Karena semua jenis reliabilitas menyangkut derajat konsistensi atau kesepakatan antara dua
perangkat skor yang diturunkan secara independen, semua jenis reliabilitas dapat diungkapkan
dalam istilah koefisien korelasi.

B. KOEFISIEN KORELASI
Koefisien korelasi menyatakan derajat kesesuaian atau hubungan antara dua perangkat skor.
Dengan demikian, jika individu dengan skor tertinggi pada variabel 1 juga mendapatkan skor
tertinggi pada varabel 2. Individu nomor dua terbaik pada variabel 1 juga nomor dua terbaik pada
variabel 2, dan seterusnya, sampai dengan individu yang memiliki skor terendah. Akan ada
korelasi sempurna antara variabel 1 dan 2. Korelasi seperti ini akan memiliki nilai +1,00.
Korelasi nol menunjukkan tidak adanya hubungan sama sekali, sebagaimana hal ini dapat
terjadi karena adanya peluang. Jika setiap sampel diperoleh secara acak untuk menentukan
variabel 1 dan variabel 2, maka korelasi nol atau mendekati- nol akan terjadi. Dalam kondisi ini,
akan mustahil memprediksi posisi relatif individu dakan variabel 2 berdasarkan pengetahuannya
mengenai variabel 1. Orang dengan skor tertinggi pada variabel 1 mungkins aja memiliki skor
yang berbeda dengan variabel 2.
Koefisien korelasi bisa dihitung dengan berbagai cara, tergantung pada hakikat data. Yang
paling umum adalah koefisien korelasi produk-momen Pearson. Koefisien korelasi ini tidak
hanya mempertimbangkan posisi orang dalam kelompok, namun juga besar simpangannya di
atas atau di bawah rata-rata kelompok. Bila posisi tiap orang dinyatakan dalam kaitan-kaitan skor
standar, orang yang ada di atas rata-rata akan menerima skor standar positif, sementara yang ada
di bawah rata-rata akan menerima skor negatif.
Dalam praktik sesungguhnya tidak mutlak perlu adanya konversi setiap raw score ke dalam
skor standar sebelum menemukan hasil silangnyam karena konversi ini bisa dibuat sekali untuks
elamanya setelah hasil silang ditambahkan.
SIGNIFIKANSI STATISTIK
Dalam riset psikologis biasanya kita tertarik untuk melakukan generalisasi di atas sampel
particular individu yang di tes sampai populasi yang diwakili sampel itu. Contoh:
Kita mungkin ingin tahu apakah matematika dan kemampuan membaca punya korelasi
diantara anak-anak sekolah Amerika yang usianya sama seperti anak-anak sekolah yang kita tes.
Yang jelas, 10 kasus misalnya, yang sungguh-sungguh di tes tidak akan merupakan sampel yang
memadai untuk generalisasi bagi populasi seluas itu. Sa,pel berukuran sama lainnya, yang dapat
dibandingkan akan menghasilkan koreasi yang jauh lebih rendah atau lebih tinggi.
Ada prosedur statistic untuk memperkirakan fluktuasi yang mungkin untuk bisa diharapakan
dari sampel ke sampel dalam ukuran dari korelasi, rata-rata, simpangan baku, dan ukuran-ukuran
kelompok lain manapun. Ketika kita mengatakan bahwa korelasi itu “signifikan pada tingkat 1%
(0,01)”, kita memaksudkan bahwa peluang-peluangnya tidak lebih besar daripada 1 dari 100
sehingga korelasi populasinya 0.
Tingkat signifikansi merujuk pada resiko kesalahan yang hendak kita tanggung dalam
menarik kesimpulan dari data kita. Selama bertahun-tahun, tingkat signifikansi merupakan cara
tradisional untuk mengevaluasi korelasi. Namun, sudah mulai disadari bahwa prosedur ini
memiliki kekurangan dan cacah, korelasi yang tinggipun bahkan gagal memenuhi “tes
signifikansi”.
Pendekatan lain yang semakin mendapat perhatian mempertimbangkan besaran actual
korelasi yang didapatkan dan memperkirakan “interval kepercayaan” di dalam korelasi populasi
kemungkinan jatuh pada tingkat kepercayaan yang spesifik. (lihat, misalnya Carver 1993). Tren
terhadap interval kepecayaan sebagai suplemen dan bukan pengganti untuk pengetesan
signifikansi, membayang-bayangi pergeseran penting dalam analisis atas koefisien korelasi
dalam tahun-tahun mendatang.
KOEFISIEN RELIABILITAS
Koefisien korelasi telah digunakan dalam analisis data psikometrik. Pengukuran reliabilitas
tes mewakili satu aplikasi koefisien-koefisien seperti ini. Contoh sebuah koefisien reliabilitas
yang dihitung oleh metode produk momen Pearson, (grafik 4-3 Hal:101). Dalam kasus ini, skor-
skor 104 orang pada bentuk-bentuk ekuivalen dari tes-tes World Fluency2 memiliki korelasi.
Dalam satu bentuk, para peserta tes diberi waktu 5 menit untuk menulis sebanyak mungkin kata-
kata yang dimulai dengan sebuah surat yang ada. Bentuk kedua sama, kecuali surat lain yang
digunakan. Dua surat ini dipilih oleh para penulis tes karena untuk maksud ini kesulitannya
hamper sama. Koralasi antara jumlah kata-kata yang tertulis dalam dua bentuk tes ini adalah
0,72. Korelasi ini tinggi dan signifikan pada tingkat 0,01.

C. JENIS-JENIS RELIABILITAS
Reliabilitas Tes-Retes
Metode paling jelas untuk menemukan reliabilitas skor tes ialah dengan mengulang tes yang
sama pada kesempatan kedua. Koefisien reliabilitas dalam kasus ini hanyalah korelasi antara
skor-skor yang didapatkan oleh orang yang sama pada dua penyelenggaraan tes. Varian
kesalahan berhubungan dengan fluktuasi acak kinerja dari satu kesempatan tes ke kesempatan
lainnya.
Variasi-variasi ini sebagian diakibatkan dari kondisi pengetesan yang tidak terkontrol seperti
perubahan eksterm pada cuaca, ujung pensil yang patah, dan lain-lain. Di samping itu juga
terdapat variasi-variasi yang muncul dari peserta tes itu sendiri, seperti sakit, letih, ketegangan
emosi, kecemasan, dan lain-lain. Reliabilitas tes ulang menunjukkan sejauh mana skor pada tes
dapat digeneralisasikan untuk berbagai kesempatan yang berbeda, makin tinggi reliabilitasnya,
makin rentanlah skor terhadap perubahan sehari-hari yang acak dalam kondisi peserta tes atau
lingkungan pengetesan.
Meskipun tampak sederhana dan blak - blakan, teknik tes dan tes ulang menampilkan
berbagai kesulitan ketika diterapkan pada kebanyakan tes psikologis. Praktik mungkin akan
menghasilkan kadar perbaikan yang bervariasi dalam skor-skor retes individu yang berbeda.
Akan tetapi, untuk sebagian besar tes-tes psikologis, pengetesan ulang (retes) dengan tes yang
sama bukanlah teknik yang tepat untuk menemukan koefisien reliabilitas.
Reliabilitas Bentuk-Alternatif
Satu cara untuk menghindari kesulitan yang ditemukan dalam reliabilitas tes dan tes ulang
adalah melalui penggunaan bentuk-bentuk tes lainnya. Dengan demikian, orang yang sama bisa
dites dengan satu bentuk pada kesempatan kedua. Korelasi antara skor-skor yang didapatkan
pada dua bentuk itu merupakan keofisien reliabilitas tes. Perlu dicatat bahwa koefisien
reliabilitas semacam itu adalah ukuran stabilitas temporal dan konsistensi respons terhadap
berbagai butir soal contoh (bentuk-bentuk tes). Dengan begitu, koefisien ini menggabungkan dua
jenis reliabilitas. Akan tetapi, karena dua jenis ini penting bagi kebanyakan maksud pengetesan,
reliabilitas bentuk-alternatif memberikan ukuran yang berguna untuk mengevaluasi banyak tes.
Seperti reliabilitas retes, reliabilitas bentuk-alternatif seharusnya selalu disertai oleh
pernyataan tentang panjang interval antara penyelenggaraan tes, dan juga deskripsi pengalaman-
pengalaman relevan yang memengaruhi. Jika kedua bentuk itu diselenggarakan langsung
berturut-turut, korelasi yang dihasilkan menunjukan reliabilitas antara bentuk-bentuk saja, bukan
antara peristiwa-peristiwa. Varian kesalahan dalam kasus ini merepresentasikan fluktuasi dalam
kinerja dari satu perangkat soal ke perangkat lain, tetapi tidak merepresentasikan fluktuasi
sepanjang waktu.
Dalam pengembangan bentuk-bentuk alternative, tentu saja harus dicurahkan perhatian untuk
memastikan bahwa, bentuk-bentuk itu betul-betul parallel. Secara mendasar, bentuk-bentuk
paralel tes seharusnya merupakan tes-tes yang disusun secara mandiri untuk memenuhi
spesifikasi yang sama. Tes-tes ini seharusnya berisi jumlah soal yang sama dan seharusnya
mencakup jenis isi yang sama. Kisaran dan tingkat kesulitan soal-soal ini seharusnya juga sama.
Instruksi, batas waktu, contoh-contoh ilustratif, format, dan semua aspek tes lain harus dicek
dalam hal ekuivalensinya.
Reliabilitas Belah-Separuh (Split-half Reliability)
Dari penyelenggaraan tunggal atas satu bentuk tes, mungkin untuk mencapai ukuran
reliabilitas lewat berbagai prosedur belah-separuh. Dengan cara ini, dua skor didapatkan untuk
setiap orang dengan membagi tes menjadi paruhan-paruhan yang ekuivalen. Tampak bahwa
reliabilitas belah-separuh merupakan ukuran yang konsisten dalam kaitan dengan sampling isi.
Stabilitas sementara skor-skor tidak masuk dalam reliabilitas semacam itu, karena hanya ada satu
kesempatan tes. Jenis reliabilitas ini kadang kala disebut koefisien konsistensi internal, karena
hanya dibutuhkan penyelenggaraan tunggal atas satu bentuk tes.
Untuk mendapatkan reliabilitas belah-separuh, masalah pertama adalah bagaimana membagi
tes dalam rangka mendapatkan paruhan-paruhan yang paling ekuivalen. Tes apa pun bisa dibagi
dengan berbagai cara. Dalam kebanyakan tes, paruhan yang pertama dan paruhan kedua tidak
akan ekuivalen, tergantung pada perbedaan dan tingkat kesulitan soal, dan juga efek-efek
kumulatif pemanasan, praktik, keletihan, kebosanan, dan banyak factor lain yang berbeda-beda
dari awal sampai akhir tes. Prosedur yang memadai bagi kebanyakan maksud adalah
mendapatkan skor pada soal-soal genap dan ganjil dari tes. Jika soal-soal ini aslinya diatur
menurut tingkat kesulitan yang kurang lebih sama, pembagian seperti itu akan menghasilkan
skor-separuh yang hampir ekuivalen. Satu hal yang perlu diwaspadai dalam membuat pemisahan
ganjil-genap seperti itu berkaitan dengan kelompok-kelompok butir soal yang berhadapan
dengan satu masalah, seperti pertanyaan-pertanyaan yang merujuk pada diagram mekanis
tertentu atau halaman tertentu dalam tes membaca. Dalam kasus ini, seluruh kelompok soal
seharusnya tetap disatukan dengan satu atau separuh lainnya. Seandainya soal-soal dalam
kelompok semacam ini harus ditempatkan dalam paruhan-paruhan tes yang berbeda dari tes,
kesamaan skor-skor paruhan akan dibesar-besarkan, karena kesalahan tunggal apa pun dalam
memahami masalah ini akan memengaruhi soal-soal dalam kedua paruhan.
Begitu dua skor-paruhan ini didapatkan untuk tiap orang, skor-skor ini bisa dikorelasikan
dengan metode yang biasa. Akan tetapi, seharusnya dicatat bahwa korelasi ini sesungguhnya
memberikan reliabilitas dari separuh-tes saja. Contohnya, jika seluruh tes terdiri dari 100 butir
soal, korelasinya dihitung antara dua perangkat skor yang masing-masing didasarkan pada 50
soal. Di pihak lain, dalam reliabilitas tes-retes dan reliabilitas bentuk alternative, tiap skor
didasarkan pada jumlah soal penuh pada tes.
Jika semuaa hal sama, semakin panjang tes, semakin dapat diandalkan tes itu. Masuk akal
jika kita berekspektasi bahwa, dengan sampel perilaku lebih besar, kita akan sampai pada ukuran
lebih memadai dan lebih konsisten. Efek yang akan dihasilkan pada koefisiennya dengan
memperpanjang atau memperpendek tes, dapat diperkirakan dengan rumus Spearman-Brown,
seperti berikut:
nrtt
rnm =
1+ ( n−1 ) rtt

dimana rnm adalah koefisien yang diperkirakan , rnm adalah koefisien yang diperoleh, dan n adalah
jumlah waktu tes itu diperpanjang atau diperpendek. Jadi, jika jumlah soal tes ditingkatkan dari
25 menjadi 100, n adalah 4; jika diturunkan dari 60 ke 30, n adalah ½. Rumus Spearman-Brown
digunakan secara luas dalam menghitung reliabilitas dalam bentuk ini. Ketika diterapkan pada
reliabilitas belah-separuh, rumus ini selalu melibatkan penggandaan panjang tes. Dalam kondisi
ini, rumus itu dapat disederhanakan sebagai berikut:
2 r bb
rtt =
1+ r bb

untuk rbb adalah korelasi dari tes-tes paruhan.


Metode alternatif untuk mendapatkan reliabilitas belah-separuh dikembangkan oleh
Rulon (1939). Hanya dibutuhkan varian dari perbedaan antara skor-skor tiap orang pada dua tes-
2 2
tes separuh (SD ) dan varian skor total ( SD ) dua nilai ini disubstitusikan dalam rumus
d x
berikut, yang menghasilkan reliabilitas seluruh tes secara langsung :

SD 2
d
rtt = 1-
SD 2
x

menarik untuk memperhatikan hubungan rumus ini dengan definisi varian kesalahan. Perbedaan
apa pun antara skor-skor seseorang pada dua tes paruhan menampilkan varian kesalahan atau
varian yang tidak relevan. Varian-varian perbedaan-perbedaan ini, dibagi dengan varian skor-
skor total, memberikan proporsi varian kesalahan dalam skor-skor itu. Ketika varian skor ini
dikurangkan dari 1,00, hasilnya adalah proporsi varian “benar” untuk penggunaan tes tertentu,
yang sama dengan koefisien reliabilitas.
Reliabilitas Kuder-Richardson dan Koefisien Alpha
Metode keempat untuk mendapatkan reliabilitas, yang juga menggunakan administrasi
tunggal dari suatu bentuk tunggal, didasarkan pada konsistensi respons terhadap semua butir soal
dalam tes. Konsistensi antarsoal ini dipengaruhi oleh dua sumber varian kesalahan: (1)
pencuplikan isi ( sebagaimana dalam bentuk alternatif dan reliabilitas belah-separuh); (2)
heterogenitas dari domain perilaku yang disampelkan. Semakin homogeny domainnya, semakin
tinggilah konsistensi antarsoal. Contoh , jika suatu tes mencakup soal perkalian saja, sementara
yang lain memuat soal-soal pertambahan, pengurangan, perkalian dan pembagian tes terdahulu
barangkali akan menunjukan lebih banyak konsistensi antarsoal daripada yang kedua tersebut.
Dalam tes kedua, yang lebih heterogen, satu peserta tes bisa menunjukkan kinerja lebih baik
dalam pengurangan daripada dalam operasi aritmetik lainnya, sedangkan peserta tes lainnya bisa
mencapai skor yang relative baik pada tes pembagian, tetapi kurang baik pada penambahan,
pengurangan, dan perkalian, dan seterusnya. Sampel yang lebih ekstrem akan ditunjukkan oleh
tes terdiri dari 40 soal kosakata, yang kontras dengan tes yang terdiri dari 10 kosakata, 10
hubungan ruang, 10 penalaran aritmetik, dan 10 soal kecepatan persepsi. Dalam tes kedua,
barangkali tidak ada atau ada sedikit hubungan antara kinerja individu pada berbagai jenis soal.
Tampak bahwa skor tes akan menjadi kurang ambigu bila berasal dari tes-tes yang relatif
homogeny. Andaikan dalam tes 40 soal amat heterogen yang dikutip sebelumnya, baik smith
maupun jones mendapatkan nilai 20. Bisakah kita menyimpulkan bahwa kinerja keduanya pada
tes ini sama? Sama sekali tidak. Smith mungkin telah menyelesaikan 10 soal kosakata dengan
benar, 10 soal kecepatan persepsi dan tidak satupun soal penalaran aritmetik dan hubungan
ruang. Sebaliknya, jones mungkin telah menerima skor 20 dengan menyelesaikan 5 soal
kecepatan persepsi, 5 hubungan ruang, 10 penalaran aritmetik, dan tidak satupun soal kosakata.
Banyak kombinasi lain yang jelas bisa menghasilkan skor total sama 20. Skor ini akan
memiliki arti yang berbeda jika didapatkan lewat kombinasi soal-soal yang tidak sama. Dalam
tes kosakata yang relatif homogeny, di pihak lain, skor 20 barangkali akan berarti bahwa peserta
tes telah berhasil dengan 20 kata pertama, jika soal-soalnya diatur dalam tingkat kesulitan yang
meningkat. Ia bisa gagal pada dua atau tiga kata lebih mudah dan dengan tepat memberikan
respons pada dua atau tiga soal lebih sulit di atas kata ke-20 ,tetapi variasi individu seperti ini
agak berbeda dalam perbandingan dengan variasi yang ditemukan dalam tes yang lebih
heterogen.
Pertanyaan yang amat relevan dalam kaitan ini adalah apakah criteria yang sedang
diprediksi oleh tes itu pada dirinya sendiri relatif homogen atau heterogen. Meskipun tes-tes
homogeny lebih disukai karena skor-skornya memungkinkan interpretasi yang agak tidak
ambisius, tes homogen jelas bukan predictor yang memadai menurut criteria yang amat
heterogen. Lagi pula, dalam prediksi yang punya criteria heterogen, heterogenitas soal-soal tes
tidak akan dengan sendirinya mewakili varian kesalahan. Tes-tes inteligensi tradisional
memberikan contoh yang baik tentang tes-tes heterogen yang dirancang untuk memprediksi
criteria heterogen. Akan tetapi, dalam kasus semacam ini, mungkin lebih baik menyusun
berbagai tes yang relatif homogeny, masing-masing mengukur berbagai fase criteria heterogen.
Jadi, interpretasi tidak ambigu atas skor-skor tes bisa dipadukan dengan cakupan criteria yang
memadai.
D. RELIABILITAS YANG DIPERCEPAT
E. KETERGANTUNGAN KOEFISIEN RELIABILITAS
F. KESALAHAN STANDAR PENGUKURAN
Interpretasi Skor-skor Individu (Standard Error of Measurement)
SEM lebih banyak digunakan dalam pengetesan daripada koefisien reliabilitas. Kesalahan
pengukuran standar bisa dihitung dengan rumus berikut:
SEM = SDt √ 1−r tt

SDt = simpangan baku skor tes


rtt = koefisien reliabilitas
Misalnya, jika IQ simpangan pada tes inteligensi tertentu memiliki simpangan baku 15 dan
koefisien reliabilitas 0,89, SEM IQ pada tes ini adalah: 15√ t−0 , 89tt = 15 √ 0 , 11 = 15 (0,33) = 5.

Kesalahan standar pengukuran dan koefisien reliabilitas merupakan cara-cara alternatif


untuk mengungkapkan reliabilitas tes. Tidak seperti koefisien reliabilitas, kesalahan pengukuran
bersifat independen terhadap variabilitas kelompok berdasarkan kesalahan pengukuran
dihitung.Untuk menginterpretasikan skor individu, kesalahan standar pengukuran merupakan alat
yang lebih tepat.
Akan tetapi, perbedaan dalam koefisien-koefisien reliabilitas maupun kesalahan-
kesalahan pengukuran tidak bisa diandaikan tetap konstan ketika tingkat kemampuan sangat
bervariasi. SEM memberikan perlindungan terhadap penekanan yang tidak tepat pada skor
numerik tunggal.
Interpretasi Perbedaan Skor
Tiap skor dapat berfluktuasi, yang berfungsi sebagai alat pemeriksa penekanan yang
ebrlebihan pada perbedaan-perbedaan kecil antara skor-skor. Sikap hati-hati seperti ini perlu ada,
baik bila membandingkan skor tes dari orang yang berbeda maupun ketika membandingkan skor
tes dari orang yang berbeda maupun ketika membandingkan skor individu yang sama dalam
kemampuan yang berbeda. Pertanyaan yang sering diajukan tentang skor-skor tes berhubungan
dengan posisi relatif individu pada berbagai area.
Perbedaan yang ada dipengaruhi oleh kesalahan-kesalahan peluang yang ada dalam suatu
skor. Kesalahan standar tentang perbedaan antara dua skor dapat ditemukan dari kesalahan
standar perbedaan antara dua skor dan SEM 1 dan SEM2 adalah kesalahan standar dari
pengukuran skor-skor yang terpisah.

SEdiff = SD √ 2−r 11-r22

Dengan mengganti SD√ 1−r 11 untuk SEM1 dan SD√ 1−r 22 untuk SEM2, kita dapat menuliskan
rumus ini kembali secara langsung dalam kaitan dengan koefisien reliabilitas, sebagai berikut:
Dalam substitusi ini, SD yang sama digunakan untuk tes 1 dan 1, karena skor-skornya harus
diungkapkan dalam kaitan dengan skala yang sama sebelum dibandingkan. Hal ini terdapat
dalam tes WAIS-R.

G. RELIABILITAS DITERAPKAN PADA TES PENGUASAAN DAN SKOR


POTONG
Implikasi utama dari pengetesan penguasaan adalah reduksi dalam variabilitas skor-skor di
kalangan individu. Setiap korelasi yang ada, termasuk koefisien-koefisien reliabilitas,
dipengaruhi oleh variabilitas kelompok tempat koefisien itu dihitung. Bila reliabilitas sampel
menurun, koefisien korelasinya akan turut menurun.
Dalam praktik sesungguhnya, tes-tes ini digunakan untuk membedakan antara orang yang
memiliki dan orang yang tidak memiliki keterampilan dan pengetahuan yang dibutuhkan untuk
aktivitas tertentu. Tujuan khusus pengadaan tes ini dapat sangat bervariasi, dari memperoleh izin
mengemudi atau penugasan pada pekerjaan khusus tertentu sampai maju ke unit berikut dalam
program pengajaran yang dibuat khusus untuk individu atau penerimaan pada program belajar
tertentu.
BAB III
PENUTUP

A. Kesimpulan
Dengan uji reliabilitas maka penelitian yang dihasilkan akan memiliki sebuah mutu yang
berkualitas. Karena penelitian yang sudah melalui uji penelitian sudah dianggap bagus dan
memenuhi standart.

Berikut adalah jenis-jenis uji reliabilitas yang dibagi menjadi 3 jenis yaitu :
1. Reliabilitas Stabil (Stability Reliability)
2. Reliabilitas Terwakili (Representative Reliability)
3. Reliabilitas Seimbang (Equivalence Reliability)

Ada tiga teknik dasar yang dapat diterapkan oleh peneliti dalam menguji Reliabilitas suatu
penelitian yaitu:
1. Teknik pengukuran ulang (test-retest)
2. Teknik belah dua
3. Teknik paralel (equivalent form)

Ada dua Peranan Koefisien Reliabilitas yaitu :


1. Reliabilitas pada Gabungan Sekor (Komposit)
2. Reliabilitas pada Selisih Sekor

Didalam pengujian sebuah hasil penelitian juga diperlukan sebuah rumus-rumus untuk
menunjukkan bahwa hasil penelitian yang kita lakukan valid dan dapat dipertanggung jawabkan.

B. Saran
Semoga dengan adanya makalah ini mampu membantu para peneliti dalam pengujian setiap
hasil penelitian yang dilakukannya.
Dan diharapkan dengan adanya makalah ini tidak hanya berguna bagi para peneliti saja,
namun bagi semua khalayak umum yang dimana mampu menunjang dalam hal pendidikan dan
sosial.

DAFTAR PUSTAKA
https://www.psikologimultitalent.com/2016/07/memahami-konsep-reliabilitas-dalam.html
https://www.semestapsikometrika.com/2017/07/reliabilitas.html
https://dokumen.tips/documents/makalah-psikometri.html

Anda mungkin juga menyukai