Anda di halaman 1dari 17

TUGAS AKHIR PSIKOMETRI

Dosen Pengampu : Prof. Dr. Augustinus Supratiknya

Disusun oleh :
Veronica Fortuna Wilhelmina F. / 179114016
Veronica Hani Mutiara Palupi / 179114017

FAKULTAS PSIKOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2019
BAB I

PENDAHULUAN

A. Apa itu psikometri atau pengukuran psikologis


Menurut Kamus Besar Bahasa Indonesia (2005), kata “mengukur” memiliki
makna “menghitung ukurannya (panjang, besar, luas, tinggi, dsb) dengan alat tertentu”.
Dari kepustakaan psikologi, kita menemukan beberapa definisi kata pengukuran sebagai
berikut. Berikut adalah definisi yang dikemukakan oleh salah seorang pioneer
pengembangan pengukuran psikologis “the assignment of numerals to object or events
according to rules”. Dapat disimpulkan bahawa pengukuran adalah pemberian suatu
tanda bilangan pada ssebuah objek atau peristiwa menurut aturan tertentu. Pengukuran
terdiri atas beberapa aturan untuk menandakan bilangan pada suatu objek dengan cara
dan aturan tertentu, untuk mengungkapkan kuantitas dari aneka atribut yang tersedia.
Pengukuran juga dapat diartikan sebagai penetapan angka atau bilangan pada individu-
individu secara sistematis, guna mengungkapkan aneka ciri dari individu-individu yang
berkaitan.

B. Tes sebagai instrument atau pengukuran psikologis


Salah satu bentuk alat dalam pengukuran psikologis adalah tes psikologis atau
psikotes yang secara singkat disebut tes. Psikotes atau tes sudah identik dengan
psikometri atau pengukuran psikologis. Selain itu, akibat pesatnya perkembangan
layanan psikotes pada masa ini, data hasil asesmen dengan psikotes dapat digunakan
sebagai dasar untuk menetapkan diagnosis, prognosis, dan intervensi dalam terapi
psikiatris.

C. Ciri tes yang baik :


1. Segi desain :
a. Tujuan
Tujuan tes mencakup tiga hal
- Atribut psikologis yang hendak diukur : hal ini berkaitan dengan domain
atau bidang yang ingin diteliti yaitu dimensi kepribadian atau wilayah perilaku
yang menjadi fokus atau sasaran tes.
- Populasi subjek yang akan dikenai tes : hal ini berkaitan dengan audience
atau masyarakat yaitu populasi subjek yang akan menjadi sasaran pengetesan
dalam arti masyarakat yang dikenai tes.
- Jenis skor : skor hasil tes dapat digunakan dengan berbagai cara seperti dalam
norma referenced scoring atau penskoran yang mengacu pada norma, skor tes
digunakan untuk membandingkan kinerja relatif individu dengan
kelompoknya. Dalam criterion-referenced scoring atau penskoran yang
mengacu pada kriteria, skor tes digunakan untuk membandingkan kinerja
individu dengan kriteria absolut untuk menunjukkan taraf penguasaan atau
taraf kepemilikan atas atribut psikologis tertentu secara absolut. Dalam
penskoran normatif , skor tes digunakan untuk menunjukkan taraf penguasaan
at au taraf kepemilikan individu atas suatu atribut psikologis tes yang
dimaksudkan untuk mengukur sebuah atribut psikologis tunggal tertentu.
Dalam penskoran ipsatif, skor tes digunakan untuk menunjukkan taraf
penguasaan atau taraf pemilikan relatif individu atas suatu atribut psikolgis
dibandingkan dengan taraf penguasaan atau taraf pemilikannya atas satu atau
lebih atribut psikologis lain dalam tes yang dimaksudkan untuk mengukur
lebih dari satu atribut psikolgis secara serentak atau bersamaan. Jenis skor
yang hendak digunakan harus dirumuskan secara jelas sejak awal dalam
konstruksi atau pengembangan tes.

b. Ranah isi yang jelas dan baku


Content atau isi tes psikologis menunjuk pada kumpulan tingkah laku,
pengetahuan, keterampilan, abilitas, sikap, atau karakteristik lain yang hendak
diukur oleh tes. Isi yang dimaksud biasanya dijelaskan dalam sebuah tabel
spesifikasi yang rinci serta dipilih ke dalam kategori-kategori antara lain untuk
memudahkan pengelompokkan item-itemnya
c. Prosedur Administrasi Baku
Prosedur administrasi tes biasanya dituangkan dalam manual atau buku
instruksi tes, berupa aneka petunjuk bagi testi dan bermacam pedoman tentang
kondisi pelaksanaan tes. Petunjuk bagi testi mencakup cara testi memberikan
respon, jenis bantuan yang boleh diberikan kepada testi jika mereka tidak
memahami pertanyaan atau tugas, cara testi mengubah atau membetulkan respon
yang keliru, dan waktu pengerjaan tes. Kondisi pelaksanaan tes mencakup
pedoman tentang pengaturan pencahayaan dan keheningan ruangan tempat tes
dilaksanakan.

d. Prosedur Penskoran Baku


Manual atau buku instruksi tes juga memuat uraian yang rinci dan jelas
tentang cara perhitungan dan melaporkan hasil tes. Pembakuan prosedur
penskoran ini digunakan untuk menjamin ketepatan penskoran dan pelaporan
hasil tes. Penskoran tes dapat dilaksanakan dengan menggunakan mesin, atau
dilakukan secara manual oleh petugas. Jika dilakukan oleh mesin, maka ketepatan
kerja mesin harus terjamin. Jika dilakukan oleh petugas, maka petugas harus
bebar-benar terlatih. (AERA, APA, & NCME, 1999).

2. Segi Psikometrik
a. Statistik Item
 Taraf kesukaran item : tes yang baik apabila memiliki taraf kesukaran
dalam kisaran nilai Pi (proporsi penjawan benar 0,30-0,70, jika nilai yang
diperoleh sebesar 1,0 berarti testi menjawab item dengan benar dan dapat
dikatakan taraf kesukaran item tersebut rendah. Jika nilai yang diperoleh
0 berarti testi tidak mampu menjawab item tersebut. Dan dapat dikatakan
item tersebut tidak efektif karena tidak dapat membedakan taraf
pemilikan atribut yang sedang diukur.
 Daya diskriminasi item : kefektivan item dalam membedakan testi yang
secara relative menempati posisi tinggi dan testi yang relative menempati
posisi rendah dalam atribut psikologis yang menjadi objek pengukuran.
Dapat dikatakan menjadi tes yang baik jika fungsi item sejalan dengan
fungsi tes, dapat dilihat dari tabel reliabilitas bagian corrected item-total
correlation serta menunjukkan hasil yang positif dan dengan kriteria 0,2-
0,3.
 Efektivitas distraktor : muncul pada item dengan format pilihan ganda.
Pada format pilihan ganda akan terdapat jawaban yang paling benar juga
ada jawaban yang kurang benar atau salah. Jawaban yang kurang benar
atau salah inilah disebut distraktor. Sebuah tes dapat dikatakan baik jika
efektivitas distraktor berjalan efektif maksudnya perannya harus mampu
menarik perhatian testi untuk memilihnya. Efektivitas distraktor
dievaluasi dengan melihat presentase testi yang memilih masing-masing
opsi yang salah dalam menjawab item.

b. Statistik Tes
 Reliabilitas : konsistensi hasil pengukuran jika prosedur pengetesannya
dilakukan secara berulangkali terhadap suatu populasi individu atau
kelompok. (AERA, APA, & NCME, 1999)
 Validitas : kualitas esensial yang menunjukkan sejauh mana suatu tes
sungguh-sungguh mengukur atribut psikologis yang hendak diukurnya.
 Daya diskriminasi tes : salah satu statistik yang direkomendasikan untuk
memeriksa daya diskriminasi tes adalah koefisien diskriminasi yang
disebut ferguson’s delta. Delta ferguson didasarkan pada penjenjangan
subjek sehingga koefisien diskriminasi menunjukkan seberapa cermat dan
konsisten sebuah tes menjenjangkan testi sepasang demi sepasang dalam
hal atribut psikologis yang diukur. Penjenjangan subjek didasarkan pada
perbedaan dari pada kesamaan skor di antara mereka.
BAB II

ANALiSIS ITEM

A. Pengertian
Analisis item merupakan proses untuk memeriksa ciri-ciri statistik respon testi
dalam uji coba yang sesungguhnya terhadap masing-masing item untuk keperluan seleksi
item, yaitu berguna untuk memutuskan item mana yang dapat memenuhi syarat untuk
dimasukkan dalam rupa final tes, mana yang harus direvisi terlebih dahulu dan diuji
kembali sebelum akhirnya dimasukkan dalam bentuk final tes, serta dapat secara
langsung dieliminasi karena mempunyai ciri-ciri statistik yang tidak sesuai dengan
persyaratan.

B. Tiga Parameter Item dengan contoh data tes Berhitung.


1. Taraf Kesukaran Item
Taraf kesukaran item bisa diketahui berdasarkan nilainya. Nilai 𝑝𝑖 diperoleh dari
Mean skor item yang merepresentasikan jumlah testi yang menjawab sesuai dengan
kunci jawaban yang disediakan. Nilai 𝑝𝑖 berada dalam rentang nilai 0,00 - 1,00.
Apabila nilai 𝑝𝑖 semakin besar artinya semakin banyak testi yang menjawab item
sesuai kunci jawaban, sehingga item tersebut mempunyai taraf kesukaran yang kecil,
dan jika nilai 𝑝𝑖 semakin kecil maka semakin sedikit pula testi yang menjawab item
dengan tepat sehingga dapat dikatakan item tersebut memiliki taraf kesukaran yang
tinggi. Taraf kesukaran item dikatakan baik ketika besaran pi berada di rentang 0,30-
0,70.
Berdasarkan hasil data, jumlah testi yang mampu menjawab item dengan benar
sebanyak 37 testi sedangkan testi yang tidak mampu menjawab item dengan benar
sebanyak 3 testi. Hal ini berarti soal yang ada dalam tes mempunyai taraf kesukaran
yang baik karena memiliki mean sesuai dengan kriteria.

2. Daya Diskriminasi Item


Daya diskriminasi item merupakan sebuah keefektivan item untuk membedakan
testi yang berada pada posisi rendah serta testi yang berada pada posisi tinggi dalam
atribut psikologis yang dijadikan sebagai objek pengukuran. Oleh karena itu, item
bisa menjadi penentu skor yang didapatkan testi untuk memperlihatkan posisi testi
yang diukur berdasarkan perolehan total yang didapatkan oleh testi.
Daya diskriminasi item dapat dikoreksi dengan cara melihat korelasi per item
dengan jumlah total hasil (Rit). Manfaat item selaras dengan fungsi tes apabila hasil
corrected item total correlation memperlihatkan hasil positif serta berada pada
rentang angka 0,2 dan 0,3.

3. Efektivitas Distraktor
Dalam analisis efektivitas distraktor dapat dievaluasi menurut persentase testi
yang menjawab opsi salah dalam menjawab item. Dalam hal ini sebuah distraktor
dikatakan efektif apabila memiliki persentase yang tinggi.
Berdasarkan hasil data yang telah didapatkan terlihat bahwa distraktor yang
dihasilkan sebanyak 30 item yang tidak baik dan 10 item yang baik. Hal ini
menunjukkan bahwa tes berhitung memiliki daya efektivitas distraktor yang tidak
baik.

C. Pembahasan
Pada taraf kesukaran item, hasil data yang didapatkan yaitu jumlah testi yang mampu
menjawab item dengan benar sebanyak 37 testi sedangkan testi yang tidak mampu
menjawab item dengan benar sebanyak 3 testi. Hal ini berarti soal yang ada dalam tes
mempunyai taraf kesukaran yang baik karena memiliki mean sesuai dengan kriteria.
Pada daya diskriminasi item, jumlah item yang positif berada pada rentang angka 0,2
dan 0,3 yaitu sebanyak 10 item dan 40 item negative.
Sedangkan untuk efektivitas distraktor dihasilkan sebanyak 30 item yang tidak baik
dan 10 item yang baik. Hal ini menunjukkan bahwa tes berhitung memiliki daya
efektivitas distraktor yang tidak baik.
BAB III

ESTIMASI RELIABILITAS

A. Pengertian
Estimasi reliabilitas merupakan analisis reliabilitas yang melibatkan penggunaan
dua rangkaian skor atau hasil pengukuran, lalu menghitung koefisian korelasi antara
kedua rangkaian skor tersebut.

B. Tiga Pendekatan Estimasi Reliabilitas


1. Estimasi Reliabilitas Test-Retest
Metode ini pertama kali diperkenalkan oleh William Brown (1910, dalam Traub,
1997). Menurut William Brown, koefisian reliabilitas merupakan korelasi antar skor-
skor yang diperoleh dari pengetesan ulang dengan tes yang sama. Metode ini
memiliki dua kelemahan pokok. Pertama, jika jeda waktu antara pengetesan pertama
dan kedua terlalu singkat, sangat mungkin terjadi carry-over effect antar pengetesan.
Kedua, jika jeda waktu antara pengetesan pertama dan kedua terlalu panjang, bisa
terjadi perubahan dalam bentuk peningkatan nyata dalam diri testi terkait atribut yang
menjadi sasaran pengukuran.
2. Estimasi Reliabiltas Belah Dua
Estimasi reliabilitas belah dua memiliki dua metode yakni belah tengah dan belah
gasal-genap. Dalam metode belah tengah, tes dibagi menjadi dua bagian, sedangkan
pada metode belah tengah uji reliabilitas diukur berdasarkan skor item ganjil dan skor
item genap.
3. Estimasi Reliabilitas Alpha Cronbach
Alpha Cronbach dapat diterapkan untuk melihat adanya konsistensi internal tiap
item secara keseluruhan.

C. Contoh Aplikasi Estimasi Reliabilitas dengan data Tes Berhitung :


1. Pendekatan Test-Retest
Ketika diadakan Tes Berhitung di dalam kelas, didapatkan dua data yaitu data
hasil tes pertama dan data hasil tes kedua dengan menggunakan alat tes yang sama.
Setelah semua data didapatkan, langkah selanjutnya dilakukan perhitungan dengan
menggunakan SPSS untuk membandingkan adanya korelasi antara tes pertama dan
tes kedua.
Correlations

X1 X2
X1 Pearson Correlation 1 .548**
Sig. (2-tailed) .006

N 24 24
X2 Pearson Correlation .548** 1
Sig. (2-tailed) .006

N 24 24
**. Correlation is significant at the 0.01 level (2-tailed).

2. Pendekatan Belah Dua (Belah Tengah dan Belah Gasal-Genap)


a) Belah Tengah
Metode diterapkan dengan membagi item soal menjadi 2 yaitu 1-20 dan
21-40, lalu data tersebut dijumlahkan sesuai dengan skor per item yang diperoleh
testi menurut no item yang sudah di belah. Setelah menghitung hasil skor testi
sesuai dengan pembagian 1-20 dan 21-40 langkah selanjutnya dilakukan
perhitungan SPSS untuk melihat perbandingan korelasi antar 2 data tersebut.

Correlations

X3 X4
X3 Pearson Correlation 1 .060
Sig. (2-tailed) .779

N 24 24
X4 Pearson Correlation .060 1
Sig. (2-tailed) .779

N 24 24

b) Belah Gasal-Genap
Metode ini diterapkan dengan membagi 2 soal menjadi no.item ganjil dan
no.item genap. Skor per item yang telah dikerjakan lalu di jumlahkan sesuai
dengan no.item yang sudah dibelah. Setelah mendapat 2 data, dilakukan
perhitungan menggunakan SPSS untuk melihat perbandingan korelasi antara item
ganjil dan item genap.
Correlations

X5 X6
X5 Pearson Correlation 1 .419*
Sig. (2-tailed) .042

N 24 24
X6 Pearson Correlation .419* 1
Sig. (2-tailed) .042

N 24 24
*. Correlation is significant at the 0.05 level (2-tailed).

3. Pendekatan Cronbach Alfa.


Metode ini dilakukan dengan menghitung adanya konsistensi internal antar item
dengan menggunakan aplikasi SPSS untuk mengetahui reliabilitas tes berhitung.
Reliability Statistics
Cronbach's
Alpha N of Items
.655 40

D. Pembahasan
Berdasarkan hasil data yang didapatkan, evidensi reliabilitas terbagi ke dalam 3
pendekatan yaitu pendekatan Test-Retest, pendekatan belah dua (belah tengah dan belah
gasal-genap), dan pendekatan Cronbach’s Alpha.
Pada pendekatan test-retest, bisa dilihat bahwa terdapat korelasi yang signifikan
dimana hasil korelasi dari tes pertama sebesar 1 dan pada pengulangan tes sebesar 1. Hal
ini menunjukkan bahwa reliabilitas test-retest menghasilkan sebuah estimasi reliabilitas .
Pada pendekatan belah dua (belah tengah), bisa dilihat bahwa terdapat korelasi
yang signifikan antara X3 dan X4. Dimana, hasil yang didapatkan pada X3 sebesar 1 dan
X4 sebesar 1. Hal ini menunjukkan bahwa terdapat korelasi yang signifikan antara X3
dan X4.
Pada pendekatan belah dua (ganjil genap), bisa dilihat bahwa terdapat korelasi
yang signifikan antara X5 dan X6. Dimana, hasil yang didapatkan pda X5 sebesar 1 dan
X6 sebesar 1. Hal ini menunjukkan bahwa antara item yang genap dan ganjil
menghasilkan korelasi yang signifikan.
Pada pendekatan Cronbach-Alpha, bisa dilihat bahwa nilai Cronbach-Alpha yang
diperoleh sebesar 0,655 dengan jumlah item sebanyak 40.
BAB IV
ESTIMASI VALIDITAS

A. Pengertian
Validitas merupakan kualitas yang memperlihatkan sejauh mana tes mengukur
atribut psikologis yang seharusnya diukur. Validitas merupakan konsekuensi sosial
karena hasil tes tersebut akan berkaitan dengan keputusan dan nasib seseorang yang
diberikan tes.

B. Lima Evidensi Validitas


1. Evidensi terkait isi tes
Evidensi tentang kesesuian isi tes dan konstruk yang diukur oleh suatu tes bisa
diperoleh melalui analisis logis atau empiris terhadap seberapa memadai isi tes
mewakili ranah isi serta seberapa relevan ranah isi tersebut.
2. Evidensi Terkait Proses Respon Subjek
Evidensi ini didasarkan pada penilaian terhadap terhadap kesesuaian antara
respon yang diberikan oleh testi dalam rangka mengerjakan tes dengan konstruk
yang diukur oleh tes.
3. Evidensi Terkait Struktur Internal Tes
Evidensi ini didasarkan pada penilaian tentang sejauh mana item-item dan
komponen-komponen dalam tes saling berhubungan sedemikian rupa sesuai dengan
konstruk yang diukur. Aspek tersebut berkaitan dengan konsistensi internal atau
homogenitas tes. Konsistensi internal atau homogenitas tes yang tinggi dipandang
sebagai evidensi yang kuat bahwa tes tersebut mengukur sebuah konstruk, khususnya
seperti yang dimaksudkan oleh penyusun tes.
Terdapat dua metode yang ditempuh untuk memeriksa struktur internal tes,
pertama adalah analisis faktor konfirmatori, di mana metode ini mempresentasikan
general intelligence atau inteligensi umum, kedua adalah differential item functions
(DIF) techniques atau teknik DIF untuk memeriksa kemungkinan terjadinya bias
item sebagai evidensi lain invaliditas.
4. Evidensi Terkait Hubungan Antara Tes dan Tes Lain
Evidensi validitas dapat diperoleh dengan menganalisis hubungan antara skor tes
dan variabel-variabel lain di luar tes. Terdapat beberapa metode yang tercakup dalam
pendekatan ini pertama, analisis hubungan antara skor tes dan skor kriteria yang
diprediksikan oleh tes yang bersangkutan. Analisis tersebut memberikan evidensi
tentang seberapa akurat tes mampu memprediksikan kinerja atau tingkah laku yang
merupakan kriteria yang sesuai. Kedua, analisis hubungan antara skor tes dan skor-
skor tes lain yang dimaksudkan untuk mengukur konstruk yang sama seperti yang
telah diukur oleh tes yang bersangkutan, artinya terdapat hubungan positif antara
skor tes dengan skor tes lain yang dimaksudkan guna mengukur konstruk yang sama
atau sejenis yang menghasilkan dengan apa yang disebut evidensi konvergen.
Analisis hubungan antara skor tes dan tes lain yang dimaksudkan untuk mengukur
konstruk yang berbeda dari yang diukur oleh tes yang bersangkutan, artinya terdapat
hubungan negatif dan signifikan antara skor tes dan skor-skor tes lain yang
mengahsilkan apa yang disebut evidensi diskriminan. Ketiga, analisis perbedaan
kinerja dalam tes yang sama antara dua atau lebih kelompok testi yang diprediksikan
akan berbeda berkat hubungan antara konstruk yang diukur oleh tes dan variabel
yang mendasari pembagian testi ke dalam kelompok-kelompok
5. Evidensi Terkait Konsekuensi Pengetesan
Konsekuensi, dampak atau akibat pengetesan ini dibedakan ke dalam dua kategori
yaitu :
a. Konsekuensi, dampak, atau akibat yang direncanakan. Artinya tes biasanya
diadministrasikan dengan harapan memperoleh manfaat tertentu dari hasil
intepretasi skor yang sudah direncanakan.
b. Konsekuensi, dampak, atau akibat yang tidak diremcamakan, artinya
penerapan tes seringkali diakui memberikan manfaat diluar hasil intepretasi
skor yang sudah direncanakan.

C. Contoh Aplikasi Estimasi Validitas Tes berdasarkan Evidensi terkait


Hubungannya dengan Variabel Lain: Tes Berhitung dan IPK.
Berdasarkan tabel di atas, terlihat bahwa aplikasi dari estimasi validitas tes
berdasarkan evidensi memiliki keterkaitan dengan variabel lain. Aplikasi estimasi
validitas dari tes berhitung dihubungkan dengan IPK testi yang adalah variabel eksternal.

D. Hubungan antara Validitas dan Reliabilitas


Tes validitas dan reliabilitas memiliki suatu keterkaitan yang saling terkait dan
dapat membentuk sebuah tes menjadi tes yang baik. Tes dinyatakan reliabel apabila tes
menunjukkan hasil yang konsisten. Tetapi hasil yang konsisten dari suatu tes, belum
tentu dapat dikatakan valid, begitu juga suatu tes yang reliabel belum tentu tes tersebut
valid untuk itu sebaiknya tes memiliki instrumen valid dengan reliabilitas yang sama-
sama baik. Tes yang valid mampu mengukur apa yang seharusnya akan diukur,
sedangkan tes yang reliabel dan valid, artinya tes tersebut telah dirancang dengan baik
dan sesuai dengan aturan yang ada.

E. Pembahasan
Hasil tes berhitung dengan IPK dianalisis untuk meilhat hubungannya, dengan
menggunakan korelasi bivariet. Berdasarkan hasil korelasi menunjukkan adanya
hubungan yang negatif signifikan. Artinya, variabel eksternal yaitu IPK, tidak
mempengaruhi hasil tes berhitung dari testi. Pada hasil tabel diatas, dapat dilihat bahwa
korelasi yang dihasilkan adalah signifikan dengan masing – masing korelasi sebesar 1.
BAB V
PENUTUP
A. Daya Diskriminasi Tes
Daya diskriminasi tes digunakan pada bagian terakhir setelah segala analisis
lainnya didapatkan. Lebih rinci dari yang dimaksud segala analisis yaitu sesudah selesai
mengumpulkan evidensi secara keseluruhan dan terbukti tes yang digunakan/diujikan
reliabel dan valid sehingga dapat dipertanggungjawabkan. Kemudian dibutuhkan satu
evidensi tambahan yang akan membuktikan secara keseluruhan memiliki daya
diskriminasi yang baik. Untuk menguji daya diskriminasi apakah baik atau tidak dapat
diperiksa dengan menghitung koefisie n delta Ferguson. Tes yang berdaya diskriminasi
baik memiliki nilai koefisien delta Ferguson lebih besar dari 0,90.

B. Kesimpulan
Pada taraf kesukaran item, hasil data yang didapatkan yaitu jumlah testi yang
mampu menjawab item dengan benar sebanyak 37 testi sedangkan testi yang tidak
mampu menjawab item dengan benar sebanyak 3 testi. Hal ini berarti soal yang ada
dalam tes mempunyai taraf kesukaran yang baik karena memiliki mean sesuai dengan
kriteria. Pada daya diskriminasi item, jumlah item yang positif berada pada rentang angka
0,2 dan 0,3 yaitu sebanyak 10 item dan 40 item negative. Sedangkan untuk efektivitas
distraktor dihasilkan sebanyak 30 item yang tidak baik dan 10 item yang baik. Hal ini
menunjukkan bahwa tes berhitung memiliki daya efektivitas distraktor yang tidak baik.
Berdasarkan hasil data yang didapatkan, evidensi reliabilitas terbagi ke dalam 3
pendekatan yaitu pendekatan Test-Retest, pendekatan belah dua (belah tengah dan belah
gasal-genap), dan pendekatan Cronbach’s Alpha.
Pada pendekatan test-retest, bisa dilihat bahwa terdapat korelasi yang signifikan dimana
hasil korelasi dari tes pertama sebesar 1 dan pada pengulangan tes sebesar 1. Hal ini
menunjukkan bahwa reliabilitas test-retest menghasilkan sebuah estimasi reliabilitas .
Pada pendekatan belah dua (belah tengah), bisa dilihat bahwa terdapat korelasi yang
signifikan antara X3 dan X4. Dimana, hasil yang didapatkan pada X3 sebesar 1 dan X4
sebesar 1. Hal ini menunjukkan bahwa terdapat korelasi yang signifikan antara X3 dan
X4.
Pada pendekatan belah dua (ganjil genap), bisa dilihat bahwa terdapat korelasi yang
signifikan antara X5 dan X6. Dimana, hasil yang didapatkan pda X5 sebesar 1 dan X6
sebesar 1. Hal ini menunjukkan bahwa antara item yang genap dan ganjil menghasilkan
korelasi yang signifikan. Pada pendekatan Cronbach-Alpha, bisa dilihat bahwa nilai
Cronbach-Alpha yang diperoleh sebesar 0,655 dengan jumlah item sebanyak 40.
Hasil tes berhitung dengan IPK dianalisis untuk meilhat hubungannya, dengan
menggunakan korelasi bivariet. Berdasarkan hasil korelasi menunjukkan adanya
hubungan yang negatif signifikan. Artinya, variabel eksternal yaitu IPK, tidak
mempengaruhi hasil tes berhitung dari testi.
Tes validitas dan reliabilitas memiliki suatu keterkaitan yang saling terkait dan
dapat membentuk sebuah tes menjadi tes yang baik. Tes dinyatakan reliabel apabila tes
menunjukkan hasil yang konsisten. Tetapi hasil yang konsisten dari suatu tes, belum
tentu dapat dikatakan valid, begitu juga suatu tes yang reliabel belum tentu tes tersebut
valid untuk itu sebaiknya tes memiliki instrumen valid dengan reliabilitas yang sama-
sama baik. Pada hasil tabel diatas, dapat dilihat bahwa korelasi yang dihasilkan adalah
signifikan dengan masing – masing korelasi sebesar 1.
Daya diskriminasi tes digunakan pada bagian terakhir setelah segala analisis
lainnya didapatkan. Lebih rinci dari yang dimaksud segala analisis yaitu sesudah selesai
mengumpulkan evidensi secara keseluruhan dan terbukti tes yang digunakan/diujikan
reliabel dan valid sehingga dapat dipertanggungjawabkan. Tes yang berdaya
diskriminasi baik memiliki nilai koefisien delta Ferguson lebih besar dari 0,90.
DAFTAR ACUAN
Supratiknya, A. 2014. Pengukuran Psikologis. Yogyakarta : Sanata Dharma University
Press.

Anda mungkin juga menyukai