Anda di halaman 1dari 13

MAKALAH KONSTRUKSI & PENGUKURAN

BIMBINGAN & KONSELING


UJI BAHASA / EXPERT REVIEW

DISUSUN OLEH :

Kelompok 3 :

1. Hanifah 201901500515
2. Laila Fauziah 201901500603
3. Nabillah Balqis Suryadi 201901500611
4. Sukma Ries Diana 201901500461
5. Wuryaningrum 201901500597

FAKULTAS IMU PENDIDIKAN DAN PENGETAHUAN SOSIAL


PROGRAM STUDI BIMBINGAN DAN KONSELING
UNIVERSITAS INDRAPRASTA PGRI
JAKARTA 2021
KATA PENGANTAR

Assalamu’alaikum wr wb

Segala puji bagi Allah SWT yang telah memberikan kami kemudahan sehingga kami dapat
menyelesaikan makalah ini dengan tepat waktu. Tanpa pertolongan-Nya tentunya kami tidak
akan sanggup untuk menyelesaikan makalah ini dengan baik. Shalawat serta salam semoga
terlimpah curahkan kepada baginda tercinta kita yaitu Nabi Muhammad SAW yang kita nanti-
natikan syafa’atnya di akhirat nanti.

Kami mengucapkan syukur kepada Allah SWT atas limpahan nikmat sehat-Nya, baik itu berupa
sehat fisik maupun akal pikiran, sehingga kami mampu untuk menyelesaikan pembuatan
makalah sebagai tugas dari mata kuliah Konstruksi & Pengukuran BK dengan judul “Uji Bahasa
/ Expert Review”.

Kami tentu menyadari bahwa makalah ini masih jauh dari kata sempurna dan masih banyak
terdapat kesalahan serta kekurangan di dalamnya. Untuk itu, kami mengharapkan kritik serta
saran dari pembaca untuk makalah ini, supaya makalah ini nantinya dapat menjadi makalah yang
lebih baik lagi. Kemudian apabila terdapat banyak kesalahan pada makalah ini kami mohon maaf
yang sebesar-besarnya.

Kami juga mengucapkan terima kasih kepada semua pihak yang telah membimbing dalam
menyusun makalah ini.Demikian, semoga makalah ini dapat bermanfaat. Terima kasih.

Jakarta , Oktober 2021

Kelompok 5
DAFTAR ISI

KATA PENGANTAR........................................................................................................i
DAFTAR ISI.......................................................................................................................ii
BAB I PENDAHULUAN
A. Latar Belakang Permasalahan.....................................................................................
B. Rumusan dan Pertanyaan............................................................................................
C. Tujuan Pembahasan.....................................................................................................
BAB II PEMBAHASAN
A. Seleksi Aitem..............................................................................................................
B. Uji Coba Bahasa..........................................................................................................
C. Analisis Aitem.............................................................................................................
BAB III KESIMPULAN DAN SARAN............................................................................
A. Kesimpulan..................................................................................................................
B. Saran............................................................................................................................
DAFTAR PUSTAKA.........................................................................................................
BAB I
PENDAHULUAN

A. Latar Belakang Masalah


Alat ukur yang tergolong valid dan reliabel sangat diperlukan dalam mengungkap
aspek psikologis seseorang. Alat ukur ini disebut juga dengan alat ukur psikologis, tes
psikologis, atau skala psikologi (Azwar, 1996). Untuk mencapai validitas dan reliabilitas alat
ukur psikologis, dilakukan suatu kegiatan sistematis disebut dengan pengembangan alat ukur
psikologis (Suryabrata, 2005). Pengembangan alat ukur psikologis merupakan proses
menghasilkan alat ukur terkait aspek-aspek dalam individu dengan mengembangkan
pertanyaan atau tugas dan mengombinasikannya untuk menjadi sebuah tes (Plake, dkk.,
2014).
Adapun langkah langkah dasar kontruksi alat ukur menurut Azwar (2017) secara
berurutan antara lain mengidentifikasi tujuan pengukuran, melakukan pembatasan domain
ukur, operasionalisasi aspek, penyusunan kisi-kisi (blue print), penulisan item, menguji item,
seleksi item kemudian kembali menguji validitas konstruk dan berakhir dengan tahap
penyusunan format final. Tahap menguji item terdiri dari review penyusun (pra uji-coba), uji
secara kualitatif (uji bahasa dan review ahli) dan uji secara kuantitatif (field test/item
analysis).
Langkah pertama dalam pembuatan item alat ukur adalah memahami konsep atau
dasar teori yang hendak diukur serta mengidentifikasi tujuan pembuatan alat ukur dengan
jelas (Azwar, 2017). Teori atau konsep yang menjadi landasan penelitian ini dikaji terlebih
dahulu dengan prinsip relevansi dan memiliki argumentasi yang lengkap (Purwanto, 2010).
Ketentuan meloloskan aitem dalam tahap evaluasi kualitatif oleh panel para ahli
tersebut adalah kesepakatan expert judgment bahwa isi aitem yang bersangkutan adalah logis
untuk mengungkap indikatornya (logical validity). Sampai pada tahap ini, kerja sistematik
yang dilakukan merupakan dukungan terhadap validitas isi (content validity) dan validitas
konstruk (construct validity) skala. Kumpulan aitem yang telah berhasil melewati proses
reviu kemudian harud dievaluasi secara kualitatif lebih jauh, yaitu dengan diujicobakan pada
sekelompok kecil responden guna mengetahui apakah kalimat yang digunakan dalam aitem
mudah dan dapat dipahami dengan benar oleh responden. Reaksireaksi responden berupa
pertanyaan mengenai kata-kata atau kalimat yang digunakan dalam aitem merupakan
pertanda kurang komunikatifnya kalimat yang ditulis dan itu memerlukan perbaikan.
B. Rumusan Masalah
1. Bagaimana tahapan awal dalam seleksi aitem?
2. Apa tujuan dari dilakukannya uji coba bahasa dalam aitem?
3. Apa yang dilakukan dalam analisis aitem?
C. Tujuan Pembahasan
Tujuan dari pembuatan makalah ini adalah mengetahui tahapan awal dalam seleksi
item. Tujuan dari dilakukan uji coba Bahasa dalam aitem dan hal-hal yang dilakukan dala
analisis aitem.
BAB II
PEMBAHASAN

A. Seleksi Aitem
Seleksi terhadap item dilakukan pertama kali oleh penulis item sendiri, yaitu dengan
selalu memeriksa apakah item telah sesuai dengan indikator perilaku yang hendak diungkap
dan apakah juga tidak keluar dari pedoman penulisan item. Setelah itu seleksi kedua
dilakukan oleh orang lain yang dianggap kompeten untuk menyeleksi (expert/ahli).
Kompetensi yang diperlukan oleh orang yang diminta untuk menyeleksi item adalah:
a. Menguasai masalah konstruksi;
b. Menguasai masalh atribut yang diukur;
c. Menguasai bahasa tulis standar.
Hal‐hal yang perlu diperhatikan dalam pengembangan skala psikologi adalah sebagai
berikut:
a. Hindari item yang mengacu pada banyak peristiwa masa lalu dibandingkan saat ini.
b. Hindari item yang dapat diinterpretasikan sebagai fakta padahal bukan.
c. Hindari item yang dapat diinterpretasi‐kan lebih dari satu cara.
d. Hindari item yang tidak relevan dengan konteks psikologis atau konstruk yang belum
terbangun.
Semua item‐item yang dikembangkan harus sesuai ketentuan spesifikasi blue‐print,
jika tidak, item tersebut harus ditulis ulang. Jika ada item yang belum sesuai dengan tahap‐
tahapan tersebut di atas, maka harus ditulis ulang. Item yang diyakini dapat berfungsi baik,
boleh diloloskan untuk uji coba di lapangan.
B. Uji Coba
Tujuan pertama uji coba item adalah untuk mengetahui apakah kalimat‐kalimat
dalam item mudah dan dapat dipahami oleh responden. Reaksi‐reaksi responden berupa
pertanyaan‐ pertanyaan apakah kalimat yang digunakan dalam item merupakan pertanda
kurang komunikasinya kalimat yang ditulis dan memerlukan perbaikan. Tujuan kedua, uji
coba dijadikan salah satu jawaban praktis untuk memeperoleh data jawaban dari responden
yang akan digunakan untuk penskalaan  atau evaluasi kualitas item secara statistik.

C. Analisis Aitem
Analisis item merupakan proses pengujian parameter‐ parameter item guna
mengetahui apakah item memenuhi persyaratan psikometris untuk disertakan sebagai bagian
dari skala. Parameter item yang perlu diuji adalah daya beda, daya beda item memperlihatkan
kemampuan item untuk membedakan individu ke dalam berbagai tingkatan kualitatif atribut
yang diukur mendasarkan skor kuantitatif. Misalnya, ingin menguji motivasi belajar
seseorang, maka item tersebut bisa menunjukkan perbedaan individu yang motivasi
belajarnya tinggi, sedang dan rendah.
Analisis item adalah suatu kegiatan yang bertujuan untuk menganalisis apakah item‐
item pada suatu alat ukur telah memenuhi fungsinya, yaitu:  
a. Mewakili domain tingkah laku yang hendak diukur;
b. Memiliki derajat kesulitan yang tepat;
c. Memiliki daya diskriminasi yang maksimal.
Menurut Kaplan & Saccuzzo (2005), analisis item adalah kegiatan mengevaluasi
item‐item alat tes. Dari kegiatan ini diharapkan didesain sebuah alat tes dengan jumlah item
minimum, namun reliabilitas dan validitas yang maksimum.   Analisis item dapat dilakukan
secara kualitatif dan kuantitatif. 
a.  Kualitatif, yaitu menyangkut keterwakilan tingkah laku domain menjadi item dalam alat
tes (konten dan form) a content validity (menyangkut expert judgement);
b. Kuantitatif; dibagi menjadi item difficulty & item discriminant.  
1) Item difficulty merupakan presentase (proporsi) orang yang menjawab item dengan
benar (P); sedangkan
2) Item discriminant adalah perbandingan antara proporsi orang yang menjawab benar
dalam kelompok upper dengan proporsi orang yang menjawab benar dalam kelompok
lower. Perbedaan proporsi ini disebut sebagai index of discrimination (D).
Prosedur analisis item adalah salah satunya dengan menguji daya diskrimnasi item
untuk mendapatkan index of discrimination (D). Indeks daya diskriminasi adalah parameter
yang membedakan antara individu/kelompok individu yang memiliki & yang tidak memiliki
atribut (variabel) yang diukur. Indeks daya diskriminasi merupakan indikator keselarasan/
konsistensi antara fungsi item dengan fungsi skala secara keseluruhan. Dasarnya adalah
untuk memilih item yang mengukur hal yang sama dengan yang diukur oleh skala sebagai
keseluruhan. Komputasi koefisien korelasi antara distribusi skor item dengan suatu kriteria
relevan (distribusi skor skala itu sendiri) akan menghasilkan koefisien korelasi item total
(total item correlation) (rix).
Formula korelasi yang tepat dalam komputasi, tergantung pada sifat penskalaan dan
distribusi skor item dan skala itu sendiri. Apabila skala yang digunakan menggunakan skor
level interval, dapat digunakan formula Korelasi Product Moment dari Pearson yaitu dengan
asumsi sebagai berikut:
a. Makin tinggi koefisien korelasi positif skor item dengan skor skala berarti makin tinggi
konsistensinya. Artinya semakin tinggi daya beda itemnya.
b. Bila koefisien korelasinya rendah (bahkan mendekati 0) berarti fungsi item tidak cocok
dengan fungsi alat ukur skala psikologi. Artinya semakin rendah daya beda itemnya.  
Sedangkan bila skala yang digunakan menggunakan skor dikotomi (nominal), dapat
digunakan formula Korelasi Point Biserial (r‐pbis) dengan asumsi yang sama yaitu sebagai
berikut:
a. Makin tinggi koefisien korelasi positif skor item dengan skor skala berarti makin tinggi
konsistensinya. Artinya semakin tinggi daya beda itemnya.
b. Bila koefisien korelasinya rendah (bahkan mendekati 0) berarti fungsi item tidak cocok
dengan fungsi alat ukur skala psikologi. Artinya semakin rendah daya beda itemnya.  
Menganalisis item untuk memilih item berdasarkan koefisien korelasi item total
(total item correlation) digunakan kriteria pemilihan item berdasar korelasi item total
biasanya menggunakan batasan rix/ri(X‐i) ≥  0,03. Artinya, item dengan koefisien korelasi
minimal (≥) 0,03 memiliki daya bedan tinggi atau memuaskan. Sedangkan item dengan
harga rix/ri(X‐i) ≤  0,03 diintepretasikan sebagai item yang punya daya diskriminasi rendah
atau tidak memuaskan.
Di samping itu, salah satu proses analisis item adalah melakukan uji validitas alat
ukur. Validitas adalah ketepatan mengukur konstruk, menyangkut: “what the test measure
and how well it does” (Anastasi, 1990), atau “apakah alat tes memenuhi fungsinya sebagai
alat ukur psikologis?” (Nunnaly, 1978). Beberapa prosedur uji validitas, yaitu sebagai
berikut:
a. Criterion‐related validation: memprediksi dan mendiagnosa. Criterion‐related melihat
validitas tes dalam memprediksi suatu tingkah laku. Kriteria adalah tingkah laku yang
hendak diramalkan. Jenis validitas ini dibagi menjadi dua yaitu, predictive dan
concurrent. Predictive berguna untuk memprediksi suatu tingkah laku, memvalidasi tes‐
tes seleksi dan penempatan, yang kriterianya diambil setelah interval waktu tertentu.
Concurrent digunakan untuk mendiagnosa suatu tingkah laku terutama kepribadian
yang kriterianya diambil bersamaan dengan saat pengetesan.  
b. Content‐related validation: merepresentasikan materi (domain behavior). Sejauh mana
peneliti yakin bahwa item‐item sudah merepresentasikan sample tingkah laku. Maka
perlu batasan tingkah laku sebagaimana definisi operasional (sebagai penegasan domain
pengukuran). Di dalamnya juga terdapat expert judgement.  
c. Construct related validation: mengukur psychological traits. Melihat sejauh sebuah tes
tepat mengukur konstruk atau trait. Beberapa metode yang dapat digunakan untuk
mengukur validitas konstruk:  
1) Perubahan yang dipengaruhi perkembangan teori.
2) Korelasi dengan alat tes lain, yang dibagi menjadi alat tes baru dengan alat tes lama,
dan korelasi alat tes baru dengan alat tes lain.
3) Analasis faktor (factor analysis).
4) Experimental intervention.
5) Human information processing.
6) Internal consistency.
7) Convergent‐discriminant validity.
Setelah melakukan analisis uji validitas, tahapan selanjutnya adalah uji reliabilitas.
Reliabilitas adalah konsistensi alat tes yang dilihat dari skor dan z‐score. Mengapa
diperlukan kekonsistenan? Karena adanya perubahan‐perubahan pada skor dan z‐score
yang disebabkan oleh error. Terdapat dua macam error yaitu: systematic dan unsystematic
error.  
Prosedur uji reliabilitas antara lain pengujian reliabilitas dengan satu kali
administrasi, yaitu sebagai berikut:
a. Split half  
Pengukuran reliabilitas alat ukur dilakukan dengan cara membelah alat tes tersebut
menjadi dua bagian yang ekuivalen. Koefisien reliabilitas diperoleh dengan cara
mengkorelasikan skor‐skor antar dua belahan (internal consistency). Teknik pengujian
reliabilitas dengan teknik ini dibagi menjadi dua, yaitu Rulon dan Spearman Brown.
b. Kuder Richardson (KR)
Mengukur konsistensi respon subjek pada item‐item tes, sehingga disebut interitem
consistency. Errornya disebut content sampling dan content heterogeneity sampling.
Teknik pengujian reliabilitas dengan teknik ini dibagi menjadi dua, yaitu KR‐20 dan
KR‐21.
c. Coefficient alpha Tujuannya sama dengan KR, hanya saja syarat yang harus dipenuhi
adalah data yang diperoleh bersifat kontinum dan bukan dikotomi.
Sedangkan prosedur uji reliabilitas antara lain pengujian reliabilitas dengan dua kali
administrasi, yaitu sebagai berikut:
a. Tes‐retes.  
Untuk melihat stabilitas atau kekonsistenan alat tes dalam mengukur karakteristik atau
trait dengan melaksanakan tes dan pengukuran terdiri lebih dari satu kali (diulang).
Koefisien korelasi yang dihasilkan disebut dengan coefficient of stability. Error pada
uji reliabilitas dengan teknik ini disebut time sampling error.
b. Alternate form: immediate alternate form & delayed alternate form.  
Untuk melihat stabilitas alat tes dalam mengukur trait individu dengan melaksanakan
tes dan pengukuran lebih dari satu kali dan menggunakan dua form tes.  
c. Immediate
Instrumen kedua diberikan langsung setelah instrumen pertama diberikan. Koefisien
korelasi yang dihasilkan disebut dengan coefficient of equivalence. Error pada teknik
ini disebut sebagai content sampling & human error.
d. Delayed
Ada penundaan pemberian form kedua setelah form pertama diberikan. Koefisiennya
disebut sebagai coefficient of equivalence & stability. Error pada teknik ini disebut
sebagai content sampling, time sampling, & human error.
e. Interscorer reliability
Tujuan dari uji reliabilitas ini adalah untuk menunjukkan konsistensi skor‐skor yang
diberikan skorer satu dengan skorer lainnya. Error yang muncul adalah interscorer
differences.  

BAB III
KESIMPULAN & SARAN

A. Kesimpulan
B. Saran
DAFTAR PUSTAKA

Azwar, S. (2013). Reliabilitas dan Validitas Edisi II, Yogyakarta: Pustaka Pelajar
__________ (2013). Sikap Manusia Teori dan Pengukurannya, Yogyakarta: Pustaka Pelajar.
Goodman, R. (1997) The Strengths and Difficulties Questionnaire: A Research Note,
Journal of Child Psychology and Psychiatry, 38, 581- 586. ____________ (2006) Evaluation
of the Strengths and Difficulties Questionnaire. Aboriginal Children's Survey
Gronlund, N.E. (1982). Constructing Achievement Tests, Publisher Englewood Cliffs:
Prentice-Hall.
Nunnaly, J.C. (1994). Psychometric Theory, New York: McGraw Hill.Inc.
Widiarso, W. (2009). Modul Statistik, Yogyakarta: Tidak Diterbitkan.
https://dspace.uii.ac.id/bitstream/handle/123456789/15745/05.3%20bab%203.pdf?
sequence=7&isAllowed=y
http://ppak.ulm.ac.id/wp-content/uploads/2020/12/DIKTAT-PERKULIAHAN-Konstruksi-
Alat-Ukur-Psikologi-Ed.-Revisi-2020-fix-3.pdf
13

Anda mungkin juga menyukai