Anda di halaman 1dari 27

RINGKASAN MATERI

SCREENING, SAMPLING & PENGUKURAN


diajukan untuk memenuhi tugas Mata Kuliah :
KONSTRUKSI DAN PENGUKURAN BK

Dosen Pengampu : Sisca Folastri, M.Pd.Kons

Disusun Oleh :
Kelompok 5

1. Ayumnah (201801500046)
2. Ita Rosita (201801500099)
3. Novia Ayu Widyasari
(201801500077)
4. Sindy Mandasari (201801500080)
5. Siti Nuri Sofi Ati (201801500090)

PROGRAM STUDI BIMBINGAN KONSELING


FAKULTAS ILMU PENDIDIKAN DAN PENGETAHUAN SOSIAL
UNIVERSITAS INDRAPASTA PGRI
2020
MATERI PERTEMUAN VI: SAMPLING & SCREENING DATA
Dalam sebuah penelitian, terkadang seorang peneliti tidak harus meneliti
seluruh objek yang diamati. Hal ini disebabkan karena keterbatasan yang dimiliki
peneliti, baik biaya, waktu atau tenaga. Dengan melakukan teknik sampling,
seorang Peneliti dapat mempelajari, memprediksi, dan menjelaskan sifat-sifat
suatu objek atau fenomena hanya dengan mempelajari dan mengamati sebagian
dari objek atau fenomena tersebut.

 Sebagian dari objek atau fenomena yang akan diamati inilah yang disebut
sampel.
 Keseluruhan objek atau fenomena yang diteliti disebut populasi.

Mengingat Seorang peneliti dapat mengambil sebagian saja dari populasi


maka syaratnya sampel harus memenuhi unsur representasi atau mewakili dari
seluruh sifat-sifat obyek yang diteliti. Sampel yang representative dapat diartikan
bahwa sampel tersebut mencerminkan semua unsur dalam populasi secara
proporsional atau memberikan kesempatan yang sama pada semua unsur populasi
untuk dipilih sehingga dapat mewakili keadaan sebenarnya dalam keseluruhan
populasi.

Lawan dari sampel representative adalah sampel bias.

APA ITU SAMPLING ?


Teknik sampling adalah bagian dari metodologi statistika yang
berhubungan dengan pengambilan sebagian dari populasi. Jika sampling
dilakukan dengan metode yang tepat, analisis statistik dari suatu sampel dapat
digunakan untuk menggeneralisasikan keseluruhan populasi. Metode sampling
banyak menggunakan teori probabilitas dan teori statistika.

Tahapan sampling adalah:


1. Mendefinisikan populasi yang hendak diamati
2. Menentukan kerangka sampel, yakni kumpulan semua item atau peristiwa
yang mungkin
3. Menentukan metode sampling yang tepat
4. Melakukan pengambilan sampel (pengumpulan data)
5. Melakukan pengecekan ulang proses sampling

Pembagian teknik sampling


Teknik pengambilan sampel atau biasa disebut teknik sampling dapat dibagi atas 2
kelompok besar, yaitu :

1. Probability Sampling (Random Sample)


2. Non Probability Sampling (Non Random Sample)

1. Probability Sampling (Random Sample)


Pada pengambilan sampel secara random atau acak, setiap unit
populasi, mempunyai kesempatan yang sama untuk diambil sebagai
sampel. Faktor pemilihan atau penunjukan sampel yang mana akan
diambil, yang semata-mata atas pertimbangan peneliti, akan dapat
dihindarkan. Bila tidak, akan terjadi bias.
Dengan cara random, bias pemilihan dapat diperkecil, sekecil
mungkin. Ini merupakan salah satu usaha untuk mendapatkan sampel yang
representatif. Keuntungan pengambilan sampel dengan probability
sampling adalah sebagai berikut:
a. Derajat kepercayaan terhadap sampel dapat ditentukan.
b. Beda penaksiran parameter populasi dengan statistik sampel, dapat
diperkirakan.
c. Besar sampel yang akan diambil dapat dihitung secara statistik.
(TAMBAHAN)

Kelebihan probability sampling

1. Pengambilan sampel dapat dilakukan secara objektif


2. Kesimpulan yang dihasilkan tidak sebatas analisis secara deskriptif
melainkan juga dapat dilakukan analisis diferensia karena mewakili
keseluruhan populasi

Kekurangan probability sampling


1. Hal yang sulit dilakukan dalam metode ini adalah membentuk
kerangka sampel, karena pada umumnya peneliti harus melakukan
listing (pendaftaran) setiap individu dalam populasi, Contoh, seorang
mahasiswa akan melakukan penelitian tentang perbandingan efisiensi
teknis produksi keramik di Kecamatan A dan Kecamatan B. Jika
ingin menggunakan probability sampling, maka dia terlebih dahulu
harus mendaftar semua pengrajin keramik yang berstatus pengusaha
(bukan buruh) di kedua Kecamatan tersebut.
Misalnya mengenai penelitian tentang pentingnya kemampuan self
love dalam pemahaman diri di Universitas Indrapasta PGRI. Jika
peneliti ingin menggunakan probability sampling, maka dia terlebih
dahulu harus mendaftar semua mahasiswa yang ada di Universitas
Indraprasta PGRI, baik itu mahasiswa baru, tahun kedua, tahun
ketiga, dan mahasiswa tahun akhir untuk diambil sebagai sample.

2. Membutuhkan waktu, tenaga dan biaya yang lebih besar dari teknik
non probability sampling.
Misalnya, pada contoh yang tadi disebutkan, untuk melakukan listing
mahasiswa unindra, maka peneliti tersebut membutuhkan waktu
penelitian yang lebih lama, tenaga yang lebih besar, dan biaya
penelitian yang lebih banyak untuk mencapai tujuan penelitiannya. 
Adapun teknik-teknik yang masuk menjadi bagian dari teknik probability
sampling antara lain :

A. Sampel Random Sederhana (Simple Random Sampling)


Sampel Random Sederhana (Simple Random Sampling)
merupakan sistem pengambilan sampel secara acak dengan
menggunakan undian atau tabel angka random. Tabel angka random
merupakan tabel yang dibuat dalam komputer berisi angka-angka
yang terdiri dari kolom dan baris, dan cara pemilihannya dilalukan
secara bebas. Pengambilan acak secara sederhana ini dapat
menggunakan prinsip pengambilan sampel dengan pengembalian
ataupun pengambilan sampel tanpa pengembalian.
Kelebihan dari pengambilan acak sederhana ini adalah
mengatasi bias yang muncul dalam pemilihan anggota sampel dan
kemampuan menghitung standard error. Sedangkan kekurangannya
adalah tidak adanya jaminan bahwa setiap sampel yang diambil secara
acak akan merepresentasikan populasi secara tepat.

CONTOH: Misal seseorang ingin meneliti tentang proses belajar


di kelas dalam satu kelas. Total muridnya berjumlah 100 orang.
Peneliti tersebut bisa mewawancarai secara mendalam 10 orang
sebagai sampel.

B. Sampel Random Sistematik (Systematic Random Sampling)


Beberapa ahli memasukkan tekink ini kedalam mix sampling.
Sampel Random Sistematik (Systematic Random Sampling)
merupakan sistem pengambilan sampel yang dilakukan dengan
menggunakan selang interval tertentu secara berurutan. Misalnya, jika
ingin mengambil 1000 sampel dari 5000 populasi secara acak, maka
kemungkinan terpilihnya 1/5. Diambil satu angka dari interval
pertama antara angka 1-5, dan dilanjutkan dengan pemilihan angka
berikutnya dari interval selanjutnya.
Kelebihan dari pengambilan acak secara sistematis ini adalah lebih
praktis dan hemat dibanding dengan pengambilan acak sederhana.
Sedangkan kekurangannya adalah tidak bisa digunakan pada
penelitian yang heterogen karena tidak mampunya menangkap
keragaman populasi heterogen.
CONTOH: misal seorang peneliti ingin melakukan penelitian
mengenai tingkat stress mahasiswa dalam pembelajaran daring
di sebuah universitas. Jumlah total populasinya 1000 mahasiswa.
Sedangkan peneliti ingin melakukan survei pada 100 mahasiswa
saja. Teknik sampling yang dilakukan, pertama-tama peneliti
merencanakan, misal sampel yang diambil adalah daftar nomor
urut ke 10 dan kelipatannya (20,30,40, dst sampai 1000)

C. Sampel Random Berstrata (Stratified Random Sampling)


Sampel Random Berstrata (Stratified Random Sampling)
merupakan sistem pengambilan sampel yang dibagi menurut lapisan-
lapisan tertentu dan masing-masing lapisan memiliki jumlah sampel
yang sama.
Kelebihan dari pengambilan acak berdasar lapisan ini adalah lebih
tepat dalam menduga populasi karena variasi pada populasi dapat
terwakili oleh sampel. Sedangkan kekurangannya adalah harus
memiliki informasi dan data yang cukup tentang variasi populasi
penelitian. Selain itu, kadang-kadang ada perbedaan jumlah yang
besar antar masing-masing strata.
CONTOH: Misalnya mengenai penelitian tentang pentingnya
kemampuan self love dalam pemahaman diri di Universitas
Indrapasta PGRI. Peneliti membuat strata pada sampel, yakni
mana mahasiswa baru, mana mahasiwa tahun kedua, mana
tahun ketiga, dan mana mahasiswa tahun akhir. Masing-masing
strata atau tingkatan yang diambil, sampelnya harus bersifat
proporsional.
D. Sampel Random Berkelompok (Cluster Sampling)
Sampel Random Berkelompok (Cluster Sampling) merupakan
sistem pengambilan sampel yang dibagi berdasarkan areanya. Setiap
area memiliki jatah terambil yang sama.
Kelebihan dari pengambilan acak berdasar area ini adalah lebih
tepat menduga populasi karena variasi dalam populasi dapat terwakili
dalam sampel. Sedangkan kekurangannya adalah memerlukan waktu
yang lama karena harus membaginya dalam area-area tertentu.
CONTOH: Misalkan suatu penelitian ingin mengetahui rata-rata
pendapatan masyarakat dari setiap desa di suatu kabupaten. Di
kabupaten tersebut terdapat 100 desa, tetapi hanya ingin diambil
50 desa saja. Secara administratif, seluruh desa dapat
dikelompokkan ke dalam 15 kecamatan yang berbeda (dianggap
sebagai kelompok/kluster/blok) dengan jumlah desa tiap
kecamatan mungkin berbeda pula.

2. Non Probability Sampling (Non Random Sample)


Merupakan cara pengambilan sampel secara tidak acak di mana
masing-masing anggota tidak memiliki peluang yang sama untuk terpilih
anggota sampel. Ada intervensi tertentu dari peneliti dan biasa peneliti
menyesuaikan dengan kebutuhan dan tujuan penelitiannya, diantaranya:
A. Pengambilan sesaat (Accidental/haphazard sampling)
Pengambilan sesaat (Accidental/haphazard sampling)
merupakan teknik pengambilan sampel yang dilakukan dengan tiba-
tiba berdasarkan siapa yang ditemui oleh peneliti. Misalnya, reporter
televisi mewawancarai warga yang kebetulan sedang lewat.
Kelebihan dari pengambilan sesaat ini adalah kepraktisan
dalam pemillihan anggota sampel. Kekurangannya adalah belum tentu
responden memiliki karakteristik yang dicari oleh peneliti.
CONTOH: Seorang ilmu ahli Bahasa Inggris ingin mengetahui
sejauh mana pengaruh buku yang dikarangnya. Cara
pengambilan sampel, yaitu: dibatasi jumlah sampelnya misalnya
30 orang, setiap orang yang datang ke lembaganya (para siswa
diberi informasi dan apabila berminat sesuai dengan
kemampuannya dijadikan responden), setelah dipelajari buku
selama satu minggu, responden segera memberi kabar atau saran
tentang buku yang dipelajarinya.

B. Pengambilan menurut jumlah (Quota sampling)


Pengambilan menurut jumlah (Quota sampling) merupakan
pengambilan anggota sampel berdasarkan jumlah yang diinginkan
oleh peneliti.
Kelebihan dari pengambilan menurut jumlah ini adalah praktis
karena jumlah sudah ditentukan dari awal. Kekurangannya adalah
bias, belum tentu mewakili seluruh anggota populasi.
CONTOH: Misalnya, mengenai penelitian tentang persepsi
masyarakat Indonesia tentang kesetaraan gender. Maka peneliti
dapat menentukan kuota berapa jumlah laki-laki dan berapa
jumlah perempuan secara proporsional yang kemudian diambil
menjadi sebuah sampel.

C. Pengambilan menurut tujuan (Purposive sampling)


Pengambilan menurut tujuan (Purposive sampling) merupakan
pemilihan anggota sampel yang didasarkan atas tujuan dan
pertimbangan tertentu dari peneliti.
Kelebihan dari pengambilan menurut tujuan ini adalah tujuan
dari peneliti dapat terpenuhi. Kekurangannya adalah belum tentu
mewakili keseluruhan variasi yang ada.
CONTOH: Misalnya, peneliti ingin meneliti permasalahan
seputar masalah kesehatan selama masa pandemi. Maka sampel
yang ditentukan adalah para psikolog atau psikiater yang
mengetahui dengan jelas permasalahan ini.

D. Pengambilan beruntun (Snow-ball sampling).


Pengambilan beruntun (Snow-ball sampling) merupakan
teknik pengambilan sampel yang dilakukan dengan sistem jaringan
responden. Mulai dari mewawancarai satu responden. Kemudian,
responden tersebut akan menunjukkan responden lain dan responden
lain tersebut akan menunjukkan responden berikutnya. Hal ini
dilakukan secara terus-menerus sampai dengan terpenuhinya jumlah
anggota sampel yang diingini oleh peneliti.
Kelebihan dari pengambilan beruntun ini adalah bisa
mendapatkan responden yang kredibel di bidangnya. Kekurangannya
adalah memakan waktu yang cukup lama dan belum tentu mewakili
keseluruhan variasi yang ada.
CONTOH: Misalnya akan dilakukan penelitian tentang pola
peredaran narkoba di wilayah A. Sampel mula-mula adalah 5
orang Napi, kemudian terus berkembang pada pihak-pihak lain
sehingga sampel atau responden terus berkembang sampai
ditemukannya informasi yang menyeluruh atas permasalahan
yang diteliti.

(TAMBAHAN)

Kelebihan non probability sampling

1. Membutuhkan waktu, tenaga dan biaya yang lebih kecil dibanding probability
sampling.
Contoh, seorang mahasiswa ingin meneliti tentang minat baca masyarakat.
Untuk memudahkan penelitian, dia cukup mewawancarai 60 responden yang
ditemuinya di sekitar kampusnya, seperti di taman, tempat hiburan dan lain-
lain.

2. Tidak memerlukan kerangka sampel dalam memilih sampel penelitian. Yang


terpenting adalah adanya populasi target yang telah ditentukan oleh peneliti.
Misalnya, pada contoh nomor 1 di atas, si mahasiswa tidak perlu membuat
sample frame terlebih dahulu sebagai dasar penentuan responden yang akan
diwawancarainya.

Kekurangan non probability sampling


1. Hasil penelitian bisa jadi kurang representative karena subjektivitas peneliti
dalam memilih sampel target penelitian.
2. Analisis yang digunakan hanya sebatas analisis deskriptif saja, sehingga
kesimpulan penelitian hanya untuk menggambarkan kondisi/karekteristik
kumpulan individu yang menjadi sampel saja, bukan untuk mewakili
keseluruhan populasi.

APA ITU SCREENING DATA?


Dalam upaya memperoleh informasi yang akurat dari data yang kita
kumpulkan, sebaiknya data-data tersebut disipkan atau di screening terlebih
dahulu dan dilakukan transformasi data. Untuk melakukan transformasi data dapat
dilakukan dengan mudah menggunakan aplikasi SPSS.
Screening data merupakan bagian dari metode untuk menyiapkan data-
data agar dapat memberikan informasi yang maksimal. Terutama dalam
menganalisis data secara kuantitatif disarankan untuk melakukan screening data
terlebih dahulu. Screening data bertujuan untuk mengantisipasi data-data yang
tidak tersedia atau hilang (missing).
Screening data juga dilakukan untuk mengatasi kekurangan data ketika
pengisian kuesioner oleh responden. Sering ada pengisian data yang terlewat oleh
responden atau tidak mengisinya sehingga mengakibatkan data ini tidak tersedia.

MATERI PERTEMUAN VII: PENGUKURAN


A. OBJEKTIVITAS PENGUKURAN
Dalam pengertian sehari-hari telah diketahui bahwa objektif berarti tidak
adanya unsur pribadi yang mempengaruhi. Lawan dari objektif adalah
subjektif, artinya terdapat unsur pribadi yang mempengaruhi. Objektivitas
dalam pengukuran adalah kualitas yang menunjukkan identitas atau kesamaan
dari skor atau diagnosis yang diperoleh dari data yang sama dari penskor-
penskor kompeten yang sama. Sebuah tes dan pengukuran dikatakan memiliki
objektivitas apabila dalam melaksanakannya tidak ada faktor subjektivitas
yang mempengaruhi. Hal ini terutama terjadi pada sistem skoringnya. Apabila
dikaitkan dengan reliabilitas, maka objektivitas menekankan
ketetapan/konsistensi pada scoring, sedangkan reliabilitas menekankan pada
ketetapan dalam hasil tes. Ada 2 faktor yang mempengaruhi subjektifitas dari
sesuatu tes, yaitu bentuk tes dan penilai.
1. Bentuk tes
Tes yang berbentuk uraian, akan memberikan banyak
kemungkinan kepada si penilai untuk memberikan penilaian menurut
caranya sendiri. Dengan demikian maka hasil dari seorang siswa yang
mengerjakan soal-soal dari sebuah tes, akan dapat berbeda apabila dinilai
oleh dua orang penilai. Untuk menghindari masuknya unsure
subyektifitas dari penilai, maka system skoringnya dapat dilakukan
dengan cara sebaik-baiknya, antara lain dengan membuat pedoman
scoring terlebih dahulu.
2. Penilai
Subjektifitas dari penilai akan dapat masuk secara agak leluasa
terutama dalam tes bentuk uraian. Faktor yang mempengaruhinya
subjektifitas antara lain: kesan penilai terhadap siswa, tulisan, bahasa,
waktu pengadaan penilaian, kelelahan, dan sebagainya. Untuk
menghindari atau mengurangi subyektifitas dalam pekerjaan penilaian,
maka penilaian ini harus dilaksanakan dengan mengingat pedoman.
pedoman yang dimaksud terutama menyangkut masalah
pengadministrasian, yaitu kontinuitas (berkesinambungan/terus-menerus)
dan komprehensifitas.
a) Evaluasi harus dilakukan secara kontinuitas.
Dengan evaluasi yang dilakukan berkali-kali, maka guru akan
memperoleh gambaran yang lebih jelas tentang keadaan siswa. Tes
yang diadakan secara on the spot (mendadak/insidental) dan hanya
satu atau dua kali, tidak akan dapat memberikan hasil yang objektif
tentang keadaan seorang siswa. Faktor kebetulan, akan sangat
mengganggu hasilnya. Sebagai contoh: seorang anak yang sebenarnya
pandai, tetapi pada saat melakukan tes dalam kondisi tidak sehat,
maka ada kemungkinan nilai tesnya menjadi tidak baik.
b) Evaluasi harus dilakukan secara komprehensif (menyeluruh),
Yang dimaksud dengan evaluasi yang komprehensif di sini adalah
terdiri atas berbagai segi peninjauan, yaitu: mencakup keseluruhan
materi, mencakup berbagai aspek berpikir (ingatan, pemahaman,
aplikasi, dan sebagainya), dan melalui berbagai cara, yaitu: tes tertulis,
tes lisan, tes perbuatan, pengamatan incidental, dan sebagainya.
Objektivitas suatu tes ditentukan oleh tingkat atau kualitas
kesamaan skor-skor yang diperoleh dengan tes tersebut meskipun
hasik tes itu dinilai oleh beberapa orang penilai. Untuk ini diperlukan
kunci jawaban tes (scoring key). Kualitas objektivitas suatu tes dapat
dibedakan menjadi tiga tingkatan yaitu :
Kualitas objektivitas suatu tes dapat dibedakan menjadi tiga
tingkatan yaitu :
1) Objektivitas tinggi adalah kualitas tes yang telah di uji coba
sehingga hasil pemeriksaan mempunyai objektivitas yang sama
antara satu penelitian dengan penelitian yang lain. Contohnya : tes
yang sudah distandardisasi, hasil penskorannya sangat objektif.
2) Objektivitas sedang adalah kualitas tes yang sudah
distandardisasi, namun dalam pemeriksaannya terdapat hal-hal
yang mendorong kearah subjektif. Contohnya : tes yang sudah
distandardisasi, hasil penskorannya sangat objektif, namun dalam
analisisnya terdapat unsur objektif.
3) Objektivitas fleksibel adalah tes yang dimaksudkan untuk tujuan-
tujuan tertentu. Misalnya seperti tes untuk mengetahui minat dan
bakat, kepribadian, tes psikologi, dan lain-lain.

B. PENGANTAR & ISSUE VALIDITAS DAN REALIBITAS DALAM


PENGUKURAN

Pengertian Validitas
Validitas berasal dari kata validity yang berarti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau
instrumen pengukuran dikatakan memiliki validitas yang tinggi apabila alat
tersebut menjalankan fungsi ukurnya atau memberikan hasil ukur yang sesuai
dengan maksud dilakukannya pengukuran tersebut. Artinya hasil ukur dari
pengukuran tersebut tepat fakta atau keadaan sesungguhnya dari apa yang
diukur.
Kemudian, Arikunto menjelaskan bahwa validitas adalah suatu ukuran
yang menunjukkan tingkat keandalan atau kesahihan suatu alat ukur. Alat
ukur yang kurang valid berarti memiliki validitas rendah. Untuk menguji
validitas alat ukur, terlebih dahulu dicari harga korelasi antara bagian-bagian
dari alat ukur secara keseluruhan dengan cara mengkorelasikan setiap butir
alat ukur dengan skor total yang merupakan jumlah tiap skor butir, dengan
menggunakan rumus Pearson Product Moment.
Menurut Gronlund validitas dapat diartikan sebagai ketepatan yang
dihasilkan dari skor tes atau instrumen penilaian. Suatu instrumen penilaian
dikatakan valid apabila instrumen yang digunakan dapat mengukur apa yang
hendak diukur.4 Validitas suatu instrumen penilaian mempunyai beberapa
makna penting diantaranya seperti berikut:
a. Validitas berhubungan dengan ketepatan interpretasi hasil tes atau
instrumen penilaian untuk grup individual.
b. Validitas diartikan sebagai derajat yang menunjukkan kategori yang bisa
mencakup kategori rendah, menengah, dan tinggi.
c. Prinsip suatu tes valid, tidak universal. Validitas suatu tes yang perlu
diperhatikan oleh para peneliti adalah bahwa ia hanya valid untuk suatu
tujuan tertentu saja. Tes valid untuk bidang studi metrologi industry
belum tentu valid untuk bidang yang lain misalnyabidang mekanika
teknik.

Macam-Macam Validitas

Pada tahun 1940-an dan awal tahun 1950 para ahli pengukuran
pendidikan telah melakukan berbagai macam pengkajian terhadap bagaimana
menentukan dan menilai validitas. Pada tahun 1954 misalnya the American
Psychological Association Test and Diagnostic Techniques mengusulkan
empat pendekatan yang sering dinamakan empat muka validitas (four faces of
validity) yang digunakan untuk menentukan validitas. Empat validitas tersebut
dapat dikelompokkan menjadi validitas yang dapat diketahui melalui
pemikiran (validitas logis) dan hal yang kedua diketahui melalui uji empiris
(validitas empiris). Dua hal inilah yang merupakan garis besar sebagai dasar
pengelompokan validitas tes. Berikut penjelasan dari jenis-jenis validitas
tersebut:

1. Validitas Logis
Istilah ”validitas logis” mengandung kata ”logis” berasal dari kata
”logika”, yang berarti penalaran. Dengan demikian validitas logis
menunjuk pada kondisi instrumen valid berdasarkan hasil penalaran. Ada
dua macam validitas logis yang dapat dicapai oleh sebuah instrumen,
yaitu: validitas isi (content validity) dan validitas konstruk (construct
validity).
a. Validitas Isi (Content Validity)
Donald dkk. mengemukakan bahwa ”content validity is evidence
based on test content involves the test’s content and its relationship to
the construct it is intended to measure. The Standards defines
content-related evidence as The degree to which the sample of items,
tasks, or questions on a test are representative of some defined
universe or domain of content.” Donald mengartikan bahwa validitas
isi adalah hubungan isi dengan item atau pertanyaan-pertanyaan di
dalam tes yang representatif dari semua domain-domain isi pelajaran
atau sesuai dengan tujuan instruksional khusus yang telah ditentukan.
Senada dengan itu, Wayan mendefinisikan validitas isi sebagai
kejituan dari pada suatu tes ditinjau dari isi tes tersebut. Suatu tes
hasil belajar dapat dikatakan valid jika materi tes tersebut benar-benar
bahan yang representatif terhadap bahan-bahan pelajaran yang
diberikan.
Untuk menilai apakah suatu tes memiliki validitas isi atau tidak,
dapat dilakukan dengan jalan membandingkan materi tes tersebut
dengan analisa rasional yang kita lakukan terhadap bahan-bahan yang
seharusnya dipergunakan dalam menyusun tes tersebut. Apabila
materi tes tersebut cocok dengan analisa rasional yang kita lakukan,
berarti tes yang kita nilai itu mempunyai validitas isi, sebaliknya jika
materi tes tersebut menyimpang dari analisa rasional kita, berarti tes
tersebut tidak valid. Sebagian ahli tes berpendapat bahwa tidak
satupun pendekatan statistik yang dapat digunakan untuk menentukan
validitas isi suatu tes. Menurut Guion (1977), validitas isi hanya dapat
ditentukan berdasarkan judgmen para ahli. Validitas isi suatu tes tidak
mempunyai besaran tertentu yang dihitung secara statistika, tetapi
dipahami bahwa tes itu sudah valid berdasarkan telaah kisi-kisi tes.
Oleh karena itu, Wiersma dan Jurs (1990) menyatakan bahwa
validitas isi sebenarnya mendasarkan pada analisis logika. Berikut
merupakan prosedur yang dapat digunakan, antara lain:
1) mendefiniskan domain yang hendak diukur.
2) menentukan domain yang akan diukur oleh masing-masing soal.
3) membandingkan masing-masing soal dengan domain yang sudah
ditetapkan.

Berikut ini contoh prosedur yang semestinya digunakan. Deskripsi


domain yang hendak diukur dalam tes IPA terpadu :

Kemampuan yang Fisika Biologi kimia Bumi Jumlah


diukur Antariksa

Mengamati 1 1 1 - 3
Mengukur 1 - - 1 2
Membaca Tabel - 1 - 1 2
Membaca 1 1 1 1 4
Diagram
Membaca Grafik 1 1 1 - 3
Mengklasifikasi - 1 1 1 3
Memprediksi 1 - 1 1 3
Jumlah 5 5 5 5 20

Dari deskripsi domain di atas, maka langkah selanjutnya adalah membuat


soal yang representatif dengan domain-domain yang hendak dicapai.

1. Pada gambar bandul disamping,


gerak yang menunjukkan satu getaran adalah?
a. G-H-I
b. G-H-I-H-G
c. G-H-I-H
d. G-H-I-H-G-H-I
2. Jika sebuah bandul bergerak 4 kali dalam waktu 1 sekon, maka
berapa frekuensi bandul tersebut?
a. 4 hertz
b. 0,5 hertz
c. 0,25 hertz
d. 0,75 hertz

b. Validitas Konstruksi (Construct Validity)


Secara etimologis, kata ”konstruksi” mengandung arti susunan,
kerangka, atau rekaan. Adapun secara terminologis, tes hasil belajar
dapat dinyatakan sebagai tes yang telah memiliki validitas konstruksi,
apabila tes hasil belajar tersebut (ditinjau dari susunan, kerangka, atau
rekaannya) telah dapat dengan secara tepat mencerminkan suatu
konstruksi berpikir (aspek kognitif, afektif, dan psikomotorik)
sebagaimana telah ditentukan dalam tujuan instruksional khusus.
Konstruk (construct) adalah suatu yang berkaitan dengan fenomena
dan objek yang abstrak, tetapi gejalanya dapat diamati dan diukur.
Validitas konstruk mengandung arti bahwa suatu alat ukur dikatakan
valid apabila cocok dengan konstruksi teoritik dimana tes itu dibuat.
Dengan kata lain sebuah tes dikatakan memiliki validitas konstruksi
apabila soal-soalnya mengukur aspek yang diuraikan dalam standar
kompetensi, kompetensi dasar, maupun indikator yang terdapat dalam
kurikulum.
Konstruksi contoh dari kompetensi dasar, hasil belajar, dan
indikator yang terdapat dalam kurikulum.

DIMENSI INDIKATOR NOMOR JUMLAH


BUTIR
Kualitas Kerja a. Merencanakan Program `1,2,3 3
dengan tepat.
b. Melakukan Penilaian hasil 4,5 2
belajar denga teliti
c. Berhati-hati dalam 6 1
d. Menerapkan hasil penelitian 7 1
dalam pembelajaran.

Dari tabel di atas, kita dapat membuat item pertanyaan sesuai


dengan indikator-indikator yang ingin dicapai.

No Pernyataan Jawaban
1 Sebelum mengajar saya menyiapkan rencana a. Sangat sering
pelajaran . b. Sering
c. Kadang –kadang
d. Kurang
e. Tidak pernah
2 Rencana pengajaran saya susun berdasarkan a. Sangat sering
analisis kemampuan awal siswa b. Sering
c. Kadang –kadang
d. Kurang
e. Tidak pernah

2. Validitas Empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya
“pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas
empiris apabila sudah diuji secara empiris. Validitas empiris sama dengan
validitas kriteria yang berarti bahwa validitas ditentukan berdasarkan
kriteria, baik kriteria internal maupun kriteria eksternal. Kriteria internal
berarti tes atau instrumen itu sendiri yang menjadi kriteria, sedangkan
kriteria eksternal adalah hasil ukur instrumen atau tes lain diluar instrumen
itu sendiri yang menjadi kriteria.
a. Validitas Internal
Validitas internal disebut pula sebagai validitas butir. Validitas
internal memperlihatkan seberapa jauh hasil ukur butir tersebut
konsisten dengan hasil ukur instrumen secara keseluruhan. Oleh
karena itu, validitas butir tercermin pada besaran koefisien korelasi
antara skor butir dan skor total instrumen. Jika koefisien korelasi
antara skor butir dengan skor total instrumen positif dan signifikan,
maka butir tersebut dapat dianggap valid berdasarkan ukuran validitas
internal. Bryman17 mengungkapkan bahwa “internal validity is
common to refer to the factor that has a causal impact as the
independent variable and the effect as the dependent variable.”
Validitas internal pada umumnya merujuk pada faktor yang memiliki
pengaruh sebab sebagai variabel bebas dan akibat sebagai variabel
terikat. Untuk menghitung koefisien korelasi validitas antara skor butir
dan skor total pada skor butir kontinum, maka rumus yang digunakan
adalah Pearson Product Moment sedangkan pada skor butir dikotomi,
maka rumus yang digunakan adalah koefisien korelasi biserial. Untuk
lebih memahami perhitungan validitas internal, maka dapat dilihat
pada subbab pengujian validitas.
b. Validitas Eksternal
Validitas eksternal dapat dibagi menjadi dua, yaitu validitas
bandingan (concurrent validity) dan validitas ramalan (predictive
validity).
1) Validitas Bandingan (concurrent validity)
Validitas bandingan artinya kejituan daripada suatu tes
dapat dilihat dari korelasinya terhadap kecakapan yang telah
dimiliki saat kini secara riil. Cara yang digunakan untuk menilai
validitas bandingan adalah dengan cara mengkorelasikan hasil-
hasil yang dicapai dalam tes tersebut dengan hasil-hasil yang
dicapai dalam tes yang sejenis yang diketahui mempunyai validitas
tinggi (misalnya tes standar). Tinggi rendahnya koefisien korelasi
yang diperoleh menunjukkan tinggi rendahnya validitas tes yang
akan kita nilai kualitasnya.
2) Validitas Ramalan (Prediktif Validity)
Validitas prediktif adalah ketepatan (kejituan) dari suatu
alat ukur ditinjau dari kemampuan tes untuk meramalkan prestasi
yang dicapainya kemudian. Cara yang dipergunakan untuk menilai
tinggi rendahnya validitas prediktif ini ialah dengan jalan mencari
korelasi antara nilai-nilai yang dicapai oleh anak-anak dalam tes
tersebut dengan nilai-nilai yang dicapainya kemudian. Supaya
lebih memperjelas perbedaan antara validitas isi, konstruksi,
konkuren, dan prediktif di atas, maka berikut merupakan
penjelasan- penjelasan singkat yang berkenaan dengan tempat
validitas tersebut yang diuraikan di dalam table :

Ketik Pertanyaan Metode


Konten terkait Apakah tes ini representatif Buatlah analisis logis dari
Sample dari domain tersebut konten untuk menentukan
diukur ? seberapa baik
Itu menutupi dominan.
Kriteria terkait Apakah tes baru berkolerasi Korelasikan skor dari tes
(bersamaan) dengan tes yang tersedia saat baru dengan skor kriteria
ini (criteria) sehingga baru yang tersedia ada saat itu.
tes bias menjadi pengganti ?

Keriteria terkait Apakah tes baru berkolerasi Korelasikan skor tes


( Prediktiv) dengan kriteria masa depan dengan ukuran (kriteria)
sehingga yang terbaik bias tersedia di waktu masa
digunakan memprediksi depan .
kinerja nanti kriteria?
Konstruksi Apakah tes tersebut benar- Kumpulan berbagai
terkait benar mengukur konstruksi macam bukti : konvergen
yang dimksud dan bukti yang berbeda ,
diketahui teknik
kelompok , intervensi studi
,struktur internal, dan
proses respon.

FAKTOR-FAKTOR YANG MEMPENGARUHI RELIABILITAS

Menurut Cook & Beckman, 2006, terdapat beberapa faktor yang


mempengaruhi reliabilitas, diantaranya adalah:
1. Definisi yang jelas mengenai suatu konstrak pengukuran
2. Panjang alat ukur
3. Variabilitas kemampuan kelompok
4. Instruksi tes yang ambigu
5. Perbedaan sosio-kultural
6. Penambahan item-item yang tidak tepat.

Pengertian Reliabilitas
Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam
bahasa Inggris, berasal dari asal kata reliabel yang artinya dapat dipercaya.
Instrumen tes dikatakan dapat dipercaya jika memberikan hasil yang tetap
apabila diteskan berkali-kali. Jika kepada siswa diberikan tes yang sama pada
waktu yang berlainan, maka setiap siswa akan tetap berada dalam urutan yang
sama atau ajeg dalam kelompoknya. Uno, dkk. Memberikan penekanan pada
pengertian reliabilitas sebagai konsistensi tes. Yaitu, seberapa konsisten skor
tes dari satu pengukuran ke pengukuran berikutnya. Reliabilitas merujuk pada
ketetapan/keajegan alat tersebut dalam menilai apa yang diinginkan, artinya
kemampuan alat tersebut digunakan akan memberikan hasil yang relatif sama.
Dalam http://wapedia.mobi/id reliabilitas, keandalan adalah konsistensi dari
serangkaian pengukuran atau serangkaian alat ukur. Hal tersebut bisa berupa
pengukuran dari alat ukur yang sama (tes dengan tes ulang) akan memberikan
hasil yang sama, atau untuk pengukuran yang lebih subjektif, apakah dua
orang penilai memberikan skor yang mirip (reliabilitas antar penilai).
Jadi jelas bahwa, reliabilitas diartikan dengan keajekan (konsistensi) bila
mana tes tersebut diuji berkali-kali hasilnya relatif sama, artinya setelah hasil
tes yang pertama dengan tes yang berikutnya dikorelasikan terdapat hasil
korelasi yang signifikan. Derajat hubungan ini ditunjukkan dengan koefesien
reliabilitas yang bergerak dari 0 sampai dengan 1. Jika koefesiennya seperti
intelegensi, bakat dan minat, perilaku, persepsi siswa, atau hasil belajar siswa.
Dan untuk mengukur dimensi tersebut kita memerlukan instrumen tes yang
benar-benar reliabel. Alan Bryman juga mengungkapkan bahwa “The
reliability term is commonly used in relation to the question of wheter the
measures that are devised for concepts in the social sciences (such as poverty,
racial prejudice, deskilling, religious orthodoxy) are consistent. Reliability is
particularly at issue in connection with quantitative research. The
quantitative researcher is likely to be concerned with the question of whether
a measure is stable or not. After all, if we found that IQ tests. Which were
designed as measures of intelligence, were found to fluctuate, so that people’s
IQ scores were often wildly different when administered on two or more
occasions, we would be concerned about it as a measure.”

Macam-Macam Reliabilitas
Salah satu syarat agar hasil ukur suatu tes dapat dipercaya ialah tes
tersebut harus mempunyai reliabilitas yang memadai. Reliabilitas dibedakan
menjadi dua, yaitu:
1. Reliabilitas Tanggapan
Reliabilitas konsistensi tanggapan responden mempersoalkan
apakah tanggapan responden atau objek terhadap tes tersebut sudah baik
atau konsisten. Maksudnya adalah apabila kita melakukan suatu
pengukuran terhadap suatu objek kemudian dilakukan pengukuran
kembali terhadap objek yang sama maka apakah hasilnya masih tetap
sama dengan hasil yang diperoleh dari pengukuran sebelumnya. Jika item-
item dalam dua kali pengukuran itu tidak sama atau tidak setara, maka
tidak akan menemukan konsistensi tanggapan terhadap dua hal yang jelas
berbeda. Dan bukanlah merupakan tujuan atau tugas pemeriksaan
reliabilitas.
Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan
responden terhadap tes, yaitu:
(1). Teknik test-retest
Test-retest is an obvious to estimate the reliability of a test is to the
same group of individuals on two occasions and correlate the two sets of
scores. Pada intinya Test-retest ialah pengetesan dua kali menggunakan
suatu tes yang sama pada waktu yang berbeda.

(2). Teknik belah dua


Split-Half Reliability the simplest of the internal-consistency
procedures, known as the split-half, artificially splits the test into two
halves and correlates the individuals’ scores on the two halves.
Researchers administer the test to a group and later divide the items into
two halves, obtain the scores for each individual on the two halves, and
calculate a coefficient of correlation. Teknik belah dua adalah prosedur
konsistensi yang paling sederhana, Pembagian tes yang dibuat menjadi dua
bagian dan mengkorelasikan skor individu ke dalam dua bagian. Peneliti
memberikan tes menjadi satu kelompok dan kemudian membagi item-
item menjadi dua bagian, menghasilkan skor untuk masing-masing
individu dalam dua bagian, dan menghitung koefisien korelasinya.
Berbeda dengan metode bentuk paralel dan tes ulang, metode belah
dua hanya menggunakan sebuah tes dan dicobakan satu kali. Metode ini
disebut juga single-test-trial-method. Ada dua cara membelah butir soal,
yaitu:
a. Membelah item-item genap dan item-item ganjil yang selanjutnya
disebut belahan ganjil-genap.
b. Membelah item-item awal dan item-item akhir yaitu separuh jumlah
pada nomor-nomor awal dan separuh jumlah nomor-nomor akhir.
(3). Teknik Paralel (Ekivalen)

Researchers use the equivalent-forms technique of estimating


reliability, which is also referred to as the alternate-forms technique or
parallel-forms technique, when it is probable that subjects will recall their
responses to the test items. Here, rather than correlating the scores from
two administrations of the same test to the same group, the researcher
correlates the results of alternate (equivalent) forms of the test
administered to the same individuals. If the two forms are administered at
essentially the same time (in immediate succession), the resulting
reliability coefficient is called the coefficient of equivalence. Pengertian di
atas mengidikasikan bahwa peneliti menggunakan bentuk penaksiran
reabilitas ekivalen ketika subjek akan ditarik tanggapan kedalam item tes.
Peneliti mengkorelasikan hasil-hasil secara bergantian dari tes yang
dilakukan pada individu yang sama. Jika dua bentuk dilakukan pada waktu
yang sama, hasil koefisien reabilitas disebut dengan koefisien ekivalen.

CONTOH: misalnya Bahasa Inggris seri A yang akan dicari


realibilitasnya dan tes seri B diteskan kepada sekelompok siswa yang
sama. Setelah itu, hasil keduanya dikorelasikan. Koefisien korelasi
dari kedua hasil tes inilah yang menunjukkan koefisien reabilitas tes
seri A. Jika koefisiennya tinggi maka tes tersebut dapat dikatakan
reliabel.

2. Reliabilitas konsistensi gabungan Item


Reliabilitas konsistensi gabungan item ini berkaitan dengan
kemantapan atau konsistensi antara item-item pada suatu tes. Artinya
semua butir pertanyaan/pernyataan dalam suatu tes dapat dikatakan
sebagai alat ukur yang mengukur dimensi/indikator variabel secara
konsisten atau tidak terdapat pertanyaan/pernyataan yang kontradiktif.
Sehingga, apabila hasil pengkuran pada bagian objek ukur yang
sama antara item yang satu dengan item yang lain saling kontradiksi atau
tidak konsisten maka kita jangan menyalahkan objek ukur, melainkan alat
ukur yang dipermasalahkan, dengan mengatakan bahwa tes tersebut tidak
reliable terhadap objek ukur yang diukur. Koefisien reliabilitas konsistensi
gabungan item dapat dihitung menggunakan:
1) Rumus Kuder-Richardson, yang dikenal dengan nama KR-20 dan
KR-21
Teknik pengujian reliabilitas dengan uji internal consistency yang
selanjutnya dibahas adalah teknik Kuder Richardson atau sering
disingkat KR. Instrumen yang dapat diuji reliabilitasnya menggunakan
KR adalah instrumen dengan satu jawaban benar saja. Rumus KR yang
sering digunakan adalah KR 20 dan KR 21.
Kedua teknik KR tersebut memiliki kriteria instrumen khusus
untuk bisa menggunakan rumusnya. Saat instrumen tidak dapat
dipastikan bahwa setiap item soal memiliki tingkat kesulitan yang
sama, maka instrumen tersebut dianalisis reliabilitasnya menggunakan
rumus KR 20 (Fraenkel, Wallen, & Hyun, 2012).
2) Rumus koefisien Alpha Cronbach
Pengujian reliabilitas menggunakan uji Alfa Cronbach dilakukan
untuk instrumen yang memiliki jawaban benar lebih dari 1 (Adamson
& Prion, 2013). Instrumen tersebut misalnya instrumen berbentuk esai,
angket, atau kuesioner.
3) Rumus reliabilitas Hoyt
Konsep dalam teknik analisis varian Hoyt adalah memandang
distribusi aitem keseluruhan subjek sebagai data pada suatu desain
eksperimen faktorial dua-jalan tanpa replikasi, yang dikenal pula
sebagai item by subject design. Setiap aitem dianggap sebagai suatu
perlakuan yang berbeda sehingga setiap kali subjek dihadapkan pada
suatu aitem seakan-akan berada pada suatu perlakuan yang berbeda,
sehingga banyaknya aitem merupakan banyaknya perlakuan.

(TAMBAHAN)
Faktor-Faktor yang Mempengaruhi Reliabilitas

Dalam mengestimasi reliabilitas tes ada beberapa faktor yang dapat


mempengaruhi reliabilitas tes, sehingga tes tersebut tidak reliabel. Pada
umumnya, dalam pendidikan reliabilitas sebuah tes dipengaruhi oleh
adanya permanen ataupun faktor yang terjadi karena faktor sementara
seperti karena kelelahaan ,menerka,atau pengaruh latihan. Selanjutnya,
Donald , dkk., menggambarkan faktor-faktor yang turut mempengaruhi
reliabilitas instrument penelitian :

Faktor Efek Potensial


1. Panjang yang terbalik Semakin lama pengujian, semakin besar
reabilitasnya .
2. Heterogenitas Kelompok Semakin heterogen suatu kelompok
,semakin reliabilitasnya.
3. Tes tingkat kemampuan kelompok A yang mudah atau terlalu sulit untuk
kelompok menghasilkan reliabilitas yang
lebih rendah .
4. Ajaran yang digunakan untuk Test-retest dan split –half memberikan
mengestimasi reabilitas estimasi yang lebih tinggi ,bentuk yang
setara memberikan perkiraan yang lebih
rendah .
5. Sifat Variabel Uji variabel yang lebih mudah diukur
menghasilkan keandalan yang lebih
tinggi .
6. Objektifitas Penelitian Semakin objektif penilaian, semakin
besar keandalannya.

(TAMBAHAN)

Faktor-Faktor yang Mempengaruhi Reliabilitas


a. Pemilihan aitem. Tes merupakan pemilihan aitem-aitem yang
digunakan untuk mengukur suatu konstrak, dengan demikian
pemilihan aitem tersebut dapat menjadi sumber kesalahan dalam
pelaksanaan tes. Untuk meningkatkan konsistensi dapat
memperbanyak pemilihan aitem yang digunakan (Jacobs,1991).
Dengan demikian akan mengurangi responden untuk asal tebak dalam
menjawab. Namun aitem ini juga harus dipertimbangkan kualitas
pertanyaannya, karena apabila tidak dan aitem yang diberikan banyak
dapat membuat responden kelelahan.
b. Penyusunan aitem. Kalimat yang ambigu atau kurangnya kata dalam
suatu kalimat juga dapat mempengaruhi interpretasi responden
sehingga dapat mempengaruhi reliabilitas.
c. Pemberian administrasi tes. Kalimat instruksi yang kurang jelas
atau suasana yang bising dapat mempengaruhi responden ketika
menjawab.
d. Penilaian (scoring), pada tes esai memiliki reliabilitas yang lebih
rendah dibandingkan dengan tes pilihan ganda. Karena pada tes esai,
penilai memiliki interpretasi yang berbeda-beda dalam menilai
jawaban responden sehingga lebih bersifat subyektif.
e. Tingkat kesulitan dari suatu tes. Nilai dari suatu tes menunjukkan
reliabilitas yang baik apabila nilai tersebut menyebar dari skala yang
digunakan dengan demikian dapat terlihat perbedaan antar siswa.
Faktor yang terakhir adalah siswa, dimana kelelahan, kecemasan, dan
siswa sakit dapat menyebabkan reliabilitas yang rendah karena
mempengaruhi kinerja mereka dalam mengerjakan tes (Jacobs,1991).

Anda mungkin juga menyukai