Anda di halaman 1dari 10

Validitas dan Reliabilitas Instrumen CTTMC pada Pembelajaran IPA Terpadu SMP

Marantika Lia Kristyasari

ABSTRACT ARTICLE HISTORY


The CTTMC instrument is an assessment instrument with a two- Submitted 19 Februari 2022
Revised 20 Februari 2022
tier multiple-choice type, consisting of a first tier and a second Accepted 21 Februari 2022
tier. Developing an instrument requires data analysis. The data KEYWORDS
analysis consisted of validity and reliability tests. In the content validity, reliability, CTTMC instrument,
validity test using the Aiken formula. Content validity analysis
science learning
data were obtained from 9 validators. The validation process is
carried out through a group discussion forum (FGD). The CITATION (APA 6th Edition)
reliability test used Alpha Cronbach's formula with the ITEMAN Marantika Lia Kristyasari. (2021). Validitas dan Reliabilitas
application. The results of the content validity were more than Instrumen CTTMC pada Pembelajaran IPA Terpadu SMP.
Pedagogika: Jurnal Ilmu-ilmu Kependidikan. Volume 1 (1), page.
0.74, thus indicating that all the developed items were declared
76 – 85
valid. While the reliability results obtained were obtained in the
medium-scale trial, tier 1 was 0.711 and tier 2 was 0.707, while *CORRESPONDANCE AUTHOR

in the broad-scale trial, tier 1 was 0.833 and tier 2 was 0.873,
indicating that the questions developed had high reliability. marantika_fkip@unmus.co.id

Universitas Musamus Merauke, Indonesia

PENDAHULUAN
Perkembangan ilmu pengetahuan dan teknologi telah membawa perubahan yang besar di kehidupan
manusia dan menimbulkan persaingan secara global, terutama di bidang pendidikan. Hal ini terlihat jelas bahwa
pendidikan di Negara Indonesia memiliki tantangan yang semakin kompleks, karena masyarakat mulai memahami
dan menuntut adanya perubahan terhadap kualitas pendidikan. Dengan demikian, di era globalisasi yang semakin
berkembang pesat sekarang ini, pendidikan diharapkan tidak hanya menjadi salah satu sektor penting dalam
pembangunan di setiap Negara saja, melainkan dapat menjadi jembatan yang menghubungkan antara individu
dengan lingkungan. Sehingga individu tersebut mampu berperan sebagai SDM yang berkualitas.
Aplikasi skenario dunia nyata merupakan proses dan strategi yang efektif dalam kegiatan pembelajaran
termasuk pembelajaran IPA (Morrison, and Estes, 2007). Penerapan kurikulum 2013 saat ini, diharapkan fungsi dan
tujuan pendidikan nasional dapat tercapai. Kurikulum 2013 memfasilitasi dan mendorong guru maupun peserta didik
untuk mendapatkan Standar Kompetensi Lulusan yang diinginkan. Sehingga sangatlah tepat sistem pendidikan di
Indonesia mulai menerapkan kurikulum 2013. Selain itu setiap guru juga dituntut untuk mengaplikasikan kegiatan
pembelajaran dengan menggunakan pendekatan saintifik. Pendekatan saintifik ini cocok untuk seluruh mata
pelajaran, terutama mata pelajaran yang berhubungan dengan ilmu pengetahuan alam atau sains. Dengan adanya
kurikulum 2013, peserta didik lebih mudah untuk memahami suatu materi karena mereka terlibat secara aktif di

© 2021 The Author(s). Published by Medan Resource Center 76


This is an Open Access article distributed under the terms of the Creative Common Attribution License (http://creativecommons.org/license/by/4.0/),
which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Validitas dan Reliabilitas Instrumen CTTMC pada Pembelajaran IPA Terpadu SMP |77
dalam kegiatan pembelajaran sehingga hal ini dapat membuat mereka lebih menikmati proses pembelajaran
(Wright, 2001). Selain kurikulum, pendekatan, strategi, model maupun metode dalam kegiatan pembelajaran,
penilaian juga merupakan salah satu bagian penting di dalam pendidikan. Penilaian dilakukan dengan tujuan untuk
mengukur dan menilai tingkat ketercapaian dari kurikulum yang digunakan dalam kegiatan pembelajaran. Salah satu
bentuk penilaian yang sering digunakan adalah ulangan harian.
Sains memiliki peran yang sangat penting dalam mendorong kemajuan Ilmu Pengetahuan dan Teknologi
(IPTEK) dan dalam meningkatkan nilai, sikap, maupun kemampuan dalam berpikir. Pendidikan sains memiliki peran
yang sangat penting dalam menyiapkan anak untuk memasuki dunia kehidupannya. Sains pada hakekatnya
merupakan sebuah produk dan proses. Produk sains meliputi fakta, konsep, prinsip, teori dan hukum. Proses sains
meliputi cara-cara memperoleh, mengembangkan dan menerapkan pengetahuan yang mencakup cara kerja, cara
berpikir, cara memecahkan masalah dan cara bersikap. Oleh karena itu, sains secara sistematis dirumuskan dan
didasarkan pada pengamatan dan induksi. Potensi ini akan terwujud apabila pendidikan sains mampu melahirkan
peserta didik yang cakap dalam bidangnya dan berhasil menumbuhkan kemampuan berpikir logis, berpikir kreatif,
kemampuan memecahkan masalah, bersifat kritis, menguasai teknologi serta adaptif terhadap perubahan dan
perkembangan zaman. Tindakan memahami sains dan mengaplikasikan sains bagi kebutuhan masyarakat tersebut
yang disebut dengan science literacy (Hurt, 1997).
Literasi sains (Scientific literacy) merupakan salah satu ranah studi Programme for International Student
Assessment (PISA) yang terfokus pada kemampuan seseorang untuk dapat menggunakan pengetahuan dan
keterampilan sains dalam membuat keputusan dan memecahkan suatu permasalahan. Literasi sains merupakan
pengetahuan ilmiah individu dan kapasitas menggunakan pengetahuan tersebut untuk mengidentifikasi pertanyaan,
memperoleh pengetahuan baru, menjelaskan fenomena ilmiah dan menarik kesimpulan berdasarkan bukti tentang
isu-isu yang berkaitan dengan sains (OECD, 2014). Seorang yang literat sains adalah orang yang menggunakan
konsep sains, keterampilan proses dan nilai dalam membuat keputusan sehari-hari yang berhubungan dengan orang
lain maupun lingkungan dan memahami interelasi antara sains, teknologi dan masyarakat termasuk dalam hal
perkembangan sosial dan ekonomi (National Teacher Association 1998). Tiga elemen standar yang terdapat dalam
literasi sains, antara lain proses sains, konten sains, dan konteks aplikasi sains.
Kemampuan literasi sains setiap individu penting untuk dikembangkan dan dikuasai oleh peserta didik,
terutama dalam memahami lingkungan hidup, memiliki kemampuan dan kreativitas individu untuk menggunakan
pengetahuan serta keterampilan ilmiahnya dalam memecahkan masalah terutama yang berhubungan dengan
kehidupan sehari-hari, serta dapat membuat keputusan yang dapat dipertanggungjawabkan. Tujuannya agar setiap
individu mampu menghadapi tantangan global yang semakin kompleks. Salah satu bentuk literasi sains pada individu
adalah peka terhadap kemajuan IPTEK dan dapat mengidentifikasi dampak dari tindakan yang dilakukan (Miller,
2008). Pembelajaran sains sangat bertanggung jawab atas literasi sains peserta didik, sehingga kualitas pendidikan
sains perlu ditingkatkan agar dapat mencapai taraf pengembangan yang berkelanjutan (Liliasari, 2011). Literasi sains
mendukung pencapaian hasil belajar dan aktivitas belajar peserta didik di kelas (Haristy, 2013).
78 | Marantika Lia Kristyasari
Instrumen penilaian yang dikembangkan pada penelitian ini adalah instrumen Computerized Two-Tier
Multiple Choice (CTTMC) yang dapat mengukur kemampuan literasi sains. Instrumen CTTMC merupakan instrumen
penilaian berupa tes objektif dua tingkat yang berbasis komputer (terkomputerisasi). Tingkatan pertama berupa soal
utama (first tier) dan tingkatan kedua berupa alasan pemilihan jawaban (second tier). Instrumen penilaian CTTMC
dipilih karena di SMP tipe pilihan ganda bertingkat dua belum pernah di terapkan apalagi soal pilihan ganda
bertingkat yang terkomputerisasi. Instrumen penilaian CTTMC juga ditunjang dengan model penskoran Graded
Response Model (GRM). Model GRM dipilih dengan tujuan untuk memudahkan guru dalam melakukan pemeriksaan
jawaban siswa dan sekaligus dapat mendeteksi kemampuan siswa. Graded Response Model (GRM) sesuai digunakan
ketika item yang dipakai dapat dikategorikan atau memiliki respon bertingkat seperti yang digunakan pada skala
Likert (Embertson dan Raise, 2000). Tes pilihan ganda dua tingkat, sangat efektif untuk menentukan miskonsepsi
peserta didik dan dapat digunakan sebagai alternatif penilaian tes evaluasi terhadap prestasi belajar peserta didik
(Tuysuz, 2009). Penerapan penskoran Graded Response Model (GRM) ini dapat diaplikasikan pada penskoran
instrumen Computerized Two-Tier Multiple Choice (CTTMC). Aplikasi penskoran GRM pada instrumen CTTMC tersaji
pada tabel 1.
Tabel 1: Skoring pada Instrumen Computerized Two-Tier Multiple Choice (CTTMC)
No. Aspek Penilaian Kor
Jabawan
1 benar pada First tier dan Second tier 3
Jawaban
2 benar pada First tier dan jawaban salah pada Second tier 2
Jawaban
3 salah pada First tier dan jawaban benar pada Second tier 1
Jawaban
4 salah pada First tier dan Second tier 0
Pedoman penskoran GRM dapat digunakan untuk menganalisis kemampuan peserta didik selain prestasi
belajar, dapat mengetahui kelemahan peserta didik dan meniminalisir adanya guesing. Sehingga dapat diketahui
profil kemampuan setiap peserta didik berdasarkan jawaban yang mereka berikan.
Validitas dan reliabilitas merupakan dua komponen yang penting untuk mengetahui kualitas dan
performansi dari suatu instrumen penilaian. Validitas merujuk pada derajat dari fakta dan teori yang mendukung
interpretasi skor tes, serta merupakan pertimbangan paling penting dalam pengembangan tes (American
Educational Research Association (AERA), American Psychological Associaton (APA), and National Council on
Measuerement in Education (NCME) dalam Standards for Edicational and Psychological Testing, 1999). Ahli lain
mengemukakan bajwa validitas suatu alat ukur adalah sejauh mana alat ukur itu mampu mengukur apa yang
seharusnya diukur (Nunnally, 1978; Allen & Yen, 1979; Kerlinger, 1986). Validitas dapat dikelompokkan menjadi tiga
tipe, antara lain (1) validitas kriteria criterion- related validity, (2) validitas isi/content validity, dan (3) validitas
konstruk/contruct validity (Nunnally, 1978; Allen & Yen, 1979: 97; Fernandes, 1984; Kerlinger, 1986; dan Lawrence
1994). Validitas isi sebagai sebuah validasi kualitatif dimana domain konsep menjadi lebih jelasn dan tugas ahli
adalah menganalisis apakah sudah secara keseluruhan mewakili domain yang diukur (Bollen, 1989). Dengan
demikian, validitas isi merupakan sarana kualitatif untuk memastikan bahwa indikator telah sesuai dengan konsep
yang di definisikan oleh peneliti.
Validitas dan Reliabilitas Instrumen CTTMC pada Pembelajaran IPA Terpadu SMP |79
Validitas isi (content validity) suatu instrumen adalah seauh mana butir-butir dalam instrumen itu mewakili
komponen-komponen dalam keseluruhan kawasan isi dari objek yang hendak diukur tersebut dan sejauh mana buti-
butir itu mencerminkan ciri perilaku yang hendak diukur (Nunnally, 1978; Fernandes, 1984). Sementara itu, ada
pendapat lain yang menyatakan bahwa validitas isi merupakan keterwakilan pertanyaan terhadap kemampuan
khusus yang harus diukur (Lawrence, 1994). Berdasarkan penjelasan di atas, maka dapat disimpulkan bahwa validitas
isi terkait dengan analisis rasional kemampuan yang hendak diukur. Sehingga, dengan demikian validitas isi menjadi
hal yang penting untuk dianalisis dalam instrumen penilaian, terutama instrumen penilaian Computerized Two-Tier
Multiple Choice (CTTMC) yang dikembangkan pada penelitian ini.
Reliabilitas adalah keakuratan dan ketepatan dari suatu alat ukur dalam prosedur pengukuran. Koefisien
reliabilitas mengindikasikan adanya stabilitas skor yang diperoleh oleh individu yang merefleksikan proses reproduksi
skor. Skor stabil apabila skor yang diperoleh pada suatu waktu dan pada waktu yang lain hasilnya relatif sama.
Makna lain dari reliabilitas dalam terminology stabilitas adalah subyek yang dikenai pengukuran akan menempati
rangking yang relatif sama pada testing yang terpisah dengan alat tes yang ekuivalen (Singh, 1986; Thorndike, 1991).
Estimasi reliabilitas sebagai alat ukur dapat dicapai dengan menggunakan tiga metode, antara lain metode “retest”
atau tes ulang, metode “alternate form” atau tes pararel dan metode “split-half” atau metode internal (Guilford,
1954; Thorndike, 1997; Azwar, 2000; Suryabrata, 2000).
Metode konsistensi internal dilakukan dengan cara memberikan satu bentuk tes yang hanya diberikan
sekali pada kelompok subjek (single trial administration) dengan tujuan untuk menghindari kelemahan pada dua
metode terdahulu. Untuk estimasi reliabilitas, dapat dilihat melalui konsistensi antar item atau antar bagian tes itu
sendiri yang sudah dibelah sebelumnya dengan menggunakan teknik komputasi tertentu. Semakin tinggi nilai
validitas dan reliabilitas suatu instrumen, maka akan semakin jitu data yang diperoleh dari suatu penelitian. Suatu
instrumen dinyatakan berkualitas baik apabila item-item dalam suatu instrumen yang sama diuji beberapa kali
kepada subyek atau responden yang sama atau hampir sama (Howard and Hendry). Sehingga dapat disimpulkan
bahwa reliabilitas adalah ketepatan pengukuran suatu instrumen penilaian.
PEMBAHASAN
A. Validitas Isi
Validitas isi dapat ditentukan dengan melalui dua tahapan: pengembangan dan judgment ahli (Lynn, 1986).
Dalam pemilihan ahli atau validator harus sesuai dengan instrumen yang akan ditelaah. Pemilihan ahli ini sangat
penting karena akan menentukan kualitas dari instrumen yang dikembangkan. Pada penelitian ini proses validitas
dilakukan pada Forum Group Discussion (FGD) yang melibatkan 9 ahli (expert/validator). Validator yang dipilih terdiri
dari 3 orang dosen ahli bidang materi dan evaluasi yang telah bergelar doktor dan 6 orang guru IPA SMP yang telah
berpengalaman mengajar lebih dari 15 tahun dan bergelar magister. Lembar validasi terdiri dari 3 aspek utama, yaitu
aspek materi, konstruksi, dan aspek bahasa/budaya yang dijabarkan menjadi 14 item. Para ahli (expert) diminta
untuk melakukan telaah pada setiap item soal instrumen Computerized Two-Tier Multiple Choice (CTTMC).
80 | Marantika Lia Kristyasari
Hasil penilaian dari 9 orang ahli (expert) ini akan dianalisis datanya menggunakan formula Aiken. Sehingga
diperoleh nilai validitas isi dari instrumen penilaian Computerized Two-Tier Multiple Choice (CTTMC). Dalam lembar
penilaian validasi instrumen yang diberikan kepada 9 expert, terdapat empat pilihan kategori antara lain: kategori
Relevan (R), kategori Cukup Relevan (CR), kategori Kurang Relevan (KR), dan Tidak Relevan (TR). Instrumen dikatakan
relevan (R) apabila dari sisi kontruksi, materi dan bahasa sudah baik. Instrumen dikatakan cukup relevan (CR) apabila
indikator, keterampilan, kemampuan dan materi yang akan diukur sudah sesuai namun masih terdapat kesalahan
dalam pemilihan kata (bahasa). Instrumen dikatakan kurang relevan (KR) apabila kemampuan dan keterampilan atau
materi yang hendak diukur kurang cocok (perlu direvisi), dan instrumen dikatakan tidak relevan (TR) apabila butir
soal sama sekali tidak mencerminkan indikator soal, indikator kemampuan literasi sains, dan kompetensi dasar yang
akan diukur.
Indikator kemampuan literasi sains yang ditelaah dalam instrumen Computerized Two-Tier Multiple Choice
(CTTMC) ini meliputi mengidentifikasi pertanyaan ilmiah, mengidentifikasi bukti yang diperlukan dalam penyelidikan
ilmiah, menarik dan mengevaluasi kesimpulan, mengkomunikasikan kesimpulan yang valid, dan menggunakan
konsep-konsep sains dalam situasi yang berbeda dari apa yang dipelajarinya. Para ahli diminta untuk memberikan
tanda cek (√) di setiap buir soal yang telah ditelaah pada tabel yang telah disusun oleh peneliti seperti yang terlihat
pada Tabel 2.
Tabel 2. Tabel Lembar Validasi Instrumen Computerized Two-Tier Multiple Choice (CTTMC)
KD: 3.1. Menganalisis gerak pada makhluk hidup, sistem gerak pada manusia, dan upaya menjaga
kesehatan sistem gerak
KD: 3.3. Menjelaskan konsep usaha, pesawat sederhana, dan penerapannya dalam kehidupan sehari-
hari termasuk kerja otot pada struktur rangka manusia
Indikator Validasi Saran
Butir Soal
No Literasi Indikator Soal TR KR CR R
Sains
1. Menarik dan Diberikan sebuah Di dalam tubuh manusia,
mengevaluasi informasi mengenai terdapat zat kimia yang
kesimpulan beberapa zat kimia tersebar di seluruh tubuh, salah
yang terdapat di dalam satunya di dalam sistem gerak
tubuh manusia, dan manusia. Zat tersebut seperti,
sangat berbahaya zat kapur, zat fosfor, kolagen,
apabila zat tesebut asam laktat dan asam klorida.
terlalu banyak terdapat Namun jika zat tersebut
di dalam tubuh. berlebihan disimpan di dalam
 Peserta didik dapat tubuh akan membahayakan
menemukan kesehatan. Zat yang dapat
hubungan situasi menyebabkan keletihan pada
ilmiah tersebut otot adalah ….
dengan sistem a. Kolagen
gerak manusia b. Zat fosfor
 Peserta didik dapat c. Asam laktat
menyimpulkan d. Asam klorida
fungsi dari zat Hal tersebut bisa terjadi karena
tersebut a. Zat fosfor berfungsi untuk
mengeraskan tulang-tulang
Validitas dan Reliabilitas Instrumen CTTMC pada Pembelajaran IPA Terpadu SMP |81
manusia.
b. Asam klorida berfungsi
untuk mencegah organism
masuk ke dalam usus
c. Asam laktat berfungsi
untuk memproduksi energi
saat oksigen tidak
mencukupi
d. Kolagen berfungsi untuk
memberi kekuatan pada
tulang dan otot
Pada Tabel 3, tabel validasi soal terdiri dari indikator soal, indikator kemampuan siswa yang diukur selain
prestasi belajar. Pada penelitian ini kemampuan siswa yang dipilih adalah literasi sains, kategori validasi serta saran.
Pada kolom kategori, ahli hanya memberikan tanda cek (√) pada kategori yang sesuai. Pada kolom saran, ahli dapat
memberikan saran secara umum maupun terkait dengan item soal yang sedang ditelaah. Selain itu, para ahli juga
dapat melihat keterkaitan antara indikator soal, soal dan indikator kemampuan literasi sains. Total butir soal yang
divalidasi oleh ahli adalah 20 soal. Terdapat 4 kategori yang digunakan untuk validasi isi yaitu relevan (R) yang
bernilai 4, cukup relevan (CR) bernilai 3, kurang relevan (KR) bernilai 2, dan tidak relevan (TR) bernilai 1. Hasil analisis
validasi setiap soal kemudian dihitung menggunakan formula Aiken (1985) seperti berikut ini rumusnya:
𝑆
𝑉= [𝑛×(𝑐−1)]
; 𝑆 = ∑ 𝑛𝑖 (𝑟 − 𝑙𝑜 )

V menyatakan indeks validitas dari Aiken, c adalah banyaknya kategori atau kriteria, ℓₒ merupakan kategori
terendah (dalam hal ini katergori tidak relevan (TR) yang termasuk kategori terendah karena bernilai 1), ni adalah
banyaknya penilai (raters) yang memilih kriteria i, dan r merupakan kriteria ke i, serta n menyatakan jumlah
keselurahan penilai (raters). Nilai V berkisar 0-1 dan kriteria yang digunakan untuk menyatakan sebuah butir soal
dikatakan valid secara isi pada jumlah rater (penilai) sebanyak 9 orang berdasarkan tabel Aiken adalah 0,74 (Aiken,
1985). Setiap item soal dianalisis dengan menggunakan cara yang sama.
Lembar validasi yang telah diisi oleh 9 orang ahli (expert) kemudian ditabulasikan dan dihitung menggunakan
formula Aiken dengan bantuan program Microsoft Excel. Setiap item soal mendapatkan skor validasi dari 9 ahli. Hasil
perhitungan validasi dengan menggunakan validasi Aiken dapat dilihat pada Tabel 3.
Tabel 3. Hasil Perhitungan Validitas Isi Menggunakan Formula Aiken
No Soal V Vtabel Kesimpulan
1 0.89 0.74 VALID
2 0.81 0.74 VALID
3 0.89 0.74 VALID
4 1 0.74 VALID
5 1 0.74 VALID
6 0.93 0.74 VALID
7 0.81 0.74 VALID
8 0.85 0.74 VALID
9 0.81 0.74 VALID
10 0.96 0.74 VALID
11 0.89 0.74 VALID
82 | Marantika Lia Kristyasari
12 0.93 0.74 VALID
13 0.85 0.74 VALID
14 0.93 0.74 VALID
15 0.89 0.74 VALID
16 0.85 0.74 VALID
17 0.81 0.74 VALID
18 0.85 0.74 VALID
19 0.85 0.74 VALID
20 0.96 0.74 VALID
Berdasarkan perhitungan nilai V di atas pada Tabel 4, diperoleh hasil bahwa soal yang dikembangkan
dinyatakan valid. Suatu instrumen yang dinyatakan valid merupakan bagian penting dalam proses penilaian karena
menjadi tujuan yang fundamental bagi pengembangan instrumen. Instrumen yang valid mampu mengukur apa yang
seharusnya diukur, dalam hal ini mengukur kemampuan kognitif siswa dan kemampuan literasi sains siswa.
Mengembangkan instrumen yang reliabel dan valid merupakan proses yang panjang. Namun, yang paling dasar
instrumen harus valid secara isi. Hal ini karena item soal yang dihasilkan akan mewakili konstruk yang akan diukur.
Oleh sebab itu, validitas isi menjadi kunci utama suatu instrumen yang berkualitas.
B. Reliabilitas
Reliabilitas berasal dari kata reliability yang dapat diartikan sebagai hal yang dapat dipercaya. Dalam hal yang
sama, Drost menyatakan bahwa “reliability is a major concern when a psychological test is used to measure some
attribute or behavior” Drost (2012). Kalimat tersebut mengandung makna bahwa reliabilitas adalah keterpercayaan,
keterandalan, keajegan, kestabilan atau konsistensi. Ada tiga jenis reliabilitas, yaitu 1) konsistensi internal, 2)
stabilitas, dan 3) ekuivalen. Reliabilitas konsistensi internal alat ukur dapat dihitung dengan menggunakan rumus
Koefisien Alpha-Cronbach, Kuder-Richardson (KR-20 atau KR-21), dan teknik belah dua. Penentuan reliabilitas dari
instrumen penilaian yang dikembangkan dalam penelitian ini adalah dengan menggunakan formula Alpha Cronbach.
Nilai reliabilitas antara -1,00 sampai 1,00. Suatu instrumen dikatakan memiliki reliabilitas tinggi apabila nilai α > 0,70
(Guilford, 1956). Rumus yang digunakan untuk menghitung Koefisien Alpha-Cronbach adalah sebagai berikut:
𝑘 ∑ 𝑆𝑖 2
𝛼= (1 − )
𝑘−1 𝑆𝑥 2
Keterangan:
𝛼 : koefisien reliabilitas perangkat tes
𝑘 : banyaknya butir tes
Sx2 : Varian skor total tes.
∑Si2 : Jumlah semua varian butir pembentuk tes.
Pada penelitian pengembangan instrumen ini, reliabilitas dihitung dengan menggunakan program ITEMAN.
Hasil perhitungan reliabilitas dari instrumen penilaian Computerized Two-Tier Multiple Choice pada pembelajaran IPA
Terpadu SMP untuk mengukur kemampuan literasi sains disajikan pada tabel 4.
Validitas dan Reliabilitas Instrumen CTTMC pada Pembelajaran IPA Terpadu SMP |83
Tabel 4. Hasil Perhitungan Reliabilitas dari Instrumen Penilaian Computerized Two-Tier Multiple Choice
Tahapan Uji Coba Tier Reliabilitas Keterangan
Uji Coba Skala Menengah Tier 1 0,711 Tinggi
Tier 2 0,707 Tinggi
Uji Coba Skala Luas Tier 1 0,833 Tinggi
Tier 2 0,873 Tinggi

Gambar 1. Hasil Perhitungan Reliabilitas Instrumen Penilaian CTTMC dengan ITEMAN


Berdasarkan hasil perhitungan yang tersaji pada gambar 1, besarnya reliabilitas ditunjukkan dengan alpha.
Alpha adalah koefisien reliabilitas alpha untuk tes/skala tersebut yang merupakan indeks homogenitas dari tes/skala.
Koefisein alpha bergerak dari 0,0 sampai 1,0. Nilai reliabilitas yang diperoleh pada uji coba skala menengah, tier 1
sebesar 0,711 dan tier 2 sebesar 0,707 sedangkan pada uji coba skala luas, tier 1 sebesar 0,833 dan tier 2 sebesar
0,873. Hal ini menunjukan bahwa nilai reliabilitas dari Computerized Two-Tier Multiple Choice (CTTMC) pada
pembelajaran IPA Terpadu SMP untuk mengukur kemampuan literasi sains > 0,70 dan dapat dikategorikan “Tinggi”.
Dengan demikian instrumen penilaian Computerized Two-Tier Multiple Choice (CTTMC) pada pembelajaran IPA
Terpadu SMP untuk mengukur kemampuan literasi sains memiliki tingkat konsistensi, atau keajegan, dan kestabilan
dalam mengukur soal yang tinggi.
SIMPULAN
Berdasarkan hasil penelitian dan pembahasan dapat disimpulkan bahwa:
A. Validitas isi pada soal pengembangan instrumen penilaian Computerized Two-Tier Multiple Choice (CTTMC)
pada pembelajaran IPA Terpadu SMP untuk mengukur kemampuan literasi sains diperoleh lebih dari 0,74
sehingga 20 item soal tersebut, sehingga dinyatakan valid.
84 | Marantika Lia Kristyasari
B. Reliabilitas soal pada pengembangan instrumen penilaian Computerized Two-Tier Multiple Choice (CTTMC)
pada pembelajaran IPA Terpadu SMP untuk mengukur kemampuan literasi sains diperoleh pada uji coba
skala menengah, tier 1 sebesar 0,711 dan tier 2 sebesar 0,707 sedangkan pada uji coba skala luas, tier 1
sebesar 0,833 dan tier 2 sebesar 0,873. Nilai ini menunjukkan bahwa soal tersebut termasuk dalam
reliabilitas kategori tinggi. Sehingga dapat dinyatakan bahwa instrumen penilaian Computerized Two-Tier
Multiple Choice (CTTMC) pada pembelajaran IPA Terpadu SMP untuk mengukur kemampuan literasi sains
memiliki tingkat konsistensi, atau keajegan, dan kestabilan dalam mengukur soal yang tinggi.
C. Instrumen penilaian Computerized Two-Tier Multiple Choice (CTTMC) pada pembelajaran IPA Terpadu SMP
untuk mengukur kemampuan literasi sains dinyatakan telah memenuhi kriteria sebagai suatu soal yang baik.
REFERENSI
Akker, V.D. (1999). Principles and Method of Development Research. London. Dlm. Van Den Akker, J., Branch, R.M.,
Gustafson, K., Nieveen, N., & Plomp, T. (pnyt.)”. Design approaches and tools in educational and training
.Dordrecht: Kluwer Academic Publisher.
Allen, M.J. & Yen, W.M. (1979). Introduction to Measurement Theory. Monterey: Brooks/Cole.
Azwar, Saifuddin. (1999). Penyusunan Skala Psikologi. Yogyakarta: Pustaka Pelajar.
Embretson, S.E, & Reise, S.P. (2000). Item Response Theory for Psychologists. New Jersey: Lawrence Erlbaum
Associates.
Fernandes, H. J. X. (1984). Evaluation of Educational Program. Jakarta: National Education Planning, Evaluating and
Curriculum Development.
Guilford, J.P. (1956). Fundamental Statistic in Psychology and Education. 3rd Edition. New York: McGraw-Hill Bsook
Company, Inc.
Hollbrook, J. & Rannikmae, M. (2009). The Meaning of Scientific Literacy. International Journal of Enviromental and
Science Education. Vol.4, No. 3, July 2009, page 275-288.
Kleinbaum, D.G dkk. (1998). Applied Regression Analysis and Other Multivariate Methods. Pacific Groove: Duxbury
Press.
Lawrence, M.R. (1994). Question to Ask When Evaluating Test. Eric Digest. Artikel. Diambil dari: http://www.
ericfacility. net/ ericdigest/ ed.385607.html tanggal 6 Januari 2007.
Marison, J.A, & Estes, J.C. (2007). Using Scientist and Real-Word Scenario in Professional Development for Middle
School Teacher. Journal of Science Teacher Education.18 (2): 165-184.
National Science Teachers Association (NSTA). (1998). NSTA Standards for Science Teachers Preparation Adopted by
the NSTA Board of Directors.
Nunnally, Bernstein, I.H. (1994). Psychometric Theory, Edisi ke 3. New York : McGraw Hill.
OECD. (2002). Reading for change: Performance and engagement across countries: result from PISA 2000. Paris
OECD
OECD. (2006). Assesing Scientific, Reading and Mathematic Literacy A Framewowk for PISA 2006. Paris: OECD
Publications Programme for International Student Assessment (PISA). (2012). PISA 2012 Plus Results
Performance of 15-years-olds in reading, mathematics and science for 10 additional participants.
Validitas dan Reliabilitas Instrumen CTTMC pada Pembelajaran IPA Terpadu SMP |85
Singh, Arun Kumar. (1986). Tests, Measurement and Research Methods in Behavioral Sciences. New Delhi: Tata
McGraw Hill.
Suryabrata, Sumadi. (2000). Pengembangan Alat Ukur Psikologis. Yogya: Andi.
Thorndike, Robert M. (1997). Measurement and Evaluation in Psychology and Education. New Jersey: Prentice
Hall, Inc.
Tuyuz, C. (2009). Development of Two-Tier Diagnostic Instrument and Assess Students’ Understanding in Chemistry.
Scientific Research and Essay. 4 (6), 626-631.
Wright, T. (2011). Karen in Motion the Role of Physical Enactment in Developing an Understanding of Distance,
sTime, and Speed. The Journal of Mathematical Behaviour. 20 (2): 145-162.

Anda mungkin juga menyukai