Page 1
Measurement /Ilmu Pengukuran merupakan cabang dari ilmu statistika terapan yang bertujuan membangun dasar-dasar pengembangan tes yang lebih baik sehingga dapat menghasilkan tes yang berfungsi secara optimal, valid, & reliabel.
Pengukuran adalah suatu prosedur pemberian angka (kuantifikasi) terhadap atribut atau variabel sepanjang kontinum.
Page 2
KONTINUM FISIK
Berbagai kontinum, seperti kontinum berat, tinggi, kecepatan, dsb, dihasilkan oleh pengukuran yang menggunakan skala fisik.
Page 3
KONTINUM PSIKOLOGIS
berbagai atribut fisik dan atribut psikologis dapat diukur dengan menggunakan skala psikologis dan hasilnya dapat disajikan dalam suatu kontinum yang dinamakan kontinum psikologis. Seperti kecerdasan, penyesuaian diri, dll
Page 4
Pengukuran merupakan suatu prosedur pembandingan antara atribut yang hendak diukur dengan alat ukurnya.
Page 5
Karakteristik Pengukuran
Membandingkan atribut yang diukur dengan alat ukurnya. Apa yang diukur adalah atribut atau dimensi dari sesuatu, bukan sesuatu itu sendiri.
Kuantifikasi tinggi badan dilakukan dengan membandingkan tinggi (badan) sebagai atribut fisik, dengan meteran sebagai alat ukur. Kita tidak dapat mengukur sebuah meja, karena yang kita ukur bukanlah meja sebagai benda melainkan dimensi meja, yaitu panjang, lebar, luas, tinggi meja. Kita tidak dapat mengukur manusia karena yang dapat kita ukur adalah atribut manusianya, seperti inteligensi/prestasi, dll.
Page 6
Pengertian di atas memberi makna bahwa : a. Benda atau manusia yang dimensinya diukur merupakan subjek pengukuran, bukan objek. Objek pengukuran adalah dimensi yang diukur. b. Kita hanya akan mengetahui alat ukurnya apabila atribut yang hendak diukur telah diketahui lebih dahulu
Page 7
Karakteristik Pengukuran
Hasil Pengukuran dinyatakan secara kuantitatif
Kuantitatif berarti berwujud angka. Hal ini berarti adalah selalu benar dalam setiap pengukuran. Suatu proses pengukuran akan dinyatakan selesai apabila hasilnya telah diwujudkan dalam bentuk angka yang biasanya dalam pengukuran fisik disertai dengan satuan ukurnya yang sesuai.
Page 8
Karakteristik Pengukuran
Hasil Pengukuran bersifat deskriptif
Artinya, hanya sebatas memberikan angka yang tidak diinterpretasikan lebih jauh. Misalnya hasil ukur terhadap luas sebuah meja adalah 240 cm, tidak diikuti oleh keterangan bahwa 240 cm tsb adalah sedang, luas, atau sangat luas. Dalam berbagai kasus, pengukuran atribut yang tidak dapat dilakukan secara langsung, karena atribut yang hendak diukur merupakan atribut derivasi, yaitu turunan dari atribut dasar lainnya. Seperti luas, kecepatan, dll.
Page 9
EVALUASI
Interpretasi terhadap hasil pengukuran hanya dapat bersifat evaluatif apabila disandarkan pada suatu norma/kriteria.
Norma berarti rata-rata bagi suatu kelompok subjek. Dengan adanya norma dan kriteria, hasil yang sama dari suatu pengukuran dapat saja mendatangkan interpretasi yang berbeda-beda.
Page 10
Karakteristik Evaluasi
1.Merupakan pembandingan antara hasil ukur dengan suatu norma atau suatu kriteria. 2.Hasilnya bersifat kualitatif. 3.Hasilnya dinyatakan secara evaluatif.
Page 11
DATA
Kata data berasal dari DATUM yang berarti materi atau kumpulan fakta yang dipakai untuk keperluan suatu analisa, diskusi, presentasi ilmiah, atau tes statistik. Bila dilihat dari menurut asal sumbernya, data dibagi menjadi 2 kelompok, yaitu data primer dan data sekunder. Sehingga setiap penelitan pasti memerlukan data sebagai bahan analisa.
Page 12
DATA STATISTIK
DATUM BENTUK TUNGGAL DATA =DATUM-DATUM BERBENTUK JAMAK
DATA STATISTIK IALAH DATA YANG BERUJUD ANGKA, NAMUN TIDAK SEMUA ANGKA DISEBUT DATA STATISTIK
ANGKA/BILANGAN DISEBUT DATA STATISTIK BILA ANGKA MENUNJUKAN SUATU CIRI DARI SUATU PENELITIAN YG BERSIFAT AGREGATIF
Page 13
Page 15
b. Data Rasio : yaitu data yang diukur dengan suatu proporsi dan mempunyai jarak yang sama. Contoh : 1) persentase jumlah pengenggur di propinsi X . 2) nilai inflasi di Indonesia tahun 2005. 3) Data tentang berat, panjang dan volume.
Page 16
3/4/2014
18
Page 18
3/4/2014
19
Page 19
3. Data intervalialah data yang dihasilkan dari pengukuran, yang di dalam pengukuran tersebut diasumsikan terdapat satuan pengukuran yang sama.
Data in terval menunjukkan adanya jarak antara data yang satu dengan yang lain. Data interval tergolong ke dalam data kontinum, yang memiliki tingkatan lebih tinggi di bandingkan dengan data ordinal, karena memiliki tingkatan yang lebih banyak lagi. Data interval dapat diordinalkan, tetapi sebaliknya data ordinal tidak dapat diintervalkan. Suatu hal penting yang harus diketahui dalam kaitan dengan data interval ialah, tidak dikenal adanya nilai 0 (nul) mutlak. Contoh data interval: nilai matakuliah tertentu, sikap terhadap sesuatu yang dinyatakan dengan skor, penghasilan seseorang, umur, dan sebagainya.
3/4/2014 20 Page 20
4. Data ratio adalah data yang dapat diperbandingkan antara yang satu dengan yang lainnya dan memiliki nilai 0 (nul) mutlak.
Data ratio ini tergolong ke dalam data kontinum. Contoh : berat badan ibu = 75 Kg, berat badan Nataya = 15 Kg. Dengan demikian, berat badan Ibu adalah 5 kali berat badan Nataya. Contoh lain : tinggi badan Billy = 171 Cm, tinggi basdan Susi = 171 Cm. Bila diperbandingkan kedua tinggi badan tersebut selisihnya adalah = 0 (nul) Cm. Arti dari 0 (nul) tersebut adalah 0 (nul) mutlak, artinya tidak ada selisih yang bisa diukur.
3/4/2014 21 Page 21
Nominal Ordinal V V V
Interval V V V
Rasio V V V
Nol mutlak
Page 22
Page 26
Page 27
Misalkan kuesioner adalah sasaran tembak seperti pada gambar berikut ini. Anggap bahwa pusat sasaran tembak itu adalah target dari apa yang kita ukur.
Jawaban tiap responden yang ditanya menggunakan kuesioner adalah menembak pada sasarannya. Jika pertanyaannya baik dan responden Page 28 menjawab dengan baik pula maka kita
Dalam hal ini, kita memperoleh estimasi yang benar secara kelompok, tetapi tidak konsisten. Sekarang jelas bahwa reliabilitas berkaitan langsung dengan Page 30
Ketiga, menunjukkan tembakan yang menyebar dan secara konsisten menyimpang dari sasaran tidak reliable dan tidak valid Terakhir, menunjukkan menembak sasaran secara konsisten reliable dan valid.
Page 31
Hasil penelitian yang valid bila terdapat kesamaan antara data yang terkumpul dengan data yang sesungguhnya terjadi pada obyek yang diteliti. Hasil penelitian yang reliabel bila terdapat kesamaan data dalam waktu yang berbeda.
Instrumen yang valid : alat ukur yang digunakan untuk mendapatkan data (mengukur) itu valid.
Page 32
Meteran yang valid dapat digunakan untuk mengukur panjang dengan teliti karena meteran memang alat untuk mengukur panjang.
Instrumen yang reliabel : instrumen yang bila digunakan beberapa kali untuk mengukur obyek yang sama akan menghasilkan data yang sama. Alat ukur panjang dari karet contoh instrumen yang tidak reliabel/konsisten. Page 33
Instrumen yang valid dan reliabel merupakan syarat mutlak untuk mendapatkan hasil penelitian yang valid dan reliabel. Instrumen yang berbentuk test untuk mengukur prestasi belajar dan instrumen yang nontest untuk mengukur sikap. Instrumen yang berupa test jawabannya adalah salah atau benar sedangkan instrumen sikap jawabannya tidak ada yang salah atau benar tetapi bersifat positif atau negatif.
Page 34
Page 35
Pengujian validitas tiap butir digunakan analisis item mengkorelasikan skor tiap butir dengan skor total yang merupakan jumlah tiap skor butir.
Item yang mempunyai korelasi positif dengan kriterium (skor total) serta korelasi yang tinggi menunjukkan bahwa item tersebut mempunyai validitas yang tinggi pula.
Page 36
Untuk menghitung koefisien korelasi product moment pearson digunakan rumus berikut ini
Page 37
Contoh Kasus
Seorang mahasiswa melakukan penelitian dengan menggunakan skala untuk mengetahui atau mengungkap prestasi belajar seseorang. Kuesioner terdiri dari 10 item dan menggunakan skala Likert yaitu : 1 = sangat tidak setuju 2 = tidak setuju 3 = setuju Page 38 4 = sangat setuju.
Page 39
Diperoleh korelasi bivariat Pearson antara Skor Item dan Skor Total untuk masingmasing item. Jika digunakan tingkat signifikansi (level of significance) = 0,05 (5 %) dengan uji 2 sisi dan n= 12 maka titik kritisnya adalah 0,576. Terlihat bahwa item 1, 9 dan 10 kurang dari 0,576 sehingga dapat disimpulkan bahwa item 1, 9 dan tidak valid dan jika perlu item tersebut diubah atau dibuang (asalkan tidak mengurangi arti kuesioner secara kesatuan).
Page 40
Page 41
Analisis ini dilakukan dengan cara mengkorelasikan masing-masing Skor Item dengan Skor Total dan melakukan koreksi terhadap nilai koefisien korelasi yang overestimasi. Hal ini dikarenakan agar tidak terjadi koefisien item total yang overestimasi (estimasi nilai yang lebih tinggi dari yang sebenarnya). Page 42
Sebagai contoh, pada kasus di atas , akan dihitung korelasi item 1 dengan skor total (yaitu jumlah total skor 2 sampai skor 10). Perhitungan teknik ini cocok digunakan pada kuesioner yang menggunakan itemitem pertanyaan yang sedikit, sedangkan pada kuesioner yang menggunakan itemitem pertanyaan yang banyak tidak perlu dilakukan karena perbedaan antara kedua teknik tersebut tidak jauh.
Page 43
Page 44
Dari output SPSS diperoleh nilai korelasi yang diinginkan pada kolom Corrected Item Total Correlation dan dibandingkan dengan titik kritis table yaitu 0,576 sehingga item-item yang tidak valid adalah item 1, item 5, item 9 dan item 10.
Page 45
Uji Reliabilitas
Suatu questionare disebut reliabel/handal jika jawaban-jawaban seseorang konsisten. Contoh pertanyaan: Apakah gaji/upah yang diterima memuaskan? Jawab: memuaskan Apakah yang krusial untuk diatasi? Jawab: Kenaikan upah. Ini menunjukkan ketidak konsistenan pertanyaan dalam mengungkap sikap atau pendapat responden.
Page 46
Reliabilitas dapat diukur dengan jalan mengulang pertanyaan yang mirip pada nomor-nomor berikutnya, atau dengan jalan melihat konsistensinya (diukur dengan korelasi) dengan pertanyaan lain.
Page 47
Page 48
Page 49
Page 50
Variansi butir ke-2 sampai ke-5 dapat dihitung dengan cara yang sama seperti menghitung variansi butir I sehingga total variansi butir :
Page 51
2 (t )
Page 52
Page 53
Misal: Kepuasan Upah disurvai dengan 5 pertanyaan Buka file yang akan diuji Klik Analyze Scale dan pilih Reliability Analysis Masukkan 5 pertanyaan yang diuji Pilih pada box model Alpha Klik Statistics dan pilih scale if item deleted (lihat gambar)
Page 54
Page 55
Karena koefisien Cronbach diperoleh 0,581 sehingga tidak signifikan berarti reliabilitas instrumen buruk atau data hasil instrumen kuesioner/angket kurang dapat dipercaya.
Page 57
Page 58
Page 59
Pengukuran merupakan proses kuantifikasi suatu atribut. Pengukuran diharapkan akan menghasilkan data yang valid yang harus dilakukan secara sistematis. Berbagai alat ukur telah berhasil diciptakan untuk melakukan atribut dalam bidang fisik seperti berat badan, luas, kecepatan, dan sebagainya yang segi validitas, reliabilitas, dan objektivitas hasil pengukuran dapat diterima semua orang secara universal. Pengukuran bidang non-fisik, khususnya psikologi masih dalam taraf perkembangan yang mungkin tidak akan pernah mencapai kesempurnaannya, walaupun skala tersebut sudah terstandarkan namun kualitasnya belum dapat dikatakan optimal. Kemajuan di bidang teori pengukuran psikologi justru menyingkap sisi lemah dari banyak tes yang sudah ada dan sudah lama digunakan.
Page 61
Atribut psikologi bersifat latent (tidak tampak). Karena itu yang kita miliki hanya konstrak yang tidak akan dapat diukur secara langsung. Pengukuran thd konstrak latent harus dilakukan lewat indikator perilaku yang belum tentu mewakili domain (kawasan yang tepat, dikarenakan batasan konstrak psikologis tidak dapat dibuat dengan akurasi yang tinggi dan tidak mudah untuk dioperasionalkan. Aitem-aitem dalam dalam skala psikologi didasari oleh indikator2 perilaku yang jumlahnya terbatas. Keterbatasan itu mengakibatkan hasil pengukuran menjadi tidak cukup komprehensif sedangkan bagian dari indikator perilaku yang terbatas itu sangat mungkin pula tumpang tindih dengan atribut psikologis yang lain.
Page 62
Respon yang diberikan oleh subjek sedikit banyak dipengaruhi variabel-variabel yang tidak relevan seperti suasana hati, kondisi, kesalahan prosedur administrasi, dsb. Atribut psikologis yang terdapat dalam diri manusia stabilitasnya tidak tinggi. Banyak yang berubah sejalan dengan waktu dan situasi. Interpretasi terhadap hasil ukur hanya dapat dilakukan secara normatif. Dalam isitilah pengukuran, dikatakan bahwa pada pengukuran psikologis terdapat lebih banyak sumber error. Karena keterbatasan2 pengukuran tersebut yang menjadikan konstruksi skala psikologis lebih rumit dan harus dilakukan dengan penuh perencanaan dan mengikuti langkah-langkah metodologis sehingga sumber error dapat ditekan sekecil mungkin.
Page 63
KARAKTERISTIK SKALA SEBAGAI ALAT UKUR Sebagai alat ukur, skala psikologis memiliki karakteristik khusus yang membedakannya dari berbagai alat pengumpulan data yang lain seperti angket, daftar isian, inventory, dll. Skala sering disamakan dengan istilah tes, namun dalam pengembangan instrument ukur, tes digunakan untuk penyebutan alat ukur kemampuan kognitif, sedangkan skala lebih banyak dipakai untuk alat ukur aspek afektif.
Page 64
Karakteristik Skala
Stimulusnya berupa pertanyaan atau pernyataan yang tidak langsung mengungkap atribut yang hendak diukur, melainkan mengungkap indikator perilaku dari atribut yang bersangkutan. Dalam hal ini, meskipun subjek yang diukur memahami pertanyaan atau pernyataannya namun tidak mengetahui arah jawaban yang dikehendaki oleh pertanyaan yang diajukan, sehingga jawaban yang akan diberikan akan tergantung pada interpretasi subjek terhadap pertanyaan tsb dan jawabannya lebih bersifat proyektif (proyeksi/cerminan dari perasaan/kepribadiannya. Dikarenakan atribut psikologis diungkap secara tidak langsung lewat indikator2 perilaku, sedangkan indikator perilaku diterjemahkan dalam aitem2, maka skala psikologis selalu berisi banyak aitem. Jawaban subjek terhadap 1 aitem baru merupakan sebagian dari banyak indikasi atribut yang diukur, sedangkan kesimpulan sebagai diagnosis dapat dicapai apabila subjek menjawab semua aitem. Respon subjek tidak diklasifikasikan sebagai jawaban benar atau salah. Semua jawaban dapat diterima sepanjang diberikan secara jujur. Hanya saja, jawaban yang berbeda akan diinterpretasikan berbeda pula. Karakteristik di atas oleh Cronbach (1970) disebut sebagai ciri pengukuran terhadap performansi tipikal, yaitu performansi yang menjadi karakter tipikal seseorang dan cenderung dimunculkan secara sadar atau tidak sadar dalam bentuk repon terhadap situasi tertentu yang sedang dihadapi. (cth : minat, sikap, garesivitas, motivasi, dll)
Page 65
2. Pertanyaannya berupa pertanyaan yang langsung terarah kepada informasi mengenai data yang hendak diungkap. Data berupa fakta atau opini menyangkut diri reponden. Hal ini berkaitan dengan asumsi dasar penggunaan angket yaitu bahwa responden merupakan orang yang paling mengetahui tentang dirinya sendiri.
ANGKET
SKALA
3. Responden thd angket tahu persis 3. Responden thd skala psikologis, apa yang ditanyakan dalam angket sekalipun memahami isi pertanyaan, dan informasi apa yang dikehendaki biasanya tidak menyadari arah oleh pertanyaan yang jawaban yang dikehendaki dan bersangkutan. kesimpulan apa sesungguhnya yg akan diungkap oleh pertanyaan tsb. 4. Repon diberi skor melalui proses 4. Jawaban tidak dapat diberi skor penskalaan (data ordinal) (dlm arti nilai) melainkan diberi angka coding sebagai identifikasi atau klasifikasi jawaban (data nominal) 5. 1 skala hanya diperuntukkan untuk 5. 1 angket dapat mengungkap mengungkap satu atribut tunggal informasi mengenai banyak hal 6. Hasil ukur skala harus teruji 6. Karakteristik pada poin 2 & 4 relaibilitasnya karena relevansi isi menyebabkan data hasil angket dan konteks kalimat sebagai stimulus tidak perlu diuji lagi reliabilitasnya. mengandung errror. Asalkan responden menjawab jujur. 7. Validitas skala lebih ditentukan oleh 7. Validitas angket lebih ditentukan kejelasan konsep psikologis yang oleh kejelasan tujuan dan lingkup hendak diukur & operasionalisasinya. informasi yang ingin diungkap. Page 67
Validitas dalam pengertian yang paling umum adalah ketepatan dan kecermatan skala dalam menjalankan fungsi ukurnya. Artinya, sejauhmana skala itu mampu mengukur atribut yang dirancang untuk mengukurnya. Validitas adalah karakteristik utama yang harus dimiliki oleh setiap skala, sehingga harus diketahui faktor yang dapat mengancam validitas skala. Identifikasi kawasan Ukur yang Tidak Cukup Jelas. Untuk mengukur sesuatu maka sesuatu itu harus dikenali terlebih dahulu dengan baik. Apabila atribut psikologi sebagai tujuan ukur tidak diidentifikasikan dengan benar, maka skala hanya memiliki gambaran yang kabur mengenai apa yang sebenarnya hendak diukur. Sehingga tidak akan mungkin mampu menulis aitem2 yang tepat untuk mengungkap respon yang diinginkan. Akibatnya aitem2 sering tumpang tindih dengan atribut psikologis yang lain. Selain itu skala menjadi tidak komprehensif dalam mengungkap atribut yang dikehendaki.
Page 68
Operasionalisasi Konsep yang Tidak tepat Kejelasan konsep mengenai atribut yang hendak diukur memungkinkan perumusan indikator perilaku yang menunjukkan ada-tidaknya atribut yang bersangkutan. Rumusan indikator perilaku berasal dari operasionalisasi konsep teoritik mengenai komponen2/dimensi2 atribut bersangkutan menajdi rumusan yang terukur. Apabila perumusan ini tidak cukup operasional, atau masih menimbulkan penafsiran ganda mengenai bentuk perilaku yang diinginkan, maka akan menghasilkan aitem2 yang tidak valid. Penulisan Aitem yang Tidak Mengikuti Akidah aitem yang maksudnya sukar dimengerti oleh responden karena terlalu panjang, tidak benar tata bahasanya, mendorong reponden untuk memilih jawaban tertentu saja, yang memancing reaksi negatif dari responden, sehingga aitem tidak akan berfungsi sebagaimana yang diharapkan.
Page 69
Administrasi Skala yang Tidak Berhati-hati Skala yang isinya telah dirancang dengan baik dan aitem2nya sudah ditulis dgn benar, namun disajikan atau diadministrasikan pada responden dengan sembarangan tidak akan menghasilkan data yang valid. Administrasi skala memerlukan persiapan dan antisipasi dari penyaji, antara lain: a. Kondisi Penampilan Skala (validitas tampang. b. Kondisi Subjek c. Kondisi Testing
Page 70
Pemberian Skor yang Tidak Cermat Sekalipun disediakan kunci skoring, terkadang terjadi kesalahan dari pihak pemberi skor karena penggunaan kunci yang keliru atau salah menjumlahkan skor. Pada beberapa skala yang menggunakan konversi skor, dapat terjadi kesalahan sewaktu mengubah skor mentah menjadi skor derivasi karena salah lihat pada tabel konversi. Interpretasi Yang Keliru Penafsiran hasil ukur skala merupakan bagian dari proses diagnosis yang teramat penting. Bagaimanapun baiknya fungsi ukur suatu skala,namun apabila diinterpretasikan secara tidak benar maka akan sia-sia, karena kesimpulan yang didapat tidak tepat.
Page 71
KESIMPULAN SKALA/TES Skala/tes dapat dikatakan sebagai suatu prosedur pengamatan perilaku, dan dilanjutkan dengan deskripsi perilaku. Prosedur pengamatan perilaku akan menghasilkan gambaran bersifat numerik (kuantitatif) dan atau kategorikal (kualitatif) Hasil tes yang berupa nemerik dapat ditafsirkan dalam bentuk kategorikal contoh : IQ= 100 Rata-rata IQ= 80 Di bawah rata-rata
Page 72
ATRIBUT PSIKOLOGIS Hanya ada dalam konsep, sehingga sulit dibayangkan secara fisik Atribut psikologis merupakan rangkaian kalimat untuk memperjelas/menjelaskan suatu fenomena. Secara psikologis, kita mengukur suatu yang tidak ada, sehingga perlu konsep dengan cara mengoperasionalisasi konsep tersebut dalam bentuk perilaku yang dapat diukur.
Page 73
Operasionalisasi Konsep (Menghimpun Indikator Keperilakuan Penulisan Aitem Ujicoba Bahasa Validasi Konstrak
Kompilasi Final
Page 74
Page 75
Page 76