Dalam pemakaian sehari-hari, pengukuran terjadi ketika sebuah indeks yang mapan
memverifikasitinggi, berat, atau ciri khas benda fisik lainnya. Seberapa baik Anda menyukai
sebuah lagu, lukisan, atau kepribadian seorang teman juga merupakan ukuran. Untuk
mengukurnya adalah untuk mengetahuiluas, dimensi, kuantitas, atau kapasitas sesuatu, terutama
dengan perbandingan dengan standar. Kami mengukur secara santai dalam kehidupan sehari-
hari, namun dalam penelitiannyapersyaratan yang ketat.
Pengukuran dalam penelitian terdiri dari penentuan jumlah kejadian empiris, objek atau properti,
atau aktivitas yang sesuai dengan seperangkat peraturan. Definisi ini menyiratkan bahwa
pengukuran adalah proses tiga bagian:
Anda ingat istilah empiris. Periset menggunakan pendekatan empiris untuk mendeskripsikan,
menjelaskan, dan membuat prediksi dengan mengandalkan informasi yang didapat melalui
pengamatan.
Asumsikan Anda mempelajari orang-orang yang menghadiri pameran otomatis tempat prototip
model baru dipamerkan. Anda tertarik untuk mempelajari rasio antara laki-laki dan perempuan di
antara peserta. Anda amati mereka yang memasuki area pertunjukan. Jika seseorang adalah
perempuan, Anda mencatat F; jika laki-laki, M. Simbol lain seperti 0 dan 1 atau # dan% juga
dapat digunakan jika Anda tahu kelompok yang diidentifikasi oleh simbol tersebut. Gambar 11-1
menggunakan contoh ini untuk menggambarkan tiga komponen.
Periset mungkin juga ingin mengukur keinginan styling sebuah mobil konsep baru di acara ini.
Mereka mewawancarai sampel pengunjung dan menetapkan, dengan aturan pemetaan yang
berbeda, pendapat mereka dengan skala berikut:
Tujuan pengukuran - memang, tujuan "menetapkan jumlah pada kejadian empiris sesuai dengan
seperangkat aturan" - adalah untuk memberikan data kesalahan dan estimasi kualitas tertinggi
untuk menguji hipotesis, estimasi atau prediksi, atau deskripsi. Peneliti menyimpulkan dari
sebuah hipotesis bahwa kondisi tertentu harus ada. Kemudian mereka mengukur untuk kondisi
ini di dunia nyata. Jika ditemukan, data memberi dukungan pada hipotesis; Jika tidak, peneliti
menyimpulkan hipotesisnya salah. Pertanyaan penting pada saat ini adalah, "Apa ukurannya?
Objek pengukuran adalah konsep, simbol yang kita lampirkan pada kumpulan makna yang kita
pegang dan bagikan dengan orang lain. Kami menciptakan konsep tingkat tinggi - konstruksi -
untuk tujuan penjelasan ilmiah khusus yang tidak secara langsung dapat diamati dan untuk
memikirkan dan mengkomunikasikan abstraksi. Konsep dan konstruksi digunakan pada tingkat
teoritis; Variabel digunakan pada tingkat empiris. Variabel menerima angka atau nilai untuk
tujuan pengujian dan pengukuran.
Konsep, konstruksi, dan variabel dapat dideskripsikan secara deskriptif atau operasional. Definisi
operasional mendefinisikan variabel dalam hal kriteria pengukuran dan pengujian specifik. Ini
harus menentukan secara memadai informasi empiris yang dibutuhkan dan bagaimana
pengumpulannya. Selain itu, harus memiliki ruang lingkup atau masalah yang tepat untuk
masalah penelitian yang ada. Kami meninjau persyaratan ini dengan contoh pada Tampilan 11-2.
Variabel yang dipelajari dalam penelitian dapat dikelompokkan sebagai objek atau properti.
Objek mencakup konsep pengalaman biasa, seperti barang berwujud seperti furnitur, deterjen
cucian, orang, atau mobil. Objek juga mencakup hal-hal yang tidak konkret, seperti gen, sikap,
dan tekanan kelompok sebaya. Properties adalah karakteristik dari objek. Sifat fisik seseorang
dapat dinyatakan
dalam hal berat, tinggi badan, dan postur tubuh, antara lain. Sifat psikologis meliputi sikap dan
kecerdasan. Sifat sosial meliputi kemampuan kepemimpinan, kelas affi liation, dan status. Sifat-
sifat ini dan banyak lainnya dari individu dapat diukur dalam sebuah penelitian.
Secara literal, peneliti tidak mengukur objek atau sifat. Mereka mengukur indikasi sifat atau
indikasi sifat benda. Mudah untuk mengamati bahwa A lebih tinggi dari B dan C berpartisipasi
lebih dari D dalam proses kelompok. Atau anggap Anda menganalisis anggota tenaga penjualan
dari beberapa ratus orang untuk mengetahui kontribusi pribadi terhadap keberhasilan penjualan.
Properti adalah usia, tahun pengalaman, dan jumlah panggilan yang dilakukan per minggu.
Indikasi dalam kasus ini sangat diterima sehingga kita mempertimbangkan sifat yang harus
diamati secara langsung.
Sebaliknya, tidak mudah untuk mengukur sifat konstruksi seperti "gaya hidup," "kepemimpinan
opini," "struktur saluran distribusi," dan "persuasif." Karena setiap properti tidak dapat diukur
secara langsung, seseorang harus menyimpulkan adanya atau tidaknya dengan mengamati
beberapa indikasi atau pengukuran penunjuk. Ketika Anda mulai membuat kesimpulan seperti
itu, seringkali ada ketidaksepakatan tentang bagaimana mengembangkan definisi operasional
untuk setiap indikasi.
Bukan hanya tantangan untuk mengukur konstruksi semacam itu, namun kualitas studi
bergantung pada ukuran yang dipilih atau dikembangkan dan bagaimana keadaannya. Sifat skala
pengukuran, sumber kesalahan, dan karakteristik pengukuran suara dipertimbangkan selanjutnya.
Measurement Scales(SkalaPengukuran)
Kombinasi karakteristik klasifikasi, urutan, jarak, dan asal mula ini memberikan empat
klasifikasi skala pengukuran yang banyak digunakan: (1) rasio nominal, (2) ordinal, (3), dan (4).
Mari kita awasi skala pengukuran ini sebelum kita mendiskusikan rincian teknisnya. Misalkan
profesor Anda meminta sukarelawan siswa untuk mencicipi-menguji enam batang permen.
Siswa tersebut mulai dengan mengevaluasi masing-masing pada skala coklat-tidak cokelat; ini
adalah ukuran nominal. Kemudian murid tersebut memberi peringkat permen dari yang terbaik
sampai yang terburuk; ini adalah ukuran ordinal. Selanjutnya, siswa menggunakan skala 7 poin
yang memiliki jarak yang sama antara titik untuk menilai candy bars dengan memperhatikan
beberapa kriteria selera (mis., Kegentingan); Ini adalah pengukuran interval. Akhirnya, siswa
mempertimbangkan dimensi rasa yang lain dan memberikan 100 poin di antara enam permen; Ini
adalah pengukuran rasio.
Karakteristik skala pengukuran ini dirangkum dalam Tampilan 11-3. Memutuskan jenis skala
yang sesuai untuk kebutuhan penelitian Anda harus dilihat sebagai bagian dari proses penelitian,
seperti ditunjukkan pada Tampilan 11-4.
Dalam penelitian bisnis, data nominal banyak digunakan. Dengan skala nominal, Anda
mengumpulkan informasi tentang variabel yang secara alami atau dengan desain dapat
dikelompokkan menjadi dua atau lebih kategori yang saling eksklusif dan kolektif yang
lengkap. Jika data dikumpulkan dari pelanggan simfoni di kompleks Glacier, pelanggan dapat
dikelompokkan menurut apakah mereka menghadiri pertunjukan simfoni sebelumnya atau ini
adalah pertama kalinya mereka. Setiap pelindung akan masuk ke salah satu dari dua kelompok
di dalam variabel kehadiran.
Klasifikasi nominal dapat terdiri dari sejumlah kelompok terpisah jika kelompok tersebut
saling eksklusif dan kolektif. Dengan demikian, seseorang dapat mengklasifikasikan siswa
dalam kursus sesuai dengan preferensi religius yang diungkapkan. Aturan pemetaan Yang
diberikan dalam tabel bukanlah skala nominal yang masuk akal karena kategorinya tidak
saling eksklusif atau kolektif. Aturan pemetaan B memenuhi persyaratan minimum; Ini
mencakup semua agama besar dan menawarkan pilihan "lainnya". Skala nominal adalah yang
paling tidak kuat dari keempat tipe data. Mereka menyarankan tidak ada hubungan pesanan
atau jarak dan tidak memiliki asal aritmatika. Skala limbah informasi apapun sampel elemen
mungkin berbagi tentang berbagai tingkat properti yang diukur.
Karena satu-satunya kation kuantifikasi adalah jumlah kasus dalam setiap kategori
(distribusifrekuensi), peneliti dibatasi pada penggunaan mode sebagai ukuran tendensi sentral.
4 Mode adalah nilai yang paling sering terjadi. Anda dapat menyimpulkan kategori mana
yang memiliki anggota terbanyak, tapi hanya itu saja. Tidak ada ukuran dispersi yang umum
digunakan untuk skala nominal. Dispersi menggambarkanbagaimana skor cluster atau scatter
dalam suatu distribusi. Denganmensimulasikan variabel nominal dengan variabel lain, Anda
bisa mulai melihat pola dalam data.
Meskipun data nominal secara statistik lemah, namun data tersebut masih berguna. Jika tidak
ada skala lain yang bisa digunakan, kita hampir selalu bisa mengklasifikasikan seperangkat
properti menjadi satu set kelas setara. Tindakan nominal sangat berharga dalam pekerjaan
eksplorasi dimana tujuannya adalah untuk mengungkap hubungan daripada melakukan
pengukuran yang tepat. Skala jenis ini juga banyak digunakan dalam survei dan penelitian
lainnya saat data digolongkan olehsubkelompok utama populasi. Klasifikasi seperti
perkawinan respondenstatus, jenis kelamin, orientasi politik, dan keterpaparan terhadap
pengalaman tertentu memberi nsight ke dalam pola data demografis yang penting.
Skala ordinal mencakup karakteristik skala nominal ditambah indikasi ketertiban. Data ordinal
memerlukan kesesuaian dengan postulat logis, yang menyatakan: Jika a lebih besar dari b dan
b lebih besar dari c, maka a lebih besar dari c. 5 Penggunaan skala ordinal menyiratkan
pernyataan "lebih besar dari" atau "kurang dari" (pernyataan kesetaraan juga dapat diterima)
tanpa menyebutkan seberapa besar atau sedikitnya. Sementara pengukuran ordinal berbicara
tentang pengukuran yang lebih besar dari dan di bawah, deskriptor lain dapat digunakan-
"lebih unggul dari," lebih bahagia daripada, "lebih miskin dari pada," atau "penting daripada".
Seperti tolak ukur karet, skala ordinal dapat Peregangan jumlah bervariasi di tempat yang
berbeda sepanjang panjangnya. Jadi, perbedaan nyata antara peringkat 1 dan 2 pada skala
kepuasan mungkin lebih atau kurang dari perbedaan antara peringkat 2 dan 3. Sebuah
ordinalKonsep dapat diperluas melampaui tiga kasus yang digunakan dalam ilustrasi
sederhana dari a> b> c. Sejumlah kasus dapat digolongkan.
Perpanjangan lain dari konsep ordinal terjadi bila ada lebih dari satu properti yang diminati.
Kita mungkin meminta pengecap untuk menentukan varietas dari minuman ringan
berkarbonasi dengan flavor, warna, karbonasi, dan kombinasi dari karakteristik ini. Kita dapat
mengamankan peringkat gabungan baik dengan meminta responden untuk mendasarkan
peringkatnya pada kombinasi properti atau dengan membangun peringkat kombinasi dari
peringkat individu pada setiap properti.
Contoh data ordinal meliputi skala sikap dan preferensi. (Pada bab berikutnya, kami
memberikan contoh rinci tentang skala sikap). Karena angka yang digunakan dengan skala
ordinal hanya memiliki satu peringkat, ukuran tendensi sentral yang tepat adalah mediannya.
Median adalah titik tengah distribusi. Persentil atau kuartil menunjukkan dispersi.
Analisis korelasi data ordinal terbatas pada berbagai teknik ordinal. Ukuran signifikansi
statistik secara teknis dikonfirmasikan ke badan statistik yang dikenal sebagai metode
nonparametrik, identik dengan statistik bebas distribusi.
Peneliti berbeda tentang apakah tes yang lebih hebat sesuai untuk menganalisis tindakan
ordinal. Karena uji nonparametrik berlimpah, mudah dihitung, memiliki kekuatan statistik
yang baik, 7 dan tidak mengharuskan peneliti menerima asumsi pengujian parametrik, kami
menyarankan penggunaannya dengan data nominal dan ordinal. Namun, dapat dimengerti
bahwa karena tes parametrik (seperti uji t atau analisis varians) bersifat serbaguna, diterima,
dan dipahami, data tersebut akan digunakan dengan data ordinal ketika peneliti dapat
menunjukkan bahwa data tersebut mendekati asumsi yang diperlukan untuk interval tingkat
analisis.
Skala interval memiliki kekuatan data nominal dan ordinal ditambah satu kekuatan tambahan:
Mereka menggabungkan konsep persamaan interval (jarak antara 1 dan 2 sama dengan jarak
antara 2 dan 3). Waktu kalender adalah skala seperti itu. Misalnya, waktu yang telah berlalu
antara pukul 3 dan 6 pagi sama dengan waktu antara pukul 4 dan 7 pagi. Seseorang tidak dapat
mengatakan, bagaimanapun, bahwa pukul 6 pagi dua kali lebih lambat dari pukul 3 pagi,
karena "waktu nol" adalah titik nol yang sewenang-wenang. Skala suhu Celcius dan
Fahrenheitadalah contoh lain dari skala interval klasik. Keduanya memiliki titik nol yang
ditentukan secara sewenang-wenang, bukan asal yang unik.
Peneliti memperlakukan banyak skala perilaku sebagai interval, seperti yang kita gambarkan di
bab berikutnya. Bila skala adalah interval dan datanya relatif simetris dengan satu mode,
berarti Anda menggunakan aritmetika sebagai ukuran kecenderungan sentral. Anda dapat
menghitung waktu rata-rata pesan promosi TV atau nilai sikap rata-rata untuk kelompok usia
yang berbeda dalam studi manfaat asuransi. Deviasi standar adalah ukuran dispersi. Korelasi
momen produk, uji t, uji F, dan uji parametrik lainnya adalah prosedur statistik pilihan untuk
data interval.
Bila distribusi skor yang dihitung dari data interval bersandar dalam satu arah atau yang lain
(miring kanan atau kiri), kita sering menggunakan median sebagai ukuran tendensi sentral dan
kisaran interkuartil sebagai ukuran dispersi. Alasan untuk hal ini dibahas di akhir bab
Lampiran 15a.
Studi ideal harus dirancang dan dikendalikan untuk pengukuran variabel yang tepat dan tidak
ambigu. Karena kontrol lengkap tidak dapat dicapai, kesalahan memang terjadi. Banyak
kesalahan yang sistematis (hasil dari bias), sedangkan sisanya acak (terjadi tidak menentu). Satu
otoritas telah menunjukkan beberapa sumber dari mana perbedaan yang diukur dapat terjadi.
Asumsikan Anda melakukan studi ex post facto tentang kewarganegaraan korporat dari produsen
multinasional. Perusahaan ini menghasilkan produk keluarga, pribadi, dan produk perawatan
rumah tangga. Peserta adalah penghuni sebuah kota besar. Studi tersebut menyangkut Pangeran
Corporation, produsen besar dengan kantor pusatnya dan beberapa fasilitas utama yang berada di
kota ini. Tujuan dari penelitian ini adalah untuk mengetahui opini publik tentang pendekatan
perusahaan terhadap kesehatan, kesejahteraan sosial, dan lingkungan. Anda juga ingin
mengetahui asal usul opini negatif yang umumnya dipegang teguh.
Idealnya, variasi skor di antara responden dapat mencerminkan perbedaan pendapat mereka
tentang perusahaan. Sikap terhadap perusahaan sebagai atasan, sebagai organisasi yang sensitif
secara ekologis, atau sebagai warga korporat progresif akan dinyatakan secara akurat. Namun,
empat sumber kesalahan utama dapat mencemari hasilnya: (1) responden, (2) situasi, (3) alat
ukur, dan (4) instrumen pengumpulan data.
Error Sources (Sumber kesalahan)
The Respondent(Termohon)
Setiap kondisi yang menimbulkan ketegangan pada sesi wawancara atau pengukuran
dapat berdampak serius pada hubungan pewawancara-responden. Jika ada orang lain,
orang tersebut dapat mendistorsi tanggapan dengan bergabung, dengan mengalihkan
perhatian, atau hanya berada di sana. Jika responden yakin anonimitas tidak dipastikan,
mereka mungkin enggan mengungkapkan perasaan tertentu. Curbside atau wawancara
mencegat tidak mungkin mendapatkan tanggapan yang rumit, sementara wawancara di
rumah lebih sering dilakukan.
The Measurer(Pengukur)
Pewawancara dapat mendistorsi tanggapan dengan menulis ulang, menguraikan, atau
menyusun kembali pertanyaan. Stereotip dalam penampilan dan tindakan mengenalkan
bias. Suara suara dan dorongan sadar atau tidak sadar dengan senyuman, anggukan,
dansebagainya, dapat mendorong atau mencegah jawaban tertentu. Pemeriksaan
pemrosesan mekanis yang cerobohSalah tanggapan atau kegagalan untuk mencatat
balasan penuh-jelas akan mendistorsi temuan. Pada tahap analisis data, pengkodean
yang salah, tabulasi ceroboh, dan perhitungan statistik yang salah dapat menimbulkan
kesalahan lebih lanjut.
Instrumen yang rusak dapat menyebabkan distorsi dalam dua cara utama. Pertama, bisa
terlalu membingungkan dan ambigu. Penggunaan kata-kata dan sintaksis yang kompleks
di luar pemahaman peserta sangat khas. Pertanyaan utama, makna ambigu, cacat
mekanis (ruang yang tidak memadai untuk jawaban, kelalaian pilihan respons, dan
pencetakan yang buruk), dan beberapa pertanyaan menyarankan berbagai masalah.
Banyak dari masalah ini adalah akibat langsung dari defisiensi operasional yang tidak
memadai, sehingga menghasilkan skala yang tidak tepat yang dipilih atau
dikembangkan.
Jenis defisiensi instrumen yang lebih sulit dipahami adalah pilihan yang buruk dari alam
semesta konten. Jarang instrumen mengeksplorasi semua masalah yang berpotensi
penting. Studi Prince Corporation dapat memperlakukan citra perusahaan di bidang
ketenagakerjaan dan ekologi namun juga mengabaikan kepemimpinan sipil manajemen
perusahaan, dukungan terhadap program pendidikan lokal, filantropi, atau posisinya
mengenai isu-isu minoritas. Sekalipun masalah umum dipelajari, pertanyaan mungkin
tidak mencakup aspek yang cukup dari masing-masing daerah
perhatian. Meskipun kita bisa mempelajari citra Prince Corporation sebagai pemberi
kerja dalam hal skala gaji dan upah, peluang promosi, dan stabilitas kerja, mungkin
topik seperti kondisi kerja, hubungan manajemen perusahaan dengan pekerja
terorganisir, dan program tunjangan pensiun dan lainnya juga harus dilakukan.
termasuk.
The Characteristics of Good Measurement (Karakteristik Pengukuran Baik)
Apa karakteristik alat ukur yang baik? Jawaban intuitif untuk pertanyaan ini adalah bahwa alat
itu harus menjadi penghitung atau indikator akurat tentang apa yang ingin kita ukur. Selain itu,
harus mudah dan efisien untuk digunakan. Ada tiga kriteria utama untuk mengevaluasi alat ukur:
validitas, reliabilitas, dan kepraktisan.
Validitas adalah sejauh mana sebuah tes mengukur apa yang sebenarnya ingin kita ukur.
Kehandalan berkaitan dengan akurasi dan ketepatan prosedur pengukuran.
Kepraktisan berkaitan dengan berbagai faktor ekonomi, kenyamanan,
dan interpretability.
Pada bagian berikut, kita membahas sifat kualitas ini dan bagaimana periset dapat mencapainya
dalam prosedur pengukurannya.
Validity (Keabsahan)
Banyak bentuk validitas disebutkan dalam literatur penelitian, dan jumlahnya bertambah
saat kita memperluas perhatian untuk pengukuran ilmiah yang lebih banyak. Teks ini
memiliki dua bentuk utama: validitas eksternal dan internal. Validitas eksternal dari
temuan penelitian adalah kemampuan data untuk digeneralisasi di seluruh orang, setting,
dan waktu; Kami mendiskusikan hal ini dengan mengacu pada eksperimen di Bab 9, dan
akan banyak lagi yang akan dibahas dalam Bab 14 tentang pengambilan sampel. 14
Dalam bab ini, kita hanya membahas validitas internal. Validitas internal dibatasi lebih
lanjut dalam diskusi ini dengan kemampuan instrumen penelitian untuk mengukur apa
yang dimaksudkan untuk diukur. Apakah instrumen benar-benar mengukur apa yang
dikatakan oleh perancangnya?
Satu klasifikasi validitas yang diterima secara luas terdiri dari tiga bentuk utama: (1)
validitas isi, (2) validitas kriteria, dan (3) membangun validitas (lihat Lampiran 11-5).
Validitas isi alat ukur adalah sejauh mana cakupannya memadai untuk menjawab
pertanyaan investigasi yang membimbing penelitian ini. Jika instrumen tersebut berisi
sampel representatif dari alam semesta materi pokok yang diminati, maka validitas isi itu
bagus. Untuk mengevaluasi keabsahan isi instrumen, seseorang harus terlebih dahulu
menyetujui elemen apa yang merupakan cakupan yang memadai. Dalam penelitian
Prince Corporation, kita harus memutuskan pengetahuan dan sikap apa yang relevan
dengan pengukurancitra publik perusahaan dan kemudian memutuskan bentuk pendapat
mana yang relevan dengan topik ini. Dalam studi Glacier, Jason harus terlebih dahulu
menentukan faktor apa yang mempengaruhi kepuasan pelanggan sebelum menentukan
apakah indeks yang dipublikasikan dapat bernilai. Jika instrumen pengumpulan data
cukup mencakup topik yang telah dikoreksi sebagai dimensi yang relevan, maka
instrumen penelitian memiliki validitas konten yang baik.
Penentuan validitas konten melibatkan penilaian. Pertama, perancang dapat
menentukannya melalui definisi topik yang hati-hati, item yang akan diskalakan, dan
timbangan yang akan digunakan. Proses logis ini sering intuitif dan unik bagi setiap
perancang penelitian.
Cara kedua adalah menggunakan panel orang untuk menilai seberapa baik instrumen
tersebut memenuhi standar. Panel secara independen menilai item uji untuk instrumen
yang penting, berguna namun tidak penting, atau tidak diperlukan. Tanggapan "penting"
pada setiap item dari masing-masing panelis dievaluasi dengan rasio validitas konten, dan
yang memenuhi nilai signifikansi statistik dipertahankan. Dalam penilaian informal dan
proses sistematis ini, "validitas isi terutama berkaitan dengan kesimpulan tentang
konstruksi uji daripada kesimpulan tentang nilai tes.
Penting untuk tidak defi ne konten terlalu sempit. Jika Anda hanya bisa mengamankan
ekspresi pendapat supervisi dalam survei sikap Pangeran Corporation, mungkin tidak ada
liputan konten yang memadai. Penelitian ini harus menyelidiki proses dimana perilaku
tersebut muncul. Bagaimana tanggapan responden terhadap apa yang mereka lakukan,
dan bagaimana intensitas perasaannya? Hal yang sama juga berlaku untuk evaluasi
kualitas dan kepuasan layanan MindWriter. Tidak cukup mengenal seorang pelanggan
adalah dissatisfi ed. Manajer yang bertugas untuk meningkatkan atau memperbaiki
program perlu mengetahui proses, karyawan, suku cadang, dan urutan waktu dalam
program CompleteCare yang telah menyebabkan ketidakpuasan tersebut.
Criterion-Related Validity (Kriteria Terkait Validitas)
Sebuah kriteria relevan jika defi ned dan dinilai dalam istilah yang kita menilainya
sebagai ukuran kesuksesan penjual yang tepat. Jika Anda yakin keberhasilan penjualan
cukup diukur dengan volume penjualan dolar yang dicapai per tahun, maka itu adalah
kriteria yang relevan. Jika Anda yakin kesuksesan harus mencakup tingkat penetrasi
akun besar yang tinggi, volume penjualan saja tidak sepenuhnya relevan. Dalam
membuat keputusan ini, Anda harus mengandalkannya
penilaian Anda dalam menentukan kriteria parsial mana yang tepat merupakan indikasi
keberhasilan penjual.
Kebebasan dari bias tercapai ketika kriteria memberi setiap tenaga penjual kesempatan
yang sama untuk mencetak gol dengan baik. Kriteria penjualan akan bias jika tidak
menunjukkan penyesuaian terhadap perbedaan kondisi potensial dan persaingan
teritorial.
Kriteria yang dapat diandalkan stabil atau dapat direproduksi. Kriteria yang tidak
menentu (menggunakan penjualan bulanan, yang sangat bervariasi dari bulan ke bulan)
hampir tidak dapat dianggap sebagai standar yang dapat diandalkan untuk menilai
kinerja pada tes ketenagakerjaan penjualan. Akhirnya, informasi yang ditentukan oleh
kriteria harus tersedia. Jika tidak tersedia, berapa biayanya dan seberapa sulitnya
mengamankan? Jumlah uang dan usaha yang harus dikeluarkan untuk pengembangan
kriteria tergantung pada pentingnya
masalah dimana tes digunakan
Begitu ada nilai tes dan kriteria, mereka harus dibandingkan dengan beberapa cara.
Pendekatan yang biasa dilakukan adalah mengkorelasikannya. Misalnya, Anda mungkin
menghubungkan skor tes 40 tenaga penjualan baru dengan pencapaian penjualan tahun
pertama yang disesuaikan dengan perbedaan antara kondisi penjualan teritorial.
Dalam upaya untuk mengevaluasi validitas konstruk, kita mempertimbangkan teori dan
alat ukur yang digunakan. Jika kita tertarik untuk mengukur pengaruh kepercayaan pada
tim lintas fungsional, cara "kepercayaan" secara operasional harus sesuai dengan teori
empiris. Jika ukuran kepercayaan yang diketahui tersedia, kami mungkinmenghubungkan
hasil yang diperoleh dengan menggunakan ukuran inidengan yang berasal dari instrumen
baru kami. Pendekatan semacam itu akan memberi kita indikasi awal tentang validitas
konvergen (tingkat di mana skor pada satu skala berkorelasi dengan skor pada skala lain
yang dirancang untuk menilai konstruksi yang sama). Jika Jason mengembangkan indeks
kepuasan pelanggan untuk Glacier dan, jika dibandingkan, hasilnya menunjukkan
indikasi yang sama dengan indeks yang berkembang dan mapan, instrumen Jason akan
memiliki validitas konvergen. Begitu pula jika Jasonmengembangkan sebuah
instrumenuntuk mengukur kepuasan dengan program CompleteCare dan ukuran turunan
dapat disesuaikan dengan ukuran kepuasan pelanggan standar, validitas konvergen akan
ada.
Kembali ke contoh kita sebelumnya, metode lain untuk memvalidasi konstruksi
kepercayaan adalah memisahkannya dari konstruksi lain dalam teori atau teori terkait.
Sejauh kepercayaan dapat dipisahkan dari ikatan, timbal balik, dan empati, kami akan
menyelesaikan langkah pertama menuju validitas diskriminan (sejauh mana skor dalam
skala tidak berkorelasi dengan skor dari skala yang dirancang untuk mengukur konstruksi
yang berbeda).
Kami membahas tiga bentuk validitas secara terpisah, namun saling terkait, baik secara
teoritis maupun operasional. Validitas prediktif penting untuk tes yang dirancang untuk
memprediksi keberhasilan produk. Dalam mengembangkan tes semacam itu, Anda
mungkin akan terlebih dahulu mencatat faktor (konstruk) yang memberikan dasar untuk
prediksi yang berguna. Misalnya, Anda akan memajukan sebuah teori tentang variabel
dalam kesuksesan produk-area untuk validitas konstruk. Akhirnya, dalam
mengembangkan item spesifik untuk dimasukkan dalam uji prediksi keberhasilan, Anda
akan memperhatikan seberapa baik item spesimen menentukan keseluruhan rangkaian
masing-masing konstruk (soal validitas konten). Melihat Gambar 11-6, kita bisa lebih
memahami konsep validitas dan reliabilitas dengan menggunakan busur pemanah dan
target sebagai analogi.
Reliability (Keandalan)
Ukuran dapat diandalkan sampai pada tingkat yang memberi hasil yang konsisten.
Keandalan adalah kontributor validitas yang diperlukan namun bukan merupakan syarat
yang cukup untuk validitas. Hubungan antara reliabilitas dan validitas dapat
diilustrasikan dengan menggunakan skala kamar mandi. Jika skala mengukur berat badan
Anda dengan benar (menggunakan kriteria bersamaan seperti skala yang diketahui
akurat), maka keduanya dapat diandalkan dan valid. Jika secara konsisten mengalahkan
Anda sebesar enam pon, maka skala itu bisa diandalkan tapi tidak valid. Jika ukuran skala
tidak menentu dari waktu ke waktu, maka itu tidak dapat diandalkan dan karena itu tidak
dapat berlaku. Jadi jika pengukuran tidak valid, tidak masalah jika dapat diandalkan -
karena tidak mengukur apa yang perancang perlu diukur untuk menyelesaikan masalah
penelitian. Dalam konteks ini, keandalan tidak dianggap sebagai validitas, namun jauh
lebih mudah untuk dinilai.
Keandalan berkaitan dengan perkiraan tingkat dimana pengukuran bebas dari kesalahan
orunastik acak. Instrumen yang dapat diandalkan dapat digunakan dengan alasan bahwa
faktor transien dan situasional tidak mengganggu. Instrumen yang handal kuat; Mereka
bekerja dengan baik pada waktu yang berbeda dalam kondisi yang berbeda. Perbedaan
waktu dan kondisi ini adalah dasar bagi perspektif yang sering digunakan mengenai
stabilitas keandalan, kesetaraan, dan konsistensi internal (lihat Gambar 11-7).
Stability (Stabilitas)
Ukuran dikatakan memiliki stabilitas jika Anda dapat memperoleh hasil yang
konsisten dengan pengukuran berulang dari orang yang sama dengan instrumen
yang sama. Prosedur pengamatan stabil jika memberikan pembacaan yang sama
pada orang tertentu bila diulang satu kali atau lebih. Hal ini sering memungkinkan
untuk mengulang pengamatanpada subjek dan membandingkannya untuk
konsistensi. Bila ada banyak waktu di antara pengukuran, ada kemungkinan faktor
situasional berubah, sehingga mempengaruhi pengamatan. Perubahan akan
tampak salah sebagai penurunan keandalan proses pengukuran.
Pengukuran stabilitas dalam situasi survei lebih sulit dan kurang mudah
dieksekusi daripada dalam penelitian observasional. Meski bisa mengamati
tindakan tertentu berulang kali, biasanya Anda hanya bisa resurvey sekali. Ini
mengarah pada pengaturan tes ulang-dengan perbandingan antara dua tes untuk
mengetahui seberapa andal mereka. Beberapa perbedaan yang dapat terjadi dalam
metodologi pengujian ulang dan menyebabkan bias turun dalam stabilitas
meliputi:
Keterlambatan waktu antara pengukuran - perubahan faktor situasional
(juga masalah dalam penelitian observasi).
Kurangnya waktu antara pengukuran - membuat responden mengingat
jawaban sebelumnya dan mengulanginya, sehingga menghasilkan
indikator reliabilitas yang bias.
Ketajaman responden terhadap tujuan tersamarkan studi - mungkin
mengenalkan bias jika responden memegang pendapat terkait dengan
tujuan namun tidak dinilai dengan pertanyaan pengukuran saat ini.
Kepekaan topik -berapa ketika responden berusaha untuk belajar lebih
banyak tentang topik atau membentuk pendapat baru dan berbeda sebelum
tes ulang.
Saran yang disarankan adalah memperpanjang interval antara tes dan tes ulang
(dari dua minggu sampai satu bulan). Meskipun hal ini dapat membantu, peneliti
harus waspada terhadap kemungkinan faktor luar akan mencemari pengukuran
dan mendistorsi skor stabilitas. Akibatnya, pengukuran stabilitas melalui
pendekatan uji coba menguji ulang aplikasi terbatas. Minat lebih banyak berpusat
pada kesetaraan.
Equivalence (Persamaan derajatnya)
Perspektif kedua mengenai keandalan mempertimbangkan berapa banyak
kesalahan yang dapat dikenalkan oleh peneliti yang berbeda (dalam pengamatan)
atau sampel item yang berbeda yang dipelajari (dalam pertanyaan atau skala).
Jadi, sementara stabilitas berkaitan dengan fluktuasi pribadi dan situasional dari
satu waktu ke yang lain, kesetaraan berkaitan dengan variasi pada satu titik waktu
antara pengamat dan sampel barang. Cara yang baik untuk menguji ekuivalensi
pengukuran oleh pengamat yang berbeda adalah membandingkan penilaian
mereka terhadap kejadian yang sama. Contoh dari hal ini adalah penilaian pemain
skater Olimpiade oleh majelis hakim.
Dalam studi di mana konsensus antara para ahli atau pemerhati diperlukan,
kesamaan persepsi para hakim terkadang dipertanyakan. Bagaimana panel
pengawas membuat keputusan mengenai kenaikan penghargaan, kemasan produk
baru, atau tren bisnis masa depan? Keandalan antarat dapat digunakan dalam
kasus ini untuk mengkorelasikan pengamatan atau skor hakim dan membuat
indeks seberapa konsisten penilaian mereka. Dalam skating fajar Olimpiade,
posisi relatif hakim terhadap skaters (ditentukan dengan menetapkan urutan
peringkat untuk masing-masing hakim dan membandingkan setiap perintah hakim
untuk semua skater) adalah alat untuk mengukur kesetaraan.
Minat utama dengan kesetaraan biasanya bukan bagaimana responden berbeda
dari satu item ke item lain, tapi seberapa baik seperangkat item tertentu akan
mengkategorikan individu. Mungkin ada banyak perbedaan dalam tanggapan
antara dua sampel item, namun jika seseorang diklasifikasikan dengan cara yang
sama pada setiap tes, tes tersebut memiliki kesetaraan yang baik.
Satu tes untuk kesetaraan sampel item dengan menggunakan bentuk alternatif atau
paralel dari tes yang sama diberikan kepada orang yang sama secara bersamaan.
Hasil kedua tes tersebut kemudian berkorelasi. Dengan kondisi ini, lamanya
proses pengujian cenderung mempengaruhi respons subyek melalui kelelahan,
dan keandalan bentuk paralel yang disimpulkan akan berkurang. Beberapa ahli
teori pengukuran merekomendasikan selang waktu antara dua tes untuk
mengkompensasi masalah ini. Pendekatan ini, yang disebut bentuk ekuivalen
tertunda, adalah gabungan uji coba ulang dan metode kesetaraan. Seperti dalam
testretest, seseorang akan mengelola bentuk X diikuti oleh bentuk Y ke setengah
peserta ujian dan formulir Y diikuti oleh bentuk X ke setengah lainnya untuk
mencegah efek "pesanan presentasi".
Peneliti hanya dapat memasukkan sejumlah pertanyaan pengukuran dalam
instrumen. Keterbatasan ini menyiratkan bahwa contoh pertanyaan pengukuran
dari domain konten telah dipilih dan sampel lain yang menghasilkan bilangan
serupa perlu ditarik untuk instrumen kedua. Seringkali sulit membuat set kedua
ini. Namun jika kolam pada awalnya cukup besar, barang dapat dipilih secara
acak untuk setiap instrumen. Bahkan dengan prosedur yang lebih canggih yang
digunakan oleh penerbit tes standar, jarang ditemukan sepenuhnya setara dan
saling dipertukarkanpertanyaan.
Internal Consistency (Konsistensi Internal)
Pendekatan ketiga terhadap reliabilitas hanya menggunakan satu administrasi
instrumen atau pengujian untuk menilai konsistensi internal atau homogenitas di
antara item. Teknik split-half dapat digunakan saat alat ukur memiliki banyak
pertanyaan atau pernyataan serupa yang dapat ditanggapi oleh peserta. Instrumen
diberikan dan hasilnya dipisahkan oleh item ke angka genap dan ganjil atau secara
acak
bagian yang dipilih Bila kedua bagian tersebut berkorelasi, jika hasil korelasi
tinggi, instrumen dikatakan memiliki reliabilitas tinggi dalam pengertian
konsistensi internal. Korelasi tinggi memberitahu kita ada kesamaan (atau
homogenitas) di antara item. Potensi kesimpulan yang salah tentang konsistensi
internal yang tinggi ada saat tes berisi banyak item - yang mempengaruhi indeks
korelasi.
Rumus koreksi Spearman-Brown digunakan untuk menyesuaikan efek panjang uji
dan untuk memperkirakan reliabilitas keseluruhan tes.
Practicality (Kepraktisan)
Persyaratan ilmiah dari suatu panggilan proyek agar proses pengukuran dapat diandalkan
dan valid, sementara persyaratan operasional mengharuskannya menjadi praktis.
Kepraktisan telah didefinisikan sebagai ekonomi, kenyamanan, dan interpretabilitas.
Meskipun definisi ini mengacu pada pengembangan tes pendidikan dan psikologis, ini
juga berarti untuk pengukuran bisnis.
Economy (Ekonomi)
Beberapa trade-off biasanya terjadi antara proyek penelitian yang ideal dan budget.
Data tidak bebas, dan panjang instrumen adalah satu area dimana tekanan ekonomi
mendominasi. Lebih banyak item memberi lebih banyak keandalan, namun demi
membatasi waktu wawancara atau observasi (dan karena itu biaya), kami menahan
jumlah pertanyaan pengukuran. Pemilihan metode pengumpulan data juga sering
didikte oleh faktor ekonomi. Meningkatnya biaya wawancara pribadi pertama kali
menyebabkan peningkatan penggunaansurvei telepon dan kemudian naik saat ini
dalam survei Internet. Dalam tes standar, biaya bahan uji saja dapat menjadi biaya
yang sangat signifikan sehingga mendorong penggunaan kembali secara berulang-
ulang. Tambahkan ke ini kebutuhan untuk skor cepat dan ekonomis, dan kami
melihat mengapa penilaian dan pemindaian komputer menarik.
Convenience (Kenyamanan)
Alat ukur melewati uji kenyamanan jika mudah dilakukan. Kuesioner atau skala
pengukuran dengan serangkaian petunjuk rinci namun jelas, dengan contoh, lebih
mudah diselesaikan dengan benar daripada yang tidak memiliki fitur ini. Dalam
sebuah penelitian yang dipersiapkan dengan baik, tidak jarang pewawancara
menjadi beberapa kali lebih lama daripada pertanyaan wawancara. Tentu, semakin
kompleks konsep dan konstruksinya, semakin besar kebutuhan akan instruksi yang
jelas dan lengkap. Kita juga bisa membuat instrumen lebih mudah diatur dengan
memperhatikan desain dan tata letaknya. Meski reliabilitas dan validitas
mendominasi pilihan kita dalam desain timbangan di sinidan kemudian di Bab 12,
kesulitan administratif harus memainkan peran tertentu. Waktu penyelesaian yang
cukup lama, instruksi yang rumit, perbedaan peserta yang dirasakan dengan survei,
dan kenikmatan hasil proses mereka juga mempengaruhi desain. Masalah tata letak
mencakup kumpulan materi, reproduksi ilustrasi yang buruk, dan pelepasan barang
dari satu halaman ke halaman berikutnya atau kebutuhan untuk menggulir layar saat
melakukan survei di Web. Baik masalah desain dan tata letak membuat selesainya
instrumen lebih sulit.
Interpretability (Interpretabilitas)
Aspek kepraktisan ini relevan bila orang-orang selain perancang tes harus
menafsirkan hasilnya. Biasanya, tapi tidak eksklusif, masalah dengan tes standar.
Dalam kasus seperti itu, perancang instrumen pengumpulan data menyediakan
beberapa potongan informasi penting untuk membuat interpretasi menjadi mungkin:
Pernyataan fungsi yang dirancang untuk mengukur dan prosedur di mana ia
dikembangkan.
Petunjuk terperinci untuk administrasi.
Tombol dan instruksi penilaian.
Norma untuk kelompok referensi yang tepat.
Bukti tentang keandalan.
Bukti mengenai interkorelasi subscores.
Bukti mengenai hubungan tes dengan tindakan lain.
Panduan untuk penggunaan uji.
Measurement
1.1.The Relationship between Attitudesand Behavior (Hubungan antara Sikap dan Perilaku)
Hubungan sikap-perilaku tidak langsung, meski mungkin ada keterkaitan yang erat. Sikap
dan niat perilaku tidak selalu mengarah pada perilaku yang sebenarnya; dan meskipun
sikap dan perilaku diharapkan konsisten satu sama lain, itu tidak selalu terjadi. Selain itu,
perilaku dapatmempengaruhi sikap. Misalnya, pemasar tahu bahwa pengalaman positif
dengan produk atau layanan memperkuat sikap positif atau membuat pertanyaan
pelanggan bersikap negatif.
Inilah salah satu alasan mengapa restoran di mana Anda memiliki pengalaman bersantap
yang buruk dapat memberi Anda kupon untuk makanan gratis pada kunjungan Anda
berikutnya. Mereka tahu pengalaman buruk berkontribusi kuat terhadap pembentukan
sikap negatif.
Peneliti bisnis memperlakukan sikap sebagai konstruksi hipotetis karena kompleksitas
dan fakta bahwa mereka disimpulkan dari data pengukuran, yang sebenarnya tidak
diamati. Kualifikasi ini menyebabkan peneliti berhati-hati mengenai cara aspek tertentu
dari perilaku yang diukur untuk memprediksi perilaku. Beberapa faktor berpengaruh
terhadap penerapan penelitian sikap:
Sikap spesifik adalah prediktor perilaku yang lebih baik daripada perilaku yang
umum.
Sikap yang kuat (kekuatan dipengaruhi oleh aksesibilitas atau seberapa baik objek
diingat dan dibawa ke kesadaran, seberapa ekstrem sikap, atau tingkat kepercayaan
di dalamnya) adalah prediktor perilaku yang lebih baik daripada sikap lemah yang
terdiri dari sedikit intensitas atau kepentingan topikal. .
Pengalaman langsung dengan objek sikap (bila sikap terbentuk, selama paparan
berulang, atau melalui pengingat) menghasilkan perilaku yang lebih andal.
Sikap berbasis kognitif mempengaruhi perilaku lebih baik daripada sikap berbasis
afektif.
Sikap berbasis afektif seringkali merupakan prediktor perilaku konsumsi yang lebih
baik.
Menggunakan beberapa pengukuran sikap atau beberapa penilaian perilaku di
waktu dan lingkungan meningkatkan prediksi.
Pengaruh kelompok referensi (dukungan interpersonal, desakan kepatuhan, tekanan
teman sebaya) dan kecenderungan individu untuk menyesuaikan diri terhadap
pengaruh ini meningkatkan hubungan perilaku-perilaku.
Periset mengukur dan menganalisa sikap karena sikap menawarkan wawasan tentang
perilaku. Banyak skala pengukuran sikap yang digunakan telah diuji untuk reliabilitas dan
validitas, namun seringkali kita membuat skala unik yang tidak sesuai standar tersebut.
Contohnya adalah instrumen yang mengukur sikaptentang objek wisata, produk, atau
kandidat tertentu, serta keinginan orang untuk berkunjung, membeli, atau memberi
suara. Baik sikap maupun instrumen niat perilaku, sendiri atau bersama-sama, efektif
dalam memprediksi perilaku sebenarnya orang tersebut jika belum dirancang dengan
hati-hati. Meskipun demikian, para manajer tahu bahwa pengukuran sikap penting
karena sikap mencerminkan pengalaman masa lalu dan membentuk perilaku masa
depan.
5. Sorting (Penyortiran)
Q-macam memerlukan pemilahan setumpuk kartu ke tumpukan yang mewakili titik-titik
sepanjang kontinum. Peserta-atau hakim-kelompok kartu berdasarkan tanggapannya
terhadap konsep yang tertulis di kartu. Peneliti menggunakan Q-sort menyelesaikan tiga
masalah khusus: pemilihan item, pilihan terstruktur atau tidak terstruktur dalam pemilahan,
dan analisis data. Prosedur Q-sort dasar melibatkan pemilihan satu set verbalpernyataan,
ungkapan, kata tunggal, atau foto yang terkait dengan konsep yang sedang dipelajari. Untuk
stabilitas statistik, jumlah kartu tidak boleh kurang dari 60; dan untuk kenyamanan, tidak
lebih dari 120. Setelah kartu dibuat, mereka dikocok, dan peserta diinstruksikan untuk
menyortir kartu menjadi satu set tumpukan (biasanya 7 sampai 11), masing-masing
tumpukan mewakili sebuah titik pada penghakiman. kontinum Tumpukan paling kiri
mewakili pernyataan konsep, yang "paling berharga," "menguntungkan," "menyenangkan,"
dan sebagainya. Tumpukan paling kanan berisi kartu yang paling tidak menguntungkan.
Peneliti meminta peserta untuk mengisi tumpukan tengah atau netral dengan kartu-kartu
yang menjadi pertimbangan peserta. Dalam kasus terstruktur, distribusikartu yang diizinkan
di setiap tumpukan sudah ditentukan sebelumnya. Dengan jenis yang tidak terstruktur,
hanya jumlah tumpukan yang akan ditentukan. Meskipun distribusi kartu dalam bentuk
yang paling terstruktur menyerupai distribusi normal, ada beberapa kontroversi mengenai
analisis data sebagai data rangking (data ordinal) versus data interval.
Tujuan pemilahan adalah untuk mendapatkan representasi konseptual sikap penyortir
terhadap objek sikap dan untuk membandingkan hubungan antar manusia. Peringkat relatif
konsep memungkinkan periset untuk mendapatkan kelompok individu yang memiliki
preferensi serupa. Oleh para peneliti berbagai petunjuk, teknik ini dapat digunakan untuk
menggambarkan produk, layanan, niat perilaku, dansejumlah aplikasi lainnya. Pada contoh
di bawah ini, peserta diminta untuk melengkapi kartu terstruktur yang berisi nama majalah.
Nilai skala dan jumlah kartu di setiap tumpukan telah ditentukan sebelumnya, walaupun
distribusi dalam kasus ini mewakili distribusi statistik normal.
Pengukuran dapat didefinisikan sebagai suatu proses sistimatik dalam menilai dan membedakan
sesuatu obyek yang diukur. Pengukuran tersebut diatur menurut kaidah-kaidah tertentu. Kaidah-
kaidah yang berbeda menghendaki skala serta pengukuran yang berbeda pula.
Dalam mengolah dan menganalisis data, kita sangat berkepentingan dengan sifat dasar skala
pengukuran yang digunakan. Operasi-operasi matematik serta pilihan peralatan statistik yang
digunakan dalam pengolahan data, pada dasarnya memiliki persyaratan tertentu dalam hal skala
pengukuran datanya. Ketidaksesuaian antara skala pengukuran dengan operasi matematik
/peralatan statistik yang digunakan akan menghasilkan kesimpulan yang bias dan tidak
tepat/relevan.
Oleh karenanya, dalam tulisan kali ini, menyambung dua tulisan sebelumnya (Transformasi Data
Ordinal ke Interval dengan Excel dan Transformasi Data Ordinal ke Interval dengan Minitab),
kita akan mencoba memahami skala-skala pengukuran yang ada serta perbedaan-perbedaannya.
Ada empat tipe pengukuran atau skala pengukuran yang digunakan dalam statistika, yakni:
nominal, ordinal, interval, dan rasio.
1. Nominal
Skala Nominal merupakan skala yang paling lemah/rendah di antara skala pengukuran yang ada.
Skala nominal hanya bisa membedakan benda atau peristiwa yang satu dengan yang lainnya
berdasarkan nama (predikat). Skala pengukuran nominal digunakan untuk mengklasifikasi
obyek, individual atau kelompok dalam bentuk kategori.
Pemberian angka atau simbol pada skala nomial tidak memiliki maksud kuantitatif hanya
menunjukkan ada atau tidak adanya atribut atau karakteristik pada objek yang diukur. Misalnya,
jenis kelamin diberi kode 1 untuk laki-laki dan kode 2 untuk perempuan. Angka ini hanya
berfungsi sebagai label
kategori, tanpa memiliki nilai instrinsik dan tidak memiliki arti apa pun. Kita tidak bisa
mengatakan perempuan dua kali dari laki-laki. Kita bisa saja mengkode laki-laki menjadi 2 dan
perempuan dengan kode 1, atau bilangan apapun asal kodenya berbeda antara laki-laki dan
perempuan. Misalnya lagi untuk agama, kita bisa mengkode 1=Islam, 2=Kristen, 3=Hindu,
4=Budha dstnya. Kita bisa menukar angka-angka tersebut, selama suatu karakteristik memiliki
angka yang berbeda dengan karakteristik lainnya.
Karena tidak memiliki nilai instrinsik, maka angka-angka (kode-kode) yang kita berikan tersebut
tidak memiliki sifat sebagaimana bilangan pada umumnya. Oleh karenanya, pada variabel
dengan skala nominal tidak dapat diterapkan operasi matematika standar (aritmatik) seperti
pengurangan, penjumlahan, perkalian, dan lainnya. Peralatan statistik yang sesuai dengan skala
nominal adalah peralatan statistik yang berbasiskan (berdasarkan) jumlah dan proporsi seperti
modus, distribusi frekuensi, Chi Square dan beberapa peralatan statistik non-parametrik lainnya.
2. Ordinal
Skala Ordinal ini lebih tinggi daripada skala nominal, dan sering juga disebut dengan skala
peringkat. Hal ini karena dalam skala ordinal, lambang-lambang bilangan hasil pengukuran
selain menunjukkan pembedaan juga menunjukkan urutan atau tingkatan obyek yang diukur
menurut karakteristik tertentu.
Misalnya tingkat kepuasan seseorang terhadap produk. Bisa kita beri angka dengan 5=sangat
puas, 4=puas, 3=kurang puas, 2=tidak puas dan 1=sangat tidak puas. Atau misalnya dalam suatu
lomba, pemenangnya diberi peringkat 1,2,3 dstnya.
Dalam skala ordinal, tidak seperti skala nominal, ketika kita ingin mengganti angka-angkanya,
harus dilakukan secara berurut dari besar ke kecil atau dari kecil ke besar. Jadi, tidak boleh kita
buat 1=sangat puas, 2=tidak puas, 3=puas dstnya. Yang boleh adalah 1=sangat puas, 2=puas,
3=kurang puas dstnya.
Selain itu, yang perlu diperhatikan dari karakteristik skala ordinal adalah meskipun nilainya
sudah memiliki batas yang jelas tetapi belum memiliki jarak (selisih). Kita tidak tahu berapa
jarak kepuasan dari tidak puas ke kurang puas. Dengan kata lain juga, walaupun sangat puas kita
beri angka 5 dan sangat tidak puas kita beri angka 1, kita tidak bisa mengatakan bahwa kepuasan
yang sangat puas lima kali lebih tinggi dibandingkan yang sangat tidak puas.
Sebagaimana halnya pada skala nominal, pada skala ordinal kita juga tidak dapat menerapkan
operasi matematika standar (aritmatik) seperti pengurangan, penjumlahan, perkalian, dan
lainnya. Peralatan statistik yang sesuai dengan skala ordinal juga adalah peralatan statistik yang
berbasiskan (berdasarkan) jumlah dan proporsi seperti modus, distribusi frekuensi, Chi Square
dan beberapa peralatan statistik non-parametrik lainnya.
3. Interval
Skala interval mempunyai karakteristik seperti yang dimiliki oleh skala nominal dan ordinal
dengan ditambah karakteristik lain, yaitu berupa adanya interval yang tetap. Dengan demikian,
skala interval sudah memiliki nilai intrinsik, sudah memiliki jarak, tetapi jarak tersebut belum
merupakan kelipatan. Pengertian “jarak belum merupakan kelipatan” ini kadang-kadang
diartikan bahwa skala interval tidak memiliki nilai nol mutlak.
Misalnya pada pengukuran suhu. Kalau ada tiga daerah dengan suhu daerah A = 10oC, daerah B
= 15oC dan daerah C=20oC. Kita bisa mengatakan bahwa selisih suhu daerah B, 5 oC lebih panas
dibandingkan daerah A, dan selisih suhu daerah C dengan daerah B adalah 5 oC. (Ini
menunjukkan pengukuran interval sudah memiliki jarak yang tetap). Tetapi, kita tidak bisa
mengatakan bahwa suhu daerah C dua kali lebih panas dibandingkan daerah A (artinya tidak bisa
jadi kelipatan). Kenapa ? Karena dengan pengukuran yang lain, misalnya dengan Fahrenheit, di
daerah A suhunya adalah 50oF, di daerah B = 59oF dan daerah C=68oF. Artinya, dengan
pengukuran Fahrenheit, daerah C tidak dua kali lebih panas dibandingkan daerah A, dan ini
terjadi karena dalam derajat Fahrenheit titik nolnya pada 32, sedangkan dalam derajat Celcius
titik nolnya pada 0. (Bagi yang menginginkan cara mengkonversi Celcius ke Fahrenheit atau
sebaliknya, lihat tulisan mengenai Konversi Sistem-Sistem Pengukuran dengan Excel)
Contoh lainnya, misalnya dua orang murid, si A mendapat nilai 70 sedangkan si B mendapat
nilai 35. Kita tidak bisa mengatakan si A dua kali lebih pintar dibandingkan si B. (Kenapa ?)
Skala interval ini sudah benar-benar angka dan, kita sudah dapat menerapkan semua operasi
matematika serta peralatan statistik kecuali yang berdasarkan pada rasio seperti koefisien variasi.
4. Skala rasio
Skala rasio adalah skala data dengan kualitas paling tinggi. Pada skala rasio, terdapat semua
karakteristik skala nominal,ordinal dan skala interval ditambah dengan sifat adanya nilai nol
yang bersifat mutlak. Nilai nol mutlak ini artinya adalah nilai dasar yang tidak bisa diubah
meskipun menggunakan skala yang lain. Oleh karenanya, pada skala ratio, pengukuran sudah
mempunyai nilai perbandingan/rasio.
Pengukuran-pengukuran dalam skala rasio yang sering digunakan adalah pengukuran tinggi dan
berat. Misalnya berat benda A adalah 30 kg, sedangkan benda B adalah 60 kg. Maka dapat
dikatakan bahwa benda B dua kali lebih berat dibandingkan benda A.
Kesalahan dalam pengukuran adalah perbedaan antara nilai sebenarnya dari suatu
pekerjaan pengukuran yang di lakukan oleh seseorang pengamat. Dalam pengukuran besara fisis
menggunakan alat ukur atau instrumen tidak akan mungkin didapat suatu nilai yang benar tepat,
namun selalu mempunyai ketidakpastian yang disebabkan oleh kesalahan- kesalahn dalam
pengukuran.
Menurut Miller & Miller (2001) tipe kesalahan dalam pengukuran analitik dapat dibagi menjadi
tiga, yaitu:
Secara umum, faktor yang menjadi sumber kesalahan dalam pengukuran sehingga menimbulkan
variasi hasil, antara lain adalah:
1. Perbedaan yang terdapat pada obyek yang diukur.
Hal ini dapat diatasi dengan:
a. Obyek yang akan dianalisis diperlakukan sedemikian rupa sehingga diperoleh ukuran kualitas
yang homogen
b. Mengggunakan tekhnik sampling dengan baik dan benar
2. Perbedaan situasi pada saat pengukuran Perbedaan ini dapat diatasi dengan cara mengenali
persamaan dan perbedaan suatu obyek yang terdapat pada situasi yang sama. Dengan demikian
sifat-sifat dari obyek dapat diprediksikan.
3. Perbedaan alat dan instrumentasi yang digunakan Cara yang digunakan untuk mengatasinya
adalah dengan menggunakan alat pengatur yang terkontrol dan telah terkalibrasi.
4. Perbedaan penyelenggaraan/administrasi Kendala ini diatasi dengan menyelesaikan
permasalahannon-teknis dengan baik sehingga keadaan peneliti selalu siap untuk sehingga
melakukan kerja.
5. Perbedaan pembacaan hasil pengukuran Kesalahan ini dapat diatasi dengan selalu berupaya
untuk mengenali alat atau instrumentasi yang akan digunakan terlebih dahulu.
Di beberpa referensi ada yang menyebutkan 3 sumber yaitu manusia, alat dan lingkungan.
Namun disini akan di bagi hanya 2 yang meliputi sumber sistematis dan sumber acak
1. Kesalahan Sistematis (systematics errors) atau alat dan manusia ( pengamat )
Merupakan kesalahan yang disebabkan oleh peralatan atau instrumen serat keslahan yang dibuat
oleh si pengamat.
a) Kesalahan alat
Kesalahan nol (zero error) akibat tidak berhimpitnya titik nol jarum penunjuk.
Kelelahan (fatigue) alat karena misalnya pegas yang dipakai telah lembek.
Gesekan antar bagian yang bergerak.
Kesalahan kalibrasi yaitu ketidak-tepatan pemberian skala ketika pertama kali alat dibuat.
Bisa dihindari dengan membandingkan alat tersebut dengan alat baku (standar).
Pemakaian alat pada kondisi berbeda dengan saat dikalibrasi, yaitu pada kondisi suhu,
tekanan atau kelembaban yang berbeda. Itulah sebabnya perlu dicatat nilai variable atau kondisi
lingkungan saat eksperimen dilakukan, misalnya suhu dan tekanan udara di laboratorium.
b) Kesalahan pengamat
Kesalahan parallax yaitu kesalahan akibat posisi mata saat pembacaan skala tidak tepat tegak
lurus diatas jarum.
Kesalahan interpolasi yaitu salah membaca kedudukan jarum diantara dua garis skala
terdekat.
Penguasaan prosedur dan ketangkasan penggunaan alat. Beberapa peralatan membutuhkan
prosedur yang rumit, misalnya osiloskop, yang membutuhkan ketrampilan pemakaian yang
cukup.
Sikap pengamat, misalnya kelelahan maupun keseriusan pengamat.
Sumber kesalahan ini dapat dihindari dengan sikap pengamatan yang baik, memahami sumber
kesalahan dan berlatih sesering mungkin
a) Gerak brown molekul udara yang dapat mempengaruhi penunjukkan alat-alat halus seperti
galvanometer.
b) Fluktuasi tegangan listrik yang tak teratur yang dapat mempengaruhi hasil pengukuran dengan
alat-alat ukur listrik.
c) Landasan (meja, lantai, atau dudukan lain) alat yang bergetar akibat lalu lintas atau sumber
lain.
d) Noise atau bising pada rangkaian elektronika.
e) Latar belakang radiasi kosmos pada pengukuran dengan pencacah radioaktif.
Contohnya saat kita menggunkan micrometer kita tidak boleh asal-asalan dalam
penggunaanya karena posisi pemegangan dan posisi penaruhan alat sangat berpegaruh
dalam hasil perhitungan.Teknik Pengunaan Micrometer yang benar
Kalibrasi terlebih dahulu apakah saat poros tetap dan poros geser bertemu, kedua
skala baik skala utama maupun skala putar menunjukan angkan nol.
pastikan pengunci poros geser dalam keadaan terbuka agar poros geser dapat
digerakan. (Perhatikan cara memegang mikrometer sekrup seperti terlihat pada
gambar di samping!)
Setelah itu, putar pemutar supaya rahang poros geser bergerak mundur. Ambil
benda yang hendak diukur ketebalannya dan letakan di antara poros geser dan
poros tetap.
Putar pemutar supaya poros geser menjepit benda.
Setelah terjepit sempurna, putar pengunci agar poros gerak tidak berubah lagi.
Setelah itu, kita dapat membaca skala hasil pengukuran alat ini.