Anda di halaman 1dari 12

TEORI PENGUKURAN

DAVID E. KREBS
ABSTRAK
Kegunaan dan kebenaran penilaian, baik yang dilakukan di klinik pada satu pasien atau di
laboratorium penelitian pada banyak subjek, bergantung pada pengukuran yang valid. Teori
pengukuran adalah proses berpikir dan kumpulan pengetahuan yang saling terkait yang
membentuk dasar pengukuran yang valid. Penerjemahan teori pengukuran ke perilaku membantu
memastikan integritas dan relevansi tes dan data yang dihasilkan dari tes tersebut. Dalam analisis
akhir, data yang berguna dan benar bergantung keberadaannya pada peristiwa yang terukur dan
dapat dideteksi yang diterjemahkan ke dalam pengukuran yang relevan, valid, dan andal. Aturan-
aturan di mana angka-angka ditetapkan untuk peristiwa-peristiwa membentuk dasar teori
pengukuran.

Teori pengukuran adalah dasar konseptual dari semua keputusan ilmiah. Jika pengukurannya
salah, tidak ada tipuan statistik atau verbal yang dapat memperbaikinya. Misalnya, jika aturan
penentuan posisi sendi goniometrik tidak dipatuhi, maka penelitian atau keputusan klinis
berdasarkan pengukuran rentang gerak tersebut mungkin akan mengarah pada kesimpulan yang
salah, bahkan mungkin berbahaya.
Pengukuran adalah pemberian angka pada peristiwa menurut aturan.' Teori pengukuran
terutama menyangkut aturan pengukuran, karena aturan ini menghubungkan ide dokter atau
peneliti dengan notasi aritmatika konkret yang biasanya dilaporkan sebagai "data". Pengukuran
menyandingkan sains dan filsafat, karena hanya melalui pengukuran sains mendekati kehidupan
nyata.2 Teori pengukuran harus mencerminkan kehidupan nyata dan sesuai dengan prinsip
epistemologi—filsafat makna dan pengetahuan. Dengan demikian, akal sehat dan pemikiran
jernih seringkali lebih penting daripada pengetahuan teknis dalam menghasilkan pengukuran
yang bermanfaat.
Tujuan dari artikel ini adalah untuk meletakkan dasar konseptual di mana aplikasi
pengukuran beton dibangun. Ini akan menyajikan prinsip-prinsip yang menentukan aturan yang
valid dengan nomor yang ditetapkan ke evenE. Faktor yang paling penting adalah jenis peristiwa
yang akan diukur, kriteria logis pengukuran, keandalan pengukuran, stabilitas peristiwa, dan
akhirnya cara pengukuran akan digunakan.

KLASIFIKASI DATA
Karakteristik peristiwa yang akan diukur menentukan sebagian besar jenis atau kelas data yang
dihasilkan pengukuran. Data adalah rekaman pengamatan. Datum—bentuk tunggal data—adalah
bahasa Latin untuk “yang diberikan.” Dengan demikian, rekaman suatu pengamatan kadang-
kadang diterima secara naif sebagai alias untuk peristiwa itu sendiri, sebagai sesuatu yang
diberikan. Data kuantitatif adalah rekaman numerik pengamatan peristiwa yang karakteristiknya
dapat dihitung, diberi peringkat, atau ditetapkan, suatu posisi sepanjang skala proporsional.
Penelitian fisioterapi biasanya berfokus pada data kuantitatif karena dapat diringkas dan
dianalisis secara statistik, sehingga artikel ini tidak akan membahas data verbal nonnumerik atau
kualitatif.
Sejauh mana data dipengaruhi oleh faktor-faktor yang istimewa bagi mesin atau orang
yang melakukan pengukuran sebagian dilambangkan dengan urutan data. Semakin dekat data
dengan peristiwa kehidupan, semakin sedikit mereka mungkin terpengaruh oleh proses
pengukuran.
Sejauh mana data dipengaruhi oleh faktor-faktor yang istimewa bagi mesin atau orang
yang melakukan pengukuran sebagian dilambangkan dengan urutan data. Semakin dekat data
dengan peristiwa kehidupan, semakin sedikit mereka mungkin terpengaruh oleh proses
pengukuran.
Data orde nol adalah peristiwa kehidupan itu sendiri. Istilah "urutan nol" digunakan
untuk menunjukkan bahwa istilah "data" tidak digunakan dalam pengertian biasa, karena
peristiwa kehidupan tidak dapat menjadi rekaman pengamatan; istilah tersebut, bagaimanapun,
berfungsi untuk mengingatkan para peneliti bahwa kami tidak pernah melaporkan data orde nol,
melainkan pengamatan berdasarkan peristiwa kehidupan. Data orde pertama adalah deskripsi
peristiwa kehidupan; mereka adalah tingkat dasar pengukuran. Data orde kedua adalah
kesimpulan berdasarkan deskripsi peristiwa kehidupan; mereka adalah dugaan yang disimpulkan
dari data tingkat yang lebih rendah dan dapat diberikan beberapa tingkat kebenaran atau
probabilitas statistik. Data orde ketiga adalah reaksi berdasarkan satu atau lebih potongan data
inferensial; mereka berasal dari akumulasi pengalaman yang secara konseptual terkait dengan
peristiwa kehidupan yang bersangkutan.
Pada umumnya, pengukuran dalam terapi fisik berkaitan dengan data orde pertama.
Beberapa ilmu sosial memiliki sedikit data orde pertama, yaitu, pengukuran observasional
naturalistik seperti yang mungkin terjadi dalam sosiologi atau antropologi dengan keharusan
mencampurkan kesimpulan dan reaksi dengan upaya untuk mengukur peristiwa kehidupan.
Pengamat naturalistik secara eksplisit merekam persepsi, kesimpulan, dan reaksinya terhadap
peristiwa, yang tak terhindarkan menghasilkan data orde kedua dan ketiga. Meta-analisis dan
penelitian literatur mengandalkan data orde kedua dan ketiga untuk bahan mentah mereka, dari
mana mereka menghasilkan data orde ketiga baru, yaitu, hasil lain, pendapat, dan literatur.
Data orde pertama dapat dianalisa ulang dan ditafsirkan ulang secara valid oleh peneliti
atau klinisi lain jika aturan awal pengukuran disebutkan dengan jelas. Analisis ulang dan
interpretasi ulang ini mungkin sesuai atau tidak sesuai dengan kesimpulan dan pendapat peneliti
asli mengenai peristiwa kehidupan yang sama. Sebagai contoh, jika seorang terapis mengukur
aktivitas elektromiografi (EMG) otot vastus medialis selama gaya berjalan, data orde pertama ini
(yaitu, data EMG mentah) dapat digunakan oleh satu peneliti untuk mengkarakterisasi beberapa
aspek fisiologi otot. Peneliti lain mungkin rata-rata atau mengintegrasikan data EMG orde
pertama yang sama untuk mencapai kesimpulan tentang kontrol lokomotor. Penyelidik ketiga,
bagaimanapun, mungkin menduga bahwa apa yang sebenarnya sedang diukur adalah artefak
gerak yang dihasilkan oleh anggota badan yang bergerak, kecuali jika peneliti asli menentukan
bagaimana artefak tersebut dikendalikan. Pesan penting adalah bahwa peneliti harus memberikan
alasan yang membenarkan deskripsi dan kesimpulan berdasarkan pengukuran. Artinya, pelaku
eksperimen harus menyediakan semua untuk memeriksa aturan-aturan yang digunakan untuk
menetapkan angka-angka untuk peristiwa eksperimental. Minimal, klinisi atau peneliti harus
menyadari bahwa data bisa kualitatif atau kuantitatif, dekat atau jauh dari peristiwa kehidupan.

OPERASIONALISASI
Aturan konseptual pengukuran harus dioperasionalkan ke dalam perilaku yang
memaksimalkan kemungkinan bahwa data benar-benar mewakili peristiwa kehidupan.
Meminimalkan artefak dan bias spesifik lainnya adalah tugas khusus dari operasionalisasi.
Beberapa contoh aturan yang mengatur sebagian besar penilaian klinis adalah: “Apa titik awal
dan akhir tes?” “Bagaimana posisi pasien dan penguji selama penilaian?” “Instruksi apa yang
diberikan kepada pasien dan penilai?” “Apa yang dimaksud dengan percobaan yang berhasil, dan
kapan percobaan harus dianggap tidak sah?”
Operasionalisasi aturan pengukuran ke dalam perilaku penilai menentukan apa yang
dicatat dan akhirnya diterima sebagai data. Untuk meyakinkan pembaca bahwa pengukuran itu
valid, hubungan logis antara angka-angka yang dianalisis dan semua peristiwa penting yang
terjadi selama pengumpulan data harus ditetapkan dengan jelas.
PERTIMBANGAN LOGIS DAN STATISTIK
Statistik digunakan untuk meringkas dan menganalisis data numerik. Setiap prosedur
statistik mengasumsikan bahwa datanya memenuhi setidaknya dua kriteria logis: I) Peristiwa
harus dapat dideteksi, dan 2) peristiwa harus dapat diskalakan.
Agar dapat dideteksi, peristiwa minimal harus dapat ditentukan. Menghitung jumlah
subjek dalam suatu kelompok adalah contoh familiar yang melibatkan deteksi; variabel ini dapat
diukur karena kita dapat menyepakati apa yang harus dihitung: Kita menghitung orang. Secara
khusus, kami mengembangkan aturan yang secara unik mencirikan atribut grup dan menghitung
jumlah subjek yang berbagi fitur pembeda grup. Contoh yang lebih halus, misalnya, adalah
definisi kelenturan/spastisitas. Meskipun ahli terapi fisik memiliki pemahaman empiris tentang
apa yang dirasakan jika anggota tubuh yang kaku, kami belum menyetujui variabel yang
mewakili tingkat kelenturan secara bermakna. Jadi, data spastisitas kuantitatif telah menghindari
terapis karena konsep dan konstruksi spastisitas belum dioperasionalkan, yang pada gilirannya,
saya duga, adalah karena kita tidak dapat menyetujui apa yang harus dideteksi.
Agar dapat diskalakan, peristiwa harus dapat dideteksi dan ditentukan setidaknya
sepanjang satu dimensi, yang dapat memiliki banyak atau sedikit gradasi. Misalnya, satuan
massa bisa kilogram atau mikrogram, tetapi data yang dihasilkan akan setara secara statistik dan
logis. Skala umumnya diklasifikasikan sebagai nominal, ordinal, interval, atau rasio.
Jenis Skala
Skala nominal menetapkan angka yang hanya menyebutkan atau mengklasifikasikan
peristiwa. Misalnya, tidak ada yang akan menganggap satu pemain sepak bola lebih baik dari
yang lain hanya karena nomor punggungnya lebih tinggi. Skala nominal hanya bisa
membedakan; orang hanya akan mengatakan bahwa satu pemain berbeda dari yang lain.
Skala ordinal mengklasifikasikan dan menganggap hierarki peristiwa. Skor tes otot
manual 4 (Baik) menunjukkan kontraksi otot yang lebih kuat, lebih tinggi, atau lebih baik dari
skor 2 (Buruk), tetapi tidak harus dua kali lebih tinggi, baik, atau kuat, atau bahkan perbedaan
aktual yang sama dalam fungsi otot antara 3 (Fair) dan 1 (Trace).
Skala interval mengklasifikasikan, menganggap hierarki, dan menunjukkan perbedaan
numerik yang secara isomorfik sama dengan perbedaan nyata. Pengukuran isomorfik adalah
pengukuran yang secara harfiah mengambil bentuk yang sama dengan kenyataan (Gambar). Jadi,
dua suhu dengan perbedaan hanya 2' pada skala Celcius adalah sama, dalam hal perbedaan panas
nyata, terlepas dari apakah perbedaannya antara 100' dan 98'C atau antara 12' dan l0'C. Dengan
demikian, penambahan dan pengurangan dapat digunakan secara bebas pada skala interval, tetapi
tidak perkalian atau pembagian.
Skala rasio mengklasifikasikan; menganggap hierarki; menunjukkan interval isomorfik
yang sama; dan memiliki nilai nol yang nyata dan terjadi secara alami. Jadi, tidak hanya 20' dan
60' pada skala suhu Kelvin berselisih 40', tetapi 20'K juga secara isomorfik mewakili sepertiga
panas nyata dari 60'K. Dengan demikian, semua operasi aritmatika akan menghasilkan hasil yang
berarti pada data rasio.
Batasan Statistik Skala Pengukuran
Operasi aritmatika pada data dari skala dibatasi karena kita ingin hasil operasi tersebut
memiliki makna. Operasi statistik tunduk pada pembatasan oleh logika yang sama, tetapi sifat
skala pengukuran tidak menentukan jenis analisis statistik deskriptif dan inferensial yang dapat
diterapkan kecuali untuk pembatasan aritmatika yang disebutkan sebelumnya; teori statistik dan
teori pengukuran cukup independen dalam hal ini.' Misalnya, rata-rata skor MMT hanya akan
menjadi deskripsi yang berguna dari sekelompok kekuatan otot pasien jika data MMT memiliki
distribusi normal. Jika data memiliki distribusi normal, interval probabilitas yang diketahui dapat
dibuat antara titik mana pun pada kurva normal, sehingga meningkatkan status MMT ke skala
interval dalam hal ini.
Pilihan statistik inferensial (misalnya, parametrik vs nonparametrik, atau bebas distribusi)
juga ditentukan terutama oleh distribusi yang mendasarinya dan oleh tingkat homogenitas dan
independensi varians kesalahan dari data sampel yang dikumpulkan.' Misalnya, skala seperti
mikrovolt EMG atau torsi isokinetik, yang tampaknya memiliki nilai nol yang terjadi secara
alami, mungkin tidak memenuhi persyaratan gradasi yang sama secara isomorfik dari skala
interval, sehingga skala tersebut mungkin tidak memiliki skala rasio. Data tersebut,
bagaimanapun, dapat dianalisis dengan statistik parametrik, seperti korelasi dan analisis varians
(ANOVAs), selama data yang dikumpulkan memenuhi persyaratan matematika dari uji statistik.
Sebagai contoh lain, skala nominal memiliki, dalam keadaan tertentu, sifat skala rasio; jika sifat
yang diukur hanya memiliki dua kemungkinan keadaan (misalnya, sifat dikotomis seperti jenis
kelamin), maka data “laki-laki atau perempuan” atau “ya atau tidak” dapat direpresentasikan
secara statistik sebagai “0,1” dan digunakan untuk ANOVA atau korelasi.' Pesan yang dibawa
pulang di sini adalah bahwa indeks pengukuran numerik yang paling penting harus sesuai secara
eksplisit dengan fenomena yang sedang diskalakan dan hanya berkaitan dengan analisis statistik
yang kemudian dapat diterapkan.

KEANDALAN/RELIABILITAS
Keandalan hanyalah sejauh mana pengukuran menghasilkan hasil yang sama secara konsisten.
Idealnya, variabilitas dalam data uji harus dihasilkan hanya dari perbedaan nyata dalam faktor
yang mendasari yang diperiksa. Namun pada kenyataannya, kesalahan pengukuran selalu
merupakan komponen dari nilai tes. Seperti yang ditunjukkan Stanley, "Jika unit pengukuran
cukup baik dalam kaitannya dengan keakuratan pengukuran, perbedaan akan selalu muncul."''
Memang, ketika teknologi pengukuran meningkat, bahkan konstanta fisika dasar, seperti
konstanta Planck dan konstanta kecepatan cahaya, harus disesuaikan secara berkala.' 2 Kesalahan
pengukuran dapat dibagi lagi menjadi kesalahan sistematis dan kesalahan acak.”
Kesalahan sistematis adalah bias konsisten yang dibangun ke dalam situasi pengujian.
Misalnya, beberapa orang percaya bahwa mereka dapat meningkatkan gerakan jahitan kranial
pada orang dewasa. Jika orang tersebut mencoba untuk mengukur gerakan sutura kranial dengan
palpasi, orang tersebut akan lebih percaya bahwa gerakan memang telah meningkat daripada
pengamat yang tidak bias. (Mengukur gerakan jahitan kranial pada orang dewasa, tentu saja, juga
melibatkan masalah deteksi.) Kesalahan sistematis juga mungkin tidak jelas: Sebuah telemeter
EMG yang menyebabkan penguatan arus searah 5 mV menghasilkan kesalahan sistematis, secara
sistematis melebih-lebihkan tegangan EMG aktual . Dengan demikian, data dapat diandalkan
hanya jika telemeter yang sama digunakan berulang kali, tetapi tidak jika telemeter yang berbeda
digunakan secara bergantian. Ketidakandalan sistematis juga mempengaruhi validitas data data.
Kesalahan acak terjadi secara kebetulan. Jika pengukuran dilakukan berkali-kali,
kesalahan acak akan cenderung mempengaruhi satu datum sebanyak yang lainnya. Tidak seperti
bias sistematis, kesalahan acak pada dasarnya adalah "gangguan" dalam sistem yang mencegah
pengumpulan data yang akurat dan tepat. Misalnya, telemeter yang peka terhadap kejadian acak
seperti sinyal radio yang menyimpang akan tidak akurat dalam semua kondisi.
Data yang tepat adalah keturunan dari aturan pengukuran yang tepat. Kesalahan
pengukuran dapat diminimalkan dengan memberikan instruksi yang adil dan tidak ambigu serta
lingkungan fisik yang konsisten kepada subjek uji dan pengumpul data. Singkatnya, semua
komponen lingkungan pengujian harus dikendalikan semaksimal mungkin untuk mengurangi
kemungkinan bahwa beberapa faktor selain yang diinginkan akan mempengaruhi pengukuran.
STABILITAS KINERJA
Masalah khusus keandalan pengukuran disajikan oleh studi empiris seperti penelitian
klinis. Subjek harus dapat melakukan tugas serupa jika ingin diuji ulang. Kontribusi istimewa
dari suasana hati subjek dan elemen lain yang tidak terkait dengan faktor yang menarik harus
diakui dalam setiap penelitian yang melibatkan manusia. Namun, selama pengujian berulang,
motivasi diferensial, efek pembelajaran dan praktik, kurangnya perhatian, dan penemuan
lingkungan pengujian yang berinteraksi dengan subjek dengan cara yang tidak terkendali dapat
mempengaruhi hasil tes sebanyak faktor yang menarik. Jika variabel pengganggu tersebut tidak
dapat dikendalikan melalui desain penelitian, mereka setidaknya harus diukur dan dilaporkan.
Misalnya, peneliti kontrol motorik sering mencoba untuk mendapatkan wawasan tentang refleks
neurofisiologis yang mendasari pemulihan gangguan gaya berjalan. Tidak peduli seberapa baik
tes itu dikendalikan, hanya paparan pertama dari subjek tertentu yang mungkin dapat mewakili
aktivitas "refleks"; percobaan berikutnya tentu mencerminkan, sampai batas tertentu, paparan
stimulus dan pembelajaran motorik konsekuen. Sebagai contoh yang lebih klinis, upaya untuk
mengkarakterisasi kekuatan otot maksimum tidak dapat diandalkan jika pasien lebih termotivasi
selama satu tes daripada yang lain. Sebaik apapun alat pengumpul data, jika kinerja yang dinilai
tidak stabil maka pengukuran tidak akan stabil.
Hubungan antara skala suhu nominal, ordinal, interval, dan rasio. Skala nominal (sumbu absis), menggunakan
ukuran deskriptif verbal, telah diatur secara sengaja untuk sejajar dengan urutan umum skala pengukuran kuantitatif
(sumbu ordinat). Perhatikan bahwa derajat Celcius (skala interval) sejajar dengan peristiwa kehidupan nyata, panas
absolut dalam derajat Kelvin (skala rasio), tetapi 0 °C bukanlah nilai nol-panas yang terjadi secara alami. Skala
Fahrenheit (skala ordinal) tidak memiliki kemiringan yang sama atau nilai nol yang sama dengan skala Celsius dan
Kelvin karena interval antara bilangan bulat skala Fahrenheit dan nilai nolnya tidak isomorfik dengan kenyataan

UNIT DAN DIMENSI PENGUKURAN


Sebagian besar peristiwa penelitian, seperti kehidupan, bersifat kompleks dan
multidimensi, dan seringkali lebih dari satu pengukuran diperlukan untuk memahami peristiwa
kehidupan. Misalnya, untuk mempelajari efek tangan palsu pada keterampilan aktivitas sehari-
hari, peneliti mungkin menganalisis kuantitas dan kualitas kinerja selama tugas ADL, seperti
mengikat tali sepatu ke busur. Satuan pengukuran dari dua dimensi kinerja ini, kuantitas dan
kualitas—dapat didefinisikan secara operasional sebagai durasi dalam detik dan derajat
penampilan normal, masing-masing. Dimensi pengukuran adalah konsep yang dioperasionalkan
menjadi variabel- variabel yang dioperasionalkan menjadi satuan ukuran. Michels menjelaskan
prosesnya dengan baik:
Mengidentifikasi dimensi... yang menarik; secara operasional mendefinisikan dimensi untuk
membuatnya dapat diamati secara publik; dan secara operasional mendefinisikan dua atau lebih
kategori atau unit pada dimensi sedemikian rupa sehingga mereka saling eksklusif dan lengkap.
Unit pengukuran, sebenarnya, adalah arbitrer. Kebermaknaan unit pengukuran pada
akhirnya merupakan fungsi dari konsep dan interpretasi konstruk peneliti, yang pada gilirannya
didasarkan secara longgar atau eksplisit pada pengukuran lain. Misalnya, satu inci didefinisikan
pada tahun 1324 oleh Raja Edward II sama dengan panjang rata-rata tiga biji gandum ketika
diletakkan dari ujung ke ujung. Dengan demikian, unit pengukuran 1-in awalnya cukup arbitrer,
meskipun sekarang memiliki definisi yang diterima secara umum.
Dimensi pengukuran kadang-kadang didefinisikan sebagai aspek atau karakteristik yang
tampak dari konsep yang dipelajari, tetapi dimensi juga mungkin laten, atau tidak dapat diamati
secara langsung." Penyebab nyeri punggung bawah mungkin multidimensi, yang melibatkan
karakteristik psikososial sebagai tambahan. aspek mekanis; interaksi kompleks dari kedua faktor
ini dapat membentuk faktor ketiga laten. Pengukuran ketiga dimensi mungkin diperlukan untuk
mengkategorikan nyeri punggung menurut perawatan yang mereka tanggapi. Untuk mengukur
dimensi laten, teknik statistik seperti analisis faktor digunakan untuk menghasilkan kombinasi
numerik baru atau pola variabel yang diukur secara empiris.
Langkah-langkah baru paling sering diturunkan dari langkah-langkah sebelumnya, karena
langkah-langkah baru secara otomatis memiliki hubungan apriori dengan yang saat ini diterima.
Dalam contoh prostetik yang dikutip sebelumnya, kualitas ADL(activity of daily living/kualitas
kehidupan sehari-hari) orang yang diamputasi dapat dinilai menurut kriteria yang biasanya
diterapkan pada orang yang tidak diamputasi, tetapi orang yang tidak diamputasi dapat
melakukan ADL khususnya mengikat sepatu—berbeda dari orang yang diamputasi. Untuk
menghindari hilangnya dimensi penting dari penilaian keterampilan ADL, tes prostetik dengan
benar akan memodifikasi definisi tes ADL normal berdasarkan perbedaan ini. Unit pengukuran
untuk orang yang diamputasi dan tidak diamputasi dapat berupa skala penilaian enam poin,
dengan 0 adalah "kinerja buruk" dan 5 adalah "melakukan aktivitas secara normal," tetapi buruk
dan normal dapat didefinisikan secara berbeda tergantung pada apakah orang yang diamputasi
atau tidak diamputasi yang diuji.

UNIT ANALISIS
Unit analisis belum tentu sama dengan unit pengukuran; analisis dapat didasarkan pada data
mentah, diringkas, atau diubah. Unit analisis mana yang paling akurat mewakili karakteristik
yang diteliti biasanya diputuskan menurut teori saat ini yang berhubungan dengan peristiwa yang
sedang diselidiki (Lampiran). Jika tujuan pengukuran dalam contoh ADL prostetik yang dibahas
sebelumnya adalah untuk mengkarakterisasi keterampilan amputasi bawah siku (BE) dalam
kaitannya dengan semua anggota tubuh yang diamputasi, skor yang diturunkan secara eksplisit
mungkin lebih bermakna daripada skor mentah (0-5) . Salah satu skor turunan tersebut akan
menjadi skor standar (yaitu, di mana skor mentah BE diamputasi jatuh dalam kaitannya dengan
rata-rata kelompok mata pelajaran serupa). Contoh umum dari skor standar adalah kecerdasan
kecerdasan, skor Tes Bakat Skolastik, dan skor tes perkembangan.
Lebih khas dalam penelitian terapi fisik adalah penggunaan skor rata-rata, di mana rata-rata dari
dua atau lebih ukuran kinerja dianalisis. Misalnya, mikrovolt EMG dapat dirata-ratakan selama
dua percobaan, dan analisis data dilakukan pada rata-rata yang dihasilkan. Skor yang diringkas
atau distandarisasi seringkali lebih mudah untuk ditafsirkan daripada skor mentah dan mungkin
kurang sensitif terhadap ketidakandalan acak dari situasi tes, bentuk tes, atau keanehan lain yang
spesifik untuk situasi unik tes. Tentu saja, kriteria transformasi harus ditentukan dengan jelas
atau informasi penting akan hilang.
MAKNA PENGUKURAN
Makna, dalam penyelidikan ilmiah, tergantung pada konteks pengukuran dan asumsi yang
memungkinkan data menjadi berguna. Jika aturan yang digunakan untuk mengukur itu valid,
maka kesimpulan logis berdasarkan pengukuran ini dapat mengarah pada kesimpulan yang valid.
Pertanyaan logis tentang pengukuran sebagian besar menguji kebermaknaan peristiwa dan
variabel dan bagaimana mengukurnya secara valid.

Kebermaknaan Acara
Kontroversi substansial ada mengenai apa yang harus diukur selama uji klinis, terutama dalam
uji coba secara acak. Kebutuhan untuk mendefinisikan dengan jelas peristiwa yang diukur dan
untuk menghubungkan peristiwa ini dengan gagasan teoretis yang diuji, membedakan sains yang
baik dari empirisme yang ceroboh dan serampangan.
Pengukuran dalam terapi fisik terutama adalah pengukuran klinis. Dalam pengaturan
klinis biasa, sebagian besar pengukuran dilakukan semata-mata atas dasar kenyamanan dan
dianggap relevan dengan informasi yang dicari; sayangnya, asumsi uji jarang diperiksa. Tidak
ada tentang pengaturan klinis, bagaimanapun, menghambat pemikiran kritis, definisi yang jelas,
dan aturan pengukuran secara teoritis suara. Oleh karena itu, pengukuran klinis dapat diandalkan,
valid, dan elegan seperti pengukuran yang digunakan dalam eksperimen terkontrol. Dalam
eksperimen terkontrol, hubungan logis antara kehidupan nyata dan angka-angka yang ditetapkan
untuk peristiwa klinis sering menentukan apakah kesimpulan eksperimen akan bermakna, atau
memang relevan, untuk praktik klinis.
Misalnya, klasifikasi nosologis yang benar dari jenis pasien dan penyakit merupakan
langkah penting dalam ilmu klinis yang sehat. Untuk menyimpulkan bahwa intervensi terapeutik
tertentu bekerja dengan baik untuk pasien dengan multiple sclerosis (MS), misalnya, kriteria
diagnostik untuk MS harus didefinisikan dengan cukup baik untuk memungkinkan kesimpulan
tersebut. Kebermaknaan peristiwa yang menentukan pengelompokan nosologis MS harus
ditetapkan dengan jelas, dan diterima secara umum sebelum hasil klinis atau eksperimental dapat
dianggap berlaku untuk pasien dengan MS.
Kebermaknaan peristiwa juga menentukan bagaimana hasil pengukuran dapat digunakan,
yaitu nilai teoretisnya. Bukti teoretis yang berkaitan dengan penyelidikan (misalnya, laporan
yang diterbitkan sebelumnya tentang nasib pasien dengan diagnosis dan gejala yang sama, nilai
yang diantisipasi dari pengukuran yang akan diambil, instrumen yang akan digunakan) harus
diperiksa secara menyeluruh dan diambil. diperhitungkan sebelum pengumpulan data.
Sebagai contoh, anggaplah bahwa subjek dengan penyakit Buerger ditugaskan secara
acak untuk latihan atau kelompok perlakuan biofeedback termal. Setelah perawatan, aliran darah
kaki mereka diukur menggunakan plethysmography dan perangkat Doppler untuk menentukan
perbedaan vaskular yang "disebabkan" oleh perawatan dan untuk memprediksi kejadian
amputasi. Hasil enam minggu pasca-eksperimen mungkin mengungkapkan peningkatan aliran
darah yang signifikan mendukung kelompok biofeedback, tetapi misalkan jumlah anggota badan
pada lima tahun tindak lanjut menunjukkan bahwa kelompok latihan bernasib lebih baik.
Logikanya, kita dapat menyimpulkan bahwa baik biofeedback gagal atau ukuran
plethysmographic dan Doppler tidak berhubungan dengan aliran darah dan karenanya dengan
amputasi. Karena kesimpulan kedua tidak mungkin benar, bagaimanapun, kami mungkin
menegaskan bahwa biofeedback gagal. Apakah benar demikian? Mungkin beberapa peristiwa
yang membingungkan dan tidak terukur yang tidak terkait dengan biofeedback atau proses
pengacakan, seperti penghentian diferensial merokok, secara kebetulan lebih banyak terjadi pada
kelompok latihan daripada pada kelompok biofeedback. Pengaruh perancu ini akan
mempengaruhi kejadian amputasi secara independen, sehingga mengurangi kebermaknaan
pengukuran aliran darah jangka pendek. Peningkatan tingkat amputasi, oleh karena itu, tidak
boleh dikaitkan dengan efek biofeedback, setidaknya sampai penelitian dapat direplikasi dengan
kontrol yang lebih baik dan dengan data yang lebih inferensial. Setidaknya, kita dapat
menyimpulkan bahwa bio-feedback bukanlah pengobatan yang cukup kuat untuk mencegah
amputasi pada subjek ini. Contoh ini, dengan demikian, menunjukkan mengapa "data" tidak
boleh diterima dengan mudah sebagai "yang diberikan," karena pengukuran tidak cukup relevan
dengan faktor yang ditelit.
Dilema sebenarnya dari peristiwa apa yang harus dibebankan pada perlakuan yang mana
yang jarang jelas terlihat. Premis dari contoh sebelumnya adalah bahwa seseorang harus
mengukur hanya peristiwa-peristiwa yang tampaknya terkait dengan eksperimen. Sayangnya,
peneliti yang memiliki pandangan yang berlawanan secara diametral jarang menyepakati
peristiwa apa yang penting. Misalnya, sebagian besar ahli terapi fisik mengabaikan
ketidakteraturan kecil dalam kurva torsi isokinetik sebagai kebisingan, tetapi beberapa peneliti
percaya bahwa "benjolan" pada kurva torsi ini mewakili peristiwa dan respons neurofisiologis
yang sah.2' Jadi, di kutub yang berlawanan dari para peneliti dalam contoh sebelumnya adalah
mereka yang berpendapat bahwa semua peristiwa harus dipertanggungjawabkan dan dibebankan
pada perlakuan selama masa jabatannya peristiwa itu terjadi. Pandangan yang sepenuhnya
deterministik ini sama-sama tidak praktis karena memaksa pengukuran dan penghitungan jumlah
kejadian yang tak terbatas.
Kursus yang masuk akal dan logis tampaknya akan menjadi pengukuran, dan oleh karena
itu tanggung jawab peneliti untuk, peristiwa yang paling adil (yaitu, dengan sedikit bias)
mencerminkan kondisi klinis atau eksperimental, seperti yang mungkin dinilai oleh arbiter yang
tidak memihak. Sackett dan Gent mencantumkan empat kriteria untuk membantu dalam
memutuskan peristiwa mana yang akan diukur: "sifat pertanyaan yang diajukan; perspektif dari
mana pertanyaan itu diajukan; pertimbangan mengapa manuver eksperimental [atau klinis]
mungkin ditinggalkan atau dilanggar; dan menghindari bias tertentu.
Validitas/Keabsahan
Validitas adalah sejauh mana suatu item benar-benar mengukur apa yang peneliti
maksudkan untuk mengukur item tersebut. Validitas pengukuran adalah tujuan terpenting dari
pengumpulan data. Rothstein menyajikan berbagai teknik penilaian validitas,24 yang semuanya
mencoba menjawab pertanyaan mendasar: "Apakah pengukuran ini benar-benar menangkap apa
yang saya pikir saya ukur?" Penilaian validitas, karena menanyakan sejauh mana kepuasan
pengukuran dari asumsi keandalan, skalabilitas, dan deteksi, terutama merupakan fungsi logis.
Ukuran, misalnya, bisa jadi salah secara andal: Timbangan kamar mandi yang selalu membaca 5
lb di atas berat sebenarnya akan menghasilkan data yang sangat andal (jika bias sistematis),
tetapi tidak pernah menjadi data berat yang valid. Sama seperti pernyataan verbal mungkin benar
atau salah, valid atau tidak valid, demikian pula perilaku dan pengukurannya dapat
mengungkapkan keadaan dasar yang benar atau mereka mungkin mengungkapkan representasi
yang salah dan tidak valid.
Beberapa ahli teori menyatakan bahwa validitas pengukuran secara fundamental
bergantung pada apakah suatu tes atau pengukuran dan hasilnya dapat direplikasi oleh orang lain.
Namun, hanya karena suatu temuan dapat direplikasi, tidak berarti bahwa pengukuran tersebut
valid. Faktor yang sama yang menentukan apakah seorang ilmuwan atau klinisi akan menyelidiki
suatu masalah seringkali merupakan faktor yang sama yang memandu—dan membatasi—
pengukuran yang dilakukan. Faktor-faktor ini mungkin lebih terkait dengan sosiologi dan
kebiasaan saat ini daripada kebenaran dan validitas tertinggi. Ideologi yang berlaku mungkin
benar atau salah, tetapi efeknya merusak kecuali pengamat mengakui kekuatan faktor-faktor
tersebut. Misalnya, ketika "sains" Aristotelian adalah ideologi yang berlaku, kumpulan penelitian
menunjukkan kegunaan dan prediktabilitas teori pengukurannya. Banyak teori Aristotelian,
termasuk teleologi, atau dorongan internal, ditolak oleh Sir Isaac Newton, dan teleologi telah
lama digantikan dalam leksikon sains modern dengan istilah-istilah termasuk gravitasi dan
hukum mekanik fisika.
Validitas pengukuran tergantung pada semua faktor yang dijelaskan dalam artikel ini,
tetapi pada akhirnya tergantung pada penggunaan data yang akan diletakkan. Jika data
dimaksudkan hanya untuk menggambarkan suatu peristiwa, data tersebut mungkin valid ipso
facto. Data deskriptif harus diterima begitu saja. Sebagian besar penelitian, bagaimanapun,
mencoba untuk menggeneralisasi di luar situasi pengujian ke kehidupan nyata.
Kesimpulan dari data dibatasi terutama oleh keterwakilan peristiwa yang diukur relatif
terhadap kehidupan nyata. Konsep veridikalitas pengukuran, atau uji isomorfisme dengan
kenyataan, diasumsikan dalam semua penilaian inferensial. Misalnya, terapis jarang hanya ingin
menggambarkan output kekuatan otot dengan menggunakan perangkat isokinetik; paling sering,
mereka ingin membuat kesimpulan tentang kemampuan pasien untuk menghasilkan kekuatan
otot yang cukup selama ADL atau ambulasi di luar klinik atau laboratorium. Saat ini, terlepas
dari semua data isokinetik yang telah dilaporkan, sedikit bukti yang menghubungkan hasil tes ini
dengan faktor lain yang bermakna secara klinis. Sejauh pembacaan isokinetik menggambarkan
motivasi subjek, bias penguji, atau karakteristik nonfisiologis lainnya dari kinerja otot, tes tidak
dapat mengizinkan kesimpulan fisiologis. Pengukuran yang dihasilkan belum terbukti isomorfik
dengan kenyataan dan karenanya tidak boleh diperlakukan sebagai data inferensial.
Penjelasan kausal membutuhkan data inferensial. Misalnya, untuk mengatakan perawatan
tertentu menyebabkan peningkatan yang relevan secara klinis dalam kekuatan otot memerlukan
ukuran yang mencirikan kerja otot secara isomorfik dari waktu ke waktu yang secara bermakna
terkait dengan situasi klinis yang nyata. Jadi, pengujian isokinetik pada tungkai bawah pasien
dengan hemiplegia, misalnya, tentu saja menghasilkan angka, tetapi apa arti dari nilai isokinetik
ketika dilaporkan tanpa bukti terkait hubungannya dengan ukuran bermakna lainnya? Pasien
dengan hemiplegia biasanya tidak memiliki kontrol motorik. Oleh karena itu, apakah data
tersebut mencerminkan kontrol motorik ekstremitas bawah atau kekuatan otot selama ambulasi?
Data yang valid dapat disimpulkan untuk mencerminkan kenyataan dan bukan hanya hasil yang
salah yang berasal dari pemikiran yang kacau atau pengamatan yang tidak terkendali. Penjelasan
kausal dalam penelitian klinis memerlukan hubungan yang cermat dari aturan-aturan yang
digunakan untuk menetapkan angka-angka pada peristiwa atau situasi yang dapat direplikasi di
klinik lain. Ketika kata-kata "disebabkan oleh" atau "karena" digunakan dalam hubungannya
dengan pengukuran, dengan demikian diberikan pemberitahuan bahwa data inferensial yang
valid sedang dilaporkan. Apa pun yang kurang adalah kekeliruan.

RINGKASAN
Tujuan akhir dari pengukuran adalah untuk menghasilkan data yang benar dan valid. Validitas
mengasumsikan keandalan, keandalan mengasumsikan skalabilitas, dan skalabilitas
mengasumsikan deteksi. Aturan-aturan di mana angka-angka ditetapkan untuk peristiwa-
peristiwa menentukan makna dan kegunaan akhir dari interpretasi berdasarkan pengukuran.
Kekeliruan tidak memberikan grasi untuk pengukuran dari satu kasus dalam pengaturan klinis
dari lusinan kasus dalam penelitian sistematis terstruktur.
Pengamatan tidak dapat dianalisis secara statistik dan ditafsirkan kecuali jika diterjemahkan
terlebih dahulu ke dalam notasi aritmatika. Statistik, pada gilirannya, hanyalah metode yang
nyaman untuk meringkas dan menganalisis pengukuran. Oleh karena itu, jika pengukurannya
salah, analisis dan interpretasi berdasarkan pengukuran ini pada dasarnya salah dan tidak dapat
diperbaiki.

Anda mungkin juga menyukai