Iec Translate
Iec Translate
,
4. Kemampuan statistika
keahlian apa yang diperlukan. Untuk beberapa aplikasi, gelar lanjutan dalam
statistik berguna dalam melakukan Analisa statistik, tetapi biasanya kebutuhan
untuk keahlian dapat dipenuhi oleh individu dengan keahlian teknis di bidang
lain, yang akrab dengan konsep statistik dasar dan memiliki pengalaman atau
pelatihan dalam teknik umum yang berlaku untuk analisis data dari skema uji
kelayakan. Jika seseorang dianggap ahli dengan desain statistik dan / atau
analisis, sangat penting bahwa orang ini memiliki pengalaman dengan
perbandingan antar laboratorium, bahkan jika orang itu memiliki gelar dalam
statistik. Pelatihan statistik lanjutan konvensional sering tidak mencakup latihan
dengan perbandingan antar laboratorium, dan penyebab unik kesalahan
pengukuran yang terjadi dalam Uji kelayakan tampaknya tidak jelas. Panduan
dalam Standar ini tidak dapat memberikan semua keahlian yang diperlukan
untuk mempertimbangkan semua aplikasi, dan tidak dapat menggantikan
pengalaman yang diperoleh dengan bekerja dengan perbandingan antar
laboratorium.
1. Tujuan
Standar ini memberikan uraian terperinci tentang metode statistik untuk penyedia
Uji kelayakan untuk digunakan untuk merancang skema Uji kelayakan dan untuk
menganalisis data yang diperoleh dari skema tersebut. Standar ini memberikan
rekomendasi tentang interpretasi data Uji kelayakan oleh peserta dalam skema
tersebut dan oleh badan akreditasi.
Prosedur dalam Standar ini dapat diterapkan untuk menunjukkan bahwa hasil
pengukuran yang diperoleh oleh laboratorium, lembaga inspeksi, dan individu
memenuhi kriteria yang ditentukan untuk kinerja yang dapat diterima.
Standar ini berlaku untuk Uji kelayakan di mana hasil yang dilaporkan adalah
pengukuran kuantitatif atau pengamatan kualitatif pada item tes.
2. Acuan Normatif
Dokumen ini secara keseluruhan atau sebagian, dirujuk secara normatif. Dalam
dokumen ini dan sangat diperlukan untuk penerapannya. Untuk referensi
bertanggal, hanya edisi yang dikutip yang berlaku. Untuk referensi yang tidak
bertanggal, edisi terakhir dari dokumen yang direferensikan (termasuk
perubahannya) berlaku
o ISO Guide 30, Referensi Bahan — istilah dan definisi yang dipilih
o ISO 3534-1, Statistics — kosakata dan simbol — Part 1: Istilah statistik umum dan
istilah yang digunakan dalam probabilitas
o ISO 3534-2, Statistics —kosakata dan simbol— Part 2: penerapan statistika
o ISO 5725-1, Ketepatan (kebenaran dan presisi ) dari metode pengukuran dan
hasil — Part 1: General principles and definitions
o ISO/IEC 17043, Conformity assessment — General requirements for proficiency
testing ISO/IEC Guide 99, International vocabulary of metrology — Basic and
general concepts and associated terms (VIM)
Untuk keperluan dokumen ini, syarat dan definisi yang diberikan dalam ISO 3534-1,
ISO 3534-2, ISO 5725-1, ISO / IEC 17043, ISO / IEC Guide 99, ISO Guide 30, dan
Hak cipta Badan Standardisasi Nasional.
berikut berlaku. Dalam kasus perbedaan antara referensi ini tentang penggunaan
istilah, definisi dalam ISO 3534 bagian 1-2 berlaku. Simbol matematika tercantum
dalam Lampiran A.
Organisasi, kinerja dan evaluasi pengukuran atau Uji pada item yang sama atau
serupa oleh dua atau lebih laboratorium sesuai dengan kondisi yang telah
ditentukan
Note 1 : Untuk keperluan Standar ini, istilah "Uji kelayakan" diambil dalam arti luas
dan mencakup, tetapi tidak terbatas pada:
- skema kuantitatif - di mana tujuannya adalah untuk mengukur satu atau lebih
pengukuran untuk setiap item tes kelayakan;
- skema kualitatif - di mana tujuannya adalah untuk mengidentifikasi atau
menggambarkan satu atau lebih karakteristik kualitatif dari item tes kelayakan;
- skema sekuensial - di mana satu atau lebih item uji kelayakan didistribusikan
secara berurutan untuk Uji atau pengukuran dan dikembalikan ke penyedia Uji
kelayakan secara berkala;
- Skema simultan - di mana item tes kelayakan didistribusikan untuk Uji atau
pengukuran bersamaan dalam periode waktu yang ditentukan;
- Latihan satu kali - di mana item tes kelayakan disediakan pada satu kesempatan; -
Skema kontinu - di mana item tes kelayakan diberikan secara berkala;
- pengambilan sampel - di mana sampel diambil untuk analisis selanjutnya dan
tujuan dari skema Uji kemahiran mencakup evaluasi pelaksanaan pengambilan
sampel; dan
- interpretasi data - di mana set data atau informasi lainnya dilengkapi dan
informasi diproses untuk memberikan interpretasi (atau hasil lainnya).
3.3 Penilaian
Nilai yang diberikan pada properti tertentu dalam item uji kelayakan
Contoh 1 :
Skor z yang lebih dari 2 secara konvensional dianggap sebagai indikasi
kebutuhan untuk menyelidiki kemungkinan penyebab
skor z melebihi 3 secara konvensional diambil sebagai sinyal tindakan
yang menunjukkan perlunya tindakan korektif.
3.12Pencilan
Yaitu anggota nilai yang memiliki nilai yang tidak konsisten dengan set nilai
tersebut
bahan referensi (RM) ditandai dengan prosedur yang valid secara metrologi
untuk satu atau lebih properti yang ditentukan, disertai dengan sertifikat
referensi bahan yang memberikan nilai properti yang ditentukan, ketidakpastian
terkait, dan pernyataan keterlacakan metrologi
4. Prinsip utama
4.1 Persyaratan umum metode statistic
4.1.1 Metode statistik yang digunakan harus sesuai dengan tujuan dan secara
statistik valid. Asumsi statistik apa pun yang menjadi dasar metode atau desain
harus dinyatakan dalam desain atau dalam deskripsi tertulis dari skema pengujian
kemahiran, dan asumsi-asumsi ini harus ditunjukkan dengan wajar.
4.1.2 Desain statistik dan teknik analisis data harus konsisten dengan tujuan yang
dinyatakan untuk skema pengujian kelayakan
4.1.3 Penyedia pengujian kelayakan harus memberikan peserta dengan deskripsi metode
perhitungan yang digunakan, penjelasan tentang interpretasi umum hasil, dan
pernyataan tentang segala batasan yang berkaitan dengan interpretasi. Ini harus
tersedia baik di setiap laporan untuk setiap putaran skema pengujian kemahiran
atau dalam ringkasan terpisah dari prosedur yang tersedia untuk peserta
4.1.4 penyedia uji kelayakan harus memastikan software yang memadai dan tervalidasi
4.2 Dasar Permodelan
4.2.1 Untuk hasil kuantitatif dalam skema uji profisiensi di mana hasil tunggal
dilaporkan untuk item tes kemampuan yang diberikan, model dasar diberikan dalam
persamaan
X i = µ + εi
Dimana :
Xi : hasil uji kelayakan dari peserta i
µ : nilai uji sebenarnya
εi : kesalahan pengukuran untuk peserta, di distribusikan sesuai dengan modul yang
relevan
4.2.2 untuk hasil ordinal dan kualitatif, model lain mungkin sesuai, atau mungkin tidak ada
model yang sesuai
4.3 pendekatan general untuk evaluasi performa
4.3.1 Ada 3 jenis pendekatan yang berbeda untuk mengevaluasi kemampuan peserta
dalam skema uji kelayakan, pendekatan tersebut ada pada daftar dibawah ini :
Pengujian kemahiran berkaitan dengan penilaian kinerja peserta dan karena itu tidak
secara khusus membahas bias atau presisi (meskipun ini dapat dinilai dengan desain
khusus). Kinerja peserta dinilai melalui evaluasi statistik dari hasil mereka mengikuti
pengukuran atau interpretasi yang mereka buat pada item tes kelayakan. Kinerja
sering dinyatakan dalam bentuk skor kinerja yang memungkinkan interpretasi yang
konsisten di berbagai pengukuran dan dapat memungkinkan hasil untuk pengukuran
yang berbeda untuk dibandingkan dengan dasar yang sama. Skor kinerja biasanya
diperoleh dengan membandingkan perbedaan antara hasil peserta yang dilaporkan
dan nilai yang ditetapkan dengan deviasi yang diijinkan atau dengan perkiraan
ketidakpastian pengukuran perbedaan. Pemeriksaan skor kinerja selama beberapa
putaran skema pengujian kemahiran dapat memberikan informasi apakah
laboratorium individu menunjukkan bukti efek sistematis yang konsisten ("bias")
atau presisi jangka panjang yang buruk. Bagian 5-10 berikut memberikan panduan
tentang desain skema pengujian kelayakan kuantitatif dan pada perlakuan statistik
hasil, termasuk perhitungan dan interpretasi berbagai skor kinerja. Pertimbangan
untuk skema pengujian kemahiran kualitatif (termasuk skema ordinal) diberikan
dalam Bagian 11.
5.2.1 dasar permodelan statistika
Menurut ISO / IEC 17043, 4.4.4.1, desain statistik “harus dikembangkan untuk
memenuhi tujuan dari skema pengujian kelayakan, berdasarkan pada sifat data
(kuantitatif atau kualitatif termasuk ordinal dan kategoris), asumsi statistik, sifat
kesalahan, dan jumlah hasil yang diharapkan ”. Oleh karena itu, skema pengujian
kelayakan dengan tujuan yang berbeda dan dengan sumber kesalahan yang
berbeda dapat memiliki desain yang berbeda. Pertimbangan desain untuk tujuan
bersama tercantum di bawah ini. Tujuan lain dimungkinkan
5.2.2 Ada berbagai jenis data yang digunakan dalam pengujian kelayakan, termasuk
kuantitatif, nominal (kategorikal), dan ordinal. Di antara variabel kuantitatif,
beberapa hasil mungkin pada skala interval; atau kerabat, atau skala rasio. Untuk
beberapa pengukuran pada skala kuantitatif, hanya seperangkat nilai diskrit dan
diskontinyu yang dapat direalisasikan (misalnya, pengenceran berurutan);
Namun, dalam banyak kasus hasil ini dapat diperlakukan dengan teknik yang
berlaku untuk variabel kuantitatif kontinu.
CATATAN 1 Untuk nilai kuantitatif, skala interval adalah skala di mana
interval (perbedaan) bermakna tetapi rasio tidak, seperti skala suhu Celcius.
Skala rasio adalah skala di mana interval dan rasio keduanya bermakna, seperti
skala suhu Kelvin, atau satuan yang paling umum untuk panjang.
CATATAN 2 Untuk nilai kualitatif, skala kategorikal memiliki nilai berbeda
yang urutannya tidak berarti, seperti nama spesies bakteri. Nilai pada skala
ordinal memiliki urutan yang bermakna tetapi perbedaannya tidak bermakna;
misalnya skala seperti 'besar, sedang, kecil' dapat dipesan tetapi perbedaan
antara nilai-nilai tidak ditentukan selain dari segi jumlah nilai-nilai intervensi.
5.2.3 Skema pengujian kelayakan dapat digunakan untuk tujuan lain selain dari
yang disebutkan di atas, sebagaimana dibahas dalam bagian 0.1 dan dalam ISO /
IEC 17043. Desain harus sesuai untuk semua tujuan yang dinyatakan untuk
skema pengujian kelayakan khusus.
5.3.1 ISO / IEC 17043: 2010, 4.4.4.2, mensyaratkan bahwa teknik analisis statistik konsisten
dengan asumsi statistik untuk data. Sebagian besar teknik analisis untuk pengujian
kelayakan mengasumsikan bahwa serangkaian hasil dari peserta yang kompeten akan
terdistribusi secara normal, atau setidaknya unimodal dan cukup simetris (setelah
transformasi jika perlu). Asumsi tambahan umum adalah bahwa distribusi hasil dari
pengukuran yang ditentukan secara kompeten dicampur (atau 'terkontaminasi')
dengan hasil dari populasi dengan nilai yang salah yang dapat menghasilkan pencilan.
Biasanya, interpretasi penilaian bergantung pada asumsi normalitas, tetapi hanya
untuk distribusi asumsi yang mendasari untuk peserta yang kompeten.
5.3.1.3 Di beberapa area kalibrasi, hasil peserta dapat mengikuti distribusi statistik
yang dijelaskan dalam prosedur pengukuran (misalnya, eksponensial, atau
bentuk gelombang); distribusi yang didefinisikan ini harus dipertimbangkan
dalam protokol evaluasi apa pun
5.3.2 Menurut ISO / IEC 17043: 2010, 4.4.4.2, penyedia pengujian kelayakan harus
menyatakan dasar untuk setiap asumsi statistik dan menunjukkan bahwa
asumsi tersebut masuk akal. Demonstrasi ini dapat didasarkan pada, misalnya,
data yang diamati, hasil dari putaran sebelumnya dari skema pengujian
kelayakan, atau literatur teknis.
CATATAN Demonstrasi kewajaran asumsi distribusi kurang ketat
daripada demonstrasi validitas asumsi
5.4.2 Jumlah minimum peserta yang diperlukan untuk berbagai metode statistik akan
tergantung pada berbagai situasi: - metode statistik yang digunakan, misalnya
metode kuat tertentu atau strategi penghilangan outlier yang dipilih; - pengalaman
peserta dengan skema pengujian kemahiran khusus; - pengalaman penyedia
pengujian kelayakan dengan matriks, ukur, metode, dan kelompok peserta; - apakah
tujuannya adalah untuk menentukan nilai yang ditetapkan atau standar deviasi (atau
keduanya). Panduan lebih lanjut tentang teknik untuk menangani sejumlah kecil
peserta diberikan dalam Lampiran D.1.
5.5 Panduan Untuk Memilih Format Pelaporan
5.5.1 Merupakan persyaratan ISO / IEC 17043: 2010, 4.6.1.2, bahwa penyedia tes
kelayakan menginstruksikan peserta untuk melakukan pengukuran dan
melaporkan hasil pada item tes kelayakan dengan cara yang sama seperti untuk
sebagian besar pengukuran yang dilakukan secara rutin, kecuali dalam keadaan
khusus . Persyaratan ini dapat, dalam beberapa situasi, menyulitkan untuk
memperoleh penilaian yang akurat tentang ketepatan dan kebenaran peserta,
atau kompetensi dengan prosedur pengukuran. Penyedia pengujian kelayakan
harus mengadopsi format pelaporan yang konsisten untuk skema pengujian
kelayakan tetapi harus, jika mungkin, menggunakan unit yang akrab bagi
sebagian besar peserta dan memilih format pelaporan yang meminimalkan
transkripsi dan kesalahan lainnya. Ini mungkin termasuk peringatan otomatis
dari unit yang tidak pantas ketika peserta diketahui melaporkan secara rutin di
unit selain yang diperlukan oleh skema.
CATATAN 1 Untuk beberapa skema pengujian kelayakan, tujuannya adalah untuk
mengevaluasi kemampuan peserta untuk mengikuti metode standar, yang dapat
mencakup penggunaan unit pengukuran tertentu atau jumlah digit signifikan.
CATATAN 2 Kesalahan transkripsi dalam penyusunan hasil oleh penyedia
pengujian kemampuan dapat secara substansial dikurangi atau dihilangkan
dengan menggunakan sistem pelaporan elektronik yang memungkinkan peserta
untuk memasukkan data mereka sendiri secara langsung.
5.5.2 Jika skema pengujian kelayakan membutuhkan pengukuran ulangan pada item
tes kelayakan, peserta harus diminta untuk melaporkan semua nilai replikasi. Ini
dapat terjadi, misalnya, jika suatu tujuan adalah untuk mengevaluasi ketepatan
peserta pada butir-butir tes kelayakan yang diketahui, atau ketika prosedur
pengukuran membutuhkan pelaporan terpisah dari banyak pengamatan. Dalam
situasi ini penyedia pengujian kelayakan mungkin juga perlu meminta nilai rata-
rata peserta (atau perkiraan lokasi lainnya) dan ketidakpastian untuk membantu
analisis data oleh penyedia pengujian kelayakan.
5.5.3 Jika praktik pelaporan konvensional melaporkan hasil sebagai 'kurang dari' atau
'lebih besar dari' batas (seperti tingkat kalibrasi atau batas kuantisasi) dan di
mana hasil numerik diperlukan untuk penilaian, penyedia pengujian kelayakan
harus menentukan bagaimana hasilnya akan diproses
5.5.3.1 Penyedia pengujian kelayakan harus mengadopsi prosedur pengolahan
data dan penilaian yang divalidasi yang mengakomodasi data yang
disensor (lihat Lampiran E.1), atau mengharuskan peserta untuk
melaporkan nilai hasil pengukuran baik di tempat, atau di samping, nilai
yang dilaporkan konvensional.
CATATAN 1 Opsi prosedur penilaian mungkin untuk tidak mencetak data
tersebut.
CATATAN 2 Mewajibkan peserta untuk melaporkan nilai numerik di luar
rentang yang biasanya dilaporkan (misalnya, di bawah batas kuantisasi
peserta) akan mengizinkan penggunaan metode statistik yang
memerlukan nilai numerik tetapi dapat menghasilkan skor yang tidak
mencerminkan layanan rutin peserta kepada pelanggan.
5.5.3.2 Ketika statistik konsensus digunakan, tidak mungkin untuk
mengevaluasi kinerja jika jumlah nilai yang disensor cukup besar sehingga
metode yang kuat dipengaruhi oleh penyensoran. Dalam keadaan di
mana jumlah hasil yang disensor cukup untuk mempengaruhi metode
yang kuat, maka hasilnya harus dievaluasi menggunakan metode statistik
yang memungkinkan estimasi yang tidak bias di hadapan data yang
disensor [21], atau hasilnya tidak boleh dievaluasi. Ketika ragu tentang
efek dari prosedur yang dipilih, penyedia pengujian kelayakan harus
menghitung statistik ringkasan dan evaluasi kinerja dengan masing-
masing prosedur statistik alternatif yang dianggap berpotensi berlaku
dalam keadaan tersebut, dan menyelidiki pentingnya setiap perbedaan.
5.5.3.3 Jika hasil yang disensor seperti pernyataan 'kurang dari' diharapkan atau
telah diamati, desain skema pengujian kelayakan harus mencakup
ketentuan untuk penilaian dan / atau tindakan lain pada nilai-nilai yang
disensor yang dilaporkan oleh peserta, dan peserta harus diberitahu
tentang ketentuan ini.
CATATAN Lampiran E.1 memiliki contoh beberapa pendekatan analisis
untuk data yang disensor. Contoh ini menunjukkan statistik konsensus
yang kuat dengan tiga pendekatan berbeda; dengan nilai-nilai yang
disensor dihapus, dengan nilai-nilai dipertahankan tetapi tanda ‘<’
dihapus, dan hasilnya diganti dengan setengah dari nilai batas
.
5.5.4 Biasanya, jumlah digit signifikan untuk dilaporkan akan ditentukan oleh desain
skema uji profisiensi
5.5.4.1 Ketika menentukan jumlah digit signifikan untuk dilaporkan, kesalahan
pembulatan harus diabaikan dibandingkan dengan variasi yang
diharapkan antara peserta.
CATATAN Dalam beberapa situasi, pelaporan yang benar adalah bagian
dari penentuan kompetensi peserta, dan jumlah angka dan tempat
desimal yang signifikan dapat bervariasi.
5.5.4.2 Jika jumlah digit yang dilaporkan dalam kondisi pengukuran rutin
memiliki efek buruk yang cukup besar pada perawatan data oleh
penyedia pengujian profisiensi (misalnya, di mana prosedur pengukuran
memerlukan pelaporan ke sejumlah kecil digit signifikan), penyedia
pengujian profisiensi dapat menentukan jumlah digit yang harus
dilaporkan.
CONTOH Prosedur pengukuran dapat menentukan pelaporan hingga 0,1
g, yang mengarah ke sebagian besar (> 50%) dari hasil yang identik dan
pada gilirannya mengkompromikan perhitungan sarana yang kuat dan
standar deviasi. Penyedia pengujian kemahiran kemudian dapat
meminta peserta untuk melaporkan ke dua atau tiga tempat desimal
untuk mendapatkan perkiraan lokasi dan variasi yang cukup andal.
5.5.4.3 Jika diizinkan bahwa peserta yang berbeda akan melaporkan hasil
menggunakan jumlah digit signifikan yang berbeda, penyedia pengujian
kelayakan harus mempertimbangkan hal ini saat membuat statistik
konsensus (seperti nilai yang ditetapkan dan standar deviasi untuk
penilaian kelayakan).
6.2.1 Ketika semua peserta diharapkan untuk melaporkan nilai untuk pengukuran yang
sama, nilai yang ditugaskan biasanya harus sama untuk semua peserta. Namun,
ketika peserta diizinkan untuk memilih metode pengukuran mereka sendiri, ada
kemungkinan bahwa nilai tunggal yang ditetapkan untuk setiap analit atau
properti tidak akan sesuai untuk semua peserta. Ini dapat terjadi, misalnya,
ketika metode pengukuran yang berbeda memberikan hasil yang tidak
sebanding. Dalam hal ini, penyedia pengujian kelayakan dapat menggunakan
nilai yang ditugaskan berbeda untuk setiap metode pengukuran.
6.2.2 Kebutuhan akan nilai yang ditetapkan berbeda untuk subset peserta harus
dipertimbangkan dalam desain skema uji profisiensi (misalnya, untuk membuat
ketentuan untuk pelaporan metode tertentu) dan juga harus dipertimbangkan
ketika meninjau data untuk setiap putaran.
6.3.1 ISO / IEC 17043: 2010, B.2.5 dan Protokol Harmonisasi IUPAC
merekomendasikan menghapus kesalahan yang jelas dari set data pada
tahap awal dalam analisis, sebelum menggunakan prosedur yang kuat atau
tes apa pun untuk mengidentifikasi pencilan statistik. Secara umum, hasil
ini akan diperlakukan secara terpisah (seperti menghubungi peserta).
Dimungkinkan untuk memperbaiki beberapa kesalahan, tetapi ini hanya
dapat dilakukan sesuai dengan kebijakan dan prosedur yang disetujui.
CATATAN Kesalahan yang jelas, seperti melaporkan hasil dalam unit yang
salah atau mengalihkan hasil dari item tes kelayakan berbeda, terjadi di
sebagian besar putaran pengujian kelayakan, dan hasil ini hanya
mengganggu kinerja metode statistik berikutnya. 6.3.2 Jika ada keraguan
tentang apakah suatu hasil adalah kesalahan, itu harus disimpan dalam
kumpulan data dan dikenakan perlakuan selanjutnya, seperti yang
dijelaskan dalam bagian 6.4 hingga 6.6.
7.3.2 Ketika nilai yang diberikan dihitung dari perumusan item tes
kelayakan, ketidakpastian standar untuk karakterisasi (uchar) diperkirakan dengan
kombinasi ketidakpastian menggunakan model yang sesuai. Sebagai contoh, dalam
pengujian kelayakan untuk pengukuran kimia, ketidakpastian biasanya akan terkait
dengan pengukuran gravimetri dan volumetrik dan kemurnian bahan yang digunakan
dalam formulasi. Ketidakpastian standar dari nilai yang diberikan (u (Xpt)) kemudian
dihitung menurut persamaan (3).
7.4 Materi referensi tersertifikasi
7.4.1 Ketika item tes kelayakan adalah materi referensi tersertifikasi (CRM), nilai
properti tersertifikasi xCRM digunakan sebagai nilai yang ditetapkan X pt. Keterbatasan
dari pendekatan ini adalah: - Mungkin mahal untuk memberikan setiap peserta satu
unit bahan referensi bersertifikat; - CRMs sering diproses cukup banyak untuk
memastikan stabilitas jangka panjang, yang dapat membahayakan komutabilitas dari
item tes kelayakan. - CRM dapat diketahui oleh peserta sehingga penting untuk
menyembunyikan identitas item tes kelayakan.
7.4.2 Ketika bahan referensi bersertifikat digunakan sebagai item uji kelayakan,
ketidakpastian standar dari nilai yang diberikan berasal dari informasi tentang
ketidakpastian nilai properti yang diberikan pada sertifikat. Informasi sertifikat harus
mencakup komponen-komponen dalam persamaan (3), dan memiliki penggunaan
yang dimaksudkan sesuai dengan tujuan skema pengujian kelayakan.
7.5 Hasil dari satu laboratorium
7.5.1 Nilai yang ditetapkan dapat ditentukan oleh satu laboratorium menggunakan
metode referensi, seperti, misalnya, metode utama. Metode referensi yang
digunakan harus sepenuhnya dijelaskan dan dipahami, dan dengan pernyataan
ketidakpastian lengkap dan penelusuran metrologis yang sesuai untuk skema
pengujian kelayakan. Metode referensi harus dapat diubah untuk semua
metode pengukuran yang digunakan oleh peserta.
7.5.1.1 Nilai yang ditetapkan haruslah rata-rata dari studi yang dirancang
menggunakan lebih dari satu item uji kelayakan atau kondisi pengukuran,
dan jumlah pengukuran ulangan yang cukup.
7.5.1.2 Ketidakpastian karakterisasi adalah estimasi ketidakpastian yang
tepat untuk metode referensi dan kondisi studi yang dirancang.
7.5.2 Nilai yang ditetapkan Xpt dari item tes kelayakan dapat diturunkan oleh satu
laboratorium menggunakan metode pengukuran yang sesuai, dari kalibrasi
terhadap nilai referensi dari bahan referensi bersertifikat yang cocok.
Pendekatan ini mengasumsikan bahwa CRM dapat diubah untuk semua metode
pengukuran yang digunakan oleh peserta.
7.5.2.1 Penentuan ini membutuhkan serangkaian tes yang harus
dilakukan, di satu laboratorium, pada item tes kelayakan dan CRM,
menggunakan metode pengukuran yang sama, dan dalam kondisi
pengulangan.
Ketika: xCRM adalah nilai yang diberikan untuk CRM Xpt adalah nilai yang
ditetapkan untuk item tes kelayakan di adalah perbedaan antara hasil rata-rata
untuk item tes kelayakan dan CRM pada sampel ke-d, d adalah rata-rata dari
perbedaan di
kemudian, Xpt CRMx xd = + (4)
CATATAN xCRM dan d bersifat independen kecuali dalam situasi yang jarang
terjadi bahwa laboratorium ahli juga menghasilkan CRM.
7.5.2.2 Ketidakpastian standar karakterisasi berasal dari ketidakpastian
pengukuran yang digunakan untuk penetapan nilai. Pendekatan ini
memungkinkan nilai yang ditetapkan untuk didirikan dengan cara yang dapat
dilacak secara metrologi ke nilai tersertifikasi CRM,
Contoh dalam Lampiran E.5 mengilustrasikan bagaimana ketidakpastian yang
diperlukan dapat dihitung dalam kasus sederhana ketika nilai yang ditetapkan
dari item tes kelayakan ditetapkan dengan perbandingan langsung dengan CRM
tunggal.
7.5.3 Ketika nilai referensi diberikan sebelum dimulainya putaran skema pengujian kemahiran
berurutan, dan kemudian nilai referensi selanjutnya diperiksa menggunakan sistem
pengukuran yang sama, perbedaan antara nilai-nilai harus kurang dari dua kali
ketidakpastian. dari perbedaan itu (yaitu, hasilnya harus kompatibel secara metrologi).
Dalam kasus seperti itu penyedia pengujian kelayakan dapat memilih untuk
menggunakan rata-rata pengukuran sebagai nilai yang ditetapkan, dengan
ketidakpastian yang sesuai. Jika hasilnya tidak kompatibel secara metrologis, penyedia
pengujian kelayakan harus menyelidiki alasan perbedaan, dan mengambil langkah-
langkah yang tepat, termasuk penggunaan metode alternatif untuk menentukan nilai
yang diberikan dan ketidakpastian atau pengabaian putaran.
7.6 Nilai konsensus dari laboratorium ahli
7.6.1 Nilai yang ditugaskan dapat ditentukan menggunakan studi perbandingan antar
laboratorium dengan laboratorium ahli, seperti yang dijelaskan dalam ISO Guide 35 untuk
penggunaan perbandingan antar laboratorium untuk mengkarakterisasi CRM. Item tes
kelayakan disiapkan terlebih dahulu dan siap untuk didistribusikan kepada para peserta.
Beberapa item tes kelayakan ini kemudian dipilih secara acak dan dianalisis oleh
sekelompok ahli menggunakan protokol yang menentukan jumlah item tes kelayakan dan
replikasi dan kondisi terkait lainnya. Setiap laboratorium ahli diharuskan untuk
memberikan ketidakpastian standar dengan hasilnya.
7.6.2 Apabila laboratorium ahli melaporkan hasil tunggal dan tidak diharuskan oleh protokol
pengukuran untuk memberikan informasi ketidakpastian yang cukup dengan hasil, atau di
mana bukti dari hasil yang dilaporkan atau di tempat lain menunjukkan bahwa
ketidakpastian yang dilaporkan tidak cukup dapat diandalkan, nilai konsensus harus
biasanya diperoleh dengan metode bagian 7.7, diterapkan pada himpunan hasil
laboratorium ahli. Jika laboratorium ahli melaporkan masing-masing lebih dari satu hasil
(misalnya, termasuk ulangan), penyedia skema pengujian kelayakan harus menetapkan
metode alternatif untuk menentukan nilai yang ditetapkan dan ketidakpastian terkait
yang secara statistik valid (lihat 4.1.1) dan memungkinkan untuk kemungkinan outlier
atau keberangkatan lain dari distribusi hasil yang diharapkan.
7.6.3 Apabila laboratorium ahli melaporkan ketidakpastian dengan hasil, estimasi nilai dengan
konsensus hasil merupakan masalah yang kompleks dan berbagai pendekatan telah
disarankan, termasuk, misalnya, rata-rata tertimbang, rata-rata tidak berbobot, prosedur
yang membuat penyisihan untuk dispersi yang berlebihan dan prosedur yang
memungkinkan untuk kemungkinan hasil yang keliru atau salah dan perkiraan
ketidakpastian [16]. Penyedia pengujian kemahiran karenanya harus menetapkan
prosedur untuk estimasi bahwa:
a) harus mencakup pemeriksaan validitas estimasi ketidakpastian yang dilaporkan,
misalnya dengan memeriksa apakah ketidakpastian yang dilaporkan bertanggung jawab
penuh atas dispersi hasil yang diamati;
b) harus menggunakan prosedur pembobotan yang sesuai untuk skala dan keandalan
ketidakpastian yang dilaporkan, yang dapat mencakup bobot yang sama jika
ketidakpastian yang dilaporkan adalah sama atau keandalannya buruk atau tidak
diketahui (lihat 7.6.2);
c) harus memungkinkan untuk kemungkinan bahwa ketidakpastian yang dilaporkan
mungkin tidak sepenuhnya bertanggung jawab atas dispersi yang diamati ('dispersi
berlebihan'), misalnya dengan memasukkan istilah tambahan untuk memungkinkan
dispersi berlebih;
d) harus memungkinkan untuk kemungkinan nilai outlying yang tidak terduga untuk
hasil yang dilaporkan atau ketidakpastian;
e) harus memiliki landasan teori yang kuat;
f) harus menunjukkan kinerja (misalnya pada data uji atau dalam simulasi) yang cukup
untuk keperluan skema pengujian kelayakan.
7.7 Nilai konsensus dari hasil peserta
7.7.1 Dengan pendekatan ini, nilai yang ditetapkan Xpt untuk item tes kelayakan yang
digunakan dalam putaran skema pengujian kelayakan adalah estimasi lokasi
(misalnya, mean kuat, median, atau rata-rata aritmatika) yang dibentuk dari hasil
yang dilaporkan oleh peserta dalam putaran, dihitung dengan menggunakan
prosedur yang sesuai sesuai dengan desain, seperti yang dijelaskan dalam
Lampiran C. Teknik yang dijelaskan dalam bagian 6.2-6.6 harus digunakan untuk
mengkonfirmasi bahwa ada perjanjian yang cukup, sebelum menggabungkan
hasil.
7.7.1.1 Dalam beberapa situasi, penyedia pengujian kelayakan mungkin
ingin menggunakan subset peserta yang ditentukan dapat diandalkan,
dengan beberapa kriteria yang telah ditentukan sebelumnya, seperti
status akreditasi atau berdasarkan kinerja sebelumnya. Teknik-teknik
bagian ini berlaku untuk situasi-situasi tersebut, termasuk pertimbangan
untuk ukuran kelompok.
7.7.1.2 Metode perhitungan lain dapat digunakan sebagai pengganti
metode yang ada dalam Lampiran C, asalkan memiliki basis statistik yang
kuat dan laporan menyatakan metode yang digunakan.
7.7.1.3 Keuntungan dari pendekatan ini adalah: a) tidak diperlukan
pengukuran tambahan untuk mendapatkan nilai yang ditetapkan; b)
pendekatan ini mungkin sangat berguna dengan pengukuran standar,
yang didefinisikan secara operasional, karena seringkali tidak ada metode
yang lebih dapat diandalkan untuk mendapatkan hasil yang setara.
Standar deviasi
{
σ R = 0.2 c 0.8495
, ketika∧1,2× 10−7 ≤ c ≤ 0,138
0,01 c0,5 , ketika∧c ≥0,138
Dimana c adalah Fraksi massa spesies kimia yang akan ditentukan di mana 0 ≤ c ≤ 1.
CATATAN 1 Model Horwitz bersifat empiris, berdasarkan pengamatan dari uji
coba kolaboratif dari banyak parameter selama periode waktu yang panjang.
Nilai σR adalah batas atas yang diharapkan dari variabilitas antar laboratorium
ketika uji coba kolaborasi tidak memiliki masalah yang signifikan. Nilai-nilai σR
karena itu mungkin bukan kriteria yang tepat untuk menentukan kompetensi
dalam skema pengujian kelayakan.
CATATAN 2 Contoh untuk memperoleh nilai dari model Horwitz yang
dimodifikasi disediakan dalam Lampiran E.9.
8.5 Menggunakan deviasi standar pengulangan dan reproduktifitas dari studi kolaboratif
sebelumnya mengenai ketepatan metode pengukuran
8.5.1 Ketika metode pengukuran yang akan digunakan dalam skema pengujian
kelayakan distandarisasi, dan informasi tentang pengulangan (σr) dan
reproduktifitas (σR) dari metode ini tersedia, standar deviasi untuk penilaian
kelayakan (σpt) dapat dihitung dengan menggunakan informasi ini, sebagai
berikut
σ pt=√ σ −σ
2 2
¿¿¿
R r
Dimana m adalah jumlah replika pengukuran setiap peserta dalam setiap kali
skema uji kelayakan
CATATAN : Persamaan ini diturunkan dari model efek acak dasar dari ISO 5725-
2.
8.5.2 Ketika penyimpangan standar pengulangan dan reproduktifitas bergantung pada
nilai rata-rata dari hasil pengujian, hubungan fungsional harus diperoleh dengan
metode yang dijelaskan dalam ISO 5725-2. Hubungan-hubungan ini kemudian
harus digunakan untuk menghitung nilai-nilai dari standar deviasi pengulangan
dan reproduktifitas yang sesuai untuk nilai yang ditetapkan yang akan digunakan
dalam skema pengujian profisiensi.
8.5.3 Agar teknik-teknik di atas valid, studi kolaboratif harus dilakukan sesuai dengan
persyaratan atau prosedur yang setara. CATATAN Contoh disajikan dalam
Lampiran E.10. ISO 5725
8.6 Dari data yang diperoleh dalam putaran yang sama dari skema pengujian kemahiran
8.6.1 Dengan pendekatan ini, deviasi standar untuk penilaian kemahiran, σ pt, dihitung
dari hasil peserta dalam putaran yang sama dari skema pengujian kemahiran.
Ketika pendekatan ini digunakan, biasanya paling nyaman untuk menggunakan
skor kinerja seperti skor z. Perkiraan yang kuat dari standar deviasi hasil yang
dilaporkan oleh semua peserta, dihitung dengan menggunakan teknik yang
tercantum dalam Lampiran C, biasanya harus digunakan untuk menghitung σ pt.
Secara umum, evaluasi dengan D atau D% dan penggunaan δE tidak sesuai dalam
situasi ini, namun PA masih dapat digunakan sebagai skor standar, untuk
perbandingan di seluruh pengukuran (bagian 9.3.6).
8.6.2 Penggunaan hasil peserta dapat mengarah pada kriteria untuk evaluasi kinerja
yang tidak sesuai. Penyedia pengujian kelayakan harus memastikan bahwa σpt
yang digunakan untuk evaluasi kinerja sesuai dengan tujuan.
8.6.2.1 Penyedia pengujian kelayakan harus memberikan batasan pada
nilai terendah σpt yang akan digunakan, dalam hal deviasi standar yang
kuat sangat kecil. Batas ini harus dipilih sehingga ketika kesalahan
pengukuran cocok untuk penggunaan yang paling menantang yang
dimaksudkan, skor kinerja akan z <3,0.
CONTOH Dalam skema pengujian kemampuan untuk kain, satu
pengukuran dan jumlah benang per sentimeter. Deviasi standar yang
kuat bisa kecil dalam beberapa putaran (<1 utas per cm.), Dan kesalahan
kurang dari 4 utas / cm dianggap tidak signifikan. Penyedia pengujian
kelayakan menentukan bahwa standar deviasi yang kuat digunakan
sebagai σpt, kecuali jika kurang dari 1,3 utas / cm, dalam hal ini σ pt = 1,3
digunakan.
8.6.2.2 Penyedia pengujian kelayakan harus memberi batasan pada σpt
terbesar yang akan digunakan, atau pada hasil pengukuran yang dapat
dievaluasi sebagai “dapat diterima” (tidak ada sinyal), dalam hal deviasi
standar yang kuat sangat besar. Batas ini harus dipilih sehingga hasil yang
tidak sesuai untuk tujuan akan menerima sinyal tindakan.
8.6.2.3 Dalam beberapa kasus penyedia pengujian kelayakan dapat
menempatkan batas atas atau bawah pada interval hasil yang dapat
dievaluasi sebagai 'dapat diterima' (tidak ada peringatan atau sinyal aksi),
ketika interval simetris mencakup hasil yang tidak sesuai dengan tujuan.
CONTOH Untuk skema pengujian kemampuan profisiensi untuk air yang
tidak dapat diminum, peraturan menetapkan bahwa hasil harus berada
dalam 3σpt dari rata-rata yang kuat dari hasil peserta. Namun, karena
dalam beberapa kasus kisaran hasil yang dapat diterima dapat mencakup
0 μg / L, setiap hasil yang kurang dari 10% dari nilai yang diformulasikan
akan menghasilkan sinyal aksi (atau 'tidak dapat diterima'). Item uji
kelayakan diformulasikan dengan 4,0 μg / L zat yang diatur. Rata-rata
peserta yang kuat adalah 3,2 μg / L dan σpt adalah 1,1 μg / L. Oleh karena
itu mungkin bagi peserta untuk mengirimkan hasil 0,0 μg / L dan berada
dalam 3σpt, tetapi setiap hasil kurang dari 0,4 μg / L akan dievaluasi
sebagai "tidak dapat diterima".
8.6.3 Keuntungan utama dari pendekatan ini adalah kesederhanaan dan penerimaan
konvensional karena keberhasilan penggunaan dalam banyak situasi. Ini mungkin
satu-satunya pendekatan yang layak.
8.6.4 Ada beberapa kelemahan dengan pendekatan ini: a) Nilai σpt dapat bervariasi
secara substansial dari putaran ke putaran dari skema pengujian kelayakan,
sehingga menyulitkan peserta untuk menggunakan nilai-nilai skor z untuk
mencari tren yang bertahan lebih lama. beberapa putaran. b) Penyimpangan
standar dapat tidak dapat diandalkan ketika jumlah peserta dalam skema
pengujian kelayakan adalah kecil atau ketika hasil dari metode yang berbeda
digabungkan. Misalnya, jika p = 20, standar deviasi untuk data yang terdistribusi
normal dapat bervariasi sekitar ± 30% dari nilai sebenarnya dari satu putaran
skema pengujian kelayakan ke tahap berikutnya. c) Menggunakan ukuran
dispersi yang berasal dari data dapat menyebabkan proporsi yang konstan dari
skor yang tampaknya dapat diterima. Umumnya kinerja yang buruk tidak akan
terdeteksi oleh inspeksi skor, dan umumnya kinerja yang baik akan menghasilkan
peserta yang baik menerima skor yang buruk. d) Tidak ada interpretasi yang
berguna dalam hal kesesuaian untuk penggunaan akhir dari hasil.
CATATAN Contoh penggunaan data peserta disediakan dalam contoh komprehensif dalam
Lampiran E.3.
9.2.2 Jika kriteria ini tidak terpenuhi, maka penyedia pengujian kelayakan harus
mempertimbangkan hal berikut, memastikan setiap tindakan yang diambil tetap
konsisten dengan kebijakan penilaian kinerja yang disepakati untuk skema
pengujian kelayakan.
a) Pilih metode untuk menentukan nilai yang ditetapkan sedemikian rupa
sehingga ketidakpastiannya memenuhi kriteria dalam persamaan (10).
b) Gunakan ketidakpastian dari nilai yang ditetapkan dalam interpretasi
hasil skema uji kemahiran (lihat bagian 9.5 pada skor z ', atau 9,6 pada
skor ζ, atau 9,7 pada skor En).
c) Jika nilai yang ditetapkan berasal dari hasil peserta, dan ketidakpastian
besar muncul dari perbedaan antara sub-populasi peserta yang dapat
diidentifikasi, laporkan nilai dan ketidakpastian yang terpisah untuk
setiap sub populasi (misalnya, peserta menggunakan metode pengukuran
yang berbeda).
CATATAN Protokol Harmonisasi IUPAC [32] menjelaskan prosedur khusus untuk mendeteksi
bimodality, berdasarkan inspeksi plot kepadatan kernel dengan bandwidth yang ditentukan.
d) Memberitahu peserta bahwa ketidakpastian nilai yang diberikan tidak
dapat diabaikan, dan evaluasi dapat dipengaruhi.
Jika tidak ada a) - d) berlaku, maka para peserta harus diberitahu bahwa tidak ada nilai yang
dapat diandalkan yang dapat ditentukan dan bahwa tidak ada skor kinerja yang dapat
diberikan.
CATATAN Teknik yang disajikan dalam bagian ini ditunjukkan dalam Lampiran E.3 dan E.4.
9.3 Estimasi penyimpangan (kesalahan pengukuran)
9.3.1 Misalkan xi mewakili hasil (atau rata-rata ulangan) yang dilaporkan oleh peserta i
untuk pengukuran properti item tes kelayakan dalam satu putaran skema
pengujian kelayakan. Kemudian ukuran sederhana kinerja peserta dapat dihitung
sebagai perbedaan antara hasil xi dan nilai yang diberikan Xpt: i i pt Dxx = - (11)
Di dapat diartikan sebagai kesalahan pengukuran untuk hasil itu, sejauh mana
nilai yang ditetapkan dapat dianggap sebagai nilai kuantitas konvensional atau
referensi. Perbedaan Di dapat dinyatakan dalam unit yang sama dengan nilai
yang diberikan atau sebagai perbedaan persentase, dihitung sebagai: ()% 100% /
i i pt pt D x x x = - (12)
9.3.2 Perbedaan D atau D% biasanya dibandingkan dengan kriteria δE berdasarkan
kesesuaian untuk tujuan atau dengan pengalaman dari putaran sebelumnya dari
skema pengujian kelayakan; kriteria dicatat di sini sebagai δE, penyisihan untuk
kesalahan pengukuran. Jika -δE <D <δE maka kinerja dianggap ‘dapat diterima’
(atau ‘tidak ada sinyal’). (Kriteria yang sama berlaku untuk D%, tergantung pada
ekspresi δE.)
9.3.3 δE terkait erat dengan σpt seperti yang digunakan untuk skor z (lihat 9.4), ketika
σpt ditentukan oleh kesesuaian untuk tujuan atau harapan dari putaran
sebelumnya. Hubungan ditentukan oleh kriteria evaluasi untuk skor z. Misalnya,
jika z ≥ 3 menciptakan sinyal aksi maka δE = 3σpt, atau ekuivalen σpt = δE / 3.
Berbagai ekspresi δE konvensional dalam pengujian kelayakan untuk aplikasi
medis dan dalam spesifikasi kinerja untuk metode dan produk pengukuran.
9.3.4 Keuntungan D sebagai statistik kinerja dan δE sebagai kriteria kinerja adalah
bahwa peserta memiliki pemahaman intuitif tentang statistik ini karena mereka
terkait langsung dengan kesalahan pengukuran dan umum sebagai kriteria untuk
menentukan kesesuaian untuk tujuan. keuntungan dari D% adalah bahwa
pemahaman bersifat intuitif, standar untuk tingkat pengukuran dan, dan terkait
dengan penyebab umum kesalahan (misalnya, kalibrasi yang salah atau bias
dalam pengenceran).
9.3.5 Kerugiannya adalah tidak konvensional untuk pengujian kelayakan di banyak
negara atau bidang pengukuran; dan bahwa D tidak terstandarisasi, untuk
memungkinkan pemindaian laporan yang sederhana untuk sinyal aksi dalam
skema pengujian kemahiran dengan beberapa analit atau di mana kesesuaian
untuk kriteria tujuan dapat bervariasi berdasarkan tingkat pengukuran dan.
CATATAN Penggunaan D dan D% umumnya mengasumsikan simetri distribusi
hasil peserta dalam arti bahwa rentang yang dapat diterima adalah -δE <D <δE.
9.3.6 Untuk tujuan perbandingan lintas tingkat pengukuran, di mana kesesuaian untuk
kriteria tujuan dapat bervariasi; atau untuk kombinasi lintas putaran atau lintas
pengukuran, D dan D% dapat diubah menjadi skor kinerja standar yang
menunjukkan perbedaan relatif terhadap kriteria kinerja untuk pengukuran.
Untuk melakukan ini, hitung “Persentase Penyimpangan yang Diizinkan” (PA)
untuk setiap hasil sebagai berikut: PAi = (Di / δE) x 100% (13) Oleh karena itu PA
≥ 100% atau PA ≤ -100% menunjukkan sinyal tindakan (atau 'kinerja yang tidak
dapat diterima').
CATATAN 1 Skor PA dapat dibandingkan lintas level dan putaran berbeda dari
skema pengujian kelayakan, atau dilacak dalam bagan. Skor kinerja ini serupa
dalam penggunaan dan interpretasi dengan skor z yang memiliki kriteria evaluasi
umum seperti z ≤ -3 atau z ≥ 3 untuk sinyal aksi.
CATATAN 2 Variasi statistik ini biasanya digunakan, khususnya dalam aplikasi
medis, di mana biasanya ada frekuensi yang lebih tinggi dari pengujian kelayakan
dan sejumlah besar analit.
CATATAN 3 Mungkin tepat untuk menggunakan nilai absolut PA untuk
mencerminkan hasil yang secara konsisten dapat diterima (atau tidak dapat
diterima) relatif terhadap nilai yang diberikan.
9.4 z scores
9.4.1 The z score for a proficiency test result xi is calculated as:
( x i−x pt )
zi=
σ pt
9.4.2 Interpretasi konvensional skor z adalah sebagai berikut (lihat ISO / IEC 17043:
2010, B.4.1.1): - Hasil yang memberikan | z | ≤ 2,0 dianggap dapat diterima.
- Hasil yang menghasilkan 2,0 <| z | <3,0 dianggap memberikan sinyal
peringatan.
- Hasil yang menghasilkan | z | ≥ 3,0 dianggap tidak dapat diterima (atau sinyal
aksi).
Peserta harus disarankan untuk memeriksa prosedur pengukuran mereka
mengikuti sinyal peringatan jika mereka mengindikasikan masalah yang muncul
atau berulang.
CATATAN 1 Dalam beberapa aplikasi, penyedia pengujian kelayakan
menggunakan 2.0 sebagai sinyal aksi untuk skor z.
CATATAN 2 Pilihan kriteria σpt biasanya harus dibuat untuk memungkinkan interpretasi di
atas, yang banyak digunakan untuk penilaian kemahiran dan juga sangat mirip
dengan batas-batas peta kendali yang sudah dikenal.
CATATAN 3 Pembenaran untuk penggunaan batas 2,0 dan 3,0 untuk skor z adalah
sebagai berikut. Pengukuran yang dilakukan dengan benar diasumsikan
menghasilkan hasil yang dapat dijelaskan (setelah transformasi jika perlu)
dengan distribusi normal dengan rata-rata Xpt dan standar deviasi σpt. skor z
kemudian akan didistribusikan secara normal dengan rata-rata nol dan standar
deviasi 1,0. Dalam keadaan ini, hanya sekitar 0,3% dari skor yang diharapkan
akan jatuh di luar kisaran -3,0 ≤ z ≤ 3,0 dan hanya sekitar 5% yang diharapkan
berada di luar kisaran -2,0 ≤ z ≤ 2 , 0. Karena probabilitas z jatuh di luar ± 3,0
sangat rendah, tidak mungkin bahwa sinyal aksi akan terjadi secara kebetulan
ketika tidak ada masalah nyata, sehingga kemungkinan ada penyebab yang dapat
diidentifikasi untuk anomali ketika sinyal aksi diberikan .
CATATAN 4 Asumsi yang menjadi dasar interpretasi ini hanya berlaku untuk distribusi
hipotesis dari laboratorium yang kompeten dan bukan pada asumsi apa pun
tentang distribusi hasil yang diamati. Tidak ada asumsi yang perlu dibuat tentang
hasil yang diamati itu sendiri.
CATATAN 5 Jika variabilitas antar laboratorium yang benar lebih kecil dari σ pt maka
probabilitas kesalahan klasifikasi berkurang.
CATATAN 6 Ketika standar deviasi untuk penilaian kemahiran ditetapkan oleh salah satu
metode yang dijelaskan dalam 8.2 atau 8.4, itu mungkin berbeda secara
substansial dari standar deviasi hasil (kuat), dan proporsi hasil berada di
luar ± 2,0 dan ± 3 , 0 mungkin berbeda jauh dari 5% dan 0,3% masing-
masing.
9.4.2 Penyedia pengujian kelayakan harus menentukan pembulatan yang sesuai untuk
skor z yang dilaporkan, berdasarkan jumlah digit signifikan untuk hasilnya, dan
untuk nilai yang ditetapkan dan standar deviasi untuk pengujian kelayakan.
Aturan untuk pembulatan harus dimasukkan dalam informasi yang tersedia
untuk peserta
9.4.3 Ketika standar deviasi hasil peserta digunakan sebagai σpt dan skema pengujian
kelayakan melibatkan jumlah peserta yang sangat besar, penyedia pengujian
kelayakan mungkin ingin memeriksa normalitas distribusi, menggunakan hasil
aktual atau skor z. Di sisi lain, ketika hanya ada sedikit peserta, mungkin tidak
ada sinyal aksi yang diberikan. Dalam hal ini, metode grafis yang menggabungkan
skor kinerja selama beberapa putaran dapat memberikan indikasi kinerja peserta
yang lebih bermanfaat daripada hasil putaran individu.
9,5 z’ score
9.5.1 Ketika ada kekhawatiran tentang ketidakpastian nilai yang ditugaskan u (Xpt),
misalnya ketika u (Xpt)> 0,3σpt, maka ketidakpastian dapat diperhitungkan
dengan memperluas penyebut skor kinerja. Statistik ini disebut skor z ′ dan
dihitung sebagai berikut (dengan notasi seperti pada bagian 9.4)
xi −x pt
z⊄= 2
√σ pt +u2 ( x pt )
CATATAN Ketika Xpt dan / atau σpt dihitung dari hasil peserta, skor kinerja berkorelasi
dengan hasil masing-masing peserta, karena hasil individu memiliki dampak pada rata-rata yang
kuat dan standar deviasi. Korelasi untuk peserta individu tergantung pada bobot yang diberikan
kepada peserta tersebut dalam statistik gabungan. Untuk alasan ini, skor kinerja termasuk
ketidakpastian dari nilai yang ditetapkan tanpa termasuk penyisihan untuk korelasi mewakili
estimasi yang lebih rendah dari skor yang akan dihasilkan jika kovarians dimasukkan. Misalnya
kapan
u (Xpt) = 0,3σpt maka ada yang menurunkan sekitar 10% dari skor z '. Oleh karena itu
persamaan (15) dapat digunakan ketika Xpt dan / atau σpt ditentukan dari hasil peserta.
9.5.2 Skor D dan D% juga dapat dimodifikasi untuk mempertimbangkan ketidakpastian
nilai yang ditetapkan dengan rumus berikut untuk memperluas δE ke δE ’
δ ' E =√ δ +U
2 2
¿¿
E
di mana U (Xpt) adalah ketidakpastian diperluas dari nilai yang ditugaskan Xpt dihitung
dengan faktor cakupan k = 2.
9.5.3 skor z ′ dapat diinterpretasikan dengan cara yang sama dengan skor z (lihat 9.4)
dan menggunakan nilai kritis yang sama yaitu 2.0 dan 3.0, tergantung pada
desain untuk skema pengujian kelayakan. Demikian pula, skor D dan D%
kemudian akan dibandingkan dengan δE ’(lihat 9.3).
9.5.4 Perbandingan formula untuk skor z dan skor z in dalam 9.4 dan 9.5 menunjukkan
bahwa skor z ′ untuk putaran skema pengujian kelayakan akan selalu lebih kecil
daripada skor z terkait dengan faktor konstan dari
σ pt
2 2
√σ pt +U ¿ ¿ ¿
Ketika pedoman untuk membatasi ketidakpastian nilai yang diberikan dalam 9.2.1
dipenuhi,faktor ini akan jatuh dalam kisaran:
σ pt
0,96 ¿ 2 2 < 1,00
√σ pt +U ¿ ¿¿
Jadi, dalam hal ini, skor z ′ akan hampir identik dengan skor z, dan dapat
disimpulkan bahwa ketidakpastian dari nilai yang diberikan dapat diabaikan
untuk evaluasi kinerja. Ketika pedoman dalam 9.2.1 untuk ketidakpastian nilai
yang ditugaskan tidak terpenuhi, perbedaan dalam besarnya skor z ′ dan skor z
mungkin sedemikian sehingga beberapa skor z melebihi nilai kritis 2,0 atau 3,0
dan jadi berikan "sinyal peringatan" atau "sinyal aksi", sedangkan skor z
corresponding yang sesuai tidak melebihi nilai kritis ini dan karenanya tidak
memberikan sinyal. Secara umum, untuk situasi ketika nilai yang ditetapkan
dan / atau σpt tidak ditentukan dari hasil peserta, z ’dapat lebih disukai karena
ketika kriteria pada 9.2.1 dipenuhi, perbedaan antara z dan z’ akan diabaikan.
9.6 Skor Zeta (ζ)
9.6.1 Skor Zeta dapat bermanfaat ketika tujuan untuk skema pengujian kelayakan
adalah untuk mengevaluasi kemampuan peserta untuk mendapatkan hasil yang
mendekati nilai yang diberikan dalam ketidakpastian yang mereka klaim. Dengan
notasi seperti pada 9,4, skor ζ dihitung sebagai:
ζ x i− x pt
i =¿ 2 2
¿
√u ( x )+ u (x
i pt )
9.7 Skor En
9.7.1 Skor En dapat berguna ketika tujuan untuk skema pengujian kemahiran adalah
untuk mengevaluasi kemampuan peserta untuk mendapatkan hasil yang dekat
dengan nilai yang diberikan dalam klaim mereka.
ketidakpastian diperluas. Statistik ini konvensional untuk pengujian kelayakan
dalam kalibrasi, tetapi dapat digunakan untuk jenis pengujian kelayakan lain.
x i−x pt
Statistik kinerja ini dihitung sebagai ( E n )i 2 2
√u ( x ) +u (x
i pt )
10.4.3 Ketika penentuan ulangan dibuat dalam putaran skema pengujian kelayakan,
hasilnya dapat digunakan untuk menghitung grafik ukuran presisi; misalnya,
statistik k seperti dijelaskan dalam ISO 5725-2, atau ukuran terkait yang
diskalakan terhadap standar deviasi rata-rata yang kuat seperti yang
didefinisikan dalam Algoritma S (Lampiran C.4).
CATATAN Contoh plot batang dengan skor z disediakan dalam Lampiran E.11.
10.5 Youden Plot
10.5.1 Ketika dua item uji kelayakan serupa telah diuji dalam satu putaran skema
pengujian kelayakan, Youden Plot menyediakan metode grafis yang sangat
informatif untuk mempelajari hasilnya. Ini dapat berguna untuk menunjukkan
korelasi (atau kemandirian) hasil pada item tes kelayakan berbeda, dan untuk
membimbing penyelidikan menjadi alasan untuk sinyal tindakan.
10.5.2 Grafik dibuat dengan memplot hasil peserta, atau skor z, diperoleh pada salah
satu item tes kelayakan terhadap hasil peserta atau skor z yang diperoleh pada
item tes kemampuan lainnya. Garis vertikal dan horizontal biasanya digambar
untuk menciptakan empat kuadran nilai, untuk membantu interpretasi. Garis
digambar pada nilai yang ditetapkan atau pada median untuk dua distribusi hasil,
atau digambar pada 0 jika skor z diplot.
CATATAN Untuk interpretasi plot Youden yang tepat, penting agar kedua
item tes kelayakan memiliki tingkat pengukuran (atau identik)
yang sama; ini adalah agar sifat dari setiap kesalahan pengukuran
sistematis adalah sama di area interval pengukuran. Plot yang
Anda dapat dapat berguna untuk level pengukuran yang sangat
berbeda dan di hadapan kesalahan sistematis yang konsisten,
tetapi plot tersebut dapat menipu jika kesalahan kalibrasi tidak
secara konsisten positif atau negatif di seluruh rentang level ukur.
10.5.3 Ketika Plot Youden dibangun, interpretasinya adalah sebagai berikut: a) Periksa
plot untuk poin-poin yang terpisah dari sisa data. Jika peserta tidak mengikuti
metode pengujian dengan benar, sehingga hasilnya tunduk pada kesalahan
sistematis, suatu poin akan diberikan jauh di kiri bawah atau kuadran kanan atas.
Poin yang jauh dari yang lain di kuadran kiri atas dan kanan bawah mewakili
peserta yang pengulangannya lebih besar dari sebagian besar peserta lainnya,
yang metode pengukurannya menunjukkan sensitivitas yang berbeda terhadap
komposisi item tes kelayakan atau, kadang-kadang, peserta yang memiliki item
tes kelayakan yang secara tak sengaja dipertukarkan. b) Periksa plot untuk
melihat apakah ada bukti hubungan umum antara hasil untuk dua item tes
kelayakan (misalnya, jika mereka terletak kira-kira di sepanjang garis miring). Jika
ada bukti hubungan, maka itu menunjukkan bahwa ada bukti bias peserta yang
mempengaruhi item tes kelayakan yang berbeda dengan cara yang sama. Jika
tidak ada hubungan visual yang jelas antara hasil (mis., poin didistribusikan kira-
kira secara merata di wilayah melingkar, biasanya dengan kepadatan lebih tinggi
ke pusat) daripada kesalahan pengukuran untuk dua item uji kelayakan sebagian
besar independen. Ini dapat diperiksa dengan statistik korelasi peringkat, jika
pemeriksaan visual tidak konklusif. c) Periksa plot untuk kelompok-kelompok
peserta yang dekat, baik di sepanjang diagonal atau di tempat lain. Grup yang
jelas cenderung menunjukkan perbedaan antara metode yang berbeda.
CATATAN 1 Dalam studi di mana semua peserta menggunakan metode
pengukuran yang sama, atau plot hasil berasal dari metode
pengukuran tunggal, jika hasilnya berada di sepanjang garis, ini
mungkin menjadi bukti bahwa metode pengukuran belum
ditentukan secara memadai. Investigasi metode uji kemudian
memungkinkan reproduksibilitas metode secara umum
ditingkatkan.
CATATAN 2 Contoh plot Youden disediakan dalam Lampiran E.12.
10.6 Plot deviasi standar pengulangan
10.6.1 Ketika pengukuran ulangan dilakukan oleh peserta dalam putaran skema
pengujian kelayakan, hasilnya dapat digunakan untuk menghasilkan plot untuk
mengidentifikasi peserta yang rata-rata dan standar deviasinya tidak biasa.
10.6.2 Grafik dibuat dengan memplotkan standar deviasi peserta-dalam si untuk setiap
peserta terhadap rata-rata xi yang sesuai untuk peserta. Atau rentang hasil
ulangan dapat digunakan sebagai pengganti deviasi standar. Misalkan x * = rata-
rata kuat x1, x2, ..., xp, yang dihitung oleh Algoritma A w * = rata-rata gabungan
kuat dari s1, s2, ..., sp, seperti yang dihitung oleh Algoritma S dan berasumsi
bahwa data terdistribusi secara normal. Di bawah hipotesis nol bahwa tidak ada
perbedaan antara peserta dalam nilai-nilai populasi dari rata-rata peserta atau
deviasi standar dalam-peserta, statistik
x∗¿
(√ m x i− +¿ ¿ ¿
w∗¿ ¿2
memiliki kira-kira distribusi χ2 dengan 2 derajat kebebasan. Karenanya wilayah
kritis dengan tingkat signifikansi sekitar 1% dapat digambarkan pada grafik
dengan memplot
1 x −x¿ 2
s=W∗exp¿ ±
√ 2 ℑ−1
√ (
x 22 :0. 9 9− √m
w¿ ) ¿
pada sumbu deviasi standar terhadap x pada sumbu rata - rata untuk
x 22 ;0,99 x2
x=x∗−w∗
√ m m √
¿ x=x∗−w∗ 2; 0,99
CATATAN Prosedur ini didasarkan pada Teknik Lingkaran yang diperkenalkan oleh van
Nuland [36]. Metode yang diuraikan menggunakan perkiraan Normal sederhana
untuk distribusi deviasi standar yang dapat memberikan wilayah kritis yang
mengandung deviasi standar negatif. Metode yang diberikan di sini
menggunakan perkiraan untuk distribusi deviasi standar yang menghindari
masalah ini, tetapi wilayah kritis tidak lagi berbentuk lingkaran seperti pada
aslinya. Selanjutnya, nilai-nilai kuat digunakan untuk titik pusat di tempat rata-
rata sederhana seperti pada metode asli.
10.6.3 Plot dapat menunjukkan peserta dengan bias yang luar biasa besar, mengingat
pengulangan mereka. Jika ada banyak ulangan, teknik ini juga dapat
mengidentifikasi peserta dengan pengulangan yang sangat kecil. Namun, karena
biasanya ada sejumlah kecil ulangan, interpretasi sulit.
CATATAN Contoh plot penyimpangan standar pengulangan disediakan dalam Lampiran
E.13.
10.7 Membagi sampel
10.7.1 Sampel terpisah digunakan ketika perlu untuk melakukan perbandingan rinci dari
dua peserta, atau ketika pengujian kelayakan tidak tersedia dan beberapa
verifikasi eksternal diperlukan. Sampel dari beberapa bahan diperoleh, mewakili
berbagai properti yang menarik, setiap sampel dibagi menjadi dua bagian, dan
setiap laboratorium memperoleh sejumlah (setidaknya dua) penentuan ulangan
pada bagian dari masing-masing sampel. Kadang-kadang, lebih dari dua peserta
dapat terlibat, dalam hal ini satu harus diperlakukan sebagai referensi, dan yang
lain harus dibandingkan dengan menggunakan teknik yang dijelaskan di sini.
CATATAN 1 Jenis penelitian ini adalah umum, tetapi sering diberi nama
berbeda, seperti "sampel berpasangan" atau "perbandingan
bilateral".
CATATAN 2 Desain sampel split ini tidak boleh disamakan dengan desain 'level
split' yang digunakan dalam ISO 5725, yang melibatkan dua item
uji dengan level yang sedikit berbeda yang disediakan untuk
semua peserta.
10.7.2 Data dari desain split-sampel dapat digunakan untuk menghasilkan grafik yang
menampilkan variasi antara pengukuran ulangan untuk dua peserta dan
perbedaan antara hasil rata-rata mereka untuk setiap item tes kelayakan. Plot
bivariat yang menggunakan rentang konsentrasi penuh dapat memiliki skala
yang menyulitkan untuk mengidentifikasi perbedaan penting antara peserta,
sehingga plot perbedaan atau persentase perbedaan antara hasil dari dua
peserta dapat lebih bermanfaat. Analisis lebih lanjut akan tergantung pada
potongan yang dibuat dari grafik ini. 10.8 Metode grafis untuk menggabungkan
skor kinerja selama beberapa putaran skema pengujian kelayakan
10.8.1 Ketika skor kinerja terstandarisasi akan digabungkan dalam beberapa putaran
skema pengujian kelayakan, penyedia pengujian kelayakan dapat
mempertimbangkan untuk menyiapkan grafik, seperti yang dijelaskan dalam
10.8.2 atau 10.8.3. Penggunaan grafik ini, di mana skor kinerja untuk beberapa
putaran skema pengujian kelayakan digabungkan, dapat memungkinkan tren,
dan fitur lainnya dari hasil, dapat diidentifikasi yang tidak jelas ketika skor kinerja
untuk setiap putaran diperiksa secara terpisah.
CATATAN Dengan menggunakan "skor berjalan" atau "skor kumulatif", di
mana skor kinerja yang diperoleh oleh peserta digabungkan
selama beberapa putaran skema pengujian kemahiran, skor
kinerja harus ditampilkan secara grafis. Peserta mungkin memiliki
kesalahan yang muncul dengan item tes kelayakan yang
digunakan dalam satu putaran tetapi tidak pada yang lain; skor
lari dapat menyembunyikan kesalahan ini. Namun, dalam
beberapa keadaan (mis. Dengan putaran yang sering) 'merapikan'
skor outlying sesekali dapat membantu dalam menunjukkan
kinerja yang mendasarinya lebih jelas.
10.8.2 Diagram kontrol Shewhart adalah metode yang efektif untuk mengidentifikasi
masalah yang menyebabkan nilai z skor tidak menentu yang besar. Lihat ISO
7870-2 [6] untuk saran tentang merencanakan grafik Shewhart dan aturan untuk
batasan tindakan.
10.8.2.1 Untuk menyiapkan bagan ini, skor terstandarisasi, seperti skor z
atau skor PA, untuk peserta diplot sebagai poin individual, dengan
batas tindakan dan peringatan ditetapkan konsisten dengan
desain untuk skema pengujian kelayakan. Ketika beberapa
karakteristik diukur pada setiap putaran, skor kinerja untuk
karakteristik yang berbeda dapat diplot pada grafik yang sama,
tetapi poin untuk karakteristik yang berbeda harus diplot dengan
menggunakan simbol plot yang berbeda dan / atau warna yang
berbeda. Ketika beberapa item tes kelayakan dimasukkan dalam
putaran yang sama dari skema pengujian kelayakan, skor kinerja
dapat diplot bersama dengan beberapa poin pada setiap periode
waktu. Garis yang bergabung dengan skor rata-rata pada setiap
titik waktu juga dapat ditambahkan ke plot.
10.8.2.2 Aturan konvensional untuk menginterpretasikan diagram kontrol
Shewhart adalah bahwa sinyal outof-control diberikan ketika a)
satu titik jatuh di luar batas tindakan (± 3,0 untuk skor z, atau
100% untuk PA);
b) dua dari tiga titik berturut-turut di luar batas peringatan (± 2,0
untuk skor z atau 70% untuk PA);
c) enam hasil berturut-turut baik positif atau negatif.
10.8.2.3 Ketika diagram kontrol Shewhart memberikan sinyal di luar
kendali, peserta harus menyelidiki kemungkinan penyebabnya.
CATATAN Standar deviasi untuk penilaian kemahiran σpt biasanya tidak
merupakan standar deviasi perbedaan (xi - Xpt), sehingga tingkat
probabilitas yang biasanya terkait dengan batas tindakan dan
peringatan dari peta kendali Shewhart mungkin tidak berlaku.
10.8.3 Ketika tingkat properti bervariasi dari satu putaran skema pengujian kemahiran
ke yang lain, plot skor kinerja terstandarisasi, seperti z dan PA, terhadap nilai
yang diberikan akan menunjukkan jika bias partisipan berubah dengan level.
Ketika lebih dari satu item tes kelayakan dimasukkan dalam babak yang sama
skor kinerja semua dapat diplot secara independen.
CATATAN 1 Berguna untuk memiliki simbol plot yang berbeda atau warna
yang berbeda untuk hasil dari putaran pengujian kelayakan saat
ini, untuk membedakan titik dari putaran sebelumnya.
CATATAN 2 Contoh plot seperti itu diberikan dalam Lampiran E.14,
menggunakan skor PA. Plot ini dapat dengan mudah
menggunakan z, dengan hanya perubahan skala vertikal.
11 Desain dan analisis skema pengujian kemahiran kualitatif (termasuk sifat nominal dan ordinal)
11.1 Jenis data kualitatif
Sejumlah besar pengujian kelayakan terjadi untuk properti yang diukur atau
diidentifikasi pada skala kualitatif. Ini termasuk yang berikut: - Skema pengujian
kemahiran yang membutuhkan pelaporan pada skala kategorikal (kadang-
kadang disebut 'nominal'), di mana nilai properti tidak memiliki besaran (seperti
jenis zat atau organisme); - Skema pengujian kelayakan untuk ada atau tidaknya
suatu properti, apakah ditentukan oleh kriteria subyektif atau oleh besarnya
sinyal dari prosedur pengukuran. Ini dapat dianggap sebagai kasus khusus dari
skala kategorikal atau ordinal, dengan hanya dua nilai (juga disebut 'dikotomi',
atau biner); - Skema pengujian kelayakan yang membutuhkan hasil yang
dilaporkan pada skala ordinal, yang dapat dipesan sesuai dengan besarnya tetapi
tidak ada hubungan aritmatika di antara hasil yang berbeda. Misalnya, 'tinggi,
sedang dan rendah' membentuk skala ordinal. Skema pengujian kemahiran
seperti itu memerlukan pertimbangan khusus untuk tahap desain, penugasan
nilai, dan evaluasi kinerja (penilaian) karena - nilai yang diberikan seringkali
didasarkan pada pendapat ahli; dan - perlakuan statistik yang dirancang untuk
data yang bernilai terus-menerus dan penghitungan tidak berlaku untuk data
kualitatif. Misalnya, tidak berarti untuk mengambil cara dan standar deviasi hasil
skala ordinal bahkan ketika mereka dapat ditempatkan dalam urutan peringkat.
Paragraf berikut memberikan panduan tentang desain, penetapan nilai dan
evaluasi kinerja untuk skema pengujian kemahiran kualitatif.
CATATAN Pedoman untuk data ordinal tidak berlaku untuk hasil pengukuran
yang didasarkan pada skala kuantitatif dengan indikasi tidak
kontinyu (seperti pengenceran atau titer), lihat bagian 5.2.2.
11.2 Desain statistik
11.2.1 Untuk skema pengujian kelayakan di mana pendapat ahli sangat penting
baik untuk penetapan nilai atau untuk penilaian laporan peserta,
biasanya akan diperlukan untuk mengumpulkan panel ahli yang
berkualifikasi tepat dan untuk menyediakan waktu untuk debat dalam
rangka mencapai konsensus yang tepat tugas. Di mana ada kebutuhan
untuk bergantung pada ahli individu untuk penilaian atau penugasan
nilai, penyedia pengujian kemahiran juga harus menyediakan penilaian
dan kontrol konsistensi pendapat di antara para ahli yang berbeda.
CONTOH Dalam skema pengujian kelayakan klinis yang bergantung
pada mikroskop untuk diagnosis, pendapat ahli digunakan
untuk menilai slide mikroskop yang diberikan kepada
peserta dan memberikan diagnosis klinis yang sesuai untuk
item tes kelayakan. Penyedia pengujian kelayakan dapat
memilih untuk mengedarkan item tes kelayakan ‘buta’
kepada anggota panel ahli yang berbeda untuk
memastikan konsistensi diagnosis, atau melakukan latihan
berkala untuk mengevaluasi kesepakatan di antara panel.
11.2.2 Untuk skema pengujian kelayakan yang melaporkan hasil kategorikal atau
ordinal yang bernilai tunggal, dihargai, penyedia pengujian kelayakan
harus mempertimbangkan
- Menyediakan dua atau lebih item tes kelayakan per putaran; atau
- meminta hasil dari sejumlah pengamatan yang direplikasi pada setiap
item tes kelayakan, dengan jumlah ulangan yang ditentukan sebelumnya.
Salah satu dari strategi ini memungkinkan jumlah hasil untuk setiap
peserta yang dapat digunakan baik dalam meninjau data atau dalam
penilaian. Penyediaan dua atau lebih item uji kelayakan dapat
memberikan informasi tambahan tentang sifat kesalahan dan juga
memungkinkan penilaian kinerja pengujian kelayakan yang lebih canggih.
CONTOH 1 Dalam skema pengujian kelayakan yang dimaksudkan
untuk melaporkan ada atau tidak adanya kontaminan,
penyediaan item uji kelayakan yang mengandung berbagai
level kontaminan memungkinkan penyedia pengujian
kelayakan untuk memeriksa jumlah deteksi yang berhasil
pada setiap level sebagai fungsi dari tingkat kontaminan
hadir. Ini dapat digunakan, misalnya, untuk memberikan
informasi kepada peserta tentang kemampuan deteksi dari
metode pengujian yang mereka pilih, atau untuk
memperoleh probabilitas deteksi rata-rata yang pada
gilirannya memungkinkan skor kinerja dialokasikan kepada
peserta berdasarkan estimasi probabilitas pola respons
tertentu.
CONTOH 2 Pengujian kelayakan dalam perbandingan forensik sering
memerlukan item uji kecocokan yang cocok, apakah
mereka berasal dari sumber yang sama atau sumber yang
berbeda (misalnya, sidik jari, DNA, selongsong peluru, jejak
kaki, dll.). Dalam banyak kasus "tak tentu" adalah respons
yang diizinkan. Skema pengujian kelayakan mungkin
mencakup beberapa item uji kelayakan dari sumber yang
berbeda, dan peserta diminta untuk menyatakan mana
yang dari "sumber yang sama", "sumber yang berbeda",
atau "tidak ditentukan" untuk setiap pasangan. Ini
memungkinkan skor objektif angka (atau%) benar atau
salah, atau angka (%) benar cocok, atau mengoreksi
penolakan. Kriteria kinerja kemudian dapat ditentukan
pada kebugaran untuk digunakan, atau pada tingkat
kesulitan tantangan.
11.2.3 Homogenitas harus ditunjukkan dengan peninjauan sampel sampel yang
sesuai untuk tes kelayakan, yang semuanya harus menunjukkan nilai
properti yang diharapkan. Untuk beberapa sifat kualitatif, misalnya ada
atau tidaknya, dimungkinkan untuk memverifikasi homogenitas dengan
pengukuran kuantitatif; misalnya jumlah mikrobiologis atau serapan
spektrum di atas ambang batas. Dalam situasi ini, uji homogenitas
konvensional mungkin sesuai, atau demonstrasi dari semua hasil berada
di atas atau di bawah nilai batas.
11.3 Nilai yang ditetapkan untuk skema pengujian kelayakan kualitatif
11.3.1 Nilai dapat ditugaskan untuk item tes kelayakan: a) berdasarkan penilaian
ahli; b) dengan menggunakan bahan referensi sebagai item tes
kelayakan; c) dari pengetahuan tentang asal atau persiapan item tes
kelayakan; d) menggunakan mode atau median hasil peserta (median
hanya sesuai untuk nilai-nilai ordinal). Metode penetapan nilai lainnya
yang dapat ditampilkan untuk memberikan hasil yang andal juga dapat
digunakan. Paragraf berikut mempertimbangkan masing-masing strategi
di atas.
CATATAN Biasanya tidak tepat untuk memberikan informasi
kuantitatif mengenai ketidakpastian nilai yang ditetapkan
dalam skema pengujian kemahiran kualitatif. Meskipun
demikian, masing-masing paragraf 11.3.2 hingga 11.3.5
mensyaratkan penyediaan informasi dasar yang berkaitan
dengan kepercayaan pada nilai yang diberikan sehingga
peserta dapat menilai apakah hasil yang buruk mungkin
disebabkan oleh kesalahan dalam penetapan nilai.
peserta Bukti asal dan / atau detail persiapan harus tersedia bagi peserta
setelah putaran baik atas permintaan atau sebagai bagian
dari laporan untuk putaran pengujian kelayakan.
CONTOH Item tes kelayakan anggur yang diedarkan untuk suatu skema
pengujian kemahiran keaslian dapat diperoleh langsung
dari produsen yang sesuai di daerah asal yang ditentukan,
atau melalui pemasok komersial yang dapat memberikan
jaminan keaslian.
11.3.4.1 Uji konfirmasi atau pengukuran
direkomendasikan jika memungkinkan,
terutama jika kontaminasi dapat
membahayakan penggunaan sebagai item
uji kelayakan. Misalnya, item tes kelayakan
yang diidentifikasi sebagai contoh mikroba
tunggal, tanaman atau spesies hewan
biasanya harus diuji untuk respon terhadap
tes untuk spesies lain yang relevan.
Pengujian tersebut harus sesensitif mungkin
untuk memastikan bahwa spesies yang
terkontaminasi tidak ada atau bahwa
tingkat kontaminasi dikuantifikasi.
11.3.4.2 Penyedia pengujian kelayakan harus
memberikan informasi tentang segala
kontaminasi yang terdeteksi atau keraguan
tentang asal yang dapat membahayakan
penggunaan item uji kelayakan.
CATATAN Rincian lebih lanjut tentang karakterisasi item uji kelayakan
tersebut berada di luar cakupan Standar ini.
11.4.4 Jika beberapa ulangan dilaporkan untuk setiap item tes kelayakan
atau di mana item uji kelayakan ganda diberikan kepada
setiap peserta, penyedia pengujian kelayakan dapat
menghitung dan menggunakan skor kinerja gabungan atau
ringkasan skor dalam penilaian kinerja. Skor atau ringkasan
kinerja gabungan dapat dihitung sebagai, misalnya: -
jumlah sederhana skor kinerja di semua item tes
kelayakan; - hitungan setiap tingkat kinerja yang
dialokasikan; - proporsi hasil yang benar; - metrik jarak
berdasarkan perbedaan antara hasil dan nilai yang
diberikan.
CONTOH Sebuah metrik jarak yang sangat umum kadang-kadang
digunakan statistik untuk data kualitatif adalah koefisien
Gower [20]. Ini dapat menggabungkan variabel kuantitatif
dan kualitatif berdasarkan kombinasi skor untuk
kesamaan. Untuk data kategorikal atau biner, indeks
mengalokasikan skor 1 untuk kategori yang sama persis
dan 0 sebaliknya; untuk skala ordinal itu mengalokasikan
skor sama dengan 1 minus perbedaan peringkat dibagi
dengan jumlah peringkat yang tersedia, dan untuk data
skala interval atau rasio itu mengalokasikan skor sama
dengan 1 dikurangi perbedaan absolut dibagi dengan
rentang semua nilai yang diamati. Skor ini, yang semuanya
harus dari 0 hingga 1, dijumlahkan dan jumlah dibagi
dengan jumlah variabel yang digunakan. Varian tertimbang
juga dapat digunakan.
Skor kinerja gabungan dapat dikaitkan dengan ringkasan
penilaian kinerja. Misalnya, proporsi tertentu dari skor
yang benar (biasanya tinggi) dapat dianggap kinerja 'dapat
diterima', jika itu konsisten dengan tujuan dari skema
pengujian kelayakan.
11.4.5 Metode grafis dapat digunakan untuk memberikan informasi
kinerja kepada peserta atau untuk memberikan informasi
ringkasan dalam laporan untuk satu putaran.
CATATAN Contoh analisis data ordinal disediakan dalam Lampiran E.15.
.