Statistical Test Untuk Menentukan Rejection of Outliers
Faizal Riswandi, 1106015674
Dalam suatu pengukuran dilakukan pengambilan data yang merupakan sample dari populasi. Pada sample yang diperoleh didapatkan dua jenis data Good Value dan Bad Value (Outlier Data). Sebelum dilakukan pegolahan data maka harus dilakukan pemilihan data terlebih dahulu dengan mengeliminasi data outlier. Dalam mengeliminasi data outlier dapat digunakan tiga metode statistic, sebagai berikut : 1. Chauvents criterion Pada penggunaan Chauvenets Criterion dinyatakan bahwa semua data yang terletak pada daerah probabilitas 1-1/(2N) harus diperhitungkan.Dengan kata lain, sampel data dieliminasi apabila probabilitas untuk mendapatkan nilai deviasi dari rata-ratanya kurang dari 1/(2N).
Dengan menggunakan nilai mean dan standar deviasi Untuk menenutukan nilai probabilitas dari sebuah nilai sample dapat digunakan rumus : Z = | X i -X m | / S x kemudian dicari nilai probabilitasnya dengan menggunakan table Z. Langkah langkah penggunaan Chauvenets Criterion : 1. Hitung rata-rata dan standard deviation dari seluruh set data eksperimen. 2. Tentukan kisaran probabilitas yang masuk kiretia dengan rumus 1/(2N). 3. Taksir data yang kemungkinan merupakan outlier data (misal, memiliki selisia dua kali Sx dibanding dengan mean) 4. Hitung nilai Z dari data yang telah ditaksir sebelumnya 5. Cari besar probabilitas dari Z tersebut 6. Apabila data berada
Contoh : Data 9 10 10 10 11 50
1. Mean = 16,7 dan Sx = 16,3 2. P = 1-1/2N = 0,916 3. Data yang ditarksi merupakan outlier adalah 50 karena memiliki selisia dua kali Sx dibanding dengan mean 4. Z = (50-16,7)/16,3 =2,043 5. Bilai P dari Z = 2,043 adalah 0,9793 6. Karena 0,9793 diluar kisaran yang diterima (0,9793 > 0,916) maka 50 merupakan data outlier.
2. Peirces criterion Peirces Criterion merupakan suatu metode statistical guna mengelimininasi outlier data dengan menggunakan bantuan Peirces table. Prosedur untuk menggunakan Peirces Method adalah sebagai berikut : 1. Hitung rata-rata dan standard deviation dari seluruh set data eksperimen. 2. Dapatkan nilai R yang sesuai dengan jumlah pengukuran, diambil dari tabel Peirce.
3. Hitung maximum allowable deviation : S x . R = 4. Untuk semua data outliers, dapatkan nilai 5. Eliminasi data outliers apabila 6. Apabila terdapat lebih dari satu pengukuran yang di eliminasi, asumsikan bahwa pengukuran nilai tertinggi berikutnya adalah observasi yang meragukan. 7. Ulangi perhitungan langkah 2-5 dengan nilai R berbeda yang berada kolom sebelah kanan R sebelumnya, hingga tidak ada lagi data pengukuran yang perlu di eliminasi. 8. Dapatkan nilai rata-rata dan standard deviasi baru dari data set yang telah direduksi tersebut.
Contoh :
1. Mean = 98,6 dan Sx = 5,02 2. R = 1,878 karena ada 10 sample 3. = Sx . R = 5,02 (1,878) = 9,43 4. Hitung nilai deviasi
5. Bandingkan dengan nilai dviasi maksimum
6. Ulangi perhitungan langkah 2-5 dengan nilai R berbeda yang berada kolom sebelah kanan R = 1,57 maka = 7,88 . Karena 8,6 > 7,88 maka nilai 90 dapat dieliminasi Data 101,2 90 99 102 103 100,2 89 98,1 101,5 102 7. Ulangi langkah 6 dengan R = 1,38 maka = 6,93 . Cek semua data dengan deviasi maskimum baru ini. Dan ternyata semua data tidak ada yang melebihinya 8. Setelah 89 dan 90 dieliminasi maka Mean = 100,9 dan Sx = 1,66
3. = criterion = 2, 3, Metode ini merupakan metode yang sering sekali digunakan dalam dunia industry. Metode ini telah banyak dikembangkan sehingga dikenal dengan teori six-sigma. Luas daerah penerimaan probabilitas dari suatu data sangat dipengaruhi oleh besar = , = 2, 3,.. Misal : Jika = 2 maka daerah probabilitas yang diterima adalah daerah (2) Jika = 3 maka daerah probabilitas yang diterima adalah daerah (3)
Maka dari itu jika kriterika ini diplot pada grafik distribusi normal maka akan diperoleh sebagai berikut : Untuk daerah 1 dari rata-rata maka diperoleh daerah penerimaan P=0,6826 Untuk daerah 2 dari rata-rata maka diperoleh daerah penerimaan P=0,9546 Untuk daerah 3 dari rata-rata maka diperoleh daerah penerimaan P=0,9973