|rr(H1) rr(H2) (
k
=1
rr (H1) rr (H2))]
2
Untuk mengetahui apakah M1 dan M2 memiliki perbedaan yang signifikan, kita menghitung
t dan memilih tingkat signifikansi (sig), misalnya 5%. Kemudian kita lihat pada tabel
distribusi t, nilai z = sig/2 (dalam kasus ini berarti 0,025), dimana z merupakan batas
kepercayaan. Bila nilai t > z atau t < -z, maka kita dapat menolak hipotesis yang menyatakan
M1 dan M2 adalah sama, dan dapat disimpulkan bahwa antara M1 dan M2 terdapat
perbedaan yang signifikan secara statistik. Sedangkan bila nilai t < z atau t > -z, dapat
disimpulkan bahwa antara M1 dan M2 tidak terdapat perbedaan yang signifikan secara
statistik.
Bila tidak menggunakan single test, kita dapat melakukan two set test, maka dilakukan t-test
nonpaired, dimana nilai varian antara rata-rata dari kedua model tersebut dapat dihitung
dengan rumus sebagai berikut:
or(H1 H2) =
_
or(H1)
1
+
or(H2
2
dimana k1 dan k2 merupakan jumlah sampel cross-validation.
ROC Curves
Kurva ROC adalah alat visual yang berguna untuk membandingkan dua model
klasifikasi. ROC kepanjangan dari Receiver Operating Characteristic. Kurva ROC
menunjukkan trade-off antara true positive rate (proporsi tuple positif yang teridentifikasi
dengan benar) dan false positive rate (proporsi tuple negatif yang teridentifikasi salah sebagai
positif) dalam suatu model. Dengan kurva ROC, kita dapat melihat trade off antara tingkat
dimana suatu model dapat mengenali tuple positif secara akurat dan tingkat dimana model
tersebut salah mengenali tuple negatif sebagai tuple positif. Kurva ROC terdiri atas sumbu
vertikal yang menyatakan true positive rate, dan sumbu horizontal yang menyatakan false
positive rate. Jika memiliki true positif (sebuah tupel positif yang benar diklasifikasikan)
maka pada kurva ROC akan bergerak ke atas dan plot titik. Sebaliknya, jika tupel milik kelas
tidak ketika memiliki false positif, maka kurva ROC bergerak ke kanan dan plot titik.
Proses ini diulang untuk setiap tupel tes (setiap kali bergerak ke atas kurva untuk true positif
atau terhadap hak untuk false positif). Untuk mengukur ketelitian dari suatu model, kita dapat
mengukur area di bawah kurva ROC.