Hendrawan
hend@telecom.ee.itb.ac.id
Pengukuran
Teknik dasar utk analisis performansi
Jalankan eksperimen/observasi data pada suatu jaringan atau prototype Nilai/ukur (benchmark) performansi
Kelebihan
Scaleability, keakuratan, mencakup detail
Kekurangan
Harus memp. peralatan (hardware/software) Sukar utk mempertimbangkan semua kasus/ harga parameter Jumlah data yang besar Analisa statistik dari data Menghabiskan waktu
Mengumpulkan Pengukuran
Monitors
Aktif masukan (inject) trafik ke jaringan dan lihat kelakuannnya Pasif set dan observasi trafik jaringan
Data Sniffer
Analisa Pengukuran
Karakterisasi statistik dari metrik
Menentukan: bloking panggilan pd sentral telepon, utilisasi link jaringan, bit error rate pd link, dll.
Mengumpulkan sampel data - n data points x 1, x 2 , , x n Umumnya statistical inference mengasumsikan data adalah independent
Langkah pertama adalah memeriksa independensi dg scatter plot atau correlation plot
Analisa Korelasi
Statistical tool digunakan utk menggambarkan seberapa jauh satu variabel secara linier berelasi thd yg lainnya
Kekuatan relasi Arah relasi (positif atau negatif) Juga digunakan utk test independence dari set data
dimana j = 1, 2, 3 .. dan X(n) adalah sample mean dan S(n) sample standard deviation j
Analisa Korelasi
Harga j berada diantara -1 dan 1 Harga + dari j indikasi relasi positif Harga - dari j indikasi relasi negatif Korelasi sempurna j = 1 atau j = -1 terjadi hanya jika asosiasi linier sempurna Hanya ukuran kekuatan dari relasi linier Sangat kuat dipengaruhi oleh bbrp outliers Dlm praktek estimasi j utk beberpa harga dari j dan pengakuan independent jika | j | < e dimana e = .2 or .3
Contoh Harga r
Contoh Harga r
Scatter Plots
Representasi grafis dari relasi antara dua variabel kuantitatif Explanatory variable diplot pd sumbu x respons pd sumbu y (plot setiap point data)
Dapat digunakan untuk memeriksa independence dari keterpisahan data j dg ploting xi vs xi+j
Scatter Plot
Kapan menggunakan Scatter Plots utk memeriksa independence dari data Plot satu seri dari scatter plots
Data 1 keterpisahan (xi , xi+1 ) korespondensi dg r1 Data 2 keterpisahan (xi , xi+2 ) korespondensi dg r2 Data n keterpisahan (xi , xi+j ) korespondensi dg rj Jika data berkorelasi akan memp relasi visual yg kuat
Correlated Data
Jika data berkorelasi Bekerja hanya dg ukuran central tendency Jika rancangan eksperimen menghasilkan korelasi rancang ulang eksperimen utk melemahkan korelasi Metoda replikasi
Lakukan eksperimen bbrp kali tiap eksperimen menghasilkan satu summary data point
Batch means
Pecah data kedalam non-overlapping batches dg ukuran yg kira-kira sama ganti tiap batch dg harga rata-ratanya gunakan harga ini sbg set sample data
Range
Mengukur dispersi Perbedaan antara observasi terbesar dan terkecil
Quartiles
Mengukur sebaran pada data Pecah deretan data kedalam 4 bagian
Interquartile Range
Mengukur dispersi Juga disebut midspread Sebaran ditengah 50% Tidak dipengaruhi oleh harga ekstrem Formula:
Outliers
Outlier titik data bukan representasi dari kelakuan Test untuk Outlier Xi > Q3 + 1.5 * IQR atau Xi < Q1 - 1.5 * IQR Test utk outliers biasanya test yg pertama dilakukan pada set data
Shape
Menggambarkan bagaimana data terdistribusi Mengukur bentuk (shape)
Skewness: Symmetry
5-Number Summary
Menjelaskan distribusi tanpa melakukan kompilasi yang kompleks
Minimum Q1 Median Q3 Maximum
Box-and-Whisker Plot
Display grafis dari data menggunakan 5number summary
Box-and-Whisker Plot
Display grafis dari data menggunakan 5-number summary Contoh dari data internet video delay jitter
Frekuensi relatif dari tiap nilai data adalah pj = nj/n dimana nj = {jumlah nilai xi = hi }. Line plot adalah grafik pj thd hi
Histogram data kontinyu
Histogram
Range dari X dibagi kedalam k interval dg ukuran sama disebut cells Lebar dari cell adalah
Frekuensi dari tiap cell adalah fj = nj/n dimana nj = jumlah xi dimana cj xi < cj+1 Sturges rule menyarankan
Contoh Histogram
Contoh Histogram
Contoh Histogram
Chi-squared Test
Test perbedaan histogram dari data dan densitas teoritis Bagi rentang (range) data kedalam k intervals (a0, a1) , (a1, a2) , (a2, a3) , , (ak-1, an) Dari data sampel, tentukan jumlah observasi pada tiap interval n1 , n2 , n3 , , nk Dari density function teoritis, tentukan probabilitas yang dimuat dalam tiap interval p1 , p2 , p3 , , pk dimana pj = P { aj-1 X aj } = F(aj ) - F(aj-1 )
Chi-squared Test
Normalized error antara bilangan teoritis yg diharapkan dg bilangan aktual dari observasi diukur dg
Chi-squared Test
Normalized error antara bilangan teoritis yg diharapkan dg bilangan aktual dari observasi diukur dg
E adalah Chi-squared distributed Tolak f(x) matches dg data jika dimana k = number of intervals, s = number of parameters diestimasi dari data