Model kinerja jaringan komputer yang optimal memerlukan model lalu lintas yang akurat,
yang dapat menangkap karakteristik statistik dari lalu lintas yang sebenarnya. Jika model lalu
lintas tidak mewakili lalu lintas secara akurat, seseorang mungkin melebih-lebihkan atau
meremehkan kinerja jaringan. Makalah ini menyajikan konfirmasi sifat serupa diri dari
protokol yang dipilih di lapisan komunikasi jaringan komputer. Ini menunjukkan bahwa
ukuran yang baik dari kesamaan diri adalah faktor Hurst.
PENDAHULUAN
Analisis statistik pengukuran lalu lintas jaringan menunjukkan keberadaan yang jelas
dari sifat fraktal atau self-similar dalam jaringan komputer. Ini berarti bahwa pola statistik
yang serupa dapat terjadi pada skala waktu yang berbeda yang dapat bervariasi oleh banyak
urutan waktu. Karakteristik statistik lalu lintas jaringan komputer telah menarik perhatian
para ilmuwan selama bertahun-tahun, paling tidak untuk mendapatkan pemahaman yang
lebih baik tentang faktor-faktor yang mempengaruhi kinerja dan skalabilitas sistem besar
seperti Internet. Lalu lintas jaringan secara inheren tergantung pada fraktal atau jarak jauh
(LRD). Fakta itu menimbulkan pertanyaan sejauh mana hasil penelitian ini dapat diterapkan
dalam praktik. Apakah mungkin untuk mendiagnosis lalu lintas jaringan dan memberikan
risiko kemacetan? Saat ini. ada banyak bukti bahwa LRD sangat penting untuk sejumlah
masalah teknik, seperti pengukuran lalu lintas dan perilaku antrian. Proses serupa telah
diamati dan dianalisis di sejumlah bidang lain seperti.
Kesamaan diri dan fraktal adalah gagasan yang dipelopori oleh Benoit B. Mandelbrot.
Kesamaan diri dapat dikaitkan dengan "fraktal", yang merupakan objek dengan penampilan
yang tidak berubah pada skala yang berbeda. Dalam kasus fraktal statistik, ini adalah
kepadatan probabilitas yang berulang pada setiap skala. Di sisi lain, fraktal dinamis
dihasilkan oleh sistem dinamis berdimensi rendah dengan solusi kacau. Penelitian yang
terkait dengan traffic self-similarity dapat diklasifikasikan ke dalam empat kategori:
pemodelan lalu lintas berbasis pengukuran, pemodelan fisik, analisis antrian dan kontrol lalu
lintas serta penyediaan sumber daya. Untuk meninjau proses LRD beberapa definisi
diperkenalkan.
Deret waktu serupa diri memiliki properti bahwa ketika digabungkan (mengarah ke
deret waktu yang lebih pendek di mana setiap titik adalah jumlah dari beberapa titik asli),
deret baru
memiliki fungsi autokorelasi yang sama dengan aslinya. Yaitu, diberikan deret waktu
stasioner X (X; = 0, 1, 2,...), kita mendefinisikan deret m agregat (m) (a) = 1,2,3,...) dengan
menjumlahkan deret asli X = di atas balok berukuran m yang tidak tumpang tindih.
Kemudian jika X adalah self-similar, ia memiliki fungsi autokorelasi yang sama r(k) = R(2,-)
(p)] sebagai deret X() untuk semua m. T Ini berarti bahwa deret tersebut self-similar:
distribusi deret yang digabungkan adalah sama (kecuali perubahan skala) dengan aslinya.
Keuntungan utama menggunakan model pola self-similar dari deret waktu adalah
bahwa derajat kesamaan diri dari deret tersebut hanya dinyatakan oleh satu parameter.
Parameter tersebut menyatakan kecepatan fungsi autokorelasi deret peluruhan. Untuk alasan
historis, parameter yang digunakan adalah parameter Hurst H = 1-8/2. Untuk deret kemiripan
diri, 1/2 <H<1, karena H→ 1 derajat kemiripan diri meningkat. Dengan demikian, kriteria
utama untuk serangkaian kesamaan diri mengurangi pertanyaan apakah II berbeda secara
signifikan dari 1/2.
Ada banyak cara untuk menentukan varians. Kita dapat menggunakan plot varians-
waktu, berdasarkan varians yang perlahan-lahan meluruh dari deret serupa diri. Varians dari
X() diplot terhadap m pada plot log-log; garis lurus dengan kemiringan (8) lebih besar dari -1
menunjukkan kesamaan diri, dan parameter H diberikan oleh H 1-3/2. Kita bisa
menggunakan metode R/S. Plot R/S, menggunakan fakta bahwa untuk kumpulan data serupa
diri, rentang yang diskalakan ulang atau statistik R/S tumbuh sesuai dengan hukum pangkat
dengan statistik eksponen tumbuh sebagai fungsi dari banyaknya poin yang disertakan (n).
Dengan demikian plot R/S terhadap skala log-log memiliki kemiringan yang merupakan
estimasi dari H. Pendekatan terakhir, metode periodogram, menggunakan kemiringan
spektrum daya deret saat frekuensi mendekati nol. Pada plot log-log kemiringan periodogram
adalah garis lurus dengan kemiringan 8-1 1-2H mendekati titik asal. mendasarkan pada
Metode ini tidak tahan terhadap asumsi yang salah (seperti non-stasioneritas dalam
kumpulan data) dan tidak memberikan interval kepercayaan. Metode keempat, yang disebut
estimator Whittle memang memberikan interval kepercayaan, tetapi memiliki kelemahan
bahwa bentuk proses stokastik yang mendasarinya harus disediakan.
Untuk mengumpulkan data, kami menggunakan salah satu program sniffer untuk
menangkap paket - Wire shark. Program ini dapat menyimpan pergerakan dari level layer
data link [5]. Sampel lalu lintas yang diambil berisi informasi seperti lokasi file, ukurannya,
formatnya, jenis enkapsulasi dan batas ukuran paket, waktu paket pertama yang merupakan
waktu mulai prosedur pengujian dan penyelesaiannya, panjang total kerja. Selain itu,
memberikan informasi tentang jumlah dan jenis paket, Selama 24 jam jaringan yang
dianalisis mencatat 7.818.848 paket, kecepatan rata-rata adalah 90.447 paket per detik.
Statistik contoh ditunjukkan pada Gambar. 2.
Penelitian ini bertujuan untuk mengamati lalu lintas jaringan dan menentukan apakah
ada ketergantungan jangka panjang di semua waktu kerja jaringan dan interval di atas jam.
Untuk melakukan pekerjaan semua paket yang ditangkap, kami mengisolasi paket yang
memiliki dampak terbesar pada jaringan. Mereka dibagi dalam hal layanan dan protokol
menjadi lima kelompok utama:
• Web – HTTP;
• SSL;
• IPv6.
Elemen penting dari komunikasi dan pengguna bisnis adalah email. Pesan yang
dikirim bisa menggunakan traffic spam. Kami mengirim pesan teks menggunakan protokol
standar (POP3 dan SMTP) yang tidak secara signifikan mempengaruhi lalu lintas jaringan.
Namun, jika pesan berisi lampiran besar, pengiriman dan pengambilannya mungkin
berdampak signifikan pada pengoperasian seluruh jaringan. Kami menganalisis total lalu
lintas yang dihasilkan oleh karyawan perusahaan dalam waktu 24 jam (Gbr. 4b). Dengan
sampel paket lalu lintas yang dianalisis, kami memperkirakan pertukaran surat elektronik
2,52% dari total. Secara total, protokol yang bertanggung jawab atas korespondensi dikirim
hingga 878,44 MB. Peningkatan terbesar terjadi pada jam kerja lalu lintas.
Layanan ketiga yang dianalisis adalah Secure Sockets Layer (SSL). Teknologi SSL
awalnya dikembangkan oleh Netscape Communications untuk memastikan keamanan dan
privasi di sesi kompilasi Internet. Ini memasuki enkripsi aliran data. Pada tahun 1999 standar
Transport Layer Security (TLS) diterbitkan, yang menyediakan keamanan pada lapisan
transport dan memecahkan beberapa masalah SSL. Ini digunakan untuk merangkum lalu
lintas aplikasi tingkat tinggi seperti HTTP, Lightweight Directory Access Protocol (LDAP),
FTP. SMTP, POP3 dan IMAP. Ini memberikan otentikasi dan integritas melalui sertifikat dan
tanda tangan digital.
Program untuk analisis jaringan lalu lintas tidak selalu dapat mengenali semua
protokol yang ada dalam file yang diambil. Kelompok paket yang tidak dikenal tersebut
digambarkan sebagai tidak diketahui (Gbr. 4). Biasanya, data dikirim oleh program yang
protokol hak ciptanya diakui sebagai tidak diketahui. Tetapi mereka juga dapat dikirim oleh
protokol data yang dikenali, tetapi nomor port harus diubah. Dalam kasus pengujian jaringan
perusahaan, paket yang ditandai sebagai tidak diketahui adalah bagian terbesar dari lalu lintas
yaitu 51,2% dan 17,88 GB data yang dikirim dalam waktu 24 jam. Contoh grafik kepadatan
spektrum daya untuk jam yang sama ditunjukkan pada Gambar 5. .
4 Hasil investigasi
Jelas, pilihan metode dihubungkan dengan pertimbangan teoretis yang disajikan pada
Bagian 2. Biasanya sulit untuk menghitung nilai sebenarnya dari kemiringan densitas spektral
karena penggunaan metode kuadrat rata-rata terakhir yang belum tentu baik untuk plot log-
log , tetapi secara umum diterima bahwa pendekatan seperti itu dapat diambil untuk estimasi
kasar parameter H.
Gambar 5. Kepadatan spektrum daya dalam jam yang sama untuk layanan yang berbeda
Untuk menghitung kemungkinan adanya dependensi jarak jauh, data dibagi menjadi interval satu
jam. Kami memutuskan untuk membagi koleksi kami menjadi 24 subkoleksi (mereka mewakili lalu lintas
selama 1 jam) dan menghitung kemiringan densitas spektralnya. Hal ini ditunjukkan pada Gambar. 6.
Secara umum, dianggap bahwa metode ini menghitung derajat dependensi jarak jauh, terlepas dari apakah
suatu proses termasuk dalam domain tarik-menarik distribusi probabilitas Gaussian atau hukum daya.
Hasil yang diperoleh dari percobaan ini menunjukkan bahwa bertentangan dengan kepercayaan yang
ada selama ini lalu lintas dapat memiliki sifat yang sama. Seperti yang dapat dilihat (Tabel 1) seperti
properti terlihat dengan baik. Kerapatan spektral daya dapat digunakan tidak
hanya untuk proposal model analitik tetapi juga untuk mengkonfirmasi
validitas model yang diusulkan berdasarkan eksperimen.
Analisis protokol yang dipilih menunjukkan bahwa lalu lintas jaringan serupa.
Derajat self-similarity eksponen Hurst ditentukan dengan rentang 0,5 sampai 1.
Semakin pendek rata-rata panjang paket termasuk eksponen Hurst cenderung 0,5
(white noise). Nilai rata-rata eksponen Hurst untuk lalu lintas email adalah 0,799,
dengan nilai maksimum 0,976 dan minimum 0,513. Dapat dilihat bahwa
pengurangan aliran dalam jaringan (misalnya, semalam) menyebabkan fluktuasi
besar eksponen Hurst, yang cenderung ke nilai 0,5. Untuk SSL rata-rata eksponen
Hurst adalah 0,721. Di seluruh rentang lalu lintas pengujian, ia berosilasi dalam
kisaran 0,54 hingga 0,98. Analisis oleh eksponen Hurst untuk aliran paket yang
ditandai sebagai tidak diketahui menunjukkan bahwa lalu lintas ini
Tidak menunjukkan variasi yang besar. Bahkan jika terjadi fluktuasi jumlah
paket, hasilnya sangat mirip di setiap jamnya. Sifatnya serupa, dan nilai
eksponen Hurst yang diaudit berada pada kisaran 0,5 hingga 0,7. Studi
menunjukkan bahwa versi baru dari protokol Internet IPv6 sangat baik di
lingkungan LAN, bahkan dalam kasus fluktuasi besar dalam jumlah paket,
eksponen Hurst tidak banyak berubah. Analisis trafik IPv6 menyajikan nilai
perhitungan Hurst eksponen pada level 0,665 dan menunjukkan sifat self-
similar hingga derajat self-similarity pada kisaran 0,5 hingga 1..
Gambar 7. Koefisien Hurst dalam periode 24 jam untuk layanan yang dipilih.
5. Kesimpulan
Dalam makalah ini kami telah melaporkan hasil dari analisis lalu lintas jaringan
komputer menggunakan faktor kesamaan diri statistik. Hasilnya menegaskan
bahwa trafik yang dianalisis memiliki sifat self-similar hingga derajat self-
similarity dalam rentang 0,5 sampai 1. Pengukuran dan analisis menunjukkan
bahwa sifat self-similar dari trafik jaringan komputer dinyatakan dengan gerakan
Brown fraksional. atau kebisingan Gaussian fraksional dan pendekatan holistik
untuk analisis antrian memungkinkan untuk menentukan kepadatan spektral daya
yang dapat menjadi ukuran tingkat internal lalu lintas variabel tinggi di seluruh
sistem. Kita dapat mengamati bahwa burstiness hadir di banyak skala waktu.
Parameter H lebih besar ketika pemanfaatan jaringan lebih tinggi. Performa
jaringan didominasi oleh properti self-similarity dalam trafik jaringan. Beberapa
fenomena fisik yang paling signifikan dapat memberikan peningkatan yang
signifikan terhadap LRD dari perilaku pengguna, pembuatan data, organisasi dan
pengambilan, agregasi lalu lintas, kontrol jaringan, dll. Hasil pertimbangan
analitis dan eksperimen menunjukkan bahwa faktor kesamaan diri dapat berhasil.
digunakan dalam analisis lalu lintas jaringan komputer.
https://www.researchgate.net/publication/
270260264_Computer_network_traffic_analysis_with_the_use_of_statistical_self-
similarity_factor