Anda di halaman 1dari 13

Abstrak

Model kinerja jaringan komputer yang optimal memerlukan model lalu lintas yang akurat,
yang dapat menangkap karakteristik statistik dari lalu lintas yang sebenarnya. Jika model lalu
lintas tidak mewakili lalu lintas secara akurat, seseorang mungkin melebih-lebihkan atau
meremehkan kinerja jaringan. Makalah ini menyajikan konfirmasi sifat serupa diri dari
protokol yang dipilih di lapisan komunikasi jaringan komputer. Ini menunjukkan bahwa
ukuran yang baik dari kesamaan diri adalah faktor Hurst.

PENDAHULUAN

Analisis statistik pengukuran lalu lintas jaringan menunjukkan keberadaan yang jelas
dari sifat fraktal atau self-similar dalam jaringan komputer. Ini berarti bahwa pola statistik
yang serupa dapat terjadi pada skala waktu yang berbeda yang dapat bervariasi oleh banyak
urutan waktu. Karakteristik statistik lalu lintas jaringan komputer telah menarik perhatian
para ilmuwan selama bertahun-tahun, paling tidak untuk mendapatkan pemahaman yang
lebih baik tentang faktor-faktor yang mempengaruhi kinerja dan skalabilitas sistem besar
seperti Internet. Lalu lintas jaringan secara inheren tergantung pada fraktal atau jarak jauh
(LRD). Fakta itu menimbulkan pertanyaan sejauh mana hasil penelitian ini dapat diterapkan
dalam praktik. Apakah mungkin untuk mendiagnosis lalu lintas jaringan dan memberikan
risiko kemacetan? Saat ini. ada banyak bukti bahwa LRD sangat penting untuk sejumlah
masalah teknik, seperti pengukuran lalu lintas dan perilaku antrian. Proses serupa telah
diamati dan dianalisis di sejumlah bidang lain seperti.

misalnya hidrologi, ekonomi, biofisika. Fenomena self-similar merupakan proses


yang menampilkan kesamaan struktural di berbagai skala dimensi tertentu. Pengukuran
terbaru dari lalu lintas jaringan telah menunjukkan bahwa lalu lintas menunjukkan
variabilitas dalam berbagai skala. Struktur referensi berulang pada rentang skala yang luas
dari dimensi yang beragam (geometris, statistik atau temporal), dan statistik proses tidak
berubah seiring waktu. Pada kenyataannya, sistem sederhana tidak ada. Dalam kasus sistem
yang nyata dan kompleks, bertentangan dengan sistem sederhana, seseorang dapat
menunjukkan fitur proses berikut: termodinamika non-ekuilibrium, topologi heterogen,
fenomena dunia kecil, dependensi jarak jauh, lalu lintas bursty dan self-similar, distribusi
bebas skala (hukum daya), packet switching, hierarki struktur, perkolasi, pengelompokan,
pengorganisasian mandiri, degradasi parameter dan keruntuhan.

Karakteristik statistik sistem teleinformatika banyak berubah ketika perilaku manusia


digantikan oleh sistem yang hierarkis dan kompleks, yang disebut komputer. Di sisi lain,
trafik suara cukup statis dan variabelnya rendah (short-range dependent) tetapi sekarang
trafik data jauh lebih bervariasi dengan panggilan yang sangat pendek dan sangat panjang
(self-similar dan long-range dependen). Dengan demikian, dapat diperhatikan bahwa baik
perilaku manusia "bentuk murni" asli dan sifat lalu lintas "murni" asli (aliran sederhana)
hilang ketika lapisan tumpukan yang lebih tinggi (bersarang) ditambahkan secara berurutan
dan sistem komputer sederhana menjadi kompleks. sistem yang memiliki sifat fraktal. Sudah
diketahui bahwa nesting menyangkut semua bidang teknik komputer (jaringan, perangkat
keras komputer, sistem operasi, bahasa pemrograman dan sistem antrian juga) dan tak
terhindarkan mengarah pada proses ketergantungan jangka panjang dari proses
ketergantungan jangka pendek. Ini terutama diintensifkan dalam sistem skala besar yang
kompleks, yaitu sistem terdistribusi, jaringan komputer. Fitur positif dari sistem yaitu:
heterogenitas, keterbukaan, keamanan, skalabilitas, penanganan kegagalan, konkurensi dan
transparansi dipahami oleh fitur sistem kompleks negatif seperti degradasi dan keruntuhan

2 Faktor statistik kesamaan diri

Kesamaan diri dan fraktal adalah gagasan yang dipelopori oleh Benoit B. Mandelbrot.
Kesamaan diri dapat dikaitkan dengan "fraktal", yang merupakan objek dengan penampilan
yang tidak berubah pada skala yang berbeda. Dalam kasus fraktal statistik, ini adalah
kepadatan probabilitas yang berulang pada setiap skala. Di sisi lain, fraktal dinamis
dihasilkan oleh sistem dinamis berdimensi rendah dengan solusi kacau. Penelitian yang
terkait dengan traffic self-similarity dapat diklasifikasikan ke dalam empat kategori:
pemodelan lalu lintas berbasis pengukuran, pemodelan fisik, analisis antrian dan kontrol lalu
lintas serta penyediaan sumber daya. Untuk meninjau proses LRD beberapa definisi
diperkenalkan.

Deret waktu serupa diri memiliki properti bahwa ketika digabungkan (mengarah ke
deret waktu yang lebih pendek di mana setiap titik adalah jumlah dari beberapa titik asli),
deret baru

memiliki fungsi autokorelasi yang sama dengan aslinya. Yaitu, diberikan deret waktu
stasioner X (X; = 0, 1, 2,...), kita mendefinisikan deret m agregat (m) (a) = 1,2,3,...) dengan
menjumlahkan deret asli X = di atas balok berukuran m yang tidak tumpang tindih.
Kemudian jika X adalah self-similar, ia memiliki fungsi autokorelasi yang sama r(k) = R(2,-)
(p)] sebagai deret X() untuk semua m. T Ini berarti bahwa deret tersebut self-similar:
distribusi deret yang digabungkan adalah sama (kecuali perubahan skala) dengan aslinya.

Sebuah proses dengan ketergantungan jangka panjang memiliki fungsi autokorelasi


r(k) k sebagai k dimana 0 << 1. Jadi fungsi autokorelasi dari proses tersebut meluruh secara
hiperbolik (dibandingkan dengan peluruhan eksponensial yang ditunjukkan oleh model lalu
lintas tradisional). Peluruhan hiperbolik jauh lebih lambat daripada peluruhan eksponensial,
dan karena $< 1, jumlah nilai autokorelasi petak dari deret semacam itu mendekati tak
terhingga. Ini memiliki sejumlah implikasi. Pertama, varians n sampel dari deret seperti itu
tidak berkurang sebagai fungsi n (seperti yang diprediksi oleh statistik dasar untuk kumpulan
data yang tidak berkorelasi) melainkan oleh nilai n. Kedua, spektrum daya dari deret
semacam itu adalah hiperbolik, naik hingga tak terhingga pada frekuensi nol yang
mencerminkan pengaruh "tak terbatas" dari ketergantungan jarak jauh dalam data.

Keuntungan utama menggunakan model pola self-similar dari deret waktu adalah
bahwa derajat kesamaan diri dari deret tersebut hanya dinyatakan oleh satu parameter.
Parameter tersebut menyatakan kecepatan fungsi autokorelasi deret peluruhan. Untuk alasan
historis, parameter yang digunakan adalah parameter Hurst H = 1-8/2. Untuk deret kemiripan
diri, 1/2 <H<1, karena H→ 1 derajat kemiripan diri meningkat. Dengan demikian, kriteria
utama untuk serangkaian kesamaan diri mengurangi pertanyaan apakah II berbeda secara
signifikan dari 1/2.
Ada banyak cara untuk menentukan varians. Kita dapat menggunakan plot varians-
waktu, berdasarkan varians yang perlahan-lahan meluruh dari deret serupa diri. Varians dari
X() diplot terhadap m pada plot log-log; garis lurus dengan kemiringan (8) lebih besar dari -1
menunjukkan kesamaan diri, dan parameter H diberikan oleh H 1-3/2. Kita bisa
menggunakan metode R/S. Plot R/S, menggunakan fakta bahwa untuk kumpulan data serupa
diri, rentang yang diskalakan ulang atau statistik R/S tumbuh sesuai dengan hukum pangkat
dengan statistik eksponen tumbuh sebagai fungsi dari banyaknya poin yang disertakan (n).
Dengan demikian plot R/S terhadap skala log-log memiliki kemiringan yang merupakan
estimasi dari H. Pendekatan terakhir, metode periodogram, menggunakan kemiringan
spektrum daya deret saat frekuensi mendekati nol. Pada plot log-log kemiringan periodogram
adalah garis lurus dengan kemiringan 8-1 1-2H mendekati titik asal. mendasarkan pada

Metode ini tidak tahan terhadap asumsi yang salah (seperti non-stasioneritas dalam
kumpulan data) dan tidak memberikan interval kepercayaan. Metode keempat, yang disebut
estimator Whittle memang memberikan interval kepercayaan, tetapi memiliki kelemahan
bahwa bentuk proses stokastik yang mendasarinya harus disediakan.

3 Arsitektur jaringan dan subjek analisis


Dalam penelitian kami, kami menggunakan data yang dikumpulkan dalam jaringan
komputer pribadi (perusahaan kecil). Data yang dikumpulkan merupakan hasil dari
pengoperasian program secara normal antara jam 10 pagi hingga 10 pagi keesokan harinya.
Perusahaan memiliki waktu kerja delapan jam dalam dua interval setiap jam dari pukul 7:00
hingga 15:00 dan dari pukul 8:00 hingga 16:00. Ada kemungkinan bahwa karyawan tetap
tinggal setelah jam kerja biasa. Pada malam hari, semua komputer harus dimatikan, tetapi ini
tidak sepenuhnya dipatuhi. Jaringan menggunakan 19 komputer dan perangkat jaringan.
Topologi jaringan yang dianalisis ditunjukkan pada Gambar 1.

Gambar 1. Model arsitektur jaringan yang dianalisis.

Untuk mengumpulkan data, kami menggunakan salah satu program sniffer untuk
menangkap paket - Wire shark. Program ini dapat menyimpan pergerakan dari level layer
data link [5]. Sampel lalu lintas yang diambil berisi informasi seperti lokasi file, ukurannya,
formatnya, jenis enkapsulasi dan batas ukuran paket, waktu paket pertama yang merupakan
waktu mulai prosedur pengujian dan penyelesaiannya, panjang total kerja. Selain itu,
memberikan informasi tentang jumlah dan jenis paket, Selama 24 jam jaringan yang
dianalisis mencatat 7.818.848 paket, kecepatan rata-rata adalah 90.447 paket per detik.
Statistik contoh ditunjukkan pada Gambar. 2.
Penelitian ini bertujuan untuk mengamati lalu lintas jaringan dan menentukan apakah
ada ketergantungan jangka panjang di semua waktu kerja jaringan dan interval di atas jam.
Untuk melakukan pekerjaan semua paket yang ditangkap, kami mengisolasi paket yang
memiliki dampak terbesar pada jaringan. Mereka dibagi dalam hal layanan dan protokol
menjadi lima kelompok utama:

Gambar 2. Contoh statistik panjang paket dalam data yang dikumpulkan

• Web – HTTP;

• E-mail – POP3,IMAP, SMTP;

• SSL;

• Unknown – IPSec, DG Gryphon;

• IPv6.

Gambar 3. Periode 24 jam traffic jaringan yang dianalisis


Untuk setiap kelompok jumlah paket, total panjang paket dan rata-rata panjang paket
dalam interval per jam dihitung. Ada juga paket ukuran terbesar dan terkecil. Langkah
selanjutnya adalah menghitung faktor Hurst dengan estimasi sebelumnya menggunakan
metode Benoit dan Power Spectrum. Kami belajar menggunakan protokol HTTP. HTTP
adalah yang paling umum digunakan protokol yang mendukung Internet. Data hanya
digunakan dengan TCP dan konfigurasi default menggunakan port 80. Setiap objek.
(misalnya situs web, video, audio) yang diunduh dari server Web dikirim melalui satu sesi.

Elemen penting dari komunikasi dan pengguna bisnis adalah email. Pesan yang
dikirim bisa menggunakan traffic spam. Kami mengirim pesan teks menggunakan protokol
standar (POP3 dan SMTP) yang tidak secara signifikan mempengaruhi lalu lintas jaringan.
Namun, jika pesan berisi lampiran besar, pengiriman dan pengambilannya mungkin
berdampak signifikan pada pengoperasian seluruh jaringan. Kami menganalisis total lalu
lintas yang dihasilkan oleh karyawan perusahaan dalam waktu 24 jam (Gbr. 4b). Dengan
sampel paket lalu lintas yang dianalisis, kami memperkirakan pertukaran surat elektronik
2,52% dari total. Secara total, protokol yang bertanggung jawab atas korespondensi dikirim
hingga 878,44 MB. Peningkatan terbesar terjadi pada jam kerja lalu lintas.

Layanan ketiga yang dianalisis adalah Secure Sockets Layer (SSL). Teknologi SSL
awalnya dikembangkan oleh Netscape Communications untuk memastikan keamanan dan
privasi di sesi kompilasi Internet. Ini memasuki enkripsi aliran data. Pada tahun 1999 standar
Transport Layer Security (TLS) diterbitkan, yang menyediakan keamanan pada lapisan
transport dan memecahkan beberapa masalah SSL. Ini digunakan untuk merangkum lalu
lintas aplikasi tingkat tinggi seperti HTTP, Lightweight Directory Access Protocol (LDAP),
FTP. SMTP, POP3 dan IMAP. Ini memberikan otentikasi dan integritas melalui sertifikat dan
tanda tangan digital.

Program untuk analisis jaringan lalu lintas tidak selalu dapat mengenali semua
protokol yang ada dalam file yang diambil. Kelompok paket yang tidak dikenal tersebut
digambarkan sebagai tidak diketahui (Gbr. 4). Biasanya, data dikirim oleh program yang
protokol hak ciptanya diakui sebagai tidak diketahui. Tetapi mereka juga dapat dikirim oleh
protokol data yang dikenali, tetapi nomor port harus diubah. Dalam kasus pengujian jaringan
perusahaan, paket yang ditandai sebagai tidak diketahui adalah bagian terbesar dari lalu lintas
yaitu 51,2% dan 17,88 GB data yang dikirim dalam waktu 24 jam. Contoh grafik kepadatan
spektrum daya untuk jam yang sama ditunjukkan pada Gambar 5. .

4 Hasil investigasi

Jelas, pilihan metode dihubungkan dengan pertimbangan teoretis yang disajikan pada
Bagian 2. Biasanya sulit untuk menghitung nilai sebenarnya dari kemiringan densitas spektral
karena penggunaan metode kuadrat rata-rata terakhir yang belum tentu baik untuk plot log-
log , tetapi secara umum diterima bahwa pendekatan seperti itu dapat diambil untuk estimasi
kasar parameter H.

Gambar 4. Traffic jaringan dalam periode 24 jam.

Gambar 5. Kepadatan spektrum daya dalam jam yang sama untuk layanan yang berbeda
Untuk menghitung kemungkinan adanya dependensi jarak jauh, data dibagi menjadi interval satu
jam. Kami memutuskan untuk membagi koleksi kami menjadi 24 subkoleksi (mereka mewakili lalu lintas
selama 1 jam) dan menghitung kemiringan densitas spektralnya. Hal ini ditunjukkan pada Gambar. 6.
Secara umum, dianggap bahwa metode ini menghitung derajat dependensi jarak jauh, terlepas dari apakah
suatu proses termasuk dalam domain tarik-menarik distribusi probabilitas Gaussian atau hukum daya.

Hasil yang diperoleh dari percobaan ini menunjukkan bahwa bertentangan dengan kepercayaan yang
ada selama ini lalu lintas dapat memiliki sifat yang sama. Seperti yang dapat dilihat (Tabel 1) seperti

properti terlihat dengan baik. Kerapatan spektral daya dapat digunakan tidak
hanya untuk proposal model analitik tetapi juga untuk mengkonfirmasi
validitas model yang diusulkan berdasarkan eksperimen.

Analisis protokol yang dipilih menunjukkan bahwa lalu lintas jaringan serupa.
Derajat self-similarity eksponen Hurst ditentukan dengan rentang 0,5 sampai 1.
Semakin pendek rata-rata panjang paket termasuk eksponen Hurst cenderung 0,5
(white noise). Nilai rata-rata eksponen Hurst untuk lalu lintas email adalah 0,799,
dengan nilai maksimum 0,976 dan minimum 0,513. Dapat dilihat bahwa
pengurangan aliran dalam jaringan (misalnya, semalam) menyebabkan fluktuasi
besar eksponen Hurst, yang cenderung ke nilai 0,5. Untuk SSL rata-rata eksponen
Hurst adalah 0,721. Di seluruh rentang lalu lintas pengujian, ia berosilasi dalam
kisaran 0,54 hingga 0,98. Analisis oleh eksponen Hurst untuk aliran paket yang
ditandai sebagai tidak diketahui menunjukkan bahwa lalu lintas ini

Gambar 6. Kerapatan spektral daya untuk interval 24 jam.

Tidak menunjukkan variasi yang besar. Bahkan jika terjadi fluktuasi jumlah
paket, hasilnya sangat mirip di setiap jamnya. Sifatnya serupa, dan nilai
eksponen Hurst yang diaudit berada pada kisaran 0,5 hingga 0,7. Studi
menunjukkan bahwa versi baru dari protokol Internet IPv6 sangat baik di
lingkungan LAN, bahkan dalam kasus fluktuasi besar dalam jumlah paket,
eksponen Hurst tidak banyak berubah. Analisis trafik IPv6 menyajikan nilai
perhitungan Hurst eksponen pada level 0,665 dan menunjukkan sifat self-
similar hingga derajat self-similarity pada kisaran 0,5 hingga 1..

Hasil yang menarik disediakan oleh ketergantungan dari faktor Hurst


panjang paket rata-rata. Analisis lalu lintas untuk protokol tertentu
menunjukkan bahwa nilai eksponen Hurst mengambil nilai antara 0,5 dan 1,0,
yang menegaskan sifat mirip diri dari protokol yang dianalisis. Tingkat
kesamaan diri tergantung pada volume lalu lintas dan jenis layanan. Dalam
kasus lalu lintas kecil yang mendekati nilai eksponen sama dengan 0,5 (white
noise), ditandai dengan keacakan lengkap dan kurangnya korelasi antar paket.
Perubahan koefisien Hurst pada rentang 24 jam ditunjukkan pada Gambar 7.
Tabel 1. Ringkasan nilai faktor Hurst untuk layananyang berbeda

Gambar 7. Koefisien Hurst dalam periode 24 jam untuk layanan yang dipilih.
5. Kesimpulan

Dalam makalah ini kami telah melaporkan hasil dari analisis lalu lintas jaringan
komputer menggunakan faktor kesamaan diri statistik. Hasilnya menegaskan
bahwa trafik yang dianalisis memiliki sifat self-similar hingga derajat self-
similarity dalam rentang 0,5 sampai 1. Pengukuran dan analisis menunjukkan
bahwa sifat self-similar dari trafik jaringan komputer dinyatakan dengan gerakan
Brown fraksional. atau kebisingan Gaussian fraksional dan pendekatan holistik
untuk analisis antrian memungkinkan untuk menentukan kepadatan spektral daya
yang dapat menjadi ukuran tingkat internal lalu lintas variabel tinggi di seluruh
sistem. Kita dapat mengamati bahwa burstiness hadir di banyak skala waktu.
Parameter H lebih besar ketika pemanfaatan jaringan lebih tinggi. Performa
jaringan didominasi oleh properti self-similarity dalam trafik jaringan. Beberapa
fenomena fisik yang paling signifikan dapat memberikan peningkatan yang
signifikan terhadap LRD dari perilaku pengguna, pembuatan data, organisasi dan
pengambilan, agregasi lalu lintas, kontrol jaringan, dll. Hasil pertimbangan
analitis dan eksperimen menunjukkan bahwa faktor kesamaan diri dapat berhasil.
digunakan dalam analisis lalu lintas jaringan komputer.

Penelitian dilakukan pada peralatan yang dibeli dalam proyek No


POPW.01.03.00-18 012/09 dari Dana Struktural, Program Operasional
Pengembangan Polandia Timur yang dibiayai bersama oleh Uni Eropa, Dana
Pembangunan Regional Eropa.
DAFTAR PUSTAKA

https://www.researchgate.net/publication/
270260264_Computer_network_traffic_analysis_with_the_use_of_statistical_self-
similarity_factor

Anda mungkin juga menyukai