Anda di halaman 1dari 10

Teori dan Pengaplikasian Teori Graf Dalam World Wide Web (WWW)

Dimas Fajar Naufal

Program Studi Informatika, Fakultas Teknik, Universitas Muhammadiyah Sidoarjo


E-mail : dimasfajarnaufal@gmail.com

ABSTRAK

World Wide Web adalah kumpulan halaman web yang saling terhubung menggunakan
hyperlink. Struktur relasi antar halaman web yang terdapat dalam World Wide Web dapat
dimodelkan menjadi sebuah graf berarah , dengan halaman web sebagai simpul dan
hyperlink sebagai sisi. Karena sifat World Wide Web yang berukuran besar, tidak memiliki
pusat , dan dapat berubah sescara dinamis , graf ini memiliki beberapa karakteristik unik.
Pengkajian mengenai karakteristik graf ini bermanfaat untuk menentukan algoritma
crawling, searching & ranking.
Ketiga algoritma ini digunakan pada mesin pencari. Makalah ini akan membahas
beberapa teori untuk memodelkan graf World Wide Web dan analisis struktur graf World
Wide Web berdasarkan data empiris.

Kata Kunci — Web Graph, Erdos-Renyi Random Graph, Small World Network , Scale Free
Network Crawler , World Wide Web.

45
Pada identifikasi masalah di atas telah
BAB 1 PENDAHULUAN
dikemukakan beberapa permasalahan dan saya
A. LATAR BELAKANG selaku penulis serta penyusun makalah ini akan
Teori graf merupakan salah satu cabang membatasi masalah yang akan saya paparkan
dari ilmu matematika yang pertama kali
diperkenalkan oleh seorang matematikawan adalah implemntasi graf dalam WWW(World
Swiss yang bernama Leonhard Euler pada Wide Web). Agar sesuai dengan tugas yang di
tahun 1736. Banyaknya jembatan yang
berikan oleh dosen pengampu. Tentang aplikasi
menghubungkan antar wilayah di Konigsberg
melahirkan pemikiran mungkin tidaknya graf dalam kehidupan sehari-hari.
melewati ketujuh jembatan yang
menghubungkan keempat kota tersebut D. RUMUSAN MASALAH
masing-masing tepat satu kali dan kembali ke
tempat semula. Adapun beberapa rumusan masalah yang akan
Permasalahan jembatan Konigsberg saya bahas seperti :
direpresentasikan oleh Euler dengan - Apa yang dimaksud dengan World Wide
memisalkan daratan yang ada dengan titik Web(WWW) dan Graf?
(vertex) dan jembatan-jembatan yang - Bagaimana memodelkan graf dalam World
menghubungkan daratan tersebut dengan
garis (edge). Kemudian Euler menyimpulkan Wide Web(WWW)?
bahwa tidak mungkin dapat melalui ketujuh - Algoritma apakah saja yang dipakai World
jembatan yang ada tepat satu kali dikarenakan Wide Web(WWW)?
derajat (banyaknya garis yang menempel - Bagaimana Struktur Graf Dalam World
pada suatu titik) titiknya adalah ganjil. Kisah
Wide Web(WWW) berdasarkan data empiris?
Jembatan Konigsberg inilah yang
melatarbelakangi sejarah lahirnya Teori Graf.
Penyelesaian masalah yang dilakukan E. TUJUAN PENELITIAN
oleh Euler memperlihatkan bahwa teori graf - Manfaat Teoritis
bermanfaat dalam kehidupan sehari-hari. a. Hasil penelitian ini diharapkan
Contoh terapan lain dari teori graf 2 adalah
dapat memberikan manfaat bagi
jaringan internet, peta rangkaian listrik,
meminimumkan biaya dengan memilih rute pengembangan ilmu, khususnya bagi
terpendek, dan sebagainya. perkembangan informatika.
Dalam istilah internet kita mengenal
World Wide Web atau disingkat WWW, - Manfaat Praktis
WWW ini sering kita pakai ketika kita
mencari informasi didunia internet. a. Mendapatkan informasi penting
Dalam teori graf bisa di implementasikan tentang pengaplikasian graf terhadap
dalam berbagai bidang tidak terkecuali WWW.
dengan WWW. b. Menambah wawasan dalam
Maka jurnal ini membahas representasi perkembangan informatika.
graf dalam WWW.

BAB II PEMBAHASAN
World Wide Web merupakan sebuah
sistem informasi global yang terdiri dari
B. IDENTIVIKASI MASALAH
halaman web yang memiliki alamat
Merujuk pada paparan latar belakang di atas, (Uniform Resource Locator) , dan memiliki
identifikasi masalah yang dapat ditarik kedalam keterkaitan degan halaman web yang lain
makalah ini adalah tidak jauh-jauh dari ruang menggunakan hyperlink. Halaman web ini
lingkup yang sudah dibahas pada latar belakang dapat diakses menggunakan internet. World
dan tentu saja hubungannya dengan graf. Wide Web diciptakan oleh Tim Berners-Lee
dan peneliti lainnya di laboratorium energi
tinggi CERN Geneva pada tahun 1989. Pada
C. BATASAN MASALAH
awalnya, WWW berfungsi sebagai sarana
berbagi informasi antar peneliti di
laboratorium tersebut. Sekarang, WWW
telah berkembang menjadi repositori
informasi global & sebuah media
komunikasi baru. World Wide Web
menyediakan ruang bagi kita untuk berbagi
informasi secara global.

World Wide Web memiliki karakteristik


yang unik , diantaranya adalah sifatnya yang
terdesentralisasi, tidak memiliki pusat, dan
Gambar 1. Representasi World Wide Web sebagai sebuah
perkembangannya yang cepat. Berbeda graf. Simpul pada graf merepresentasikan sebuah simpul,
dengan beberapa jaringan lainnya (seperti sementara sisi pada graf merepresentasikan hyperlink pada
halaman web. Citra ini dihasilkan oleh program Internet
jaringan listrik , telepon & jalan) , World Cartographer.
Sumber gambar :
Wide Web tidak memiliki struktur yang http://www.visualcomplexity.com/vc/project.cfm?id=16#
terencana oleh sistem. Jaringan hyperlink Diakses 7 Desember 2015
yang terbentuk antar halaman web Struktur graf pada World Wide Web
merupakan kumpulan aksi yang tidak pertama kali dimodelkan menggunakan teori
terkoordinasi dari individuindividu graf. Meskipun demikian, beberapa penelitian
pengguna World Wide Web. Sistem yang mencoba untuk mengungkap struktur graf
terdesentralisasi ini merupakan keunggulan World Wide Web yang sesungguhnya dengan
yang dimiliki oleh World Wide Web. Berkat menjelajahi World Wide Web menggunakan
sistem ini, pengguna dapat menambahkan crawler.
informasi baru ke dalam World Wide Web
secara mudah. Hal ini memungkinkan
Hasil penelitian ini menunjukkan bahwa secara
penyebaran informasi yang cepat.
Meskipun demikian, keunggulan- makroskopis , struktur graf pada World Wide
keunggulan World Wide Web ini juga Web memiliki karakteristik yang unik.
menimbulkan permasalahan baru. Akibat
struktrurnya yang besar dan terus berubah, II. TERMINOLOGI MENGENAI GRAF
proses pencarian informasi juga semakin Berikut adalah beberapa terminologi
sulit. Oleh karena itu, diperlukan sebuah mengenai graf yang digunakan pada makalah
strategi untuk melakukan pencarian di ini. Sebuah graf berarah didefinisikan sebagai
dalam World Wide Web. Strategi ini dapat pasangan yang terdiri dari himpunan simpul V
dikembangkan setelah kita mengetahui yang tidak kosong dan himpunan sisi E. Sebuah
bagaimana struktur relasi yang graf yang tidak memiliki sisi disebut dengan
menghubungkan antar halaman web. graf kosong. Sementara itu , sebuah graf yang
Struktur relasi pada World Wide Web memiliki sisi ke semua simpul lainnya disebut
dapat dimodelkan sebagai sebuah graf dengan graf lengkap.
berarah,.Graf World Wide Web dapat
dinyatakan G = (V,E) ,dimana V adalah Sisi E didefinisikan sebagai pasangan
himpunan tidak kosong dari halaman web simpul (v1,v2) , dimana v1 disebut dengan simpul
( V = v1,v2,v3,.). & E adalah himpunan awal, dan v2 disebut dengan simpul akhir.
pasangan (v1,v2) yang menunjukkan bahwa Derajat masuk v (indegree) didefinisikan
ada hyperlink dari halaman web a ke sebagai jumlah sisi (v1,v) ... (vn,v) (jumlah sisi
halaman web b. yang masuk ke simpul v) , sementara itu derajat
keluar v (outdegree) didefinisikan sebagai
jumlah sisi (v, v1) ... (v,vn) (jumlah sisi yang
keluar dari simpul v).

Simpul u & v disebut terhubung kuat


apabila ada sisi yang menghubungkan dari u ke
v dan juga sebaliknya (dari v ke u). Sementara
itu, simpul u & v disebut terhubung lemah
apabila u & v terhubung pada graf tidak
berarahnya , namun tidak terhubung kuat.

Sebuah lintasan u ke v adalah rangkaian


sisi yang menghubungkan dari u ke v ,
sementara itu panjang lintasan adalah jumlah
sisi dalam lintasan itu. Sebagai contoh, apabila
(u,v) adalah sebuah sisi , maka panjang Gambar 2. Graf pada bagian kiri adalah graf
lintasan u ke v adalah 1. acak Erdos-Renyi dengan n = 5 , p = 0,3 .
Sementara itu, graf pada bagian kanan adalah
Sementara itu, diameter graf graf acak Erdos-Renyi dengan n = 5 , p = 0,6.
didefinisikan sebagai nilai tertinggi dari Perhatikan bahwa peningkatan nilai
seluruh lintasan terpendek (u,v) pada seluruh probabilitas pembentukan sisi p akan
pasangan simpul (u,v). Diameter graf juga mengakibatkan meningkatnya jumlah sisi pada
dapat dipandang sebagai panjang lintasan antar graf
duasimpul yang terjauh. Namun, model graf ini tidak cukup
untuk memodelkan graf world wide web
III. PERMODELAN GRAF WORLD WIDE secara keseluruhan. Pada model graf ini,
WEB jumlah simpul selalu tetap (n buah simpul).
Sementara itu, pada world wide web , jumlah
simpul (halaman web) dapat bertambah dan
A. Model Graf Acak (Random Graph) Erdos-
berkurang.
Renyi
Selain itu , pada model ini, nilai
Relasi yang terbentuk antar halaman – probabilitas pembentukan sisi pada setiap
halaman web merupakan murni keputusan pasang simpul selalu seragam. Pada
individual pengguna world wide web , bukan kenyataannya, dalam world wide web ,
keputusan sistem internal dari world wide web. probabilitas ini bernilai acak & tidak seragam.
Oleh karena itu , kemunculan hyperlink & Model graf ini juga hanya dapat
halaman web baru yang ada di dalam world memodelkan keadaan world wide web secara
wide web tidak dapat diprediksi. Atas statis. Model graf ini tidak dapat
pertimbangan itu, graf world wide web menggambarkan keadaan world wide web
dimodelkan sebagai graf acak (Random yang berubah. Pada kenyataannya, halaman
Graph). web dan hyperlink pada world wide web dapat
bertambah & berkurang. Oleh karena itu,
Erdos & Renyi merupakan orang yang dibutuhkan model graf yang lain untuk
pertama kali mengemukakan model graf acak. memodelkan graf World Wide Web ini. Selain
Graf ini dimulai dengan graf kosong dengan n itu, dibutuhkan data empiris mengenai struktur
buah simpul. Setiap pasang simpul graf World Wide Web yang sebenarnya untuk
dihubungkan oleh sebuah sisi dengan menyusun sebuah model graf yang akurat.
probabilitas p. Nilai p ini disebut juga nilai
probabilitas pembentukan sisi. Sebuah graf B. Model Graf Small World Network
disebut dengan graf acak Erdos-Renyi apabila (Watts-Strogats)
nilai p-nya tidak terlalu dekat dengan 0 atau 1.
Ketika p mendekati 1 , graf ini cenderung
membentuk sebuah graf lengkap. Namun, Fenomena “Dunia Sempit” ( Small
ketika probabilitas p mendekati 0 , graf ini World Phenomenon) adalah sebuah fenomena
cenderung tetap menjadi graf kosong. Jumlah yang berasal dari kajian jejaring sosial , bahwa
sisi yang terbentuk pada probabilitas p tiap orang di dunia mempunyai keterkaitan
dekat dengan orang lain berdasarkan kesamaan
kenalannya. Kata Small World-“Dunia itu
sempit” berasal dari kata yang biasa kita
ungkapkan ketika kita bertemu dengan orang
asing, dan ternyata orang asing tersebut
memiliki kenalan dengan salah satu teman
kita.
Secara formal , Small World Network rata-rata dari sebuah simpul v ke seluruh
adalah sebuah graf yang mayoritas simpulnya simpul lainnya.
tidak saling bertetangga satu sama lain, namun
setiap pasangan simpulnya memiliki panjang
lintasan yang pendek. Pada graf ini, panjang Setelah panjang lintasan rata-rata dari
lintasan antar dua buah simpul sembarang (L)
seluruh simpul , hitung median dari
berbanding lurus dengan logaritma dari jumlah
seluruh dv , nilai median ini adalah
simpul pada graf (n).
characteristic path length. Secara sederhana ,
characteristc path length adalah panjang
Berbagai macam jaringan yang terdapat
lintasan rata rata untuk mencapai sembarang
di alam dapat dimodelkan menggunakan graf pasangan simpul pada suatu graf.
ini , seperti jaringan syaraf pada cacing
C.elegans , jaringan kabel transmisi listrik , Sementara itu clustering coefficient (C)
graf kolaborasi peneliti , dan graf pada jejaring adalah ukuran seberapa besar kecenderungan
sosial. sebuah simpul untuk membentuk kelompok.
Pada model graf ini, sekumpulan simpul Nilai C adalah perbandingan jumlah sisi yang
cenderung untuk membentuk kelompok- terbentuk antar tetangga simpul n dengan
kelompok (cluster) yang saling terhubung satu jumlah sisi maksimum yang terbentuk antar
sama lain. Model graf ini cocok untuk tetangga simpul n. Sebagai contoh , lihat
memodelkan world wide web, karena ilustrasi di bawah ini.
sekumpulan halaman web yang saling
berkaitan cenderung membentuk sebuah
kelompok halaman web yang disebut dengan
website.
Selain itu, salah satu alasan pemilihan
model graf small world network sebagai model
graf world wide web adalah bukti eksperimen
yang dilakukan oleh Albert, Jeong & Barabasi
pada tahun 1999. Berdasarkan penelitian yang
mereka lakukan, diameter graf world wide web Gambar 3. Ilustrasi local clustering
dapat ditentukan dengan persamaan coefficient pada simpul berwarna biru
dimana d adalah nilai Sumbergambar:https://en.wikipedia.org/wik
maksimal panjang lintasan antar dua buah i/Clustering_coefficient Diakses 8
simpul sembarang , dan n adalah jumlah Desember 2015
simpul pada graf. Berdasarkan persamaan Pada gambar pertama (terkiri) , nilai C
tersebut , terlihat bahwa nilai d berbanding adalah satu. Jumlah maksimal sisi yang
lurus dengan log(n). Hal ini mengindikasikan terbentuk antar tetangga simpul biru adalah 3 ,
sifat “ Small World Network” yang dimiliki sementara jumlah sisi sebenarnya yang
oleh graf World Wide Web. terbentu antar tetangga simpul biru adalah 3 .
Jadi C 3 / 3 = 1. Sementara itu, pada gambar
Berdasarkan persamaan di atas, dengan kedua (tengah), nilai C adalah 1/3 . Jumlah
memasukkan nilai estimasi jumlah halaman maksimal sisi yang terbentuk antar tetangga
web yang ada di World Wide Web (N = 8 x 108) simpul biru adalah 3 , sementara jumlah sisi
, maka d adalah 18,59. Jadi, berdasarkan teori sebenarnya yang terbentuk adalah 1. Jadi nilai
ini , kita bisa menjelajahi World Wide Web C adalah 1/3. Nilai C ini adalah local
cukup dengan maksimal 19 klik pada clustering coefficient untuk simpul berwarna
hyperlink. biru. Untuk mendapatkan nilai C untuk
Terdapat dua karakteristik yang terdapat di keseluruhan graf, dapat dihitung dengan
dalam model graf Small World Network , yaitu merata-ratakan seluruh nilai C pada setiap
characteristic path length (L) dan clustering simpul.
coefficient (C).

Characteristic path length adalah ukuran


seberapa jauh dua buah simpul terpisah. Untuk
menghitungnya, pertama hitung jarak lintasan
Berdasarkan kedua karakteristik ini, dengan berbagai probabilitas p. Saat nilai
Adamic [4] telah membuktikan sifat Small probabillitas p = 0 , graf masih berupa graf
World Network dari graf World Wide Web teratur. Saat nilai p = 0.25 , terdapat m = 0.25
berdasarkan definisi dari Watts & Strogatz . x 6 x 4 / 2 = 3 buah sisi yang dipindahkan
Watts & Strogatz mendefinisikan sifat-sifat secara acak. Saat nilai p = 0.5 , terdapat 6 buah
dari graf Small World Network sebagai sisi yang dipindahkan secara acak. Ketika nilai
berikut. 1. Nilai clustering coefficient (C) pada p mendekati 1 , graf ini akan cenderung
Small World Network lebih besar daripada membentuk graf acak Erdos-Renyi .
graf acak Erdos Renyi (Erdos Renyi Random Permodelan graf World Wide Web
Graph) dengan jumlah simpul yang sama. 2. menggunakan “Small World Network” lebih
Nilai characteristic path length (L) pada Small baik daripada permodelan menggunakan graf
acak Erdos Renyi karena permodelan ini telah
World Network kurang lebih sama kecilnya
didukung menggunakan bukti data empiris.
dengan L pada graf acak Erdos Renyi (Erdos
Meskipun demikian , model graf ini masih
Renyi Random Graph) dengan jumlah simpul
belum dapat menjelaskan sifat dinamis dari
yang sama. Adamic melakukan penelitian
world wide web. Model ini tidak
dengan menggunakan data uji sekitar 50 juta menjelaskanproses penghapusan/penciptaan
halaman web dan 269.794 website. Data ini halaman web & hyperlink baru. Jumlah simpul
dikumpulkan menggunakan crawler Alexa . dan sisi pada model ini selalu tetap.
Dengan menganalisis graf dengan website
berdomain .edu , dia menemukan bahwa nilai C. Model Graf “Scale Free Networks”
L graf .edu adalah 4,062 , sementara itu nilai L (Barabasi, Albert)
graf acak Erdos-Renyi adalah 4,048. Nilai C Seperti yang telah dijelaskan, beberapa
pada graf .edu adalah 0.156 , sementara itu model graf sebelumnya masih belum
nilai C pada graf acak Erdos-Renyi adalah mencukupi untuk memodelkan graf World
0.0012 . Berdasarkan hasil penelitian tersebut, Wide Web. Pada model ER (Erdos-Renyi
dapat disimpulkan bahwa graf world wide web Random Graph Model) , sisi-sisi diletakkan
memiliki karakteristik Small World Network , secara acak , pada model SW (Watts-Strogatz
sesuai dengan definisi yang ditetapkan oleh Small World Network) , sisi-sisi hanya
Watts & Strogatz. dipindahkan dari graf teratur.Kedua model graf
ini tidak menggambarkan graf di dunia nyata,
Watts & Strogatz menjelaskan mengenai yang memungkinkan penambahan /
prosedur pembentukan graf Small World pengurangan simpul baru.
Network yang disebut dengan Random Selain itu, pada model ER & SW ,
Rewiring Procedure. Pertama , buat graf probabilitas pasangan simpul membentuk
dengan n simpul , setiap simpul terhubung sebuah sisi (p) diasumsikan sama dan seragam.
dengan d buah simpul yang terdekat. Jumlah Kenyataan di dunia nyata tidak demikian.
sisi yang terbentuk pada graf ini adalah m = n Sebuah simpul baru cenderung membentuk sisi
x d / 2. Graf ini disebut juga graf teratur. dengan simpul yang telah memiliki banyak
sisi.. Berdasarkan dua kelemahan ini, Barabasi
& Albert menyusun sebuah model graf “Scale
Free Network” , yang memiliki karakteristik
sebagai berikut :
1. Jaringan graf dapat berkembang dengan
penambahan simpul-simpul baru.
2. Simpul yang baru ditambahkan cenderung
Gambar 4. Beberapa contoh graf teratur membuat sisi dengan simpul yang telah
memiliki banyak sisi.
Ciri dari graf Scale Free Network
persebaran derajat pada setiap simpulnya yang
tidak merata. Terdapat simpul yang berperan
sebagai hub . Simpul ini terhubung dengan
banyak simpul lainnya sekaligus.
Gambar 5. Graf "Small World Network"
disusun dari graf teratur dengan n=6 dan d = 4
Dimana di adalah derajat simpul i , adalah
jumlah derajat seluruh simpul pada graf.
Gambar 6. Perbandingan graf acak Erdos- Dengan rumus ini, simpul baru akan memiliki
Renyi (kiri) dengan graf "Scale Free
Network" (kanan). Pada graf Scale Free
kecenderungan untuk membentuk sisi dengan
Network , terdapat simpul hub yang
simpul yang memiliki derajat tertinggi.
terhubung dengan banyak simpul sekaligus.
Simpul hub ditandai dengan warna hitam
IV. ANALISIS STRUKTUR GRAF WORLD
Kemunculan simpul hub ini disebabkan WIDE WEB BERDASARKAN DATA
oleh kecenderungan simpul baru untuk EMPIRIS
membentuk sisi dengan simpul yang memiliki
sisi terbanyak. Ungkapan “yang kaya semakin Pada bab sebelumnya telah dijelaskan
kaya (rich get richer) “cocok untuk beberapa permodelan world wide web
menggambarkan situasi ini. Simpul yang menggunakan teori graf. Namun , untuk
memiliki banyak sisi akan cenderung memiliki mendapatkan gambaran nyata mengenai
lebih banyak sisi seiring bertambahnya simpul struktur graf world wide web , kita harus
baru. menjelajahi seluruh halaman web di dalam
Distribusi derajat sisi pada simpul graf world wide web , mengunduh setiap
Scale Free Network mengikuti hukum pangkat halamannya & menganalisis keterkaitan antar
(power law). Probabilitas sebuah simpul halaman-halaman web tersebut. Untuk
melakukan penjelajahan & pengunduhan
memiliki derajat k berbanding lurus dengan halaman web di dalam world wide web,
,dimana n adalah sebuah konstansta. digunakanlah program web crawler. Web
crawler adalah program untuk menjelajahi isi
world wide web dengan otomatis dan
sistematis. Web crawler menjelajahi world
wide web dengan mengikuti struktur hyperlink
yang terdapat di dalam halaman web
Pertama-tama , web crawler diberikan
sebuah daftar URL yang harus ia kunjungi .
Lalu, crawler akan mengunjungi URL
tersebut , mengunduh halaman web pada
URL , mengidentifikasi seluruh hyperlink yang
Gambar 7. Grafik Distribusi Hukum Pangkat. Sumber terdapat di dalam halaman web dan
Gambar : Albert-Laszlo Barabasi, Eric Bonabeau,“Scale memasukkan daftar hyperlink tersebut ke
Free Networks” , in Scientific American, 2003
daftar URL yang harus ia kunjungi. Proses ini
dilakukan berulang-ulang hingga crawler
Grafik diatas menunjukkan bahwa
memutuskan kapan untuk berhenti.
mayoritas simpul memiliki jumlah sisi yang
Menurut Trupti , dkk ada beberapa
sedikit , namun ada simpul hub yang memiliki
komponen dasar yang dimiliki oleh web
jumlah sisi yang banyak. Proses pembentukan
crawler,yaitu.
graf Scale Free Network dapat dijelaskan
1. Crawler Frontier
menggunakan mekanisme Preferential
Sebuah daftar URL yang akan
Attachment Model . Pertama , buat sebuah graf
dikunjungi oleh web crawler
kosong dengan n buah simpul. Lalu, setiap
satu satuan waktu , tambahkan sebuah simpul 2. Page Downloader
baru, dengan m buah sisi. Probabilitas sebuah Program untuk mengunduh halaman
simpul baru membentuk sisi dengan simpul i web berdasarkan URL yang ada di
adalah dalam Crawler Frontier
3. Web Repository
Sebuah tempat penyimpanan halaman
web yang telah berhasil diunduh oleh
web crawler
Web crawler digunakan oleh peneliti graf
world wide web untuk menganalisis struktur
graf pada world wide web. Selain itu , web
crawler juga digunakan dalam mesin pencari.
Crawling (proses penguduhan halaman-
halaman web untuk dianalisis lebih lanjut)
merupakan proses yang pertama kali mesin
pencari lakukan dalam pencarian informasi di
dalam world wide web.
Karena struktur world wide web yang
begitu besar, sampai saat ini, belum ada yang
berhasil menjelajahi seluruh isi world wide
web.Pada banyak kasus, crawler tidak mampu Gambar 8. Bow Tie Structure , sebuah alternatif
struktur graf world wide web yang diajukan oleh
untuk menguduh seluruh halaman web yang Broder,dkk Sumber gambar : A.Broder , R.
ada di world wide web , bahkan mesin pencari- Kumar , F.Maghoul , P.Raghavan , S. Rajagopalan,
pun hanya berhasil mengunduh sebagian kecil S. Stata , A. Tomkins , J. Wiener , “Graph structure
dari keseluruhan web in the web” , in Computer Networks , 2000
Oleh karena itu, beberapa analisis struktur
graf yang akan dijelaskan berikut ini 1. SCC (27,74 %)
bergantung pada jumlah halaman web yang SCC merupakan singkatan dari
berhasil diunduh oleh web crawler. Perbedaaan Strongly Connected Component. Setiap
metode crawling yang digunakan oleh crawler pasangan simpul di dalam SCC terhubung kuat.
juga mempengaruhi hasil analisis struktur graf. Andaikan u & v adalah simpul, maka terdapat
sisi dari u ke v dan sebaliknya.
2. IN (21,29 %)
A.Struktur Graf Dasi Kupu-Kupu , Broder,
IN terdiri dari simpul yang memiliki
dkk sisi menuju komponen SCC , namun tidak
sebaliknya. Halaman web pada IN dapat
Broder,dkk menjelaskan struktur graf mengakses SCC, namun SCC tidak memiliki
world wide web berdasarkan data empiris. link menuju IN.
Data ini dikumpulkan menggunakan crawler 3. OUT (21,21 %)
Altavista untuk menjelajahi hyperlink yang OUT terdiri dari simpul yang
terdapat di dalam halaman web. Terdapat memiliki sisi dari komponen SCC , namun
tidak sebaliknya. Komponen SCC dapat
sekitar 200 juta halaman web dan 1,5 milyar mengakses OUT , namun OUT tidak memiliki
hyperlink yang dianalisis di dalam penelitian link menuju SCC.
ini. 4. TENDRILS (21,52%)
Penelitian in mengonfirmasi berlakunya Terdiri dari simpul yang tidak dapat
hukum pangkat (power law) pada derajat diakses dari SCC dan tidak dapat mengakses
masuk & derajat keluar. Nilai konstanta hukum SCC. IN dapat mengakses TENDRILS atau
pangkat yang ditemukan adalah 2,1. Hal ini TENDRILS dapat mengakses komponen OUT.
menunjukkan bahwa graf World Wide Web 5. TUBES
dapat dimodelkan menggunakan graf Scale Terdiri dari simpul yang dapat
diakses dari IN dan dapat mengakses
Free Network.. Selain itu, graf ini memiliki OUT, tetapi bukan bagian dari SCC.
struktur makroskopik yang unik. Apabila graf 6. DISCONNECTED ( 8,24 %) Terdiri dari simpul
ini dianggap sebagai graf yang tidak berarah, yang tidak memiliki hubungan dengan
sekitar 90% simpul graf membentuk sebuah komponen-komponen di atas.
kesatuan komponen yang terhubung.
Komponen terhubung ini terbagi menjadi
empat bagian.
B. Struktur Graf Bunga Aster , Donato,dkk world wide web yang dapat berubah-ubah
Berdasarkan hasil penelitian secara dinamis.
Broder,dkk dan Donato,dkk , Zhu,dkk
melakukan sebuah penelitian untuk V. KESIMPULAN
membandingkan struktur bunga aster Struktur World Wide Web dapat
dengan struktur dasi kupu-kupu. Berbeda dimodelkan menjadi sebuah graf berarah,
dengan dua penelitian sebelumnya , data di dimana halaman web merupakan simpul
dalam penelitian ini berfokus kepada pada graf dan hyperlink merupakan sisi
halaman web dari Tiongkok. Data graf uji pada graf. Karena sifat strukturnya yang
yang digunakan pada penelitian ini adalah terdesentralisasi dan acak , graf ini dapat
837 juta halaman web dan 43 miliar dimodelkan menggunakan model graf acak,
hyperlink . seperti graf acak Erdos-Renyi ( Erdos-
Renyi Random Graph Model) , graf Small
Berdasarkan hasil penelitian , graf World Network Watts-Stogatz , dan graf
web tersebut tidak membentuk struktur graf Scale Free Networks. Dari ketiga model
bunga aster maupun struktur dasi kupu- graf ini, model graf Scale Free Networks
kupu , melainkan membentuk struktur graf lebih cocok untuk memodelkan graf World
baru yang disebut dengan struktur graf teko Wide Web karena sudah dikonfirmasi
teh (teapot) . Hal ini ditandai oleh ukuran kebenarannya berdasarkan data empiris .
relatif komponen IN yang jauh lebih besar
daripada komponen OUT. Sementara itu, struktrur graf World
Wide Web juga dapat ditentukan
menggunakan data empiris.
Halamanhalaman web dalam jumlah besar
diunduh dari world wide web menggunakan
web crawler untuk dianalisis lebih lanjut.
Berdasarkan hasil analisis beberapa
penelitian, struktur graf ini terbagi menjadi
beberapa komponen , yaitu SCC, IN, OUT,
TENDRILS, TUBES & DISCONNECTED.
Ukuran relatif masingmasing komponen
bergantung pada ruang (wilayah analisis
Gambar 10. Struktur graf teko teh , struktur struktur web) dan waktu (kapan proses
graf ini merepresentasikan graf web di crawling itu dilakukan). Hal ini disebabkan
Tiongkok. oleh sifat alami world wide web yang dapat
Sumber gambar : Jonathan J. H. Zhu , Tao berubah secara dinamis
Meng , Zhengmao Xie , Geng Li, Xiaoming
Li , “A Teapot Graph and Its Hiearchical
Structure of the Chinese Web”, in WWW ,
2008

Berdasarkan ketiga hasil penelitian ini


, secara umum struktur graf world wide
web terdiri dari beberapa komponen , yaitu
SCC, IN, OUT, TENDRIL, TUBES &
DISCONNECTED. Namun ukuran relatif
masing-masing komponen bergantung &
berubah secara dinamik terhadap ruang dan
waktu. Hal ini disebabkan oleh sifat alami
REFERENSI “A Teapot Graph and Its Hiearchical S
tructure of the Chinese Web”, in
1. Rinaldi Munir , “Diktat Kuliah IF2120
WWW , 2008
Matemat ika Diskrit” , Program Studi
Teknik Informatika , Institut Teknologi 14. P Erdos, A.Renyi , “On Random Graphs
Bandung, 2006 I” , 195 8
2. Narsigh Deo , Panjah Gupta , “World
Wide Web : Graph-Theoretic
Perspective” , University of Central
Flor ida , 2001
3. Reka Albert, Hawoong Jeong, Albert-
Laszlo Barabasi , “Diameter of World
Wide Web” in Nature , Vol 401, 1999
4. Jon Kleinberg, Steve Lawrence, “The
Structure o f Web” in Science Vol 294 ,
2001
5. Lada Adamic , “The Small World Web”
in Proceed ings of the Third European
Conference on Research and Advanced
Technology for Digital Libraries , 1999
6. D.Watts , S. Strogatz , “Collective
dynamics o f ‘small world’ networks”
in Nature , Vol 393, 1998
7. Albert-Laszlo Barabasi , Reka Albert , “
Emerg ence of Scaling in Random
Networks” , in Science , Vol 286 , 1999
8. Albert-Laszlo Barabasi, Eric
Bonabeau,“Scale Free Networks” , in
Scientific American, 2003
9. A.Broder , R. Kumar , F.Maghoul ,
P.Raghavan , S. Rajagopalan, S. Stata ,
A. Tomkins , J. Wiener , “Graph
structur e in the web” , in Computer
Networks , 2000
10. Jungho Choo , “Crawling the Web :
Discovery a nd Maintenace of Large
Scale Web Data” , Standford University
, 2001
11. Trupti V. Udapure , Ravindra D. Kali ,
Rajesh C. Dharmik , Study of Web
Crawler and its Different Types” , in
IOSR J ournal of Computer Engineering
, 2014
12. Debora Donato, Stefano Leonardi,
Stefano Milozzi, Panayiotis Tsaparas,
“Mining the Inner Structure of the Web
G raph” in Eighth International
Workshop on Web and Databases , 2005

13. Jonathan J. H. Zhu , Tao Meng ,


Zhengmao Xie , Geng Li, Xiaoming Li ,

Anda mungkin juga menyukai