Web Graf

STUDI WORLD WIDE WEB SEBAGAI SEBUAH GRAF BERARAH
Indah Kuntum Khairina – NIM : 13505088

Program Studi Teknik Informatika, Institut Teknologi Bandung
Jl. Ganesha 10, Bandung
E-mail : if115088@students.if.itb.ac.id
Abstrak
Makalah ini membahas tentang studi world wide web sebagai sebuah graf berarah. Di sini, sebuah halaman
situs kita anggap sebagai simpul dan hyperlink adalah sisi yang menghubungkan simpul-simpul tersebut.
Graf semacam ini dikenal dengan istilah web graph.
Struktur dari web-graph sangat berguna untuk mengembangkan algoritma-algoritma pencarian web. Pada
makalah ini, dibahas dua jenis algoritma pencarian, yaitu: algoritma HITS dan algoritma trawling. Pada
proses pencarian web dengan memasukkan sebuah kata kunci/topik ke dalam search engine ditemukan
sebuah fenomena bahwa situs-situs hasil pencarian dapat dibagi dalam dua jenis, yaitu (1) authorities
(situs-situs yang isi/topiknya memang berkaitan dengan kata kunci), dan (2) hubs (situs-situs yang
mengenumerasi/mengumpulkan authorities). Algoritma HITS sangat berguna untuk mencari authorities,
sementara algoritma trawling dapat digunakan untuk mencari upagraf-upagraf terhubung dari web graph,
yang nantinya dapat digunakan untuk mencari hub dari sebuah komunitas maya (yaitu, terdiri dari
kumpulan situs-situs dengan topik yang serupa). Namun demikian, algoritma trawling memiliki banyak
kelemahan yang disebabkan oleh tak-terhingganya besar ruang pencarian di dalam world wide web.
Dalam makalah ini juga dibahas mengenai sifat-sifat struktural yang didapat melalui pengamatan dari
proses pencarian web dalam search engine. Selain itu, makalah ini juga membahas mengenai model dari
web graph.
Kata kunci: graf berarah, web graph, pencarian web, search engine, algoritma HITS, trawling, enumerasi,
graf lingkaran bipartit, random graph.
1. Pendahuluan dengan bermiliar-miliar hyperlinks. Jumlah ini

masih akan terus bertambah setiap tahun.
Sejak beberapa tahun terakhir, teknologi
informasi, khususnya internet (world wide web),
Pembahasan dalam makalah ini difokuskan pada
tidak lagi hanya menjadi konsumsi orang-orang
studi graf berarah yang dihasilkan oleh
yang bekerja di bidang IT saja, tapi juga menjadi
hyperlinks sebagai penghubung antar situs;
konsumsi hampir setiap orang. Hal ini terjadi
dikenal dengan istilah web graph. Untuk tujuan
karena world wide web memang menjanjikan
tersebut, sebuah halaman situs kita anggap
penghematan waktu dan kemudahan dalam
sebagai sebuah simpul dan hyperlink sebagai sisi
melakukan berbagai hal, seperti transaksi
penghubung situs-situs tersebut. Sebagai contoh,
perbankan, belanja online, bertukar kabar serta
pada gambar graf berarah di bawah ini,
informasi melalui e-mail, dan sebagainya. Oleh
himpunan simpul V = {x1,...,xN} adalah halaman-
karena itu, berbagai perusahaan membuat situs
halaman situs dan xi xj jika xi mengandung
resmi sebagai pelayanan penunjang untuk
pelanggan mereka. Situs-situs komunitas dan sebuah hyperlink ke xj.
pribadi juga banyak bermunculan, terutama sejak
teknologi weblog menjadi populer. Setiap situs
dapat mengacu/menunjuk halaman situs lain
melalui sebuah hyperlink. Berdasarkan
pengamatan, rata-rata sebuah situs memiliki
tujuh hyperlinks. Dengan demikian, dapat
dipastikan saat ini telah ada berjuta-juta situs
x2 x3 tentang hubungan antara hubs dan authorities.
Dalam algoritma HITS, setiap simpul (situs) p
diberi bobot hub (xp) dan bobot authority (yp)
melalui operasi
x4
x1 x5 xp = ∑ yq
q, q p
dan
x6 yp = ∑ xq
x7 q, p q
Gambar 1 Web Graph sebagai Graf Berarah
yang dalam hal ini nilai xp diperoleh dari jumlah
Studi mengenai web graph ini menjadi menarik seluruh nilai yq di mana q adalah situs-situs yang
karena beberapa hal berikut. Pertama, struktur menunjuk (mengandung hyperlink) ke situs p
dari web graph telah banyak digunakan untuk (notasi q p menunjukkan bahwa q menunjuk
meningkatkan kualitas pencarian web (misalnya ke p). Sementara nilai yp diperoleh dari jumlah
dalam search engine) dan juga digunakan untuk seluruh nilai xq. Dari operasi tersebut, dapat
menemukan algoritma topic-classification yang dilihat bahwa antara hubs dan authorities
lebih akurat. Kedua, banyak informasi menarik terdapat sebuah hubungan yang saling
lain yang dapat kita temukan dalam sebuah web memperkuat satu sama lain, yaitu: sebuah hub
graph, misalnya informasi mengenai ukuran dari yang bagus menunjuk ke banyak authorities
web graph itu sendiri (derajat sebuah situs, jarak yang juga bagus, sementara sebuah authority
antara dua situs, dan lain-lain) atau bahkan yang bagus ditunjuk oleh banyak hubs yang juga
informasi mengenai situs apa saja yang paling bagus.
diminati user saat ini.
Untuk melakukan update secara berkala dari
2. Algoritma nilai-nilai tersebut, terdapat cara yang lebih
Algoritma yang dibahas dalam makalah ini singkat dibanding dengan melakukan
adalah algoritma yang berhubungan dengan perhitungan ulang dari rumus yang telah dibahas
pencarian web. Berdasarkan pengamatan saat sebelumnya. Pertama-tama, nomori situs-situs
melakukan pencarian topik-topik tertentu dalam hasil pencarian dengan angka {1,2,...,n} dan
search engine, ditemukan bahwa untuk setiap tentukan matriks ketetanggaan A yang berukuran
topik yang dicari didapatkan dua jenis situs hasil n x n dari situs-situs tersebut. Lalu, himpun
pencarian, yaitu: seluruh nilai x dalam sebuah vektor x =
1. Authoritative pages (authorities) (x1,x2,...,xn) , lakukan hal yang serupa pada
Situs-situs yang memang memiliki seluruh nilai y. Selanjutnya, update nilai x dan y
topik serupa dengan topik yang sedang dapat dilakukan melalui operasi
kita cari.
2. Hub pages (hubs) x  ATy  ATAx = (ATA)x
Situs-situs yang berisi hyperlinks ke
authoritative pages. dan
Selanjutnya, hasil pengamatan tersebut
memotivasi pengembangan dua jenis algoritma y  ATx  ATAy = (AAT)y
yang akan dibahas kemudian. Pertama, algoritma
pencarian yang menyaring situs-situs yang Di bawah ini adalah gambaran keseluruhan dari
memang berkaitan dengan topik yang dicari algoritma HITS.
(authorities), dibahas dalam upabab 2.1. Kedua,
algoritma untuk mengenumerasi topik-topik dari
authorities untuk kemudian dikumpulkan dalam
sebuah hub, dibahas dalam upabab 2.2.
2.1 Algoritma HITS

Algoritma Hyperlink Induced Topic Search
(HITS) Kleinberg memberikan gagasan baru
2.2 Algoritma Trawling (Penjaringan)
langkah 1: Kumpulkan sejumlah r situs hasil
pencarian sebuah topik yang terletak paling atas Pada upabab ini, kita beralih ke algoritma kedua
(highest-ranked) dari sebuah search engine.
Sejumlah r situs ini dikumpulkan dalam sebuah
yang digunakan dalam pencarian web. Berbeda
himpunan akar (root) R. dengan HITS, yang merupakan sebuah algoritma
pencarian yang dirancang untuk menemukan
langkah 2: Buatlah sebuah himpunan basis situs-situs dengan topik tertentu, algoritma
(base) S yang berukuran n, dengan cara trawling mengenumerasi semua topik dan
memperbesar himpunan R (yaitu, menambah kemudian memproses keseluruhan web graph.
anggota himpunan dengan semua situs yang
ditunjuk oleh situs-situs di R dan paling banyak Misalkan Ki,j adalah sebuah graf bipartit lengkap,
sejumlah d situs tambahan tersebut menunjuk ke yaitu setiap simpul pada himpunan i terhubung
situs-situs di R).
langsung dengan setiap simpul pada himpunan j.
langkah 3: Buatlah graf G[S] yang dihasilkan Kemudian, buatlah sebuah graf lingkaran bipartit
oleh situs-situs pada himpunan S sebagai simpul. Ci,j (yaitu, graf dengan himpunan simpul i + j
Terdapat dua jenis links dalam graf G[S] ini, yaitu: yang mengandung paling sedikit sebuah Ki,j
transverse links (links antara situs-situs yang sebagai upagraf). Gambaran tersebut
alamat domainnya berbeda) dan intrinsic links menjelaskan bahwa pada pencarian setiap topik
(links antara situs-situs yang berdomain sama). dalam world wide web, akan dihasilkan sebuah
Semua sisi yang terbentuk dari intrinsic links graf lingkaran bipartit dalam web graph-nya.
dihapus dari graf G[S], sehingga yang tersisa Gambar di bawah ini mengilustrasikan sebuah
hanyalah sisi-sisi dari transverse links.
contoh graf C4,3 di mana keempat situs di sebelah
langkah 4: Buat matriks ketetanggaan A yang kiri memiliki hyperlinks ke tiga situs perusahaan
berukuran n x n dan juga matriks transposnya AT. besar yang bergerak di bidang penerbangan
Normalisasikan vektor eigen ε1 dari ATA yang (terletak di sebelah kanan).
bersesuaian dengan nilai eigen λ1 terbesar.
langkah 5: Temukan elemen-elemen dengan www.boeing.com

nilai absolut dari hasil normalisasi vektor eigen
yang besar. Kemudian, definisikan elemen-elemen
tersebut sebagain authorities. www.airbus.com
Gambar 2 Algoritma HITS

www.embrair.com
Pada akhirnya, algoritma HITS ini menghasilkan

sebuah daftar singkat yang terdiri dari situs-situs
dengan bobot hub terbesar serta situs-situs
dengan bobot authority terbesar. Yang menarik
dari algoritma HITS adalah: setelah Gambar 3 Graf Lingkaran Bipartit
memanfaatkan kata kunci (topik yang dicari) Upagraf K4,3 dari web graph di atas dapat disebut
untuk membuat himpunan akar (root) R, sebagai sebuah ”komunitas maya” yang terdiri
algoritma ini selanjutnya sama sekali tidak dari perusahaan-perusahaan penerbangan
mempedulikan isi tekstual dari situs-situs hasil komersial yang kemudian menghasilkan hubs,
pencarian tersebut. Dengan kata lain, HITS yaitu keempat situs di sisi kiri. Situs-situs ini
murni merupakan sebuah algoritma berbasis link menunjuk pada authorities yang terletak di sisi
setelah himpunan akar terbentuk. Walaupun kanan.
demikian, secara mengejutkan HITS memberikan
hasil pencarian yang baik untuk banyak kata Katakanlah, sebuah komunitas maya muncul
kunci. Sebagai contoh, ketika dites dengan kata dalam ketika banyak hubs menunjuk ke banyak
kunci ”search engine”, lima authorities terbaik authorities yang sama. Dalam banyak kasus,
yang dihasilkan oleh algoritma HITS adalah hubs dari komunitas-komunitas tersebut tidak
Yahoo!, Lycos, AltaVista, Magellan, dan Excite menunjuk ke semua authorities yang
− padahal tidak satupun dari situs-situs tersebut bersesuaian. Alamat dan jumlah authorities yang
mengandung kata ”search engine”. ditunjuk oleh hubs sangat mungkin berbeda satu
sama lain. Dengan mengetahui fakta ini, dapat
kita nyatakan sebuah hipotesis (yang lemah)
sebagai berikut: setiap komunitas maya akan lintasan selanjutnya. Proses melewati lintasan-
mengandung sebuah graf lingkaran bipartit Ci,j lintasan ini diselingi oleh operasi sort, yang
dengan nilai-nilai i dan j yang non-trivial. berguna untuk mengubah urutan ketika data di-
Hipotesis ini juga berarti bahwa untuk setiap scan, dan merupakan bagian terbesar dari proses
nilai i (jumlah hubs) terdapat banyak graf tersebut. Operasi sort ini dapat dipandang
lingkaran bipartit Ci,j dengan nilai j (jumlah sebagai operasi pengurutan sisi-sisi berarah dari
authorities) yang berbeda-beda; hal ini juga simpul asal ke simpul tujuan (atau sebaliknya)
berlaku untuk setiap nilai j. Untuk menindak- berdasarkan jumlah derajat masuk dan derajat
lanjuti hipotesis tersebut, kita dapat berusaha keluar setiap simpul. Selama melewati tiap
untuk menemukan sebuah komunitas maya yang lintasan, juga dilakukan proses elimination filter
lebih besar dengan cara menyatukan (melalui dan generation filter, yang selanjutnya akan
enumerasi) semua graf lingkaran bipartit dibahas.
tersebut; proses seperti ini disebut sebagai
trawling. Elimination Filter. Ada beberapa persyaratan
sederhana yang harus dipenuhi oleh sebuah
Berdasarkan percobaan mengenumerasi Ci,j simpul agar dapat menjadi bagian dari upagraf
untuk nilai i = 3, akan diperoleh rentang nilai j yang bersesuaian. Bayangkan sebuah graf
antara 3 sampai 20. Sementara, untuk nilai j = 3, lingkaran bipartit C4,4. Semua simpul yang hanya
akan diperoleh rentang nilai i antara 3 sampai 9. memiliki derajat masuk kurang dari 4 tidak dapat
Hasil semacam ini memberi kesan bahwa (1) menjadi bagian dari sisi sebelah kanan pada graf
sebuah web graph memiliki ribuan graf C4,4 tersebut. Dengan demikian, sisi-sisi yang
lingkaran bipartit, dan (2) hanya sebagian kecil mengarah ke simpul tersebut dapat dibuang dari
yang tepat − biasanya dicapai jika menggunakan graf. Sebaliknya, semua simpul dengan derajat
kata kunci/topik yang sangat jelas dan fokus. keluar kurang dari 4 tidak dapat menjadi bagian
Pada paragraf berikutnya, akan diberikan dari sisi sebelah kiri.
penjelasan singkat tentang percobaan ini, diikuti
dengan beberapa penemuan penting dari Generation Filter. Proses ini merupakan lanjutan
percobaan tersebut. dari elimination filter. Di sini, simpul-simpul
yang diperoleh dari elimination filter (yaitu,
Dilihat dari sisi algoritmik, algoritma pencarian simpul-simpul yang hampir memenuhi syarat
untuk mengenumerasi tersebut menyebabkan dua untuk menjadi bagian dari upagraf yang
masalah yang fatal. Pertama, ukuran dari ruang bersesuaian) dapat ditentukan apakah bisa
pencarian menjadi sangat amat besar − dengan menjadi bagian dari upagraf tersebut atau tidak.
menggunakan algoritma ini untuk Bayangkan kembali sebuah graf lingkaran
mengenumerasi semua graf lingkaran bipartit bipartit C4,4. Anggap u adalah sebuah simpul
dari dua situs yang menunjuk ke tiga situs yang memiliki derajat masuk tepat 4 (atau lebih
dibutuhkan pemeriksaan kira-kira 1040 graf sedikit dari 4). Selanjutnya, u dapat menjadi
dengan 108 simpul. Kedua, algoritma ini bagian dari C4,4 jika dan hanya jika keempat
membutuhkan akses ke sisi-sisi pada web graph simpul yang menunjuk ke u memiliki tetangga
secara acak, yang menyebabkan banyak bagian paling sedikit 4. Generation filter merupakan
dari graf harus diletakkan di memory utama sebuah prosedur untuk menentukan simpul-
untuk menghindari pencarian pada disk yang simpul yang memenuhi syarat, dan setiap simpul
memakan waktu lama dan memory yang lebih dapat menghasilkan sebuah graf lingkaran atau
banyak setiap kali sebuah sisi diakses. membuktikan bahwa sebuah graf lingkaran
tertentu tidak eksis.
Dalam percobaan ini, digunakan sebuah
paradigma elimination-generation. Algoritma Setelah proses elimination-generation selesai,
yang menggunakan paradigma ini akan melewati akan tersisa simpul-simpul yang memiliki
sejumlah lintasan sekuensial pada web graph, jumlah tetangga yang lebih sedikit. Kita dapat
yang kemudian disimpan sebagai relasi biner. melanjutkan proses ini sampai tidak ada
Selama melewati tiap-tiap lintasan, algoritma kemajuan berarti yang dapat dihasilkan lagi.
tersebut menuliskan data-data pada web graph Proses elimination-generation ini dapat
tersebut yang telah dimodifikasi/di-update ke menyebabkan terjadinya salah satu dari dua hal
dalam disk. Selain itu, algoritma tersebut juga berikut: (1) simpul-simpul pada graf dibuang
menuliskan beberapa metadata yang terletak di terus-menerus sampai tidak ada yang tersisa, atau
memory utama yang berguna untuk melewati (2) setelah melewati beberapa lintasan, simpul-
simpul yang dibuang pada setiap proses menjadi simpul lainnya tetap terisolasi. Graf Gu seperti
semakin dan semakin sedikit. Dari percobaan ini hanya mengandung sebuah komponen besar
yang telah banyak dilakukan, fenomena kedua (yaitu, simpul-simpul terhubung yang
lebih sering terjadi. merupakan bagian paling penting di antara
semua simpul). Untuk memperoleh
Dalam [8] dilaporkan sebuah hasil trawling dari keterhubungan yang lebih kuat, gunakan prinsip
sebuah web graph. Percobaan ini keterhubungan-ganda. Katakanlah dua simpul u
mengenumerasi graf lingkaran bipartit sebanyak dan v terhubung-ganda. Graf tak-berarah seperti
100,000 lebih. Perhatikan bahwa karena graf- ini juga hanya mengandung sebuah komponen
graf tersebut adalah hasil dari enumerasi (bukan besar yang terhubung-ganda dengan beberapa
hasil dari mencocokkan kata kunci), hasil komponen lain tetap terisolasi. Pada algoritma
pencarian dengan algoritma trawling ternyata HITS, komponen-komponen terhubung-ganda ini
hanya mengandung sedikit sekali situs yang biasanya merupakan hubs dan authorities
isi/topiknya bersesuaian dengan kata kunci. Satu- terbaik.
satunya cara untuk menentukan apakah sebuah
graf lingkaran yang dihasilkan itu benar atau Keterhubungan Bolak-Balik. Keterhubungan-
cuma kebetulan adalah dengan melakukan ganda menghasilkan sebuah komponen
pengecekan manual, yang lebih lengkapnya besar/utama; keterhubungan-kuat memecah
dijelaskan dalam [8]. sebuah graf menjadi komponen-komponen kecil.
Keterhubungan bolak-balik adalah sebuah
keterhubungan alami (bukan buatan) yang
3. Struktur
membutuhkan arah dari sisi-sisi penghubung
Sebuah web graph dapat mengandung beberapa antar simpul. Berikut ini akan dijelaskan
struktur lokal. Salah satu contoh struktur lokal mengenai keterhubungan bolak-balik, serta
yang menarik dalam web graph dapat dilihat kesulitannya untuk menemukan komponen
pada graf lingkaran bipartit yang telah dibahas utama.
pada bab sebelumnya.
Jika u dan v adalah simpul, dapat dikatakan
3.1 Keterhubungan dari upagraf-upagraf bahwa himpunan sisi-sisi P dari graf berarah G
lokal adalah sebuah lintasan bolak-balik dari u ke v
jika (1) P juga merupakan sebuah lintasan pada
Dalam upabab ini akan dibahas mengenai hal-hal graf tak-berarah Gu yang titik akhirnya berada
yang berkaitan dengan keterhubungan dari pada simpul u maupun v, dan (2) arah dari sisi-
upagraf-upagraf lokal pada web graph. sisi dalam himpunan P pada graf G harus bolak-
Sebelumnya, bentuklah sebuah himpunan balik. Dengan demikian, untuk mencapai situs v
upagraf-upagraf lokal (yaitu, himpunan basis S dari situs u melalui sejumlah links (situs-situs
yang diperoleh dari algoritma HITS pada upabab lain) dapat digunakan lintasan maju atau lintasan
2.1). Kemudian, kita akan memandang G sebagai mundur. Hal ini berkaitan erat dengan algoritma
sebuah graf berarah, namun kita juga akan HITS. Ketepatan hubungan bolak-balik dari sisi-
mendefinisikan sebuah graf tidak-berarah Gu sisi dalam himpunan P berkaitan dengan bobot
yang diperoleh dari mengabaikan arah dari yang dimiliki oleh tiap-tiap simpul. Ketepatan
semua simpul pada graf berarah. Dari hasil hubungan bolak-balik ini yang kemudian dapat
percobaan dengan limapuluh contoh kata kunci, digunakan untuk menentukan kemiripan di
diperoleh bahwa graf-graf yang terbentuk dengan antara situs-situs [9,10,11].
cara ini menunjukkan sejumlah sifat structural
yang konsisten; beberapa dari sifat-sifat ini
selanjutnya akan kita bahas dari segi kualitatif. 4. Model
Rentang keterhubungan. Dari hasil percobaan, Pada bagian ini akan dibahas mengenai beberapa
dapat dilihat bahwa graf tidak-berarah Gu tidak graf model yang diharapkan dapat membantu
terhubung. Komponen-komponen dari himpunan pemahaman mengenai studi struktural pada web
akar R biasanya hanya mengandung sedikit graph. Terdapat beberapa alasan untuk
sekali sisi; dan sementara perbesaran dari memahami model-model tersebut:
himpunan akar R menjadi himpunan basis S 1. Memudahkan kita untuk memodelkan
dimaksudkan untuk menghubungan banyak berbagai struktur dari web graph.
simpul dalam himpunan tersebut, beberapa
2. Memudahkan kita untuk memprediksi DAFTAR PUSTAKA
perilaku-perilaku dari algoritma-
algoritma yang dipakai dalam web [1] Kleinberg, Jon M., Ravi Kumar, Prabhakar
graph. Raghavan, Sidhar Rajagopalan, & Andrew
3. Memudahkan kita untuk mempelajari S. Tomkins. (2007). The Web as A Graph:
sifat-sifat struktural pada word wide Measurements, Models, and Methods.
web, sehingga selanjutnya kita dapat http://www.cs.cornell.edu/home/kleinber/w
mengambil manfaat dari hal-hal eb-graph.ps. Tanggal akses: 1 Januari 2007
tersebut. pukul 16:00.
4. Memudahkan kita untuk memprediksi
bentuk dari web graph di masa yang [2] Yang, Rong. (2007). The Structure of The
akan datang. World Wide Web Graph.
http://delivery.acm.org/10.1145/1190000/1
4.1 Model Random Graph 181930/p169-yang.pdf. Tanggal akses: 1
Awalnya, web graph dianggap serupa dengan Januari 2007 pukul 16:00.
sebuah random graph. Model random graph ini
digunakan untuk menunjukkan bahwa selalu ada [3] Nomura, Saeko, Satoshi Oyama, Tetsuo
lintasan terpendek di antara sepasang situs. Hayamizu, & Toru Ishida. (2007). Analysis
Dalam memodelkan sebuah web graph, and Improvement of HITS Algorithm for
digunakan graf yang berbeda dari random graph Detecting Web Communities.
biasa. Penjelasan mengenai random graph biasa http://www.kyoto-u.ac.jp. Tanggal akses: 3
dapat dilihat pada [12], sementara penjelasan Januari 2007 pukul 10:00.
mengenai random graph yang digunakan untuk
memodelkan sebuah web graph dapat dilihat [4] Ding, Chris H.Q., Hongyuan Zha, Xiaofeng
pada [1]. He, Parry Husbands, & Horst D. Simon.
(2003). Link Analysis: Hubs and
5. Kesimpulan Authorities on The World Wide Web.
http://. Tanggal akses: 3 Januari 2007 pukul
Kesimpulan yang dapat dimbil dari studi world 10:00.
wide web sebagai sebuah graf berarah ini
adalah: [5] Guillaume, Jean-Loup & Matthieu Latapy.
1. World wide web dapat dipandang (2007). The Web Graph: an Overview.
sebagai sebuah graf berarah, di mana http://hipercom.inria.fr/soleil/rapports/guill
situs-situs adalah himpunan simpul dan aume02algotel.ps. Tanggal akses: 1 Januari
hyperlinks adalah sisi-sisi penghubung 2007 pukul 16:00.
simpul-simpul tersebut; disebut sebagai
web graph. [6] Leighton, Tom & Ronitt Rubinfeld. (2006).
2. Struktur web graph dapat digunakan Graph Theory III.
untuk mengembangkan algoritma- http://theory.lcs.mit.edu/classes/6.042/fall06
algoritma pencarian web, misalnya : /lec8.pdf. Tanggal akses: 1 Januari 2007
algoritma HITS dan algoritma trawling. pukul 16:00.
3. Kesulitan dalam pengembangan
algoritma-algoritma dalam web graph [7] Munir, Rinaldi. (2004). Bahan Kuliah
disebabkan oleh terlalu besarnya ruang IF2153 Matematika Diskrit. Departemen
pencarian web. Teknik Informatika, Institut Teknologi
4. Pemahaman mengenai struktur web Bandung.
graph memberikan banyak informasi
dan manfaat, misalnya dalam [8] S.R. Kumar, P.Raghavan, S. Rajagopalan,
pembuatan situs agregator yang & A. Tomkins. (1999). Trawling Emerging
mengumpulkan situs-situs dengan topik Cyber-Communities Automatically. Proc.
yang relevan/serupa, prediksi mengenai 8th WWW Conference.
situs-situs yang paling diminati oleh
user, dan sebagainya. [9] S. Chakrabarti, B. Dom, P. Indyk. (1998).
Enhanced Hypertext Classification Using
Hyperlinks. Proc. ACM SIGMOD.
[10] Kleinberg, J. (1999). Authoritative Sources
in A Hyperlinked Environment. Journal of
ACM.
[11] Larson, R. (1996). Bibliometrics of The

World Wide Web: An Exploratory Analysis
of The Intellectual Structure of Cyberspace.
Annual Meeting of the American Society
Info. Sci.
[12] William Aiello, Fan Chung, & Linyuan Lu.

(2007). A Random Graph Model for Power
Law Graphs. http://. Tanggal akses: 1
Januari 2007 pukul 16:00.
[13] Anton & Rorres. (2004). Aljabar Linear

Elementer versi Aplikasi. Jakarta: Erlangga.

Web Graf

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Web Graf

Diunggah oleh

Hak Cipta:

Format Tersedia

STUDI WORLD WIDE WEB SEBAGAI SEBUAH GRAF BERARAH

Indah Kuntum Khairina – NIM : 13505088

1. Pendahuluan dengan bermiliar-miliar hyperlinks. Jumlah ini

2.1 Algoritma HITS

langkah 5: Temukan elemen-elemen dengan www.boeing.com

Gambar 2 Algoritma HITS

Pada akhirnya, algoritma HITS ini menghasilkan

[11] Larson, R. (1996). Bibliometrics of The

[12] William Aiello, Fan Chung, & Linyuan Lu.

[13] Anton & Rorres. (2004). Aljabar Linear

Anda mungkin juga menyukai