,
:
(web crawler), (indexer),
(query engine). , (web spider)
-, - .
-
-. ,
.
-[ ]
- (web crawler) -
-. - .
, - -
(HTTP). ,
-
, .
.
: (1)
(2) , - .
-
-, .
,
. , .[2]
.[3]
,
-
.
.
.
,
.
, ,
- - .
.
- .
, .
- .
-
.
.
,
.
-[ ]
- ,
.
.
. ,
. , .
,
( ) .
. ,
.
,
. ,
. () ,
,
() , .
, ,
. , ,
. ,
. , -
(HTML), title header.
-. , -,
,
- (body)
.
[]
.
.
, ,
.
.
. ,
.
.
, .
.
- ,
. ,
. ,
-
. ,
.
.
, ,
. A A,
A .
,
. ,
PageRank ,
.[4] PageRank-a:
(1) .
,
-. (2) -
. (3)
.
, ,
.
(PageRank) .[4] PageRank -
. , x,
PageRank-.
, PageRank.
[]
,
. ,
.
. ,
.
x, ,
.
, . ,
.
.
,
.
,
.
1. ,
. , .
,
, , ,
.
,
. ,
,
, .
, .
,
20,
.[5]
[]