鏈接分析算法之HITS算法詳解加示例
2、可以利用HITS的主題漂移原理帶動其他頁面之間的排名,比如seo頁面帶動沒有seo的頁面排名。
六、HITS算法與PageRank算法比較
HITS算法和PageRank算法可以說是搜索引擎鏈接分析的兩個** 基礎且** 重要的算法。從以上對兩個算法的介紹可以看出,兩者無論是在基本概念模型還是計算思路以及技術實現細節都有很大的不同,下面對兩者之間的差異進行逐一說明。
1.HITS算法是與用戶輸入的查詢請求密切相關的,而PageRank與查詢請求無關。所以,HITS算法可以單獨作為相似性計算評價標準,而PageRank必須結合內容相似性計算才可以用來對網頁相關性進行評價;
2.HITS算法因為與用戶查詢密切相關,所以必須在接收到用戶查詢后實時進行計算,計算效率較低;而PageRank則可以在爬蟲抓取完成后離線計算,在線直接使用計算結果,計算效率較高;
3.HITS算法的計算對象數量較少,只需計算擴展集合內網頁之間的鏈接關系;而PageRank是全局性算法,對所有互聯網頁面節點進行處理;
4.從兩者的計算效率和處理對象集合大小來比較,PageRank更適合部署在服務器端,而HITS算法更適合部署在客戶端;
5.HITS算法存在主題泛化問題,所以更適合處理具體化的用戶查詢;而PageRank在處理寬泛的用戶查詢時更有優勢;
6.HITS算法在計算時,對于每個頁面需要計算兩個分值,而PageRank只需計算一個分值即可;在搜索引擎領域,更重視HITS算法計算出的Authority權值,但是在很多應用HITS算法的其它領域,Hub分值也有很重要的作用;
7.從鏈接反作弊的角度來說,PageRank從機制上優于HITS算法,而HITS算法更易遭受鏈接作弊的影響。
8.HITS算法結構不穩定,當對“擴充網頁集合”內鏈接關系作出很小改變,則對** 終排名有很大影響;而PageRank相對HITS而言表現穩定,其根本原因在于PageRank計算時的“遠程跳轉”
- 如何優化:
- 網站url改版不收錄 網站建設哪個 奉賢網站改版哪家好 公司網站改版價格會變嗎 網站改版注意哪些 陽江網站開發 孝義網站定制公司 日本跨境選品軟件網站開發 本溪網站定制報價 鄭州旅游網站開發運營