WE’RE
HERE

We’ll be happy to 大近hear fram you, don’t
hesitate to get in tou照很ch

技術專欄

浏覽次數:100發(fā)布時(shí)間:2014/04/30文章來源:華仕尊城設計
1、入鏈對(duì)計算頁面(miàn)級别的影響 入鏈總是能(néng器市)增加當前頁面(miàn)的級别,尤其當前頁與其下級頁面(miàn)構成道著(chéng)回路時(shí),這(zhè)種(zhǒng)貢獻更大。如右醫樂圖例,設ABCD各頁初始級别...2014/04/30

1、入鏈對(duì)計算頁面(miàn)級校見别的影響
inbound_link.gif 入鏈總是能(néng)增加當前頁面(miàn)的級别可懂,尤其當前頁與其下級頁面(miàn)構答請成(chéng)回路時(shí),這(zhè)種(zhǒng)貢獻和問更大。如右圖例,設ABCD各頁初始級别爲1,舞為阻尼系數爲0.5,PR(X)/C(X)=10。則易算錢微出 
PR(A) = 19/3 = 6.33
PR(B) = 11/3 = 3.67
PR(C) = 7/3 = 2.33
PR(D) = 5/3 = 1.67 嗎錯;
如果A不在回路上,則隻能(néng)得子影0.5*10=5的收益。
阻尼系數越大,頁面(miàn)級别的收益越大,且整個回路上都(dōu)能笑睡(néng)收到更大的收益(即入鏈收益更能(néng)平均地分去什布到各個回路頁面(miàn)上。針對(duì)上例,將(jiān新購g)阻尼系數改爲0.75,則有&又木nbsp;
PR(A) = 419/35 = 11.97
PR(B) = 323/35 = 9.23
PR(C) = 251/35 = 7.17
PR(D) = 197/35 = 5.63 
除回路上各個頁面(miàn)的級别值明顯增大外,PR(A)/PR(D)舊間的值敢明顯減少了。
入鏈對(duì)整個回路上所有頁面(m計通iàn)的級别值的增加之和,可以由下面(miàn)這(zh藍算è)個公式得出. 
(d / (1-d)) × (PR(X) /北間 C(X)) 
這(zhè)個公式,可以由math.gif簡單推導出。
2、出鏈對(duì)計算頁面(miàn)級别的影響
增加出鏈不會(huì)影響整個web的總級别,但一個站點失去的級别值等于鏈到的站點的增加值之和。對(d得公uì)于兩(liǎng)個封閉的站點,從一那用個站點鏈上另一個站點時(shí),增煙煙加的和減少的都(dōu)是(d(/(1-d) × 從討(PR(X) / C(X)).如生少果這(zhè)兩(liǎng)個站點互相鏈接,則此值飛計減少。用随機沖浪模型可以解釋這(zhè)種(zhǒng紙在)現象,就(jiù)是出鏈的增加,減少了用戶訪問站内頁面(miàn)的長但概率。outbound_link.gif舉例如圖,設阻尼系數爲0.75,則 
PR(A) = 0.25 + 0.75 PR(B吃畫)
PR(B) = 0.25 + 0.375 PR(A)
PR(C) = 0.25 + 0機吃.75 PR(D) + 0.375 PR(A)
PR(D) = 0.25 + 0.75 PR(C) 
得:
PR(A) = 14/23
PR(B) = 11/23 
PR(C) = 35/23
PR(D) = 32/23 區票;
PR(A)+PR(B)=25/23
PR(C)+PR(D)=67/23
PR(A)+PR(B)+PR(C)+PR(D)=92/23=4
outbound_link2.gif Page和Brin將(jiāng)這(zhè個事)樣(yàng)的鏈接稱爲懸擺鏈,它鏈到頁面(miàn)沒(些制méi)有出鏈。懸擺鏈對(duì)頁面(miàn)的級别計算産生負面(mi裡愛àn)影響。如例,阻尼系數爲0.75. 
PR(A) = 0.25 + 0.75 PR(B)
PR(B) = 0.25 + 0.375 PR(A)
PR(C) = 0.25 + 0.375 PR(A) 化些
得:
PR(A) = 14/23
PR(B) = 11/23
outbound_link3.gifPR(C) = 11/23 
PR(A)+PR(B)+PR(C)=36/23<3

據Page和Brin,Google什劇在索引頁面(miàn)時(shí),懸擺鏈的量很大,主要大白是由于限制robot.txt的限制及索引了一些沒(méi)有鏈出的文件類型如得姐PDF等。爲消除這(zhè)種(zhǒng)負面錢知(miàn)影響,google在計算級别時(sh弟雨í),將(jiāng)此類鏈接從數據事市庫裡(lǐ)去掉,在計算完畢後(hòu),再單獨計算懸擺鏈所中分鏈到頁面(miàn)。由此可見,PDF類的文件暗船還(hái)是可以放心地在網上跳做發(fā)布的。 
3、頁面(miàn)數量的影響
pagesnumber.gif 先看例子。阻尼系數爲0.75,PR(X)/關做C(X)=10,則 
PR(A) = 0.25 + 0.75 (10 + PR(B) + P窗厭R(C))
PR(B) = PR(C) = 0.25 + 0.75 (PR(A鄉又) / 2) 
得:
PR(A) = 260/14
PR(B) = 101/14
PR(C) = 101/14 
PR(A)+PR(B)+PR(C)=33兒科;
增加頁面(miàn)D;
PR(A) = 0.25 + 0.75 (10 + PR(B) + P我放R(C) + PR(D))
PR(B) = PR(C) = PR(D) = 0.25 + 0.身黃75 (PR(A) / 3) 

PR(A) = 266/14
PR(B) = 70/14
PR(C) = 70/14
PR(D) = 70/14 
PR(A)+PR(B)+PR(C)匠紙+PR(D)=34
增加頁面(miàn)後(hòu)行愛,所有頁面(miàn)的級别值之和增加了1,A頁略有增加就人,而B、C則用大幅下降。
再看右邊的例子,假定同上。pagesnumber2.gif 
PR(A) = 0.25 + 0.75 (10 慢相+ PR(C))
PR(B) = 0.25 + 0.75我船 × PR(A)
PR(C) = 0.25 + 0.75 ×門謝; PR(B) 
得:
PR(A) = 517/37 = 13.97
PR(B) = 397/37 = 10.73
PR(C) = 307/37 = 8.30&用西nbsp;
增加頁面(miàn)D:
PR(A) = 0.25 + 0.75 (民河10 + PR(D))
PR(B) = 0.25 + 0.75 ×國票 PR(A)
PR(C) = 0.25 + 0.75 × 學對PR(B)
PR(D) = 0.25 + 0.75 × PR(C) 說愛
得:
PR(A) = 419/35 = 11.97輛風
PR(B) = 323/35 = 9.23
PR(C) = 251/35 = 7.17
PR(D) = 197/35 = 5.63 
增加頁面(miàn)後(hòu),所有頁面(miàn)級别增一東加了1,但每個頁面(miàn)的級别值減少了,這(zhè)是由于新加頁面(自開miàn)分享了入鏈代來的值。從這(zhè)個結果看,增我門加頁面(miàn)減少了已有頁面(mi答和àn)的級别值,露了google算法青電服睐小站點的特點。當然,大站點也會(huì)因内容豐林熱富而吸引其它站點的出鏈而得以級别值增加。 
3、針對(duì)搜索引擎優化的級别分布
se_optm2.gifse_optm1.gif 先看兩(liǎng)個列子,阻尼系數爲0.5,她機PR(X)/C(X)=10; 
BC之間無鏈接時(shí):
PR(A) = 0.5 + 0.5 (10 + PR(B) + P綠聽R (C))
PR(B) = 0.5 + 0.5 (PR(A) / 2請謝)
PR(C) = 0.5 + 0.5 (PR(A) /的藍 2) 

PR(A) = 8
PR(B) = 2.5
PR(C) = 2.5
BC之間互相鏈接時(shí):
PR(A) = 0.5 + 0.5 (10 + PR(B) /金報 2 + PR(C) / 2)
PR(B) = 0.5 + 0.5 醫時(PR(A) / 2 + PR(C) / 2)
PR(C) = 0.5 + 0上制.5 (PR(A) / 2 + P農數R(B) / 2) 
得:
PR(A) = 7
PR(B) = 3
PR(C) = 3 
當BC間互鏈時(shí),雖然減少了A的級玩兵别,但BC都(dōu)增加了。這(zhè)符合優化站點所有頁面(m紅街iàn)而非隻主頁的優化思路,因爲隻有每個頁面(miàn)的級别都爸相(dōu)提高了,當有檢索詞命中這(zhè)些頁面(m車見iàn)時(shí),它們才能(néng)排在前面(miàn)。這(zhè)種日制(zhǒng)優化的方法也很明顯了,就(jiù)是盡可能(né制說ng)地在所有頁面(miàn)間平均分布入鏈的貢獻,各低級頁空熱面(miàn)要增加互鏈。 
4、隻要不影響易用性,盡可能(né林制ng)地將(jiāng)所有出鏈集中爸爸在一個或幾個低級頁面(miàn)中,可以有效地降低出鏈對要視(duì)頁面(miàn)級别計算的負面(miàn)影響。你喝看列子:阻尼系數爲0.5,PR(X)/C中技(X)=10;se_optm3.gifse_optm4.gif 
BCD都(dōu)有出鏈時(shí):
PR(A) = 0.5 + 0.5 (PR(B)也訊 / 2 + PR(C) / 2 + PR(D)這花 / 2)
PR(B) = PR(C) = PR(D) = 0.5 + 0.區家5 (PR(A) / 3) 
得:
PR(A) = 1
PR(B) = 2/3
PR(C) = 2/3
PR(D) = 2/3 
出鏈集中于D時(shí):
PR(A) = 0.5 + 0.5 (PR(B) 湖離+ PR(C) + PR(D) / 4)
PR(B) = PR(C) = PR(D) = 0.5 + 0.5頻這 (PR(A) / 3) 
得:
PR(A) = 17/13
PR(B) = 28/39
PR(C) = 28/39
PR(D) = 28/39&n北要bsp;
從結果看,出鏈集中後(hòu)物外,ABCD各頁面(miàn)的級别都(dōu)上升了。 
5、鏈接交換增加了實施交換的頁面(miàn)的級别,卻減少了其它頁那睡面(miàn)的級别。如圖,阻尼系他麗數爲0.5,PR(X)/C(X)=10; 
交換前,
PR(A) = 4/3
PR(B) = 5/6
PR(C) = 5/6 
PR(D) = 4/3
PR(E) = 5/6
PR(F) = 5/6 
交換後(hòu);
PR(A) = 0.5 + 0.5 (家窗PR(B) + PR(C) + PR(D) / 3)
PR(B) = PR(C) = 0.5 + 0.5 (PR(A)有鄉 / 3)
PR(D) = 0.5 + 0.5 (PR(E) + 兒木PR(F) + PR(A) / 3)
PR(E) = PR(F) = 0.5 + 0.5 (PR(D)微新 / 3) 

PR(A) = 3/2
PR(B) = 3/4
PR(C) = 3/4
PR(D) = 3/2
PR(E) = 3/4
PR(F) = 3/4 
這(zhè)情況恰好(hǎo)與增加站内互鏈的笑麗效果相反。由此,當需要對(duì)主頁進(jì著相n)行針對(duì)某一關鍵詞的優化時(shí),厭她才取交換鏈接是可取的。
例中級别值的重新分布,更基本的前提是兩(liǎng)個站點中參考報上交換的頁面(miàn)互相爲對(d可麗uì)方提供的級别值是相等的。如果一個站的某個頁面(miàn)門風級别高或少出鏈,則這(zhè)個站所有頁面(miàn)的級别會(huì為分)降低。這(zhè)兒一個重要的影響學能因素是站點頁面(miàn)的數量。當一個站點的頁面(miàn)更多時(shí光市),有更多的入鏈級别值被(bèi)分布到站點的其它頁面(miàn體區)中,因而參考交換的頁面(miàn)不能(né公謝ng)提供更多貢獻給對(duì)方。

6、很多針對(duì)搜索引擎做網站優化的專家,認一個爲google給一些特殊站點以特定的南有級别而不是按前述算法進(jìn)行計算,這(zhè)些網站的級校通别很有可能(néng)來在Yahoo或ODP(Open Directory P鐵哥roject)。Lawrence Page在他們的專利說(shuō)明中,提到随機沖浪模型中窗村,用記不願繼續點擊時(shí),很了物有可能(néng)借助Yahoo的目錄或ODP到另一個站紙森點去。
由于前述的算法,無論初始的級别值如何票紙,經(jīng)過(guò)足夠次數的叠代最終結果都作花(dōu)是一樣(yàng)的,所以對(duì)小相這(zhè)些特殊站點可能(néng)采用下述的公式。&謝錢nbsp;
PR(A) = E(A) (1-d) + d (司話PR(T1)/C(T1) + ... + PR(Tn)/C空電(Tn)) 

從另一個角度來看,如果給頁面(miàn業你)賦一個跟其實際級别相近的初始值,可以明顯減少叠代次數。弟生 
7、影響頁面(miàn)級别的其它因素
在Lawrence Page和Serg少和ey Brin關于PageRank的論文發(fā)表以後(hòu),除了web的鏈接結構以外,還(hái)照線有沒(méi)有别的因素被(bèi)加麗開到PageRank的算法當中曾經(樂關jīng)有過(guò)廣泛地讨論。Lawrence Page本人在Pag林服eRank的專利說(shuō)明中曾指出以下潛在的影響因素:鏈接的能(né近城ng)見度,鏈接在文檔中的位置,web頁面(miàn)間的距離,出鏈頁面(miàn)的重要性,頁白北面(miàn)的不過(guò)時(shí)。這(zhè樂舊)此因素的增加,可以更好(hǎo)用随機業自沖浪模型模拟人類利用web的行爲。
不管上述附加因素有沒(méi)有在實際計算PageRank時(s車數hí)使用,如何實現這(zhè)些附加因素近什仍要讨論。
首先算法公式需要改進(jìn). 路雨
PR(A) = (1-d) + d (PR(T1)&ti會刀mes;L(T1,A) + ... + PR(Tn)睡廠×L(Tn,A))
此處,L(T1,A)是入鏈的評價值,由幾個因他在素構成(chéng),隻需要在叠代前計算門微一次,減少了對(duì)數據庫的站路查詢次數,雖然每次叠代的查詢結果會(huì)有不同。
pagerank_link_ev.gif
Lawrence Page在PageRank的專利說(shu站樹ō)明中指出鏈接評價的兩(liǎng)個因對話素是鏈接的可見性和在文檔中的位置。下美鏈接評價取代了PR(A)/C(A),指出了外們對(duì)一特定的頁面(miàn)的鏈接,每個鏈接被(bèi)點擊的概見裡率是不同的。
此處,每一鏈接有兩(liǎng)個屬性值,空用X表示可見度,如果沒(méi)有被(bèi)文花重點強調(如粗體、斜體等)爲1否則爲2,Y表鏈接在文檔中的位置,車器如果在文檔下半部爲1否則爲3。則有 
X(A,B) × Y(A,技聽B) = 1 × 3 = 員海3
X(A,C) × Y(A,C) = 1 × 1 = 長子1
X(B,A) × Y(B,A) = 2長購 × 3 = 6
X(B,C) × Y(B,C) = 2 ×到長 1 = 2
X(C,A) × Y(C,A) = 2 &ti睡動mes; 3 = 6
X(C,B) × Y(C,B) = 2 &tim高城es; 1 = 2 
易得:
Z(A) = X(A,B) &ti購時mes; Y(A,B) + X(A,C) &ti房物mes; Y(A,C) = 4
Z(B) = X(B,A) × Y(B吃數,A) + X(B,C) &time們近s; Y(B,C) = 8
Z(C) = X(C,A) × Y(C,A) +路現 X(C,B) × Y(C,B) = 8 
鏈接評價公式爲:(頁面(miàn)T1指向(xiàng)書雨T2)
L(T1,T2) = X(T1,T2) × Y(T1,T2近大) / Z(T1) 
有:
L(A,B) = 0.75
L(A,C) = 0.25
L(B,A) = 0.75
L(B,C) = 0.25
L(C,A) = 0.75
L(C,B) = 0.25 
最後(hòu)利用改進(jìn)的公式計算頁面(miàn)級動跳别:
PR(A) = 0.5 + 0.5 (0.75 PR(B) + 0.7可多5 PR(C))
PR(B) = 0.5 + 0.5 (0.75 PR(A) + 0.服亮25 PR(C))
PR(C) = 0.5 + 0.5 (0.25 PR(村山A) + 0.25 PR(B)) 業森;
得:
PR(A) = 819/693
PR(B) = 721/693
PR(C) = 539/693 

爲了防止人爲的級别優化,頁面(miàn)的距離被(bèi)用來影響鏈接的評價湖南。站内鏈接的權重小于站間鏈接的權重。頁面(miàn)的距離可能(néng)由廠下頁面(miàn)是否在一個站内、一個服務器及物理距玩船離等決定。
另一個影響頁面(miàn)重要性的能(né作雜ng)參數,是頁面(miàn)的不過(guò道山)時(shí)性(up-to-daten化友ess),意指有越多的新建的頁面(miàn)湖為指向(xiàng)某一個頁面(miàn),則這(zhè)個頁面(m上廠iàn)内容過(guò)時(shí)的可能(néng)性越小。
爲增加這(zhè)些因素的影響,都玩要對(duì)公式進(jìn)行修訂如下: 還在;
L(Ti,A) = K(Ti,A) &ti書城mes; K1(Ti) × ...件的 × Km(Ti)事慢 
其中,K(Ti,A)表示鏈接可見度及位置的權重,Kn(Ti)是第n個因素對(我大duì)頁面(miàn)Ti的影響。看列子:船問pagerank_link_ev_2.gif此處,從C引出的鏈接的重要性是黑計其它的4倍。 
K(A) = 0.5
K(B) = 0.5
K(C) = 2 
計算級别值:
PR(A) = 0.5 + 0.5愛站 × 2 PR(C)
PR(B) = 0.5 + 0.5 × 0.5愛腦 × 0.5 PR(A)
PR(C) = 0.5 + 0.5 (秒分0.5 PR(B) + 0.5 × 0.5 PR(A)) 場照;
得:
PR(A) = 4/3
PR(B) = 2/3
PR(C) = 5/6 
此時(shí),所有頁面(miàn)的級别之和不等于頁面(m分一iàn)數量。 
8、Google的PR0懲罰
Google對(duì)采用了搜索優老玩化的網站的一種(zhǒng)懲罰就(jiù)是,把這(zhè)個站子站的所有或很多網頁的網頁級别定爲0,典型的表現就(jiù)是原去姐先不爲0忽然變爲0的情況。當然,PR爲0不一定是受到了懲罰,可能(néng)物見隻是因爲沒(méi)有重要頁面(miàn)鏈到它。
一個Google的員工在WebmasterWorld's Google News論壇上一再提醒網站管理員,一定不要“鏈接到壞鄰明草居”。Raph Levien提出了一種(zh城行ǒng)技術分析鏈接結構獲取頁面(miàn)的負面(miàn)特征,與"兵地PageRank"相似但目标相反,名之爲“BadRank”。
pagerank_pr0.gif BadRank基于“鏈到壞鄰居”謝不,對(duì)BadRank有影響顯然是出鏈,因爲對(duì)PageRan木做k的算法加以改動,即會(huì)适合BadRank的計算。 
BR(A) = E(A) (1-d) + d (BR(T1)/C(關雪T1) + ... + BR(Tn)/懂商C(Tn)) 
,其中,BR(A) 是頁面(m多道iàn)A的BadRank, 下謝BR(Ti)頁面(miàn)Ti的BadRank,頁面(mià呢銀n)A有鏈接到Ti,C(Ti)頁面姐長(miàn)Ti的入鏈數,d是阻尼系數跳水,E(A)表示當前頁面(miàn)有沒(méi)有被(b習著èi)垃圾網頁過(guò)濾系統檢測到。當E(A)爲0時(shí),好老這(zhè)個公式不再有意義,它隻是變成(chéng)了另一種(zh外花ǒng)分析鏈接結構的方法而已。所有頁面(m弟關iàn)的E(A)之和等頁面(miàn)總數。看例子,令E(A)=10少門0,其它的爲1,d=0.85,則有


Page

BadRank

A

22.39

B/C

17.39

D/E/F/G

12.21

可見頁面(miàn)A的BadRank被(bèi)分布到每個頁面自冷(miàn)中了。
上例中,如果所有頁面(miàn)的BadRank都(dōu)爲1,阻尼系討頻數爲0.85,頁面(miàn)G鏈到一個頁面(miàn)X,E(X)=話如10,且這(zhè)個鏈接是pagerank_pr0_2.gifX的唯一的入鏈。則有


Page

BadRank

A

4.82

B

7.50

C

14.50

D

4.22

E

4.22

F

11.22

G

17.18

在這(zhè)種(zhǒng)情況下,所有頁面(miàn暗現)的BadRank都(dōu)有增加,A增如她加得比較少。
常見這(zhè)樣(yàng)的網站,主頁的pagerank在2-自話4之間,而其它頁面(miàn)爲0,這(zhè)去電是可能(néng)由于受到了Go長如ogle的懲罰,或者可能(néng)冷國隻是低層頁面(miàn)有鏈接到“壞鄰居”。(真是這能村(zhè)樣(yàng)嗎?我的路有網站就(jiù)如所述。可怕)。
如果將(jiāng)BadRank和PageRan通學k結合,有多方法,一是相減,一是相除,一是BadRan年間k到了一定值就(jiù)PageRan南外k=0,等等。其實,兩(liǎng)者如何結合并不重要。但是其後謝筆(hòu)果卻值得重視。一種(zhǒng)情況是,一個頁飛愛面(miàn)的PageRank很高,它的BadRank也不低但相對(du畫慢ì)于其PageRank卻可以忽略,那還東麼(me)如果一個鏈向(xiàng)這(zh視票è)個頁面(miàn)但PageRank不高的頁面(miàn)將(jiāng子票)會(huì)深受其害了。另一種(zhǒng)情況更嚴重,無論呢開有多少入鏈幫助增加PageRank,一個到“壞鄰居”的出鏈就(jiù)可能(見厭néng)導緻PR0。對(duì)于後(hò但服u)一種(zhǒng)情況,Google的Matt Cut妹舞t發(fā)言說(shuō),一個到“壞鄰居”的鏈接并不會(hu物身ì)造成(chéng)傷害,但如果有20,就(jiù)是個問題了。對事現(duì)于一高一低兩(liǎng)個紙唱PageRank的頁面(miàn),都(dōu)連到麗鄉一個“壞鄰居”,低PageRank的頁面(miàn)受到少視的傷害會(huì)更厲害,隻喜歡Goog友窗le能(néng)區别這(zhè)種(zhǒng)情況,否則出鏈就綠朋(jiù)隻有壞處而不見什麼(me)好(媽作hǎo)處了。
都(dōu)是關于BadRank的思考,但是對(duì)鏈接結構進(們放jìn)行同PageRank相似的分析來答校确定BadRank似乎是Google的唯一的思謝跳路。

咨詢電話:0755/29555722

(+86) 0755 2955 8889

518000

深圳寶安.西鄉寶源.F518時(高低shí)尚創意園.15棟405

體驗手機版您可以免費體驗我們的服務(即時(sh理會í)回複)

WWW.W-VI.COM
Copyright © W-De習資sign. All Rights Rese吃多rved. 華仕尊城 版權所有 粵ICP 12007005-1 手機版 盜版必究 法律聲明