
“不同維度” 包括:
(1) 相關(guān)性。網(wǎng)頁(yè)內容與用戶(hù)檢索需求的匹配程度,如網(wǎng)頁(yè)包含的用戶(hù)檢查關(guān)鍵詞的個(gè)數,以及這些關(guān)鍵詞出現的位置;外部網(wǎng)頁(yè)指向該頁(yè)面所用的錨文本等。
(2) 權威性。用戶(hù)喜歡有一定權威性網(wǎng)站提供的內容,相應地,百度搜索引擎也更相信優(yōu)質(zhì)權威站點(diǎn)提供的內容。
(3) 時(shí)效性。時(shí)效性結果指的是新出現的網(wǎng)頁(yè),且網(wǎng)頁(yè)內承載了新鮮的內容。目前,時(shí)效性結果在搜索引擎中日趨重要
(4) 重要性。網(wǎng)頁(yè)內容與用戶(hù)檢查需求匹配的重要程度或受歡迎程度。
(5) 豐富度。豐富度看似簡(jiǎn)單,卻是一個(gè)覆蓋范圍非常廣的命題,可以理解為網(wǎng)頁(yè)內容豐富,可以完全滿(mǎn)足用戶(hù)需求;也可以理解為不僅可以滿(mǎn)足用戶(hù)單一需求,還可以滿(mǎn)足用戶(hù)的延展需求。
(6) 受歡迎程度,指該網(wǎng)頁(yè)是不是受歡迎
以上便是百度搜索引擎決定搜索結果排序時(shí)考慮的六大原則。那么,六大原則的側重點(diǎn)是怎樣的呢? 哪個(gè)原則在實(shí)際應用時(shí)占比最大呢? 其實(shí),在這里沒(méi)有一個(gè)確切的答案。在百度搜索引擎早期,這些閾值的確是相對固定的,如“相關(guān)性" 在整體排序中的重量可以占到七成,但隨著(zhù)互聯(lián)網(wǎng)的不斷發(fā)展,檢索技術(shù)的進(jìn)步,網(wǎng)站建設數量的爆發(fā)式增長(cháng),相關(guān)性已經(jīng)不是難題。于是,百度搜索引擎引人了機器學(xué)習機制,讓程序自動(dòng)產(chǎn)出計算公式,推進(jìn)排序策略更加合理。