前面我們碧鑫設(shè)計(jì)分享了《搜索引擎工作原理之預(yù)處理和索引與鏈接關(guān)系的計(jì)算》,當(dāng)搜索引擎蜘蛛爬行和抓取網(wǎng)頁之后,會(huì)對(duì)得到的網(wǎng)頁進(jìn)行一系列的預(yù)處理,最后得到關(guān)于網(wǎng)頁的反向索引集合,這時(shí)搜索引擎就可以根據(jù)用戶輸入的搜索詞對(duì)網(wǎng)頁做出排名了。
當(dāng)然,從用戶輸入搜索詞到搜索引擎展示出相關(guān)的網(wǎng)頁排名結(jié)果,中間還要經(jīng)過相當(dāng)復(fù)雜的計(jì)算過程!
搜索引擎會(huì)對(duì)用戶輸入的搜索詞進(jìn)行分詞處理和去噪,如果對(duì)分詞處理和去噪還不是很了解的小伙伴,大家可以到《參考搜索引擎工作原理:預(yù)處理這篇文章》,這里就不多做介紹了,當(dāng)搜索引擎分詞和去噪完畢之后,會(huì)得到幾個(gè)關(guān)鍵詞,然后按照這幾個(gè)關(guān)鍵詞的邏輯“與”關(guān)系到反向索引集合中去進(jìn)行匹配,比如網(wǎng)友輸入“桂林網(wǎng)站建設(shè)”最后會(huì)被搜索引擎分詞成“桂林”,“網(wǎng)站”,“建設(shè)”這三個(gè)關(guān)鍵詞,然后再去爬行和抓取的網(wǎng)頁反向索引庫中查找同時(shí)包含這三個(gè)關(guān)鍵詞的頁面,因?yàn)檫@樣得到的網(wǎng)頁相關(guān)性更高。
當(dāng)搜索引擎得到這些網(wǎng)頁之后會(huì)發(fā)現(xiàn),這些網(wǎng)頁的數(shù)量是相當(dāng)龐大的,而用于展示在用戶面前的搜索結(jié)果頁面不超過1000個(gè),百度也只展示了760個(gè)頁面,所以搜索引擎會(huì)對(duì)這些頁面進(jìn)行相關(guān)性之外的計(jì)算,其中影響較大的一個(gè)因素就是網(wǎng)頁的權(quán)重,根據(jù)網(wǎng)頁權(quán)重的高低排序會(huì)篩選出一批頁面,至于篩選出多少頁面,這里不得而知,但肯定大于1000個(gè)頁面。
在選出這些權(quán)重較高相關(guān)性較強(qiáng)的頁面之后,接下來搜索引擎會(huì)對(duì)這些頁面進(jìn)行更加細(xì)微的相關(guān)性計(jì)算,這個(gè)過程也是我們seoer更為關(guān)心的一個(gè)過程,因?yàn)檫@個(gè)過程中的很多因素是我們這些seoer可以控制的。
關(guān)鍵詞的常見指數(shù),比如用戶搜索“深圳旅游”,經(jīng)過搜索引擎分詞可以分成“深圳”,“旅游”,我們可以很明顯的看出“旅游”這個(gè)詞在我們生活中經(jīng)常會(huì)出現(xiàn),而“深圳”就出現(xiàn)的比較少了,針對(duì)都包含“深圳”和“旅游”關(guān)鍵詞的兩個(gè)頁面,顯然在標(biāo)題中出現(xiàn)關(guān)鍵詞“深圳”比內(nèi)容中出現(xiàn)“深圳”的相關(guān)性更強(qiáng)。
關(guān)鍵詞的頻率及密度,這個(gè)比較好理解,如果關(guān)鍵詞在頁面中的出現(xiàn)的頻率很高,密度也很大(這里不考慮關(guān)鍵詞的堆砌),那么這個(gè)頁面和這個(gè)關(guān)鍵詞的相關(guān)性很強(qiáng)。
關(guān)鍵詞的位置和表現(xiàn)形式,就像在上面說的搜索引擎工作原理:索引與鏈接關(guān)系的計(jì)算這篇文章中提到的,關(guān)鍵詞的位置和表現(xiàn)形式都會(huì)被列入相關(guān)性計(jì)算中,比如一些標(biāo)題標(biāo)簽的使用,文字加粗和顏色變化,H1標(biāo)簽等。
關(guān)鍵詞是否完整匹配,如果關(guān)鍵詞能夠完整匹配用戶的搜索詞,則相關(guān)性高,即使沒能完整匹配,但是關(guān)鍵詞之間距離很短,這樣也會(huì)被認(rèn)為相關(guān)性較高。
錨文本和權(quán)重,頁面的權(quán)重對(duì)關(guān)鍵詞的相關(guān)性影響非常大,而錨文本的重要性與頁面的權(quán)重幾乎相當(dāng),如果錨文本的錨點(diǎn)采用的是用戶搜索的關(guān)鍵詞,那么這個(gè)錨文本會(huì)給這個(gè)關(guān)鍵詞帶來很大的鏈接權(quán)重,包括錨文本周圍的文字也需要重點(diǎn)布局。
經(jīng)過以上這些關(guān)于頁面與關(guān)鍵詞之間相關(guān)性計(jì)算之后,網(wǎng)頁的排名結(jié)果頁就浮出水面了,接下來的工作就是搜索引擎調(diào)用頁面的標(biāo)題,頁面描述,網(wǎng)址,快照等數(shù)據(jù)顯示在搜索結(jié)果頁面中。
我們通過幾篇文章介紹了搜索引擎的工作原理,要想做好網(wǎng)站優(yōu)化,理解搜索引擎的工作原理還是非常重要的,這樣我們的優(yōu)化才會(huì)更有目的性,希望能對(duì)大家有所幫助!