久热re国产手机在线观看_日韩精品欧美激情人妻视频_色帝国亚洲欧美在线蜜汁tv_苍井空被躁黑人50分钟_无码网站免费观看_午夜影院日韩剧场_正在播放国产av国模私拍_欧美成人性爱视频_欧美国产精品一区二区_黄网站色视频三级片

一站式電子商務(wù)網(wǎng)絡(luò)營銷機構(gòu)!手機微信:18923745965 域名主機續(xù)費 ?| ?微站公眾號管理 | ?微云商城管理
咨詢電話:0755-83808132
新聞觀點

搜索引擎工作原理之收錄預(yù)處理

標(biāo)簽: 收錄預(yù)處理 ? | 作者:admin | VISITORS: | 來源:碧鑫設(shè)計
26
Apr
2020

    今天我們碧鑫設(shè)計給大家分享搜索引擎工作過程中一個非常重要的階段“收錄預(yù)處理”,也就是大家常說的索引。當(dāng)用戶在搜索引擎中輸入搜索詞之后,搜索引擎并不是根據(jù)用戶的搜索詞然后來計算頁面給予排名的,而是事先在爬行和抓取頁面的時候就進行了預(yù)處理,要不然也不可能在很短時間內(nèi)根據(jù)搜索詞展現(xiàn)出排名。

 

 

 

 

 

 

      首先,搜索引擎會對爬行的頁面進行篩選和提取文字信息,以便進行排名處理,通過搜索引擎的這個動作,我們知道在頁面中添加meta信息,圖片的alt標(biāo)簽,錨文本的文字設(shè)定,a標(biāo)記中的title標(biāo)簽還是非常有必要的。

 

 

      緊接著搜索引擎會對篩選出來的這一大堆文字進行分詞處理,以此來判定哪些字可以組成一個詞,搜索引擎的分詞過程一般有兩種分法,一個是通過搜索引擎數(shù)據(jù)庫中已經(jīng)創(chuàng)建好的詞典,另一種是根據(jù)日常統(tǒng)計,不過為了提高分詞的效率,通常都是兩種方法并行的。

 

 

 

      通過詞典進行分詞,是指搜索引擎根據(jù)自己創(chuàng)建的詞典,跟網(wǎng)頁中提取的文字進行匹配,如果匹配成功的話,就算分出了一個詞,而根據(jù)日常統(tǒng)計則是指搜索引擎對網(wǎng)絡(luò)上提取的文本做了大量的分析,哪些字經(jīng)常出現(xiàn)在一起,那么就會把它判定為一個詞組,不過搜索引擎更喜歡的是比較長的最大匹配詞組,也就是我們常說的長尾關(guān)鍵詞,因為這樣顯示出來的搜索結(jié)果將會更加精確。關(guān)于搜索引擎是如何進行分組的,大家可以參考網(wǎng)站快照中帶顏色的詞,這里說明這只是一個參考,因為網(wǎng)站快照所能提供的分詞信息很少,有時也并不能完全表達出搜索引擎的意愿。而我們在這個環(huán)節(jié)能進行優(yōu)化的就是,通過頁面標(biāo)題,H1標(biāo)簽,關(guān)鍵詞加粗的方式來提示搜索引擎,這是一個詞組,同時還有強調(diào)的作用。

 

 

 

      當(dāng)搜索引擎分詞完畢后,接下來要進行的工作就是去除這些詞中的干擾信息,俗稱“去噪”,搜索引擎去噪主要從兩方面進行去噪,一個是把這些詞組中一些完全跟網(wǎng)站主題無關(guān)的詞組去掉,比如我們文章中經(jīng)常包含的一些“的”,“啊”,“然而”之類的助詞,感嘆詞和副詞,進行去噪的第二步則是把網(wǎng)站中沒有用的模塊中包含的詞組去掉,比如免責(zé)聲明,廣告字段,版權(quán)信息,分頁列表等等,通過去噪后剩余的內(nèi)容才是搜索引擎想要的內(nèi)容。

 

 

 

      在搜索引擎獲得了有用的信息之后,是不是我們就可以通過這些內(nèi)容進行網(wǎng)頁排名了?NO!接下來的這一步,我相信是很多站長比較心痛的一個環(huán)節(jié)——去重。搜索引擎會在這些得到的內(nèi)容中提取出N個最能代表頁面主題的關(guān)鍵詞,進行指數(shù)分析,如果指數(shù)顯示網(wǎng)上已經(jīng)存在大量的相同信息,搜索引擎將會進行刪除操作,這也就是為什么很多站長通過復(fù)制或轉(zhuǎn)載來的文章不被收錄展示的原因。

相關(guān)新聞
首頁 | 深圳網(wǎng)站建設(shè) | 網(wǎng)站案例 | 服務(wù)范圍 | 新聞觀點 | 服務(wù)客戶 | 聯(lián)系我們