
搜索引擎對頁面的分詞取決于詞庫的規(guī)模、準確性和分詞算法的好壞,而不是取決于頁面本身如何,所以網站優(yōu)化人員對分詞所能做的很少。井陘正規(guī)建設網站唯一能做的是在頁面上用某種形式提示搜索引擎,某幾個字應該被當做一個詞處理,尤其是可能產生歧義的時候,比如在頁面標題、hl標簽及黑體中出現(xiàn)關鍵詞。建設網站多少錢如果頁面是關于“和服”的內容,那么可以把“和服”這兩個字特意標為黑體。如果頁面是關于“化妝利服裝”,可以把“服裝”兩個字標為黑體。

指令處理。正規(guī)建設網站查詢詞完成分詞后,搜索引擎的默認處理方式是在關鍵詞之間使用“與”邏輯。也就是說用戶搜索“減肥方法”時,程序分詞為“減肥”和“方法”兩個詞,搜索引擎排序時默認認為,用戶尋找的是既包含“減肥”,建設網站多少錢也包含“方法”的頁面。只包含“減肥”不包含“方法”,或者只包含“方法”不包含“減肥”的頁面,被認為是不符合搜索條件的。當然,這只是極為簡化的為了說明原理的說法,實際上我們還是會看到只包含一部分關鍵詞的搜索結果。

井陘正規(guī)建設網站同一篇文章經常會重復出現(xiàn)在不同網站及同一個網站的不同網址上,搜索引擎并不喜歡這種重復性的內容。用戶搜索時,如果在前兩頁看到的都是來自不同網站的同一篇文章,用戶體驗就太差了,雖然都是內容相關的。建設網站多少錢搜索引擎希望只返回相同文章中的一篇,所以在進行索引前還需要識別和刪隙重復內容,這個過程就稱為“去重”。去重的基本方法是對頁面特征關鍵詞計算指紋,也就是說從頁面主體內容中選取Z有代表性的一部分關鍵詞(經常是出現(xiàn)頻率Z高的關鍵詞),然后計算這些關鍵詞的數字指紋。

正規(guī)建設網站正向索引還不能直接用于排名。假設用戶搜索關鍵詞2,如果只存在正向索引,排名程序需要掃描所有索引庫中的文件,找出包含關鍵詞2的文件,再進行相關性計算。這樣的計算量無法滿足實時返回排名結果的要求。建設網站多少錢所以搜索引擎會將正向索引數據庫重新構造為倒排索引,把文件對應到關鍵詞的映射轉換為關鍵詞到文件的映射,在倒排索引中關鍵詞是主鍵,每介關鍵詞都對應著一系列文件,這些文件中都出現(xiàn)了這個關鍵詞。這樣當用戶搜索某個關鍵詞時,排序程序在倒排索引中定位到這個關鍵詞,就可以馬上找出所有包含這個關鍵詞的文件。

為什么要了解搜索引擎原理?井陘建設網站說到底,網站優(yōu)化是在保證用戶體驗的基礎上盡量迎合搜索引擎。與研究用戶界面及可用性不同的是,網站優(yōu)化既要從用戶出發(fā),也要站在搜索引擎的角度考慮問題,才能清晰地知道怎樣優(yōu)化網站。正規(guī)建設網站網站優(yōu)化人員必須知道:搜索引擎要解決什么問題,有哪些技術上的困難,有什么限制,搜索引擎又怎樣取舍。從某個角度來說,網站優(yōu)化人員優(yōu)化網站就是盡量減少搜索引擎的工作量、降低搜索引擎的工作難度,使搜索引擎能更輕松、快速地收錄網站頁面,更準確地提取頁面內容。

正規(guī)建設網站由此可見,雖然理論上蜘蛛能爬行和抓取所有頁面,但實際上不能、也不會這么做。網站優(yōu)化人員要想讓自己的更多頁面被收錄,就要想方設法吸引蜘蛛來抓取。既然不能抓取所有頁面,蜘蛛所要做的就是盡量抓取重要頁面。建設網站多少錢哪些頁面被認為比較重要呢?有幾方面影響因素。網站優(yōu)化網站和頁面權重。質量高、資格老的網站被認為權重比較高,這種網站上的頁面被爬行的深度也會比較高,所以會有更多內頁被收錄。 網站優(yōu)化頁面更新度。