
為什么要了解搜索引擎原理?邢臺網(wǎng)站制作說到底,網(wǎng)站優(yōu)化是在保證用戶體驗的基礎(chǔ)上盡量迎合搜索引擎。與研究用戶界面及可用性不同的是,網(wǎng)站優(yōu)化既要從用戶出發(fā),也要站在搜索引擎的角度考慮問題,才能清晰地知道怎樣優(yōu)化網(wǎng)站。正規(guī)網(wǎng)站制作網(wǎng)站優(yōu)化人員必須知道:搜索引擎要解決什么問題,有哪些技術(shù)上的困難,有什么限制,搜索引擎又怎樣取舍。從某個角度來說,網(wǎng)站優(yōu)化人員優(yōu)化網(wǎng)站就是盡量減少搜索引擎的工作量、降低搜索引擎的工作難度,使搜索引擎能更輕松、快速地收錄網(wǎng)站頁面,更準(zhǔn)確地提取頁面內(nèi)容。

正規(guī)網(wǎng)站制作中文分詞,分詞是中文搜索引擎特有的步驟。搜索引擎存儲和處理頁面及用戶搜索都是以詞為基礎(chǔ)的。英文等語言單詞與單詞之間有空格分隔,搜索引擎索引程序可以直接把句子劃分為單詞的集合。而中文詞與詞之間沒有任何分隔符,一個句子中的所有字和詞都是連在一起的。網(wǎng)站制作多少錢搜索引擎必須首先分辨哪幾個字組成一個詞,哪些字本身就是一個詞。比如“減肥方法”將被分詞為“減肥”和“方法”兩個詞。中文分詞方法基本上有兩種,一種是基于詞典匹配,另一種是墓于統(tǒng)計。

邢臺正規(guī)網(wǎng)站制作同一篇文章經(jīng)常會重復(fù)出現(xiàn)在不同網(wǎng)站及同一個網(wǎng)站的不同網(wǎng)址上,搜索引擎并不喜歡這種重復(fù)性的內(nèi)容。用戶搜索時,如果在前兩頁看到的都是來自不同網(wǎng)站的同一篇文章,用戶體驗就太差了,雖然都是內(nèi)容相關(guān)的。網(wǎng)站制作多少錢搜索引擎希望只返回相同文章中的一篇,所以在進行索引前還需要識別和刪隙重復(fù)內(nèi)容,這個過程就稱為“去重”。去重的基本方法是對頁面特征關(guān)鍵詞計算指紋,也就是說從頁面主體內(nèi)容中選取Z有代表性的一部分關(guān)鍵詞(經(jīng)常是出現(xiàn)頻率Z高的關(guān)鍵詞),然后計算這些關(guān)鍵詞的數(shù)字指紋。

正規(guī)網(wǎng)站制作文件存儲搜索引擎蜘蛛抓取的數(shù)據(jù)存入原始頁面數(shù)據(jù)庫。其中的頁面數(shù)據(jù)與用戶瀏覽器得到的HTML是完全一樣的。每個URL都有一個獨特的文件編號。爬行時的復(fù)制內(nèi)容檢測網(wǎng)站制作多少錢 檢測并刪除復(fù)制內(nèi)容通常是在下面介紹的預(yù)處理過程中進行的,但現(xiàn)在的蜘蛛在爬行和抓取文件時也會進行一定程度的復(fù)制內(nèi)容檢測。遇到權(quán)重很低的網(wǎng)站上大量轉(zhuǎn)載或抄襲內(nèi)容時,很可能不再繼續(xù)爬行。這也就是有的站長在日志文件中發(fā)現(xiàn)了蜘蛛,但頁面從來沒有被真正收錄過的原因。

正規(guī)網(wǎng)站制作正向索引還不能直接用于排名。假設(shè)用戶搜索關(guān)鍵詞2,如果只存在正向索引,排名程序需要掃描所有索引庫中的文件,找出包含關(guān)鍵詞2的文件,再進行相關(guān)性計算。這樣的計算量無法滿足實時返回排名結(jié)果的要求。網(wǎng)站制作多少錢所以搜索引擎會將正向索引數(shù)據(jù)庫重新構(gòu)造為倒排索引,把文件對應(yīng)到關(guān)鍵詞的映射轉(zhuǎn)換為關(guān)鍵詞到文件的映射,在倒排索引中關(guān)鍵詞是主鍵,每介關(guān)鍵詞都對應(yīng)著一系列文件,這些文件中都出現(xiàn)了這個關(guān)鍵詞。這樣當(dāng)用戶搜索某個關(guān)鍵詞時,排序程序在倒排索引中定位到這個關(guān)鍵詞,就可以馬上找出所有包含這個關(guān)鍵詞的文件。

頁面Z下面又是一個贊助商廣告,與頁面頂部的廣告相同。頁面左側(cè)頂部及左側(cè)底部的廣告,邢臺正規(guī)網(wǎng)站制作并不是每次搜索有廣告商競價時都會出現(xiàn),只有點擊率和質(zhì)量分?jǐn)?shù)達到一定水平的廣告才會出現(xiàn)在左側(cè)頂部或底部。網(wǎng)站優(yōu)化Z關(guān)注的是占據(jù)頁面主體的自然搜索結(jié)果。網(wǎng)站制作多少錢統(tǒng)計數(shù)據(jù)顯示,自然搜索結(jié)果總點擊訪問數(shù)要遠遠大于廣告點擊數(shù)。但是企業(yè)花費在網(wǎng)站優(yōu)化上的費用卻遠遠低于花費在搜索廣告上的費用。這既是網(wǎng)站優(yōu)化的尷尬,也是Z大的機會。掌握了網(wǎng)站優(yōu)化流量,才能掌握Z大搜索流量。