
有實(shí)力做網(wǎng)站公司不了解搜索引擎工作原理,也就無(wú)從替搜索引擎解決一些網(wǎng)站優(yōu)化力所能及的技術(shù)問(wèn)題。當(dāng)搜索引擎面對(duì)一個(gè)網(wǎng)站,發(fā)現(xiàn)要處理的問(wèn)題太多、難度太大時(shí),搜索引擎可能就對(duì)這樣的網(wǎng)站敬而遠(yuǎn)之了。很多網(wǎng)站優(yōu)化技巧是基于對(duì)搜索引擎的理解。下面舉幾個(gè)例子。我們都知道網(wǎng)站域名和頁(yè)面權(quán)重非常重要,這是知其然,做網(wǎng)站公司哪家好很多人不一定知其所以然。權(quán)重除了意味著權(quán)威度高、內(nèi)容可靠,因而容易獲得好排名外,獲得一個(gè)Z基本的權(quán)重,也是頁(yè)面能參與相關(guān)性計(jì)算的Z基本條件。一些權(quán)重太慨的頁(yè)面,就算有很高的相關(guān)性也很可能無(wú)法獲得排名,因?yàn)楦緵]有機(jī)會(huì)參與排名。

蜘蛛的爬行、頁(yè)面的收錄及排序都是自動(dòng)處理。網(wǎng)站目錄則是一套人工編輯的分類目錄,邢臺(tái)有實(shí)力做網(wǎng)站公司由編輯人員人工創(chuàng)建多個(gè)層次的分類,站長(zhǎng)可以在不同分類里提交網(wǎng)站,目錄編輯在后臺(tái)審核所提交的網(wǎng)站,將網(wǎng)站放置于相應(yīng)的分類頁(yè)面。有的時(shí)候編輯也主動(dòng)收錄網(wǎng)站。做網(wǎng)站公司哪家好典型的網(wǎng)站目錄包括雅虎目錄、開放目錄、好123等。目錄并不是本書中所討論的SEO所關(guān)注的真正的搜索引擎。雖然網(wǎng)站目錄也常有一個(gè)搜索框,但目錄的數(shù)據(jù)來(lái)源是人工編輯得到的。

有實(shí)力做網(wǎng)站公司這里的關(guān)鍵詞選取是在分詞、去停止詞、消噪之后。實(shí)驗(yàn)表明,通常選取10個(gè)特征關(guān)鍵詞就可以達(dá)到比較高的計(jì)算準(zhǔn)確性,再選取更多詞對(duì)去重準(zhǔn)確性提高的貢獻(xiàn)也就不大了。典型的指紋計(jì)算方法如MD5算法(信息摘要算法第五版)。做網(wǎng)站公司哪家好這類指紋算法的特點(diǎn)是,輸入(特征關(guān)鍵詞)有任何微小的變化,都會(huì)導(dǎo)致計(jì)算出的指紋有很大差距。了解了搜索引擎的去重算法,網(wǎng)站優(yōu)化人員就應(yīng)該知道簡(jiǎn)單地“的”、“地”、“得”、調(diào)換段落順序這種所謂偽原創(chuàng),并不能逃過(guò)搜索引擎的去重算法,因?yàn)檫@樣的操作無(wú)法改變文章的特征關(guān)鍵詞。

用戶搜索“歷史”、“分類”這些關(guān)鍵詞時(shí)僅僅因?yàn)轫?yè)面上有這些詞出現(xiàn)而返回博客帖子是毫無(wú)意義的,完全不相關(guān)。有實(shí)力做網(wǎng)站公司所以這些區(qū)塊都屬于噪聲,對(duì)頁(yè)面主題只能起到分散作用。搜索引擎需要識(shí)別并消除這些噪聲,排名時(shí)不使用噪聲內(nèi)容。做網(wǎng)站公司哪家好消噪的基本方法是根據(jù)HTML標(biāo)簽對(duì)頁(yè)面分塊,區(qū)分出頁(yè)頭、導(dǎo)航、正文、頁(yè)腳、廣告等區(qū)域,在網(wǎng)站上大量重復(fù)出現(xiàn)的區(qū)塊往往屬于噪聲。對(duì)頁(yè)面進(jìn)行消噪后,剩下的才是頁(yè)面主體內(nèi)容。

另外用戶輸入的查詢?cè)~還可能包含一些高級(jí)搜索指令,如加號(hào)、減號(hào)等,搜索引擎都需要做出識(shí)別和相應(yīng)處理。有關(guān)高級(jí)搜索指令,后面還有詳細(xì)說(shuō)明。有實(shí)力做網(wǎng)站公司寫錯(cuò)誤矯正。用戶如果輸入了明顯錯(cuò)誤的字或英文單詞拼錯(cuò),搜索引擎會(huì)提示用戶正確的用字或拼法,輸入的錯(cuò)拼、錯(cuò)字矯正,整合搜索觸發(fā)。某些搜索詞會(huì)觸發(fā)整合搜索,比如明星姓名就經(jīng)常觸發(fā)圖片和視頻內(nèi)容,做網(wǎng)站公司哪家好當(dāng)前的熱門話題又容易觸發(fā)資訊內(nèi)容。哪些詞觸發(fā)哪些整合搜索,也需要在搜索詞處理階段計(jì)算。

邢臺(tái)有實(shí)力做網(wǎng)站公司搜索引擎和目錄兩者各有優(yōu)劣。搜索引擎收錄的頁(yè)面數(shù)遠(yuǎn)遠(yuǎn)高于目錄能收錄的頁(yè)面數(shù)。但搜索引擎收錄的頁(yè)面質(zhì)量參差不齊,對(duì)網(wǎng)站內(nèi)容和關(guān)鍵詞提取的準(zhǔn)確性通常也沒有目錄高。限于人力,目錄能收錄的通常只是網(wǎng)蛄首頁(yè),做網(wǎng)站公司哪家好而且規(guī)模十分有限,不過(guò)收錄的網(wǎng)站通常質(zhì)量比較高。像雅虎、開放目錄、好123這些大型目錄,收錄標(biāo)準(zhǔn)非常高。目錄收錄網(wǎng)站時(shí)存儲(chǔ)的頁(yè)面標(biāo)題、說(shuō)明文字都是人工編輯的,比較準(zhǔn)確。搜索引擎數(shù)據(jù)更新快,而目錄中收錄的很多網(wǎng)站內(nèi)容十分陳1日,甚至網(wǎng)站可能已經(jīng)不再存在了。