
在排名中計(jì)入鏈接因素,不僅有助于減少垃圾,提高結(jié)果相關(guān)性,也使傳統(tǒng)關(guān)鍵詞匹 配無法排名的文件能夠被處理。有實(shí)力網(wǎng)站建設(shè)公司比如圖片、視頻文件無法進(jìn)行關(guān)鍵詞匹配,但是卻可能有 外部鏈接,通過鏈接信息,搜索引擎就可以了解圖片和視頻的內(nèi)容從而排名。不同文字的頁面排名也成為可能。比如在百度或google.cn搜索“SEO”,網(wǎng)站建設(shè)公司哪家好都可以看到 英文和其他文字的SEO網(wǎng)站。甚至搜索“搜索引擎優(yōu)化”,也可以看到非中文頁面,原因 就在于有的鏈接可能使用“搜索引擎優(yōu)化”為錨文字指向英文頁面。

有實(shí)力網(wǎng)站建設(shè)公司詞頻及密度。一般認(rèn)為在沒有關(guān)鍵詞堆積的情況下,搜索詞在頁面中出現(xiàn)的次數(shù)多,密度越高,說明頁面與搜索詞越相關(guān)。當(dāng)然這只是一個大致規(guī)律,實(shí)際情況未必如此,所以相關(guān)性計(jì)算還有其他因素。網(wǎng)站建設(shè)公司哪家好出現(xiàn)頻率及密度只是因素的一部分,而且重要程度越來越低。關(guān)鍵詞位置及形式。就像在索引部分中提到的,頁面關(guān)鍵詞出現(xiàn)的格武和位置都被記錄在索引庫中。關(guān)鍵詞出現(xiàn)在比較重要的位置,如標(biāo)題標(biāo)簽、黑體、Hl等,說明頁面與關(guān)鍵詞越相關(guān)。這一部分就是頁面網(wǎng)站優(yōu)化所要解決的。

我們經(jīng)常在搜索結(jié)果中看到,排名會沒有明顯原因地上下波動,甚至可能刷新一下頁面,就看到不同的排名,有的時候網(wǎng)站數(shù)據(jù)也可能丟失。網(wǎng)站建設(shè)公司哪家好這些都可能與大規(guī)模數(shù)據(jù)存儲的技術(shù)難題有關(guān)。索引處理快速有效,具可擴(kuò)展性 搜索引擎將頁面數(shù)據(jù)抓取和存儲后,還要進(jìn)行索引處理,滄州有實(shí)力網(wǎng)站建設(shè)公司包括鏈接關(guān)系的計(jì)算、正向索引、倒排索引等。由于數(shù)據(jù)庫中頁面數(shù)量大,進(jìn)行PR之類的迭代計(jì)算也是耗時費(fèi)力的。要想及時提供相關(guān)又及時的搜索結(jié)果,僅僅抓取沒有用,還必須進(jìn)行大量索引計(jì)算。由于隨時都有新數(shù)據(jù)、新頁面加入,因此索引處理也要具備很好的擴(kuò)展性。

有實(shí)力網(wǎng)站建設(shè)公司實(shí)際上用戶并不需要知道所有匹配的幾十萬、幾百萬個頁面,絕大部分用戶只會查看前兩頁,也就是前20個結(jié)果。搜索引擎也并不需要計(jì)算這么多頁面的相關(guān)性,而只要計(jì)算Z重要的一部分頁面就可以了。常用搜索引擎的人都會注意到,搜索結(jié)果頁面通常Z多顯示100個。網(wǎng)站建設(shè)公司哪家好用戶點(diǎn)擊搜索結(jié)果頁面底部的“下一頁”鏈接,Z多也只能看到第100頁,也就是1000個搜索結(jié)果但問題在于,還沒有計(jì)算相關(guān)性時,搜索引擎又怎么知道哪一千個文件是晟相關(guān)的?所以用于Z后相關(guān)性計(jì)算的初始頁面子集的選擇,必須依靠其他特征而不是相關(guān)性,其中Z主要的就是頁面權(quán)重。