
正規(guī)網(wǎng)站建設(shè)實際上用戶并不需要知道所有匹配的幾十萬、幾百萬個頁面,絕大部分用戶只會查看前兩頁,也就是前20個結(jié)果。搜索引擎也并不需要計算這么多頁面的相關(guān)性,而只要計算Z重要的一部分頁面就可以了。常用搜索引擎的人都會注意到,搜索結(jié)果頁面通常Z多顯示100個。網(wǎng)站建設(shè)多少錢用戶點擊搜索結(jié)果頁面底部的“下一頁”鏈接,Z多也只能看到第100頁,也就是1000個搜索結(jié)果但問題在于,還沒有計算相關(guān)性時,搜索引擎又怎么知道哪一千個文件是晟相關(guān)的?所以用于Z后相關(guān)性計算的初始頁面子集的選擇,必須依靠其他特征而不是相關(guān)性,其中Z主要的就是頁面權(quán)重。

正規(guī)網(wǎng)站建設(shè)正向索引還不能直接用于排名。假設(shè)用戶搜索關(guān)鍵詞2,如果只存在正向索引,排名程序需要掃描所有索引庫中的文件,找出包含關(guān)鍵詞2的文件,再進行相關(guān)性計算。這樣的計算量無法滿足實時返回排名結(jié)果的要求。網(wǎng)站建設(shè)多少錢所以搜索引擎會將正向索引數(shù)據(jù)庫重新構(gòu)造為倒排索引,把文件對應(yīng)到關(guān)鍵詞的映射轉(zhuǎn)換為關(guān)鍵詞到文件的映射,在倒排索引中關(guān)鍵詞是主鍵,每介關(guān)鍵詞都對應(yīng)著一系列文件,這些文件中都出現(xiàn)了這個關(guān)鍵詞。這樣當用戶搜索某個關(guān)鍵詞時,排序程序在倒排索引中定位到這個關(guān)鍵詞,就可以馬上找出所有包含這個關(guān)鍵詞的文件。

正規(guī)網(wǎng)站建設(shè)搜索是近20年互聯(lián)網(wǎng)變化Z快的領(lǐng)域之一,這種變化不僅體現(xiàn)在搜索技術(shù)突飛猛進和對網(wǎng)絡(luò)經(jīng)濟的巨大推動上,搜索引擎本身昀合縱連橫、興衰起伏也是精彩紛呈,常令人有眼花繚亂、瞠目結(jié)舌之感。了解搜索引擎的發(fā)展歷史有助于網(wǎng)站優(yōu)化人員理解搜索引擎營銷的發(fā)展、變革,網(wǎng)站建設(shè)多少錢對未來有更準確的預(yù)期。本節(jié)就簡要列出搜索引擎發(fā)展史上的重要事件,其中很多事件對今天搜索以及網(wǎng)站優(yōu)化行業(yè)的形態(tài)有至關(guān)重要的影響。

正規(guī)網(wǎng)站建設(shè)站長通過搜索引擎網(wǎng)頁提交表格提交進來的網(wǎng)址。蜘蛛按重要性從待訪問地址庫中提取URL,訪問并抓取頁面,然后把這個URL從待訪問地址庫中刪除,放進己訪問地址庫中。大部分主流搜索引擎都提供一個表格,讓站長提交網(wǎng)址。網(wǎng)站建設(shè)多少錢不過這些提交來的網(wǎng)址都只是存入地址庫而已,是否收錄還要看頁面重要性如何。搜索引擎所收錄的絕大部分頁面是蜘蛛自己跟蹤鏈接得到的??梢哉f提交頁面基本上是毫無用處的,搜索引擎更喜歡自己沿著鏈接發(fā)現(xiàn)新頁面。

正規(guī)網(wǎng)站建設(shè)雖然搜索引擎在識別圖片及從Flash中提取文字內(nèi)容方面有些進步,不過距離直接靠讀取圖片、視頻、Flash內(nèi)容返回結(jié)果的目標還很遠。對圖片、視頻內(nèi)容的排名還往往是依據(jù)與之相關(guān)的文字內(nèi)容,詳細情況可以參考后面的整合搜索部分。網(wǎng)站建設(shè)多少錢排名 經(jīng)過搜索引擎蜘蛛抓取頁面,索引程序計算得到倒排索引后,搜索引擎就準備好可以隨時處理用戶搜索了。用戶在搜索框填入關(guān)鍵詞后,排名程序調(diào)用索引庫數(shù)據(jù),計算排名顯示給用戶,排名過程是與用戶直接互動的。