對于搜索引擎你了解多少?搜索引擎(search engine),萬維網環境中的信息檢索系統(包括目錄服務和關鍵字檢索兩種服務方式),按照工作原理的不同,可以分為全文搜索引擎(Full Text Search Engine)和分類目錄(Directory),通常所說的搜索引擎主要是指全文搜索引擎。為了更深入的了解搜索引擎我們通過搜索引擎的起源,搜索引擎的工作原理以及搜索引擎商務模式三個方面來更深入的了解搜索引擎。
1、搜索引擎的起源
1990年由Montreal的McGill University 三名學生(Alan Emtage、Peter Deutsch、Bill Wheelan)發明的Archie(Archie FAQ),被公認為現代搜索引擎的鼻祖,Archie是第一個自動索引互聯網上匿名FTP網站的程序。
2、搜索引擎工作原理
抓取網頁:每個獨立的搜索引擎都有自己的網頁抓取程序(spider),Spider順著網頁中的超鏈接,連續的抓取網頁,被抓取的網頁被稱為網頁快照。
處理網頁:由分析索引系統程序對收集回來的網頁進行分析,根據一定的算法提取相關信息并建立網頁索引數據庫。
檢索服務:當用戶輸入關鍵詞搜索后,由搜索系統程序從網頁索引數據庫中找到符合該關鍵詞的所有相關網頁,根據相關度數值排序,并由頁面生成系統將搜索結果的鏈接地址和頁面內容摘要等內容組織起來返回給用戶。
3、搜索引擎商務模式
在搜索引擎發展早期,多是作為技術提供商為其他網站提供搜索服務,網站付錢給搜索引擎。后來,隨著2001年互聯網泡沫的破滅,大多轉向競價排名方式,這種模式最早是Bill Gross提出的。競價排名模式有兩個特點,一是點擊付費,二是競價排序。