推薦-飼育網路爬蟲:搜尋引擎資料探勘最佳化

 

詳細介紹(點我)

 

 

本書作者是一位資深的搜尋引擎開發人員,作者對資料獲取(網路資訊挖掘)與資料檢索(搜尋引擎)兩方面作了深入的介紹。本書首先提出了一套「網路資料採擷」的完整理論,並舉出一個實際的智慧爬蟲系統,透過理論與實際的完整呈現,使讀者能夠對「網路資料採擷」有一個比較具體的認識,然後介紹了一個專用程式語言IRS,並舉出了這個語言的編譯器以及虛擬機器的實現方法。

本書還透過對多個開放原始碼搜尋引擎項目抽絲剝繭的細緻分析,引出搜尋引擎的一些基本原理與開發方法,並介紹一個商業化搜尋引擎的實例;最终還結合一個Java框架介紹一些軟體設計思想。

希望本書能對搜尋引擎開發人員有所啟發,幫助那些對搜尋引擎開發有興趣的讀者踏進這扇大門,並為那些經驗不那麼豐富的搜尋引擎開發者提供一些參考,使得廣大網際網路使用者能在Google 和Baidu 之外的眾多的垂直搜索網站上獲得更好的體驗與服務。從初學者到有一定經驗的搜尋引擎開發人員,各個層次的讀者都能找到一些適合自己閱讀的章節。

 

詳細介紹(點我)

 

arrow
arrow

    AVA 發表在 痞客邦 留言(0) 人氣()