[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  • 新类目

     管理
     投资理财
     经济
     社会科学
  • 自制搜索引擎/圖靈程序設計叢書
    該商品所屬分類:圖書 ->
    【市場價】
    320-464
    【優惠價】
    200-290
    【作者】 山田浩之末永匡譯者 
    【出版社】人民郵電 
    【ISBN】9787115411709
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    出版社:人民郵電
    ISBN:9787115411709
    商品編碼:10356182868

    開本:32
    出版時間:2016-01-01

    代碼:39
    作者:山田浩之末永匡譯者

        
        
    "

    基本信息

    • 商品名稱:自制搜索引擎/圖靈程序設計叢書
    • 作者:(日)山田浩之//末永匡|譯者:胡屹
    • 代碼:39
    • 出版社:人民郵電
    • ISBN號:9787115411709

    其他參考信息

    • 出版時間:2016-01-01
    • 印刷時間:2016-01-01
    • 版次:1
    • 印次:1
    • 開本:32開
    • 包裝:平裝
    • 頁數:190
    • 字數:187千字

    內容提要

    由山田浩之、末永匡編著的《自制搜索引擎/圖 靈程序設計叢書》聚焦於Google和Yahoo!等Web搜索 服務幕後的搜索引擎繫統,首先講解了搜索引擎的基 礎知識和原理,接著以現實中的開源搜索引擎 Senna/Groonga為示例,使用該引擎的源代碼引導讀 者親自體驗搜索引擎的開發過程。這部分講解涉及了 倒排索引的制作和壓縮、檢索的處理流程以及搜索引 擎的優化等內容。又簡單介紹了一些*加專業的搜索 引擎的知識和要點,為讀者今後進一步學習打下了基 礎。本書適合做有對搜索引擎感興趣的技術人員閱讀 。
        

    作者簡介

    山田浩之 信息工程學博士。先後於日本IBM、雅虎從事分布式搜索引擎的研發工作。目前在東京大學生產技術研究所從事高性能並行數據庫的研發工作。 末永匡 開源搜索引擎Senna/Groonga的開發者。每天都在奮鬥,夢想著能創建一個*加自由、*加無拘無束的,而不是一家獨大的應用程序平臺。 胡屹 多年從事Web開發工作。熱愛編程,關注設計模式,致力於提升軟件開發的質量。曾獲得SCJP和PHP ZCE證書。譯有《計算機是怎樣跑起來的》。

    目錄

    **章 搜索引擎是如何工作的
    1-1 理解搜索引擎的構成
    什麼是搜索引擎
    構成搜索引擎的組件
    與搜索引擎相關的組件
    1-2 實現了快速全文搜索的索引結構
    全文搜索的兩種方法
    倒排索引的結構
    倒排索引的構建方法
    倒排索引中的術語
    1-3 深入理解倒排索引
    倒排索引=詞典+倒排文件
    從倒排索引中查找單詞
    將單詞的位置信息加入倒排文件中
    從倒排索引中查找短語
    1-1 理解搜索引擎的構成
    什麼是搜索引擎
    構成搜索引擎的組件
    與搜索引擎相關的組件
    1-2 實現了快速全文搜索的索引結構
    全文搜索的兩種方法
    倒排索引的結構
    倒排索引的構建方法
    倒排索引中的術語
    1-3 深入理解倒排索引
    倒排索引=詞典+倒排文件
    從倒排索引中查找單詞
    將單詞的位置信息加入倒排文件中
    從倒排索引中查找短語
    1-4 制作中文文檔的倒排索引
    分割中文句子的方法
    權衡分割方法
    1-5 實現倒排索引
    實現詞典
    實現倒排文件
    1-6 使用倒排索引進行檢索
    布爾檢索
    使用倒排索引的檢索處理流程
    關聯度的計算方法
    信息檢索中的檢索
    1-7 構建倒排索引
    使用內存構建倒排索引
    使用二級存儲構建倒排索引
    靜態索引構建和動態索引構建
    1-8 準備要檢索的文檔
    收集數據
    數據規範化
    第2章 準備全文搜索引擎的檢索樣本
    2-1 全文搜索引擎wiser
    wiser的構成
    準備用於檢索的文檔
    2-2 安裝wiser
    構建wiser
    啟動wiser
    解壓縮Wikipedia的副本
    2-3 運行wiser
    構建倒排索引
    使用倒排索引查詢
    比較grep和wiser的運行速度
    第3章 構建倒排索引
    3-1 復習有關倒排索引的知識

    為創建倒排列表
    3-2 構建倒排索引
    在存儲器上創建倒排列表
    倒排列表和倒排文件的數據結構
    從源代碼級別梳理倒排索引的構建順序
    進一步閱讀源代碼
    專欄根據實際情況設計搜索引擎(繫統)
    第4章 開始檢索吧
    4-1 檢索處理的大致流程
    充分理解檢索處理的流程
    4-2 使用倒排索引進行檢索
    從源代碼級別梳理檢索處理的流程
    解讀split_query_to_tokens()函數的具體實現
    使用具體示例加深對檢索處理流程的理解
    解讀函數search_docs()的實現細節
    解讀函數search_phrase()的實現
    專欄如何實現標簽檢索
    第5章 壓縮倒排索引
    5-1 壓縮的基礎知識
    壓縮倒排索引的好處
    專欄壓縮的目的
    倒排索引的壓縮方法
    倒排文件的壓縮方法
    壓縮的原理
    5-2 實現wiser中的壓縮功能
    壓縮功能源代碼的概要
    了解無需進行壓縮時的操作
    抓住Golomb編碼的要點
    解讀Golomb編碼中的編碼處理
    解讀Golomb編碼的解碼處理
    第6章 挑戰wiser的優化及參數的調整
    6-1 提高檢索處理的效率
    優化檢索處理
    將查詢分割為無重復部序列
    6-2 禁用短語檢索
    分析對2字符的字符串進行檢索時的行為
    分析對3字符的字符串進行檢索時的行為
    6-3 改變檢索結果的輸出順序
    作為檢索結果排序核心的指標
    按照文檔大小降序排列的檢索結果
    專欄排名欺詐
    6-4 讓1個字符的查詢也能檢索出結果
    獲取以特定字符開的列表
    合並檢索到的結果
    專欄如何實現相似文檔的檢索
    6-5 調整控制倒排索引*新的緩衝區容量
    確認由緩衝區容量的差異帶來的不同效果
    用sar命令分析負載
    6-6 調整隻有英文字的分割方法
    如何避免用英文單詞檢索時準確率下降的問題
    如何判斷某字符是否屬於索引對像
    修改負責的函數
    6-7 確認壓縮的效果
    觀察Golomb編碼的效果
    對比壓縮啟用前後的索引大小
    專欄避免濫用全文搜索引擎
    第7章 為今後*加深入的學習做準備
    7-1 wiser沒能實現的功能
    倒排索引之外的全文搜索索引
    高效處理大規模數據的存儲器
    利用緩存提高檢索的速度
    使用各種各樣的壓縮方法
    優化搜索結果的排名
    調整準確率和召回率
    降低檢索結果排序處理的負載
    並行處理
    結合對屬性的篩選過濾
    分面搜索
    專欄時延和吞吐量
    7-2 全文搜索引擎Groonga的特點
    的部分一致檢索提升召回率
    使用內存映射文件片段
    專欄宣傳活動的重要性
    7-3 實現出考慮到用戶意圖的搜索引擎
    引入停用詞
    應對詞素解析的錯誤
    專欄斷句錯誤
    處理全角字符和半角字符
    對查詢進行歸一化
    留意布爾檢索的解析過程
    通過詞素解析器適當地解析查詢
    對錯誤的輸入進行修正
    輸入補全
    建議用戶檢索相關的關鍵詞
    7-4 收集、提取文檔時的要點
    制作爬蟲時的處理要點
    在提取文本時需要處理的要點
    Appendix附錄
    A-1深度話題
    近幾年的壓縮方法
    動態索引構建
    分布式索引
    A-2wiser中的文本提取和存儲
    用於處理XML的2種API――DOM和SAX
    提取文檔的標題和正文
    掌握狀態的遷移
    構建文檔數據庫
    後記




    "
     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部