[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • 這就是搜索引擎:核心技術詳解
    該商品所屬分類:圖書 -> 科技
    【市場價】
    276-400
    【優惠價】
    173-250
    【作者】 張俊林 
    【出版社】電子工業出版社 
    【ISBN】9787121148651
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    出版社:電子工業出版社
    ISBN:9787121148651
    商品編碼:1027461726

    品牌:文軒
    出版時間:2012-01-01
    代碼:45

    作者:張俊林

        
        
    "
    作  者:張俊林 著作
    /
    定  價:45
    /
    出 版 社:電子工業出版社
    /
    出版日期:2012年01月01日
    /
    頁  數:300
    /
    裝  幀:平裝
    /
    ISBN:9787121148651
    /
    目錄
    ●第1章 搜索引擎及其技術架構 1
    1.1 搜索引擎為何重要 1
    1.1.1  互聯網的發展 1
    1.1.2 商業搜索引擎公司的發展 3
    1.1.3 搜索引擎的重要地位 3
    1.2 搜索引擎技術發展史 4
    1.2.1 史前時代:分類目錄的一代 4
    1.2.2 第一代:文本檢索的一代 5
    1.2.3 第二代:鏈接分析的一代 5
    1.2.4 第三代:用戶中心的一代 5
    1.3 搜索引擎的3個目標 6
    1.4 搜索引擎的3個核心問題 7
    1.4.1 3個核心問題 7
    1.4.2 與技術發展的關繫 8
    1.5 搜索引擎的技術架構 9
    第2章 網絡爬蟲 12
    2.1 通用爬蟲框架 12
    2.2 優秀爬蟲的特性 15
    2.3 爬蟲質量的評價標準 18
    2.4 抓取策略 19
    2.4.1 寬度優先遍歷策略(Breath First) 20
    2.4.2 非接近PageRank策略(Partial PageRank) 21
    2.4.3 OCIP策略(Online Page Importance Computation) 23
    2.4.4 大站優先策略(Larger Sites First) 23
    2.5 網頁更新策略 23
    2.5.1 歷史參考策略 24
    2.5.2 用戶體驗策略 24
    2.5.3 聚類抽樣策略 24
    2.6 暗網抓取(Deep Web Crawling) 26
    2.6.1 查詢組合問題 27
    2.6.2 文本框填寫問題 29
    2.7 分布式爬蟲 30
    2.7.1 主從式分布爬蟲(Master-Slave) 31
    2.7.2 對等式分布爬蟲(Peer to Peer) 31
    本章提要 34
    本章參考文獻 34
    第3章 搜索引擎索引 36
    3.1 索引基礎 36
    3.1.1 單詞—文檔矩陣 37
    3.1.2 倒排索引基本概念 37
    3.1.3 倒排索引簡單實例 39
    3.2 單詞詞典 42
    3.2.1 哈希加鏈表 42
    3.2.2 樹形結構 43
    3.3 倒排列表( ting List) 44
    3.4 建立索引 45
    3.4.1 兩遍文檔遍歷法(2-Pass In-Memory Inversion) 45
    3.4.2 排序法(Sort-based Inversion) 46
    3.4.3 歸並法(Merge-based Inversion) 49
    3.5 動態索引 50
    3.6 索引更新策略 51
    3.6.1 接近重建策略(Complete Re-Build) 51
    3.6.2 再合並策略(Re-Merge) 52
    3.6.3 原地更新策略(In-Place) 55
    3.6.4 混合策略(Hybrid) 57
    3.7 查詢處理 57
    3.7.1 一次一文檔(Doc at a Time) 58
    3.7.2 一次一單詞(Term at a Time) 59
    3.7.3 跳躍指針(Skip Pointers) 60
    3.8 多字段索引 62
    3.8.1 多索引方式 62
    3.8.2 倒排列表方式 63
    3.8.3 擴展列表方式(Extent List) 64
    3.9 短語查詢 64
    3.9.1 位置信息索引( ition Index) 65
    3.9.2 雙詞索引(Nextword Index) 66
    3.9.3 短語索引(Phrase Index) 67
    3.9.4 混合方法 67
    3.10 分布式索引(Parallel Indexing) 68
    3.10.1 按文檔劃分(Document Partitioning) 69
    3.10.2 按單詞劃分(Term Partitioning) 70
    3.10.3 兩種方案的比較 72
    本章提要 73
    本章參考文獻 73
    第4章 索引壓縮 76
    4.1 詞典壓縮 76
    4.2 倒排列表壓縮算法 78
    4.2.1 評價索引壓縮算法的指標 79
    4.2.編碼與二進制編碼 79
    4.2.3 Elias Gamma算法與Elias Delta算法 81
    4.2.4 Golomb算法與Rice算法 81
    4.2.5 變長字節算法(Variable Byte) 83
    4.2.6 SimpleX 繫列算法 84
    4.2.7 PForDelta算法 86
    4.3 文檔編號重排序(DocID Reordering) 89
    4.4 靜態索引裁剪(Static Index Pruning) 93
    4.4.1 以單詞為中心的索引裁剪 94
    4.4.2 以文檔為中心的索引裁剪 96
    本章提要 97
    本章參考文獻 97
    第5章 檢索模型與搜索排序 99
    5.1 布爾模型(Boolean Model) 101
    5.2 向量空間模型(Vector Space Model) 102
    5.2.1 文檔表示 102
    5.2.2 相似性計算 104
    5.2.3 特征權重計算 106
    5.3 概率檢索模型 108
    5.3.1 概率排序原理 108
    5.3.獨立模型(Binary Independent Model) 110
    5.3.3 BM25模型 113
    5.3.4 BM25F模型 115
    5.4 語言模型方法 116
    5.5 機器學習排序(Learning to Rank) 119
    5.5.1 機器學習排序的基本思路 120
    5.5.2 單文檔方法(PointWise Approach) 121
    5.5.3 文檔對方法(PairWise Approach) 122
    5.5.4 文檔列表方法(ListWise Approach) 123
    5.6 檢索質量評價標準 125
    5.6.1 準確率與召回率 126
    5.6.2 P@10指標 127
    5.6.3 MAP指標(Mean Average Precision) 128
    本章提要 129
    本章參考文獻 129
    第6章 鏈接分析 131
    6.1 Web圖 131
    6.2 兩個概念模型及算法之間的關繫 133
    6.2.1 隨機遊走模型(Random Surfer Model) 133
    6.2.2 子集傳播模型 135
    6.2.3 鏈接分析算法之間的關繫 136
    6.3 PageRank算法 137
    6.3.1 從入鏈數量到PageRank 137
    6.3.2 PageRank計算 138
    6.3.3 鏈接陷阱(Link Sink)與遠程跳轉(Teleporting) 139
    6.4 HITS算法(Hypertext Induced Topic Selection) 140
    6.4.1 Hub頁面與Authority頁面 140
    6.4.2 相互增強關繫 141
    6.4.3 HITS算法 142
    6.4.4 HITS算法存在的問題 144
    6.4.5 HITS算法與PageRank算法比較 145
    6.5 SALSA算法 146
    6.5.1 確定計算對像集合 146
    6.5.2 鏈接關繫傳播 148
    6.5.3 Authority權值計算 150
    6.6 主題敏感PageRank(Topic Sensitive PageRank) 152
    6.6.1 主題敏感PageRank與PageRank的差異 152
    6.6.2 主題敏感PageRank計算流程 153
    6.6.3 利用主題敏感PageRank構造個性化搜索 156
    6.7 Hilltop算法 156
    6.7.1 Hilltop算法的一些基本定義 157
    6.7.2 Hilltop算法 158
    6.8 其他改進算法 162
    6.8.1 智能遊走模型(Intelligent Surfer Model) 162
    6.8.2 偏置遊走模型(Biased Surfer Model) 163
    6.8.3 PHITS算法(Probability Analogy of HITS) 163
    6.8.4 BFS算法(Backward Forward Step) 163
    本章提要 164
    本章參考文獻 164
    第7章 雲存儲與雲計算 166
    7.1 雲存儲與雲計算概述 167
    7.1.1 基本假設 167
    7.1.2 理論基礎 168
    7.1.3 數據模型 170
    7.1.4 基本問題 170
    7.1.5 Google的雲存儲與雲計算架構 171
    7.2 Google文件繫統(GFS) 173
    7.2.1 GFS設計原則 174
    7.2.2 GFS整體架構 174
    7.2.3 GFS主控服務器 176
    7.2.4 繫統交互行為 178
    7.3 Chubby鎖服務 179
    7.4 BigTable 181
    7.4.1 BigTable的數據模型 181
    7.4.2 BigTable整體結構 183
    7.4.3 BigTable的管理數據 184
    7.4.4 主控服務器(Master Server) 186
    7.4.5 子表服務器(Tablet Server) 187
    7.5 Megastore繫統 191
    7.5.1 實體群組切分 192
    7.5.2 數據模型 193
    7.5.3 數據讀寫與備份 195
    7.6 Map/Reduce雲計算模型 195
    7.6.1 計算模型 196
    7.6.2 整體邏輯流程 197
    7.6.3 應用示例 198
    7.7 咖啡因繫統——Percolator 199
    7.7.1 事務支持 200
    7.7.2 觀察/通知體繫結構 202
    7.8 Pregel圖計算模型 203
    7.9 Dynomo雲存儲繫統 206
    7.9.1 數據劃分算法(Partitioning Algorithm) 207
    7.9.2 數據備份(Replication) 208
    7.9.3 數據讀寫 208
    7.9.4 數據版本控制 209
    7.10 PNUTS雲存儲繫統 210
    7.10.1 PNUTS整體架構 211
    7.10.2 211
    7.10.3 子表控制器與數據路由器 213
    7.10.4 雅虎消息代理 213
    7.10.5 數據一致性 214
    7.11 HayStack存儲繫統 215
    7.11.1 HayStack整體架構 216
    7.11.2 目錄服務 218
    7.11.3 HayStack緩存 219
    7.11.4 HayStack存儲繫統 219
    本章提要 222
    本章參考文獻 222
    第8章 網頁反作弊 224
    8.1 內容作弊 224
    8.1.1 常見內容作弊手段 225
    8.1.2 內容農場(Content Farm) 226
    8.2 鏈接作弊 227
    8.3 頁面隱藏作弊 230
    8.4 Web 2.0作弊方法 231
    8.5 反作弊技術的整體思路 232
    8.5.1 信任傳播模型 233
    8.5.2 不信任傳播模型 234
    8.5.3 異常發現模型 234
    8.6 通用鏈接反作弊方法 236
    8.6.1 TrustRank算法 237
    8.6.2 BadRank算法 238
    8.6.3 SpamRank 239
    8.7 專用鏈接反作弊技術 240
    8.7.1 識別鏈接農場 240
    8.7.2 識別Google轟炸 241
    8.8 識別內容作弊 241
    8.9 反隱藏作弊 241
    8.9.1 識別頁面隱藏 241
    8.9.2 識別網頁重定向 242
    8.10 搜索引擎反作弊綜合框架 242
    本章提要 244
    本章參考文獻 244
    第9章 用戶查詢意圖分析 246
    9.1 搜索行為及其意圖 246
    9.1.1 用戶搜索行為 246
    9.1.2 用戶搜索意圖分類 248
    9.2 搜索日志挖掘 250
    9.2.1 查詢會話(Query Session) 250
    9.2.2 點擊圖(Click Graph) 251
    9.2.3 查詢圖(Query Graph) 252
    9.3 相關搜索 253
    9.3.1 基於查詢會話的方法 253
    9.3.2 基於點擊圖的方法 254
    9.4 查詢糾錯 255
    9.4.1 編輯距離(Edit Distance) 256
    9.4.2 噪聲信道模型(Noise Channel Model) 257
    本章提要 257
    本章參考文獻 258
    第10章 網頁去重 259
    10.1 通用去重算法框架 261
    10.2 Shingling算法 262
    10.3 I-Match算法 265
    10.4 SimHash算法 268
    10.4.1 文檔指紋計算 269
    10.4.2 相似文檔查找 270
    10.5 SpotSig算法 272
    10.5.1 特征抽取 272
    10.5.2 相似文檔查找 273
    本章提要 274
    本章參考文獻 274
    第11章 搜索引擎緩存機制 276
    11.1 搜索引擎緩存繫統架構 277
    11.2 緩存對像 279
    11.3 緩存結構 281
    11.4 緩存淘汰策略(Evict Policy) 283
    11.4.1 動態策略 284
    11.4.2 混合策略 284
    11.5 緩存更新策略(Refresh Policy) 285
    本章提要 286
    本章參考文獻 287
    第12章 搜索引擎發展趨勢 288
    12.1 個性化搜索 288
    12.2 社會化搜索 290
    12.3 實時搜索 291
    12.4 移動搜索 293
    12.5 地理位置感知搜索 294
    12.6 跨語言搜索 296
    12.7 多媒體搜索 298
    12.8 情境搜索 299
    內容簡介
    搜索引擎作為互聯網發展中至關重要的一種應用,已經成為互聯網各個領域的制高點,其重要性不言而喻。搜索引擎領域也是互聯網應用中不多見的以核心技術作為其命脈的領域,搜索引擎各個子繫統是如何設計的?這成為廣大技術人員和搜索引擎優化人員密切關注的內容。
    本書的優選特點是內容新穎全面而又通俗易懂。對於實際搜索引擎所涉及的各種核心技術都有全面細致的介紹,除了作為搜索繫統核心的網絡爬蟲、索引繫統、排序繫統、鏈接分析及用戶分析外,還包括網頁反作弊、緩存管理、網頁去重技術等實際搜索引擎必須關注的技術,同時用相當大的篇幅講解了雲計算與雲存儲的核心技術原理。另外,本書也密切關注搜索引擎發展的前沿技術:Google的咖啡因繫統及Megastore等雲計算新技術、百度的暗網抓取技術阿拉丁計劃、內容農場作弊、機器學習排序等。諸多新技術在相關章節都有詳細講解,同時對於社會化搜索、實時搜索及情境搜索等搜索引擎的等



    "
     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    【同作者商品】
    張俊林
      本網站暫時沒有該作者的其它商品。
    有該作者的商品通知您嗎?
    請選擇作者:
    張俊林
    您的Email地址
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部