[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • 漫畫算法與數據結構(大規模數據集)
    該商品所屬分類:計算機/網絡 -> 數據庫
    【市場價】
    396-574
    【優惠價】
    248-359
    【作者】 波黑黛拉·梅傑多維奇(Dzejla 
    【所屬類別】 圖書  計算機/網絡  數據庫  數據庫理論 
    【出版社】清華大學出版社 
    【ISBN】9787302645207
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:32開
    紙張:膠版紙
    包裝:線裝

    是否套裝:否
    國際標準書號ISBN:9787302645207
    叢書名:數據科學與大數據技術

    作者:[波黑]黛拉·梅傑多維奇(Dzejla
    出版社:清華大學出版社
    出版時間:2024年02月 


        
        
    "

    產品特色

    編輯推薦

    《漫畫算法與數據結構(大規模數據集)》的重點並不是介紹通用的數據結構與算法分析。在大數據和人工智能的時代背景下,傳統的經典算法往往性能不佳,甚至可能不起作用。本書以分布式數據集、流式數據結構與算法設計為主線,對流式數據采集、數據庫中的數據結構設計、外部存儲器算法進行介紹。目前,實際生產中已經形成了流式數據采集、存儲、分析和計算的產品且成果顯著。針對流式數據的采集和存儲的產品主要有 Apache Kafka、Apache Pulsar 和 Pravega。流式數據的計算與分析主要經歷了兩代產品,第一代為 Apache Storm、Spark Streaming,目前流行的是第二代產品 Apache Flink。此外,還出現了 MPP(Shared Nothing 架構)的分布式並行架構數據庫集群,主要有 Greenplum、HAWQ、HashData 等分布式數據庫繫統。通過在 MPP 架構基礎上對流式數據的存儲和計算支持,單節點每秒可處理多達 100 億行數據,支持大規模數據實時寫入且保證秒級實時性,主要的產品有Apache Doris、StarRocks 和 MatrixDB。這些優秀的產品無不把流式數據的數據結構和算法體現得淋漓盡致。本書針對流式數據場景,對常見的大規模數據集算法和數據結構進行了梳理和講解。這些流式數據產品的出現有效解決了海量流式數據的采集、存儲和極速全場景分析計算等問題。本書可作為從事算法設計與分析、大數據平臺分析、模式識別與人工智能和數據庫等領域研究工作的工程師、計算機科學家的參考書。

     
    內容簡介
    當應用於大型分布式數據集時,標準算法和數據結構可能會變慢或完全失效。選擇專為大數據設計的算法可以時間、提高準確性並降低處理成本。《漫畫算法與數據結構(大規模數據集)》將最前沿的研究論文提煉為實用的技術,用於繪制、流式傳輸並組織磁盤和雲中的大規模數據集,十分獨特。
    大規模數據集的算法與數據結構為大型分布式數據引入了處理和分析技術。《漫畫算法與數據結構(大規模數據集)》作為指南,包含了行業故事和有趣的插圖,使復雜的概念也易於理解。在學習如何將強大的算法(如Bloom 過濾器、計數最小草圖、HyperLogLog和LSM樹)映射到你自己的用例時,將對真實世界的示例進行探索。
    主要內容:
    ● 概率草圖數據結構
    ● 選擇正確的數據庫引擎
    ● 設計高效的磁盤數據結構和算法
    ● 大規模繫統中的算法權衡

    當應用於大型分布式數據集時,標準算法和數據結構可能會變慢或完全失效。選擇專為大數據設計的算法可以時間、提高準確性並降低處理成本。《漫畫算法與數據結構(大規模數據集)》將最前沿的研究論文提煉為實用的技術,用於繪制、流式傳輸並組織磁盤和雲中的大規模數據集,十分獨特。
    大規模數據集的算法與數據結構為大型分布式數據引入了處理和分析技術。《漫畫算法與數據結構(大規模數據集)》作為指南,包含了行業故事和有趣的插圖,使復雜的概念也易於理解。在學習如何將強大的算法(如Bloom 過濾器、計數最小草圖、HyperLogLog和LSM樹)映射到你自己的用例時,將對真實世界的示例進行探索。
    主要內容:
    ● 概率草圖數據結構
    ● 選擇正確的數據庫引擎
    ● 設計高效的磁盤數據結構和算法
    ● 大規模繫統中的算法權衡
    ● 有限空間資源下的百分位數計算
    Python、R和偽代碼中的示例。

    作者簡介

    Dzejla Medjedovic在紐約石溪大學應用算法實驗室獲得博士學位。
    Emin Tahirovic在賓夕法尼亞大學獲得了生物統計學博士學位。
    插圖畫家
    Ines Dedovic在德國亞琛RWTH大學成像和計算機視覺研究所獲得博士學位。

    目錄
    第Ⅰ部分基於哈希的草圖
    第1 章 導論 3
    1.1 示例 5
    1.1.1 示例解決方法 6
    1.1.2 本書給出的解決方法 8
    1.2 本書的結構 11
    1.3 本書的不同之處及目標讀者 12
    1.4 為什麼大規模數據對當今的繫統如此具有挑戰性 13
    1.4.1 CPU 內存性能差距 13
    1.4.2 內存層次結構 14
    1.4.3 延遲與帶寬 15
    1.4.4 分布式繫統的情況 15
    1.5 基於硬件來設計算法 16
    1.6 本章小結 17

    第Ⅰ部分基於哈希的草圖
    第1 章 導論     3
    1.1 示例     5
    1.1.1 示例解決方法  6
    1.1.2 本書給出的解決方法     8
    1.2 本書的結構    11
    1.3 本書的不同之處及目標讀者    12
    1.4 為什麼大規模數據對當今的繫統如此具有挑戰性     13
    1.4.1 CPU 內存性能差距    13
    1.4.2 內存層次結構   14
    1.4.3 延遲與帶寬   15
    1.4.4 分布式繫統的情況    15
    1.5 基於硬件來設計算法     16
    1.6 本章小結     17
    第2 章 哈希表和現代哈希回顧     19
    2.1 無處不在的哈希  20
    2.2 數據結構概述   22
    2.3 現代繫統中的使用場景     25
    2.3.1 備份/存儲解決方案中的重復數據刪除   25
    2.3.2 使用MOSS 和Rabin-Karp 指紋識別進行剽竊檢測   26
    2.4 有關O(1)      29
    2.5 解決衝突:理論與實踐     30
    2.6 使用場景:Python 的dict是如何實現的   33
    2.7 MurmurHash    35
    2.8 分布式繫統的哈希表:一致性哈希   36
    2.8.1 一個典型的哈希問題    37
    2.8.2 哈希環    38
    2.8.3 查找    41
    2.8.4 添加新節點/資源    41
    2.8.5 刪除節點   44
    2.8.6 一致性哈希場景:Chord      48
    2.8.7 一致性哈希:編程練習    50
    2.9 本章小結    50
    第3 章 近似成員關繫:Bloom 過濾器和商
    過濾器   53
    3.1 工作原理    56
    3.1.1 插入    56
    3.1.2 查找    57
    3.2 用例     58
    3.2.1 網絡中的Bloom 過濾器:Squid  58
    3.2.2 Bitcoin 移動應用    59
    3.3 一個簡單的實現  60
    3.4 設置Bloom過濾器     61
    3.5 一點理論     66
    3.6 Bloom 過濾器的調整和替代方案   69
    3.7 商過濾器     70
    3.7.1 商-餘數法   71
    3.7.2數據位  73
    3.7.3 示例:插入商過濾器中  73
    3.7.4 用於查找的Python代碼   76
    3.7.5 調整大小與合並   79
    3.7.6 誤報率和空間考慮   80
    3.8 Bloom 過濾器和商過濾器的比較   80
    3.9 本章小結     82
    第4 章 頻率估計和count-minsketch    85
    4.1素     87
    4.2 count-min sketch 的工作原理     90
    4.2.1 update     90
    4.2.2 estimate    91
    4.3 用例     92
    4.3.1 前k 個睡眠不安者   92
    4.3.2 縮放單詞的分布相似度    96
    4.4 count-min sketch 中的誤差與空間   99
    4.5 count-min sketch 的簡單實現   100
    4.5.1 練習     101
    4.5.2 公式所蘊含的原理   102
    4.6 使用count-min sketch進行範圍查詢  103
    4.6.區間   104
    4.6.2 更新階段   105
    4.6.3 估計階段   107
    4.6.4 區間     108
    4.7 本章小結    110
    第5 章 基數估計和HyperLogLog  113
    5.1 對數據庫中的不同項計數     114
    5.2 HyperLogLog 增量設計    116
    5.2.1 第一步:概率計數     117
    5.2.2 隨機平均   119
    5.2.3 LogLog    121
    5.2.4 HyperLogLog:使用調和平均值進行隨機平均   123
    5.3 用例:使用HLL 捕捉蠕蟲     126
    5.4 一個小實驗  128
    5.5 用例:使用Hyper-LogLog 進行聚合  132
    5.6 本章小結   135
    第Ⅱ部分實時分析第6 章 流式數據   139
    6.1 流式數據示例   144
    6.1.1 Bloom 連接  144
    6.1.2 重復數據刪除     147
    6.1.3 負載平衡和跟蹤網絡流量   149
    6.2 數據流中的實際約束和概念   151
    6.2.1 實時     151
    6.2.2 小時間和小空間   152
    6.2.3 概念轉變和概念漂移     152
    6.2.4 滑動窗口模型     153
    6.3 抽樣和估計  155
    6.3.1 有偏差抽樣策略     157
    6.3.2 代表性樣本的估計     160
    6.4 本章小結    162
    第7 章 從數據流中抽樣   165
    7.1 從地標流中抽樣  166
    7.1.1 伯努利抽樣  166
    7.1.2 蓄水池抽樣  170
    7.1.3 有偏差的蓄水池抽樣     176
    7.2 從滑動窗口抽樣  182
    7.2.1 鏈式抽樣   182
    7.2.2 優先級抽樣  187
    7.3 抽樣算法比較  191
    7.4 本章小結    195
    第8 章 數據流上的近似分位數     197
    8.1 精確分位數  198
    8.2 近似分位數  201
    8.2.1 加法誤差   201
    8.2.2 相對誤差   203
    8.2.3 數據域中的相對誤差     204
    8.3 t-digest:工作
    原理    204
    8.3.1 digest     205
    8.3.2 比例函數   207
    8.3.3 合並t-digest  211
    8.3.4 t-digest 的空間範圍    215
    8.4 q-digest    215
    8.4.1 從頭開始構建q-digest    216
    8.4.2 合並q-digest    218
    8.4.3 q-digest 中的誤差和空間注意事項    219
    8.4.4 使用q-digest 進行分位數查詢  220
    8.5 模擬代碼和結果  221
    8.6 本章小結   226
    第Ⅲ部分數據庫的數據結構和外部存儲器算法


    第9 章 外部存儲器模型  231
    9.1 外部存儲器模型初探     233
    9.2 示例1:尋找最小值     235
    9.3 示例2:二進制搜索     239
    9.3.1 生物信息學用例    239
    9.3.2 運行時間分析     241
    9.4 最優搜索    243
    9.5 示例3:合並K 個排序列表   246
    9.5.1 合並時間/日期日志     246
    9.5.2 外部存儲器模型是否過於簡單  250
    9.6 下一章內容  251
    9.7 本章小結    251
    第10 章 數據庫的數據結構:B 樹、Bε 樹和LSM 樹   253
    10.1 索引的工作原理    254
    10.2 本章中的數據結構    256
    10.3 B 樹    258
    10.3.1 B 樹平衡  259
    10.3.2 查找   260
    10.3.3 插入   261
    10.3.4 刪除   263
    10.3.5 B 樹   266
    10.3.6 B 樹上的操作有何不同   268
    10.3.7 用例:MySQL 等中的B 樹   268
    10.4 為什麼B 樹查找在外部存儲器中是最佳的   269
    10.5 Bε 樹    272
    10.5.1 Bε 樹:工作原理   273
    10.5.2 緩衝區機制· 273
    10.5.3 插入和刪除  275
    10.5.4 查找   276
    10.5.5 成本分析  277
    10.5.6 Bε 樹:數據結構的範圍  278
    10.5.7 用例:TokuDB 中的Bε 樹   279
    10.5.8 輸入/輸出之道:欲速則不達  280
    10.6 日志結構合並樹(LSM 樹)    281
    10.6.1 LSM 樹:工作原理   283
    10.6.2 LSM 樹成本分析   285
    10.6.3 用例:Cassandra 中的LSM 樹  286
    10.7 本章小結   287
    第11 章 外部存儲器排序    289
    11.1 排序用例   290
    11.1.1 機器人運動規劃    290
    11.1.2 癌癥基因組學   291
    11.2 外部存儲器排序的挑戰:示例   293
    11.3 外部存儲器合並排序    297
    11.4 外部快速排序 300
    11.4.1 外部存儲器雙向快速排序  301
    11.4.2 外部存儲器多向快速排序  302
    11.4.3 找到足夠的樞軸   303
    11.4.4 找到足夠好的樞軸   304
    11.4.5 將它們重新組合在一起   305
    11.5 為什麼外部存儲器合並排序是最優的   306
    11.6 結尾    308
    11.7 本章小結   309
    參考文獻      310

    前言
    本書旨在幫助人們構建可擴展的應用程序並了解大規模數據繫統下的算法構建塊。本書涵蓋了構建大規模應用程序的不同算法,包括使用概率數據結構空間、處理流式數據、使用磁盤上的數據以及了解數據庫繫統中的性能權衡。
    本書讀者對像
    本書適合了解基本數據結構和算法的讀者。書中的許多內容都以早期數據結構/算法課程中通常涵蓋的內容為基礎:大部分章節都從展示問題的傳統解決方案開始並說明該算法或數據結構在大規模數據的背景下失敗的原因。盡管各章的介紹部分討論了一些基本算法,但這些內容隻是對讀者本應了解的主題的簡短復習。本書的讀者還應該掌握中級編程知識以及基本的概率知識。除了需要熟悉Python和偽代碼這些基本知識,學習本書無須了解其他任何特定繫統或架構(這就是算法的奧妙之處)。
    本書主要結構
    本書分為3 部分,共11 章。第Ⅰ部分介紹概率型簡潔數據結構,第Ⅱ部分介紹流式數據結構和算法,第Ⅲ部分介紹外部存儲器數據結構和算法。以下是各章內容的簡要說明。
    第Ⅰ部分:基於哈希的草圖

    本書旨在幫助人們構建可擴展的應用程序並了解大規模數據繫統下的算法構建塊。本書涵蓋了構建大規模應用程序的不同算法,包括使用概率數據結構空間、處理流式數據、使用磁盤上的數據以及了解數據庫繫統中的性能權衡。
    本書讀者對像
    本書適合了解基本數據結構和算法的讀者。書中的許多內容都以早期數據結構/算法課程中通常涵蓋的內容為基礎:大部分章節都從展示問題的傳統解決方案開始並說明該算法或數據結構在大規模數據的背景下失敗的原因。盡管各章的介紹部分討論了一些基本算法,但這些內容隻是對讀者本應了解的主題的簡短復習。本書的讀者還應該掌握中級編程知識以及基本的概率知識。除了需要熟悉Python和偽代碼這些基本知識,學習本書無須了解其他任何特定繫統或架構(這就是算法的奧妙之處)。
    本書主要結構
    本書分為3 部分,共11 章。第Ⅰ部分介紹概率型簡潔數據結構,第Ⅱ部分介紹流式數據結構和算法,第Ⅲ部分介紹外部存儲器數據結構和算法。以下是各章內容的簡要說明。
    第Ⅰ部分:基於哈希的草圖
    ??第1 章解釋大規模數據在現代繫統中存在嚴峻挑戰的原因,以及這些挑戰對算法和數據結構設計的影響。
    ??第2 章回顧哈希並解釋哈希表如何發展以滿足大型數據集和復雜分布式繫統的需求(如一致性哈希)。哈希方法將在接下來的章節中大量使用,因此該章是第Ⅰ部分的基礎。
    ??第3 章介紹近似成員關繫問題和有助於解決該問題的兩種數據結構:Bloom 過濾器和商過濾器。該章展示用例和誤報率分析,以及使用每種數據結構的優缺點。
    ??第4 章描述頻率估計問題並介紹count-min sketch(計數-最小草圖,這是一種以非常空間的方式解決頻率估計問題的數據結構)。該章討論NLP、傳感器數據和其他領域的用例,以及count-min sketch 在範圍查詢等問題中的應用。
    第5 章深入了解基數估計、HyperLogLog 算法及其應用。該章通過一個小型實驗,展示了從簡單的概率計數到完整的HyperLogLog 數據結構在準確性方面的演變。
    第Ⅱ部分:實時分析
    ??第6 章循序漸進地介紹數據流這一算法概念,以及其現實世界表現形式——流式數據(應用程序)。該章使用流式數據架構中的幾個實際用例,展示了前幾章中的數據結構如何用於流式數據上下文。
    ??第7 章介紹如何保留數據流中的代表性樣本或數據流上的滑動窗口。該章指出人們何時可能對有偏差的樣本感興趣,並給出代碼示例來展示如何實現將樣本偏向於最近看到組。
    ??第8 章涉及計算連續數據流中數值數據的近似分位數,描述了兩種草圖數據結構:t-digest 和q-digest。該章還解釋了它們背後的算法並在一個真實的數據集上將兩者進行對比。
    第Ⅲ部分:數據庫的數據結構和外部存儲器算法
    ??第9 章介紹外部存儲器模型及相關示例,這些示例用於說明在遠程存儲上處理數據時,輸入/輸出成本如何支配CPU。
    對於習慣於從CPU 成本方面考慮優化算法的算法設計者來說,該章會轉換他們的視角。
    ??第10 章展示支持主流數據庫的數據結構(例如,B 樹和LSM樹),並且涵蓋數據庫引擎設計中的各種讀/寫權衡。從高層次上理解這些數據結構的工作原理有助於辨別不同風格的數據庫,並為應用程序選擇適合的數據庫。
    ??第11 章著眼於對外部存儲器的排序,並且展示了使用合並排序和快速排序的外部存儲器優化版本對磁盤上的文件進行排序的最佳算法。該章以排序為例,說明在將批處理問題移至外部存儲器時可以進行哪些優化。
    本書的各部分相互關聯,但第Ⅰ、Ⅱ部分之間的聯繫更緊密,因為這兩部分都涉及RAM 中的數據結構以及在空間的同時最大限度地提高準確性這一主題。第Ⅲ部分具有獨立的主題,隻對它感興趣的讀者可以直接跳至這一部分。第Ⅰ、Ⅱ部分之間的閱讀順序也並不絕對,但先閱讀第Ⅰ部分可能比直接跳入第Ⅱ部分更容易理解第Ⅱ部分。
    第Ⅱ部分和第Ⅲ部分都以解釋模型和背景的章節(第6 章和第9章)開始,強烈建議閱讀這些章節,為理解相應部分中的其他章節奠定基礎。了解這一點後,可以隨意探索本書。編寫時,我們盡力使各章自成體繫。如果需要,可以隨時返回前置章節以獲取更多相關知識。我們建議所有讀者閱讀第1 章,因為該章解釋了當涉及部署在繁忙的大型基礎設施中的算法和數據結構時,大規模數據會產生範式轉變的原因。
    配套資源
    書中示例的完整代碼及配套資源可通過掃描本書封底的二維碼獲取並下載。
    書中有幾章包含代碼,對於一些較復雜的算法以及上下文會明顯加大代碼復雜度的算法(如外部存儲器算法),我們會返回使用偽代碼。我們將Python 和R 用於大多數代碼片段,並在某些章節中用其創建一些小型實驗來演示數據結構性能。讀者應能夠隨意用自己選擇的語言來實現編程練習,因為所涵蓋的主題並不特定於某一語言或技術。
    本書包含代碼清單和類似普通文本形式的許多源代碼示例。這兩種情況下,源代碼都被格式化為Courier New 字體,從而區分於普通文本。有時代碼也以粗體突出顯示與書中先前步驟相比發生變化的代碼,例如將新特性添加到現有代碼行時。
    許多情況下,原始源代碼已被重新格式化;我們添加了換行符並重新設置縮進以適合紙質書中可用的頁面空間。極少數情況下,這些還不夠,代碼清單中還包含續行符(?)。此外,在正文中描述代碼時,源代碼中的注釋通常已刪除。不過許多代碼清單都帶有代碼注釋,突出了重要的概念。

















     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部