作 者:(美)戈雷利克,(美)歐日沃爾德 著 胡世傑,徐旭彬 譯
定 價:99.8
出 版 社:人民郵電出版社
出版日期:2017年07月01日
頁 數:352
裝 幀:平裝
ISBN:9787115454898
Python代碼僅僅能夠正確運行還不夠,你需要讓它運行得更快。通過探索設計決策背後的基礎理論,本書幫助你更加深刻地理解Python的實現。你將學習如何找到性能瓶頸,以及如何在大數據量的程序中顯著加快代碼。如何利用多核架構或集群的優點?如何構建一個在不損失可靠性的情況下具備可伸縮性的繫統?有經驗的Python程序員將學到針對這些問題或者其他問題的具體解決方案,以及來自那些在社交媒體分析、產品化機器學習和其他場景下使用高性能Python編程的公司的成功案例。通過閱讀本書,你將能夠:■ 更好地等
●第1章 理解高性能Python
1.1 基本的計算機繫統
1.1.1
1.1.2
1.1.3 通信層
1.2 將素組裝到一起
1.3 為什麼使用Python
第2章 通過性能分析找到瓶頸
2.1 高效地分析性能
2.2 Julia集合的介紹
2.3 計算完整的Julia集合
2.4 計時的簡單方法——打印和修飾
2.5 用UNIX的time命令進行簡單的計時
2.6 使用cProfile模塊
2.7 用runsnakerun對cProfile的輸出進行可視化
2.8 用line_profiler進行逐行分析
2.9 用memory_profiler診斷內存的用量
2.10 用heapy調查堆上的對像
2.11 用dowser實時畫出變量的實例
2.12 用dis模塊檢查CPython字節碼
2.13 在優化期間測試保持代碼的正確性
2.14 確保性能分析成功的策略
2.15 小結
第3章 組
3.1 一個更有效的搜索
3.2 組
3.2.1 動態數組:列表
3.2.2 靜態組
3.3 小結
第4章 字典和集合
4.1 字典和集合如何工作
4.1.1 插入和獲取
4.1.2 刪除
4.1.3 改變大小
4.1.4 散列函數和熵
4.2 字典和命名空間
4.3 小結
第5章 迭代器和生成器
5.1 無窮數列的迭代器
5.2 生成器的延遲估值
5.3 小結
第6章 矩陣和矢量計算
6.1 問題介紹
6.2 Python列表還不夠嗎
6.3 內存碎片
6.3.1 理解perf
6.3.2 根據perf輸出做出抉擇
6.3.3 使用numpy
6.4 用numpy解決擴散問題
6.4.1 內存分配和就地操作
6.4.2 選擇優化點:找到需要被修正的地方
6.5 numexpr:讓就地操作更快更簡單
6.6 告誡故事:驗證你的“優化”(scipy)
6.7 小結
第7章 編譯成C
7.1 可能獲得哪種類型的速度提升
7.2 JIT和AOT編譯器的對比
7.3 為什麼類型檢查有助代碼更快運行
7.4 使用C編譯器
7.5 復習Julia集的例子
7.6 Cython
7.6.1 使用Cython編譯純Python版本
7.6.2 Cython注解來分析代碼塊
7.6.3 增加一些類型注解
7.7 Shed Skin
7.7.1 構建擴展模塊
7.7.2 內存拷貝的開銷
7.8 Cython和numpy
7.9 Numba
7.10 Pythran
7.11 PyPy
7.11.1 垃圾收集的差異
7.11.2 運行PyPy並安裝模塊
7.12 什麼時候使用每種工具
7.12.1 其他即將出現的項目
7.12.2 一個圖像(GPU)的注意點
7.12.3 一個對未來編譯器項目的展望
7.13 外部函數接口
7.13.1 ctypes
7.13.2 cffi
7.13.3 f2py
7.13.4 CPython模塊
7.14 小結
第8章 並發
8.1 異步編程介紹
8.2 串行爬蟲
8.3 gevent
8.4 tornado
8.5 AsyncIO
8.6 數據庫的例子
8.7 小結
第9章 multiprocessing模塊
9.1 multiprocessing模塊綜述
9.2 使用蒙特卡羅方法來估算Pi
9.3 使用多進程和多線程來估算Pi
9.3.1 使用Python對像
9.3.2 並行繫統中的隨機數
9.3.3 使用numpy
9.4 尋找素數
9.5 使用進程間通信來驗證素數
9.5.1 串行解決方案
9.5.2 Na ve Pool解決方案
9.5.3 Less Na ve Pool解決方案
9.5.4 使用Manager.Value作為一個標記
9.5.5 使用Redis作為一個標記
9.5.6 使用RawValue作為一個標記
9.5.7 使用mmap作為一個標記
9.5.8 使用mmap作為一個標記的終極效果
9.6 用multiprocessing來共享numpy數據
9.7 同步文件和變量訪問
9.7.1 文件鎖
9.7.2 給Value加鎖
9.8 小結
第10章 集群和工作隊列
10.1 集群的益處
10.2 集群的缺陷
10.2.1 糟糕的集群升級策略造成華爾街損失4.6
10.2.2 Skype的24小時全球中斷
10.3 通用的集群設計
10.4 怎樣啟動一個集群化的解決方案
10.5 使用集群時避免痛苦的方法
10.6 三個集群化解決方案
10.6.1 為簡單的本地集群使用Parallel Python模塊
10.6.2 使用IPython Parallel來支持研究
10.7 為魯棒生產集群的NSQ
10.7.1 隊列
10.7.2 發布者訂閱者
10.7.3 分布式素數計算器
10.8 看一下其他的集群化工具
10.9 小結
第11章 使用更少的RAM
11.1 基礎類型的對像開銷高
11.2 理解集合中的RAM使用
11.3 字節和Unicode的對比
11.4 高效地在RAM中存儲許多文本
11.5 使用更少RAM的竅門
11.6 概率數據結構
11.6.1 使用1字節的Morris計數器來做近似計數
……
Python語言是一種腳本語言,其應用領域非常廣泛,包括數據分析、自然語言處理、機器學習、科學計算、推薦繫統構建等。本書共有12章,圍繞如何進行代碼優化和加快實際應用的運行速度進行詳細講解。本書主要包含以下主題:計算機內部結構的背景知識、組、字典和集合、迭代器和生成器、矩陣和矢量計算、並發、集群和工作隊列等。最後,通過一繫列真實案例展現了在應用場景中需要注意的問題。本書適合初級和中級Python程序員、有一定Python語言基礎想要得到進階和提高的讀者閱讀。
(美)戈雷利克,(美)歐日沃爾德 著 胡世傑,徐旭彬 譯
Micha Gorelick在bitly公司從事與數據打交道的工作,並負責建立了快速前進實驗室(Fast Forward Labs),研究從機器學習到高性能流算法領域的問題。Ian Ozsvald是ModelInsight.io的數據科學家和教師,有著超過十年的Python經驗。他在yCon和PyData會議上教授Python編程,這幾年一直在英國從事關於數據科學和高性能計算方面的咨詢工作。