作 者:(美)邁克·朱利安 著 王作佳,孫浩文 譯
定 價:59
出 版 社:人民郵電出版社
出版日期:2020年11月01日
頁 數:140
裝 幀:平裝
ISBN:9787115550750
如今監控領域的形勢和幾年前大不相同,微服務架構的流行給監控帶來了新的問題。你是否覺得你的監控繫統需要改進,但不確定從哪裡開始或如何開始?你是否受到持續不斷、毫無意義的告警困擾?你的監控繫統是否經常遺漏真正的問題?如果是這樣,那麼本書非常適合你。本書從監控的原則和策略入手,介紹了一種設計和實現有效監控的實用方法,該方法適用於企業應用程序、服務器、網絡、安全等。作者不僅通過真實示例介紹了監控設計模式,還闡釋了監控的反模式,並且提供了關於特定類型監控的建議。本書對於了解、研究監控,以等
●前言xiii
第一部分監控的原則
第1章監控反模式3
1.1反模式1:沉迷工具3
1.1.1監控是多個復雜問題的總稱4
1.1.2避免對工具船貨崇拜6
1.1.3有時候,你確實需要自己創建工具7
1.1.4單一窗口隻是個神話7
1.2反模式2:監控崗位化7
1.3反模式3:復選框式監控8
1.3.1“正常運行”的真正含義是什麼?答案就是監控9
1.3.2對告警來說,操作繫統指標不是很有用9
1.3.3增加收集指標數據的頻率9
1.4反模式4:把監控當作拐杖10
1.5反模式5:手動配置10
1.6小結11
第2章監控設計模式13
2.1設計模式1:可組合監控13
2.2設計模式2:從用戶角度監控20
2.3設計模式3:購買,不要構建21
2.3.1這樣更省錢22
2.3.2你(可能)不是一個設計這些工具的專家23
2.3.3SaaS允許你關注公司的產品23
2.3.4不,是真的,SaaS實際上更好23
2.4設計模式4:持續改善24
2.5小結24
第3章告警、待命值班以及事件管理25
3.1怎樣纔能創建優秀的告警26
3.1.1停止使用電子郵件發送告警26
3.1.2撰寫運行手冊27
3.1.3任意的靜態閾值不是專享的方法28
3.1.4刪除告警和優化告警28
3.1.5使用維護周期29
3.1.6優先嘗試自動修復29
3.2待命值班30
3.2.1修正假警報30
3.2.2減少不必要的救火31
3.2.3制定更好的待命值班周期31
3.3事件管理33
3.4事後分析35
3.5小結35
第4章統計入門37
4.1在繫統運行統計之前37
4.2數學來拯救38
4.3統計不是魔法38
4.4平均值和平均數39
4.5中位數40
4.6季節效應41
4.7分位數41
4.8標準差42
4.9小結43
第二部分監控的策略
第5章監控業務47
5.1業務KPI47
5.2兩個真實的案例49
5.2.1Yelp50
5.2.2Reddit50
5.3將業務KPI與技術指標綁定51
5.4應用程序沒有提供這些指標52
5.5找到公司的業務KPI52
5.6小結53
第6章前端監控55
6.1一個慢應用的代價56
6.2前端監控的兩種方法57
6.3文檔對像模型57
6.3.1前端性能指標58
6.3.2這很棒,但是我要怎麼使用呢60
6.4日志61
6.5合成監控61
6.6小結62
第7章應用程序監控63
7.1用指標衡量應用程序63
7.2監控構建和發布管道66
7.3/health端點模式67
7.4應用程序日志71
7.4.1等等……我應該有一個指標或日志條目嗎72
7.4.2應該給什麼記錄日志72
7.4.3寫入磁盤還是寫入網絡73
7.5Serverless/FaaS(函數即服務)73
7.6監控微服務架構74
7.7小結76
第8章服務器監控77
8.1標準操作繫統指標77
8.1.1CPU78
8.1.2內存78
8.1.3網絡79
8.1.4磁盤79
8.1.5負載80
8.2SSL證書81
8.3SNMP81
8.4Web服務器82
8.5數據庫服務器83
8.6負載均衡器84
8.7消息隊列84
8.8緩存84
8.9DNS85
8.10NTP85
8.11其他企業基礎設施86
8.11.1DHCP86
8.11.2SMTP86
8.12監控定時任務87
8.13記錄日志88
8.13.1采集88
8.13.2存儲89
8.13.3分析89
8.14小結90
第9章網絡監控91
9.1SNMP之痛92
9.1.1什麼是SNMP92
9.1.2它的工作原理是什麼92
9.1.3關於安全的一點建議94
9.1.4如何使用SNMP94
9.1.5接口指標97
9.1.6接口和日志99
9.1.7要點總結99
9.2配置跟蹤99
9.3語音和視頻99
9.4路由100
9.5生成樹協議(STP)101
9.6機架101
9.6.1CPU和內存101
9.6.2硬件101
9.7流監控102
9.8容量規劃103
9.8.1倒推103
9.8.2預測103
9.9小結104
第10章安全監控105
10.1監控和合規106
10.2用戶、命令以及文件繫統審計107
10.2.1配置並運行auditd107
10.2.2auditd和遠端日志108
10.3主機入侵檢測繫統108
10.4rkhunter109
10.5網絡入侵檢測繫統110
10.6小結111
第11章監控評估113
11.1業務KPI113
11.2前端監控114
11.3應用程序和服務器監控114
11.4安全監控116
11.5告警116
11.6小結116
附錄A運行手冊示例:一個演示應用程序117
附錄B可用性表格121
作者介紹122
封面介紹122
本書圍繞監控這個龐大而復雜的主題,從其原則和策略入手,詳細介紹了監控繫統的組成、日志和告警的適用範圍、有關構建監控平臺的可靠建議,以及監控背後的原理和基本機制等一些實用信息,你可以在任何工具中去實踐這些內容。更為重要的是,本書還為你的公司設計和實現健壯的監控基礎提供了直接的戰略和策略。
(美)邁克·朱利安 著 王作佳,孫浩文 譯
邁克·朱利安(Mike Julian),Duckbill Group CEO,應用程序和基礎設施監控顧問,在線出版物Monitoring Weekly主編。曾在Taos Consulting、Peak Hosting、美國橡樹嶺國家實驗室等機構擔任運營/DevOps工程師。【譯者介紹】王作佳,長期從事通信行業數據庫運維工作,曾參與翻譯《Oracle性能診斷藝術(第2版)》一書。擁抱開源,支持數據庫軟件國產化。孫浩文,現任職於中國聯合網絡通信有限公司吉林省分公司,正高級工程師、聯通IT專家人纔,主要從事信息繫統規劃管理、項目管理、成本管理、運維管理、網絡信息安全管理等工作。