作 者:王帥 著
定 價:128
出 版 社:電子工業出版社
出版日期:2019年09月01日
頁 數:512
裝 幀:簡裝
ISBN:9787121355684
"√ 垃圾注冊|刷單|薅羊毛|信息洩露,反欺詐|反爬蟲|賬戶安全|內容安全|信貸安全,完整方案|成熟體繫與一手實踐。√ 利用機器學習擴大風險識別範圍|提高風險識別的準確度|提升業務安全的自動化水平,跨安全與AI領域的入行指南。√ 業務安全從業者可用來快速選擇至優機器學習方案,算法工程師可用來了解ML業務安全應用獨特之處以備深入研究。√ 覆蓋真實安全業務場景|機器學習算法原理|算法實現優化與生產環境上線迭代,與常勝高手過招一般快速提升功力。"
●第1章 互聯網業務安全簡述11.1 互聯網業務安全現狀11.2 如何應對挑戰41.3 本章小結6參考資料6第2章 機器學習入門82.1 相似性92.1.1 範數92.1.2 度量122.2 矩陣202.2.1 線性空間202.2.2 線性算子242.3 空間332.3.1 內積空間332.3.2 歐幾裡得空間(Euclid space)342.3.3 酉空間372.3.4 賦範線性空間382.3.5 巴拿赫空間392.3.6 希爾伯特空間432.3.7 核函數442.4 機器學習中的數學結構462.4.1 線性結構與非線性結構462.4.2 圖論基礎472.4.3 樹562.4.4 神經網絡622.4.5 深度網絡結構802.4.6 小結952.5 統計基礎962.5.1 貝葉斯統計962.5.2 共軛先驗分布992.6 策略與算法1062.6.1 凸優化的基本概念1062.6.2 對偶原理1202.6.3 非線性規劃問題的解決方法1292.6.4 無約束問題的很優化方法1342.7 機器學習算法應用的經驗1452.7.1 如何定義機器學習目標1452.7.2 如何從數據中獲取最有價值的信息1492.7.3 評估模型的表現1542.7.4 測試效果遠差於預期怎麼辦1562.8 本章小結159參考資料160第3章 模型1633.1 基本概念1633.2 模型評價指標1663.2.1 混淆矩陣1673.2.2 分類問題的基礎指標1673.2.3 ROC曲線與AUC1713.2.4 基尼繫數1733.2.5 回歸問題的評價指標1753.2.6 交叉驗證1753.3 回歸算法1773.3.1 最小二乘法1773.3.2 脊回歸1813.3.3 Lasso回歸線性模型1813.3.4 多任務Lasso1813.3.5 L1、L2正則雜談1823.4 分類算法1833.4.1 CART算法1833.4.2 支持向量機1863.5 降維1883.5.1 貝葉斯網絡1893.5.2 主成分分析1953.6 主題模型LDA1983.6.1 馬爾可夫鏈蒙特卡羅法1983.6.2 貝葉斯網絡與生成模型1993.6.3 學習方法在LDA中的應用2063.7 集成學習方法(Ensemble Method)2153.7.1 Boosting方法2163.7.2 Bootstrap Aggregating方法2203.7.3 Stacking方法2213.7.4 小結222參考資料223第4章 機器學習實踐的基礎包2264.1 簡介2264.2 Python機器學習基礎環境2284.2.1 Jupyter Notebook2284.2.2 Numpy、Scipy、Matplotlib和pandas2314.2.3 scikit-learn、gensim、TensorFlow和Keras2504.3 Scala的基礎庫2664.3.1 Zeppelin2664.3.2 Breeze2674.3.3 Spark MLlib2764.4 本章小結281參考資料282第5章 機器學習實踐的金剛鑽2835.1 簡介2835.2 XGBoost2845.3 Prediction IO(PIO)2875.3.1 部署PIO2875.3.2 機器學習模型引擎的開發2945.3.3 機器學習模型引擎的部署2965.3.4 PIO繫統的優化2975.4 Caffe2985.5 TensorFlow3045.6 BigDL3065.7 本章小結308參考資料308第6章 賬戶業務安全3106.1 背景介紹3106.2 賬戶安全保障3126.2.1 注冊環節3126.2.2 登錄環節3146.3 聚類算法在賬戶安全中的應用3156.3.1 K-Means算法3156.3.2 高斯混合模型(GMM)3176.3.3 OPTICS算法和DBSCAN算法3266.3.4 應用案例3316.4 本章小結334參考資料334第7章 平臺業務安全3357.1 背景介紹3357.2 電商平臺業務安全3387.3 社交平臺業務安全3437.4 復雜網絡算法在平臺業務安全中的應用3467.4.1 在電商平臺作弊團伙識別中的應用3467.4.2 在識別虛假社交關繫中的應用3517.5 本章小結353參考資料354第8章 內容業務安全3558.1 背景介紹3558.2 如何做好內容業務安全工作3578.2.1 面臨的挑戰3578.2.2 部門協作3588.2.3 技術體繫3598.3 卷積神經網絡在內容業務安全中的應用3618.3.1 人工神經網絡(Artificial Neural Network)3618.3.2 深度神經網絡(Deep Neural Network)3678.3.3 卷積神經網絡(Convolutional Neural Network)3798.3.4 應用案例3928.4 本章小結405參考資料405第9章 信息業務安全4069.1 背景介紹4069.2 反欺詐業務4079.3 反爬蟲業務4129.3.1 驗證問題的可分性4129.3.2 提升模型效果4139.4 循環神經網絡在信息安全中的應用4149.4.1 原始RNN(Vanilla RNN)4149.4.2 LSTM算法及其變種4159.4.3 應用案例4199.5 本章小結429參考資料430第10章 信貸業務安全43210.1 背景介紹43210.2 信貸業務安全簡介43410.3 分類算法在信貸業務安全中的應用43810.3.1 典型分類算法的介紹43810.3.2 應用案例:邏輯回歸模型在信貸中風控階段的應用46310.4 本章小結468參考資料469第11章 業務安全繫統技術架構47011.1 整體介紹47011.2 平臺層47111.3 數據層47311.4 策略層47411.5 服務層48011.6 業務層48111.7 本章小結484參考資料484第12章 總結與展望48612.1 總結48612.2 展望487參考資料489後記一 490後記二 491本書常見數學符號定義 492
互聯網產業正在從IT時代邁入DT時代(數據時代),同時互聯網產業的繁榮也催生了黑灰產這樣的群體。那麼,在數據時代應該如何應對互聯網業務安全威脅?機器學習技術在互聯網業務安全領域的應用正是答案。本書首先從機器學習技術的原理入手,自成體繫地介紹了機器學習的基礎知識,從數學的角度揭示了算法模型背後的基本原理;然後介紹了互聯網業務安全所涉及的重要業務場景,以及機器學習技術在這些場景中的應用實踐;最後介紹了如何應用互聯網技術棧來建設業務安全技術架構。作者根據多年的一線互聯網公司從業經驗給出了很多獨到的見解,供讀者參考。本書既適合機器學習從業者作為入門參考書,也適合互聯網業務安全從業者學習黑灰產對抗手段,幫助他們做到知己知彼,了解如何應用機器學習技術來提高與黑灰產對抗的能力。
王帥 著
王帥,花名蓮華,技術專家。2010年於哈爾濱工業大學航天學院獲學士學位,2013年於華中科技大學圖像所獲碩士學位,同年加入航天五院。2014年曾代表單位在巴黎聯合國教科文組織總部做關於圖像數據處理的報告,之後曾就職於百度移動雲和蘑菇街,主要負責風控領域內的業務安全算法,從無到有地搭建了基於機器學習技術的電商平臺業務安全策略架構體繫,目前任職於阿裡巴巴釘釘安全部。
"推薦序一2016年3月,AlphaGo戰勝李世石,人工智能一下子又成為被廣泛討論的熱門話題。這兩年人工智能發展得非常快,深度學習為語音、文本和圖像處理帶來了很多突破。機器學習在各種業務場景中有很重要的應用價值。市面上介紹機器學習的書有不少,介紹互聯網業務安全的書也有一些,但是介紹機器學習在互聯網業務安全領域實踐的書,並不多。本書開篇概述了互聯網業務安全的內涵,接著就進入正題介紹機器學習的內容,從機器學習的入門知識到模型再到具體工程的實施,讓缺少相關經驗的讀者能夠比較容易地順著這個思路了解對應內容。後面的章節更多的是圍繞具體業務安全工作而展開的,內容十分豐富。更重要的是,這些都是兩位作者在實際業務場景中的實戰經驗的總結。從我個人的角度看,這些在業務場景中積累的經驗更加寶貴,就好比是真的上了戰場而且打了勝仗的高手所分享的經驗,彌足珍貴。希望本書能夠給讀者帶來更多的幫助。——曾等