作 者:宋天龍 著
定 價:129
出 版 社:機械工業出版社
出版日期:2019年06月01日
頁 數:549
裝 幀:平裝
ISBN:9787111627760
(1)作者是有10餘年數據分析與數據化運營經驗的大數據專家,在國內外企業都工作過,經驗豐富。(2)作者善於總結和寫作,樂於分享,撰寫數據分析類 暢銷書3部。(3)本書與同類書*大的不同在於,並不隻有純粹的關於數據分析技術和工具的講解,而且還與數據使用場景深度結合,在業務上真正可指導落地。(4)新版除了Python更新到了*新版外,具體內容上做了大幅度的補充和優化,整體篇幅超過30%,詳見前言。(5)本書作者提供微信、郵箱等,可通過實時和離線兩種方式及時為讀者在線傳道、受業、解惑。
●前言第章nbsp;nbsp;Python和數據化運營nbsp;nbsp;用Python做數據化運營nbsp;nbsp;Python是什麼2nbsp;nbsp;數據化運營是什麼23nbsp;nbsp;Python用於數據化運營52nbsp;nbsp;數據化運營所需的Python相關工具和組件52nbsp;nbsp;Python程序622nbsp;nbsp;Python交互環境Jupyter723nbsp;nbsp;Python第三方庫2324nbsp;nbsp;數據庫和客戶端2925nbsp;nbsp;SSH遠程客戶端303nbsp;nbsp;內容延伸Python的OCR和tensorflow33nbsp;nbsp;OCR工具Tesseractocr332nbsp;nbsp;機器學習框架TensorFlow34nbsp;nbsp;第個用Python實現的數據化運營分析實例銷售預測324nbsp;nbsp;案例概述3242nbsp;nbsp;案例過程3243nbsp;nbsp;案例小結365nbsp;nbsp;本章小結37第2章nbsp;nbsp;數據化運營的數據來源402nbsp;nbsp;數據化運營的數據來源類型402nbsp;nbsp;數據文件4022nbsp;nbsp;數據庫423nbsp;nbsp;API4224nbsp;nbsp;流式數據4325nbsp;nbsp;外部公開數據4326nbsp;nbsp;其他來源4422nbsp;nbsp;使用Python獲取運營數據4422nbsp;nbsp;從文本文件讀取運營數據44222nbsp;nbsp;從Excel獲取運營數據55223nbsp;nbsp;從關繫型數據庫MySQL讀取運營數據57224nbsp;nbsp;從非關繫型數據庫MongoDB讀取運營數據64225nbsp;nbsp;從API獲取運營數據6823nbsp;nbsp;內容延伸讀取非結構化網頁文本圖像視頻語音7223nbsp;nbsp;從網頁中獲取運營數據72232nbsp;nbsp;讀取非結構化文本數據73233nbsp;nbsp;讀取圖像數據74234nbsp;nbsp;讀取視頻數據78235nbsp;nbsp;讀取語音數據824nbsp;nbsp;本章小結85第3章nbsp;nbsp;0條數據化運營不得不知道的數據預處理經驗873nbsp;nbsp;數據清洗缺失值異常值和重復值的處理873nbsp;nbsp;數據列缺失的4種處理方法8732nbsp;nbsp;不要輕易拋棄異常數據33nbsp;nbsp;數據重復就需要去重嗎9034nbsp;nbsp;代碼實操Python數據清洗9232nbsp;nbsp;將分類數據和順序數據轉換為標志變量0032nbsp;nbsp;分類數據和順序數據是什麼00322nbsp;nbsp;運用標志方法處理分類和順序變量0323nbsp;nbsp;代碼實操Python標志轉換033nbsp;nbsp;大數據時代的數據降維0433nbsp;nbsp;需要數據降維的情況04332nbsp;nbsp;基於特征選擇的降維05333nbsp;nbsp;基於特征轉換的降維06334nbsp;nbsp;基於特征組合的降維2335nbsp;nbsp;代碼實操Python數據降維434nbsp;nbsp;解決樣本類別分布不均衡的問題2334nbsp;nbsp;哪些運營場景中容易出現樣本不均衡24342nbsp;nbsp;通過過抽樣和欠抽樣解決樣本不均衡24343nbsp;nbsp;通過正負樣本的懲罰權重解決樣本不均衡24344nbsp;nbsp;通過組合集成方法解決樣本不均衡25345nbsp;nbsp;通過特征選擇解決樣本不均衡25346nbsp;nbsp;代碼實操Python處理樣本不均衡2535nbsp;nbsp;數據化運營要抽樣還是全量數據2835nbsp;nbsp;什麼時候需要抽樣28352nbsp;nbsp;如何進行抽樣29353nbsp;nbsp;抽樣需要注意的幾個問題30354nbsp;nbsp;代碼實操Python數據抽樣336nbsp;nbsp;解決運營數據的共線性問題3536nbsp;nbsp;如何檢驗共線性35362nbsp;nbsp;解決共線性的5種常用方法36363nbsp;nbsp;代碼實操Python處理共線性問題3737nbsp;nbsp;有關相關性分析的混沌3937nbsp;nbsp;相關和因果是一回事嗎39372nbsp;nbsp;相關繫數低就是不相關嗎39373nbsp;nbsp;代碼實操Python相關性分析4038nbsp;nbsp;標準化讓運營數據落入相同的範圍438nbsp;nbsp;實現中心化和正態分布的ZScore4382nbsp;nbsp;實現歸一化的MaxMin42383nbsp;nbsp;用於稀疏數據的MaxAbs42384nbsp;nbsp;針對離群點的RobustScaler42385nbsp;nbsp;代碼實操Python數據標準化處理4239nbsp;nbsp;離散化對運營數據做邏輯分層4539nbsp;nbsp;針對時間數據的離散化45392nbsp;nbsp;針對多值離散數據的離散化46393nbsp;nbsp;針對連續數據的離散化46394nbsp;nbsp;針對連續數據的二值化47395nbsp;nbsp;代碼實操Python數據離散化處理4730nbsp;nbsp;內容延伸非結構化數據的預處理530nbsp;nbsp;網頁數據解析5302nbsp;nbsp;網絡用戶日志解析59303nbsp;nbsp;圖像的基本預處理64304nbsp;nbsp;自然語言文本預處理693nbsp;nbsp;本章小結72第4章nbsp;nbsp;跳過運營數據分析和挖掘的大坑744nbsp;nbsp;聚類分析744nbsp;nbsp;當心數據異常對聚類結果的影響7542nbsp;nbsp;超大數據量時應該放棄K均值算法7543nbsp;nbsp;聚類不僅是建模的終點更是重要的中間預處理過程7744nbsp;nbsp;高維數據上無法應用聚類嗎7845nbsp;nbsp;如何選擇聚類分析算法7946nbsp;nbsp;案例客戶特征的聚類與探索性分析7942nbsp;nbsp;回歸分析9642nbsp;nbsp;注意回歸自變量之間的共線性問題97422nbsp;nbsp;相關繫數判定繫數和回歸繫數之間是什麼關繫97423nbsp;nbsp;判定繫數是否意味著相應的因果聯繫97424nbsp;nbsp;注意應用回歸模型時研究自變量是否產生變化98425nbsp;nbsp;如何選擇回歸分析算法98426nbsp;nbsp;案例大型促銷活動前的銷售預測9943nbsp;nbsp;分類分析20643nbsp;nbsp;防止分類模型的過擬合問題207432nbsp;nbsp;使用關聯算法做分類分析207433nbsp;nbsp;用分類分析來提煉規則提取變量處理缺失值208434nbsp;nbsp;類別劃分分類算法和聚類算法都是好手209435nbsp;nbsp;如何選擇分類分析算法20436nbsp;nbsp;案例用戶流失預測分析與應用2044nbsp;nbsp;關聯分析2244nbsp;nbsp;頻繁規則不一定是有效規則22442nbsp;nbsp;不要被啤酒尿布的故事禁錮你的思維222443nbsp;nbsp;被忽略的負相關模式真的毫無用武之地嗎223444nbsp;nbsp;頻繁規則隻能打包組合應用嗎2
這是一本將數據分析技術與數據使用場景深度結合的著作,從實戰角度講解了如何利用Python進行數據分析和數據化運營。暢銷書全新、大幅升級,第1版近乎100%的好評,第2版不僅將Python升級到了*新的版本,而且對具體內容進行了大幅度的補充和優化。作者是有10餘年數據分析與數據化運營的大數據專家,書中對50餘個數據工作流知識點、14個數據分析與挖掘主題、4個數據化運營主題、8個綜合性案例進行了全面的講解,能讓數據化運營結合數據使用場景360°落地。全書一共9章,分為兩個部分:第壹部分(第1-4章) Python數據分析與挖掘首先介紹了Python和數據化運營的基本知識,然後詳細講解了Python數據獲取(結構化和非結構化)、預處理、分析和挖掘的關鍵技術和經驗,包含10大類預處理經驗、14個數據分析與挖掘主題,50餘個知識點。第二部分(第5~9章) Python數據化運營這是本書的核心,詳細講等
宋天龍 著
作者簡介宋天龍TonySong大數據技術專家觸脈咨詢合伙人兼副總裁前Webtrekk中國區技術和咨詢負責人Webtrekk德國大的在線數據分析服務提供商擅長數據挖掘建模分析與運營精通端到端數據價值場景設計業務需求轉換數據結構梳理數據建模與學習以及數據工程交付在電子商務零售銀行保險等多個行業擁有豐富的數據項目工作經驗參與過集團和企業級數據體繫規劃DMP與數據倉庫建設大數據產品開發網站流量繫統建設個性化智能推薦與精準營銷企業大數據智能等參與實施客戶案例包括聯合利華Webpower德國OTTO集團電子商務中國Esprit 八戒網順豐優選樂視商城泰康人壽酒仙網國美在線迪信通等著有多部暢銷書Pytho等
內容待完善