原書序
Microsoft Excel是進行數據分析的世界標準,其易用性和強大功能使得Excel電子表格成為人人使用的工具,無論分析何種信息。
可以使用Excel存儲個人開支數據、現有賬號信息、客戶信息或復雜的商業計劃,甚至在難以堅持的節食期間存儲你的瘦身進展。使用Excel的可能性是無限的——我們就不再列舉可以用Excel分析的所有各類信息了。事實是,如果有一些待整理和分析的數據,那麼Excel是可供使用的完美工具。即使隻有相對有限的軟件知識,你也可以輕松地以表格式的形式組織數據,更新數據,生成圖表、數據透視表和基於數據的計算,並且作出預測。隨著雲計算的到來,現在你可以在移動設備上(諸如平板電腦和智能手機)使用Excel,也可利用互聯網持續訪問信息。此外,在Excel的早期版本中,每個工作表有65536的行數的限制,而事實上許多用戶都要求微軟增加行數(微軟確實這麼做了,在Excel 2007中將行數限制提高到100萬行),這清晰地表明用戶希望在Excel中存儲和分析大量數據。
除了Excel用戶以外,還有一類人在其職業生涯中致力於數據分析: 商業智能(BI)專業人士。BI是從大量信息中獲得的洞察力的科學,而且,近年來BI專業人士已經學習並創建了許多新的技術和工具,以管理可以處理高達數百萬甚至數億行交易記錄的繫統。BI繫統需要很多專業人士的努力和昂貴的硬件來運行。BI繫統十分強大,但也存在嚴重缺點: 構建起來十分昂貴和耗時。
2010年以前,在少量數據分析和大量數據分析之間存在清晰的界限: 一方為Excel,另一方為復雜的BI繫統。現在Excel邁出了融合這兩個世界的步,因為數據透視表工具已經能夠查詢BI繫統。通過這麼做,數據分析師可以查詢大型BI繫統,實現魚和熊掌兼得,因為這樣一個查詢結果可以導入Excel數據透視表,因此可用於進一步的分析。
2010年,微軟公司發起的一項顛覆之舉打破了BI專業人員和Excel用戶之間的藩籬: 通過引入一個名為xVelocity的強大引擎,直接在Excel內部驅動大型BI解決方案。彼時,Microsoft SQL Server 2008 R2 PowerPivot for Excel發布,成為Excel 2010的免費插件。目標是使得創建BI解決方案變得如此容易,Excel將不僅僅能作為BI客戶端啟動,而且還能作為BI服務器啟動,能夠在筆記本電腦上托管復雜的BI解決方案。他們將其稱為自助式BI。
微軟PowerPivot對其可存儲的行數沒有限制: 如果你需要處理100萬行,你大可放心地這麼做,且其分析速度驚人。PowerPivot還引入了DAX語言,一個旨在創建BI解決方案的強大編程語言,而不僅僅通過Excel公式。後,PowerPivot能夠高倍壓縮數據,使得大量信息可存儲於相對較小的工作簿中。但是,這還隻是步。
第二個決定性的一步,是將用戶級BI的力量引入到Excel 2013當中。PowerPivot不再是一個分離的Excel插件,現在成為Excel技術的一個內在組成部分,為每個Excel用戶帶來了xVelocity引擎的力量。自助式BI時代於2010年開啟,且在2013年升級。
由於你已在閱讀這篇介紹,你可能有興趣加入到自助式BI的浪潮中,並且想要學習如何掌握PowerPivot for Excel。你將需要學習PowerPivot工具的基本知識,但是這僅僅是步。然後,需要學習如何組織數據以便有效地執行分析,即數據建模。後,你將需要學習DAX語言並掌握其所有概念,以便充分利用其效力。如果這些是你想要的,那麼這本書即是為你而作。
我們是BI專業人士,從經驗中我們知道構建BI解決方案並不容易。
我們不想誤導你: BI是激情科技,也是工程科技。本書的目的是幫助你采取必要的步驟,將你從Excel用戶轉變為自助式BI建模師。這將是一段漫長之旅,是需要時間和奉獻精神的旅行,你會發現自己需要做出調整以學習新技術。然而,終修成的正果是無價的。
這本書,不是一步一步指導PowerPivot for Excel 2013的書。如果你正在尋找PowerPivot傻瓜書,那麼隻能說這不是你的菜。但是如果你需要一本書伴隨你在這漫長而令人愉悅的旅行中,從個簡單的Excel工作簿開始,不久將很快創建復雜的模擬,那麼這本書就是你的終極資源。
在寫這本書時,我們決定把重點放在概念和實例上,從零開始帶你掌握DAX語言。
本書不涵蓋每個功能,也不用“單擊A,然後B”的方式解釋每個操作。相反,本書承載了大量信息,這樣一旦學完本書,你在Excel新的建模選項中將有足夠的背景知識。
用後一句話來強調這本書的主要特點: 它是用來學習的書,而不隻是閱讀。做好長途旅行的準備——但我們向你保證這將是非常值得的。
注意: PowerPivot和Power View軟件功能隻包含在特定的Office 2013配置中。適用於所有Excel 2010版本的PowerPivot功能,僅適用於Office 2013的專業增強版、SharePoint 2013企業版、SharePoint Online 2013 Plan 2、Office365的E3或E4版本。在Excel 2013中新增的Power View功能,包含在同一版本的PowerPivot中。幸運的是,在Excel 2013所有配置中均支持Excel數據模型。然而,請注意,各類可用配置是可以改變的。
本書為誰而作
這本書面向Excel用戶、項目經理和決策者,本書能滿足他們學習PowerPivot for Excel 2013基礎知識、掌握用於PowerPivot的新的DAX語言以及學習PowerPivot高級數據建模和編程技術的願望。
對讀者的假定
這本書假定你對Excel 2010或Excel 2013有一個基本了解。你不需要成為一個Excel高手,隻是一個普通用戶就好。將介紹從Excel過渡到PowerPivot需要什麼,但不以任何方式涵蓋Excel基礎知識,例如輸入公式、寫VLOOKUP函數或其他基本功能。不需要PowerPivot的預備知識。如果你已經嘗試過自己建立一個數據模型,那更好;但我們假設在閱讀這本書之前,你從來沒有打開過PowerPivot。
這本書如何組織
從頭到尾讀這本書。任何試圖直接跳轉到某個特定問題的解決方案,跳過一些內容,可能會是錯誤的選擇,在每個章節都會介紹需要在後續章節進一步理解的概念和功能。
此外,你將需要不止一次地閱讀本書的一些章節,因為其中的理論背景是很難在次閱讀時掌握的。
全書共分為16章。
第1章“PowerPivot簡介”介紹了PowerPivot for Excel 2013中的基本功能。按照一步一步的指導,我們將展示使用PowerPivot滿足分析需求的主要好處。我們還展示了如何創建一份簡單的Power View報告。
第2章“使用PowerPivot的獨特功能”展示了隻有當你啟用PowerPivot for Excel後纔可使用的功能。這包括計算列、計算字段、層次結構和一些其他基本特性。本章是第1章的邏輯延續和結論。
在第3章“DAX簡介”中,我們開始涉獵DAX語言,包括DAX語法和基本的函數。我們強調計算列和計算字段之間的差異,而且在後展示了使用DAX的個實例。
第4章“了解數據模型”是具有理論性的一章,涵蓋了數據建模基礎,並展示了PowerPivot數據庫中不同的建模選項。我們將介紹幾個明顯不屬於Excel用戶領域的概念,例如規範化和反規範化、SQL查詢語句的結構、關繫的工作原理以及重要性、數據集市和數據倉庫的結構等。
第5章“發布到SharePoint”講解發布Excel工作簿到Microsoft SharePoint的流程,以實現團隊級BI。此外我們將介紹PowerPivot for SharePoint作為一個服務器端應用程序的概念,你可以使用Excel和PowerPivot來編程和擴展。
第6章“加載數據” 致力於以多種方式將數據加載到PowerPivot內部。對於每個數據源,我們展示了其工作方式,並為具體來源提供了許多提示和實踐。
第7章“理解計值上下文”和第8章“理解CALCULATE”是本書的理論核心。在這兩章中,我們介紹了計值上下文、關繫和CALCULATE函數的概念。這些都是DAX語言的支柱,你在使用PowerPivot創建高級數據模型之前需要掌握這三大支柱。
第9章“使用層次結構”展示了如何創建和管理層次結構。本章涵蓋了基本的層次結構處理,如何計算層次結構的值,後,本章展示了如何通過使用在第7章和第8章中所學到的概念來管理父/子層次結構。
第10章“使用Power View”專門介紹Excel 2013中的新的報告工具Power View。本章展示了該報告工具的主要功能,如何創建簡單的Power View 報告,以及如何篩選數據並創建令人愉悅的報告供查看並提供從數據派生而來的有用見解。
第11章“構建報告”涵蓋了一些有關報告的高級主題,包括關鍵績效指標(KPI),如何編制KPI,以及如何使用KPI來提高報告繫統的質量,本章還涵蓋了PowerPivot中的Power V數據層、鑽通、Excel集或MDX集以及透視。
第12章“在DAX中執行日期計算”處理時間智能。YTD(年初至今)、QTD(季初至今)、MTD(月初至今)、工作日vs.非工作日、半累加度量、移動平均以及所有其他涉及時間的復雜計算都在本章之中。
第13章“使用高級DAX”組合了情景和解決方案,所有這一切都共享相同的背景: 它們是使用Excel或任何其他任何工具難以解決的,而一旦你從本書前面章節中獲得必要的知識,在DAX之中它們就比較容易管理。所有這些例子都來自現實世界的情景,都是當我們作為顧問或在網絡上看論壇時處於所看到的請求列表前列的情景。
第14章“使用DAX作為查詢語言”專門講述了使用DAX作為查詢語言。它涵蓋了用於查詢數據庫時的各種DAX函數。它也展示了高級函數,如反向鏈接和鏈接回表,這些能夠極大地提升PowerPivot構建復雜數據模型的能力。
第15章“使用VBA自動化操作”討論如何以編程的方式使用Microsoft Visual Basic Application(VBA)管理PowerPivot工作簿,以自動化一些常規任務;提供了一些代碼示例顯示如何解決一些常見情景,這些VBA可能十分有用。
第16章“比較Excel和SQL Server分析服務”比較了3種風格的PowerPivot技術: PowerPivot for Excel、PowerPivot for SharePoint和SQL Server分析服務(SSAS)。後一章的目標是給你一個清晰的畫面: 在PowerPivot for Excel中可以做什麼,何時需要進一步采用PowerPivot for SharePoint,其在SSAS中有哪些僅適用於SSAS的額外功能。
關於配套內容
本書包含配套內容來充實你的學習體驗。本書的配套內容可以從以下網頁下載:
http://go.microsoft.com/FWLink/?Linkid=279953013
配套內容包括:
■微軟的Access版本AdventureWorksDW數據庫,你可以用它來建立自己的例子。
■本文中使用的所有Excel工作簿(也就是說,所有工作簿是用來說明書中的概念的)。注意,你需要用Excel 2013,打開工作簿。
致謝
這本書要感謝的人很多,以至於不可能列出一個完整的列表來一一感謝。所以,感謝所有對本書有貢獻的朋友,甚至那些沒有意識到為本書做出了貢獻的朋友。博客評論、論壇帖子、電子郵件討論、技術會議的與會者和演講者的聊天,這些一直對我們非常有幫助,而且很多人都為本書的創作做出了重大貢獻,也就是說,我們需要提及一些有特殊貢獻的朋友。
首先要感謝Edward Melomed,他鼓舞了我們,沒有幾年前與他的那場充滿激情的討論,我們可能尚未開啟我們的PowerPivot之旅。
還要感謝微軟出版社、O’Reilly傳媒和對本項目有貢獻的人: Kenyon Brown、Christopher Hearse以及其他許多幕後工作人員。
比寫一本書更花費時間的工作,是必須為準備寫書所做的研究。有一群人,我們(友好地)稱為“SSAS業內人士”幫我們為寫這本書鋪平了道路。來自微軟的幾個人特別值得一提,因為他們花了寶貴時間教導我們有關PowerPivot和DAX函數的重要概念。他們是Marius Dumitru、Jeffrey Wang和Akshai Mirchandani。伙計們,你們的幫助是無價的!
也要感謝Amir Netz, Ashvini Sharma和T.K.Anand,他們對有關如何定位PowerPivot的討論做出了貢獻,他們幫助我們對本書做出了一些戰略選擇。
在互聯網時代編撰成書是具有挑戰性的,因為新的資料和想法層出不窮。有幾個博客對本書的完成尤為重要,在這裡要提到的博主是: Chris Webb、Kasper de Jonge、Rob Collie、Denny Lee和Dave Wickert。
後,要特別提及本書的技術評審Javier Guillen。他兩次檢查了我們原始文本中的所有內容,尋找錯誤,給我們提供了關於如何提高本書質量的寶貴建議。如果這本書包含比我們的原稿更少的錯誤,這歸功於Javier。如果仍然有錯誤,這當然要由我們負責。
太謝謝你們了,伙計們!
支持與反饋
以下部分提供了勘誤表、電子書支持、反饋和聯繫人信息。
勘誤表
我們已經盡力,以確保本書和配套內容的準確性。
這本書出版後的任何已報道的錯誤會在oreilly.com的微軟出版社網站中的本書主頁上列出:
http://aka.ms/Excel2013DataModelsPP/errata
如果你發現一個尚未列出的錯誤,可以通過上述網頁報告給我們。
如果你需要額外支持,請發送電子郵件至mspinput@microsoft.com獲取微軟出版社的圖書支持。
需要注意的是,這些地址不提供微軟公司軟件產品的支持。
我們希望獲取你的反饋
在微軟出版社,你的滿意是我們的首要任務,您的反饋是我們寶貴的資產。請告訴我們你對本書的想法。
http://www.microsoft.com/learning/booksurvey
以上網頁中的調查是簡短的,我們會閱讀你的每個意見和想法,提前感謝你的反饋!
保持聯繫
讓我們繼續交談下去!我們在Twitter上:
http://twitter.com/MicrosoftPress
譯者序
當你拿起這本書的時候,你之前一定讀過有關Excel電子表格的指導書。而這本書卻如此令人耳目一新: 這次Excel不再僅僅是帶有數據透視表功能的電子表格工具,它從其他同類數據可視化工具中脫穎而出,華麗地轉身成了真正的商務智能(BI),迎接大數據時代的到來。微軟PowerPivot的威力在於: 業務人員不必花費漫長的時間解釋需求並等待IT人員開發報表,而是可以隨心所欲地組合多來源數據以建立模型,即席地切片切塊以進行數據探索和多維分析,近乎實時地在PC端生成交互式報告和儀表板來支持決策,這一切可媲美工業級的數據集市和商務智能工具。傳統的分析師會發現,除了處理手頭的表格數據以外,還可以喚醒沉睡中的企業數據資產,對它們加以關聯整合,快速產生洞察力並創造價值,充分掌握駕馭大數據的能力。
在微軟Power BI in Excel的加載項當中,PowerPivot位於核心的地位,用於抽取來自多個數據庫中的數據進行整合建模。基於PowerPivot數據模型,不僅可以同傳統電子表格和數據透視表/圖無縫連接生成報告並利用OLAP功能隨心所欲地變換為自由格式,而且還可使用DMX加載項開展數據挖掘。另外,基於PowerPivot, 可以使用Power View快速直觀地生成交互式圖表和儀表板供展示;可以使用Power Map和Bing(必應)對包含地理位置的數據生成三維地圖;並借助Power Query將不同格式的外部數據進行預處理轉換,與內部數據混合在一起進行建模分析,從而充分發揮Excel PowerPivot的所有潛力。而這一切,在你的筆記本電腦中即可完成,Excel專業增強版官方售價僅幾十美金,而且很多公司都已經為員工配置了Excel 2013,並推動企業級的數據治理和BI部署治理,促進自助式BI的應用並通過分析創造價值。
如今,每個公司的IT部門都將BI提到重要的日程之上,但為何PowerPivot等自助式BI也如此重要?根據Forrester的估計,企業對數據資產的利用程度尚不足10%,未來將有80%的BI內容(交互式報表、儀表板等)出自業務人員之手,企業BI投資中的一半也將投向自助式商務智能,並且未來十年廣泛存在著BI和分析人纔缺口。
掌握PowerPivot需要花費時間學習,這並不容易,但這一切值得。想想你每周都花費大量時間在重復性的工作上,而現在Excel可以幫你自動地追加數據、合並與整合數據集、刷新圖表和任意格式的報表,你將有更多時間用於分析,為企業創造更多價值。
2013年10月,IMA(美國管理會計師協會)和ACCA財會前沿學院在一份名為《數據達爾文主義: 在技術變革中蓬勃發展》的深度分析報告中指出,中國乃至全球財會行業將受到十大技術趨勢的顯著影響。其中,“未來十年所需的十大技能”當中,“從商務智能挖掘中抽取數據工具的知識”和“支持數據建模和分析工具的使用”分別排名位和第二位。在其11月份的《大數據: 福音還是禍源》報告中指出,未來需要新的復合型財會專業人士,能夠對財務、IT和信息三大領域融會貫通。而對每一位數據分析師和管理會計師而言,熟練掌握Excel PowerPivot, 無疑是迎接未來十年,駕馭數據的一張***“駕照”。
對於企業而言,要想成為“敏捷”組織,充分利用數據這一企業寶貴資產來創造價值,僅僅通過IT部門是不夠的,及早在企業內培養起由業務主導的“自助式商務智能的社區環境”至關重要。企業應當開展數據治理和BI治理,完善數據管理制度,加強培訓,並促進業務/IT間的深度交流,甚至成立“自助式商務智能委員會”來推動對來自企業內外部、各種類型數據的充分使用。
任何有Excel基礎的決策者、信息工作者都應當閱讀本書。PowerPivot不是數據分析發燒友的工具,而是大數據時代人人觸手可及的商業智能。
決策者應當學習本書,目前商業報告的閱讀習慣正發生顯著變化,很快會從傳統的靜態報告轉向直接查看的交互式的、參數化的動態報告。
CFO\\\\COO\\\\CIO應當學習本書,因為企業的商務智能能力中心(BICC)建設和大數據分析項目將來很大程度上需要高管層來領導,通過本書可以深刻理解商務智能中端到端的數據加工過程。
統計人員應當學習本書,通過對復雜的數據開展挖掘,從而發現其中隱含的模式和趨勢。
審計師應當學習本書,改進查賬方法,直接對數據庫底層數據進行審計以發現異常和錯誤,高效地收集審計證據。
財務分析師應當學習本書,減少數據準備和報表編制所占的時間比例,而將更多精力用於分析以優化財務決策。
管理會計師應當學習本書,通過將預算數據和實際數據整合,財務數據和業務數據整合,靈活開展多維分析,發現問題產生的根本原因,幫助業務做出改進。
營銷分析師應當學習本書,通過將交易數據、營銷數據庫中的客戶人文數據、互聯網中的客戶行為數據、線下的地理位置數據等整合在一起,開展精準營銷。
商務智能專業人士和大數據分析師應當學習本書,通過在測試環境下快速建立BI原型,對分析需求進行詳細驗證,從而利於進一步在生產環境下進行BI部署。
商學院學生應當學習本書,通過查閱經濟數據庫,通過調研開展實證研究,生成分析圖表以支持論文論點,從而使論文更具說服力。
理工科學生應當學習本書,通過對在實驗室所開展的大量測試和實驗數據進行篩選挖掘,從而快速得出實驗結論。
如今,BI內容很大程度上還是以報表的形式,由IT部門提供給業務部門來使用。據Forrester預計,未來80%的BI內容將由業務人員來創建,企業中的每個人都是“知識工作者”,既是日常經營管理分析報告的創建者,也是經營管理分析報告的使用者,相互協作,相互分享。知識工作者在使用商務智能工具方面,將和駕駛汽車、操作電腦、攝影的過程一樣自然,盡享敏捷與自由。
我要感謝本書的原作者阿爾貝托·法拉利(Alberto Ferrari)和馬可·魯索(Marco Russo),他們身在意大利,卻蜚聲全球,在本書的翻譯過程中花了寶貴時間進行解讀並提供視頻指導。感謝來自搜狐的魏新橋先生,他花了大量時間對第5章、第10章和第11章進行翻譯,並統籌了全文的中文校對和圖文排版。感謝微軟中國區的資深專家王偉民先生,御數坊的劉晨先生,以及國際數據管理協會中國分會的許多成員在本書翻譯過程中給出的建議。
感謝清華大學出版對本書強烈市場需求的前瞻性預判,以及許多對本書深有期待的潛在讀者。
在微軟公司對某些術語尚未形成官方翻譯之前,翻譯這本書是具有挑戰性的,由於PowerPivot獨特高效的數據操控方式,引入了許多傳統電子表格時代不具備的術語。對於專業術語的翻譯,本書同《DAMA數據管理知識體繫指南》(清華大學出版社出版)的翻譯風格盡可能保持一致。如果發現本書包含的詞彙翻譯不夠精練直觀,請通過微信賬號“Excel商務智能PowerPivot”和郵箱pivotmodel@outlook.com與譯者聯繫,以便譯者在以後的印刷中予以修訂。
我們已經盡力確保本書譯文和配套內容的準確性。這本書出版後所發現的錯誤會在譯者的www.pivotmodel.com網站上列出。除此之外,www.pivotmodel.com還提供了本書勘誤、答疑、解惑和討論的空間,以及敏捷BI、自助式BI方面的精選文章。歡迎大家結合使用過程中的實例提出問題,發表商務智能領域的經驗、技巧和心得。
自助式商務智能的使用,同樣也離不開企業良好的數據治理和BI部署治理,有關治理和BI治理的咨詢,請通過郵箱聯繫: pivotmodel@outlook.com。
劉凱的微信公眾號: “Excel商務智能PowerPivot”,微信號: PowerPivotModel。魏新橋的微信公眾號: powerpivot,微信號: powerpivot。
劉凱
美國注冊管理會計師(CMA)
國際信息繫統審計師(CISA)
國際數據管理協會(DAMA)中國分會項目主管
2014年5月