前 言
現代職場最基本的要求將是學習了數學和統計學……
V. Mayer-Schonberger & K. Cukier
商業分析與決策
我們正在進入或已經生活在大數據時代。所有企業每天都要收集及處理大量數據。據麥肯錫(McKinsey & Company)(2015) 估計, 早在2009年,美國1000人以上的公司平均每個公司已累計了200TB的數據。在中國,有人估計到2020年,平均每個人每年產生的數據可達4.1GB 。如何使用這些數據已經成為許多企業在激烈的市場競爭中能否制勝的關鍵因素。數據本身隻是一些未經處理的(原始)數字。這些未經處理的數字並不能告訴我們什麼,其本身並不能產生價值,亦不能為決策者提供參考。隻有經過整理、分析,我們纔能找出這些數據所隱藏的趨勢、各有關變量間的關繫及其他信息,從而為管理人員做出正確的決策及把握商機提供準確而及時的參考和支持。這就是商業分析(Business Analytics,BA)的工作。由於數據重要性的日益凸顯,所有管理者都要用到定量分析(quantitative analysis)的方法。很多企業對管理人員的基本要求之一是具備一定的商業分析能力,並能將分析結果運用到決策中以解決工作中的各種問題。
商業分析就是對企業的大量數據進行分析,找出與企業商業活動有關的各種趨勢(trend)、模式(pattern)和各因素間的相互關繫等,使這些數據成為信息(information),成為知識,為企業決策提供咨詢和支持。商業分析試圖回答的問題包括一件事情(一種結果,等等)為什麼會發生;在相似的條件下這種事情還會再發生嗎;如果我們改變其中的一個條件,事情會有什麼變化;等等。商業分析用到的主要是統計及其他定量分析方法。商業分析基本上由3部分組成:數據處理及分析(主要是統計)、決策及與決策有關的不確定性分析。
關於本書
1.目的及特點
商業分析中的數據分析基本是商業統計的內容,而決策、不確定性分析及建模則屬於管理科學(management science)的範疇。從企業管理人員或商業分析師的角度來說,二者實際上是密不可分的。因為本書的讀者對像主要是企業管理人員和商業分析師及與大數據分析有關的人員,我們將二者放在一起討論。作者相信,這種安排更有利於讀者對內容的學習及掌握。本書的目的是繫統地介紹商業分析,使讀者閱讀完本書後對商業分析的內容、方法及應用有一個比較好的理解,並能將這些知識及方法運用到工作中,解決工作中遇到的問題。本書的一大特點是運用大量商業方面的例子對各種概念及其應用進行討論,並介紹如何用Excel來建立模型以分析和解決各種問題。作者希望,讀者在讀了本書後能夠將本書討論的概念、方法及各種Excel知識和技巧處理用於解決工作或研究中遇到的有關數據處理、分析、決策、風險分析等方面的實際問題。
2.對讀者背景知識的要求
數據分析大部分內容都與統計有關,但本書並不假設讀者在閱讀本書之前有很多統計學的基礎。本書將繫統介紹數據分析中要用到的統計學中有關的基本概念及方法,但本書不是一本統計學教程,故不會對統計理論做太多討論。統計學的概念及方法隻是我們解決問題的工具。本書的重點將放在如何運用這些工具來解決工作中的實際問題。隻要對這些概念及方法有正確的理解,我們就能夠正確運用這些概念及方法來解決工作中的各種問題,而沒有必要對其中的理論基礎做過多討論。
微軟的Excel@ 幾乎已成為所有企業用於數據處理分析的最重要的工具。本書主要目的之一是介紹如何用Excel解決各種商業分析方面的問題。本書隻假定讀者具備Excel的入門知識,如Excel的建檔及其他各種基本知識等。如果讀者從未使用過Excel,建議讀者讀一讀Excel的入門書,再用一用Excel,以對其基本用法有所了解。本書會對用到的Excel公式、函數等進行詳細討論。
3.本書內容
本書分4篇19章。第1篇和第2篇屬於數據分析,第3篇為回歸與預測,第4篇為建模、優化與風險分析。
商業統計可分為兩大部分:描述統計和推斷統計。本書第1篇是描述統計,包括6章(第1章~第6章),將繫統介紹統計學的基本概念及各種統計分布類型,主要包括描述、總結和表達不同類型數據的概念及方法。我們將首先討論定量分析的特點及步驟(第1章),數據的整理及表示(第2章),然後是數據的分散和集中程度及表示方法(第3章)。概率的概念是研究各種隨機變量的基礎,我們用一章(第4章)的篇幅介紹了概率的基本概念及計算。第5章和第6章則是離散型與連續型隨機變量的常見分布。
第2篇是推斷統計方面的內容,共有6章(第7章~第12章),包括抽樣及各種估計和檢驗的方法及其應用。第7章抽樣及抽樣分布討論了各種不同的抽樣方法。這些方法都是為了使抽到的樣本是隨機的(或盡可能是隨機的),樣本特征盡可能反映總體特征。第8章是根據樣本統計值估計總體統計值。由於假設檢驗在數據分析中的重要性,本篇用了4章的篇幅(第9章~第12章)討論各種假設檢驗及其應用。
第3篇是回歸與預測,由3章(第13章~第15章)組成。回歸要回答的是不同變量之間關繫的問題。第13章側重於簡單線性回歸,第14章則討回歸的問題;第15章的內容包括時間序列數據的特點及各種預測方法。
本書最後一篇即第4篇分為4章(第16章~第19章)。第16章包括Excel建模的方法和技巧,以及不同類型的Excel模型。第17章和第18章則對如何尋找最優方案進行了討論。第19章的內容涵蓋了風險分析的概念及方法,特別是如何用模擬的方法對風險進行分析。
4.本書的術語及符號
(1)本書術語
本書術語的中文主要根據下列著作確定。
有關統計的術語:
戴久永. 統計概念與方法. 1998. 三民書局,647頁.
吳柏林. 現代統計學. 2013. 五南圖書出版公司,468頁.
有關Excel的術語:
Microsoft Excel幫助. https://support.office.com/zh-cn/excel
蘇蕊, 等. Excel表格、公式、函數與圖表完全學習手冊. 2013. 電子工業出版社,337頁.
(2)有關符號
{}: 表示隨書所附Excel文件的文件名。
例如,{C03F3.32}表示Excel的文件名為C03,工作表的名字為F3.32,即第3章(C03)圖3.32(F3.32)的數據、計算、模型或圖。有時一個工作表會有數個圖,這時會在F後面將該工作表的圖列出,如{C02F2.8-2.18}表示該工作表的圖或數據包括圖2.8~圖2.18。
書中有時會介紹一些Excel應用的小竅門(tips),若其中有數據引用,表示方法與上面相似,但將F改成了T。如{C02T2.1}表示Excel的文件名為C02,工作表的名字為T2.1,即第2章(C02)Excel小竅門2.1(T2.1)的數據、計算或模型。與小竅門有關的工作表(T)位於該章Excel文件的最右(後)方。
【】:表示Excel中的各種選項和功能。
例如,【數據分析】表示Excel中的“數據分析”選項。
→:Excel操作過程中從一步(上一步)到另(下)一步。
例如,單擊【數據】→【規劃求解】,表示單擊Excel的【數據】選項,然後單擊【規劃求解】。
5.致謝
在本書寫作過程中,作者與同事就有關數據分析及Excel應用的討論讓作者受益匪淺。好友何秀娟女士、張紹輝博士及王薇博士的建議使本書增色不少。作者感謝同事和好友的支持。
本書承石會敏和徐萍女士悉心編輯,特此感謝。
本書由澳門基金會資助出版。
陳星玉(echen05@yahoo.com)
2017年1