金融計量學源於計量經濟學,二者與金融科技一樣,均屬學科交叉領域。執教之初,筆者一直想為金融科技專業的研究生編寫一本適用於該領域的金融計量學教材。
計量經濟學創始人弗裡希(Ragnar Frisch)是1969年屆諾貝爾經濟學獎得主,他在《計量經濟學》(Econometrica)期刊的創刊詞中,曾為計量經濟學這樣下過定義:“經驗表明,統計學、經濟學和數學,這三者對於真正理解經濟生活中的定量關繫而言,都是必要條件而非充分條件。這三者的統一,構成了計量經濟學。” 這一定義在他1926年發表的論文《經濟理論、數學和統計學的統一》中已具雛形。他使用“econometrics”一詞來代表計量經濟學,這種構詞法借鋻了英國統計學家皮爾遜(Karl Pearson)創辦的《生物統計》(Biometrika)期刊的刊名。計量經濟學的早期發展,面臨兩個基本問題:,經濟關繫是大量個體的加總,難以完全用數據去證明理論;第二,經濟中的數據不像自然科學實驗中的數據那樣具有可控性。弗裡希的學生,1989年諾貝爾經濟學獎得主,挪威經濟學家哈維爾莫(Trygve Haavelmo)在1941年的博士論文《計量經濟學中的概率方法》中,借助概率統計理論繫統地解決了這兩個問題,為計量經濟學建立了嚴密的統計學基礎。哈維爾莫指出統計理論可以估計經濟理論的參數,進而檢驗經濟理論並進行預測,該文於1944年發表在《計量經濟學》期刊上。在吸收統計學和數學研究成果後,計量經濟學的方法論逐漸發展完善。
如果說計量經濟學是統計理論、經濟理論與數學理論的交叉應用,那麼金融計量學就是統計理論、經濟理論與數學理論在金融領域的交叉應用。從狹義上看,金融計量學與美國經濟學家恩格爾(Robert Engle)1982年在《計量經濟學》期刊發表的論文中提到的自回歸條件異方差模型(autoregressive conditional heteroskedasticity model,ARCH)聯繫緊密,因為金融學理論經常使用收益率的方差或標準差(波動率)來度量風險。恩格爾還與英國經濟學家格蘭傑(Clive Granger)一起提出了著名的恩格爾—格蘭傑因果檢驗,共同獲得了2003年的諾貝爾經濟學獎。不過,與恩格爾不同,格蘭傑更關注期望。顯然,期望與方差都是金融學、統計學與計量經濟學的基本概念。以金融學為例,馬科維茨(Harry Markowitz)1952年提出的投資組合理論,便是在均值—方差的框架下建立的。因此從廣義上看,很難界定金融計量學與計量經濟學的邊界,金融學本身就是經濟學的分支之一。本書對金融計量學與計量經濟學二者的差異不加以明確界定,在分析中則偏重金融學理論背景。
大數據(big data)時代的到來,為數據分析帶來了新的方法論,也帶來了應用上的挑戰,在催生了金融科技(Fintech)這一概念的同時,為金融計量學增添了一個交叉領域:計算機科學。計算機科學領域的各類算法在金融科技中的使用,是對經典金融計量學的強有力補充。金融計量學與算法密不可分,金融計量學中常用的小二乘法(ordinary least squares,OLS)本身就是一種算法。1805年,法國數學家勒讓德(Adrien-Marie Legendre)在《計算彗星軌跡的新方法》一文的附錄中,首次使用了小二乘法。樣本的個數多於待估參數個數,例如天文觀測的數據遠多於彗星軌跡所需要估計的參數。參數如何進行估計,困擾了包括歐拉在內的許多學者。勒讓德另闢蹊徑,他假設存在一個理論值,用觀測值與理論值之差的平方和小來估計參數,此時對待估參數求導,就可以得到與參數個數相同的方程個數,從而求解出參數估計量。在計算估計量時,小二乘法並不依賴於樣本的分布,勒讓德也僅僅將小二乘法視為處理數據的一個算法。小二乘法僅依賴於數據的便捷性,奠定了它在金融計量中的重要地位。
算術平均數是小二乘法一個應用的特例,即小二乘法包含了平均數思想,而真正為這種算法建立誤差分析基礎並展示其優越性的,是被譽為“數學王子”的德國數學家高斯。高斯聲稱自己1799年之後就開始使用這種方法,由此引起了小二乘法的發明權之爭,這是繼牛頓和萊布尼茲的微積分發明權之爭後,又一大影響深遠的爭論。高斯1809年之後的繫列工作,將小二乘法建立在正態誤差理論基礎之上,其中一個裡程碑式的貢獻就是高斯—馬爾可夫定理,隻要樣本滿足一定的假設,小二乘估計量就會是線性無偏估計量(best liner unbiased estimator,BLUE)。這表明,在參數的所有線性無偏估計量中,小二乘估計量精度,即估計量具有無偏性(unbiasedness)和有效性(efficiency)。他在研究誤差時從另一個角度推導出了正態分布,因此正態分布又稱為高斯分布,德國10馬克紙幣上就印著高斯的頭像和正態分布曲線,以紀念他的貢獻。在對隨機誤差項引入正態分布假設之後,可以對參數關繫進行檢驗。一種算法,隻要能夠與數理統計建立某種聯繫,就能夠對參數進行檢驗,就能爆發出驚人的生命力,小二乘法就是其中的典型例子。
有小二乘法也就有小一乘法(least absolute deviation,LAD)。事實上,小一乘法的出現比小二乘法更早。1760年,意大利天文學家和數學家博斯科維奇(Ruggero Boscovich)在研究子午線長度問題時就是用該方法,比勒讓德和高斯的小二乘法早了約40年。小二乘法是尋求一條擬合直線,使得各個樣本點距離該擬合直線形成的殘差的平方和小。但是如果存在偏離擬合直線很遠的異常樣本點,該樣本點的殘差平方就會很大,為了降低殘差平方和,就需要調整擬合曲線來“將就”這個點。顯然,如果用殘差的值相加,異常樣本點帶來的影響就會小很多。算法受異常值的影響程度被稱為穩健性(robustness)。尋求擬合直線使殘差值之和小,就是小一乘法。如果說小二乘法蘊含了算術平均數思想,小一乘法就蘊含了中位數思想,隻是計算過程較為復雜而已,但穩健性要強於小二乘法。
在高斯建立了正態分布基礎後,英國統計學家高爾頓(Francis Galton)又引入了回歸(regression)與相關兩個概念。作為以《物種起源》聞名於世的生物學家達爾文的表弟,高爾頓的研究領域涉及氣像學、力學、心理學、遺傳學等諸多領域,而回歸與相關,正是他在研究遺傳學中發現的。在親子兩代的實驗研究中,他發現親子兩代人的各自身高服從相同的正態分布,即具有均值回歸性。如果父親比較高,則孩子往往比父親矮;如果父親比較矮,孩子往往就會比父親高,自然界的力量使得人類的身高遠離值,向平均值靠攏,這就是均值回歸性。金融計量學裡講回歸,基本思想源於算平均數。為了去除實驗數據量綱的影響,高爾頓還引入了相關繫數(correlation coefficient)。此後,他的學生皮爾遜逐步發展並完善了這些概念。
皮爾遜因為他的論文使用了過多的數學,難以在生物學期刊上發表,由此創辦了《生物統計》期刊並擔任主編,統計學中的t分布就發表在該期刊上。1899年,也就是高斯聲稱自己開始使用小二乘法的100年之後,英國統計學家哥塞特(William Gosset)當時還名不見經傳,在愛爾蘭的一家釀酒廠上班。他在分析數據時發現,如果總體服從正態分布,樣本均值的分布雖然在樣本量很大時接近正態分布,但樣本量很小時,又和正態分布不太一樣。例如,OLS下的參數估計量服從正態分布,其方差與隨機誤差項的方差相關,但後者卻是未知的,這時候使用樣本估計量進行替代,就不再是標準正態分布統計量。隨後哥塞特與皮爾遜及英國的另一位統計學家費歇爾(Ronald Fisher)取得聯繫並展開討論,終的研究成果《均值的或然誤差》於1908年發表在《生物統計》期刊上。在正態分布一統江湖的時代裡,哥塞特以筆名“Student”謙虛地提出了新的分布,因此這種分布又被稱為學生t分布或t分布。哥塞特的這種自謙,使得他與皮爾遜、費歇爾兩人長期保持良好的關繫。
t分布的出現,使得統計學出現了大樣本與小樣本之分。小樣本的理論與方法出現在大樣本理論之後,命名卻在大樣本理論前。小樣本,顧名思義,樣本數量有限,可以推導出參數估計量的精確分布,以哥塞特和費歇爾為代表;大樣本,指樣本數量趨近於無窮時的情形,此時可以推導參數估計量的漸近分布,以皮爾遜為代表。F分布的字母F,就是用來紀念費歇爾功績的,而卡方分布盡管不是皮爾遜先發現的,但與1900年皮爾遜的卡方擬合優度檢驗緊密聯繫在一起。一般而言,小樣本以t分布和F分布的統計量為核心,例如在OLS中,檢驗單個繫數是否顯著,就會構造t統計量,而要檢驗估計量是否滿足一組約束關繫,就會構造F統計量;大樣本則以標準正態分布和卡方分布為核心。標準正態分布是t分布的漸近分布,而F分布以卡方分布為基礎,在樣本量趨近於無窮時,F分布可以轉化為卡方分布。t分布、F分布與卡方分布是統計學上所謂的“三大分布”,與正態分布一起,貫穿於本書始終。
在小二乘法之後,皮爾遜與費歇爾分別發展出了矩估計方法(method of moments,MM)和似然估計方法(maximum likelihood estimation,MLE)。與勒讓德和高斯的小二乘法發明權之爭類似,皮爾遜與費歇爾再次掀起了論戰。在哲學層面,皮爾遜認為統計分布是實際數據集合的描述,但費歇爾則認為統計分布是抽像的數學公式,數據隻能用於估計真實分布中的參數。在方法論上,皮爾遜在19世紀90年代發表的繫列論文中提出了矩估計理論。在樣本量趨近於無窮,即大樣本的前提下,經驗分布可以收斂至真實分布,此時從經驗分布出發,基於矩條件構建的一組方程可以用來進行參數估計。但是,它不需要任何分布信息,也不使用總體矩之外的任何信息,而且因為使用的矩條件不同,得到的參數估計量也不同,這些是矩估計被攻擊的根本原因。如果知道總體分布,似然估計一定是選擇。1912年,費歇爾發表了學術生涯的篇論文《關於頻率曲線擬合的一個準則》,重新發掘100年前高斯誤差理論的相關研究工作,在此基礎上提出了參數估計的似然估計方法。如果總體分布已知,似然估計量容易具備漸近有效性(asymptotic efficiency)和漸近正態性(asymptotic normality),大樣本性質極佳。但是,對於一個隨機變量,如果知道了它的分布,也就等於知道了這個隨機變量的全部信息。因此,似然估計在某種程度上是一種循環論證,進行參數估計前就需要知曉總體分布的要求極為苛刻,這也是似然估計被攻擊的原因。費歇爾對統計學的貢獻還有很多,比如金融計量回歸中常用的顯著性檢驗。結合哥塞特的研究工作,費歇爾創立了在檢驗中常用的t檢驗與F檢驗,這樣就可以在樣本量很小的情況,檢驗所關心的某項效應,即檢驗參數是否滿足某種關繫,這與皮爾遜的處理不同,後者受高爾頓的影響,習慣處理通過自然觀測收集的大量數據。在皮爾遜、費歇爾和哥塞特等人研究的基礎上,奈曼(Jerzy Neyman)與皮爾遜的兒子小皮爾遜(Egon Pearson)一起合作,建立似然比檢驗、無偏檢驗、置信區間等理論,形成並完善了當前經常使用的假設檢驗理論體繫。
OLS、MM和MLE這三大算法,可以說都是根源於算平均數的思想,有時也被稱為頻率學派。與之對應的是貝葉斯學派的貝葉斯估計法(Bayesian estimation,BE),它也是數據處理中的常用算法。OLS、MM和MLE這三大算法,都將樣本視為隨機而待估參數視為固定,著眼點在樣本空間,參數的分布基於樣本的分布推導;貝葉斯估計法則完全相反,將待估參數視為隨機而將樣本視為固定,著眼點在待估參數的空間,在計算中雖然也用到樣本分布,但這種使用是技術性的,僅是為了獲得後驗分布。這就使得對前三大算法而言,參數估計的精度與所利用的樣本無關,例如OLS中,樣本隻要滿足一定的假設,參數估計量就會是線性無偏估計量。但是BE的精度是後驗的,取決於所選用的樣本,這在現實應用中顯然更容易被接受。
這四大算法是金融計量學的四大支柱,相互取長補短,在發展的長河中交相輝映。除了OLS一枝獨秀外,MM在20世紀上半世紀基本處於被MLE壓制的狀態,但在廣義矩估計法(generalized method of moments,GMM)興起後,矩估計量具備了性和漸近有效性,又煥發起了新的生命力。BE雖然長期被頻率學派壓制,但在人工智能和機器學習等興起後,又呈現出壓制前三大算法的趨勢。本書作為金融計量學的導論,則主要分析OLS,兼論各個算法的優劣。
筆者參照統計學及計量經濟學的經典教材,結合金融科技的特點,編寫了本教材。本教材具有以下幾個方面的特點。
,以線性模型為基礎。這主要源於金融理論背景,如果將國際金融領域歸為宏觀經濟學,金融理論於1990年次獲得諾貝爾經濟學獎,獲得者分別是馬科維茨、夏普(William Shape)與米勒(Merton Miller)。作為馬科維茨的學生,夏普基於馬科維茨的投資組合理論發展出了資本資產定價模型(capital asset pricing model,CAPM),米勒則與莫迪利安尼(Franco Modigliani)共同提出了資本結構與公司價值的無關性定理,即以二人名字首字母命名的MM定理,由此經典的金融理論也就分為資產定價與公司金融兩個主領域。
以資產定價領域為例,CAPM模型中,市場中任意資產的期望收益率是市場組合收益率的線性方程,這種精確定價模型對應於金融計量學裡的單變量線性回歸模型,即本書的章。但是,CAPM模型成立的前提假設極為嚴格,金融學家羅斯(Stephen Ross)放寬假設,構建了近似定價模型,即套利定價理論(arbitrage pricing theory,APT),也被稱為線性多因子定價模型,這對應於金融計量學的多變量線性回歸模型,即本書的第二章和第三章。在此基礎上,對金融時間序列的常見模型進行基本解構,這構成了本書的第四章。
以線性模型為基礎的另一個理由是便於預測。有規律且便於預測的常用的曲線就是直線與正弦函數,以後者為基礎的預測就是譜分析(spectrum analysis),但弱在可解釋性上。以直線為基礎的OLS兼備了解釋性與預測性的兩大優點,而且非線性情形也可以轉化為線性模型進行分析。
第二,以樣本數據假設為核心。本書從經典的單變量線性回歸模型展開,基於小二乘法,在參數估計及其分布的推導過程中,逐步引入變異性、同方差、無自相關等假設,使讀者能夠知曉該假設用於何處。而對隨機項是否存在正態分布的假設,又是區分小樣本和大樣本的關鍵假設。
隨機誤差項如果給出分布假設,例如服從正態分布,就稱之為小樣本理論,核心結論歸結為經典的高斯—馬爾可夫定理:在參數所有的線性無偏估計量中,小二乘法下的參數估計量方差小。這表明,OLS下的估計量的精度,即估計量具有有效性,這也是OLS的優越性所在,它不同於MM中依賴於經驗分布的矩條件,不同於MLE中依賴於總體分布函數,也不同於BE所需要的先驗分布,僅基於數據就可以計算出參數估計量,而且一定條件下,參數估計量滿足諸多優良的性質。那線性無偏估計量中的“線性”能否放寬呢?為放寬線性假設,引入了費歇爾信息量,證明了小二乘法下的參數估計量不僅在線性無偏估計量中方差小,而且還在所有無偏估計量中方差小。基於隨機項的正態分布,可以構造相應的t統計量與F統計量來對參數進行假設檢驗。這也是本書第二章的核心。在算法中,也經常使用均方誤差(mean-square error,MSE)來度量估計量的精度。在估計量滿足無偏性的前提下,均方誤差就與估計量的方差一樣,但如果放寬估計量無偏性的要求,均方誤差可能比小二乘估計量的方差更低,針對這一問題,第二章也進行了相關分析。
如果隨機誤差項的分布假設沒有給出,不存在正態分布假設,則稱之為大樣本理論。盡管小二乘法可以估出參數,但是無法構建以正態分布為基礎的t統計量和F統計量來對參數進行檢驗。此時大數定理(law of large numbers,LLN)和中心極限定理(central limit theory,CLT)就有了用武之地。大數定理是指,在一定條件下,隨著樣本量的無限增加,樣本平均值就會收斂到總體平均值,即樣本矩在一定條件下收斂至總體矩(期望)。估計量如果收斂至真實值本身,就具有一致性。如果參數估計量不具有一致性,就被稱為存在內生性。也就是說,無論樣本容量有多大,參數估計量都無法收斂至真實值本身,這時候從統計邏輯講,回歸分析就沒有意義。因此,控制內生性是任何一個計量模型都首先需要考慮的問題。中心極限定理是指,樣本平均值漸近服從正態分布,這也被稱為漸近正態性。一旦存在漸近的正態分布,就可以構建標準正態分布與卡方分布的統計量進行檢驗。這也是第三章與第二章的核心區別。
事實上,所有的數據都可以根據相依性、異質性和矩條件進行分類。例如,經常假設數據樣本滿足獨立同分布,在這一簡單情形中,矩條件要求稍弱,有時僅需要矩存在且有限就可以,但時間序列裡面,數據彼此之間經常具有相關性,這時候就需要增強矩條件的限制,以保證可以使用大數定理和中心極限定理。
可以說,一致性是大數定理的應用,漸近正態性是中心極限定理的應用,漸近有效性是費歇爾信息量的應用。參數估計量要想具備一致性、漸近正態性與漸近有效性,本質上就是要將樣本空間限制到能夠使用大數定理、中心極限定理和費歇爾信息量的前提假設條件上。
第三,以“實證六步”為主線。本書始終按“設模型、估參數、論性質、推分布、做檢驗、做預測”的六個核心步驟展開,這也是進行金融計量實證分析的基本流程。包括選擇模型在內,首先需要對樣本進行一定的假設,以估計參數。OLS、MM、MLE和BE的假設出發點都不同,OLS從誤差項平方和小化出發,MM從矩條件出發,MLE從似然函數出發,BE從先驗分布出發,模型選擇不同,估參數的流程也不同。
在估出參數之後,需要討論參數滿足何種性質,如是否滿足無偏性、有效性等,這同時表明,OLS等經典算法的參數精確度獨立於樣本之外。在此基礎上,推導出參數相應的分布,再基於分布構建統計量就可以對參數關繫進行檢驗。第二章的小樣本分析中,以t統計量和F統計量為核心,而大樣本則以標準正態分布統計量和卡方統計量為核心。
基於要研究的金融問題或金融現像,收集相應的數據,構建金融計量模型並檢驗該模型的有效性,終目的是為了對金融問題進行解釋並做出有效的預測。單純的預測問題,是數學或統計學研究的問題,這時候預測過程隻需要服從數學邏輯或統計邏輯即可。但是,金融計量學從金融理論和金融數據出發,除了需要統計邏輯,更需要金融邏輯,構建金融計量模型,除了需要對金融現像的發展前景進行預測,更需要對金融現像進行解釋。一個好的金融計量模型,一定是統計邏輯與金融邏輯一致,模型既具備金融理論基礎,又可以通過統計上的顯著性檢驗,從而實現對所研究問題的解釋和預測。但是,如果不滿足統計邏輯,或者模型的顯著性沒有通過檢驗,也不能直接否認模型中蘊含的金融邏輯。金融邏輯與統計邏輯並不必然一致,這就是金融計量學與統計學的核心區別所在。
從金融邏輯出發,由數學邏輯完善,再經過統計邏輯檢驗,後回到金融邏輯去解釋和預測,這就是完整的金融計量學鏈條。
第四,以邏輯證明為切口。本書一個鮮明的特點是以邏輯證明為主,除了使讀者知其然,更側重使之知其所以然。章從簡單的單變量線性回歸模型出發,給出“實證六步”的完整證明,假設的嚴謹性也在證明過程中逐步加深。在對單變量線性回歸模型建立直觀理解的基礎上,第二章直接引入矩陣,從矩陣代數的相關知識出發,給出OLS參數分布的完整推導,包括高斯—馬爾可夫定理的證明。對於統計量的構建及其分布的推導,也給出了完整證明。從第二章可以看出,隨機誤差項是否服從正態分布,對於小樣本分析而言,至關重要。放寬正態分布假設後,就進入了大樣本理論分析的領域。
第三章首先介紹了大樣本理論基礎的兩大基石,即大數定理和中心極限定理。一致性和漸近正態性就是這兩大定理的直接應用。本書隨後給出了違反一致性而產生內生性的三大常見情形:聯立性偏誤、缺失相關解釋變量和解釋變量存在測量誤差。對為克服內生性而形成的工具變量法等方法也做了簡要介紹。同時,本章也依據相依性與異質性對數據進行了分類並簡要討論。如果數據不滿足獨立、同分布,則可以使用遍歷性與平穩性來進行近似替代,同時加強對矩條件的限制。在此基礎上,第四章對平穩時間序列、非平穩時間序列和條件異方差時間序列的基本模型進行了簡要解構。當然,作為導論,本書並沒有給出所有結論的證明,更強調它們所表達的含義與應用。
本書是筆者在講授金融計量學課程中形成的,感謝我的研究生錢龍和瀋佳瑜對本書的辛苦整理工作,感謝我的研究生王順龍、張俊超、商同澤、瀋心如、瀋鑫圓、王江偉、張悅寧對本書的校稿工作,感謝他們加速了本書的成稿。感謝中國科學院數學與繫統科學研究院李琳博士和武晨博士、中山大學趙慧敏副教授和張俊玉副教授、中央財經大學孫會霞副教授在本書成稿過程中有益的完善建議。由衷感謝我的導師黃嵩副教授,他的鼓勵是我編寫這本教材的動力。後,需要感謝的是我的家人,感謝他們在成書過程中對我的支持與照顧。
本書適用於金融計量相關專業的高年級本科生和研究生,也可以作為從事金融計量研究的同行的參考書。由於筆者的水平有限,書中錯誤在所難免,懇請同行專家與讀者批評指正。
倪宣明
2020年3月