內容介紹 | |
-
出版社:清華大學
-
ISBN:9787302485551
-
作者:(意)薩特利|譯者:吳瓊莉//丁義明//易鳴//範清風
-
頁數:254
-
出版日期:2018-03-01
-
印刷日期:2018-03-01
-
包裝:平裝
-
開本:16開
-
版次:1
-
印次:1
-
字數:292千字
-
-
《全局敏感性分析》提供了一個簡單易懂的手冊來實踐敏感性分析,闡明了敏感性分析如何有助於建立一個*具魯棒性、*簡潔的模型,以及怎樣讓模型*加經得起推敲。
-
本書給出關於該學科全面的方法介紹,讓讀者可以學習並實踐全局敏感性分析,而不需要再查閱其他書籍。首先,介紹了構建敏感性分析框架的方法,如何解釋結果,從而避免某些缺陷。其次,利用富有特色的大量習題和答案進一步闡明敏感性分析的應用。本書適合來自不同領域的研究生或者科研人員閱讀,例如統計學、數學、工程、物理、化學、環境科學、生物、毒物學、保險科學和計量經濟學等,也同樣對從事風險分析,定價和對衝金融分析的工程師們有重要的價值。
-
無
-
第1章敏感性分析導論 11模型與敏感性分析 111定義 112模型 113模型和不確定性 114如何建立不確定性和敏感性分析 115對模型質量的影響 12敏感性分析的方法和設置簡介 121局部與全局敏感性分析 122測試模型 123散點圖與導數 124標準差歸一化導數 125蒙特卡羅和線性回歸 126條件方差:**種釋義 127條件方差:第二種釋義 128對於式(13)中模型的應用 129**種設定:參數優先排序 1210非加性模型 1211高階敏感性繫數 1212總階效應 1213第二種設定:參數固定 1214敏感性分析基本原理 1215組參數的處理 1216其他方法 1217元效應分析 1218蒙特卡羅濾波 13非獨立輸入參數 14敏感性分析的可能缺陷 15結束語 16習題 17習題解答 18補充習題 19補充習題答案
第2章實驗設計 21導言 22對單個參數的依屬關繫 23對單個參數的敏感性分析 231隨機取值 232分層抽樣 233分層抽樣的均值與方差估計 24多參數敏感性分析 241線性模型 242單次逐個(OAT)取樣 243影響參數個數的限制 244部分析因抽樣 245拉丁超立方體抽樣(LHS) 246多變量分層抽樣 247弱差異序列的準隨機抽樣 25組抽樣 26習題 27習題解答
第3章元效應方法 31導言 32元效應方法 33抽樣策略與策略優化 34敏感性繫數的計算 35組參數的計算 36元效應(EE)方法步驟 37結論 38習題 39習題解答
第4章基於方差方法 41不同設定的不同測試實例 42為什麼選擇方差 43方差方法發展史 44相互作用效應 45總效應 46如何計算敏感性繫數 47FAST和隨機平衡設計 48方法應用實例:疾病傳染動態模型 49額外解釋 410習題與解答
第5章參數映射和元建模 51導言 52蒙特卡羅濾波(MCF) 521蒙特卡羅濾波方法植入 522優缺點分析 523習題 524習題解答 525例子 53元建模和高維度模型表述(HDMR) 531HDMR計算和元模型 532簡單例子1 533簡單例子2 534習題 535習題解答 54結論
第6章敏感性分析:從理論到實踐 61例子1:綜合指數 611問題陳述 612估量各**環境可持續發展綜合指數 613選擇敏感性分析方法 614敏感性分析的過程及結果 615結論 62例子2: 跳躍在期權定價中的重要性 621問題提出 622帶跳躍的Heston隨機波動率模型 623選擇合適的敏感性分析方法 624敏感性分析的過程及結果 625結論 63例子3:化學反應 631問題提出 632間歇式反應器中的熱失控分析 633選擇合適的敏感性分析方法 634敏感性分析的過程及結果 635結論 64例子4:混合的不確定性—敏感性作圖 65什麼時候使用什麼方法
後記
譯後記
參考文獻
〖=(〗1112348910111114151819202223262829303232333436363739394344464648515152535657586163677173788588979798100104108110114115117136136137139141142144147149153153162162163164166167168176186187196199202202206209209209210212213221223223225227227230231231231234234237238239243245247〖=〗
-
第1章敏感性分析導論
11模型與敏感性分析
什麼是模型?敏感性分析考慮什麼樣的模型輸入?在建模過程中,不確定性分析和敏感性分析起到什麼作用?它們的作用在於,幫助我們了解不確定性在模型內部傳播的主要途徑,以及評估其對模型質量的影響。 111定義
敏感性分析可定義為研究模型輸出的不確定性(數值的或者其他類型的),如何能夠追根溯源到模型輸入的不確定性(Saltelli et al,2004)。與敏感性分析相關的是“不確定性分析”,不確定性分析量化評估模型的輸出。理想情況下,不確定性分析和敏感性分析應該先後成對進行。
在這種定義下,首先要明確的概念是:什麼是“模型”,什麼是“輸入”,什麼是“輸出”。這些概念將貫穿本書的始終。 112模型
圖11所示的建模框圖能幫助我們了解敏感性分析在整個科學過程中的作用。該圖引用自生物學家Robert Rosen (1991)(也可見文獻Saltelli et al,2000,pp34)。在Rosen的框圖左邊,是整個“現實世界”,是研究的主體繫統。我們有理由相信,這個繫統不管是自然的還是人工的,或是被某種規則所驅使運轉的,而這種規則,我們可以揭示並為我們所用。因此,我們制定或者假想出模型的一套結
圖11Rosen模型(1991)
構(圖中右邊所示)。例如,一種假設的世界上某一物種的生長機制可以在模型中翻譯為差分方程。當這一物種以其自己繫統規則(也是我們致力於弄明白的規則)持續生長,*後安靜地在世界上消失,這一過程可以在差分方程裡面用數學算法來解得。Rosen的直覺假設是,當自然界的物種遵循某種“規則”時,差分方程也是有“規則”的,不管是形式上的,還是數學上的。沒有哪種“規則”可以決定自然界的這種假設的規則以什麼方式影射到模型中的這種“規則”。在Rosen的言論中,當現實世界和模型各自內部相關,模型對現實世界的描述作用是有限的。這種悖論形成的原因是:模型能捕捉到的現實世界是被主觀加工過的封閉的內部相互關聯的個體,而不是開放的
當一個模型的作用在於學習一個繫統的不可觀測部分時,這種現像尤甚。。這也是當考察的現實世界是自然繫統的一部分時Rosen的觀點。然而,經驗告訴我們,即使現實世界是一個嚴格定義的封閉繫統,如人工繫統,一個人工元器件或者一個機械裝置,不同的建模者會有不同的繫統描述,這些模型的輸出會與相同的觀測結果相吻合,但是其結構卻不盡相同。
一個初步接觸建模的學生如果對那些顯而易見的自然規律的美習以為常,那麼他也不得不接受一個不太令人舒服的現實,那就是往往對於同一組數據或者證據有多個模型與之匹配。有學者為這種現像專門造了一個詞:equifinality(Beven,1993,2001, 也見Saltelli et al 2004, pp173178),這個詞的意思是說不同的模型也會有相同的結果。也有另外的說法把這一現像叫作模型的不確定性。
從伽利略時代,科學家們就不得不面對人類大腦在創造從“現實世界”到“模型”的映射這一過程中的局限性。在這種背景下,“規則”這個詞可以理解為是一種艱難的簡化、分離和辨識的過程,這一過程導致了模型特有的簡單和美。 113模型和不確定性
使得建模和科學研究比較困難的一個原因就是不確定性。不確定性不是科學方法的偶然事件,而是其實質。“這是科學的含義。問題及其答案都在不確定性當中混在一起,這個事實也令人苦惱。但是沒有辦法,你沒法隱藏什麼,相反,所有的一切將在不確定性當中展開。”(Heg,1995)。
在模型的不確定性問題上,建模工作者和科學哲學家爭論由來已久(Oreskes et al,1994)。如今,大多數建模工作者會承認一個模型如果從“被證明是真實的”這個角度來講,是沒有辦法校驗的。*令人信服和正確的說法應該是,一個模型經過了各種擴展性的確證,即通過了各種測試:是否合乎規範,是否內部一致,或者模型在一定程度上具備解釋和預測真實世界的能力。
如果模型失效,繼而在不同科學團隊之間引發爭議,這種後果是嚴重的。 建模信用危機,荷蘭RIVM實驗室(Van der Sluijs,2002),又見MacLane(1988)。因為模型的應用是廣泛的,而不確定性有可能被很功利性地加以利用。一位荷蘭環境科學家(Int Veld,2000)就這樣說過,“所有的團體以一種選擇性方式處理環境信息,或者進行巧妙的處理”。巧妙設計處理模型的不確定性在一些諸如健康、環境等重要問題上的爭議是比較普遍的。
總之,模型是科學方法的一部分,因此也成為認識論爭論的主題。後常規科學(PNS,見圖12;Funtowicz,Ravetz,1990,1993;Funtowicz等,1996)提出了一種構造當代科學辯論的方法。
圖12Funtowicz,Ravetz不確定性/風險圖(1990)
在後常規科學中,要區分三種科學生產模式,取決於繫統的不確定性,而且與風險也有關。
應用該理論到建模中的各種需求和實踐有如下幾個方面。
●應用科學:模型為一個封閉的專家團體創建並且僅僅為其所用。例如,這是用來解決一個局限的化學動力學問題的模型。 ●當模型作為“咨詢”用途時,*容易被審查。例如,為一個社區內新的道路或橋梁的建設所產生的影響做成本效益分析。 ●在**變化背景下計算氣候敏感性。在這種情形下,屬於我們所講的後常規科學的範疇。科學及其模型為具有衝突的利害關繫和信念提供了證據。
像理論科學一樣,模型可以給出其譜繫以幫助我們判斷其品質。 這種模型譜繫考慮了該模型過去的使用情況,其支持者的狀態,同行接受程度等(Van der Sluijs,2002;Craye等,2005)。在這個譜繫中,模型質量與“有目的性的擬合”*密切相關,也就是說,當模型建立時這個特定的目的比模型的內在構成*為重要。
科學與決策相關的產出模式,Funtowicz (2004)中給出了相應的後常規觀點。Ravetz (2006) 中對模型作為一種比喻做了討論。
114如何建立不確定性和敏感性分析
如本章開頭所提到的,敏感性分析的定義涉及模型本身、模型的輸入和輸出。我們現在嘗試以模型本質和作用定義模型的輸入,以及設置不確定性和敏感性分析。模型可以有如下類型。
(1) 診斷型或預測型的模型。換句話說,要區分這是一個用來理解特定規律的模型,還是一個用來預測在特定規律下的繫統行為的模型。模型可以從天馬行空的假設遊戲(例如,外星智慧是否存在的模型)到被認為是準確和可信的預測繫統模型(例如,一家化工廠控制繫統)。 (2) 法則驅動或者數據驅動的模型。法則驅動的模型是將對繫統有貢獻的規律法則綜合在一起,以預測其行為。例如,使用Darcy和Fick定律來理解一種溶質在流動的水中通過多孔介質的運動。數據驅動的模型是將溶質作為信號以獲得它的統計性能。像數據驅動模型的倡導者指出的那樣,這些模型可以以一種精簡的方式建立起來,即用*小的可調參數描述現實(Young等,1996)。對比之下,法則驅動的模型,通常過參數化,因為它們可能包括*多的相關規律,而這些規律缺乏可用的數據量支持。出於同樣的原因,法則驅動的模型可能有*強的能力描述未觀察到的情況下的繫統,而數據驅動的模型**於支持在做估計時所使用的與數據相關聯的繫統行為。統計模型(如分層或多層模型)是數據驅動的模型另一個例子。
除此之外,也有其他類別的模型
貝爾等,(1988)區分正式(公理),描述性與規範性模型(代理人應遵循有助於達到目標的規則),在本書中的例子都是描述性模型。。模型輸入的定義取決於作為研究對像的特定模型。為了做不確定性及敏感性分析,可以將輸入看作可以驅動模型輸出的所有變量。
考慮圖13所示的方案。這裡有觀測值(為簡單起見,假定無誤差)和一個模型,其參數從觀測數據估計。參數估計可以采取不同的方法,通常是通過*小化度量所述模型預測和數據之間的距離,如*小二乘法。在估計步驟結束時,“*佳”的參數值以及它們的誤差是已知的。在這一點上,可以認為模型是“真實”的,而參數的不確定性經由模型傳播至模型的輸出端來做不確定性分析。在這種情況下,所估計的參數成為我們研究的因素。
圖13參數自助版本的不確定性和敏感性分析
這種研究的一種方式是通過蒙特卡羅分析來實現的。在此我們考察輸入參數的分布函數,這些分布函數往往由估計來獲得。例如,可有以下方案。
●從參數α~N(α-,σα) 開始,經過參數估計之後,α 呈正態分布,均值為α-,標準差為σα。 ●同樣的分布也適用於參數β 和γ 。雖然邏輯上來講有點不現實,為了簡化考慮,假定參數是相互獨立的。這個問題在以後的章節會詳細討論。 ●對於每個參數,從其分布中取樣。例如,產生一簇向量(α(j),β(j),…) ,其中j=1,2,…,N ,而(α(1),α(2),…,α(N)) 是依分布α~N(α-,σα)的抽樣,同樣的抽樣也適用於其他參數。
α(1)β(1)γ(1)…
α(2)β(2)γ(2)…
…………
α(N-1)β(N-1)γ(N-1)…
α(N)β(N)γ(N)…
(11)
●對矢量α(j),β(j),…計算(習慣上也稱為“運行”)模型輸出,因此得到模型輸出Yj 的N個值。 注意:此處的模型輸出Yj可能與參數估計時的模型輸出不一樣。 y(1)
y(2)
…
y(N-1)
y(N)(12)
這些步驟構成了不確定性分析的過程。從這些步驟可以計算出模型的平均輸出,標準方差,其分布的分位數,置信區間,點描出其分布,等等。顯然,這種分析有時被稱為“參數自助”
自助是重復多次替換采樣的過程。例如,如果我們想估計三個Bingo遊戲片的和,可以通過從Bingo袋子中隨機抽取三個,計算它們的平均值,然後把遊戲片放回袋子再抽。當抽取次數足夠大時平均和可以計算出來,這種策略被稱為Bingo遊戲片自助法。,在這裡,模型輸入是模型的參數。這種不確定性分析之後再進行敏感性分析,以確定哪些輸入參數是*重要的,能*加影響模型輸出的不確定性。在這裡簡略這一步是為了繼續關於模型輸入的探討。
注意:為了剛剛講的不確定性分析,我們認為相關的輸入隻有估計的參數。其他的模型輸入信息均被忽略不計,例如,觀測數據,物理或數學常數,內部模型的變量(如網格點的數量,如果模型需要一個網格的話),也就是說,我們不考慮它們的變化對模型輸出造成的變化。
在圖14中,我們做了一個不一樣的不確定性分析,對觀測值采樣,而不是參數。此時隻有有限的觀測值,而我們都知道,觀測值不同的子集可能都會使我們嘗試一個不同的模型去擬合數據。為了對數據進行公平的處理,我們所能做的是選擇觀測值的一個子集,基於這些數據和預先建立的模型選擇準則選擇一個模型,使用相同的采樣數據估計相應的參數,運行模型來計算Yj。我們采取替換采樣,然後重復這個過程,識別潛在的不同的(或者是相同的)模型,參數估計(如果模型是不同的,參數個數與之前的可能有不同),如此反復總共N次,直到我們得到不確定性分析的采樣。這種方法可以被稱為“自助建模過程”(Chatfield,1993)。
圖14“自助建模過程”(Chatfield,1993)
這種不確定性分析的輸入已變成自助重復數據,因為我們假定所有其他步驟(從模型選擇到參數估計)是自動完成的,因此沒有增加模型輸出的變化。
圖15中比較了一套合理的模型與數據。利用貝葉斯分析,我們可以得到模型後驗概率以及相關參數的分布(Saltelli 等,2004)。一旦模型的*新和參數估計完成,就可以得到一個平均模型用於不確定性分析。
圖15貝葉斯模型平均
這個過程是這樣實現的:先根據模型和參數的分布來抽樣,在繫統中傳播不確定性,從而產生一個模型輸出Yj。這個過程稱為貝葉斯模型平均
這種方法詳見Kass, Raftery(1995),Hoeting等(1999)。相關敏感性問題見Saltelli等(2004,pp151192)。,在這種情況下,敏感性分析的輸入是模型和參數,***地講,是不同的模型表示和不同的參數概率分布。在Monte Carlo框架下,觸發變量將被采樣,以根據後驗概率選擇模型,同時參數也將被采樣,模型輸出也將被確定。敏感性分析可以在這一點上執行。然而一個可能的問題是:有多少的不確定性是由於模型的選擇造成的,有多少不確定性又是由參數估計造成的?
115對模型質量的影響
以上不確定性和敏感性分析方法的插圖淺顯地說明了“什麼是敏感性分析的輸入”,這一問題的答案取決於分析是如何建立的。輸入是可以變化的,以研究其對輸出的影響。敏感性分析將反過來指導建模者弄清楚輸入對於輸出的相對重要性。一個明顯的結果是,建模者將忽略這些已經固定了值的變量。當然,這對建模者來說是一種危險的做法,作為一個被視為無影響的變量而固定其值會在稍後的階段影響分析結果。例如,建模者不幸後驗發現網格尺寸太大,網格點的數目對模型輸出有巨大的影響。
因此,應該在決定不確定性和敏感性分析的輸入時做盡可能認真和客觀的分析。顯然,如果在輸入端計入*多的變量,並允許其不同程度的變化,模型預測的方差也*大。這可能會導致一種情況,在這種情況下我們會發現,計入所有的不確定性後,模型預測變化如此之大,以致它沒有實際用途。計量經濟學家愛德華E Leamer(1990)已經精闢地概括了這種權衡:
“我提出了一種有條理的敏感性分析形式,我稱之為‘全局靈敏度分析’。在全局敏感性分析中,選擇替代的假設區間和確定相應的區間推理。結論認為隻有假設區間足夠寬而可信,推斷出的相應的區間足夠窄而有用。”
注意:他強調“在假設區間的可信度”的必須性。證明模型失效的*簡單的方法是證明它脆弱就站不住腳的假設。然而,這種權衡可能不會如想像中那樣引人注目,而且增加輸入要素的數量並不必然導致模型輸出方差的增加。有實踐記錄稱,在大多數的不確定性分析和敏感性分析中,輸入因素的重要性僅僅簡單分布在類似於**的財富這種因素上,僅僅幾個因素導致了幾乎所有的不確定性,大多數其他因素對於不確定性隻有微不足道的貢獻。因此,如果“關鍵”的因素是明智的選擇,在分析中進一步增加輸入變量可能會增加分析的完整性和說服力,反而沒有增加輸出方差。
如前所述,一個模型的品質在很大程度上取決於其有目的的擬合功能。如果建模作為一種工具,模型不能被證實(由於不確定性的普遍性質,以及分離觀測者的觀測值所反映的事實的困難)
“價值”在這裡的意思是道德判斷。在很多情況下,事實和價值的分離很艱巨,如當模型試圖評估采用新技術的影響,相應的環境威脅,在經濟學裡的分配問題,等等。,建模者有道德義務(事實上它是建模者的實際利益)盡可能嚴格地評估模型魯棒性推理。這樣做會產生*好的和*簡潔的模型,並將在科學爭論和公共政策或辯論中加強分析的說服力。
12敏感性分析的方法和設置簡介
本節將回答如下問題:可以用哪些方法?一個特定的方法如何用來解決一個特定的問題?我們如何清楚地定義一種因素的重要性以及提出一些實踐建議。
121局部與全局敏感性分析
我們將在下面的章節中學習敏感性分析在經濟建模中的很多用途。它可以給分析者帶來驚喜的發現,如發現模型中的技術性錯誤,確定輸入域的關鍵區域,明確優先研究重點,簡化模型和證偽分析。在用於政策評估的模型中,敏感性分析可以驗證鋻於繫統中的不確定性而采取不同政策選擇之間的差別,等等。問題是,要選擇什麼方法進行上述的敏感性分析?
大部分文獻中的敏感性分析是基於導數的,這不是偶然的。事實上相對於輸出Yj與輸入Xi的導數dYj /dXj可以認為是一種Yj對於Xi敏感性的數學定義。
在導數的計算方面,有些復雜的物理、化學或遺傳模型的計算機程序,增加了特殊的程式以便高效計算繫統導數大型陣列。隨後這些導數被用於校準模型、模型降階或驗證以及模型反演(Rabitz,1989;Turanyi,1990; Varma等,1999;Cacuci,2003;Saltelli等,2000,pp 81101)。
基於導數的方法在節約計算時間上是**有效的。它僅僅需要運行模型幾次即可算出導數陣列。然而,其在分析時間上卻是低效的。分析的人需要介入計算機程序,將Ad Hoc編碼嵌入,並有效地執行此操作。基於導數的方法的致命缺陷是模型輸入的不確定性和模型線性度的未知性。換句話說,結果僅僅在計算導數的這一點上有效,而且也不能遍歷其他的輸入空間。這個問題對於線性繫統比較少。在線性繫統中,一點上的偏離程度能夠用一階導數很快算出來。但是當繫統為非線性時,問題就比較多。本書的重點在於探討當繫統有不確定輸入存在時,定量分析繫統的不確定性及敏感性。我們利用探索整個輸入空間的方法,考察空間中大量的數據點。因而這種方法較之在空間一點上的導數*有信息量,魯棒性*強。本書中,當用導數增長率YjXi+ΔXi-YjXi/ΔXi 時,通常我們在輸入空間的一簇點上計算Yj並取其平均,這樣得到當將因子Xi在空間不同點變化ΔXi時,如點X~i
如下所有的論述中,X~i表示除去參數Xi之外的所有參數。 ,Yj的相應變化。
為了引入敏感性分析,我們先從導數開始,舉一個簡單的例子。
122測試模型
假設模型有如下線性無誤差的形式
Y=∑ri=1ΩiZi(13)
輸入參數為X=(Ω1,Ω2,…,Ωr,Z1,Z2,…,Zr)。 為了方便起見,這裡省略了模型輸出編號j。式(13)中隻有一個輸出變量。首先假設Ω是固定的繫數,因而式(13)中真正活躍的模型參數隻是Z1,Z2,…,Zr。Y可能是一個綜合指標之類的輸出變量,如一個可持續性指數或溫室氣體排放指標,其中Ω是專家們給Z變量加上的一個權重。例中,我們認為權重是固定的,而單個變量定性為獨立正態分布,且均值為零,即
Zi~N(0,σZi)i=1,2,…,r(14)
如果模型是復合因子,且是標化的變量
一個變量標準化的方法是:將變量減去其均值,除以其標準差。,所有的σZi應該為1。
由式(13)和式(14),**容易證明(見練習)Y呈正態分布,參數為
=∑ri=1Ωii(15)
σY=∑ri=1Ω2iσ2Zi(16)
為了舉例的方便,我們認為這個特定的指標變量已經根據其不確定性的大小排好了序: 從稍微不確定到很不確定的順序排序,即
σZ1<σZ2<…<σZr
權重Ω相等且是常數:
Ω1=Ω2=…=Ωr=常數(17)
123散點圖與導數
圖16顯示Y相對於Zi的散點圖。通過對模型進行Monte Carlo實驗來得到這個圖。正如我們已經提到的(第2章中還將詳細討論),Monte Carlo方法是基於對參數值的分布進行抽樣的。在多數情況下,這些參數被認為是獨立的,因而樣本抽自每個參數的邊緣分布。輸入樣本為
M=z(1)1z(1)2…z(1)r
z(2)1z(2)2…z(2)r
…………
z(N-1)1z(N-1)2…z(N-1)r
z(N)1z(N)2…z(N)r
(18)
圖16Y對應於Z1,…,Z4的散點圖。哪個參數是影響*大的參數?
可以通過對比Ⅰ、Ⅲ像限和Ⅱ、Ⅳ像限來看哪個正線性關繫*強來判斷
依矩陣(18)依次計算每行輸入所對應模型即式(13)的輸出,得到如下的模型輸出向量:
Y=y(1)
y(2)
…
y(N-1)
y(N)(19)
y(1)是通過這組輸入z(1)1,z(1)2,…,z(1)r而得到的輸出,其他輸出依次類推。 基於這種模型輸入和輸出的抽樣,我們通過依次投影N個模型輸入和對應的模型輸出Y(假設是一個標量)描出r個散點圖。
通過散點圖可以看出,Y對參數Z4比對參數Z3敏感,輸入參數,按照它們對輸出的影響大小可排序為
Z4>Z3>Z2>Z1(110)
從圖16中看出,Z4的散點分布比Z3的散點分布形狀*明顯,可以得到這樣的結論。 然而,如果直接用Y相對於Zi的導數來計算其敏感性,即用如下的度量來考察Zi的重要性:
SpZi=YZi(111)
從式(13)可以得到SpZi=Ωi,由式(17)可以推斷出所有的因子都是同等重要的,而跟σ 的值沒有關繫。這個結論當然不太合理。在式(111)中,我們用上標p來表示這是偏微分,而且沒有歸一化,即這個值是基於輸入輸出原始數據的。作為一種敏感性分析方式,圖16中的散點圖形式比式(111)*具有說服力。輸入/輸出散點圖是從一般意義上講*簡單和信息豐富的敏感性分析方式。我們將在本書中很頻繁地使用該方法,因為它能很直觀地給出各個參數的相對重要性。例如,圖16中Z1有一個形狀的散點圖,在橫坐標表示的該參數範圍內,散點呈**均勻的分布,這幾乎是一個確定的信號且足以證明Z1比Z4對輸出的影響要小。我們用“幾乎”這個詞,因為在有些情況下,二維散點圖有可能帶有欺騙性,而帶來Ⅱ型誤差(一個因子有影響而不可識別)。 敏感性分析中,Ⅰ型誤差指的是錯誤地將一個無影響因子定義為一個重要因子。Ⅱ型誤差指的是將一個重要因子劃定為無影響因子。現代建模實踐中,還有現在常見的錯誤做法:Ⅲ型誤差。這是一類典型的形式誤差,這類誤差是在錯誤的問題上尋求正確答案。敏感性分析無法應對Ⅲ型誤差。例如,如果作為一個敏感性分析輸入的合理區間是**錯誤的,敏感性分析的結果將幫助不大。在一些**特殊的情況下便是這樣,見文獻Saltelli等(2004,pp160161)。
大多數實際應用中形成的敏感性方法旨在提煉壓縮格式的散點圖所提供的豐富的信息。敏感性分析的挑戰性在於,在多輸入參數的條件下,是如何將這些參數迅速自動地排名而無須一個個查看單獨的散點圖。用散點圖的另一個問題是,一些不確定的因素可能是一個集合,而緊湊的敏感性分析方法可以用來處理這種情況。因子集合的敏感性無法通過可視化的簡單的二維散點圖來實現。 事實上,可以將多維的散點圖通過沿著搜索曲線掃描輸入因子空間的方法建立二維曲面,見第5章。
124標準差歸一化導數
可不可以將式(111)改進一下,以得到一種可以與圖16一致的結果?一種可能的方法是
SσZi=σZiYσYZi(112)
導數被輸入輸出的標準差之比歸一化(因此上標為σ)。應用到式(13)中,得到SσZi=(σZi/σY)Ωi,將之平方,之後與σY=∑ri=1Ω2iσ2Zi的平方比較, 得到
σ2Y=∑ri=1Ω2iσ2Zi,(SσZi)2=σZiσYΩi2(113)
因此σ2Y=σ2Y∑ri=1(SσZi)2,所以得到
∑ri=1(SσZi)2=1(114)
式(112)的量度比式(111)的量度*有說服力,見表11。首先,因為Zi的相對順序取決於兩個向量σ和Ω,事實上也應該是這樣;其次,因為敏感性的度量被歸一化了。
表11導數和歸一化導數[模型式(13),式(14)],這裡取r=4, Ω=(2,2,2,2),σ=(1,2,3,4)
SσZi(SσZi)2
Z120036
Z22014
Z32031
Z42056
式(112)是聯合國政府間氣候變化專門委員會(Intergovernmental Panel for Climate Change,IPCC)的指南上**的敏感性分析的量度。
125蒙特卡羅和線性回歸
回到圖16的散點圖上,正如之前提到的一樣,這些散點是蒙特卡羅仿真的結果,也可以用如下的矩陣來表示:M=z(1)1z(1)2…z(1)r
z(2)1z(2)2…z(2)r
…………
z(N-1)1z(N-1)2…z(N-1)r
z(N)1z(N)2…z(N)r
(115)
這些數據輸入到式(13),得到模型輸出的向量:
Y=y(1)
y(2)
…
y(N-1)
y(N)(116)
y(1)是根據輸入行向量z(1)1,z(1)2,…,z(1)r運行式(13)得到的模型輸出,其他的行向量也可以進行類似操作得到各個輸出。 N是蒙特卡羅實驗的規模(如圖16中N=1 000),即實驗過程中運行式(13)的次數。在敏感性分析中,都必須有一個如式(13)作用的計算機程序來計算模型輸出Y。運行程序得到如式(19)所示的輸出向量往往是分析過程中計算成本*高*耗時的部分,因為模型本身可能比較復雜,而敏感性分析的量度的計算則很簡單。所以N代表了分析過程的計算成本,還有一個問題就是計算時間不能和分析時間弄混淆了。如式(14)所示的導數所確定的不確定性分布在實際操作中是*耗時也是*昂貴的部分,尤其是當這種實驗建立在專家意見的啟發式實驗上的時候(Helton等,2006;Saltelli等,2000,pp101152)。 還有一點值得注意的地方,矩陣(18)中的每一列:
z(1)1
z(2)1
…
z(N)1
是從獨立分布Zi~N(i,σZi)中抽樣而來。總而言之,除個別特殊情況以外,我們假設輸入參數也彼此獨立,因而參數之間可以從其邊緣分布中獨立抽樣[如此例中的式(14)]。 如以上提到的,分析人員*希望從圖16的散點中提煉出一個數字對結果加以精練。這畢竟是敏感性分析的初衷。*流行的做法是對式(18)和向量(19)遵照下式做一個簡單的線性回歸:
y(i)=b0+∑rj=1bZiz(i)j(117)
繫數b0,bZj由*小方差的方法計算得到,其基本思想是回歸元模型
元模型是模擬仿真時計算量很大的原模型的替代模型。元模型的建立有很多種途徑(如以上討論過的,簡單的線性回歸)和目的(如進行敏感性分析)。見第5章。的輸出y值與真實模型的輸出值之間的平方差*小。由於這些點是由線性模型得到的,我們希望這種線性回歸能夠重現原模型的規律,即00,ZiΩi,i=1,2,…,r,其中符號表示如果N足夠大的情況下應該得到的結果,符號上面的帽子代表估計值。 圖16(N=1 000)中的點的結果在表12中表12中的結果是用一種簡單的回歸分析軟件得到的。然而,下一章中將解釋到,假如模型(13)和(14)是線性的,模型本身沒有任何誤差項,我們僅僅用五次運算就可以得到回歸繫數的解析值,然後用Kramer公式去解一個用5個方程描述的繫統,其中b0,…,b4未知。。
表12線性回歸繫數和歸一化繫數,式(13),式(14)的模型,
r=4,Ω=(1,2,3,4),σ=(2,2,2,2),N=1 000
| | |