能有多糟? 預測區間重要性的一面

傳統的商業預測系統不是為了告訴我們極端事件。這是這次關於下行風險的討論中所得出的結論。問題在於,在業務受到嚴重衝擊時確定“最壞情況”的可能性,標準的統計模型提供了誤導性的證據,就像2008年世界金融危機時發生的那樣。典型的最壞情況預測可能不會比實際發生的最壞情況嚴重。雖然承認這一警告本身很重要,但也有辦法模擬極端事件的影響,從而得出下行風險的現實跡象。

這闡明了需要做些什麼來更準確地確定事情可能會有多糟糕。關鍵點之一是:

■嚴重衝擊通常會增加銷售的波動性:這種額外的波動性必須適當模擬。

■在金融中使用的一種建模方法稱為 GARCH,這種方法假定波動率和預期的預測誤差在巨大的外部衝擊之後會增加。

Batchelor提供了一個汽車銷售案例研究,以說明GARCH模型如何提供更現實的行業面臨的下行風險預測。

在預測極端事件時,重要的是要了解最糟糕的事情還未到來。到目前為止已經發生的最糟糕的事情只是對可能發生的最壞情況的一種事先估計。事情總是會比以前變得更糟。


墨西哥灣爆井造成最壞情況的損壞

據新聞報導,主要應急計劃預計會出現最嚴重的四千萬加侖洩漏事故。在頭三個月裡,每天有數百萬加侖的水湧入。監管機構將其努力基於幾乎不是最差情況的最壞情況。


介紹

在最近的經濟衰退期間,公司已經看到銷量和產量以前所未有的數量萎縮。 月復一月,結果不僅沒有達到中央預測值,而且已經在統計模型產生的預測區間的下限中崩潰。 傳統的商業預測系統並不是為了告訴我們關於極端事件的信息。

下行風險一直是金融預測人士關注的焦點。 在金融市場中,價格的高波動意味著投資者潛在的巨大損失,而風險規避的對沖者將為不利事件的保險支付更多的費用。 期權定價理論將保險成本直接與未來價格變動的波動預測聯繫起來。 一個大規模的學術和實踐者文獻出現了,專注於對股價,貨幣和商品在未來是否可能變得或多或少有較好的預測。

可以預測波動率的變化。日常價格變化接近隨機,但這些價格變化的波動性是連續相關的:如果某一天有大的價格變化(上漲或下跌),則更有可能不會出現第二天價格變化很大(下跌或者上漲,我們不知道哪個)。

最近,對於關注未來銷售而不是金融市場價格的商業預測者而言,下行風險已成為一個重要問題。大多數公司都試圖定義最糟糕的銷售情況。庫存控制模型在很大程度上依賴於未來需求波動的估計。然而,不知何故,有良好已開發的波動性預測技術尚未轉入商業領域。為了看看會涉及哪些內容,隨著從理解一個基本的商業預測文獻,我安排在下面定義出現的最壞情況的程序。接下來我將說明如何將一小部分波動率預測技術(即GARCH方差模型)從財務預測情境轉移到商業預測情境,以幫助量化下行風險。

新車銷售的標準看法

考慮預測人員通過2008-2009年經濟衰退試圖預測美國新車銷量的觀點。想像一下,我們在2008年9月初。我們初步估計8月份的銷量約為63萬輛。這比去年同期的8月份低約10%,但仍然在2000年以來的常規水平範圍內,在500-800萬之間。目視檢查下圖的月度數據表明,最壞的情況是月銷量低於50萬件,這一事件僅在過去的103個月中發生過。





為了產生2008年9月以後的預測,我們需要一個汽車銷售模型。我使用了傳統的時間序列表示法,使用1980年的季節性ARIMA模型數據。下圖中顯示了該模型的預測結果,採用大多數標準商業軟件包生成的形式。這顯示了預期的銷售額(淺灰線)以及95%預測間隔的上限和下限。這個想法是,在預測的95%的月份裡,銷售額應該在這些限制之內。預計銷售量每月約為60萬輛,並有一些季節性波動。不好的情況是9月份銷售額將低至下限49.4萬。中央單點預測的估計可靠性反映在其標準誤差中,我們可以粗略地將其定義為典型月度誤差的大小。標準偏差的較大值意味著較低的可靠性。這個下限約低於預期銷售水平的兩個標準誤差,所以我們提前一個月預測的標準誤差約為 1/2 ×(600-494)= 53,000輛汽車,約佔中央預測的9%。





實際發生在雷曼兄弟破產的那個月的2008年9月,消費者信心暴跌,支出在整個經濟中萎縮,汽車銷售量下降到歷史最低水平481,000,低於該模型的壞消息估計。當然,我們預計當銷售額低於預測下限時,每隔十年就會有兩到三個月。這是一個極端的不利事件,並導致我們的關鍵問題:給予這樣的打擊,事情會變得多糟?

讓我們繼續使用我們的傳統模型,根據9月份銷售崩潰的信息,為2008年10月及以後製定一套新的預測。預期銷售的新路徑和95%預測區間的下限如下圖所示。銷售預計將回升至505萬,然後繼續沿著比一個月前預測的要低的路徑前進。非常理智的是,9月份銷售下滑的一部分被視為臨時效應,將在下個月抵消,部分被視為該系列基礎水平已經永久下降的信號。




不太明智的是預測區間發生了什麼。現在不好的情況是銷售額達到413萬。這比平均預測值低92,000,表明標準誤差為92/2 = 46千。這實際上比一個月前 53 千還要低,並且仍然只是新平均預測的9%。因此,在汽車銷售受到最嚴重衝擊後,標準商業預測模型顯示我們的預測將與打擊震驚之前的預測一樣可靠!

為了強調這是不切實際的,上圖還顯示10月份的銷售再次低於模型生成的較低預測範圍。低於下限的兩個連續結果是非常罕見的事件,應該使我們重新考慮我們的壞情況預測是如何構建的。我們可以繼續前進 - 但是,月復一月,無論經濟狀況是平靜還是暴風雨,一個月前預測的標準誤差都會停留在預測水平的約 9%。


汽車銷售隨時間變動而變化的波動

問題在於傳統的時間序列和迴歸模型假設系統隨機震盪的分佈隨時間保持不變。有時震盪很大,有時甚至很小,但這些被視為具有恆定波動性的潛在概率分佈的隨機抽取。

這些模型的預測區間基於對模型估計中使用的整個樣本的殘差的平均波動性的估計。當出現新的觀測值時,不管它有多極端,它對估計的殘差方差只有邊際效應,因此幾乎不影響預測區間。

這種震盪持續波動的假設 - 所謂的相同方差 - 並不是在任何金融市場模型中都會受到歡迎的。在這種模型中,市場穩定增長期間被繁榮和崩潰所打斷,在此期間波動率急劇上升。自20世紀 80 年代諾貝爾經濟學獎獲得者經濟學家 Rob Engle 開發了所謂的 ARCH(自迴歸條件異方差)模型以來,通過該模型的一些變體來表徵金融時間序列已成為標準。金融經濟學家也不願意認為衝擊震盪是正態分佈的,而是傾向於使用肥(或厚)尾分佈(如t分佈),這使得極端事件發生的頻率比正常曲線所提出的頻率更高。

在最普遍的 “廣義ARCH” 或 GARCH 模型中,存在一些長期的潛在平均方差,但在短期內,如果出現意想不到的大衝擊(潛在衝擊較大,潛在衝擊的方差可能會超過此基礎水平),到正在建模的系列。在文章附錄中會描述 GARCH 模型。

迴歸軟件包產生殘差(Jarque Bera 測試)和ARCH 誤差(Engle 拉格朗日乘數測試)的正態性測試。這些往往被忽略,因為它們不偏袒中央點預測。然而,它們對於構建預測區間至關重要。因此,我們可以很容易地測試汽車銷售的震盪是否可以用 GARCH 模型來描述,以及它們的分佈是否包含比正常更多的極端事件。答案是肯定的。汽車銷售的波動性確實在銷售額出現異常大而意外的增加和減少之後出現上漲。當發生震盪時,會有比正常曲線導致我們預期的更大的變化。

讓我們重新審視2008年9月和10月的預測,使用相同的 ARIMA 模型進行汽車銷售,但允許震盪的分佈變胖並且具有隨時間變化的波動性。下圖顯示了GARCH 假設對平均預測和較低預測區間界限的影響。平均預測不變。然而,2008年9月發生的大規模震盪導致該模型大幅上調其對未來震盪能波動性的估計。 10月份的預測下限為38.6萬,遠低於傳統模型預測的413,000。




40萬的結果現在在內部而不是在預測區間之外,從這個意義上來說並不令人驚訝。 10月份結果遠低於預期值的事實也意味著,當我們做出我們對11月份的預測時,GARCH模型將再次預測波動率會很高,預測區間會很大,並且壞的情況會再次出現很糟糕。

下圖顯示了2000年以來汽車市場衝擊的標準差如何變化的 GARCH 模型估計值。儘管平均波動率確實在9%左右,但每年的變化可能戲劇化的很大,而且非常陡峭,在最近的經濟衰退中上升到超過15%,這表明忽略了波動性變化的汽車銷售模式會為我們提供了一個對生產商和經銷商所面臨風險的非常遭糕的指導。請注意,順便說一下,最近波動的高峰不是由於銷售量的崩潰,而是由於2009年8月的揮霍購買,以響應“新舊車換現金”計劃,該計劃補貼舊車換新,更省油的車輛。

結束語
我只用一種簡單的隨時間而變化的波動模型來研究預測區間估計的一種方法。在金融風險管理者的工具包中,還有許多其他巧妙的方法來查看下行風險。例如,一些分析師忽略了除極端事件以外的所有事件,並使用特殊的極值分佈來近似概率分佈左尾的形狀。只有當我們對極端事件有很多觀察時,這些方法才是可行的,而這又取決於長時間內高頻率,日常或日內數據的可用性 - 這些條件排除了大多數主流商業預測應用。
商業預測師通常不會認真對待預測區間,並且有一些鼓勵措施來維持他們的安靜。大多數時候,區間看起來非常可怕。對於中等的樣本量,傳統的95%預測間隔提前三到四步通常包含整個歷史數據范圍,同事和客戶可能會試圖斷定您說的是“任何事情都可能發生”。不幸的是,這是真的。事實上,預測競賽的結果一直告訴我們,如果有的話,統計預測的時間區間太窄,因為我們很難確定指出驅動產生我們數據的真實模型,所有序列都會受到不可預見結構變化的影響。法蘭克辛納特拉的歌詞上寫著“最好的未來”。在預測極端事件時,重要的是要了解最糟糕的事情還未到來。樣本中已經發生的最糟糕的事情是可能發生的最糟糕的事情的高估[不夠糟!]。對於“事情能得到多麼糟糕”這個問題的誠實回答是,它們總是比以前更糟。具有隨時間變化波動性的模型的價值在於它們幫助我們準確地量化了事情的嚴重程度:無論現在我們面臨的風險程度是低還是正常,還是像2008年9月那樣 - 波動性異常高,並且這些前所未有的糟糕結果之一最有可能發生。

補充: GARCH 說明


留言

這個網誌中的熱門文章

標準差與 Wald 統計量

可能性比檢定(Likelihood ratio test)

Wold Decomposition Theorem