好模式? 還是壞模式?

通過類比預測是新產品預測的常用方法。假設銷售具有與新產品相似屬性的以前產品,可以引導我們對新產品進行更準確的銷售預測。但是,正如在“新產品預測中的最差實踐”中所討論的那樣,規劃人員傾向於選擇不恰當的類比 - 甚至是“挑選”僅表現最好的以前的產品,以證明對新產品的更高預測。在這篇文章中,將更廣泛地看待了模式預測的好處和缺陷。

當發生破壞性事件(例如新產品介紹,公司收購出價或經濟危機)時,我們的自然反應是試圖通過尋找結果已知的類比來預測其影響。但是,儘管事件的過去發生可以作為預測新事件影響的類比,這裡認為類比的可靠性在於數據解釋和良好判斷的適當平衡。

與2009年美國的就業復甦預測一樣,基於模式的預測可能會出現嚴重的誤差,這與之前的幾次經濟衰退類似。問題在於知道哪些先前的事件與當前的預測問題真正類似。在這種情況下,2008年後的經濟衰退是由信貸危機造成的,而不是由貨幣政策或石油價格引起的,就像選定的類比。基於錯誤的類比,預測顯著高估了就業復甦的速度。

對過去數據不加批判的審查可能會導致錯誤的類比 - 對不適用於手邊案例模式的推斷。不加批判地使用任何和所有明顯相關的數據,給我們提供了統計上看起來很好的結果,但是忽略了審查中事件的關鍵特徵是否類似。另一方面,這裡也指出,如果我們在沒有能力建立可信統計模型的情況下,過度理論化目前的事件,那麼最後我們可能會看到很少的類比,並且對我們的錯誤判斷過於重視。良好的判斷需要建立在一個連貫的與數據一致的理論基礎上。糟糕的判斷是信仰、一廂情願的想法、和軼事的結果。

介紹

當發生破壞性事件時,我們的自然反應是試圖通過尋找結果已知的類比來預測其影響。在金融市場中,這是事件研究方法學的基礎,分析師已經使用了40多年的時間來預測企業行為(如收購和債券降級)的影響。在本文中,我們將介紹該方法,並考慮是否以及如何將其擴展到主流商業和經濟預測問題。成功的關鍵是找到正確的類比,這反過來又需要將領域知識和數據挖掘結合起來。

好的模式

假設我們想知道在收購出價前後某家公司的股價可能會發生什麼變化。在過去的公司歷史中不太可能發生類似的事件,股價在任何情況下都非常波動。在這種情況下,時間序列分析和因果模型建立並沒有多大用處。然而,過去許多其他公司都遭受了收購出價,我們可以通過匯總這些劇集的數據並在這些數據中搜索模式來學習。這是Fama,Fisher,Jensen和Roll(1969)提出並由John Binder(1998)調查的高度有影響力和直觀吸引力的事件研究方法論的基礎。

這個想法是在收購公告前後收集目標公司樣本的股票價格數據,並排列這些股票價格窗口,看看是否有明顯的模式。圖2.21說明了這個過程的結果,對於五家公司的一小部分樣本。灰線顯示每家公司的投資者通過購買公告(第0天)前60天(第60天)購買股票所獲得的(超額風險調整後)回報。



這些公司的經驗不同,但通過對這些回報進行平均,我們可以看到一個模式出現,如圖中的黑線所示。通常情況下,直到收購公告發布前20天才能獲得超額收益,當時收益率逐漸回升至10%左右。在宣布當天,股價大幅上漲20%,此後保持穩定。這就是為什麼許多對沖基金投入大量時間和精力試圖確定潛在的收購目標。它還解釋了為什麼監管機構試圖識別和起訴內部人士,他們的行為必須負責在收購公告之前推高價格。

這是一種直接且直觀的預測方法,我們在其他許多情況下都可以看到不同程度的複雜情況。在預測商業的高科技的一端,統計學家試圖理解長時間但明顯不穩定的時間序列,使用最鄰近方法來查看些序列的過去歷史,以基於最近過去觀察到的模式來進行預測。在擁有許多產品的銷售和庫存數據的組織中,將相關產品的數據進行匯總具有明顯的優勢,特別是如果我們根據它們與我們試圖預測的產品的相似性對這些數據進行加權(Duncan and colleagues,2001)。在確定銷售新型製藥或電子產品的可能路徑這一非常實際的業務中,規劃人員通常會在先前推出類似產品後排列銷售路徑,並推測新產品將遵循類似的軌跡。

壞模式

然而,沒有妥善處理,基於模式的預測可能會非常糟糕。問題在於知道哪些先前的事件與當前的預測問題真正類似。為了說明,這裡有兩個很好的使用不當方法的例子。首先,數據被不加批判地使用,並且沒有適用足夠的判斷。第二,太多(有偏見的)判斷被應用,允許預測人員忽略相關但不受歡迎的數據。

示例1:沒有足夠的判斷

自2008年經濟衰退以來,報紙和博客圈一直都在充滿圖片的狀況,試圖通過考察過去的經濟衰退來分析產出和就業的可能進展。下圖提供了2009年2月在網站上公佈的美國非農就業圖表。這些線條顯示了戰後美國商業周期高峰後的60個月的就業情況。 2008年的就業之路表現為堅定的黑線,作者的希望是以前的模式將為2009年及以後的走向提供一些指導。根據在過去的經濟衰退中就業恢復健康的觀察結果,提交人 - 不會提及任何名字 - 寫道:




...對繼續工作 6 至 9 個月的失業率預測不會脫節。此外,考慮過去的周期,人們預計在就業達到前一個高峰之前,至少一年(可能更多,如果經濟復甦看起來更像是2001年經濟衰退之後)。就我個人而言,我的期望是從18個月到24個月(從現在開始)回到上一個高峰。

換句話說,復甦預計將遵循圖中的虛線(長破折號之間的兩條短劃線)。實際發生的情況由黑色虛線表示。就業持續下降,而在寫作這段時間 - 經濟衰退後四年 - 仍低於最高峰時的5%。

問題在於美國目前的經濟衰退與過去的美國經濟衰退並不相似,其中大部分衰退是由貨幣政策或油價推動的。這場經濟衰退如何成為不同的動物? Reinhart和Rogoff(2009)在他們的優秀著作“這個時代不一樣”中看到了許多國家在更長時間的歷史中發生的金融危機。他們表明,由於目前的危機是由信貸失敗所驅動,更好的類比可以從日本在股市崩盤,斯堪的納維亞經濟在20世紀90年代銀行業危機之後的壓抑經歷以及早期的債務負擔中找到亞洲和南美的新興經濟體。總之,上圖中的錯誤是沒有足夠的判斷或理論來選擇類似事件的樣本。


有時候我們可能會因為這件事情變得混亂而逃脫。考慮一個對沖基金已經確定了一些預測收購的模式。每次接管都有獨特的元素,而同時分析師試圖控制這些因素,在一些狀況會出現收益低於預期的情況,以及有些收益較高的情況,以及不會發生收購的情況。但是,這一年會有很多收購,基金可以按照其模型所揭示的平均模式行事,因為知道個別股票的特異行為將一系列投資平均化。

預測誤差的這種分散化風險並非總是可能的,絕對不是像經濟衰退等代價很大的一次性事件。同樣,一家公司的整體生存能力可能取決於一種新產品的成功。如果沒有可能分散化風險,不正確的模型造成的潛在損失就會更大並且可能會非常嚴重。在這些情況下,需要更多的關注是否所匯集的事件與公司的產品推出真正類似。

示例2:數據不足

我們在尋找與我們試圖預測的事件精確類比時所採取的更加謹慎的態度,要使用的數據越少,我們就越需要依靠判斷而不是統計分析。正如Foresight的文章中經常報導的那樣,判斷並不總是像法官所假設的那樣可靠,專家也很少像我們想的那樣專家。如 Reinhart 和 Rogoff 研究中那樣,良好的判斷需要基於一致的數據與一致性理論。糟糕的判斷是信仰,一廂情願的想法和軼事的結果。

在基於模式的預測領域,有很多糟糕的判斷。尤其是,金融市場上的許多“圖表分析師”根據幾乎沒有理論或經驗支持的模式進行預測。下圖顯示了非常受歡迎的頭部和肩部模式。這些股票顯示股價的每日幅度,綠色上漲,下跌紅色。這裡的敘述是,在價格上漲之後,賣家進來並且價格回落(左肩)。然后買家重新進入市場並推高價格(頭)。在價格再次回落之後,買家重新進入市場,但未能將價格推高至前期高點(右肩)。當價格跌破頸線並加入最近的低谷時,如下圖所示,這是一個賣出信號,因為價格預計會進一步下跌。




如果能夠報告這種模式是從廣泛的事件研究發展而來的,那麼追踪和平均這些模式之後的價格路徑將會很好。然而,該地區的經驗性研究(Osler,1998; Chang and Osler,1999)並沒有發現頭肩頂形成的重要預測能力或盈利能力。對這種模式的唯一支持來自交易者的軼事。


在我們周圍的世界中尋找模式是人的本性。這就是我們如何在科學和社會關係方面取得的進展。不幸的是,這種本能有時會發現不適當的應用。在這種情況下,頭部和肩部模式很可能是幻覺控制的產物,即使是隨機數據構建模式的傾向。通過半閉著眼睛幻想看短期的股價,很容易開始看到波浪,旗幟和雙頂,並想像在這個非常混亂的環境中有秩序,特別是如果有財務獎勵等待,任何人都可以理解它。

為了對圖表分析師公平,最佳實踐要求他們不僅要根據上圖中給出的信號進行交易,而且要在時間序列模式或相關變量行為中尋求其有效性的確認。具體而言,他們應該檢查該模式是否持續上升趨勢,並仔細查看轉折點附近的交易量以及該模式的突破情況(請參閱stockcharts.com,2012)。不幸的是,延長時間序列和擴大所考慮的變量集會減少交易機會的數量並延遲執行,這是對交易員紀律的嚴峻考驗。

結論

“事件研究/模式疊加”方法為預測人員提供了一些好處,在我們沒有長時間序列數據的情況下,或者驅動我們數據的過程受到某些結構性中斷的影響。這幾乎涵蓋了所有現實世界的預測問題。

本文考慮了可能確定在財務應用以外使用事件研究方法的有效性。即使從這些簡單的考慮,顯然在判斷的執行和數據的使用之間存在權衡。

一方面,不加批判地使用任何和所有明顯相關的數據(如經濟衰退預測的例子)可能會給我們帶來統計上好看的結果,但是忽略審查中事件的關鍵特徵。

另一方面,如果我們對當前事件進行過度理論化,查看更長時間的數據,或嘗試對許多相關變量進行加權,但沒有能力建立可靠統計模型,我們可能結果只會看到極少數類比,同時過於強調我們的錯誤判斷。

留言

這個網誌中的熱門文章

標準差與 Wald 統計量

可能性比檢定(Likelihood ratio test)

Wold Decomposition Theorem