Software Survey: Forecasting 2018 [翻譯文章]

今年的調查反映了軟件市場的變化,但它也更加強調實踐預測者的要求。
作者:Robert Fildes,Oliver Schaer和Ivan Svetunkov
來源出處: http://netinfo.takming.edu.tw/tip/register/reg_openlist.php

下面是我用 Google 翻譯

預測一直是OR / MS[鐵雲註: OR/MS Today 是一本雜誌]的重要組成部分,現在正在為快速發展的業務分析領域做出重大貢獻。預測是幾乎所有規劃決策的必要輸入,無論是長期還是短期,但在性能分析和收益優化中也需要預測。因此,預測方法應成為所有大學或從業者分析課程的重要組成部分。

合適的軟件是預測活動的核心,無論是從業者在供應鏈中的需求預測,還是作為企業或政府分析師。有趣的是,預測的歷史在某種程度上是由那些在傳播新方法的早期開發出用戶友好軟件套件的人編寫的。例如,Box-Jenkins ARIMA軟件的早期開發確保了快速採用,而國家空間軟件的缺乏限制了它的採用,直到R開源軟件的開發(Hyndman和Khandakar,2008 [3])。但是預測軟件不是同質的,無論是在實施的方法方面,還是更重要的是,在設想的應用方面,它是一個快速發展的領域。 OR / MS Today多年來一直在調查預測軟件供應商,以概述最新功能和市場趨勢(最近,Fry和Mehrotra,2016 [1])。在最新的調查中,我們試圖確定所有包含時間序列預測的軟件包預測軟件提供商,無論是研究型軟件還是專為運營組織規劃而設計的軟件。當然,只有一部分人在截止日期前回复,任何遲到的提交都將在網上提供:https://bit.ly/2Jpl66p。

預測的核心原則是查看過去的歷史以理解和預測。 Fry和Mehrotra在2016年進行的調查包括一些已經變得多餘的方面,例如靈活的數據輸入和輸出。但現在這很簡單,我們從當前的調查問卷中刪除了這些問題。 Fry和Mehrotra還確定了市場上的一些趨勢:“整合”,其中預測與規劃系統相關聯; “自動化”,其中包括從一系列方法中自動選擇; “可視化”,適用於擴展的圖形範圍; “虛擬化”,供應商的產品通過雲提供,或者在更極端的版本中,供應商從頭到尾虛擬地管理預測過程。我們現在在當前的軟件中看到所有這些功能。 2018年的調查經過重新設計,以反映軟件市場的這種變化,但它也更加強調執業預測員的要求。用於預測的軟件有多種形式 - 沒有一種軟件產品包含用戶可能想要的所有功能,因為不同的用戶有不同的要求。在對從業者的調查中,Excel通常被稱為最常用的預測包(Weller和Crone,2012 [6]),儘管它最好被認為是一個數據處理和分析程序,而不是提供預測;其內置的預測程序仍然有限,即使在2016年最新版本中也是如此。此外,其統計特徵也存在缺陷(參見McCullough和Heiser,2008 [4])。

如果Excel及其內置例程不足,預報員可以嘗試使用宏構建自己的方法。不建議這樣做,因為即使是簡單的方法,如季節性指數平滑,也會有其缺陷。對於許多應用程序而言,擴展到需要預測的時間序列的數量也不是直截了當的。相反,預測特定的包應該可以解決問題,但現在選擇範圍很廣;它可以有用地分解為許多不同的類別,這些類別既反映了包的設計專業性,也反映了應用的重點。例如:

通用統計軟件包。這些軟件包包括各種統計技術,並輔以預測程序。有時會有一個更專業的加載項(更多的成本)來增強基本系統。通常,基本通用軟件包不包括所有預測方法和更高級用戶可能需要的其他功能。市場領導者包括Minitab,SAS,SPSS,STATA和StatGraphics。

專業的預測軟件。這些可能集中在單一技術或一系列方法上。它們包括Autobox(一種自動Box-Jenkins ARIMA建模和預測包),ForecastPro(包括一系列方法),專家神經網絡包(如Alyuda或Analytic Solver Data Mining)和狀態空間建模(在STAMP中) ,OxMetrics系列的一部分)。此外,還有免費提供的季節性分解方法X-13-ARIMA和Tramo-Seats。

無論是用於研究還是實踐,預測中的關鍵概念是保持樣本與樣本內擬合期不同。其次,該軟件應允許簡單地結合滾動原點預測,這是預測評估的關鍵組成部分(例如,參見Ord,Fildes和Kourentzes,2017 [5],以全面解釋這些評估的最佳實施方式)。修訂後的調查問卷包括一些關於預測誤差計量的問題。根據我們的經驗,這些往往執行不力,但對評估預測成功至關重要。例如,ForecastPro的用戶可以指定保留樣本,其中針對固定和起始兩者計算各種誤差度量。雖然AutoBox,ForecastPro和Smart是經過充分驗證的軟件示例,參與過各種已發布的競賽,因此已經對預測準確性的標準化測試進行了評估,但其他人可能不符合我們所論述的業務預測原則(Ord, Fildes,Kourentzes,2017 [5])。至少,所有包裹都應該產生與R可用的基準相當的預測 - 如果沒有進行這樣的比較,買家要小心必須是格言。

在專業軟件領域,數據挖掘的特定領域(現在通常稱為預測分析)值得特別關注。該軟件包括一系列適用於預測個人消費者行為的方法。通常,方法包括邏輯回歸,包括CHAID的預測分類和橫截面神經網絡。諸如SAS,Statgraphics和SPSS之類的通用統計軟件包包括這些方法,但有時需要額外的購買成本。 Weka提供免費的,備受推崇的軟件:其他替代品是XLMiner,NeuroIntelligence和Neurosolutions(可用作Excel插件)。他們的時間序列能力通常是有限的。

計量經濟學套件。雖然最初是為計量經濟學建模而開發的,但EViews,Oxmetrics,STATA,RATS和TSP等軟件包現在都包含了大量基於回歸的建模例程,可以很容易地應用於時間序列預測。它們還可能包括各種單變量替代品。其他計量經濟學軟件包更加專業化,並專注於一組有限的例程,例如 LINDEP,其中包括一系列適用於分類的模型。

預測軟件支持套件。這些系統旨在支持需​​求計劃和其他組織活動。這些系統的核心通常依賴於簡單的平滑方法,但它們的優勢在於能夠同時處理許多時間序列並與ERP(企業資源規劃)等其他公司係統集成(或至少兼容)。這些無所不包的軟件包包括SAP,Oracle,JDA和Vanguard,以及專注於零售和健康等特定經濟部門的軟件包。這些包通常花費數千美元,而他們的預測組件(儘管部分預測包)卻過於有限。現在,SAP等一些公司在其擴展的程序套件中包含了許多高級建模功能,包括自動回歸建模;但是,基本套件仍然可以依賴於指數平滑。

如果它們如此昂貴並且通常有限,為什麼公司會使用它們?答案很簡單 - 這些軟件包包括非常靈活的數據處理設施,可滿足供應鏈中大多數公司的需求。特別是,它們將鏈接到ERP和財務系統。它們還允許多用戶訪問。他們所接受的預測活動的規模可能是巨大的。例如,支持沃爾瑪美國商店的軟件每天可能需要處理超過10億個時間序列(Seaman,2018 [7]),因此自動預測和高效計算至關重要。購買此類包裝存在許多缺陷,其中最重要的是假設所有這些包裝都是從預測角度精心設計的。一些供應商過度主張,因此對標準驗證軟件進行基準測試至關重要!

第二個方面是預測支持系統的設計應該與組織的過程相匹配。例如,統計預測通常根據需求計劃者的專業知識進行調整。這需要進一步分析隨之而來的錯誤以及調整產生的“預測增值”。

最後,還有數學和統計編程語言,如R,Python和MATLAB,它們具有免費提供的包和庫,支持時間序列分析,計量經濟學和預測。此外,SAS和其他通用統計軟件包還提供編程語言,如R,可用於將各種統計和預測方法合併到更複雜的分析中。讀者可以參考CRAN時間序列存儲庫(https://cran.r-project.org/view=TimeSeries),了解R中與時間序列分析,建模和預測相關的可用包。鑑於R在過去幾年中越來越受歡迎,評估我們在調查中詢問的任何軟件的一個重要標準是它可以靈活地將R例程無縫地整合到其設計中,從而增加其功能。這些優於商業軟件包的優勢在於各種創新模型和算法的作者通常為研究和實踐社區提供開源代碼,確保最先進的預測解決方案。此外,許多大學使用這些開源實施培訓他們的畢業生,使他們可以隨時使用。這是預測軟件的主要範式轉變。

在2018年的調查中已經探討了另外兩個問題,即預測質量測量和增強能力(間歇性需求,新產品方法和機器學習,以及結合各種不同方法的預測的方法)。邀請調查問卷的受訪者強調新的發展。沒有出現一致的主題;大數據和機器學習被強調,因為需要自動化預測過程來分析許多數據系列。圖形分析可能證明特別有價值。讀者將能夠看到哪些包提供這些設施。

在這樣的調查中容易忽視的一個問題套裝軟體的學習和使用是多麼容易,但回答需要全面的實踐審查。但是,我們會注意到,並非所有我們使用過的程序對於新手來說都很容易(比如我們)。實際上,調查問卷受訪者提到非專業人員可以使用套裝軟體,以及他們與Tableau等儀表板的聯繫。總體而言,我們在此報告的維度(請參閱第48頁開始的調查數據)應該讓讀者了解可用的內容,儘管某些功能可能會被深埋。他們還應該為執業預測人員提供審查其軟件實施的功能,並提供功能清單和供應商的簡短列表,以便在基準測試中查找。


References

  1. Fry, C. and Mehrota, V., Forecasting 2016 (Software Survey), OR/MS Today, June 2016, Vol.43, No. 3. Available online at http://viewer.zmags.com/publication/085442e2#/085442e2/46
  2. Hyndman, R.J., 2017, “Forecasting functions for time series and linear models,” R package version 8.1, http://github.com/robjhyndman/forecast.
  3. Hyndman, R.J. and Khandakar. Y., 2008, ”Automatic time series forecasting: the forecast package for R,” Journal of Statistical Software, Vol. 26, No. 3, pp. 1-22.
  4. McCullough, B. D. and Heiser, D. A., 2008, “On the accuracy of statistical procedures in Microsoft Excel 2007,” Computational Statistics and Data Analysis, Vol. 52, pp. 4570-4578.
  5. Ord, K., Fildes, R., and Kourentzes, N., 2017, “Principles of Business Forecasting,” 2nd ed, Wessex.
  6. Weller, M., and Crone, S. F., 2012, “Supply Chain Forecasting: Best Practices and Benchmarking Study,” Lancaster Centre for Forecasting White Paper. Available online: http://goo.gl/MPbAjz.
  7. Seaman, B., 2018, “Considerations of a retail forecasting practitioner,” International Journal of Forecasting.Forthcoming.

留言

這個網誌中的熱門文章

標準差與 Wald 統計量

可能性比檢定(Likelihood ratio test)

Wold Decomposition Theorem