機器學習是動物,但金融機器學習是野獸


由於與傳統應用程序形成鮮明對比,金融機器學習應該被命名為自己的學科1*5fxyPiIxEbw7z9uvrj6eew.png📸由我

機器學習(ML) 最令人振奮和激動人心的應用是在金融領域。評估生產模型很容易(你在執行策略的那一刻就會看到模型的性能)。這也是我所知道的ML 最具挑戰性的應用。

絕大多數流行的ML 文章、博客、YouTube 視頻或白皮書都中心化在我所說的傳統應用程序上。在本文中,當研究人員假設正常、觀察是獨立的並且目標在結構上不隨時間發生變化時,我將傳統的ML 應用程序歸入一個陣營。

調用ML 的一個小節的目的是為了擴大和中心化研究人員和從業者的注意力——用於測試、記錄和鞏固最佳實踐。

出於你的興趣,我不是第一個提出與傳統應用劃清界限的金融ML 實踐者:請參閱Marcos Lopez de Prado 最近的著作。

了解傳統機器學習

傳統機器學習和金融機器學習之間最關鍵的區別是經典的統計IID 假設。在我的第一個統計學價格中,這個假設就深深地印在了我的腦海裡。雖然在傳統應用中很重要,但在金融中堅持這是一個不切實際的假設。

當採用這種假設時,假設數據以類似高斯的方式分佈。觀察或參與者被假定為彼此獨立。兩者都不能在金融中假設,因為觀察(例如,系列中的天數)不是獨立的(即,今天的水平取決於昨天的水平),並且由於趨勢和製度的變化,數據不是正態分佈的。

結構中斷是不正常的,有時是隨機的,在時間序列結構中發生變化或變化。

想像一下,由於某些宏觀或微觀經濟效應,你的機器學習目標在行為上發生了變化,躍升至前所未有的水平,或發生了巨大變化。一個很好的例子是2020 年4 月——WTI 價格歷史上第一次出現負值。

金融機器學習是一個領域的野獸

你應該將金融ML 視為自己的研究領域,有五個主要原因。我沒有在本文中解釋其中的一些觀點,但我可能會在以後的文章中討論這些觀點。敬請關注。

IID 假設在金融領域是不現實的,儘管研究人員在分解和轉換時間序列後採用了這個假設。獨特的數據源稀缺且昂貴; 季度收益等常見數據太常見,無法輕易獲得優勢。結構性中斷是意料之中的,而且不容易處理。與經典計量經濟學方法相比,ML 模型很容易過擬合,除非仔細考慮特定的ML 方法(特徵重要性、交叉驗證和評估指標)針對金融應用進行了微調。如果你的裝配線構造正確,那麼與經典方法相比,過度擬合ML 模型將更加困難。回測廣泛用於創建和測試理論,但回測並不是構建理論的好方法。

最後的話

金融和交易是機器學習和數據科學最令人著迷和令人興奮的應用。這個領域已經成熟,需要創新。

參考

[1] M. Lopez de Prado,金融機器學習進展(2018 年),Wiley

資訊來源:由0x資訊編譯自THECAPTAL。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts