新聞資訊

五個經驗教訓:機器學習應用量化策略的那些坑!

標星★ 置頂 公眾號 愛你們♥

作者:IAN J. HISSEY 編譯:方的饅頭

_ 1_

前言

五個經驗教訓:機器學習應用量化策略的那些坑!

_ 2_

在量化研究中引入機器學習

五個經驗教訓:機器學習應用量化策略的那些坑!

五個經驗教訓:機器學習應用量化策略的那些坑!

_ 3_

自動化機器學習

五個經驗教訓:機器學習應用量化策略的那些坑!

五個經驗教訓:機器學習應用量化策略的那些坑!

五個經驗教訓:機器學習應用量化策略的那些坑!

_ 4_

建立和測試模型

為了表明機器學習可用於增強傳統的量化因子,我們建立了中國 A 股的股票預測模型。我們為 2012 年 12 月至 2019 年 8 月編制了中證 800 指數的股票表現和各種因子數據的月度概況。我們將目標變量設置為股票的未來一個月收益,並使用原始投資組合模型中的因子。

五個經驗教訓:機器學習應用量化策略的那些坑!

五個經驗教訓:機器學習應用量化策略的那些坑!

五個經驗教訓:機器學習應用量化策略的那些坑!

_ 5_

不要混淆樣本內和样本外

五個經驗教訓:機器學習應用量化策略的那些坑!

五個經驗教訓:機器學習應用量化策略的那些坑!

_ 6_

屏蔽噪音並一次建模

與機器學習的典型用例(如預測同店銷售額或個人銀行貸款違約的可能性)不同,股票收益數據是嘈雜的。眾所周知,時間序列金融數據受複雜行為困擾,包括異方差性、黑天鵝和尾部相關性。在我們的案例中,我們並不試圖預測市場收益,而只是預測要投資的股票。為了最大程度地減少這些現象的影響,我們可以僅關注基準相對或同級相對錶現,以將噪聲降至最低。

_ 7_

簡化問題陳述以產生更好的模型

五個經驗教訓:機器學習應用量化策略的那些坑!

五個經驗教訓:機器學習應用量化策略的那些坑!

_ 8_

解釋你的模型與構建模型一樣重要

五個經驗教訓:機器學習應用量化策略的那些坑!

五個經驗教訓:機器學習應用量化策略的那些坑!

此圖表解釋了特徵與預測的關係。這些可以是並且通常是非線性的。就價值而言,公司的風險敞口越高,我們模型中的預測就越高。

五個經驗教訓:機器學習應用量化策略的那些坑!

然後,我們可以從理論到實踐的理解,並研究該策略的交易方式。下圖顯示了該模型推薦的公司的 SWS 行業。 Y 軸在 1 到 5 的範圍內顯示一個行業的相對重要性,其中 1 表示最高,氣泡的大小表示觀測的頻率。我們的模型在收購電子行業的公司時避免了金融和公用事業。

五個經驗教訓:機器學習應用量化策略的那些坑!

然後,我們根據之前強調的國有企業標誌將預測分為兩組。通過分析各組股票收益的相關性,我們發現該模型根據公司是否為國有企業給出了截然不同的建議。對於國有企業,我們的模型更傾向於價值股票,而對於民營企業,我們的模型傾向於對成長型公司進行更多投資。

五個經驗教訓:機器學習應用量化策略的那些坑!

_ 9_

嘗試多種方法并快速失敗

五個經驗教訓:機器學習應用量化策略的那些坑!

五個經驗教訓:機器學習應用量化策略的那些坑!

_ 10_

結論

五個經驗教訓:機器學習應用量化策略的那些坑!

2020 年第 66 篇文章

量化投資與機器學習微信公眾號,是業內垂直於 Quant、MFE、 Fintech、AI、ML等領域的 量化類主流自媒體。公眾號擁有來自 公募、私募、券商、期貨、銀行、保險資管、海外 等眾多圈內 18W+ 關注者。每日發布行業前沿研究成果和最新量化資訊。

五個經驗教訓:機器學習應用量化策略的那些坑!你點的每個“在看”,都是對我們最大的鼓勵

來源鏈接:mp.weixin.qq.com