GoogleDeepMind 新研究:Transformer泛化能力無法擴展到訓練資料以外的內容

根據量子位元11 月11 日報道,針對Transformer,GoogleDeepMind一項新的發現引起了不小爭議:它的泛化能力,無法擴展到訓練資料以外的內容。目前這一結論還沒有進一步得到驗證,但已經驚動了一眾大佬,比如Keras之父Francois Chollet表示,如果消息為真,將成為大模型界的一件大事。

巴比特訊

Total
0
Shares
Related Posts