根據IT 之家11 月15 日報道,微軟近日推出了名為「Everything of Thought」(XOT)的方法,靈感來自GoogleDeepMind 的AlphaZero,利用緊湊的神經網絡,來增強AI 模型推理能力。微軟和喬治亞理工學院、華東師範大學合作開發了該演算法,整合了強化學習(reinforcement learning)和蒙特卡洛樹搜尋(MCTS)能力,在複雜決策環境中,進一步提高解決問題的有效性。據悉,微軟研究團隊表示XOT 方法可以讓語言模型擴展到不熟悉的問題上,在Game of 24、8-Puzzle 和Pocket Cube 嚴苛測試中提昇明顯。結果表明,XOT 明顯優於其他方法,甚至解決了其他方法失敗的問題。但是,XOT 並沒有達到100% 的可靠性。