Anthropic推出新工具“Think”,使Claude能夠暫停並反思復雜的工具使用情況


擬人化引入了Claude的“思考”工具,在復雜的工具中啟用結構化推理使用任務

人類專門從事AI安全和研究的公司介紹了“ Think”工具,該工具為複雜任務期間的結構化思維提供了專門的空間。該工具使Claude能夠在達到最終答案之前結合一個額外的思維步驟(與自己的指定空間相結合)。

儘管這個概念似乎類似於擴展思維,但存在關鍵差異。在克勞德(Claude)開始產生響應之前,就會發生擴展思維,在這種響應中,它深入考慮並完善了其方法。相反,在克勞德(Claude)開始產生響應後,使用“思考”工具,允許其暫停並評估它是否已收集了所有必要的信息進行進行。這在涉及長時間與用戶的工具調用或多步對話的任務中尤其有益。

在克勞德(Claude)沒有足夠的用戶查詢信息並需要處理外部數據(例如工具調用結果)的情況下,“思考”工具特別有效。該工具背後的推理不如擴展思維過程全面,並且更專注於整合任務過程中出現的新信息。

擬人化建議使用擴展思維以進行更簡單的方案,例如非序列工具調用或直接說明。對於Claude不需要依靠外部工具的編碼,數學和物理等任務也有效。該工具更適合更複雜的任務,克勞德必須仔細分析工具輸出,在政策繁重的環境中瀏覽詳細指南,或做出彼此建立的順序決策,而錯誤會產生後果。

為了用Claude最大程度地提高“思考”工具的好處,Anthropic建議根據其τ基礎實驗進行以下實施實踐。

最有效的策略是提供有關何時以及如何使用“思考”工具的明確指示。這在τbench航空公司域中尤其明顯,在該領域,特定於域的示例極大地提高了模型在應用“思考”工具方面的有效性。這些示例應包括有關幾個方面的指導,例如:概述推理過程中預期的細節水平,將復雜的指令分解為可行的步驟,為處理共同場景提供決策樹,並幫助評估是否收集了所有必要的信息。

此外,人類發現,對於長或複雜的說明,將它們放在系統提示中比將它們包括在工具說明本身中更有效。這使模型可以通過為其提供更廣泛的環境來更好地將思維過程整合到其整體行為中。

將“思考”工具集成到Claude實施中相對簡單,可以改善。該公司建議從具有挑戰性的用例開始,尤其是那些克勞德(Claude)在政策合規性上掙扎或在長長的工具呼叫中進行複雜推理的那些案例。用戶可以開始添加工具定義並實現特定於域的自定義“思考”工具。此過程需要最少的編碼,但有助於更結構化的推理。用戶還應考慮包括有關何時以及如何使用該工具的說明,以及系統提示中與域相關的示例。

該工具到位後,鼓勵用戶通過觀察Claude在實踐中如何應用它來監視和完善其使用。他們可以調整提示以促進更有效的思維模式。添加新工具在性能方面具有最小的缺點。除非克勞德(Claude)選擇使用它,否則它不會改變外部行為,並且不會干擾現有的工具或工作流程。

資訊來源:由0x資訊編譯自出MPOST。版權歸作者Alisa Davidson所有,未經許可,不得轉載

Total
0
Shares
Related Posts