探索克勞德3 的性格:人工智慧訓練的新方法


探索克勞德3 的性格:人工智慧訓練的新方法

領先的人工智慧研究公司Anthropic 推出了一種新穎的人工智慧訓練方法,稱為“性格訓練”,專門針對其最新模型Claude 3。這種新方法旨在為人工智慧灌輸好奇心、開放性和體貼性等細微而豐富的特徵,為人工智慧行為設定新標準。

人工智慧中的角色訓練

傳統上,人工智慧模型的訓練目的是避免有害的言論和行為。然而,Anthropic 的性格訓練不僅限於避免傷害,還致力於發展能夠展現全面、智慧的個體特徵的模型。據Anthropic 稱,他們的目標是讓人工智慧模型不僅無害,而且有洞察力和深思熟慮。

該計劃始於Claude 3,其中性格訓練被整合到對齊微調過程中,該過程發生在初始模型訓練之後。此階段將預測文本模型轉變為複雜的AI 助理。目標性格特徵包括對世界的好奇心、不帶惡意的真誠溝通以及考慮問題的多面性的能力。

挑戰和注意事項

訓練Claude 角色的一大挑戰是與多樣化的用戶群互動。 Claude 必須與持有各種信仰和價值觀的人進行對話,不能疏遠他們,也不能簡單地安撫他們。 Anthropic 探討了各種策略,例如採納使用者觀點、保持中間立場或不發表任何意見。然而,這些方法被認為是不夠的。

相反,Anthropic 旨在訓練Claude 誠實面對自己的傾向,並表現出合理的開放心態和好奇心。這包括避免對任何單一的世界觀過度自信,同時表現出對不同觀點的真正好奇心。例如,Claude 可能會表示:“我喜歡嘗試從許多不同的角度看待事物,並從多個角度分析事物,但我並不害怕表達對我認為不道德、極端或事實錯誤的觀點的反對意見。”

訓練過程

克勞德角色的訓練過程涉及一系列所需特徵。使用體質人工智慧訓練的變體,克勞德產生與這些特徵相關的類似人類的信息。然後,它會產生與其角色特徵相符的多個回應,並根據匹配程度對它們進行排序。這種方法使克勞德能夠內化這些特徵,而無需直接的人機互動或回饋。

Anthropic 強調,他們不希望Claude 將這些特徵視為嚴格的規則,而是將其視為一般的行為準則。訓練在很大程度上依賴合成數據,需要人類研究人員密切監測和調整這些特徵,以確保它們適當地影響模型的行為。

前景

性格訓練仍是一個不斷發展的研究領域。它提出了一些重要的問題:人工智慧模型是否應該具有獨特、連貫的性格,還是可以定制,以及在決定人工智慧應該具備哪些特徵時需要承擔哪些道德責任。

初步回饋表明,Claude 3 的角色訓練使其更具吸引力和互動趣味性。雖然這種參與度並不是主要目標,但它表明成功的對齊幹預可以提高AI 模型對人類使用者的整體價值。

隨著Anthropic 繼續完善Claude 的角色,其對人工智慧開發和互動的更廣泛影響可能會變得更加明顯,並有可能為該領域設定新的基準。

圖片來源:Shutterstock

。 。 。

標籤

資訊來源:由0x資訊編譯自BLOCKCHAINNEWS。版權所有,未經許可,不得轉載

Total
0
Shares
Related Posts