據品玩10 月25 日報道,Arxiv 頁面顯示,微軟聯手聖母大學發布了一款用於給大語言模型的指令進行調優的方法Auto-Instruct。 Auto-Instruc 利用LLM 的生成能力為給定任務產生多種候選指令,然後使用一種訓練於多種575 個現有NLP 任務的評分模型對它們進行排名。在118 個領域外任務的實驗中,Auto-Instruct 超過了人類所寫的指令和現有的LLM 產生的指令基準。
巴比特訊