蘋果無視工程師關於人工智慧技術缺陷的警告


據報道,蘋果無視工程師對其有缺陷的蘋果智慧的警告,並繼續發布了該技術,但市場評價卻平淡無奇。

這家iPhone 製造商的Apple Intelligence 因錯誤原因成為頭條新聞,並受到廣泛批評,尤其是捏造虛假資訊和搞砸新聞頭條。

工程師發現了包括Apple Intelligence在內的許多模型的故障

雖然大型語言模型產生幻覺是很常見的,這是人工智慧產業尚未解決的挑戰(如果有的話),但蘋果的情況有點不同。工程師在發布之前註意到該模型存在一些嚴重缺陷。然而,該公司忽視了這些警告。

分析師表示,在對其人工智慧的巨大缺陷發出警告後,這家科技巨頭繼續發布該模型是魯莽的。這些警告來自去年十月發布的一項研究。

儘管尚未經過同行評審,但在測試了人工智慧行業一些頂尖法學碩士的數學「推理」後,該研究還得出結論,這些模型無法推理。

為了測試這些模型,工程師讓他們從廣泛使用的GSM8K 資料中心化解決數千個數學問題,該資料集是業界的基準。

根據Futurism 的說法,數據中心化的一個典型問題是:“詹姆斯買了5 包牛肉,每包4 磅。牛肉價格為每磅5.50 美元。他付了多少錢?”

工程師們透過簡單地更改問題中的一些數字來暴露人工智慧模型中的差距,以避免數據污染。這導致了所檢查的20 個法學碩士存在一些小但值得注意的錯誤。

然而,當研究人員更進一步,更改名稱並添加一些“不相關的細節”時,結果卻是“災難性的”,高達65%。

研究人員寫道:“這揭示了模型識別解決問題相關資訊的能力的關鍵缺陷,可能是因為它們的推理在常識術語中並不正式,並且主要基於模式匹配。”

研究人員表示,每個模型的結果都不同。 OpenAI 01-preview 下跌了17.5%,其前身GPT-4o 下跌了32%。研究人員指出,即使是「最聰明」的模型也會面臨問題並表現出一些嚴重的缺陷。

AI 模型靠自己掙扎

測試還證明,人工智慧模型在解決問題方面可能看起來很聰明,但一旦它們不能逐字複製某人的作業,它們就會陷入困境。至於蘋果公司,據報道這家科技巨頭知道測試結果,但向市場發布了其模型。

由於市場的強烈反對,包括英國廣播公司(BBC)對該模型洩露誤導性資訊的擔憂,蘋果最終暫停了該計劃,直到能夠修復它。

蘋果的人工智慧功能原本應該可以總結新聞通知,但它有時會自己編造新聞,這讓讀者和新聞出版商非常不滿。

其中一條不準確的新聞提醒稱,拉斐爾納達爾是同性戀,一名被指控殺害美國保險老闆的男子開槍自殺。蘋果的人工智慧也錯誤地總結了BBC 應用程式通知,聲稱盧克·利特勒(Luke Littler) 在PDC 世界飛鏢錦標賽開始前幾個小時就贏得了冠軍。

《紐約時報》報導的另一篇錯誤摘要似乎已於1 月6 日發表,與國會山莊騷亂四週年有關。

蘋果在給BBC 的聲明中表示:「Apple Intelligence 功能尚處於測試階段,我們將在用戶回饋的幫助下不斷進行改進。」「未來幾週的軟體更新將進一步澄清顯示的文字何時是Apple Intelligence 提供的摘要。

蘋果的故障功能之一是去年12 月向一些較新iPhone 的用戶發布的人工智慧工具之一,包括iPhone 16、15 Pro 和15 Pro Max 手機,以及一些iPad 和Mac。

90 天內開啟您的Web3 職業生涯並獲得高薪加密貨幣工作的逐步系統。

資訊來源:由0x資訊編譯自CRYPTOPOLITAN。版權歸作者Enacy Mapakame所有,未經許可,不得轉載

Total
0
Shares
Related Posts