一夜之間,亞馬遜來了個「彎道超車」。
在全球各大科技巨頭都在擁抱如今最火的大模型、AIGC 的時候,亞馬遜給人的印像只有一個:隱身。
雖然AWS 一直在為Hugging Face、Stability AI 等大模型明星公司提供機器學習算力,不過亞馬遜很少透露合作的細節。有網友曾統計,在過去一段時間的財報財報會議上,亞馬遜提到AI 的次數幾乎為零。
但如今,亞馬遜的態度發生了巨大的變化。
4 月13 日,亞馬遜首席執行官安迪・賈西(Andy Jassy)發布了2022 年度股東信,稱他對亞馬遜能夠控製成本並繼續投資於新的增長領域充滿信心。他在信中biaoshi,亞馬遜未來將大力投資當下十分火爆的大型語言模型(LLM)和生成式人工智能(AI)領域。
賈西表示,在過去的幾十年裡,亞馬遜在各種應用中使用機器學習。該公司現在正在開發自己的大語言模型,其有可能改善「幾乎所有客戶體驗」。
話音未落,亞馬遜的大模型及服務就被揭開了面紗。
「大多數公司都想用上大型語言模型,但真正好用的語言模型需要數十億美元和多年的時間來訓練,人們不想經歷這些,」安迪・賈西表示。 「因此,他們期待從一個已經非常龐大的基礎模型中進行提升,然後能夠根據自己的目的對其進行定制。這就是Bedrock。」
亞馬遜版ChatGPT:是其云服務的一部分。
大模型
在最新的公告中,AWS 介紹了一組新模型—— 統稱為「Amazon Titan」。
Titan 系列模型分為兩種,一種是用於內容生成的文本模型,另一種是可創建矢量嵌入的嵌入模型,用於創建高效搜索功能等。
文本生成模型類似於OpenAI 的GPT-4(但在性能方面不一定相同),可以執行諸如撰寫博客文章和電子郵件、總結文檔和從數據庫中提取信息等任務。嵌入模型將文本輸入(如單詞和短語)翻譯成數字表示形式,稱為嵌入,其中包含文本的語義。
基於OpenAI 語言模型的ChatGPT 和微軟Bing 聊天機器人的人有時會產出不准確的信息,這是由於一種稱為「幻覺」的行為,輸出看起來很有說服力,但實際上與訓練數據無關。
AWS 副總裁Bratin Saha 在接受CNBC 採訪時表示,亞馬遜「非常關心」準確性並確保其Titan 模型產生高質量的響應。
客戶將能夠使用自己的數據定制Titan 模型。但另一位副總裁表示,這些數據永遠不會用於訓練Titan 模型,以確保包括競爭對手在內的其他客戶最終不會從這些數據中受益。
Sivasubramanian 和Saha 拒絕談論Titan 模型的大小或確定亞馬遜用於訓練它們的數據,Saha 也不願描述亞馬遜為刪除模型訓練數據中有問題的部分而遵循的過程。
雲服務
Titan 模型的發布,其實是亞馬遜「Bedrock」計劃的一部分。全球最大的雲基礎設施提供商亞馬遜,顯然不會將這樣一個迅速增長的領域留給谷歌和微軟這些對手。
Bedrock 計劃是在OpenAI 發布GPT-4 一個月後推出的。當時,微軟已向OpenAI 投資數十億美元,並通過Azure 雲服務為OpenAI 提供算力。這是亞馬遜AWS 業務面臨的最強大的競爭。
Bedrock 雲服務類似於由微軟支持的初創公司OpenAI 提供支持的ChatGPT 聊天機器人背後的引擎。通過其Bedrock 生成式人工智能服務,亞馬遜網絡服務將提供Titan 等模型的訪問。
該服務支持的初始基礎模型集還包括來自AI21、Anthropic 和Stability AI 的模型,以及亞馬遜自研的Titan 系列新模型。 Bedrock 的亮相,某種程度上預示著AWS 在過去幾個月與生成式AI 初創公司達成了合作夥伴關係。
Bedrock 的關鍵優勢在於,用戶可將其與AWS 雲平台的其餘部分集成在一起。這意味著組織將能夠更輕鬆地訪問存儲在Amazon S3 對象存儲服務中的數據,並能夠從AWS 訪問控制和治理策略中受益。
亞馬遜目前沒有透露Bedrock 服務的成本,因為它還處於有限的預覽階段。一位發言人表示,客戶可以將自己添加到等候名單中。此前,微軟和OpenAI 已經公佈了使用GPT-4 的價格,起價為每1000 個token 幾美分,一個token 相當於大約四個英文字符,而谷歌尚未公佈其PaLM 語言模型的定價。
AI 編程助手,免費向個人開放
我們知道,編程將是生成式AI 技術得到快速應用的領域之一。今天,軟件開發者需要花費大量時間編寫相當淺顯和無差別的代碼,還得花不少時間學習複雜的新工具和技術,而這些工具和技術總在不斷演進。因此,開發者真正用於開發創新功能與服務的時間少之又少。
為應對這一難題,開發者會嘗試從網上複製代碼片段再進行修改,但可能無意中復制了無效代碼和有安全隱患的代碼。這種搜索和復制的方式也浪費了開發者用於業務構建的時間。
生成式AI 可以通過「編寫」大部分無差別的代碼來大大減少這種繁重的工作,讓開發人員更快地編寫代碼,同時有更多時間專注在更具創造性的編程工作上。
2022 年,亞馬遜宣布推出Amazon CodeWhisperer 預覽版。這款AI 編程助手通過內嵌的基礎模型,根據開發者用自然語言描述的註釋和IDE 中的既有代碼實時生成代碼建議,提升工作效率。預覽版發布後得到了開發者的熱烈響應,與未使用該編程助手的開發者相比,使用者完成任務的速度平均快57%,成功率提高27%。
現在,亞馬遜宣布CodeWhisperer 正式可用,免費向所有個人用戶開放,不設任何資質或使用時長的限制。另外還提供引用跟踪和每個月50 次的安全掃描服務。用戶只需郵箱註冊,無需亞馬遜雲服務賬號。企業客戶可以選擇包含更多高級管理功能的專業版。
除了適用Python、Java、JavaScript、TypeScript 和C# 之外,CodeWhisperer 新增了對Go、Kotlin、Rust、PHP 和SQL 等10 種開發語言的支持。開發者可以通過在VS Code、IntelliJ IDEA、Amazon Cloud9 等集成開發環境中的Amazon Toolkit 插件訪問CodeWhisperer,也可在Amazon Lambda 控制台中使用。
亞馬遜表示,除了從數十億行公開代碼中學習之外,CodeWhisperer 也基於亞馬遜的代碼進行了訓練。因此它是目前為亞馬遜雲服務(包括Amazon EC2 等)生成代碼的最準確、最快和最安全的方式。
AI 編程助手生成的代碼可能包含隱藏的安全漏洞,因此CodeWhisperer 提供了內置安全掃描功能(通過自動推理實現),這是唯一一個這樣做的。該功能查找難以檢測的漏洞並提出補救建議,如十大開放式Web 應用程序安全項目(OWASP)中的漏洞以及不符合加密貨幣庫最佳實踐的漏洞等。
此外,為了幫助開發人員以負責任的方式開發代碼,CodeWhisperer 會過濾掉可能被認為有偏見或不公平的代碼建議。同時由於客戶可能需要對開源代碼源進行參考或獲得其使用許可,CodeWhisperer 還是唯一可以對疑似開源代碼建議進行過濾和標記的編程助手。
小結
亞馬遜在AI 領域佈局了20 多年,而AWS 已經擁有超過10 萬家AI 客戶。 Sivasubramanian 表示,亞馬遜一直在使用經過微調的Titan 版本,通過其主頁提供搜索結果。
然而,亞馬遜只是在ChatGPT 出現並走紅後,推出生成式AI 能力的大公司之一。 Expedia、HubSpot、Paylocity 和Spotify 都致力於整合OpenAI 技術,亞馬遜則不然。 「我們總在一切準備就緒時行動,所有技術早已出現。」Sivasubramanian 這樣說到。由於使用定制的AI 處理器,亞馬遜希望確保Bedrock 易於使用且具有成本效益。
目前,C3.ai、Pegasystems 和Salesforce 等公司都已準備引入Amazon Bedrock。
參考內容:
https://www.cnbc.com/2023/04/13/aws-launches-bedrock-generative-ai-service-titan-llms.html
https://aws.amazon.com/blogs/machine-learning/announcing-new-tools-for-building-with-generative-ai-on-aws/
https://d18rn0p25nwr6d.cloudfront.net/CIK-0001018724/73ee03b0-fbbc-4d37-96a2-f405ef966bc5.pdf
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載