來源:雷石投資
導語:近年來,AI製藥已經成為醫療領域的新晉熱門賽道。 2023年ChatGPT的爆火,又讓人們看到生成式AI在製藥領域的新可能。當AI製藥的潛能不斷被證實,在大勢所趨下,AI製藥又該如何破局數據之困、監管之難,突破挑戰迎來新發展。
ChatGPT火了,AI製藥能迎來新發展嗎?
從OpenAI發布聊天機器人ChatGPT開始,人工智能的發展又一次駛入快車道。最近一個月,每隔幾天人們就能看到人工智能的新進展。無論是行業巨頭還是初創公司,都在積極尋求應對新一輪AI風潮的方法,制定相應的AI戰略。
ChatGPT的爆火,AI 2.0時代的到來,也給生物製藥行業帶來新的改變。最近,AI藥物研發公司Insilico Medicine(英矽智能)在生成化學領域知名期刊Chemical Science發表文章,闡述了分子生成平台Chemistry42在AIphaFold2蛋白質結構預測的基礎上進行分子設計,進而在30天內發現靶向潛在抗癌靶點CDK20的小分子抑製劑的過程,展示了在有限分子結構數據下,人工智能可以輔助新藥物發現,實現降本增效。
更早之前,初創公司Profluent首次利用類似ChatGPT的蛋白質工程深度學習語言模型ProGen實現了AI預測蛋白質的合成,並將研究成果發佈在《自然》雜誌子刊。可以說,AI正在給製藥領域帶來根本性的改變。 Gartner《2022年人工智能技術成熟度曲線》報告稱,2025年50%的藥物發現與研發將使用生成式AI;2027年,30%的製造商將使用生成式AI提高產品研發效率。隨著生成式AI的持續發展,製藥領域或許也能迎來全新的發展期。
AI+蛋白質成新的投資熱點
ChatGPT走紅,勢必帶動新一波AI投資熱潮。事實上,隨著近期AI製藥話題度的持續走高,一眾AI概念股的股價也跟著水漲船高。儘管中國目前還沒有真正的AI製藥公司,但也不妨礙CRO(醫藥研發合約外包服務機構)企業成都先導股價在3月一路上漲,數次漲停。成都先導稱,公司一直以來都對AI在藥物研發領域的進展保持高度關注並不斷進行探索和研究,未來會持續加大在該領域的嘗試。
在今年3月的複星醫藥業績發布會上,董事長吳以芳接受采訪時表示,未來將在創新藥靶點發現和藥物設計等方面進行AI製藥業務。
上市公司持續深耕AI製藥,初創公司的融資能力也表現不俗。
2月20日,AI蛋白質設計平台公司分子之心宣布獲得超億元戰略投資,用於AI蛋白質優化與設計平台MoleculeOS進一步開發,以及在生物製藥、合成生物學等產業領域的應用探索。不到一年的時間裡,分子之心已經完成2輪融資。
而在國外,資本市場對於AI+蛋白質的投資熱情持續高漲。 2022年4月,Arzeda宣布完成3300萬美元的B輪融資,用於正在進行的蛋白質設計項目。
2022年11月,AI+合成生物初創公司Cradle獲得550萬歐元的種子輪融資,資金將用於支持公司基於AI設計蛋白質和細胞工廠的研究進程。
2023年1月,Profluent宣布完成900萬美元的種子輪融資,該筆融資將用於在加利福尼亞伯克利建立一個綜合實驗室,使Profluent能夠在通過實驗方法產生的數據與其AI系統之間創建一個緊密的反饋循環,不斷改進公司AI。
資本的投入,將更加有利於企業不斷提高AI技術,進一步促進人們對細胞基本結構的理解,進一步推動生物製藥過程,從而推動生命科學和醫學的發展。
生成式AI顛覆蛋白藥物研發
為什麼製藥公司會看重“AI+蛋白質”領域?因為生物製藥主要都是蛋白質,蛋白質類原料是生物醫藥上游佔比最大的原料之一。目前重組蛋白藥已經成為生物製藥領域最重要的產品之一。
當人們將大量的蛋白質數據提供給AI,AI就可以分析研究這些數據從而創建新的蛋白質。在蛋白質設計過程中,AI可以把原先無序、不規則的氨基酸殘基拼接成能夠和靶點結合的候選蛋白,從而推進新藥物的開發。相比傳統實驗技術測定蛋白質結構的費時費力,AI強大的算力算法和數據處理能力,能顛覆傳統的藥物研發,加快藥物研發速度。
2017年,《Nature》發表文章稱,人類可發現的藥物分子個數可能是10的60次方,而傳統藥物篩選辦法能夠找到的分子數僅約10的11次方,在11次方與60次方之間有一個遠未窮盡的大黑洞,這里或許就潛藏著許多新藥的可能性。生成式AI或許是創造可能性的有力工具之一。
生成式AI可以基於訓練數據生成算法模型,自主生成各種形式的內容。 ChatGPT的出現讓人們看到大型語言模型(LLM,Large Language Model)的出色效果。
Profluent的蛋白質工程深度學習語言模型ProGen和ChatGP類似,實現了AI預測蛋白質的合成。據報導,Profluent設計的蛋白質是通常需要數百年才能進化出來的高活性蛋白質。由此可以看出生成式AI同樣可以學習生物學的基本原理,可以大大提高蛋白質設計效率。
和ChatGPT一樣,ProGen模型的創建也是研究人員餵養了2.8億種不同蛋白質的氨基酸序列,並經過了幾週時間的訓練。同樣地,ProGen也是通過學習氨基酸如何組合成2.8億個現有蛋白質的語法,才學會如何生成新的蛋白質。 ProGen和ChatGPT一樣也是經過大量的數據餵養才能使算法模型越來越精準。
眾所周知,新藥品的研發是一個週期長、複雜的過程,而且失敗率高。而隨著生成式AI的發展,可以幫助藥企更快地識別和分類小的分子和生物製劑,並且改善臨床試驗的結果。
圖注:使用條件語言模型生成人工蛋白質
AI製藥面臨的挑戰
AI快速發展給製藥帶來新機遇的同時,挑戰也一直存在。首先是數據。早在2019年,《Nature評測s Drug Discovery》發表的文章就將“獲取適當數據集”視為AI藥物面臨的五大挑戰之一。數據首先要面臨質量問題,GPT-3的訓練數據有很多是來自互聯網,導致當時人們感覺ChatGPT在胡言亂語。而藥物數據的質量更難以保證。同時,藥物數據相較其他數據更為敏感,數據都去中心化在各大醫院,很難被科技公司獲取和加以使用,數據孤島不能打破,AI模型的訓練就會差強人意。
其次,和電商、金融、遊戲等行業相比,在製藥領域,數據的豐富性和多樣性相差甚遠,使用場景也有限。要知道,只有當數據足夠豐富時,AI的落地才會更加順暢。
最重要的一點是,AI製藥還會面臨監管問題。 ChatGPT的火熱已經引起各國政府的注意,相應的監管規則正在不斷出爐。路透社報導稱,3月31日,意大利個人數據保護局宣布禁用ChatGPT,暫停OpenAI處理意大利人的數據,並對其展開調查。德國、法國、愛爾蘭等國家也開始準備加強對ChatGPT監管。我國國家互聯網信息辦公室起草了《生成式人工智能服務管理方法(徵求意見稿)》,向全社會公開徵求意見。當野蠻生長的新興技術遇上監管之手,未來發展將會充滿更多不確定性。
值得一提的是,儘管AI製藥是大勢所趨,但在傳統結構生物學家眼裡,AI 是未來,但現在仍差強人意。
顏寧曾表示,AI仍有局限性,AI還需要更大的數據庫,更強的算力,更新的算法。 2013年諾貝爾化學獎獲得者邁克爾·萊維特(Michael Levitt)在接受第一財經採訪時表示,“我認為很多結構生物學家不僅僅是在做結構方面的研究,他們也做很多蛋白功能以及藥物研發方面的工作,就好像顏寧教授。人工智能只是解放了一部分傳統的人力,但是科學的進步仍然需要依靠最智能人腦,單靠人工智能恐怕還是不行的。”
結語
AI製藥領域備受熱捧,AI製藥創業公司融資額也日益走高,我們可以看到製藥業正在熱切擁抱AI,寄希望於這一前沿技術,縮短藥物研發週期,降低藥物研發成本,提高藥物研發成功率,創造更大的商業價值以及社會價值。
但現階段AI製藥在技術和政策上面臨著諸多挑戰,一些傳統藥企對AI態度複雜,仍持觀望態度。 AI製藥的商業化前景仍需接受市場檢驗。
但從長遠來看,隨著AI技術的快速發展,AI製藥仍是未來的發展趨勢。當製藥企業經驗不斷增持,AI持續優化,AI在製藥業發揮的價值將會越來越大,能進一步促進生物科學的發展,讓更多普通人受益。這條路道阻且長,但充滿想像力。
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載