AI顛覆人類的第一步:讀懂人心
在關於AI的大討論中,人們為其賦予的角色要么是我們最得力的高效助手,要么是將顛覆我們的“機器軍團”,不管是敵是友, AI不僅要能完成人類佈置的任務,還要能「讀懂」人心,而這讀心力也正是今年以來AI領域的重頭戲。
在PitchBook今年發布的企業Saas新興技術研究報告中,「情感AI」成為了一大技術亮點,它指的是使用情感運算和人工智慧技術來感知、了解和進行對人類情感的互動,試圖透過分析文字、臉部表情、聲音和其他生理訊號來理解人類的情緒,簡單來說,情感AI就是希望機器能像人類一樣,甚至比人類更好地「讀懂」情感。
它的主要技術包括:
-
臉部表情分析:透過相機、電腦視覺和深度學習,偵測微表情與臉部肌肉運動。
-
聲音分析:透過聲紋、語調、節奏辨識情緒狀態。
-
文本分析:借助自然語言處理(NLP)技術解讀語句和上下文。
-
生理訊號監測:使用穿戴裝置分析心率、皮膚反應等,提升互動個人化和情緒豐富度。
Emotion AI
情感AI的前身是情感分析技術,它主要是透過文字互動進行分析,例如在社群媒體上透過文字進行使用者情感的分析和提取,而有了AI的加持,整合視覺和音訊等多種輸入方式,情感AI承諾著更精準和完整的情感分析。
VC撒錢,創辦人獲巨額融資
矽兔君觀察,情感AI的潛力吸引了許多投資者的關注,一些專注於這個領域的新創公司像Uniphore、MorphCast等,已經在這條賽道上獲得了大量投資。
來自加州的Uniphore從2008年起就在探索為企業提供自動化對話解決方案,已經開發出包括U-Self Serve、U-Assist、U-Capture和U-Analyze等多個產品線,幫助客戶通過語音、文字、視覺和情感AI技術進行更個人化和情感豐富的互動。 U-Self Serve主打精準辨識對話中的情感與語氣,讓企業能提供更個人化的服務,提升用戶參與滿意度;
U-Self Serve
U-Assist則能透過即時指導和工作流程的自動化來提高客服代理的工作效率;U-Capture可以透過自動化的情感數據收集和分析,讓企業擁有對客戶需求和滿意度的深度洞察;而U- Analyze則能夠幫助客戶識別互動中的關鍵趨勢和情感變化,提供由數據驅動的決策支援來增強品牌忠誠度。
Uniphore的技術並非只是讓機器理解語言,而是希望它們能在與人類互動時,捕捉和解讀隱藏在語氣、表情背後的情感。這種能力讓企業在與客戶互動時,不再只是機械化應對,而是能夠更好地滿足客戶的情感需求,透過使用Uniphore, 企業的用戶滿意度能夠達到87%,客服表現提升30%。
Uniphore至今已經完成了超6.2億美元融資,最近一輪投資來自於2022年由NEA領投的4億美元,March Capital等現有的投資者也進行了參投,此輪後估值達到了25億美元。
Uniphore
Hume AI則推出了世界上第一個能夠共情的語音AI,由前Google科學家Alan Cowen創立,他曾以開創了語義空間理論而出名,這一理論通過揭示聲音、面部和手勢的細微差別,來理解情緒體驗和表達,Cowen的研究成果發表在「自然「和「認知科學趨勢」等眾多期刊上,涉及迄今為止研究範圍最廣、最多樣化的情緒樣本。
以此研究驅動的Hume開發出了對話式語音API – EVI,它結合了大型語言模型和同理心演算法,能夠深入理解和解析人類的情感狀態,它不但能識別語音中的情感,還能在在與使用者的互動中做出更細膩和個人化的反應,而開發人員只需幾行程式碼即可使用這些功能,並可將其內建到任何應用程式中。
Hume AI
目前大多數AI系統的主要限制之一在於它的指令主要由人類給出,這些指令和提示容易出錯且無法挖掘出人工智慧的巨大潛力,而Hume所開發出的共情大型語言模型(eLLM)能夠根據上下文和使用者的情緒表達調整其使用的詞語和語調,透過將人類快樂作為第一原則進行機器的學習、調整和互動,在心理健康、教育培訓、急救呼叫、品牌分析等多個場景中都能為使用者帶來更自然真實的體驗。
就在今年3月,Hume AI 完成了由EQT Ventures領投的5,000萬美元B輪融資,投資方還包括Union Square Ventures、Nat Friedman & Daniel Gross、Metaplanet和Northwell Holdings等機構。
在這一領域的還有專門衡量消費者認知和情感反應的Entropik,透過Decode這一融合了情感AI、行為AI、生成AI和預測AI綜合力量的功能,它能夠更好地了解消費者的行為和偏好,從而提供更個人化的行銷建議,Entropik最近在2023年2月完成了2500萬美元的B輪融資,投資者包括SIG Venture Capital和Bessemer Venture Partners。
Entropik
巨頭參與,一場混戰
科技大廠憑藉自身優勢,在情感AI這一領域也有所佈置。
包含Microsoft Azure 認知服務的情緒API,能夠透過分析臉部表情和情緒,來辨識圖片和影片中的喜悅、憤怒、悲傷、驚訝等多種情緒;
IBM Watson的自然語言理解API可以處理大量文字數據,辨識出背後的情緒傾向(如正面、負面或中性),來更精準的解讀使用者意圖;
Google Cloud AI 的Cloud Vision API 擁有強大的影像分析功能,能夠快速辨識圖片中的情緒表達,且支援文字辨識與情緒關聯;
AWS 的Rekognition也能夠偵測情緒、辨識臉部特徵並追蹤表情變化,還可以與其他AWS服務結合使用,成為完整的社媒分析或情緒AI驅動的行銷應用。
Cloud Vision API
有些新創公司在情感AI領域的研發腳步更快,甚至到了科技巨頭都要「挖人」的地步,例如獨角獸Inflection AI就被投資方微軟看中了AI團隊和模型,微軟在與Bill Gates 、Eric Schmidt和NVIDIA等多方共同為Inflection AI投下了13億美元後,向AI領軍人物也是Inflection AI的聯合創立者之一Mustafa Suleyman拋出橄欖枝,隨後Suleyman連帶70多位員工轉投微軟,而微軟也為此支付了近6.5億美元。
不過,Inflection AI也很快重整旗鼓,組成了來自擁有Google翻譯、 AI諮詢和AR 多個背景的新團隊,繼續在其核心產品Pi上持續發力。 Pi是一款能夠理解並回應使用者情緒的個人助手,與傳統的AI不同,Pi 更重視與使用者建立情感連結,透過分析語音、文字等輸入感知情緒,在對話中展現出同理心。 Inflection AI將Pi視為教練、知己、傾聽者和創意夥伴,而不是簡單的AI助理。此外,Pi 擁有強大的記憶功能,能夠記住使用者多次對話的歷史,以此來提升互動的連續性和個人化體驗。
Inflection AI Pi
發展之路,關注與質疑並存
雖然情感AI寄託著我們對更人性化互動方式的期許,但就像所有的AI技術一樣,它的推廣更伴隨著關注和質疑。首先,情感AI是否真的能夠準確解讀人類的情感?在理論上,這項技術的確能夠使服務、設備和技術的體驗更加豐富,但從現實的角度來看,人類的情感本質上是模糊和主觀的,早在2019年就有研究人員曾對這項技術提出質疑,表示面部表情並不能可靠的反映人類的真實情感,因此單純依賴機器來模擬人類的面部表情、體態和語調來理解情感, 存在著一定的局限性。
其次,嚴格的法規監管也一直是AI發展路上的絆腳石,例如歐盟的AI法案禁止在類似教育等領域使用使用電腦視覺情緒檢測系統,因此可能會限制某些情緒AI解決方案的推廣;像是美國伊利諾伊州等州也有法律禁止在未獲許可的情況下進行生物識別數據的收集,這直接限制了情感AI某些技術使用的前提。同時,資料隱私和保護更是一個重要議題,情感AI通常應用於教育、健康、保險等對資料隱私要求格外嚴格的領域,因此確保情緒資料的安全和合法使用,是每一家情感AI公司都需要面對的課題。
最後,不同文化地域的人與人之間進行交流和情緒解讀都是難題,對AI來說更是考驗,例如不同地區對情感的理解和表達方式各不相同,這可能影響情感AI系統的有效性與完整性,此外,情感AI在處理種族、性別和性別認同偏見時,也可能面臨不小的困難。
情感AI不僅承諾著減少人力的高效,還有著讀人心的體貼,但它是否能夠真的成為人類互動中的萬能解決方案,還是會成為和Siri大同小異的智能助手,在需要真正情感理解的任務中表現平平?或許在未來,AI的「讀心術」將會顛覆人機甚至是人類互動,但至少在現在,真正理解和回應人類情感,或許更需要人的參與和審慎。
參考來源:
-
Uniphore Announces $400 Million Series E(Uniphore)
-
Hume AI Announces $50 Million Fundraise and Empathic Voice Interface(Yahoo Finance)
-
Introducing Pi, Your Personal AI(Inflection AI)
-
‘Emotion AI’ may be the next trend for business software, and that could be problematic(TechCrunch)
-
EMERGING TECH RESEARCH Enterprise Saas Report (PitchBook)