云、AI等虛擬數字人,或將顛覆傳媒、文創、金融等行業運營模式
作者:趙滿滿
編輯:益韓
編審:楊小天
頭圖來源:Ibtnews
近年來,人工智能相關技術持續演進,與云計算、大數據、物聯網、5G等技術不斷融合,成為引領未來的新興戰略性技術,是驅動新一輪科技革命和產業變革的重要力量。
在新科技革命和產業變革的大背景下,人工智能產業化和商業化進程不斷提速,正在加快與千行百業深度融合,正在促進新興產業之間、新興產業與傳統產業之間以及技術與社會的跨界融合發展。
中國軟件網、海比研究院認為,人工智能與產業深度融合,將成為企業釋放數字化疊加倍增效應、加快戰略新興產業發展、構筑綜合競爭優勢的必然選擇,全面梳理人工智能技術、應用的發展態勢,對推動人工智能持續健康發展至關重要。
為此,中國軟件網、海比研究院特別推出了“人工智能行業洞察”系列報道,通過對人工智能技術、應用、企業等深度報道,助力企業數字化、智能化。
目前,中國軟件網、海比研究院已經推出的AI報道包括:
·知識圖譜讓知識比數據更重要,得知識者得天下
·數據不出門就能被利用,聯邦學習讓機器學習工程化
·HR擁抱人工智能,8大場景重塑無限可能
·一文透視“北京智源大會”十大AI熱點
·讓機器人解惑傳道,對話式AI能否為企業帶來巨量的業務
·MLOps:讓AI應用周期從9個月縮短到幾天
·超大規模與輕量化模型,誰會成為AI主流?
·大型機沒有滅亡,反而正成為AI、混合云的寵兒
·向死而生,浴火重生,創新能讓AI芯片新生?
·從蜂擁而上到紛紛退場,AI芯片誰在“裸泳”?
·谷歌微軟阿里華為都愛上大模型,AI開發邊界被打破
在阿爾伯特·愛因斯坦(AlbertEinstein)獲得諾貝爾物理學獎100周年之際,作為現代歷史上最聰明的頭腦和最知名的人物之一,“數字愛因斯坦”重返“人間”。
國外一家公司推出了“數字愛因斯坦”,是同名人物的現實再現,借助對話式AI的力量,普通人可以與他實時互動,參加他的日常測驗,或詢問有關他生活和工作的任何事情。
“客自長安來,還歸長安去,就在這地方,夢開始穿越……”國內首位秦腔領域虛擬人——第九屆中國秦腔藝術節虛擬推薦官秦筱雅亮相,蘊含著秦腔承古開新的精神密碼,可以說就是人格化的秦腔藝術,是秦腔藝術的數字化代言人。
除此之外,像清華虛擬女學霸華智冰,抖音美妝達人柳夜熙,以及抖音名人“Axi”、虛擬女團“A-SOUL”,江蘇衛視2022跨年演唱會的虛擬人“鄧麗君”,湖南衛視全新綜藝《你好,星期六》啟用的數字主持人“小漾”,等等,越來越多的虛擬數字人席卷而來。
“元宇宙”熱度持續抬升,而“虛擬數字人”卻乘機進入了大眾視野。不過,現在市場上越來越多的虛擬數字人不是醫學上使用的有生命體征的人,也不是半機械人和超人類。當然這些虛擬數字人已經在除了元宇宙以外的領域開始大行其道。
哈佛商業評論認為,虛擬數字人通過情感聯系的客戶對品牌的忠誠度提高了4倍,品牌銷售額會提高2倍。
虛擬人處于爆發點,行業迎來機遇期
伴隨著元宇宙的興起,虛擬數字人正越來越頻繁地出現在公共視野,而且借機野蠻生產,大有遍地開花之勢。
從英偉達發布會上虛擬CEO黃仁勛,到美的旗下品牌華凌分別擔任美的數智體驗主理人和潮流設計主理人虛擬偶像凌魂少女·涼然、凌魂少女·暖沁•••
在抖音平臺,一個名叫“Axi”的小女孩沒有臺詞,沒有與用戶互動,反而贏得了50多萬抖音粉絲。能夠互動的女性團體“A-SOUL”獲得了更多的人氣。
在新華社APP上,一個AI復合主播以零錯誤播出了1萬多條新聞,可以實現對日常和突發事件的實時響應,并且看起來越來越像真人了。
騰訊同步推出了一些基于特定場景的虛擬數字人,如平安普惠數字員工、新華社主播“新小微”、航天員“小諍”、3D手語翻譯官“聆語”、故宮博物館導游“福大人”等。
阿里巴巴的虛擬數字人也是為自身業務需求服務。借著北京冬奧會的契機大火了一把的數字人“冬冬”,仍是以直播帶貨為主,契合其老本行——電商業務的需求。
光大銀行虛擬人小智 圖片來源:http://airlpb.com/
目前,虛擬數字人出現在各種服務場合,數字員工、虛擬偶像、虛擬代言人、虛擬主播……虛擬數字人在社交、媒體傳播、營銷、傳統產業等領域的價值正在逐漸顯現。
如果將元宇宙比作一艘駛向未來的宇宙飛船,那么虛擬人就是未來的門票。對于用戶來說,虛擬人是任何進入虛擬世界的人的化身。
可能你聽說過虛擬人、數字人和虛擬數字人,甚至數字替身等概念,不過現在統統被人們成為虛擬數字人,與醫療上的虛擬人等截然不同。
中國人工智能產業發展聯盟總體組和中關村數智人工智能產業聯盟的報告認為,與醫療領域的數字化人體不同,虛擬數字人是指具有數字化外形的虛擬人物。與具備實體的機器人不同,虛擬數字人依賴顯示設備存在。
因此,報告認為,虛擬數字人具備三方面特征:
一是擁有人的外觀,具有特定的相貌、性別和性格等人物特征;
二是擁有人的行為,具有用語言、面部表情和肢體動作表達的能力;
三是擁有人的思想,具有識別外界環境、并能與人交流互動的能力。
更直接一點,虛擬數字人都是計算機圖形學技術(CG)創造出的與人類形象接近的數字化形象,并賦予其特定的人物身份設定。
從這個概念可以發現,要實現虛擬數字人和別人順暢交流,對背后企業的技術要求極高,特別是AI技術。
虛擬數字人系統一般情況下由人物形象、語音生成、動畫生成、音視頻合成顯示、交互等5個模塊構成。
人物形象可分為2D和3D兩大類,又可分為卡通、擬人、寫實、超寫實等不同的風格;語音生成模塊和動畫生成模塊,可分別基于文本生成對應的人物語音,以及與之相匹配的人物動畫;音視頻合成顯示模塊將語音和動畫合成視頻,再顯示給用戶;交互模塊使數字人具備交互功能,即通過語音語義識別等智能技術識別用戶的意圖,并根據用戶當前意圖決定數字人后續的語音和動作,驅動人物開啟下一輪交互。
虛擬人優勢逐漸顯現,逐步滲透各細分賽道。
在金融、醫療等APP的客服界面中,虛擬數字人與真人等需要解答問題的用戶互動,7×24小時持續提供服務······
在企業內部的虛擬數字人,則多是為企業端業務場景量身定制,或者是與旗下智能車載、智能家居、智能交通等智能設備結合,定位是服務型數字助手。
“虛擬人”的普及,可使目前依賴于高IP價值現實人物(如明星)的商業模式中的成本大幅降低,內容產出效率大幅提升。
同時,“虛擬人”也大幅提升了虛擬角色與用戶的交互真實性。技術走向成熟或已經為虛擬人的應用提供了前提條件,而虛擬人自身亦有顯著優勢,使得其應用場景逐步拓寬。
虛擬人并非真人,天然擁有工作不出錯、全天候在線、無負面新聞、可低成本運營等優勢。
虛擬人有更強的用戶交互性,UGC屬性為其內容用戶生產提供可能。
憑借降本增效優勢,虛擬人或將顛覆行業運營模式。
技術突破成為核心驅動力,虛擬人行業煥發生機
技術加速實現升級迭代,顯著的提升了虛擬人賽道的熱度。
虛擬人的發展早期受到技術的制約,后期隨著計算機動畫(CG)和人工智能(AI)等技術的發展,制作過程得到簡化,虛擬人迎來爆發性增長。
受訪的國內頭部人工智能獨角獸企業——云知聲的一位專家認為,技術突破為虛擬人行業發展提供核心驅動力。
計算機圖形學技術CG和AI是虛擬數字人的核心技術,目前都取得比較大的突破。
以AI為例,基于計算機視覺(CV)、自動語音識別技術(ASR)、自然語言理解(NLU)、語音合成技術(TTS)的多模態的人機交互、高逼真的聲音和圖像的合成,都讓虛擬數字人不再是簡單的卡通形象,而是可以感知用戶輸入,比如通過人臉感知用戶靠近,通過語音識別、手勢識別等感知用戶輸入;處理特定領域的任務,如數字人RPA,對于大規模數據進行處理的數字員工;以及以用戶喜歡的方式輸出相應的結果,如采用用戶定制的聲音輸出,甚至可以有“捏臉”方式塑造用戶喜愛的形象。
虛擬人相關技術公司也受資本熱捧,虛擬人賽道熱度提升顯著。進入2021 年下半年以來,虛擬人相關公司融資進程加快,互聯網大廠紛紛入局,為行業帶來資本和技術支持,行業景氣度持續上升。
創建數字人類身份的過程由3個關鍵要素組成:模型創建、動作捕捉和實時圖形。
演員必須佩戴特殊的標記,才能創建其面部的3D模型。他們的面部和身體運動需要由多個攝像機不斷拍攝,這些攝像機將這些動作的每個幀和角度傳輸到負責渲染數字角色的系統。
第一步模型創建。從技術上講,有兩種方法可以創建全新的虛擬身份。如果你想使用動畫卡通人物,你應該從頭開始繪制你的新角色。但是,當涉及到數字人類身份時,您需要從動作捕捉設置開始。
通常它必須是一個高度受控的舞臺,具有多個高分辨率攝像機和受控照明。有可用的軟件可以幫助您僅使用移動設備或筆記本電腦即可獲得類似的結果。當然,使用網絡攝像頭或手機制作的模型無法與在專業工作室中創建的模型相提并論。
當人類面部和身體的數字模型被編譯后,是時候啟動動畫了。
第二步,動作捕捉。對于虛擬化身,模特將由演員的面部動作實時“驅動”。由于3D頭像不依賴于任何特定的人,因此任何演員都可以為數字角色模型的工作奠定基礎。
無論演員是誰,角色將永遠保持自我。要捕捉演員的動作,你需要一件帶有運動傳感器的特殊套裝。
第三步,實時渲染。最后一個要素是實時圖形處理。由于數字素材和逼真的圖形必須實時動畫化,因此您將需要一臺功能強大的計算機和一個特殊的軟件引擎,將演員的動作與頭像的3D模型相結合。
通常可以使用游戲開發人員用于視頻游戲的引擎來完成。唯一的區別是在視頻游戲中,所有角色動作都是預先編寫的,但是對于數字人類,鏡頭必須實時渲染。
目前,市場上的建模工具逐漸增多。
2021年,EpicGames、英偉達分別推出了自己的虛擬人制作工具MetaHuman Creator 和OmniverseAvatar,在保證人像質量的同時提高了虛擬人的制作效率。
Epic的建模工具MetaHumanCreator是一款基于云的應用,可以幫助開發者快速地構建出高保真的虛擬人物形象,極大地加速建模效率,并同時降低了建模成本。
MetaHuman還允許開發者便捷地導出、下載虛擬人文件,以進行后續的開發。使用MetaHuman塑造的人物更加寫實,開發門檻較低,幾乎所有人都可以快速上手。
相比于之前制作虛擬人像所需要的高成本,MetaHuman工具目前對開發者免費開放。
英偉達的實時仿真模擬和協作平臺Omniverse被稱為“工程師的元宇宙”,包括寶馬、愛立信、沃爾沃和Adobe等眾多公司都有采用Omniverse。
OmniverseAvatar旨在幫助開發者通過英偉達的Omniverse平臺創建可以理解真人自然說話意圖的交互式虛擬角色。OminiverseReplicator則是一種用于訓練深度神經網絡的合成數據生成引擎,從而提供創建訓練AI所需的大量數據。
OmniverseAvatar整合了英偉達在語音AI、計算機視覺、自然語言理解、推薦引擎和模擬方面的技術。利用所述平臺創建的虛擬形象是具有光線追蹤3D圖像效果的交互式角色,并能夠看見、說話、談論各種主題,以及合理地理解表達意圖。
值得一提的是,Omniverse同時新增了英偉達早前發布的一系列AR/VR功能。
智能語音技術賦能,虛擬人擁有更強交互能力
伴隨 AI 技術的加速突破和數據積累,虛擬數字人是繼語音助手之后智能語音技術新的應用領域。
虛擬人語音交互的核心在于AI,包括語音識別、語義理解、自然語言處理、語音交互等,強大的AI交互能力是智能語音產品的核心競爭力;而大量數據的積累能有效提升模型表現高度,提升虛擬人的交互體驗。
接受記者采訪的云知聲專家認為,智能語音技術主要是用于虛擬人的交互。智能語音技術主要包括:
第一,前端降噪和定向,主要確保在噪聲環境下也可以取得比較好的識別效果,或者指向特定方向收音,從而確保交互的效果。
第二,喚醒,利用這一技術,用戶可以為虛擬數字人自定義自己傾向的名字,增加喚醒數字人時的親切感和趣味性。
第三,聲紋技術,可以讓數字人傾聽特定人員的聲音,或者區分不同人員的年齡和性別的生物特征,從而更加有專屬感。
第四,語音識別+自然語言理解技術,主要將用戶的聲音轉換成文字,并對文字進行處理,從而理解用戶的意圖,做出正確的應答。
第五,語音合成。用戶可以給出部分樣音,從而讓虛擬人給出的反饋聲音是自己的朋友、戀人、親人等,更加舒適。
面對虛擬數字人的新行業機遇,互聯網公司、AI企業和硬件廠商均入局智能語音賽道。
騰訊、百度、阿里、字節等互聯網巨頭紛紛布局AI技術,入局智能語音領域,并在虛擬人賽道中擁有“To C”的傳統優勢。
憑借在人工智能領域深厚的技術積淀,云知聲、科大訊飛等AI企業在虛擬人領域亦有極強的市場競爭力。
而華為、小米手機等硬件廠商早期在智能語音助手、智能音箱等家居生活場景產品的布局,使得硬件廠商有資本搶灘虛擬人賽道,完善其智能家居場景的搭建。
目前我國AI智能語音行業進入到了技術落地期。國內外的相關企業都紛紛開放語音生態系統,以產業內合作的方式,將語音技術植入產品和或應用于相關業務場景,構建全產業生態鏈廠。
不管人工智能的發展進程如何,國內外的各個廠家均開始從不同維度布局相關的產業鏈。如谷歌打造開發者生態鏈,推出Google Home,試圖建立物聯網時代安卓系統。而蘋果基于智能硬件定標準,定制平臺、積累數據,重視物聯網時代生態控制權。
國內的科技巨頭如百度則是通過開放語音生態系統,以產業合作的方式,將語音技術植入產品和或應用于相關業務場景,構建全產業生態鏈廠。
虛擬數字人開疆拓土,商業化拉開帷幕
虛擬數字人逐漸實現在多場景、多領域的融合、應用、落地。
盡管目前數字人的發展環境、整體情況還處于起步階段,但隨著虛擬數字人技術的精進、市場價值的釋放,將更全面、更深入地融入影視、金融、文旅等各個領域,充分發揮應用價值,迸發巨大的潛力。
從難易程度上看,新聞播報是虛擬人最容易實現應用的業務形式。相對于新聞播報,節目主持需要較強的專業能力和互動效果,且對運營能力要求更高。
同樣簡單易行的是直播帶貨。相對于真人主播,虛擬人主播具備一系列優勢,有望為直播帶貨等帶來新的活力。外表靚麗、風格突出的虛擬人博主AYAYI已經在小紅書上開始帶貨。
依靠背后專業的團隊運作,虛擬人偶像開始活躍在各大平臺,并開始取得良好的“明星”效應。
廣告營銷在業務形態上天然和虛擬人有良好的結合,虛擬人的應用有望提升廣告營銷業務的增長潛力,整體板塊估值有望提升,重點關注處于估值低位且有相關業務布局的公司。
在金融領域,UneeQ為瑞銀設計開發了很多創新解決方案,不僅可以讓專家可以同時在多個地方,而且可以使其看起來很容易。
瑞銀首席經濟學家丹尼爾·卡爾特的數字人類替身可以與客戶會面,以提供獨一無二的數字體驗。也能夠利用瑞銀的財務預測數據,并“面對面”向高財富客戶提供見解。他也可以全天候進行個性化的對話,這是真正的丹尼爾根本做不到。
在影視和傳媒,云知聲主要提供特定人員的聲音復刻服務,針對一些故去的知名人士、用戶指定的聲優,通過他們的影像留聲,提取樣音,訓練語音合成引擎,從而實現聲音復刻。
在金融、文旅方面,云知聲主要是提供完整虛擬數字人解決方案,完成具備企業或者城市形象的虛擬數字人的整體輸出,并提供虛擬數字人背后一整套的多模態交互技術。
IBM最近發布的WatsonAssistant,是IBMCloud上的一項服務,可以幫助任何人構建和部署虛擬助手。IBM的人工智能技術允許用戶對虛擬助手進行編程,遠遠超出一般的聊天機器人。
像起亞這樣的公司已經開始在汽車商店中使用IBM的技術和數字人類。ANZ、Sony、P&G、蘇格蘭皇家銀行和梅賽德奔馳等品牌已經將AI數字人類作為其客戶服務的一部分。
市場普遍認為,虛擬數字人行業正處在爆發期,虛擬人正受到越來越多人的歡迎。
受益于技術進步帶來的應用場景開拓和虛擬人的多維度優勢,虛擬人行業開始步入成長階段,目前市場仍處于前期培育階段。根據量子位報告的測算,中國虛擬人行業有望在2030年超過2700億元的整體市場規模。
根據Statista2022年1月進行的一項關于虛擬人類普及的調查,大約68.5%的中國互聯網用戶認為,虛擬人的外表或聲音是吸引他們注意虛擬角色的關鍵,被創意作品所吸引的用戶也達到了47.8%。廣告在提高虛擬人的受歡迎程度方面也發揮了作用,占比大約16.5%。
中國互聯網用戶對虛擬人類感興趣的原因 資料來源:Statista
接受記者采訪的云知聲的專家認為,從技術和需求兩個方面都讓虛擬數字人行業處于成長期。
一方面,隨著終端和云端計算能力的快速增長,以及AI技術自身的不斷完善,在之前無法實現流暢和逼真效果的虛擬數字人變得可行了。
另一方面,用戶也希望有更多具象化的虛擬形象,從而讓體驗得到提升。
虛擬數字人是元宇宙一個比較重要的分支方向,甚至有可能成為主要的方向之一。
目前虛擬數字人面臨的主要挑戰是單個數字人定制成本比較高,周期也比較長,快速大規模應用還有一定的成本門檻。
未來,隨著CG和AI技術發展,特別是智能語音技術的發展,大規模降低成本,提升效率,從而讓虛擬數字人快速走向ToB和ToC的市場。
科技媒體·企業演化科學·戰略托管綜合體
本文作者系趙滿滿
本文來自微信公眾號“中智觀察”(ID:Hapiweb-soft6),作者:海比研究院,36氪經授權發布。