AIGC主流玩家一覽:國內外最值得關注的AIGC機構
量子位智庫 發自 凹非寺量子位 | 公眾號 QbitAI
2022年,效果驚人的Disco Diffusion、Midjourney、DALL·E2和Imagen AI,讓大眾切身體會到了AI在圖像生成上的驚人表現。
而這只是AIGC(AI內容生成)的一個縮影。
除了圖像,如今的AI在文本、音樂、視頻、甚至策略生成上都有了顯著的突破,相關成果不斷出現。
量子位智庫在此基礎之上梳理了AIGC相關技術場景及成熟度分類:
我們認為,隨著標注數據累積、技術架構完善、內容行業對豐富度/事實性/個性化的要求越來越高,AIGC行業即將被推向前臺。
在未來2-3年間,AIGC的初創公司和商業落地案例將持續增加。
△圖:AIGC業務場景分析
△ 圖:我國現有AIGC產業鏈劃分
那么,國內目前有哪些AIGC相關機構值得關注?他們各自進展如何?
在國外,又有哪些高潛力場景與商業模式可供借鑒?
1、小冰公司
成立時間及融資輪次:
2020年A輪(估值已達10億美元獨角獸,高瓴領投)
主營方向:
小冰是全球領先的人工智能科技公司,旗下小冰框架是全球承載交互量最大的完備人工智能框架之一,在開放域對話、多模態交互、超級自然語 音、神經網絡渲染及內容生成領域居于全球領先。
AIGC相關亮點:
作為“AI being”派虛擬人。小冰的產品始終是人+交互+內容。具體包括虛擬人(夏語冰等somebody instance、虛擬男友等nobody instance和國家隊人工智能裁判與教練系統觀君等在垂直場景中工作的虛擬人類)、音頻生成(主攻超級語言及歌聲,在線歌曲生成平臺與歌手 歌聲合成軟件X studio)、視覺創造(畢業作品集《或然世界》、為國家紡織品開發中心、萬事利等數百家機構提供了圖案和紋樣設計)、文本創造(2017年即推出小冰詩集)、虛擬社交、Game AI(Xiaoice Game Studio)等。
商業客戶已覆蓋金融、智能車機、零售、體育、紡織、地產、文旅等十多個垂直領域,并提出了以“人力”的邏輯去進行商業報價的虛擬人商業模式。
2、DeepMusic(靈動音科技)
成立時間及融資輪次:
2018年A輪(TME領投,單輪融資數千萬人民幣)
主營方向:
公司致力于運用AI技術從作詞、作曲、編曲、演唱、混音等方面全方位降低音樂創作及制作門檻,為音樂行業提供新的產品體驗,提升效率。
AIGC相關亮點:
產品包括針對視頻生成配樂的配樂貓、支持非音樂專業人員創作的口袋音樂、可AI生成歌詞的 LYRICA、AI作曲軟件LAZYCOMPOSER。目前已與國內多家音樂平臺廠商達成合作。其音樂標注團隊已形成了全球最精確的話語歌曲音樂信息庫。
3、倒映有聲
成立時間及融資輪次:
2019年Pre-A輪(中文在線投資,單輪融資千萬人民幣級)
主營方向:
一家以技術為核心的創新型公司和無人驅動數字分身技術解決方案供應商,通過自研神經渲染引擎和TTSA技術,實現基于文本實時生成高質量語音(音頻)和動畫(視頻)。
AIGC相關亮點:
倒映有聲將其虛擬人的高自然度歸結于神經渲染(Neural Rendering)、TTSA(基于文本和語音合成實時生成音頻和視頻)、ETTS(富情感語音合成)、Digital Twin。通過神經渲染技術快速構建AI數字分身,通過語音+圖像生成技術,生成和驅動數字分身的唇形、表情、動作、肢體姿態,創造表情自然、動作流暢、語音充滿情感的高擬真度數字分身IP。2021年3月倒映有聲和中央廣播電視總臺音頻客戶端「云聽」簽署戰略合作協議。
4、rct AI
成立時間及融資輪次:
2018年A3輪(元宇宙資本和Springwind Ventures領投,單輪融資額超千萬美元)
主營方向:
rct AI致力于運用人工智能為游戲行業提供完整的解決方案,并利用人工智能生成內容(AIGC)創造真正的Metaverse。通過使用最前沿的技術,特別是深度學習和強化學習,rct AI為消費者和制作方提供真正動態且智能的用戶體驗。
AIGC相關亮點:
通過簡單設計并調整不同的參數,rct AI的混沌球(Chaos Box)算法可以在游戲中大規模地輕松生成具有智能意識的虛擬角色。他們的行為和對話不會重復,皆為動態生成。在游戲場景中,部署具有不同性格的智能 NPC,通過對話、行為等動態交互,增加玩家的游戲時長,同時提供新的變現途徑。具體包括性格化NPC、對抗式 AI、互動式AI、大規模智能 NPC 部署、智能留存及智能運營策略等。
目前,rct AI已憑借核心技術Chaos Box幫助了10余家企業,完成包括對戰游戲、虛擬人鑄造等多種類型的項目,與世界范圍內 20+ 游戲廠商建立了深入合作,觸達超過 2 億用戶。
5、超參數
成立時間及融資輪次:
2019年B輪(紅杉中國領投,估值已達10億獨角獸,單輪融資1億美元)
主營方向:
超參數科技是一家專注于AI領域的科技公司,致力于「打造有生命的AI」,創造一個10億人與100億AI共同生活的虛擬世界。超參數圍繞L1-L4技術路徑打造極致的AI Bot,逐步為廣泛用戶帶來全新的虛擬世界體驗。
AIGC相關亮點:
超參數科技提供的AI bot支持玩家陪玩(3D生存游戲AI獵戶座α)、多人團隊競技(球球大作戰)、非完美信息博弈AI(斗地主、德撲、麻將等)等。自有游戲AI平臺“Delta”采用全新的“AI+游戲”研發管線,為開發側和體驗側兩端帶來范式創新。
目前,超參數AI Bot已在多款千萬日活的產品中上線,每日在線數峰值將近百萬,業內率先實現在3D FPS領域的大規模商業化落地。
6、影譜科技
成立時間及融資輪次:
2018年D輪(單輪融資13.6億元,商湯科技領投)
主營方向:
影譜科技以人工智能視覺技術產業化為主要目標,是國內領先的智能影像生產技術提供商及應用方案提供商。公司專注于視覺內容的生產效率與呈現交互方式的技術研究,通過ACM(影像商業化引擎)、AGC(影像工業化引擎)和ADT(數字孿生引擎)三大引擎,面向媒體、文化、科教等多行業領域提供一站式的智能解決方案。
AIGC相關亮點:
在視頻生成相關領域支持結構化視覺分析、影像自動合成技術(將視頻短片、圖片、音軌等按照規定效果批量化自動拼接)、智能視頻編輯(基于視頻中多模態信息的特征融合進行學習,按照氛圍、情緒等高級語義限定,對滿足條件片段進行檢測并合成)、視頻內容生產(對視頻中的鏡頭、元素和場景采用不同的生成方式,同時對組件的組合方式進行學習,實現視頻的自動化生產)、行為動作分析、場景信息恢復、跨模態轉換等。
7、騰訊AI Lab
AIGC相關亮點:
除去業內首個AI驅動的多模態虛擬人“艾靈”外,以“絕悟”為代表,騰訊AI Lab基于自己的多模態學習及生成能力在游戲領域進行了全流程的布局。
「絕悟」AI通過強化學習的方法來模仿真實玩家,包括發育、運營、協作等指標類別,以及每分鐘手速、技能釋放頻率、命中率、擊殺數等具體 參數,讓AI更接近正式服玩家真實表現,將測試的總體準確性提升到95%。
目前騰訊絕悟在環境觀測、圖像信息處理、探索效率等方面的創新算法已經突破了可用英雄限制(英雄池數量從40增為100 ),讓 AI 完全掌握 所有英雄的所有技能并達到職業電競水平,能應對高達10的15次方的英雄組合數變化。
基于絕悟,王者榮耀的數值平衡性偏差已經從1.05%下降到0.68%,其所涉及的“多智能體”決策過程中,可以在高達 10 的 20000 次方種操作可能性的復雜環境中進行決策。
目前,騰訊AI Lab還與騰訊 AI Lab 還與王者榮耀聯合推出了AI開放研究平臺「開悟」,并積極舉辦相關賽事。
……
除此之外,其他相關機構還包括:微軟亞洲研究院(可支持圖像變為動態、文本生成視頻、文本生成圖像、圖像補全、圖像生成的NUWA-Infinity,可參考https://www.qbitai.com/2022/07/36275.html)、阿里巴巴(阿里巴巴智能設計實驗室,如虛擬模特塔璣及AI視覺物料生成系統阿里鹿班)、百度(百度云虛擬人及中文作畫AI文心·一格,可參考https://www.qbitai.com/2022/08/37097.html)、特贊(內容智能生成板塊)。
1、Zyro :圍繞垂直業務場景,結合業務knowhow 組織相關AIGC能力
圍繞電商場景,通過AIGC生成網站搭建過程中所需的各類素材,具體業務包括針對性生成公司介紹、企業價值、Slogan、自動提升圖片清晰度、自動生成logo等。
國內類似的公司包括聆心智能。基于多模態對話生成系統,該公司專注于針對精神心理的AI驅動的高質量數字療法,讓AI圍繞認知、情緒和行為三個維度對用戶進行評估和干預,生成千人千面的情緒治療方案,目前已與北醫六院、湘雅二院、中日友好醫院、清華大學玉泉醫院等達成合作。
2、NVIDIA:構建技術矩陣,使其最終服務于創作型工具平臺
在視覺生成研究領域始終位于前沿,代表作品包括CycleGAN、GauGAN、EditGAN、GANverse3D、Instant NeRF等。
3、OpenAI:將其底層模型對外開放商用,開創基礎設施型的商業模式
GPT-3目前已經開始對外提供API,并分為四種模型按照用量對外收費。
4、Gliacloud:拼湊式視頻生成代表
輸入文本鏈接,軟件能夠自動對其中的標題和文字進行區分表示,并根據不同層級自動匹配素材和文字的轉場、格式等,進而形成說明式的視頻。據公開數據,該方式能夠增加10倍的視頻產量。
類似公司包括:Gliacloud、Synths.video、lumen5、Pencil。
5、Rosebud.ai:可結合營銷數據生成無版權糾紛的圖像
Rosebud.ai能夠生成非真實的人臉圖像,并在該圖像中匹配相關衣物等所需素材。此外,模型面孔可以根據對應受眾的相關數據進行調整。該公司聲稱,其生成模型能夠使活動點擊率提升22%。
類似公司包括:Generated Photos。
6、Persado:結合精準用戶畫像,實現個性化文本營銷
Persado的平臺將營銷創意分解為六個關鍵要素:敘事、情感、描述、號召性用語、格式和文字定位。通過組合各類元素,該平臺能夠為每位客戶確定交流的個性化措辭。該平臺已被多家公司用于促銷電子郵件、社交媒體廣告、 店內展示橫幅甚至廣播內容等,以提高品牌參與度和轉化率。
類似公司還包括Anyword、Phrasee、Persado、Pencil、Copy.ai、 Friday.ai、Retresco、Writesonic、 Conversion.ai、 Snazzy AI、Rasa.io、LongShot.AI。
關于量子位智庫:
量子位旗下科技創新產業鏈接平臺。致力于提供前沿科技和技術創新領域產學研體系化研究。面向前沿AI&計算機、生物計算、量子技術及健康醫療等領域最新技術創新進展,提供系統化報告和認知。通過媒體、社群和線下活動,幫助決策者更早掌握創新風向。
本文來自微信公眾號“量子位”(ID:QbitAI),36氪經授權發布。