大廠大模型,強(qiáng)在哪?
今年以來,中國科技公司掀起“百模大戰(zhàn)”,大廠、創(chuàng)業(yè)公司都發(fā)布了自己的AI大模型。
大模型越來越多,有閉源有開源,有通用也有垂直;企業(yè)做大模型的策略也不盡相同,有的堅持從底座做起,有的在開源架構(gòu)之上抄近道。
不過,雖然路徑有差異,但有一點逐漸成為行業(yè)共識——大模型要落地,得從產(chǎn)業(yè)開始。B端的使用效果,成為評價一個大模型靠不靠譜的重要指標(biāo)。
做出一個大模型不難,難的是讓大模型具備產(chǎn)業(yè)價值,在應(yīng)用的時候穩(wěn)定、安全、易用。
對于To B企業(yè)而言,面對如此眾多的大模型產(chǎn)品,該如何選擇?
短短半年時間,大模型創(chuàng)業(yè)就經(jīng)歷了共識之變。
年初,很多人認(rèn)為,通用大模型是未來。大家看到GPT3.5大模型強(qiáng)大的泛化能力,感到非常興奮,認(rèn)為大模型似乎可以解決一切問題。
這里簡單科普一下,大模型分為兩類,一類是通用大模型,可以聊天、問答、通用數(shù)理計算等,另一類是垂直大模型或行業(yè)大模型,面向產(chǎn)業(yè),突出應(yīng)用,強(qiáng)調(diào)降本增效的作用。
有創(chuàng)業(yè)公司基于開源的大模型,快速做出了一些有意思的產(chǎn)品,AI繪畫、AI寫作、AI數(shù)字人等火爆。
然而沒過多久大家發(fā)現(xiàn),做出類似產(chǎn)品的門檻不高。受制于算力的稀缺性,很難將大模型包裝成類似微信這種大范圍使用的付費C端產(chǎn)品。而大模型訓(xùn)練的成本很高,部分參數(shù)量很大的大模型,訓(xùn)練一次動輒耗資數(shù)千萬。
盲目燒錢不可持續(xù),如何讓大模型在產(chǎn)業(yè)里發(fā)揮作用,產(chǎn)生價值,成為很多大廠考慮的問題。
百度就發(fā)現(xiàn),文心一言發(fā)布后,一開始來交流的企業(yè)都是CEO級別的人出面,后來大多是技術(shù)負(fù)責(zé)人或業(yè)務(wù)負(fù)責(zé)人。字節(jié)跳動發(fā)現(xiàn),來找火山引擎的企業(yè),四五月份都是模型廠商,需求是訓(xùn)練模型,現(xiàn)在是一些行業(yè)客戶,希望在營銷、客服等場景落地。
從玩具到工具,落地才是王道。所以我們看到,近期國內(nèi)科技公司新發(fā)布的大模型,大多都面向垂類產(chǎn)業(yè)落地。而垂直行業(yè)里的企業(yè)們,都有很強(qiáng)的降本增效的需求。
這導(dǎo)致一個結(jié)果,全球的基礎(chǔ)大模型,現(xiàn)階段都主要面向To B行業(yè)市場。
To B客戶在選擇大模型產(chǎn)品時,應(yīng)該重點考察哪些方面?
首先,有沒有“云”很重要。
這波AI 2.0浪潮,很多能力都是建立在云平臺之上。通過云平臺輸出模型能力,支撐更多應(yīng)用生長,是一套比較高級的打法。
大模型離不開云廠商。國內(nèi)現(xiàn)在跑的最快的大模型公司,如百度、阿里,都有自己的云業(yè)務(wù)。而在它們公司內(nèi)部,云部門也是沖在最前面。
這是大廠跟創(chuàng)業(yè)公司非常大的一個區(qū)別,即便是OpenAI,也要借助微軟云平臺Azure。而微軟也借此實現(xiàn)了對OpenAI更強(qiáng)的控制,成為其獨家云廠商。
一些在算法上實力不弱的創(chuàng)業(yè)公司,也許能在很短時間內(nèi),基于開源代碼開發(fā)出自己的大模型,但它們沒有自己的云底座,必須得找云廠商合作,后期在系統(tǒng)部署、數(shù)據(jù)歸屬、利益分成方面,難免存在隱患。
其次,要看有沒有“生態(tài)”。
大模型創(chuàng)業(yè)的生態(tài)分為四層——芯片層、框架層、模型層、應(yīng)用層。其中芯片層+框架層是基礎(chǔ)設(shè)施,企業(yè)的進(jìn)入門檻最高;模型層對算力、算法、數(shù)據(jù)、人才的要求非常高;應(yīng)用層是基于前兩類大模型,調(diào)用API開發(fā)應(yīng)用。
所有的玩家都要在這四大層級里站位,縱向覆蓋的層級越多,競爭壁壘越深厚。
中國的科技公司在布局時,尤其是BAT這樣的超級巨頭,往往會交叉覆蓋四大層級。基礎(chǔ)打法是先發(fā)布通用大模型或者行業(yè)大模型底座,其他公司再基于這些基礎(chǔ)模型,結(jié)合自身擁有的行業(yè)數(shù)據(jù),微調(diào)出自己的大模型應(yīng)用。
最后,服務(wù)體驗也不能忽視。
企業(yè)客戶在選擇大模型時,不能只看中技術(shù)實力,是否懂行,能否保證交付,運(yùn)維有沒有長期保障,同等重要。
以上這三個方面,將決定哪些公司的大模型產(chǎn)品,更能獲得客戶青睞。
綜合來看,大廠的優(yōu)勢明顯。
業(yè)界普遍認(rèn)為,百度、阿里、華為是綜合實力排名靠前的玩家。
就像當(dāng)年的云計算市場一樣,底層算力和平臺能力可以構(gòu)建壁壘,市場需要算力強(qiáng)悍、模型全面的服務(wù)商。那些在算力、平臺、模型、應(yīng)用方面都有布局的大廠,對企業(yè)客戶具備更強(qiáng)吸引力。
百度、華為,除了自研大模型產(chǎn)品,還完成了從芯片到應(yīng)用的布局。百度是“昆侖芯+飛槳平臺+文心大模型”,華為是“昇騰芯片+MindSpore框架+盤古大模型”,這是其他公司在短期內(nèi)很難追上的優(yōu)勢。
也是基于這些優(yōu)勢,大廠一方面在技術(shù)上做到了領(lǐng)先,另一方面在服務(wù)客戶上更接地氣。
比如百度,百度是國內(nèi)第一個推出類ChatGPT產(chǎn)品,開放內(nèi)測,硬剛ChatGPT的公司。在SuperCLUE中文大模型7月最新榜單中,百度的大語言模型產(chǎn)品文心一言,以62分的總成績超過了GPT-3.5-turbo和ChatGLM-130B。IDC最新發(fā)布的《AI大模型技術(shù)能力評估報告,2023》中,百度文心大模型3.5拿下12項指標(biāo)中的7個滿分,綜合評分第一。
現(xiàn)在,國內(nèi)的大模型廠商,都在積極拓展ToB業(yè)務(wù)。百度的文心千帆,是全球首個一站式企業(yè)級大模型平臺,可以為企業(yè)提供從數(shù)據(jù)處理、模型訓(xùn)練、模型部署到模型運(yùn)維等全流程的大模型服務(wù)。
因為有完善的工具鏈,配套更豐富,文心千帆在為客戶提供服務(wù)時,能更全面、更易用、更安全。這大大降低了企業(yè)開發(fā)大模型的門檻,基本接近“開箱即用”的效果。
拋開這些硬實力,在軟實力方面,大廠的優(yōu)勢也很明顯。無論是資金儲備、人才厚度,還是產(chǎn)業(yè)洞察、數(shù)據(jù)積累,都非創(chuàng)業(yè)公司所能比。大廠過去十幾年的經(jīng)驗,在持續(xù)構(gòu)建競爭壁壘。
尤其是在垂直行業(yè)資源方面,大廠布局很深。百度一口氣推出十多個行業(yè)大模型,華為推出礦山大模型、實時預(yù)測全球海浪的大模型,以及京東面向零售、金融、城市、健康和物流領(lǐng)域提供行業(yè)解決方案,都體現(xiàn)出大廠已經(jīng)在“用大模型賦能千行百業(yè)”。
這場AI大模型的長跑,不同背景的玩家,并不是站在同一個起跑線上。
具備資金儲備、生態(tài)能力、產(chǎn)業(yè)洞察、戰(zhàn)略意志的實力玩家,最有可能率先到達(dá)終點。
本文來自「定焦One」,36氪經(jīng)授權(quán)發(fā)布。
