人工智能公司當然是有“硬科技”的
作者|桑明強
和過去的消費互聯網類似,近幾年人工智能行業多少有點到了分水嶺的意味。一方面,不同場景的解決方案有所區隔,讓標準化這件事門檻變高;另一方面,Gartner雖然在《2021年AI成熟度曲線》提及機器學習、邊緣AI、決策智能在內的創新會對市場產生變革性的影響,但短期內想突破這些技術桎梏并非易事。
在這種形勢下,“拐點在哪”以及“如何破局”成了一眾玩家正在思考的關鍵命題。盡管AI業態延展的不確定性在加劇,但數字經濟和數字化這件事已經成為業界共識,從AI明星企業的崛起,到新基建、東數西算的戰略實施,如果說前者是二級市場的正向反饋,那么后者就是產業級的框架搭建。
一直以來,人工智能被視為幫助人類突破科學技術進步認知障礙和認知邊界的一個重要工具,這些年逐漸從幕后走向臺前,以微軟為代表的“智慧的工具”、特斯拉為代表的“聰明的車”,包括扎克伯格所押注的“元宇宙”,均掀起了行業級的變革浪潮。按照AI的三要素(數據、算法、算力)來劃分,如果說過去是數據和算法的繁榮時期,那么現在顯然是算力發展的黃金年代。
根據中國信通院測算:2021年,算力核心產業規模已經超過1.5萬億元,其中云計算市場規模超過3000億元,IDC(互聯網數據中心)服務市場規模超過1500億元,人工智能核心產業規模超過4000億元,算力產業支柱作用愈發凸顯。
通俗來說算力就是計算能力,指的是數據的處理能力,小到手機筆記本,大到超級計算機,算力存在于各種智能硬件設備中,過安檢時的每一次人臉識別、發消息時的每一次語音文字轉化,都需要硬件芯片的算力支持。可以這么說,算力的大小就代表著對數字化信息處理能力的強弱,也是衡量一家AI公司含金量的關鍵指標。
最近兩年,大算力的確定性,一定程度上撥開了AI行業的云霧。國際上很多科技公司包括谷歌、特斯拉、Facebook等,不惜斥巨資建設人工智能計算中心,國內的很多政府和企業也躬身入局、建設新一代人工智能基礎設施。但也有觀點對此持嚴謹態度,在剛剛結束2022中國算力大會上,商湯科技聯合創始人、AI大裝置事業群總裁楊帆認為,“當我們在談算力的時候,必須要想好算力到底能給我們帶來什么價值。”
從過去業務層面的生存抉擇、疲于追趕,到現在基礎科學的底層創新與博弈,很明顯,國內的AI行業和玩家們正站在一個歷史新拐點上,一場新的角逐也才剛剛開始。
我們常說當今世界正經歷百年未有之大變局,體現在數字經濟上,就是以數字技術核心驅動力的新一輪科技革命和產業變革正深刻影響著經濟增長路徑和生產力發展方向。這是一個值得重視的現象和深入研究的命題,前些日子任正非就曾指出:大算力時代已經到來,我們正在轉彎,我們要理解并參與到這個時代的改變。
過去這些年,國內的算力產業發展速度非常快,且與當前的數字化發展基本保持一致。根據中國信通院院長余曉輝給出的一組數據,近5年中國算力產業規模平均增速超過30%;無獨有偶,根據此前OpenAI發布的一項研究表明,AI訓練中使用的計算能力每3到4個月就會翻一番。只不過,人們沒有料到的是,芯片的算力會有到達極限的一天,也沒有想到芯片算力極限會來得這么快。
此前麻省理工學院的研究人員就曾發出過算力警告——深度學習正在逼近計算極限,這也是當下算力產業的痛點所在,即產業下游對AI算法和應用場景的需求愈發多樣,給上游軟件設計和芯片硬件架構的協同提出了挑戰。通俗的講,算力是智能時代的新生產力,這點毋庸置疑,但問題出現在對“生產力”的利用率維度上,因為大家不知道的是,算力有多重要,它就有多昂貴。
早在1961年,算力被定義之初,美國約翰·麥卡錫教授就曾提出過算力應該像水、電資源一樣隨用隨取的設想,類似于當今的云計算,把算力進行基礎設施化,但遺憾的是,時至今日,這個設想依舊面臨著很多核心技術挑戰。舉個簡單的例子,眼下的很多AI芯片核心是利用乘加計算陣列來實現卷積神經網絡中最主要的卷積運算的加速,但MAC陣列的大量運算會造成功耗的增加,所以如何達到優異的性能功耗比一直是AI芯片研發的關鍵目標。
但這并不是沒有解法的,國內一些AI玩家也嘗試給出自己的解題思路,甚至在某些方面走在了國際前面。以SenseCore商湯AI大裝置為例,它是商湯前瞻性打造的新型人工智能基礎設施,它以商湯AIDC(新型人工智能算力中心)為基座,將深度學習平臺和模型層有機整合,讓算力能被更好的解耦、利用的同時,也實現了批量的算法模型生產、部署和迭代升級。
換句話說,大算力的問題不僅僅是技術問題,也是成本問題。業界曾有人作過一個比較形象的比喻:如果把GPU比作是大巴車,AI的計算任務就相當于旅游團,在傳統的算力分配模式中,無論計算量大還是小,都會占用一個硬件單元,就像小團體出游,卻包了整個大巴,這無疑是一種資源浪費。
這其實也是如今人工智能行業的一個關鍵矛盾——技術成本和商業化的不匹配。如果AI解決一個問題,自身所花費的成本和代價,遠比解決這件事帶來的好處要大,那這件事就要認真思考,因為歸根結底,算力也好,算法也罷,初衷是為了能更好地解決問題,實現相對正向的商業化結果。
如前文所述,時下大算力的一個關鍵命題是如何解決長尾需求,但在實際的應用場景中,從算力到終端需求的鏈條很長,其中包括了算力硬件、算力調度管理軟件、能力平臺軟件、場景解決方案服務,每個關鍵環節之間是上下游串聯的關系,任何一個環節的缺失都會影響到最終算力落地應用的效果。
這是智能時代給算力提出的最高挑戰,因為智能的本質是對數據的深度加工與精煉,依賴算力、算法將數據訓練成模型,進而實現包括通用人工智能、可解釋人工智能甚至是類腦智能等在內的智能建模,最終形成以大模型為代表的智能時代,這也是“風投女王”徐新口中的AI時代三要素:一個好的解決方案必須做到算力、算法和數據的象限聚焦。
我們還是以比較典型的商湯科技為例,它對大算力的投入是很篤定的,據悉,在上海臨港,商湯興建的人工智能計算中心AIDC今年開始投運,擁有3740P的峰值算力,同時也是當前亞洲最大的人工智能計算中心之一。在商湯方面看來,現在的任務是,在搞清楚未來的AI對算力、數據、算法需求空間的同時,還要清楚自己的定位:當有了更好的AI基礎設施后,到底能給各個行業的用戶和客戶,創造什么樣的價值。
在2022中國算力大會商湯人工智能基礎設施創新論壇上,由淄博市政府牽頭的中國北方AI算力創新中心正式宣布啟動
在商湯科技聯合創始人、CEO徐立看來,“AI大裝置的本質是讓AI落地擺脫人力密集的狀態。”他認為AI之所以人力密集,是因為生產效率不高,而生產效率提升的關鍵,是生產要素的成本得足夠低,按照徐立的“機器猜想”,靠人腦的方式可能永遠趕不上宇宙膨脹的速度,如果要真正解開宇宙真理,可以試著用更大的數據,更強的算力,或許還會撞出更多預期之外的結果。
以智慧城市為例,今天整個城市級的服務和綜合治理,可以通過大量的視頻處理和分析,更加自動化的完成,當然,同時也意味著需要更好的AI基礎設施和更好的算力支持。目前,AIDC在山東也落地了諸多產業應用,包括智慧園區、智能遙感、智慧醫療、智慧教育等,基于商湯AI算力創新中心這一城市級產業算力底座,讓“智都”這張淄博的新名片也慢慢浮出水面。
某種程度上,“商湯模式”并不復雜,其實就是構建產業級生態的方式和邏輯,即以AI算力創新中心為支點,支持中心城市及周邊地區企業落地AI服務,從而形成發散式的產業鏈結構,雖然很多方面還有待驗證,但它也為國內AI行業趟出了一個可行的樣本。
這很容易讓我聯想到《云網融合:算力時代的數字信息基礎設施》這本書,作者李正茂曾在書中作過一個比較形象的說明:如果說互聯網是智能時代1.0,算力網是智能時代2.0,模型網是智能時代3.0,那么從信息的角度來看,電信網解決了數據聯網,互聯網解決了信息聯網,算力網將解決云聯網,模型網將解決算法聯網,這樣才能徹底完成信息的基礎設施化。
有這么一種說法,當電力成為基礎設施或者說成為工業時代的主要驅動力的時候,人類才算真正地踏進電汽時代,同理到算力時代,盡管今天的互聯網和算力的滲透已經無處不在,但還遠遠不夠,我們必須得承認現在的人工智能,充其量只能說是算力黃金時代到來前的第一槍。
隨著深度學習網絡模型越來越通用,參數規模越來越大,它對算力的需求,在過去幾年也翻了大約50萬倍,平均下來每年十幾倍的增速,甚至超過了對算法精度增長的需求。另外,行業中也開始出現越來越多的長尾細分需求,雖然這些應用頻次較低,但是一旦出現會發生不可逆的影響,產業巨大的商業價值,也就是說,這張“算力地圖”上還有很多黃金等待挖掘。
回到一開始的討論的話題,怎么去理解大算力才是檢驗人工智能的關鍵指標,其實這里包含了2層意思:1、大算力當下要解決的,是“場景升級”邏輯,而不是互聯網口中的“顛覆”邏輯,所以需要扎根到最底層的場景需求中去,做到“因地制宜”;2、大算力的根本目的是大幅降低人工智能生產要素的成本,同時也是最難的點,就像物流領域的“最后一公里”難題,它是必須要跨過去的一道坎。
本文來自微信公眾號“新眸”(ID:xinmouls),作者:桑明強,36氪經授權發布。