15年前的3篇論文,變成了萬億大生意
文 | Rickzhang
輪值主編 | 君莫笑值班編輯 | 玉茹
第 5786 篇深度好文:5860 字 | 12 分鐘閱讀
如果能再來一次,也許多倫多大學的杰弗里·辛頓教授不會在2006年,對外發布自己的那三篇關于深度學習的論文。
因為他沒想到的是,僅僅一個源自實驗室未被證明的設想,現在已經變成了超過數千億美元的大生意。
尤其在中國。
根據不完全統計,中美之間每年超過2000億的芯片進口中,這兩年用于人工智能的GPU芯片占比以超過10%的增速逐年提升。
當然,這句話也可換個角度理解。
從2012年開始,深度學習技術的發現和后續應用,讓語音識別準確率一年的提升比過去15年的提升總和還要多;同時,圖像識別以圖搜圖的準確率從20%提升到了80%。
關鍵,這些技術在中國國內都有著全球最大的應用市場。而從智慧城市管理開始的政府需求,也助推深度學習技術在不計成本的投入下正以“光速”奔跑。
根據中國信息通信研究院數據顯示,2017年中國人工智能市場規模達到217億元,2020年已經超過700億元,年度復合增長率大于50%。
正因此,這兩年全球的AI市場熱點,中國的獨角獸企業都在不遺余力追逐。這樣的背景下,AI在中國的發展一日千里,并越來越跟基礎的學科與細節應用相結合,出現了大眾化和普及化的趨勢。
一、為什么AI架構師會出現?
“一般的人很難想象,AI在現在的信息系統中已經發展到了什么樣的情況”,作為蘇州BioX生命智能產業研究院人工智能部門經理,王建峰說,與大眾對AI的認知還處在非常高端應用領域不同,當下深度學習,尤其是針對圖像優化和邏輯思維的AI應用,已經廣泛普及到了生產領域的各個方面。
這在中國是一個必然的發展趨勢。畢竟,國家層面大力投資AI系統以及其他人工智能領域,是政府需求引爆的。
2006年前后,國內各個城市都在逐漸推進交通攝像頭網絡的搭建,目的是建設無人交通管理體系。
為了不漏拍,幾乎是每張照片內容都會被保存。可是在運營過程中,各個城市交管部門發現,影像數量急劇增加,每年在云存儲上都要進行巨額投入。
因此,地方交管部門迫切需要一個能在攝像頭就進行判斷的技術,讓攝像頭只拍違法事件。之后,又衍生出車牌識別、人臉識別等方面的應用需求。
正因為這樣龐大的需求存在,才迫使中國的AI企業迅速成長,也才有了各大廠都在推動的數字城市操作系統。
王建峰說,深度學習理論引出的圖像優化和識別相應的技術在城市管理方面,現在已經收獲了非常好的效果、大大提升了效率;同樣的技術延伸到醫療相應圖片的判別上,也應該有著相應的能力。“我們的項目,實際上就是幫助醫生在醫學相應圖片的判斷上做出更好的決策。”
而正是由于AI圖片處理和識別技術已經應用在很多場景,因此公司判斷這種技術,延伸到醫療圖像處理領域就順理成章,這是整個公司對于這個技術研發立項的前提。
當然,這不是首次將AI技術運用于醫療圖片處理和識別。
在國外,谷歌、微軟都在做類似的一些技術。而國內龐大的病歷,以及海量的醫生對醫療圖片處理需求,成為公司下決心推出這種技術的背景。
這也是醫療領域信息化需要解決的一個非常大的痛點。
畢竟傳統醫學中,對于CT X光等醫療圖片進行研判,要依靠醫生長期積累下來的經驗,不僅耗人,更耗時。但通過深度學習技術,教會計算機正確的識別醫療圖片所反映出的病癥問題,醫生在做診斷決策的時候,就有了更多二次判斷審核的時間和空間。無疑,這會減少對于病人病情誤判的幾率。
這樣看似在其他行業已經應用的AI技術,卻讓王建峰和他的團隊遇到了大麻煩。
“我們團隊當時組建的時候,擁有著接觸過AI算法,甚至很有經驗的一批工程師”,王建峰說,這樣的情況卻并沒有對整個系統的研發起到促進作用,團隊被很多重復的算法疊加以及邏輯梳理的工作困住了。
原因很簡單。
因為不熟悉真實醫療領域的各種工作流程,整個技術團隊無法站在醫生的角度考慮問題,因此技術在實現過程中走了很多的彎路,而且代碼越弄越復雜。
再加上之前希望能利用一套系統解決所有的問題,因此在不停地給系統增加學習的樣本,但系統由于無序的知識灌輸所產生的學習效果也非常不到位。
實際上,傳統業務受限于數據的獲取以及處理效率,訓練和預估精確數據的獲得依然是個難題。
后來在接觸到百度AICA首席AI架構師培養計劃之后,王建峰才發現當時整個團隊最大的問題只是從AI技術出發去理解業務,并沒有從公司整體的戰略方向去重視業務的訴求和邏輯。
而在接受完培訓并順利在老師指導下完成項目研發后,王建峰認為,AI架構師現在已成為AI技術在中國發展的必然產物與關鍵角色。
實際上,“AI架構師”并不是AI行業的“專屬”職位,更多的是在有真實應用問題和場景的公司中,將本公司面臨的問題和AI技術結合起來的一種管理和技術相結合在一起的崗位。
“在AI技術落地的過程中有太多未明確的情況,都是要根據實際的業務場景構造對AI技術的需求,這需要技術領導者在熟悉AI技術和理論的同時,還要具備整體的架構能力,而不是簡單的對AI生搬硬套。”
二、AI架構師的最大優勢
讓王建峰覺得參加百度AI架構師培養計劃收獲最大的,是從以往沒想到的復合視角來看問題,最終另辟蹊徑解決了項目在技術研發中遇到的所有問題。
“我們一開始整個項目遇到問題的原因,在經過行業專家的點評之后才發現,并不是我們技術水平上沒有達到,而是公司在立項的時候對于項目的期望值有一點過高”,王建峰說,這已經成為AI技術落地過程中的一個通病。
在他看來,現在有不少人對AI還存在一定的誤解,覺得AI是一個萬物都可智能的程序和技術,“但任何一種AI理論和技術的落地都是有邊界的。”
王建峰參與的醫療項目也不例外。“原本公司是希望做一個能涵蓋大多數醫療圖片處理的AI智能助手,提供給醫院和醫生使用,從而創造價值提升利潤”,但王建峰帶領團隊開發過程中發現,這樣給系統深度學習的材料需要海量的處理能力,也是在現有的情況下無法達到的。
“關鍵,參與的工程師也很累,大家費了很大的勁,但做出的系統總是不能達到預先的要求”,直到參加AICA四期的培訓,“百度技術專家的話才把我點醒,我們不再追求知識的全部覆蓋,而聚集在一個有邊界的地域抽取關鍵知識,并對關鍵知識進行優化,以實現在關鍵點的知識圖譜完美覆蓋”。
效果立竿見影,調整思路后的結果讓王建峰第一次認識到了在AI領域復合視角的強大能力。“我們針對疑難病的圖片判定系統迅速就完成研發,并在實驗室和對應單位的應用中取得了非常高的準確率,達到了項目開始前的預期。”
百度AI架構師培養計劃不光讓他了解到AI架構師是當下AI技術人才轉型的必然,同時也認識到想成為AI架構師,就必須重視理解業務的訴求和邏輯。因為只有抓住業務的關鍵點,才能做出正確的抽象設計和技術選型。
“這次培訓教會了我一個道理,切忌只從AI技術的角度出發去理解業務,一定要站在整體業務流程的高度去做大范圍的邏輯分析和考慮。”
實際上,與王建峰有相同感受的人還有很多,他在百度AI首席架構師培訓同期的“同學”——浙江能源集團算法工程師朱凌風就是其中一位。
百度專門開設AI首席架構師培養計劃,不光讓他在內的技術人才有了高度的業務視角,同時也讓他們站在一個更高的角度去梳理已經存在的AI技術,并利用AI技術對企業的整個生產流程,開始有了整體掌握能力。
這點可能對于很多獨立化、體系化的產業更具有應用價值。
“我們公司是能源企業,為了提升管理效率降低人工成本,AI在能源中的應用日益受到重視”,這也是朱凌風開發一整套能源企業智能維護系統的初衷。
“在沒有接觸過百度AI架構師培訓的時候,我們更多的是關注各個AI理論應用模型以及算法”,朱凌風說,他們立項的時候還認為通過算法的開發就能完善,但其實在過程中遇到了很多困難。
“AI算法包括以前很多人完成的一些案例,跟我們所處的這個行業差距還比較大”,在朱凌風看來,技術選型上遇到的問題是他參加百度AI架構師培養計劃需要解決的第一個核心需求。
“收獲非常大”,在談及這次AI架構師培訓給整個項目帶來的變化時候,朱凌風認為他通過此次培訓增長了很多在AI領域的落地經驗。
“我系統地體驗了完整的AI項目從方案設計到落地執行的一個全流程,對設計并實現高效合理的AI落地方案的能力得到了提高。同時,經過與百度內部AI架構師的交流和探討,我對業界先進的算法以及一些前沿技術有了更深入的認識,對AI技術和開發應用流程的整體掌握能力有了進一步的提升。”
他迅速應用在公司立項的智能維護系統開發過程中。
“因為這次培訓把一個開發流程遞進地拆解為算法的基本原理、深度學習技術棧、主流模型和網絡架構,以及最后應用部署的具體流程這幾個層面,訓練了我的業務理解和技術抽象能力”,朱凌風第一次找準了自己所需要的技術和模型方向,并利用百度開源開放的深度學習平臺——飛槳完善了整個需求。
最終,他們所研發的系統在集團真實的測試數據上得到了非常不錯的效果,現在已經被運用到了日常集團設備維護中。
“AI技術是一項復雜的技術,入門難度較高、學習曲線陡峭。如果對AI技術缺少系統的掌握,在面對企業復雜的項目或者新的任務場景時必會手足無措。”作為企業的AI技術開發者,朱凌風認為最好先成為AI技術專家再進行業務的落地,結合項目實踐不斷迭代深入。
“因為AI是一門在應用中不斷前行的科學”。
三、AI架構師培訓搶手原因
百度AICA首席AI架構師培養計劃到現在已經開設了四期,第五期也即將開班。跡象顯示,越來越多的人愿意加入這項以應用為先的培訓。
任職于一家國際知名信息公司,作為客戶解決方案專家級架構師的詹宏聃,領導參與過多個人工智能相關的項目。她認為以應用為導向的培訓,對于AI技術的產業化落地和實際工作有著非常明確的指導作用。
“百度首席AI架構師培養計劃的亮點就在于,每個人進入培訓的時候都要帶著一個項目的選題,然后通過培訓在老師的指導下一步一步完善這個選題,最終在培訓結束的時候,要對這個選題進行答辯并實施出來”。
很多時候指導老師站在宏觀視角上的一句話,就會讓詹宏聃在業務與AI技術的結合上產生很多好的想法。
“工作中我很多次發現,工程師花了好多的時間去處理數據,但是訓練出來的AI系統提升的效能并不是很高。以前我可能會要求工程師去改參數或者改數據試試,但百度的老師一句話給我一個非常醍醐灌頂的感受”,詹宏聃說,她以前還是太偏AI技術的角度去理解業務問題。
“老師說,如果工程師選用的算法和模型都沒錯,那你應該回過頭去看看自己的業務邏輯有沒有可以調整的地方。”
通過課上學習和課內交流,詹宏聃發現,優化業務邏輯通常可以發現調整并增加自身業務效率的地方。“神奇的是優化業務邏輯后,再回過頭跑已經做的差不多的AI算法和系統,居然發現效果可以再上一個臺階。”
而在這個過程中,百度飛槳深度學習平臺對詹宏聃和其他學員完成自身的項目,給予了極大的支持和便利。
詹宏聃認為,飛槳是非常適合中國企業開發AI深度學習應用的平臺之一,“飛槳是源于產業實踐的一個開源開放的深度學習平臺,這意味著平臺不光是開源,而且深耕于產業實踐,就有了很多在產業端的應用案例”。
在她眼中,“飛槳提供的這些產業端應用案例,對于我們在日常工作中建立新的AI深度學習應用或者系統,有著非常到位的指導作用。”
關鍵,這個系統還非常好用。
“如果你看到全景圖的話,就會發現無論是學習框架、模型訓練、推理引擎、平臺部署,以及一些模型庫、開放的數據集等,都包括在飛槳里,這就意味著如果你想在深度學習領域有所建樹的話,你所有的技術需求在這個平臺上都能實現。”
四、如何加入AI架構師培訓?
當然,參加過此次培訓的學員都認為,百度首席AI架構師培養計劃對于AI技術在中國的發展有著非常積極的促進作用。
在AI已經成為中國當下最火熱的技術賽道的時候,企業如何在這場技術的洪流中緊跟技術趨勢完成升級轉型,考驗的不僅僅是企業的發展視野和戰略,更是考驗企業技術主管對于傳統業務轉型的把控力。
后者其實站在技術團隊角度,對于企業在AI條件下的發展更具有現實意義。
對此,在6月27日百度AICA首席AI架構師培養計劃第四期畢業典禮上,百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜表示,人工智能在和產業的結合過程中,已經逐漸走到AI工業大生產,正在經歷三個階段:AI先行者探路階段、AI工作坊應用階段、AI工業大生產階段。
她認為AICA學員所在大部分企業處于第一階段,有少數進入了第二階段,發展到第三階段的企業還鳳毛麟角。因此,AICA和各位學員正在共同探索AI工業大生產的實現路徑,可以看到未來的發展空間非常值得想象。
實際上,大多數情況下,由于業務的時間要求、成本限制、質量要求等等,企業的技術團隊很難在理想狀態下解決問題。如何在受到限制的情況下提升技術方案的可擴展性,使之能隨著業務的變化而不斷演進,這其實才是百度AI架構師,對于整個行業尤其是AI技術在企業端應用的推進,最深刻的意義。
百度AICA首席AI架構師培養計劃,是百度聯合深度學習技術及應用國家工程實驗室共同打造,致力于為中國AI方向輸送既懂AI技術又懂產業應用的復合型高端AI人才,強勁的AI“中堅力量”才是中國產業智能化變革“第一線”。
2021年6月27日,首席AI架構師培養計劃四期班在京舉辦畢業典禮,典禮上還首次發布《AI架構師》手冊。
該手冊通過采訪百度內部不同身份、技術典型、轉型成功的AI架構師,形成23,000字的論述。通過多維度、多角度描述當代“業務+算法+架構”于一體的AI架構師轉型路徑,帶領業界AI人才一同預見AI產業落地前瞻變量。
經過四期培訓的沉淀,當前已經有近200位通過百度認證的AI架構師正深入產業,遍布工業、能源、金融、交通等數十個行業,正在利用自己學習到的知識和理論,結合AI技術服務中國基礎產業的轉型。
當然在這個過程中,AICA也積累了產業AI管理人才生產落地的豐富經驗。
從某種意義上講,這些具有全局視角和技術實施能力的高端技術管理人才,才是AI技術在中國落地的關鍵。
現在,大門已經打開。未來,就在腳下。
本文來自微信公眾號 “筆記俠”(ID:Notesman),作者:Rickzhang,36氪經授權發布。
