對話 CTO | 聽碼隆科技 CTO 碼特講計算機視覺技術賦能全球零售行業

成立于 2014 年的碼隆科技是一家提供計算機視覺技術服務的人工智能公司。區別于市面上做安防、金融等人臉識別的人工智能公司,碼隆科技將核心技術圍繞著商品識別展開。2016 年碼隆科技發布了 ProductAI 人工智能商品識別平臺,目前技術已經在零售、紡織服裝、質檢等多個領域落地。在碼隆科技 CTO 碼特(Matt Scott)看來,務實的 AI 才能真正帶來商業價值。
碼特曾任微軟亞洲研究院高級研發主管,擁有超過 90 個中美專利技術。在職業生涯的黃金時期,碼特與同事黃鼎隆組成「中美創業」組合,創立碼隆科技。除了產品研發,碼特還帶領團隊參與了很多科學研究項目。碼隆科技通過自主研發的弱監督學習算法解決了深度學習需要大量人工標注來支持的難題,因此取得了 WebVision 全球圖像識別競賽的冠軍,識別正確率達到了 94.78%。
出生于美國,在中國工作了 13 年的碼特認為,AI 無國界,技術解決的是全球性的問題,具備全球化視野和格局是 AI 行業企業家的挑戰和必備素養。
從微軟亞洲研究院走出來的 CTO
穎奇:非常感謝碼隆科技 CTO 碼特接受我們的采訪。您作為一個在中國創業做 AI 技術的美國人,能否先簡單介紹一下您在 AI 領域中的成長經歷和故事?
碼特:計算機視覺一直是我的興趣,我在 20 歲左右就發表了 CVPR 論文。我在畢業后就進入美國微軟,之后又轉到中國,去追尋我在計算機視覺領域的夢想。我在微軟亞洲研究院的第一個項目是做條形碼識別,是為 Pocket PC 寫一維和二維的解碼器。這個經歷讓我想到了零售行業,因為零售業的類似場景有很多,但我當時做的工作還屬于傳統的計算機視覺。
我在微軟研究院工作的過程中,有機會接觸到最前沿的事物。2012 年,我在天津展示了微軟研究院的即時翻譯技術——我說英語的同時,AI 程序可以實時翻譯成中文,我非常榮幸見證這一時刻的到來,這也讓我看到了未來 AI 將是一個大趨勢。
在微軟亞洲研究院工作了八年之后,我和最好的朋友兼同事黃鼎隆博士發現 AI 創業的最佳時機到了。碼隆科技創立于 2014 年,「碼隆」是由「碼特」的「碼」和「鼎隆」的「隆」組成,當然還有另外一層含義就是「碼農」。后來,雖然我離開了微軟去創業,但仍然是關系緊密的微軟校友。同時,碼隆也是微軟加速器第六期的企業學員,是微軟創新計劃的一部分。
公司初創時,只有鼎隆和我聯合創始。我們參加了中國科技部主辦的中國創新創業大賽,在一萬家公司中我們獲得了第二名。然后在下一個月我們又參加了深創賽,這次獲得了第一名。我們覺得是時候了,然后逐漸整備資源,讓公司運營逐步走上正軌。
穎奇:能否介紹一下碼隆科技的研發團隊大概是什么樣的規模,內部人員的組織架構是怎樣的?AI 對技術人才的要求很高,碼隆又是怎樣聚攏一批優秀人才呢?
碼特:我們公司大概 150 人,其中有 70% 以上是核心研發人員。聘請職業管理者相對容易,招聘優秀的人才卻很難,所以我的策略是努力吸收那些頂尖的人才。我們團隊中大多數人都是一起共事多年的朋友。很多人說,人脈來來往往經常流動,而我卻發現人們會留下來像家人一樣相處,一起努力解決不可能的問題。這樣的凝聚力是一種非常棒的價值傳達。
穎奇:能否提供一些工作中的學習方法和建議給年輕一代的工程師和研究人員?有哪些書是會推薦給大家的?
碼特:我的建議是不要走捷徑,真正建立核心知識體系和技能。如果想讀書,就讀課本,而不是那些花哨的書。我們需要基礎知識,即使你沒有經驗也沒關系,但是你需要對它的工作原理有一個基本的了解。
在此,我也推薦一本關于 AI 的好書,叫做《機器與人》(《Human + Machine: Reimagining Work in the Age of AI》),它描述的是和人工智能一起工作的未來,告訴企業如何使用人工智能來改變我們的工作方式。
當然,如果你能找到一個導師就再好不過了。但人工智能是一個新領域,所以很難有人在人工智能領域有十年的經驗。在人工智能中,你必須愿意走進未知世界,必須愿意嘗試一些新東西。
從計算機視覺的行業領先者到基準創建者
穎奇:能否請您簡單介紹一下碼隆科技在 AI 領域上的技術創新和整體情況?
碼特:碼隆科技是世界上領先的人工智能計算機視覺公司之一,區別于市面上做人臉識別的人工智能公司,我們專注于商品識別。這是一項能夠支持零售和其他場景的核心技術。
起初,我們從服裝開始做起,識別不同顏色和紋理并不容易,同時服裝還非常容易產生褶皺、折疊等變形。我喜歡挑戰,所以我想如果能識別出流行與時尚這樣抽象的概念,我就能識別一切。我們目前已經專注在這個領域近五年的時間了,我們將服裝識別的技術延伸到全品類的商品識別,我們的技術現在可以精準識別面料商品的花型及紋理材質,對于場景中的服飾商品可以反饋幾十種品類,比如雪紡上衣、雙肩包、運動鞋等。同時,我們在對商超、貨柜、購物中心等場景中的商品也能進行精準識別,為零售商提供智能結算、資產保護等服務?,F在我們的業務已經擴展到各個細分領域的龍頭企業中,今年專注于項目落地,明年會進行大規模行業范圍復制。同時,我們也參與了很多科學研究項目,積極為學術界貢獻力量,再將科學研究和產品研發更好地結合在一起。
穎奇:現在國內有很多專注于做計算機視覺的公司,碼隆在技術或效率上有哪些優勢呢?有沒有一些基準(benchmarks)或技術參數?
碼特:我們不斷用現有的學術基準來測試自己,挑戰自己——這是我們文化的一部分。在學術界,有很多關于商品識別的評估基準,我們的結果都處于業界最領先的位置。同時,我們也發表了很多研究成果,并且在 CVPR、ICCV 和 ECCV 等計算機視覺世界頂級行業會議上接受同行的科學評審。而這些前沿技術,也被我們充分應用到技術服務之中。
從去年開始,我們創建了自己的評估基準。最近我們舉辦了一項有關商品識別的比賽 iMaterialist Challenge on Product Recognition,截至目前全球已有一百多支代表隊參賽,這項比賽的結果將在世界頂級會議 CVPR 上進行公布。同時,這也是 CVPR 迄今數據規模最大、種類最多的商品識別競賽。
(采訪期間,碼特向穎奇展示了 MeasureAI 自動化服裝測量解決方案。
MeasureAI 是一套可擴展、經濟高效的自動化服裝測量解決方案。碼隆擁有專有的深度學習模型能夠定位衣服關鍵點,如衣領、肩膀等,并利用尖端的計算機視覺技術將像素距離轉換為毫米級別的測量值?;诖a隆的商品識別能力,它還可以區分衣服的款式類型。使用者只需要通過拍照進行服裝測量,幾秒鐘內即可得到服裝測量結果,全程無需手動輸入數據。)
放眼全球,深耕行業痛點
穎奇:碼隆更多是幫助其他人來使用 AI,所以我想到了「AI 民主化」這個話題,即能夠讓更多人來使用 AI。碼隆在這個方向是否做了一些努力?
碼特:我們不僅重視在 AI 行業中建立影響力,更重視 AI 給其他行業帶來的影響。ProductAI 是我們最早大眾化的產品,是一個商品識別平臺。但后續我們的戰略上有一些聚焦,更專注于服務各個行業的龍頭企業,可以幫助他們解決計算機視覺和商品識別的業務問題。因為我們發現通用產品解決的是相對淺層的問題,如果要想給行業帶來變革,就一定要深入到行業中去。比如我們現在的 RetailAI 重點聚焦于零售行業,StyleAI 重點聚焦于服裝紡織行業等,之后會有更多專注于垂直行業深度探索的定制化開發。
穎奇:同一個領域里不同客戶的相似性有多少?或者他們也都有不同之處?
碼特:我們在零售行業做得很深,從我們觀察來說,每個公司,尤其是創業公司的能力是有限的,大家一開始就用新的技術和不同的行業去進行碰撞和嘗試。而在后期的話,隨著公司的體量不同和發展策略有所變化,一定要去解決最貼近他們的實際問題才能夠走下去?,F在的 AI 公司都會有一個更加聚焦的成長趨向。
穎奇:能否分享一下您認為的 AI 或者 ProductAI 在未來五年的產品形態?會為類似的垂直行業提供怎樣的產品和解決方案?
碼特:之前,AI 是「酷」的代名詞,現在 AI 是「真」的代名詞。解決真正的問題,才是一個健康的產業。我不認為你會想看到比如一些瘋狂的科幻小說里的科幻場景,你想看到的是一些能帶來真正價值的東西,特別是為客戶、大企業解決真正的問題。因此,我們未來五年的目標是用 AI 為世界大型企業解決問題,尤其是在零售業,他們尤為重視成本效益和實用性。
穎奇:那么碼隆是如何應對在中國市場中遇到的困難和挑戰?
碼特:我們每天都遇到挑戰,也一直努力在解決問題。對于一些項目,比如像智能貨柜,其中一個主要問題便是如何高效、低成本進行商品上新。假設你有了一個新商品,它不僅要能夠被識別出來,而且還必須高效地將商品錄入系統中。現在很多人做這個需要成百上千張圖像數據來進行訓練,而我們只需要 20 張圖片就能實現同樣的效果,所以我們減少了很多空間和時間成本,這正是我們攻克的核心技術難點之一。
這背后的技術就是弱監督學習(Weakly Supervised Learning)?,F在大家都認為,如果我想做一個圖像識別或相關場景,需要收集大量圖像數據,并需要對應準確無誤的標簽支撐。但在碼隆,我們有自己的弱監督學習算法 CurriculumNet,能夠有效處理有噪音數據和數據不均衡的情況。基于這類的基礎研究,我們把這些成果應用到智能貨柜的商品信息錄入上,使之得以更高效的運轉和工作。
穎奇:在中國解決了這些問題后,是否能把這種能力擴展到全世界范圍?
碼特:我認為我們解決的不僅僅是中國問題,而是全球性的問題,像商品識別和商品信息錄入這些問題都是全球性的。總的來說,我不喜歡說中國的 AI,或者美國的 AI,法國的 AI……AI 就是 AI,是世界的。
穎奇:今天的前沿科技領域,需要企業家具備全球化的格局。感謝您的分享。
