智能管家“賈維斯”走進現實?AI Agent或成2023科技領域新風向標
漫威粉們想必都知道《鋼鐵俠》系列電影中,有一個不可或缺的角色——賈維斯。但就算是沒有看過任何一部大電影的路人,只要通過一個詞就可以了解“賈維斯”是一個什么樣的角色——智能管家。
作為托尼·斯塔克的助手,賈維斯的存在讓主人的生活更加便捷。在日常生活中,賈維斯負責幫助斯塔克管理日常事務,理解并執行斯塔克的語音指令,充當著斯塔克與其他人溝通的橋梁,讓斯塔克有更多的時間去專注于他的工作。而在戰場上,賈維斯可以連接到任意計算機終端,在幾秒鐘內處理大量信息并在關鍵時刻提供正確的解決方案,甚至可以在危急時刻控制鋼鐵俠戰服,協助戰斗。
“這樣的智能管家哪里找?”“這只能存在于科幻片里面吧?”的確,比起一臺機器,賈維斯更像一個擁有獨立思考能力和判斷力的“人”。而想把冰冷的機械變成智慧的生物,光喊魔法咒語“巴啦啦能量”可沒什么用,還得找人工智能領域的新晉頂流——AI Agent。
這是什么?如果問比爾蓋茨,他表示:“這是一件大事。Agent會了解你所有的信息,也會知道更多你不知道的信息,這意味著,用戶永遠不會再訪問搜索網站,也不必使用生產力工作,一切都將通過Agent來完成……”如果問百度,它給出的官方定義是“AI Agent(AI智能體)是一種能夠感知環境、進行決策和執行動作的智能實體,擁有自主性和自適應性,可以依靠AI賦予的能力完成特定任務,并在此過程中不斷對自我進行完善和改進”,如果問我,那就通俗點理解,AI Agent差不多是智能人工助理,能理解人的意思并且自主完成人類的指令。
想知道AI Agent是如何快速出現的,那就不得不提到大模型的蓬勃發展。雖然蘋果手機里的Siri也能和我們對話,但賈維斯不僅能陪聊,還是一個會進步會學習的人工智能程序。這是因為大模型龐大的訓練數據集中包含了大量人類行為數據,為模擬類人的交互打下了堅實基礎;而且隨著模型規模不斷增大,大模型涌現出了上下文學習能力、推理能力、思維鏈等類似人類思考方式的多種能力。
由此可見,大語言模型相當于大腦,讓Agent在接收到目標之后,可以自主進行邏輯推理和自我提示,不斷尋找達成目標的最好方式,通過和其他軟硬件相連,Agent可以熟練地使用計算機、瀏覽網頁、讀寫文件、用信用卡付款。人唯一需要做的就是提供一個目標。而AI Agent充分結合大模型“腦”與數字員工“手”二者的優勢,一方面破除了大模型“有腦無手”的困局,另一方面賦予數字員工多重能力,帶來更高級的自動化解決方案。
到了現在,隨著國內百模大戰接近尾聲,企業們生產大模型的步伐有所放緩,都逐漸開始將目光聚焦到大模型應用層,致力于讓加了大型語言模型能力的Agent直接去解決某具體場景中的各種問題。以一家科技公司為例,AI行業準獨角獸實在智能為了推進大模型在真實商業場景中快速、有效落地,在發布了自研TARS垂直大模型后,重磅推出了行業首個基于大模型的TARS-RPA-Agent產品,將數字員工應用門檻進一步大幅降低,實現“所說即所得,你說,PC做!”
TARS-RPA-Agent不僅全能覆蓋發郵件、請假等各種辦公場景,而且還有著優秀的泛化能力。比如你問TARS-RPA-Agent“我要買一臺筆記本電腦,幫我推薦下”,它就會基于計算機視覺大模型的“智能屏幕語義理解”技術“秒懂”屏幕畫面,完成自動解析并將其拆解成“登錄購物網站,查詢筆記本電腦品牌、配置、價格等信息,完成產品推薦”等多個可自動實現步驟。值得一提的是,TARS-RPA-Agent在任務過程中可允許人工修改、調優,如果我們中途有了新的計劃,也可以直接用嘴告訴它。
AI Agent的出現,代表了科技的進步,也順應著需求的激增;它讓人們對于科幻作品中能力超凡的AI助手的想象變成現實,給人與機器的關系構建出全新的軟件可能。暢想未來,你也配備了一個大模型Agent,這位智能管家能幫你處理大量信息甚至做出推理,我們的生活將發生什么樣的變化呢?