智能管家“賈維斯”走進現實？AI Agent或成2023科技領域新風向標

實在智能

+ 關注

2024-03-08 15:55

853次閱讀

漫威粉們想必都知道《鋼鐵俠》系列電影中，有一個不可或缺的角色——賈維斯。但就算是沒有看過任何一部大電影的路人，只要通過一個詞就可以了解“賈維斯”是一個什么樣的角色——智能管家。

作為托尼·斯塔克的助手，賈維斯的存在讓主人的生活更加便捷。在日常生活中，賈維斯負責幫助斯塔克管理日常事務，理解并執行斯塔克的語音指令，充當著斯塔克與其他人溝通的橋梁，讓斯塔克有更多的時間去專注于他的工作。而在戰場上，賈維斯可以連接到任意計算機終端，在幾秒鐘內處理大量信息并在關鍵時刻提供正確的解決方案，甚至可以在危急時刻控制鋼鐵俠戰服，協助戰斗。

智能管家“賈維斯”走進現實？AI Agent或成2023科技領域新風向標

“這樣的智能管家哪里找？”“這只能存在于科幻片里面吧？”的確，比起一臺機器，賈維斯更像一個擁有獨立思考能力和判斷力的“人”。而想把冰冷的機械變成智慧的生物，光喊魔法咒語“巴啦啦能量”可沒什么用，還得找人工智能領域的新晉頂流——AI Agent。

這是什么？如果問比爾蓋茨，他表示：“這是一件大事。Agent會了解你所有的信息，也會知道更多你不知道的信息，這意味著，用戶永遠不會再訪問搜索網站，也不必使用生產力工作，一切都將通過Agent來完成……”如果問百度，它給出的官方定義是“AI Agent（AI智能體）是一種能夠感知環境、進行決策和執行動作的智能實體，擁有自主性和自適應性，可以依靠AI賦予的能力完成特定任務，并在此過程中不斷對自我進行完善和改進”，如果問我，那就通俗點理解，AI Agent差不多是智能人工助理，能理解人的意思并且自主完成人類的指令。

想知道AI Agent是如何快速出現的，那就不得不提到大模型的蓬勃發展。雖然蘋果手機里的Siri也能和我們對話，但賈維斯不僅能陪聊，還是一個會進步會學習的人工智能程序。這是因為大模型龐大的訓練數據集中包含了大量人類行為數據，為模擬類人的交互打下了堅實基礎；而且隨著模型規模不斷增大，大模型涌現出了上下文學習能力、推理能力、思維鏈等類似人類思考方式的多種能力。

由此可見，大語言模型相當于大腦，讓Agent在接收到目標之后，可以自主進行邏輯推理和自我提示，不斷尋找達成目標的最好方式，通過和其他軟硬件相連，Agent可以熟練地使用計算機、瀏覽網頁、讀寫文件、用信用卡付款。人唯一需要做的就是提供一個目標。而AI Agent充分結合大模型“腦”與數字員工“手”二者的優勢，一方面破除了大模型“有腦無手”的困局，另一方面賦予數字員工多重能力，帶來更高級的自動化解決方案。

到了現在，隨著國內百模大戰接近尾聲，企業們生產大模型的步伐有所放緩，都逐漸開始將目光聚焦到大模型應用層，致力于讓加了大型語言模型能力的Agent直接去解決某具體場景中的各種問題。以一家科技公司為例，AI行業準獨角獸實在智能為了推進大模型在真實商業場景中快速、有效落地，在發布了自研TARS垂直大模型后，重磅推出了行業首個基于大模型的TARS-RPA-Agent產品，將數字員工應用門檻進一步大幅降低，實現“所說即所得，你說，PC做！”

智能管家“賈維斯”走進現實？AI Agent或成2023科技領域新風向標

TARS-RPA-Agent不僅全能覆蓋發郵件、請假等各種辦公場景，而且還有著優秀的泛化能力。比如你問TARS-RPA-Agent“我要買一臺筆記本電腦，幫我推薦下”，它就會基于計算機視覺大模型的“智能屏幕語義理解”技術“秒懂”屏幕畫面，完成自動解析并將其拆解成“登錄購物網站，查詢筆記本電腦品牌、配置、價格等信息，完成產品推薦”等多個可自動實現步驟。值得一提的是，TARS-RPA-Agent在任務過程中可允許人工修改、調優，如果我們中途有了新的計劃，也可以直接用嘴告訴它。

AI Agent的出現，代表了科技的進步，也順應著需求的激增；它讓人們對于科幻作品中能力超凡的AI助手的想象變成現實，給人與機器的關系構建出全新的軟件可能。暢想未來，你也配備了一個大模型Agent，這位智能管家能幫你處理大量信息甚至做出推理，我們的生活將發生什么樣的變化呢？

[免責聲明]

原文標題：智能管家“賈維斯”走進現實？AI Agent或成2023科技領域新風向標

本文由作者原創發布于36氪企服點評；未經許可，禁止轉載。