AI Agent成了大廠必爭(zhēng)之地。
近期,蘋果、谷歌、Antropic、OpenAI紛紛發(fā)布AI Agent進(jìn)展 ,希望用大模型技術(shù)改變?nèi)藱C(jī)交互方式,找到AI最恰當(dāng)?shù)穆涞胤绞健?/p>
這其中,國(guó)內(nèi)AI企業(yè)智譜快速布局,領(lǐng)先海外巨頭一個(gè)身位。
繼10月25日首次上線可以代替人類操作手機(jī)和電腦的AI工具之后,11月29日,智譜發(fā)布了AI Agent系列更新。
主打AI接管手機(jī)的AutoGLM,已經(jīng)可以實(shí)現(xiàn)跨APP、跨設(shè)備、長(zhǎng)流程的復(fù)雜步驟。
所謂AutoGLM,是指接收人類簡(jiǎn)單語(yǔ)音指令,自動(dòng)執(zhí)行手機(jī)端復(fù)雜任務(wù),任務(wù)執(zhí)行過(guò)程中可以持續(xù)與用戶進(jìn)行交互反饋。
根據(jù)簡(jiǎn)單語(yǔ)音指令,AutoGLM可以在微信、小紅書、美團(tuán)、淘寶、抖音、攜程等APP上執(zhí)行發(fā)布消息、查找店鋪、選購(gòu)商品、路線導(dǎo)航、訂機(jī)票、訂車票、訂酒店等操作。
銀河證券近日發(fā)布研報(bào)指出,AI Agent的崛起正重塑AI產(chǎn)業(yè)鏈并帶來(lái)投資新機(jī)遇,未來(lái),AI Agent模型將改變C端流量入口的分配,或許還會(huì)取代APP的地位,并與硬件爭(zhēng)奪流量入口。
智譜CEO張鵬演示了“AI發(fā)給人類的第一個(gè)紅包”,他發(fā)出“面對(duì)面建群并發(fā)布200個(gè)紅包”的語(yǔ)音指令之后,AutoGLM自動(dòng)執(zhí)行了打開微信、建群、發(fā)群紅包的系列步驟。
當(dāng)然,輸入密碼還是需要人類確認(rèn)的。
據(jù)介紹,AutoGLM可以實(shí)現(xiàn)觸控執(zhí)行、內(nèi)容理解、內(nèi)容生成等大類別任務(wù)。
目前,AutoGLM覆蓋了手機(jī)端主流生活場(chǎng)景APP,包括微信、小紅書、抖音、微博、美團(tuán)、大眾點(diǎn)評(píng)、餓了么、淘寶、京東、拼多多、高德地圖、百度地圖、12306、攜程、去哪兒等。
另外,針對(duì)特殊場(chǎng)景,也可以實(shí)現(xiàn)跨APP操作。
比如,“在小紅書上搜索北京比較正宗的餐廳,找一家合適的在大眾點(diǎn)評(píng)上定位,并在微信上發(fā)送給老婆,告訴我它在美團(tuán)上有哪些推薦菜,幫我高德導(dǎo)航過(guò)去”;“對(duì)比攜程和去哪兒下周三從昆明到烏魯木齊的航班價(jià)格”。
GLM-PC是面向PC端的自主Agent,目前開放第一階段的內(nèi)測(cè)場(chǎng)景,包括會(huì)議替身、文檔處理、網(wǎng)頁(yè)搜索與總結(jié)、遠(yuǎn)程和定時(shí)操作、隱形屏幕等。
不過(guò),智譜方面坦陳,由于PC和PC任務(wù)的復(fù)雜程度,目前大模型的能力距離真正代替用戶辦公還有一定距離。GLM-PC在當(dāng)前版本下,用戶仍需要輸入非常精準(zhǔn)的指令。
大模型正在改變?nèi)藱C(jī)交互方式,而AI Agent是行業(yè)內(nèi)公認(rèn)的、最具潛力的AI落地方式。
或許,AI Agent可以將移動(dòng)互聯(lián)網(wǎng)時(shí)代的“人適應(yīng)機(jī)器”,推進(jìn)到AI時(shí)代的“讓機(jī)器適應(yīng)人”。
蘋果(Apple Intelligence)、Anthropic(Computer Use)、谷歌(Jarvis)和 OpenAI(Operator)等企業(yè)也已經(jīng)把Agent作為2025年的業(yè)務(wù)重點(diǎn)。
AI Agent能夠讓大模型完全執(zhí)行人類的工作流程,適應(yīng)、學(xué)習(xí)、迭代,與其他系統(tǒng)和人類協(xié)作,并端到端地完成任務(wù)。
在智譜CEO張鵬看來(lái),現(xiàn)階段,AutoGLM相當(dāng)于在人與應(yīng)用之間添加一個(gè)執(zhí)行的調(diào)度層,大幅改變了人機(jī)交互形式。
張鵬認(rèn)為,大模型發(fā)展會(huì)經(jīng)過(guò)五個(gè)階段,分別是L1語(yǔ)言能力、L2邏輯能力(多模態(tài)能力)、L3使用工具的能力、 L4自我學(xué)習(xí)能力、 L5探究科學(xué)規(guī)律。
目前,Agent會(huì)極大地提升大模型的L3能力,同時(shí)開啟對(duì)L4自我學(xué)習(xí)能力的探索。
“而且,Agent可以看作是大模型通用操作系統(tǒng)LLM-OS的雛形,未來(lái)有可能實(shí)現(xiàn)原生的人機(jī)交互?!睆堸i說(shuō)。
從產(chǎn)業(yè)端來(lái)看,AI Agent有廣闊的市場(chǎng)機(jī)遇。銀河證券預(yù)計(jì),到2028年,中國(guó)AI Agent的市場(chǎng)規(guī)模將激增至8520億元,年復(fù)合增長(zhǎng)率達(dá)72.7%。
“AI Agent也會(huì)推動(dòng)APP生態(tài)逐漸向端側(cè)生態(tài)轉(zhuǎn)變,成為AI應(yīng)用發(fā)展新趨勢(shì)?!便y河證券在研報(bào)中指出,AI Agent通過(guò)實(shí)現(xiàn)自然語(yǔ)言與硬件的交互,解決端側(cè)AI痛點(diǎn),可能改變C端流量入口的分配機(jī)制。
業(yè)界對(duì)此有共識(shí)。智譜COO張帆也認(rèn)為,AI Agent有望革新智能設(shè)備的生態(tài),手機(jī)+AI會(huì)變成隨身個(gè)人智能助理,PC+AI有機(jī)會(huì)成為全新生產(chǎn)力工具,汽車+AI會(huì)打開汽車更大的想象空間。