AI智能體,代替人類操作手機(jī)、電腦和汽車,以及一切可能的設(shè)備。
11月29日,國產(chǎn)大模型“六小虎”之一的智譜AI舉辦Agent開放日活動,展示其在AI智能體方面最新的技術(shù)成果。在活動現(xiàn)場,智譜AI首席執(zhí)行官張鵬發(fā)布了新升級的AutoGLM以及GLM-PC,并邀請了榮耀、華碩、小鵬這三家代表手機(jī)、電腦、汽車的客戶,分享如何通過接入智譜GLM大模型,讓設(shè)備變得更加智能。
Wind顯示,截至收盤,智譜AI指數(shù)上漲2.55%,概念股普遍上漲。其中,金現(xiàn)代盤中漲超10%,海天瑞聲漲近6%,凌云光漲超5%,值得買漲超4%,中科金財(cái)漲超3%。
AutoGLM新升級:可自主執(zhí)行超50步操作
“絕大部分人已經(jīng)意識到,大模型不是簡單的聊天機(jī)器人,所以我們期待它能夠超出語言交互,做更多事情。”開放日活動上,張鵬表示。
事實(shí)上,在一個月前的10月25日,智譜AI就發(fā)布了AI手機(jī)端的AutoGLM,迅速引起廣泛關(guān)注,并與此前的月之暗面一樣攪動二級市場,產(chǎn)生了“智譜AI概念股”。自10月28日起,智譜AI概念股逆勢走強(qiáng),當(dāng)天創(chuàng)業(yè)黑馬、首都在線、豆神教育、傳智教育、正和生態(tài)等相關(guān)概念股漲停。
AutoGLM是其大模型GLM第一個產(chǎn)品化的智能體,只需接收簡單的文字或者語音指令,就可以模擬人類操作手機(jī)。從其發(fā)布的視頻來看,用戶向手機(jī)語音傳遞命令后,AutoGLM會經(jīng)過用戶授權(quán),自動打開目標(biāo)APP,執(zhí)行相關(guān)命令,可以實(shí)現(xiàn)的功能包括在淘寶上購買一款歷史訂單產(chǎn)品、在攜程上預(yù)訂酒店、在美團(tuán)上點(diǎn)外賣、在微信群里領(lǐng)取老板發(fā)的紅包等功能,開啟了人機(jī)交互的新范式。
?在淘寶上購買一款歷史訂單產(chǎn)品
?在微信群里領(lǐng)取老板發(fā)的紅包
新升級的AutoGLM較一個月前實(shí)現(xiàn)了一系列進(jìn)步:一是在手機(jī)上具備了更多的能力,可以挑戰(zhàn)更高難度的操作、支持更長的流程,甚至毫無打斷地執(zhí)行超過50步的操作;二是可以實(shí)現(xiàn)跨APP操作,比如可以在刷社交媒體的同時喚起購物APP;具備短口令能力,例如用戶只需要說一句“點(diǎn)咖啡”,智能體就能自動采取對應(yīng)行動,減少超長復(fù)雜指令。
在今天的開放日活動現(xiàn)場,張鵬進(jìn)行了現(xiàn)場演示。他向手機(jī)發(fā)出了“幫我創(chuàng)建一個面對面的群聊,數(shù)字是1129”的指令,屏幕上的手機(jī)界面顯示,AutoGLM自動喚起微信、輸入數(shù)字、直接進(jìn)群。除此以外,他還發(fā)出了“幫我在智譜開放日的群聊里發(fā)一個2萬元的紅包,數(shù)量為100個,名字為‘AI給你發(fā)的第一個紅包’”的指令,該發(fā)紅包的指令也得到順利執(zhí)行。
不過,AutoGLM并非沒有“翻車時刻”。例如,現(xiàn)場在執(zhí)行面對面群聊任務(wù)時,由于現(xiàn)場進(jìn)入群聊的人員太多,超過了人數(shù)限制,而AutoGLM由于速度不夠快,導(dǎo)致無法進(jìn)群,最終只能由工作人員將其手動拉入群聊,這是智譜AI此前未能預(yù)料到的情況,顯示AI智能體還有進(jìn)一步進(jìn)化的空間。
除了手機(jī)以外,張鵬還發(fā)布了面向個人電腦的GLM-PC。據(jù)介紹,GLM-PC是能夠操作電腦的生產(chǎn)力助手,具有發(fā)送信息、網(wǎng)頁總結(jié)、文檔處理、預(yù)定和參加會議、遠(yuǎn)程和定時操作等能力。例如,下班后領(lǐng)導(dǎo)讓發(fā)一份客戶研報(bào),用戶可以在PC開機(jī)的狀態(tài)下,遠(yuǎn)程讓GLM-PC自動執(zhí)行相關(guān)的操作,還可以幫助用戶定時發(fā)出文檔等。
張鵬在現(xiàn)場也演示了GLM-PC的功能。他發(fā)出了“在智譜開放日活動中發(fā)布一個文件,文件是今天活動的新聞稿”“幫我去王心凌的微博點(diǎn)個贊,并且發(fā)一個評論”等指令,屏幕上的界面顯示,智能體完成了相應(yīng)的操作。
值得注意的是,在以上任務(wù)的關(guān)鍵步驟,例如支付款項(xiàng)、發(fā)送文件等環(huán)節(jié),需要人工進(jìn)行確認(rèn)?!斑@是為了進(jìn)一步保證整個操作環(huán)節(jié)的安全性?!睆堸i強(qiáng)調(diào)。他表示,隨著AI能力的持續(xù)提升,它們能駕馭越來越多的應(yīng)用程序,適配多樣化的操作系統(tǒng),可以說是大模型通用操作系統(tǒng)?!爸亲V已經(jīng)與多家手機(jī)廠商和PC廠商實(shí)現(xiàn)深度合作,并與高通、英特爾等芯片廠商展開合作,聯(lián)合訓(xùn)練端側(cè)大模型?!睆堸i說。
AI智能體接管“一切硬件設(shè)備”
“理論上,AutoGLM可以完成人類在可視化電子設(shè)備(電腦,手機(jī),平板……)上能做的任何事?!敝亲VAI表示。一名業(yè)內(nèi)人士向證券時報(bào)記者分析稱,AutoGLM執(zhí)行諸如訂外賣、領(lǐng)紅包等個性化的指令時,需要獲得用戶個人信息使用權(quán)限才可執(zhí)行。這也意味著,智譜AI作為軟件服務(wù)提供商,需要與更多的第三方硬件廠商達(dá)成更全面的合作,才能讓AI智能體真正在端側(cè)落地。活動現(xiàn)場,張鵬宣布AutoGLM將啟動大規(guī)模內(nèi)測,將盡快上線成為面向C端用戶的產(chǎn)品。同時,AutoGLM宣布啟動“10個億級APP免費(fèi)Auto升級”計(jì)劃,邀請APP伙伴聯(lián)合探索自己的Auto新場景。
活動現(xiàn)場,榮耀AI技術(shù)總監(jiān)王作健表示,榮耀將智譜GLM系列大模型應(yīng)用在各個設(shè)備的業(yè)務(wù)場景中,未來將在三個關(guān)鍵技術(shù)能力上進(jìn)行長期深入合作,一是面向復(fù)雜場景的任務(wù)智能體、二是面向更廣泛的UI理解和自動交互規(guī)劃執(zhí)行的能力,三是端云協(xié)同的多模態(tài)理解和生成的大模型。
華碩AIPC智能生態(tài)負(fù)責(zé)人鐘懷圣表示,華碩和智譜共同打造云一體的AIPC智能助手“小碩知道”和“豆丁知道”。其中,“小碩知道”將應(yīng)用在華碩的靈耀和無畏系列筆記本上,涵蓋了AI繪畫、AI識圖功能,而且用戶可自如調(diào)節(jié)屏幕亮度、藍(lán)牙、音量等,并控制打開第三方軟件。據(jù)介紹,“小碩知道”將在2025年第一季度上線。
小鵬汽車座艙智能語音/智能化業(yè)務(wù)負(fù)責(zé)人廉磊表示,小鵬和智譜共同打造了小P智能語音助手。例如只需說出“你好,小P”,即可激活語音助手,無論是調(diào)節(jié)車內(nèi)溫度、導(dǎo)航到目的地、播放音樂,還是詢問天氣,小P都能迅速響應(yīng)并執(zhí)行命令。
AI智能體想象空間逐步打開
今年以來,AI Agent(AI智能體)成為生成式AI領(lǐng)域的一個熱詞,被視為AI落地的重要載體。所謂AI智能體,就是具備AI能力的一個智能實(shí)體,既可以是硬件裝置,也可能是軟件系統(tǒng),可以感知環(huán)境、進(jìn)行決策、執(zhí)行任務(wù)。“通俗來講,AI智能體就像是一個有智商、有情商、能理解、會幫忙的小助手,不僅能理解人類語言,而且還能通過學(xué)習(xí)和數(shù)據(jù)分析提高自己在特定領(lǐng)域的技能水平。”北京通用人工智能研究院先進(jìn)技術(shù)中心副主任陳浩表示。
今年7月,百度創(chuàng)始人李彥宏在2024世界人工智能大會暨人工智能全球治理高級別會議產(chǎn)業(yè)發(fā)展主論壇上就表示,智能體是開發(fā)最簡單的AI應(yīng)用,也是他最看好的AI應(yīng)用的發(fā)展方向,醫(yī)療、教育、金融、制造、交通、農(nóng)業(yè)等各行業(yè)領(lǐng)域,未來都會依據(jù)自己的場景和特有經(jīng)驗(yàn)、規(guī)則、數(shù)據(jù)等,做出各種智能體。微軟創(chuàng)始人比爾·蓋茨也曾公開表示,智能體不僅會改變?nèi)祟惻c計(jì)算機(jī)的互動方式,還將顛覆軟件行業(yè),帶來自圖形用戶界面誕生以來最大的計(jì)算革命。比爾·蓋茨還稱,智能體將會像過去的Android、iOS和Windows一樣,成為下一個平臺。
當(dāng)前,國內(nèi)外科技巨頭在AI智能體領(lǐng)域頻頻發(fā)力,均取得了顯著的進(jìn)展。國內(nèi)廠商方面,除了智譜AI以外,字節(jié)跳動發(fā)布了一款A(yù)I智能體耳機(jī)Ola Friend。該耳機(jī)可接入豆包大模型,單耳6.6克,售價1199元。用戶戴上耳機(jī)后,無需打開手機(jī),只需喊出關(guān)鍵詞“豆包豆包”,便能喚起豆包進(jìn)行對話。百度也于最近發(fā)布了首款搭載中文大模型的原生AI眼鏡小度AI眼鏡,用戶可以通過語音與眼鏡進(jìn)行交互,向它提問或下達(dá)指令。
國外科技大廠也屢獲突破。去年年底,Meta發(fā)布內(nèi)置Llama大模型的智能眼鏡Ray-Ban Meta。蘋果、Midjourney等公司也在探索頭顯與AI的結(jié)合。前不久,據(jù)彭博社報(bào)道,OpenAI將在明年1月推出智能體“Operator”(操作員),為用戶自動執(zhí)行任務(wù),用戶只需在電腦上下達(dá)指令,智能體就會自動幫助用戶編碼、訂餐、做攻略等。
銀河證券研報(bào)指出,大模型從“訓(xùn)練”向“推理”演繹,AI智能體將成為通往通用人工智能時代的必經(jīng)之路。隨著大型模型快速迭代升級,基于大型模型技術(shù)的AI智能體迎來了快速發(fā)展的階段。AI智能體的崛起正重塑AI產(chǎn)業(yè)鏈并帶來投資新機(jī)遇。預(yù)計(jì)到2028年,中國AI代理市場規(guī)模將激增至8520億元,年復(fù)合增長率達(dá)72.7%。AI智能體產(chǎn)業(yè)鏈?zhǔn)嵌嘣腋叨葏f(xié)同生態(tài)系統(tǒng),未來市場空間廣闊,同時將推動APP生態(tài)逐漸向端側(cè)生態(tài)轉(zhuǎn)變,將成為AI應(yīng)用發(fā)展新趨勢。
校對:陶謙