9月21日,風險投資公司安德森·霍洛維茨公司(AndreessenHorowitz,簡稱a16z)發(fā)布了一期重磅訪談視頻。a16z普通合伙人馬丁·卡薩多(MartinCasado)與WorldLabs的兩位領軍人物——被譽為“AI教母”的李飛飛以及她曾經(jīng)的學生賈斯汀·約翰遜(JustinJhonson)展開了一場精彩對話。
此次訪談重點討論了AI的歷史進程、當前挑戰(zhàn)以及未來突破,特別是“空間智能”這一領域的潛力和應用。
回顧AI發(fā)展:從“寒冬”到“大爆發(fā)”
李飛飛在訪談中首先回顧了人工智能的發(fā)展歷程。她表示,盡管許多人對那個時期的AI發(fā)展持悲觀態(tài)度,稱之為“AI的寒冬”,但她卻始終認為這是“春前的冬眠”。
李飛飛形象地描述道,人工智能正經(jīng)歷著“大爆發(fā)”式的快速發(fā)展。她強調(diào),當前的AI已經(jīng)不僅限于文本處理,在音頻、視頻等多模態(tài)領域也正在迅速崛起,這為AI帶來了無數(shù)的可能性。
賈斯汀則通過自己的學術經(jīng)歷,回顧了深度學習的興起,并強調(diào)算力的飛速提升對AI發(fā)展的關鍵作用:“算力的增長是驚人的,以前需要6天才能完成的任務,現(xiàn)在只需要不到5分鐘就能完成?!彼镁唧w的例子說明,隨著技術的發(fā)展,AI的能力在幾何級數(shù)上攀升。
空間智能:3D世界的AI革命
作為此次對話的核心話題之一,李飛飛和賈斯汀深刻剖析了“空間智能”的革命性潛力。李飛飛定義道:“空間智能是機器在3D空間和時間中感知、推理和行動的能力?!?/p>
李飛飛表示,視覺空間智能是她的“北極星”。她指出,空間智能與語言智能一樣重要,甚至在某些方面可能更古老、更基礎。她還提到,AI的發(fā)展不會局限于處理平面圖像或文本,而是會邁向?qū)θS世界的理解,這是智能發(fā)展的自然延伸。
賈斯汀進一步解釋了空間智能與傳統(tǒng)基于語言的AI之間的差異:“語言模型的底層表示是一維的,但世界是三維的。我們認為,世界的三維特性應該在表示中占據(jù)核心地位?!彼J為,空間智能不僅僅是對圖像或視頻的2D處理,而是通過3D模型來推動機器理解物理世界的本質(zhì)。
李飛飛還從進化的角度闡述了空間智能的重要性:“智能的進化使動物,尤其是人類,能夠在世界中移動,與世界互動,甚至創(chuàng)造文明。這種能力不僅僅是感知二維世界,更是理解并應對三維的真實物理環(huán)境。”
“視覺智能是我的激情所在,因為我相信每一個智能生物,如人類、機器人或其他形式,都必須具備看待世界、推理世界和與世界互動的能力?!崩铒w飛進一步解釋,空間智能不僅是技術上的突破,更是構建未來AI生態(tài)的關鍵。
李飛飛強調(diào),當前的計算能力更加成熟,數(shù)據(jù)理解比以往更深入,算法進展迅速,正是探索空間智能的關鍵時刻。
應用場景:虛擬與現(xiàn)實世界融合
當談及空間智能的潛在應用時,賈斯汀表示:“未來的AI不僅能生成圖像或視頻,還能創(chuàng)建一個充滿活力和交互性的3D世界。”他設想,空間智能能夠應用在游戲、教育、虛擬攝影等多個領域,甚至開啟一種全新的媒體形式。這不僅降低了3D內(nèi)容制作的成本,還可能會激發(fā)更多的沉浸式體驗。
李飛飛則補充了增強現(xiàn)實(AR)和虛擬現(xiàn)實(VR)的應用場景。她提到:“這種技術將成為AR/VR的‘操作系統(tǒng)’,幫助人類增強能力。”
她舉例說,未來,佩戴AR眼鏡的人可能不需要任何專業(yè)技能,就能修理汽車或完成復雜的操作。她認為,通過空間智能,虛擬世界與現(xiàn)實世界的融合將大大增強人類與機器的互動能力。
賈斯汀指出,隨著這項技術的成熟,未來我們可能不再需要使用手機、平板等不同尺寸的屏幕。他表示:“如果你能夠?qū)⑻摂M內(nèi)容與物理世界無縫融合,那么對所有這些屏幕的需求就會減少。”
李飛飛還提到了蘋果發(fā)布的VisionPro。她笑稱,“就在WorldLab成立的時候,蘋果發(fā)布了VisionPro。蘋果使用了‘空間計算’這個詞,幾乎是‘偷’了我們的名字,我們是‘空間智能’?!?/p>
邁向“北極星”的旅程
在對話的最后,馬丁·卡薩多問及如何衡量空間智能的成功。李飛飛表示:“當我們看到越來越多的企業(yè)和用戶開始使用我們的模型來解鎖他們的需求時,那將是我們到達一個重要里程碑的時刻?!钡仓赋?,追逐技術的“北極星”是一場永無止境的旅程,空間智能的未來充滿了無限可能。
賈斯汀則認為,空間智能的終極目標是理解宇宙的四維結(jié)構,技術的每一次突破都會開啟更多的未知領域:“我們永遠不會到達終點,但這正是技術魅力所在?!?/p>