我們需要更多的DeepSeek。
“中國距離追上ChatGPT還有多遠(yuǎn)?”
過去幾年里,這是幾乎每個中國大模型從業(yè)者們都被反復(fù)拷問的話題。
2025年初,這個問題被重新解構(gòu)。 “來自東方的神秘力量”攪動全球科技圈,一度帶崩芯片股,也引領(lǐng)了持續(xù)一個月的“DeepSeek熱”。從巴黎到迪拜,近期所有國際性AI大會都在討論它,盡管它并未參加。
風(fēng)投機(jī)構(gòu)a16z創(chuàng)始人安德森將DeepSeek R1描述為“人工智能的斯普特尼克時刻”,斯普特尼克是蘇聯(lián)在1957年先于美國發(fā)射的人造衛(wèi)星。 ScaleAI創(chuàng)始人亞歷山大·王的觀點更激進(jìn):過去十年來,美國可能一直在AI競賽中領(lǐng)先于中國,但DeepSeek的AI大模型發(fā)布可能會“改變一切”。
壓力之下,海外AI巨頭近期動作頻頻,谷歌端出了熱乎的新產(chǎn)品Gemini2.0系列,xAI發(fā)布了馬斯克口中“地球上最聰明的人工智能”Grok 3,為坐穩(wěn)大模型王座,OpenAI也變得焦慮,CEO在線投票征集開源方案。
以DeepSeek為代表的中國模型看起來追上甚至部分超越了一向領(lǐng)先的海外模型。QuestMobile數(shù)據(jù)顯示,DeepSeek日活躍用戶已在2月1日突破3000萬大關(guān),成為史上最快達(dá)到這一里程碑的應(yīng)用。隨后,全球最大的代碼托管平臺GitHub顯示,DeepSeek的Star量(星標(biāo))超過了OpenAI。
全球在人工智能領(lǐng)域長期角力進(jìn)入新階段,全球的大模型實力差距到了重估的時候。
通往羅馬的路不只有一條
自2022年底ChatGPT發(fā)布以來,中國AI的主流敘事一直是“追趕”。過去一兩年,當(dāng)被問及我們離OpenAI有多遠(yuǎn)時,有從業(yè)者給出的答案還是代差兩三年。2025年,這個問題的答案會更樂觀。
“通往羅馬的路并不是只有一條,可能有很多風(fēng)景更優(yōu)美的路徑?!睏髑蹇萍紕?chuàng)始人兼 CEO 高雪峰對第一財經(jīng)記者表示, DeepSeek-R1 將很多方面的研究創(chuàng)新性地組合在一起,并真正實驗,達(dá)成了現(xiàn)在的效果,的確是一件值得讓全球關(guān)注的創(chuàng)新性研究成果。
復(fù)旦大學(xué)計算機(jī)科學(xué)技術(shù)學(xué)院教授邱錫鵬則用“令人震驚”形容R1系列中的R1-Zero,以往大模型團(tuán)隊復(fù)刻GPT-o1時會遇到如何拿到訓(xùn)練數(shù)據(jù)的重要問題,而R1-zero證明了純RL就能增強(qiáng)模型推理能力?!斑@讓人產(chǎn)生非常大的遐想,打開了思路:未來是不是有很大的機(jī)會能通過大規(guī)模RL在推理路線上超越o1?”邱錫鵬說。
CIC灼識咨詢執(zhí)行董事董曉雅在接受記者采訪時認(rèn)為,DeepSeek的爆火意味著中國的AI已大幅拉近了與美國技術(shù)的差距?!癉eepSeek證明中國能夠在既有的技術(shù)框架下,通過局部創(chuàng)新與大規(guī)模系統(tǒng)級工程優(yōu)化,實現(xiàn)對國際領(lǐng)先水平的追趕甚至超越?!?/p>
而從AI從業(yè)者的感知來看,今年年初曾前往硅谷的光輪智能創(chuàng)始人謝晨對第一財經(jīng)記者說,他發(fā)現(xiàn)硅谷在AI領(lǐng)域的認(rèn)知其實和國內(nèi)頂尖創(chuàng)業(yè)者的認(rèn)知并沒有太大差異,且形成了相當(dāng)程度的共識。例如,“預(yù)訓(xùn)練不行了,要轉(zhuǎn)向后訓(xùn)練”、“RLHF很關(guān)鍵”、“具身智能前景廣闊”等,其實這些在國內(nèi)早已有深入討論,硅谷正在“祛魅”。
不只是DeepSeek,復(fù)旦大學(xué)計算機(jī)科學(xué)技術(shù)學(xué)院教授、上海市數(shù)據(jù)科學(xué)重點實驗室主任肖仰華對第一財經(jīng)記者表示,單純從國內(nèi)外模型的效果上來看,我們的差距已經(jīng)比較微弱。無論是黑馬大模型Deepseek還是大廠派的通義千問系列,從模型效果上看,都已經(jīng)非常接近海外頂尖模型。
如果看向模型榜單,中國AI勢力不容小覷。全球知名AI模型評測平臺Chatbot Arena(大模型競技場)公布的最新一期榜單顯示,Top11名單中(包含部分并列的模型,總數(shù)不止11個),國內(nèi)4家大模型廠商共有6款產(chǎn)品上榜,包括排在第5位的推理模型DeepSeek-R1,第8位的通義千問Qwen2.5-Max,并列第10位的DeepSeek-V3、Qwen-Plus-0125和智譜AI的GLM-4-Plus-0111,階躍星辰的Step-2-16K-Exp排在11位。
大模型競技場是業(yè)界公認(rèn)的榜單之一,采用匿名方式將大模型兩兩組隊,交給用戶進(jìn)行盲測(提出任何相同問題),根據(jù)真實對話體驗對模型能力進(jìn)行投票。這份榜單部分可以代表中國大模型在全球市場的競爭力。
分領(lǐng)域來看,在基座大模型領(lǐng)域,通義千問旗艦版模型Qwen2.5-Max模型擠進(jìn)了基座模型TOP5,排在前面的是xAI最新發(fā)布的Grok-3,谷歌旗艦?zāi)P虶emini 2.0 Pro、OpenAI最新的GPT-4o模型,以及谷歌通用模型Gemini 2.0 Flash。DeepSeek-V3作為基座模型排在第6位。
在推理模型領(lǐng)域,DeepSeek的R1已經(jīng)擠進(jìn)全球開閉源推理模型TOP3,在榜單中僅次于谷歌的推理模型Gemini 2.0 Flash Thinking,超過OpenAI的o1。
除了榜單外,從在專利、頂會論文等維度來看,中國在大模型賽道上也展現(xiàn)出強(qiáng)大的競爭實力。
根據(jù)去年7月發(fā)布的《2023全球人工智能創(chuàng)新指數(shù)報告》顯示,在主要國家人工智能頂級論文數(shù)量和主要國家人工智能專利授權(quán)數(shù)量上,中國遠(yuǎn)高于美國。
其中,頂會頂刊論文中國作者數(shù)量從2018年的328人增長到2022年的1674人,與美國的差距正逐漸縮小。在主要國家人工智能頂級論文數(shù)量占比上,中國占比36.7%,美國占比22.6%。
專利領(lǐng)域同樣競爭激烈。上述報告稱,在主要國家人工智能專利授權(quán)數(shù)量占比上,中國占比34.7%,美國占比32%。
近日記者從知識產(chǎn)權(quán)信息服務(wù)商智慧芽獲得的數(shù)據(jù)顯示,2020年至2024年期間,美國在人工智能領(lǐng)域累計申請8.4萬余件專利,其中2.4萬余件已獲授權(quán);同期中國在人工智能領(lǐng)域累計申請77.6萬余件專利,其中29.9萬余件已獲授權(quán),分別是美國的9.23倍和12.45倍。
這些領(lǐng)域,中國AI仍需追趕
DeepSeek的橫空出世,讓全球看到了中國AI技術(shù)的潛力,但這場爆火背后,業(yè)界仍需直面與美國AI產(chǎn)業(yè)的差距。這既體現(xiàn)在AI企業(yè)數(shù)量、技術(shù)、算法等顯性維度,也體現(xiàn)在創(chuàng)新土壤與生態(tài)體系的深層結(jié)構(gòu)之中。
根據(jù)《全球數(shù)字經(jīng)濟(jì)白皮書(2024年)》,截至2024年一季度,全球AI企業(yè)中美國占34%,而中國僅占15%。盡管中國AI企業(yè)數(shù)量不少,但與美國相比仍有較大差距。
上述報告還顯示,截至去年7月,全球人工智能大模型有1328個(包含同一企業(yè)、同一模型的不同參數(shù)版本),美國大模型數(shù)量位居全球第一,占44%,位居第二的中國大模型數(shù)量占比為36%。
而在AI獨角獸規(guī)模中,在2023年到2024年第一季度,全球AI獨角獸已有234家,新增數(shù)量為37家,占新增獨角獸總量的40%,其中,美國AI獨角獸120家,中國AI獨角獸71家。
AI目前仍是高度依賴資金投入的燒錢行業(yè),在投融資方面,中美存在不小差距。
過去一年里,全球AI領(lǐng)域投資呈現(xiàn)爆發(fā)式增長,CB Insights報告顯示,去年全球 AI 領(lǐng)域融資總額達(dá)1004億美元,同比增長79.61%,占全球融資總額的69%。其中,美國依然是AI投資的主要力量,AI初創(chuàng)企業(yè)融資額約占全球70%,以伊隆·馬斯克的xAI、OpenAI和Anthropic等為代表的美國AI公司獲得了數(shù)十億美元的巨額投資。中國在2024年的AI初創(chuàng)企業(yè)融資額僅占全球融資額的7%,遠(yuǎn)遠(yuǎn)低于美國。
一位聚焦中美市場的AI創(chuàng)業(yè)者告訴第一財經(jīng)記者,目前美國一級市場仍是繁榮的狀態(tài),一方面表現(xiàn)在VC基金絕對數(shù)量多,另一方面表現(xiàn)在創(chuàng)投生態(tài)完善。從pre-seed一直到A輪甚至B輪,美國VC們形成了一條“流水線”似的投資孵化鏈條,為早期創(chuàng)業(yè)公司保駕護(hù)航,提供了更多的確定性。
另一位AI創(chuàng)業(yè)者對記者舉例,自己在硅谷觀察到,一些AI初創(chuàng)團(tuán)隊的創(chuàng)始人來自斯坦福、MIT 等名校,通常三五人組成小團(tuán)隊、開發(fā)一款產(chǎn)品,并構(gòu)建一個宏大故事,美國投資人態(tài)度寬容,即使團(tuán)隊商業(yè)路徑還未想清楚,也能拿到 50~80 萬美元的種子輪融資,而在國內(nèi)同階段可能很難達(dá)到這種規(guī)模。此后在天使輪階段,即便商業(yè)化尚未完善,也能拿到 500~800 萬美元的投資。
在此前為數(shù)不多對外發(fā)聲中,DeepSeek創(chuàng)始人梁文鋒提到,他的團(tuán)隊不會過早設(shè)計基于模型的應(yīng)用,而會專注在大模型上,目標(biāo)是做研究、做探索。此前DeepSeek也在找不同出資方談,但接觸下來感覺很多VC對做研究有顧慮,VC有退出的需求,希望盡快做出產(chǎn)品商業(yè)化,而按照DeepSeek優(yōu)先做研究的思路,很難從VC獲得融資。
劉知遠(yuǎn)也以DeepSeek為例,稱這是一個非常技術(shù)理想主義、以AGI(通用人工智能)為夢想組建的團(tuán)隊,擁有一個由技術(shù)長期主義推出來的結(jié)構(gòu)?!爸袊呀?jīng)到了這樣一個階段,需要有更多像DeepSeek這樣的團(tuán)隊,但是又不像DeepSeek這么有錢,能不能讓他們踏踏實實地做一些創(chuàng)新?這非常值得我們思考?!?/p>
“我們需要更多的DeepSeek”
DeepSeek的爆火并非終點,而是中國AI從單點突破邁向“系統(tǒng)能力構(gòu)建”的起點。
大模型生態(tài)社區(qū)OpenCSG(開放傳神)創(chuàng)始人陳冉對記者提到建設(shè)生態(tài)的迫切性,有了模型,需要建生態(tài)?!皢吸c有了,但沒有面,沒有網(wǎng)狀生態(tài)?!?/p>
高雪峰同樣認(rèn)為,在基礎(chǔ)算法研究的沉淀上,在大生態(tài)圈的建設(shè)方面,以及在硬件基礎(chǔ)設(shè)施的創(chuàng)新與追趕方面,我們都需要繼續(xù)付出更多的努力。
他表示,DeepSeek將普惠 AI 的基準(zhǔn)水平拉齊到了最前沿的水準(zhǔn)。當(dāng)全球越來越多用戶, AI 技術(shù)生態(tài)就會明顯傾向國內(nèi)優(yōu)秀開源模型,“可以明顯看到,普惠 AI 的風(fēng)已經(jīng)在中國吹響,各個城市的大中小型企業(yè)都在尋求用 DeepSeek的開源技術(shù)來實現(xiàn)自身的智能化場景,這會對模型甚至硬件的發(fā)展帶來不可估量的正向影響。”
高雪峰認(rèn)為,當(dāng)國內(nèi)真正涌現(xiàn)出非常多具備行業(yè)特定推理能力的優(yōu)秀模型與行業(yè)知識體系時,我們會真正具備與任何領(lǐng)先的 AI 技術(shù)競爭的實力,因為國內(nèi)在數(shù)據(jù)整合,知識整合的方面有先天優(yōu)勢。
“雪球就這么滾起來了”。盤古智庫學(xué)術(shù)委員、FutureLabs未來實驗室首席專家胡延平對第一財經(jīng)記者提到,DeepSeek引爆市場帶來巨大的信心提振,有助于接下來形成良性的開源生態(tài)循環(huán), 而接下來一個重要的方向是國產(chǎn)算力要能夠跟上,形成生態(tài)軟硬件協(xié)同。
此外,從技術(shù)創(chuàng)新的角度看,肖仰華認(rèn)為,關(guān)鍵不在于我們是否屬于第一陣營,而在于是否是第一。
“想要與海外頂尖模型競爭,在效果上接近的同時,能否做到成本更低、服務(wù)更優(yōu)、響應(yīng)更快、場景適配更好也很重要。”肖仰華對記者表示,在達(dá)到當(dāng)前性能接近的成果之后,國內(nèi)模型已具備與頭部模型競爭的可能性,但還要看很多其他因素。
“AGI容易形成類似于差之毫厘、失之千里的效應(yīng),即使在某個領(lǐng)域以微弱優(yōu)勢領(lǐng)先,但AI是一種基礎(chǔ)能力,在千行百業(yè)無處不在的應(yīng)用中,會放大這一微弱的領(lǐng)先優(yōu)勢。”因此,國內(nèi)模型并不能滿足于現(xiàn)階段的成果。
他同時也認(rèn)為,AI是全方位的,“例如在具身智能、在千行百業(yè)的應(yīng)用,我們的亮點仍然不多,但是美國已經(jīng)取得了很多世界級的成果?!彼a充道,“我們還需要更多的Deepseek?!?/p>
“此前,國內(nèi)外大模型公司都在追隨OpenAI,DeepSeek-R1追上o1后,國內(nèi)面臨的下一個問題變成了,下一步需要自己走一條全新的路或找到全新的創(chuàng)新點。這是未來看中美差距的關(guān)鍵點?!睆埧×终f。
開創(chuàng)性的突破也需要容忍失敗的勇氣。張俊林提到,國內(nèi)存在做原始創(chuàng)新的可能性,前提是有這種企業(yè)文化:不著急賺錢,在寬松環(huán)境下做各種嘗試。目前看,國內(nèi)只有DeepSeek有這種環(huán)境,但如果其他企業(yè)能復(fù)刻這種環(huán)境,將推動國內(nèi)大模型團(tuán)隊創(chuàng)新甚至反超OpenAI。
肖仰華認(rèn)為,市場投入結(jié)構(gòu)和效率或許需要改變。
他對記者提到,中國在AI方面的資源、資本投入并不少,但主要是自上而下的規(guī)劃和創(chuàng)新,作為輔助的是民營企業(yè)和民間投入的科技創(chuàng)新。
“此次Deepseek的成功,讓我們意識到,來自民營小微企業(yè)等市場主體自發(fā)地創(chuàng)新難能可貴,可能是整個國家科研科技創(chuàng)新體系中非常寶貴的一分子?!?肖仰華說,優(yōu)化投入效率和投入結(jié)構(gòu)很重要。初創(chuàng)企業(yè)、小微企業(yè)和民營企業(yè)是具有創(chuàng)新活力的,是他們的好奇心和創(chuàng)造力成就了這次突破,全社會需要“呵護(hù)”這種創(chuàng)新。