視覺中國 圖
由國產(chǎn)大模型公司深度求索(DeepSeek)旗下最新模型帶來的影響在海外持續(xù)發(fā)酵,市場密切關(guān)注上游AI(人工智能)硬件市場是否會(huì)波及。
1月27日,DeepSeek應(yīng)用登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,在美區(qū)下載榜上超越了ChatGPT。DeepSeek系量化巨頭幻方量化旗下大模型公司,1月20日,該公司正式發(fā)布推理大模型DeepSeek-R1。
推出后不久,R1就憑借其開源的性質(zhì)、大幅下降的售價(jià)和訓(xùn)練成本獲得了廣泛關(guān)注。作為一款開源模型,R1在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能能夠比肩OpenAI o1模型正式版,并采用MIT許可協(xié)議,支持免費(fèi)商用、任意修改和衍生開發(fā)等。
更令市場驚訝的是,據(jù)DeepSeek介紹,R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬美元,在2048塊英偉達(dá)H800 GPU(針對(duì)中國市場的低配版GPU)集群上運(yùn)行55天完成。
此前,AI初創(chuàng)企業(yè)OpenAI和Anthropic一直在與谷歌、Meta等科技巨頭圍繞大模型展開激烈競爭,“大力出奇跡”的“燒錢”模式成為了在這些企業(yè)間流行的選項(xiàng)。例如,Meta預(yù)計(jì)2024年資本支出為 380億至400億美元,而根據(jù)此前財(cái)報(bào)的統(tǒng)計(jì),谷歌的2024年資本支出或超480億美元。微軟和亞馬遜也預(yù)計(jì)2025年資本支出將繼續(xù)上行。
毫無疑問,DeepSeek的橫空出世又增強(qiáng)了這些企業(yè)的危機(jī)感。當(dāng)?shù)貢r(shí)間1月23日,一名臉書母公司Meta的員工在匿名職場論壇Teamblind上發(fā)帖稱,Meta內(nèi)部已經(jīng)因?yàn)镈eepSeek-R1進(jìn)入“恐慌模式”:“Meta的工程師們正在爭分奪秒地分析DeepSeek,試圖復(fù)制其中一切可能的技術(shù)?!庇姓J(rèn)證為谷歌員工的網(wǎng)友回復(fù)稱:“DeepSeek做的事情很瘋狂。不僅是Meta,OpenAI、谷歌和Anthropic都因?yàn)樗麄兌馃ü??!?/p>
R1發(fā)布后不久,Meta首席執(zhí)行官馬克·扎克伯格就宣布,Meta在2025年的資本支出將超600億美元,加大對(duì)AI的投入。1月27日,據(jù)外媒報(bào)道,Meta成立了四個(gè)專門研究小組來研究量化巨頭幻方量化旗下的國產(chǎn)大模型DeepSeek的工作原理,并基于此來改進(jìn)旗下大模型Llama。
當(dāng)?shù)貢r(shí)間1月24日,2024年諾貝爾化學(xué)獎(jiǎng)得主、谷歌DeepMind的CEO德米斯·哈薩比斯(Demis Hassabis)也在采訪中評(píng)價(jià)了DeepSeek:“可以肯定的是,他們?nèi)〉玫某删土钊擞∠笊羁?,中國具有極強(qiáng)的工程和規(guī)?;芰??!?/p>
DeepSeek-R1的出現(xiàn)不僅讓Meta等科技巨頭產(chǎn)生了危機(jī)感,還震動(dòng)了上游概念股。由于R1的顯著進(jìn)步并非完全建立在算力基礎(chǔ)上,華爾街開始考慮科技行業(yè)巨頭對(duì)AI基礎(chǔ)設(shè)施的巨額投資以及對(duì)英偉達(dá)芯片的需求是否合理。
截至發(fā)稿時(shí),美股盤前,英偉達(dá)(Nasdaq:NVDA)跌超11%,博通跌超11%,臺(tái)積電、Arm跌超10%,同時(shí),在日本股市,英偉達(dá)的主要供應(yīng)商Advantest Corp(TYO:6857)的股價(jià)暴跌8.6%。
外媒分析指出,如果DeepSeek的成功能夠鼓勵(lì)A(yù)I初創(chuàng)公司用更少的芯片構(gòu)建強(qiáng)大的AI模型、并將它們更快地推向市場,那么英偉達(dá)的收入增長可能會(huì)放緩,因?yàn)榇竽P烷_發(fā)人員會(huì)復(fù)制DeepSeek使用數(shù)量更少且配置較低的AI芯片的策略。
華爾街研究機(jī)構(gòu)Yardeni Research的分析師Ed Yardeni在報(bào)告中寫道:“對(duì)于計(jì)劃通過高昂的AI服務(wù)主導(dǎo)市場的‘美股七巨頭’而言,(DeepSeek-R1)可能是個(gè)壞消息。關(guān)鍵在于,當(dāng)AI資本支出的飆升速度遠(yuǎn)超收入增速,這是否會(huì)導(dǎo)致市場失望?”Yardeni認(rèn)為,在這種情況下,英偉達(dá)的營收也可能受到波及。
美國投行Raymond James的分析師Srini Pajjuri也在報(bào)告中寫道:“DeepSeek顯然無法獲得與美國超大規(guī)模企業(yè)一樣多的算力,但卻設(shè)法開發(fā)出了一種看起來極具競爭力的模式。一個(gè)自然浮現(xiàn)的問題是,DeepSeek的出現(xiàn)將如何影響算力的增長以及對(duì)硬件和半導(dǎo)體的需求?”
不過,Pajjuri指出,DeepSeek-R1也可能轉(zhuǎn)而促使美國科技巨頭們“更加迫切地利用其關(guān)鍵優(yōu)勢(即英偉達(dá)GPU)來與更便宜的替代品拉開距離”。
摩根大通分析師Joshua Meyers寫道,DeepSeek顛覆性的主張是“更多的投資并不等于更多的創(chuàng)新”,這一觀念開始在美國AI領(lǐng)域引起關(guān)注。不過,Meyers也表示,降低的成本并不意味著AI企業(yè)不再需要更多的算力,更不意味著投入最多資金的一方不會(huì)獲勝,而是會(huì)迫使DeepSeek的競爭對(duì)手提高效率、降低推理成本。
對(duì)于DeepSeek-R1為何能大幅降低訓(xùn)練成本,Logenic AI公司聯(lián)合創(chuàng)始人李博杰對(duì)澎湃新聞?dòng)浾弑硎?,這是由于R1的核心在于后訓(xùn)練階段,所需要的數(shù)據(jù)量和成本都會(huì)遠(yuǎn)低于預(yù)訓(xùn)練階段,相當(dāng)于“站在巨人的肩膀上”。不過,雖然這樣的成功可以復(fù)制,但最前沿的大模型探索還是需要消耗很大的算力和成本,然后才能實(shí)現(xiàn)“左腳踩右腳”的數(shù)據(jù)飛輪效應(yīng)。
而對(duì)于AI模型的訓(xùn)練成本下降是否會(huì)影響上游AI硬件企業(yè),李博杰認(rèn)為,雖然AI目前看起來發(fā)展很快,但背后其實(shí)有很多大家看不到的試錯(cuò)的過程,整體依然處于研究階段,所以“更多的(算力)卡和更多的資源肯定還是有優(yōu)勢的”。
FutureLabs未來實(shí)驗(yàn)室首席專家胡延平表示,接下來要看DeepSeek的熱度能夠持續(xù)多久:“如果不看開源生態(tài),只看C端角度,DeepSeek要想站穩(wěn),至少需要盡快具備多模態(tài)文生圖文生視頻、理解圖像、語音交互等能力,尤其類AVM(全景影像系統(tǒng))、知識(shí)庫、結(jié)合Agent(智能體)等既有形態(tài),能否形成模型矩陣和Apps生態(tài)等,可能會(huì)決定其熱度是短期還是長期,輿論熱度能否充分轉(zhuǎn)化為市場實(shí)地,以及能否內(nèi)與豆包、外與ChatGPT分食市場?!?/p>
澎湃新聞?dòng)浾?胡含嫣