2024年12月,梁文鋒在朋友圈轉(zhuǎn)發(fā)了一篇文章,內(nèi)文是其為文藝復(fù)興科技公司創(chuàng)始人——“量化之王”詹姆斯·西蒙斯的傳記《征服市場(chǎng)的人:西蒙斯傳》一書所做的序言,其中有句話寫道,“西蒙斯是幸運(yùn)的,他遇到了好的時(shí)代。”

梁文鋒無(wú)疑同樣是幸運(yùn)的,他遇到了能令自己大放異彩的AI時(shí)代。如今,隨著R2模型發(fā)布越來(lái)越近,全行業(yè)都在期待梁文鋒帶來(lái)的新驚喜。

01

憑借R1發(fā)布爆火之前,梁文鋒其實(shí)引發(fā)過(guò)兩次行業(yè)熱議。

2023年4月,千億量化私募巨頭幻方量化發(fā)布公告,稱將集中資源和力量,投身人工智能技術(shù),成立新的獨(dú)立研究組織,探索AGI(通用人工智能)。

一個(gè)月后的2023年5月,該組織被命名為“深度求索”,并發(fā)布了首款模型DeepSeek V1。當(dāng)時(shí),《財(cái)經(jīng)十一人》報(bào)道稱,國(guó)內(nèi)擁有超過(guò)1萬(wàn)枚GPU的企業(yè)不超過(guò)5家。而DeepSeek就是其中之一,并由此開(kāi)始得到外界關(guān)注。

及至2024年5月,DeepSeek再次借助大模型價(jià)格戰(zhàn)一躍成名。當(dāng)時(shí),DeepSeek發(fā)布了DeepSeek V2開(kāi)源模型,并在行業(yè)內(nèi)率先降價(jià),將推理成本降到每百萬(wàn)token僅1塊錢,約等于GPT-4 Turbo的七十分之一。

隨后,字節(jié)、騰訊、百度、阿里等大廠紛紛降價(jià)跟進(jìn)。中國(guó)大模型價(jià)格戰(zhàn)由此揭幕。

只不過(guò),當(dāng)時(shí)暫未推出C端應(yīng)用的梁文鋒,其聲量更多局限在大模型行業(yè)圈層,外界的更多目光被吸引到了科技大廠身上。

爆火之前,梁文鋒也曾渴望得到投資機(jī)構(gòu)的青睞,但在找不同出資方洽談后,很多VC在退出需求下,因看不到商業(yè)化前景,而放棄了投資梁文鋒的可能性。

但隨著DeepSeek爆火,梁文鋒成了一眾投資機(jī)構(gòu)的座上賓,還是請(qǐng)不到的那種。

就連一直宣稱不投資大模型的朱嘯虎,都在感受完DeepSeek新模型后,希望能夠參與其中。

值得一提的是,DeepSeek的爆火,并未改變梁文鋒一貫的低調(diào)作風(fēng)。

成立DeepSeek之前,作為幻方量化創(chuàng)始人,由于梁文鋒一直隱身幕后,外界在很長(zhǎng)一段時(shí)間內(nèi)都以為公司核心高管只包括另外兩位聯(lián)合創(chuàng)始人。

即便因DeepSeek一夜成名,梁文鋒依然繼續(xù)保持著每天看論文、寫代碼、參與小組討論的習(xí)慣,且至今DeepSeek都暫未設(shè)立公關(guān)團(tuán)隊(duì),對(duì)外發(fā)聲主要通過(guò)在相關(guān)社交媒體上設(shè)立的官方賬號(hào),以及上百個(gè)DeepSeek微信交流群。

自1月20日DeepSeek R1發(fā)布至今,梁文鋒唯二的公開(kāi)露面,一次是上了新聞聯(lián)播,一次是參加民營(yíng)企業(yè)家座談會(huì)。

盡管甚少露面,但通過(guò)國(guó)內(nèi)外科技大佬之口,梁文鋒一直活躍在大眾視野。

只不過(guò),不同于硅谷如馬斯克、奧特曼等人對(duì)DeepSeek和梁文鋒的質(zhì)疑之聲,國(guó)內(nèi)科技大佬幾乎清一色展現(xiàn)出了對(duì)DeepSeek的擁抱,和對(duì)梁文鋒的贊賞。

靠接入DeepSeek攫取到最大紅利之一的馬化騰,在談到梁文鋒時(shí)稱“很敬佩市場(chǎng)上出現(xiàn)獨(dú)立、開(kāi)源的產(chǎn)品,我們非常尊重。”

去年12月宣布追逐AGI的李想,在時(shí)隔130天后,再次對(duì)外談及AI,不僅認(rèn)為DeepSeek加速了理想在大模型上的研發(fā)效率,而且總結(jié)了自己對(duì)梁文鋒的兩個(gè)印象,“第一他是個(gè)特別自律的人,第二他是會(huì)在全世界范圍之內(nèi)去研究和學(xué)習(xí)最佳實(shí)踐和最好的方法論的人。”

當(dāng)然,被梁文鋒改變的科技大佬名單還有很長(zhǎng),包括張一鳴、李彥宏、蔡崇信……

02

被聚光燈環(huán)繞的梁文鋒,卻選擇了一系列反常識(shí)的操作。

盡管受到萬(wàn)千矚目,但梁文鋒既沒(méi)有利用投資人的熱情,瘋狂融資擴(kuò)張資源,也沒(méi)有借機(jī)做大C端用戶規(guī)模。

在各路投資人看來(lái),上述場(chǎng)景原本應(yīng)該是擺在梁文鋒面前的一手好牌。

對(duì)于想要參與投資DeepSeek的朱嘯虎來(lái)說(shuō),梁文鋒的安卓開(kāi)源夢(mèng)想,再往前走是需要燒錢的。

更現(xiàn)實(shí)的考量上,無(wú)論是未來(lái)在模型路線上繼續(xù)scale up,還是承接B端和C端暴漲的客戶需求和流量,在外界看來(lái),梁文鋒都需要用更多的錢來(lái)構(gòu)建更充裕的算力資源。

2月份,甚至外界一度傳出阿里將以100億美元估值,投資DeepSeek 10億美元占股10%的消息,但被阿里予以否認(rèn)。

不過(guò),據(jù)投中網(wǎng)消息,彼時(shí)DeepSeek確實(shí)在與部分投資人接觸,希望以80億美元估值尋求融資,當(dāng)時(shí)國(guó)內(nèi)AI六小龍中估值最高的也不超過(guò)40億美元。

但事實(shí)是,爆火100天內(nèi),DeepSeek官方API一度因調(diào)用需求過(guò)高而暫停充值服務(wù),APP也幾度因服務(wù)繁忙而頻頻卡頓,但梁文鋒除了帶隊(duì)優(yōu)化服務(wù)體驗(yàn)外,并沒(méi)有明顯的算力擴(kuò)建跡象,也絲毫未展現(xiàn)出對(duì)用戶規(guī)模效應(yīng)的追逐。融資一事被暫時(shí)擱置了。

這也使得DeepSeek成了中國(guó)大模型創(chuàng)業(yè)公司中,唯一一家只做基礎(chǔ)模型、暫不考慮商業(yè)化的公司,還要加上一條,即暫未尋求外部融資的公司。

與在融資上的猶疑相反,梁文鋒則繼續(xù)堅(jiān)持踐行開(kāi)源。2月底,梁文鋒帶領(lǐng)DeepSeek用一場(chǎng)開(kāi)源周行動(dòng),通過(guò)開(kāi)源FlashMLA、DeepEP通信庫(kù)、DeepGEMM等多個(gè)代碼庫(kù),向外界證明了DeepSeek小力出奇跡的原因所在,并首度對(duì)外揭秘了一系列針對(duì)英偉達(dá)H卡的算力優(yōu)化方案。

同時(shí),梁文鋒繼續(xù)沿著擬定好的節(jié)奏,追趕AGI腳步。

在內(nèi)部規(guī)劃中,梁文鋒曾表示,團(tuán)隊(duì)押注了三個(gè)方向:一是數(shù)學(xué)和代碼,二是多模態(tài),三是自然語(yǔ)言本身。圍繞這三條路,梁文鋒在過(guò)去100天內(nèi)動(dòng)作頻頻。

2月18日,DeepSeek發(fā)布了最新的技術(shù)論文,以挑戰(zhàn)Transformer架構(gòu)最核心的注意力機(jī)制,讓它能更高效地處理更長(zhǎng)的上下文。

尤其值得一提的是,梁文鋒的名字,也出現(xiàn)在了上述論文的共同作者里。文中,DeepSeek提出的新架構(gòu)NSA(原生稀疏注意力)在基準(zhǔn)測(cè)試中,與全注意力機(jī)制相比,準(zhǔn)確率相同或更高。

除了帶領(lǐng)團(tuán)隊(duì)創(chuàng)新算法,梁文鋒還推動(dòng)著公司在模型更新上的節(jié)奏。

語(yǔ)言模型上,3月25日,DeepSeek V3模型完成小版本升級(jí),上線新版本DeepSeek-V3-0324,官方稱其大幅提高了在推理類任務(wù)上的表現(xiàn)水平,中文寫作和中文搜索能力也都得到了優(yōu)化。

一個(gè)月后,數(shù)學(xué)和代碼新模型DeepSeek-Prover-V2也來(lái)了。以DeepSeek-V3作為基礎(chǔ)模型微調(diào)而來(lái)的Prover-V2,其參數(shù)規(guī)模擴(kuò)展到了671B,相較于前一代V1.5版本的7B,參數(shù)規(guī)模增加了近百倍,這讓其在數(shù)學(xué)測(cè)試集上的效率和正確率都變得更高。

03

盡管梁文鋒還能保持自己的節(jié)奏推進(jìn)模型更新,但外界的AI發(fā)展步伐已經(jīng)被DeepSeek重構(gòu)了。

在梁文鋒驗(yàn)證成功低成本大模型訓(xùn)練方法后,AI行業(yè)開(kāi)始分裂出兩條進(jìn)化路線:一是繼續(xù)堅(jiān)持Scaling Law,奉行大力出奇跡,堆高算力資源,訓(xùn)練更強(qiáng)大的基礎(chǔ)大模型;二是追隨梁文鋒,以性價(jià)比思路開(kāi)道,用更少資源訓(xùn)練更強(qiáng)大的專用模型。

圍繞兩條不一樣的大模型進(jìn)化路線,中美在AI發(fā)展策略上的分歧進(jìn)一步擴(kuò)大:硅谷AI創(chuàng)企繼續(xù)追求Scaling Law,融資額屢創(chuàng)新高,前有OpenAI宣布完成歷史性的400億美元新融資,后有傳聞中正在尋求200億美元新融資的馬斯克的xAI。

反觀被冠以“AI六小龍”稱號(hào)的國(guó)內(nèi)AI創(chuàng)企,除了智譜拿下一些國(guó)資投資外,其他五家則罕有融資消息傳出。

典型如零一萬(wàn)物,1月初,零一萬(wàn)物創(chuàng)始人李開(kāi)復(fù)對(duì)外正式表態(tài),自己將退出對(duì)AGI的追尋,未來(lái)公司主攻中小參數(shù)的行業(yè)模型。“從商業(yè)角度考慮,我們認(rèn)為只有大公司能繼續(xù)做超大模型。”李開(kāi)復(fù)說(shuō)道。

DeepSeek爆火后,李開(kāi)復(fù)更是將公司直接定位為一家開(kāi)發(fā)AI應(yīng)用的公司。

“AI六小虎”其他玩家也不同程度受到?jīng)_擊:月之暗面暫停大規(guī)模廣告投放,戰(zhàn)略重心轉(zhuǎn)向底層模型優(yōu)化;MiniMax 和階躍星辰目前都在探索Agent 相關(guān)的新應(yīng)用;百川智能業(yè)務(wù)重心轉(zhuǎn)向醫(yī)療;智譜AI重點(diǎn)布局政務(wù)、金融等市場(chǎng)。

國(guó)內(nèi)科技大廠也不再對(duì)外講述大力出奇跡的的AI敘事,而是紛紛跟梁文鋒拼起了性價(jià)比。李彥宏更是在4月份的一場(chǎng)演講中,點(diǎn)名DeepSeek慢且貴。

但DeepSeek紅利之下,科技大廠又是結(jié)結(jié)實(shí)實(shí)享受到了一波紅利。最大受益者騰訊,更是憑借率先接入DeepSeek的舉動(dòng),助推旗下騰訊元寶一度超越豆包,成為國(guó)內(nèi)AI助手下載量第一。

擁抱梁文鋒之外,科技大廠的更大野心則在于超越梁文鋒。直觀表現(xiàn)之一是,在接入DeepSeek之外,科技大廠都紛紛加碼了模型自研的決心。

從OpenAI到DeepSeek,這些驚艷業(yè)界的AI大模型公司,之所以能創(chuàng)新不斷,更重要的是依靠了一幫才華橫溢的年輕人。

作為DeepSeek創(chuàng)始人的梁文鋒,更是將人才組織,視為自家在AGI大戰(zhàn)中的護(hù)城河,不是閉源,更不是招募行業(yè)頂尖牛人。年輕人身上所具備的對(duì)創(chuàng)新的自信信念,成為梁文鋒對(duì)這一群體青睞有加的重點(diǎn)所在。

現(xiàn)在,包括字節(jié)、騰訊、阿里、美團(tuán)和京東在內(nèi)的科技大廠,也想將年輕人身上的這種創(chuàng)新信念,汲取到自家公司身上,并由此開(kāi)啟了各自的“天才少年”招募計(jì)劃。

但在科技大廠追趕梁文鋒之前,全行業(yè)正在等待梁文鋒帶著自己的天才少年,發(fā)布新的R2模型。

參考資料:

本文系作者 字母榜 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

2025-09-16 23:02

國(guó)內(nèi)期貨夜盤收盤漲跌不一,燃油漲超1%

2025-09-16 22:48

禮來(lái)計(jì)劃在弗吉尼亞州投資50億美元建設(shè)生產(chǎn)設(shè)施

2025-09-16 22:40

納斯達(dá)克中國(guó)金龍指數(shù)創(chuàng)2022年2月以來(lái)新高

2025-09-16 22:35

《紐約時(shí)報(bào)》回應(yīng)特朗普起訴其誹謗:毫無(wú)法律依據(jù)

2025-09-16 22:33

蘋果股價(jià)漲近2%

2025-09-16 22:31

蜂巢能源楊紅新:正開(kāi)發(fā)能量密度360Wh/kg軟包半固態(tài)電池,已送樣

2025-09-16 22:23

今年中國(guó)已有50款創(chuàng)新藥獲批上市,超去年全年

2025-09-16 22:21

奧飛娛樂(lè):選舉蔡?hào)|青為董事長(zhǎng),聘任蔡曉東為總經(jīng)理

2025-09-16 22:20

美法官駁回聯(lián)合健康集團(tuán)高管槍殺案嫌疑人兩項(xiàng)刑事指控

2025-09-16 22:17

現(xiàn)貨黃金升破3700美元/盎司,續(xù)創(chuàng)歷史新高

2025-09-16 22:13

太二回應(yīng)門店活魚現(xiàn)殺爭(zhēng)議:鮮活門店現(xiàn)有68家,明年完成所有門店調(diào)改

2025-09-16 22:11

弘陽(yáng)地產(chǎn):清盤呈請(qǐng)聆訊延期至2026年3月23日

2025-09-16 22:10

美元指數(shù)跌破97關(guān)口,歐元兌美元上漲至四年來(lái)最高水平

2025-09-16 22:09

比亞迪:1-8月海外乘用車及皮卡銷售累計(jì)超63萬(wàn)輛,積極關(guān)注具身智能機(jī)器人領(lǐng)域

2025-09-16 22:07

人力資本管理軟件廠商Workday將斥資近11億美元收購(gòu)AI公司Sana

2025-09-16 22:00

印度金達(dá)爾就蒂森克虜伯鋼鐵部門提出收購(gòu)要約

2025-09-16 21:59

貝萊德ETHA的以太坊持倉(cāng)量突破380萬(wàn)枚,持倉(cāng)市值超170億美元

2025-09-16 21:58

亞洲電視控股:接獲清盤呈請(qǐng),將于11月19日聆訊

2025-09-16 21:54

亞鉀國(guó)際:公司董事、高級(jí)管理人員計(jì)劃減持不超過(guò)54萬(wàn)股股份

2025-09-16 21:53

市場(chǎng)恐慌指數(shù)VIX創(chuàng)一周新高

掃描下載App