5月27日下午16點多,接任螞蟻集團(tuán)CEO僅87天的韓歆毅,穿著黃色短袖來到杭州螞蟻A空間正進(jìn)行的“螞蟻黑客松”比賽,并坐在前排臺階上仔細(xì)聆聽。今年3月,獲清華大學(xué)經(jīng)濟(jì)學(xué)碩士學(xué)位的韓歆毅升任螞蟻集團(tuán)CEO。
支付寶雙飛輪、AI First和加速全球化是螞蟻集團(tuán)的三大戰(zhàn)略。事實上,螞蟻和其他互聯(lián)網(wǎng)公司一樣,近兩年一直在 AI 領(lǐng)域進(jìn)行投入。去年螞蟻20周年時候,螞蟻集團(tuán)董事長井賢棟宣布,未來20年,螞蟻要做一家科技驅(qū)動、創(chuàng)新驅(qū)動的公司。
其中,在AI First戰(zhàn)略下,螞蟻推出了金融、醫(yī)療、生活服務(wù)三款A(yù)I應(yīng)用,螞蟻內(nèi)部業(yè)務(wù)也做了很多變革,支付寶、螞蟻國際等核心業(yè)務(wù)加速AI化,螞蟻內(nèi)部也成立了通用人工智能(AGI)部門,開源2900億參數(shù)規(guī)模的百靈大模型,引發(fā)關(guān)注。
韓歆毅在27日下午的內(nèi)部技術(shù)日活動上首次詳解螞蟻AI戰(zhàn)略。
他用時三十多分鐘,全面清晰談未來螞蟻的AI戰(zhàn)略布局。在韓歆毅看來,中國 AI 大模型賽道競爭激烈,螞蟻將聚焦AI應(yīng)用側(cè),利用AI基座大模型技術(shù)做更強(qiáng)的技術(shù)服務(wù)能力。
“今天,我們永遠(yuǎn)是在AI技術(shù)突破的邊界上做一款PMF產(chǎn)品,如果技術(shù)路線不收斂,產(chǎn)品很難突破;技術(shù)路線收斂了,我們就敢于往里去投、去砸。大家說你聚焦AI應(yīng)用,還要不要做基礎(chǔ)大模型,年初討論的時候我們答案非常堅決,一定要,因為如果基于AI做服務(wù)和應(yīng)用,就像訓(xùn)練一個人去做所有的事,追求智能上限,會讓這個人更加聰明,能夠做更多、更好的服務(wù)。我們很堅定去探索AGI、探索智能上限。”韓歆毅稱,未來,AI 時代將會重新定義一切。
螞蟻集團(tuán)CEO韓歆毅
對于AI大模型領(lǐng)域來說,螞蟻最重磅的消息無疑是今年3月百靈大模型團(tuán)隊(Ling Team)發(fā)布的兩款MoE開源大模型論文。
今年3月,螞蟻百靈大模型團(tuán)隊開源2個MoE架構(gòu)的大語言模型Ling-lite(0220版本)和Ling-plus。
其中,Ling-lite參數(shù)規(guī)模168億(激活參數(shù)27.5億),Ling-plus基座模型參數(shù)規(guī)模高達(dá)2900億(激活參數(shù)288億),并且在多個算力平臺(包括非Hopper架構(gòu)的國產(chǎn)算力)進(jìn)行訓(xùn)練,預(yù)訓(xùn)練階段將計算成本降低約20%,每1萬億token成本達(dá)508萬元,最終實現(xiàn)行業(yè)頭部模型水平的性能表現(xiàn),并驗證了300B尺寸的SOTA MoE大語言模型在非高端算力平臺上訓(xùn)練的可行性。
同時,螞蟻強(qiáng)化學(xué)習(xí)AReaL團(tuán)隊還開源了AReaL-boba,可用128張H800 GPU 在1天訓(xùn)練完成SOTA 1.5B推理模型訓(xùn)練,256張H800 GPU 2天內(nèi)完成SOTA 7B推理模型訓(xùn)練。
過去幾個月,螞蟻百靈大模型團(tuán)隊進(jìn)行了迭代,Ling-lite升級到了1.5版本,相比上一代新模型的推理能力有了顯著提升,同尺寸MoE SOTA,僅用2.75B激活計算可對標(biāo)10B內(nèi)SOTA dense模型。Ling-lite-1.5采用分層語料預(yù)訓(xùn)練策略和需求驅(qū)動的執(zhí)行優(yōu)化體系,以更少的語料和更高的質(zhì)量,性能超過同尺寸下SOTA模型,大幅提升數(shù)學(xué)、代碼等推理能力。
5月27日舉行的第十屆螞蟻技術(shù)日上,螞蟻百靈大模型團(tuán)隊宣布,即將逐步開源百億參數(shù)規(guī)模的多模態(tài)模型Ming系列Ming-lite-omni。
具體來說,這是一款以統(tǒng)一架構(gòu)集成多模態(tài)理解、生成和編輯能力的模型,支持將理解和生成模型合在一起調(diào)用,也可以單獨完成理解和生成任務(wù),帶來原生全模態(tài)交互體驗。
Ming-lite-omni主要承襲了5月初開源的Ming-lite-omni-preview和Ming-lite-uni這2款模型的能力,在此基礎(chǔ)上做了更為系統(tǒng)的整合優(yōu)化。
Ming-lite-omni基于Ling-lite-1.5,MoE模塊新增了模態(tài)特定路由以緩解模態(tài)沖突、增強(qiáng)模態(tài)間協(xié)同,使得音、視、圖、文等模態(tài)能夠有效統(tǒng)一在一個模型中。同時在圖像、語音生成與理解統(tǒng)一方面?zhèn)戎貎?yōu)化,突破理解與生成相互沖突的難題。至此,Ming-lite-omni實現(xiàn)了模態(tài)統(tǒng)一處理,以及多模態(tài)理解與生成在一個模型上的統(tǒng)一,可以處理音頻、視頻、圖像和文本模態(tài)的任意組合作為輸入,生成與音頻、圖像或文本輸出交織的多模態(tài)輸出,從而實現(xiàn)先進(jìn)的實時的全模態(tài)交互體驗。
團(tuán)隊表示,“我們的目標(biāo)是逐步開源Ming系列多模態(tài)模型,這將營造一個協(xié)作環(huán)境,讓研究人員和開發(fā)者能夠在這些模型的基礎(chǔ)上進(jìn)行構(gòu)建和擴(kuò)展,從而推動 AI 應(yīng)用的創(chuàng)新。我們希望通過與社區(qū)的合作,逐步加速Ming系列模型開發(fā),推進(jìn)開發(fā)更先進(jìn)、更實用的 AI 系統(tǒng),以應(yīng)對復(fù)雜的現(xiàn)實問題。”
螞蟻百靈大模型負(fù)責(zé)人周俊(花名:西亭)表示,新開源的Ming-lite-omni模型有幾個值得關(guān)注的創(chuàng)新點:一是真正把生成和理解模型放到一個模型;二是真正意義上的全模態(tài)輸入和輸出,都支持音視頻、圖文多種形態(tài);三是真正是以MoE為架構(gòu)的模型,中間沒有提供其他東西,交互性較強(qiáng)。
螞蟻百靈多模態(tài)大模型負(fù)責(zé)人陳景東(景東)向筆者進(jìn)一步指出,目前更多開源的是必要的代碼,開源的更多作用是希望大家可以把Ming系列模型能夠用好。
目前來看,包括螞蟻、騰訊在內(nèi)的多家AI大模型團(tuán)隊認(rèn)為,多模態(tài)模型正在走向MoE架構(gòu)的“全模態(tài)”模型。包括Seed1.5-VL和Qwen2.5-Omni為代表的模型現(xiàn)已支持圖像、視頻、語音、文本及其任意組合的理解,而以Kimi-VL為代表支持MoE架構(gòu);但技術(shù)挑戰(zhàn)上,支持音、視、圖、文全模態(tài)交互的公開單模型非常少見,并且圖像和語音的理解與生成統(tǒng)一模型鮮有出現(xiàn),且理解和生成效果難以平衡。
阿里集團(tuán)副總裁許主洪認(rèn)為,當(dāng)下多模態(tài)大模型的一大演進(jìn)趨勢,正是用統(tǒng)一的框架做理解和生成,這一領(lǐng)域發(fā)展尚處于初級階段,需要實踐驗證。而今日螞蟻開源的Ming-lite-omni,正是這一領(lǐng)域的代表性實踐。
同時,螞蟻團(tuán)隊還宣布,百靈大模型即將開源一款Ling-max模型,模型規(guī)模和性能與DeepSeek-V3“滿血版”比肩,追尋跟V3差不多的版本進(jìn)行開源,讓更多人基于百靈版本上面調(diào)用各式各樣的能力。
截至目前,螞蟻逐步形成兩類百靈基礎(chǔ)模型路線:MoE語言大模型Ling-Series/推理模型Ring-Series;原生全模態(tài)大模型Ming-Series。
除了模型更新,螞蟻三大AI管家應(yīng)用方面也有新進(jìn)展,旗下AI健康管家不久后將上線新版本。
據(jù)悉,今年初螞蟻集團(tuán)宣布完成收購好大夫之后,3月首次對外公布了以螞蟻醫(yī)療大模型為核心的“一體三端(醫(yī)療機(jī)構(gòu)、醫(yī)生、用戶)”的AI醫(yī)療布局,成為應(yīng)用場景與行業(yè)共建最深的專業(yè)大模型之一。據(jù)悉,其面向用戶端的應(yīng)用產(chǎn)品AI健康管家,從去年下半年發(fā)布以來,通過高質(zhì)量數(shù)據(jù)資源、專業(yè)標(biāo)注團(tuán)隊等多方面優(yōu)化模型,在AI就醫(yī)助理、AI健康咨詢等方面表現(xiàn)出色,充當(dāng)用戶個人日常健康管理與就醫(yī)咨詢的助理角色,上線半年服務(wù)超4000萬用戶。而這一AI應(yīng)用產(chǎn)品即將上線新版本,迎來新的產(chǎn)品功能迭代突破。
對于內(nèi)部AI產(chǎn)品使用百靈大模型情況,西亭對筆者表示,站在基礎(chǔ)大模型角度看,之所以開源這么多基礎(chǔ)模型,主要是不想讓大模型成為某些公司的專屬,通過將螞蟻更多探索的AI技術(shù)公布到開源社區(qū),成為推動大模型往前發(fā)展的重要起點。今天從業(yè)務(wù)和應(yīng)用角度來說,百靈不會強(qiáng)行做一個非常綁定,因為當(dāng)前模型還沒有達(dá)到AGI能力,也沒有成為社會必需品,所以行業(yè)和基礎(chǔ)模型兩方會持續(xù)推進(jìn),不會有那么強(qiáng)的耦合。
“另外,如果不談技術(shù)本身,我更加期待我們合作伙伴,純粹是因為百靈技術(shù)做得好而選用我們,而不是別的應(yīng)用連接使用百靈模型,這是我們對內(nèi)和對外的一個非常關(guān)鍵因素。我們希望做的東西能夠得到(開源)社區(qū)的認(rèn)可,并且與社區(qū)推動AI技術(shù)進(jìn)步。這是我們的觀點。”西亭稱,AGI仍處于早前階段,團(tuán)隊相信通過自己的努力、模型能力進(jìn)步后,會在合適的時間通過內(nèi)部、外部使用它。
自2025年起,全球AI大模型市場“內(nèi)卷”加劇。開源模型DeepSeek引發(fā)全球討論,基礎(chǔ)大模型并未如預(yù)期一樣放緩迭代,除了DeepSeek之外的AI行業(yè)Super App超級應(yīng)用也未出現(xiàn)。
因此,國內(nèi)外科技大廠都在“內(nèi)卷”模型迭代:OpenAI發(fā)布GPT-4.5和o3;Gemini發(fā)布2.5 Pro版本;騰訊混元升級快思考模型混元TurboS、深度思考模型混元T1,并發(fā)布視覺深度推理模型T1-Vision和端到端語音通話模型混元Voice;字節(jié)跳動旗下火山引擎發(fā)布豆包·視頻生成模型Seedance 1.0 lite、豆包1.5·視覺深度思考模型,并升級豆包·音樂模型等。
去年第四季度國內(nèi)有49個大模型更新發(fā)布,到今年一季度這一數(shù)字增長至55個,最多的時候一周有8個模型。大模型迭代速度越來越快,模型能力越來越強(qiáng)。正如李彥宏所說“大模型廠商卷生卷死。”
所以,對于AI這場戰(zhàn)役來說,企業(yè)如何利用這些強(qiáng)大模型,把AI應(yīng)用做好,讓更多人體驗到AI技術(shù)能力,這似乎成為未來的關(guān)鍵點,而國內(nèi)科技大廠擁有非常強(qiáng)的基本盤產(chǎn)品,并且擁有流量、資源投入以及人才資源,將是國內(nèi)AI“下半場”競爭的核心參與者。
“跟很多創(chuàng)業(yè)公司相比,我們的優(yōu)勢不是資源,而是人才,怎么把我們的人才聚集到一起,其實靠的是協(xié)作。”韓歆毅表示,AI這件事很難,當(dāng)前螞蟻是在與全球最頂級的AI團(tuán)隊競爭,而且坦白說,這上面人家不光是跑得比我們早,也跑得比我們快。因此,對于螞蟻來說,目標(biāo)并不是做一家全球最領(lǐng)先的大模型公司,而是依然聚焦于應(yīng)用上,仍希望智能上限的探索使得AI應(yīng)用層面有突破,“至少在某幾個領(lǐng)域我們要領(lǐng)先。”
展望未來,韓歆毅首次詳細(xì)闡述螞蟻新的AI First戰(zhàn)略:
談到基礎(chǔ)模型的探索,韓歆毅表示,過去幾個月螞蟻團(tuán)隊投入的探索力量和更多突破,其實在某些方向已具備全球一定的領(lǐng)先地位,但這個領(lǐng)先還是偏單點。今天我們要全力以赴,追求智能上限,并且不斷開源開放。另一方面,未來所有應(yīng)用隨著AI世界變得更加多樣化,螞蟻的機(jī)會在于支付,AI世界的支付可能與今天完全不一樣,因此,螞蟻需要提供AI世界的支付與基礎(chǔ)能力。
對于具身智能的探索,韓歆毅指出,這是一個面向未來的開放式探索。今年螞蟻成立了靈波科技,希望探索AI與物理世界的融合,未來還將與哈啰一起探索自動駕駛。
“人在相當(dāng)長的時間內(nèi),不太可能回到我們的科幻電影中,有一個養(yǎng)生艙躺進(jìn)去接上我們的虛擬世界、宇宙里面,這個短期內(nèi)不太可能發(fā)生,但至少相當(dāng)長的時間內(nèi),人還是活在現(xiàn)實世界中,現(xiàn)實世界和數(shù)字AI世界會同時并存,而我們希望幫助大家解決現(xiàn)實AI世界問題,這就是為什么我們?nèi)ヌ剿骶呱碇悄?、智能駕駛等。”韓歆毅稱。
韓歆毅表示,如果往前看,螞蟻AI First戰(zhàn)略是一個“頂層框架型”的想法,還有一些非常具象的業(yè)務(wù)和策略依然在探索、摸索過程中,因此,整個過程中,無論是解決當(dāng)下的業(yè)務(wù)的具體問題,還是螞蟻面向未來的探索,其實都需要技術(shù)人員的創(chuàng)新與突破。“因為技術(shù)是我們產(chǎn)品、業(yè)務(wù)快速奔跑的核心能力和堅強(qiáng)后盾。”
韓歆毅強(qiáng)調(diào),螞蟻希望真正給到用戶、合作伙伴一個革命性、代際差體驗、核心的競爭優(yōu)勢,所以在面臨當(dāng)下AI技術(shù)探索、AI應(yīng)用的戰(zhàn)場上,我們要回到“黑客松”的精神,源于對技術(shù)的熱愛。
“我們源于熱愛,成于協(xié)同,最后我們終于創(chuàng)新,用創(chuàng)新的方式為螞蟻未來的10年、科技的10年打出一片新的天地。”韓歆毅在演講結(jié)尾稱。(本文首發(fā)于鈦媒體App,作者|林志佳)
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論