Cohere聯(lián)合創(chuàng)始人艾丹·戈麥斯(Aidan Gomez)(圖片來源:多倫多大學(xué))

艾丹·戈麥斯(Aidan Gomez)是一位著名的AI研究者,也是Cohere的聯(lián)合創(chuàng)始人。他是少數(shù)在Google Brain工作時創(chuàng)造Transformer算法的研究者之一。此次交流中,他談到了自己的經(jīng)歷以及他的初創(chuàng)公司Cohere,該公司以他早些時候的工作為基礎(chǔ)。

戈麥斯在加拿大長大,后來他去了多倫多大學(xué)學(xué)習(xí)。在那里,他在大二的時候發(fā)現(xiàn)了人工智能,并開始狂熱地閱讀有關(guān)該主題的學(xué)術(shù)論文,是一名機(jī)器學(xué)習(xí)研究員和數(shù)學(xué)迷。

“我變得癡迷,我就是日夜不停地閱讀論文,”他回憶說。“我會帶著一篇研究論文入睡。”

他在文獻(xiàn)中一直看到一個名字——杰夫·辛頓(Geoffrey Hinton )——他的附屬機(jī)構(gòu)也是多倫多大學(xué),盡管辛頓早已停止教學(xué)。戈麥斯通過電子郵件與他聯(lián)系,向辛頓提出一個小技術(shù)問題。令他驚訝的是,辛頓回應(yīng)了他,這位世界上最著名的AI研究者向一個當(dāng)時還是匿名的本科生解釋了一個普通的問題。

在他的本科學(xué)習(xí)期間,戈麥斯前往科技創(chuàng)新的中心——硅谷——那里他成為了著名的Google Brain團(tuán)隊的一名實習(xí)生。在那里,他與領(lǐng)域內(nèi)一些最聰明的人合作,包括在開發(fā)谷歌TensorFlow模型框架中發(fā)揮了重要作用的Lukasz Kaiser。

“Kaiser想把機(jī)器學(xué)習(xí)研究者們編譯的每一個數(shù)據(jù)集都放入一個模型中,使其在輸入和輸出方面都完全Multi-model(多模態(tài))。”戈麥斯說。

為了支持這個項目,戈麥斯幫助建立了一個名為Tensor2Tensor的軟件基礎(chǔ)設(shè)施,該設(shè)施可以在成千上萬的GPU之間分配計算任務(wù)。他說,這主要集中于自回歸模型,特別是基于注意力的模型。“我們聽說Google翻譯的一個團(tuán)隊也對基于注意力的自回歸模型感興趣,Lukasz說服他們過來,并在Tensor2Tensor上構(gòu)建它。”

接下來的10周,我們一直在趕制這個模型。“由于我們得到的結(jié)果非常出色,所以壓力只是越來越大,”戈麥斯回憶道。“這是早期非常成功、可以大規(guī)模擴(kuò)展的架構(gòu)之一,我們的大規(guī)模GPU集群帶來了極高的性能。”

“沒人在睡覺;我每天工作14個小時編碼,建設(shè)這個基礎(chǔ)設(shè)施,使它更為健壯,運(yùn)行實驗,這就是我們得到變壓器算法的方式。”

現(xiàn)在,Transformer算法只有大約20行代碼。基本層是一個多層感知器(MLP),Transformer實際上只是一些堆疊在一起的MLP和一個注意力層。在Transformer之前,有這些非常復(fù)雜的LSTM架構(gòu),沒有統(tǒng)一的架構(gòu)。有了Transformer,所有這些都被拆除,留下的是簡單的、表現(xiàn)良好的、可擴(kuò)展的“內(nèi)核”東西。

Transformer算法為先進(jìn)的自然語言處理打開了大門,使機(jī)器能夠理解和生成類似人類的語言。OpenAI的首席科學(xué)家Ilya Sutskever立即利用它建立了第一個生成預(yù)訓(xùn)練Transformer模型——GPT,現(xiàn)在已經(jīng)發(fā)展到第四代GPT-4。Transformer引領(lǐng)了正在改變世界的生成AI革命。

戈麥斯接著共同創(chuàng)立了一家公司,Cohere,目的是使人們能夠接觸到這種變革性的算法和圍繞它構(gòu)建的大型語言模型。Cohere致力于使LLM(大型語言模型)盡可能地實用和有用,以滿足不同的垂直任務(wù)和行業(yè)的需要。

戈麥斯大部分時間都沒有參與關(guān)于生成式AI(AIGC)對人類的威脅的辯論。但考慮到AI近期的顯著進(jìn)步,戈麥斯表示,越來越難以否認(rèn)機(jī)器獲得感知能力的想法。

隨著AI感知潛力的展現(xiàn),戈麥斯強(qiáng)調(diào)了負(fù)責(zé)任開發(fā)和倫理考慮的重要性。他呼吁AI社區(qū)以保護(hù)人類價值、隱私和社會福祉的承諾來面對進(jìn)步。他相信,通過培養(yǎng)對AI開發(fā)的深思熟慮和透明的方法,我們可以減少風(fēng)險,最大化它所提供的好處。(本文首發(fā)鈦媒體App)

本文系作者 Craig Smith 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

14:44

中信建投黃文濤:A股、港股呈現(xiàn)科技創(chuàng)新牛等“新四?!睉B(tài)勢

14:41

比亞迪A股成交額達(dá)100億元,現(xiàn)漲2.88%

14:41

半導(dǎo)體板塊再度走強(qiáng),利揚(yáng)芯片、峰岹科技漲停

14:40

勝宏科技成交額達(dá)200億元,現(xiàn)跌3.84%

14:40

丁薛祥會見新加坡政府投資公司首席執(zhí)行官林昭杰

14:40

市場監(jiān)管總局新批準(zhǔn)發(fā)布一批生物領(lǐng)域國家標(biāo)準(zhǔn)物質(zhì)

14:40

菲律賓股指上漲1%至6,211.02點(diǎn)

14:33

豬肉股午后持續(xù)調(diào)整,邦基科技一度跌9%

14:32

日經(jīng)225指數(shù)收盤下跌0.25%,報44790.38點(diǎn)

14:27

農(nóng)業(yè)農(nóng)村部:“農(nóng)產(chǎn)品批發(fā)價格200指數(shù)”為117.87,比昨天下降0.13個點(diǎn)

14:26

恒力重工集團(tuán)增資至69億,增幅130%

14:22

滬深兩市成交額超2萬億元,較上日此時放量179億元

14:21

游戲板塊震蕩走高,愷英網(wǎng)絡(luò)沖擊漲停并創(chuàng)新高

14:20

國務(wù)院國資委:積極擁抱AI、科學(xué)運(yùn)用AI 將持續(xù)深化“AI+”專項行動

14:20

國債期貨拉升,30年期主力合約盤中漲0.20%

14:03

英國8月CPI同比增長3.8%,預(yù)期3.8%

14:02

創(chuàng)業(yè)板指漲超2.00%,滬深京三市上漲個股超2500只

13:59

新疆伊犁州尼勒克縣發(fā)生3.9級地震

13:49

李家超:香港推出組合拳鼓勵生育

13:45

臺灣加權(quán)指數(shù)收跌0.75%,報25438.25點(diǎn)

掃描下載App