會(huì)議室里,在王東來(lái)講完這番客套話之后,便到了本次會(huì)議的重點(diǎn)。
五道口組建這么一支研究團(tuán)隊(duì),自然是抱有一定的期待和展望。
而面對(duì)這個(gè)嶄新的科研項(xiàng)目,其實(shí)不止是姚啟智沒(méi)有怎么接觸過(guò),就連其他邀請(qǐng)過(guò)來(lái)的專家也都沒(méi)有接觸過(guò)。
要知道,國(guó)內(nèi)的互聯(lián)網(wǎng)行業(yè)說(shuō)是在創(chuàng)新,只不過(guò)是把在發(fā)達(dá)國(guó)家的一些成熟行業(yè)搬運(yùn)過(guò)來(lái)而已。
社交、游戲、外賣(mài)、門(mén)戶網(wǎng)站等等,皆是如此。
而互聯(lián)網(wǎng)的真正核心卻根本沒(méi)有關(guān)心,也志不在此。
就像是早在2012年的時(shí)候,谷歌人工智能實(shí)驗(yàn)室就提出了讓機(jī)器能夠?qū)W習(xí)語(yǔ)言和語(yǔ)法。
彼時(shí)的國(guó)內(nèi)互聯(lián)網(wǎng)卻在干什么?
高下立判!
會(huì)議室上首位置,王東來(lái)鞠了一躬之后,就站了起來(lái)。
隨著站直身子,他的身上散發(fā)出一種獨(dú)特的氣質(zhì)。
既有少年人的昂揚(yáng),也有一種科研人員的自信,更有一種商界大佬的氣勢(shì)。
“我不知道在座的有沒(méi)有聽(tīng)說(shuō)過(guò)去年2月份,白頭鷹人工智能學(xué)術(shù)年會(huì)上展示出來(lái)的GPT,我在這里簡(jiǎn)單地介紹一下。”
“2012年,谷歌人工智能實(shí)驗(yàn)室提出想讓機(jī)器學(xué)習(xí)語(yǔ)言和語(yǔ)法,次年,便發(fā)布了基于GPT的語(yǔ)言模型,該模型通過(guò)對(duì)輸入的編碼來(lái)學(xué)習(xí)語(yǔ)言?!?/p>
“同年十月,谷歌開(kāi)始了GPT的試點(diǎn)項(xiàng)目,并通過(guò)改進(jìn),使得其能夠在不需要大量訓(xùn)練數(shù)據(jù)的情況下學(xué)習(xí)語(yǔ)言模型?!?/p>
“所以,我們的目標(biāo)其實(shí)很簡(jiǎn)單,那就是對(duì)標(biāo)GPT,先從獨(dú)屬于國(guó)內(nèi)的人工大模型開(kāi)始。”
“第一階段最終要完成的模塊功能是能夠做到像人一樣的交流,甚至完成寫(xiě)郵件、文案創(chuàng)作、數(shù)學(xué)計(jì)算等功能?!?/p>
在王東來(lái)說(shuō)到這里的時(shí)候,下面坐著的教授和研究員都有些躁動(dòng)起來(lái)。
實(shí)在是王東來(lái)提出來(lái)的要求太高了,完全超過(guò)了眾人的想象。
像人一樣的交流,可以寫(xiě)郵件,文案創(chuàng)作。
這樣的功能在王東來(lái)的嘴里還只是第一階段。
只是聽(tīng)著王東來(lái)這么說(shuō),眾人的心里便飛快地盤(pán)算了一下,便有了一個(gè)結(jié)論。
那就是根本不可能。
憑借他們的能力根本做不到這一點(diǎn)。
人工智能雖然他們還只是第一次接觸,但是他們對(duì)于計(jì)算機(jī)還是有幾分了解的,同時(shí)他們自己有幾分實(shí)力,更是心知肚明。
真要是可以做到王東來(lái)所說(shuō)的這樣,他們也就不是現(xiàn)在這個(gè)樣子了。
當(dāng)即,就有一位戴著眼鏡的中年人出聲打斷了王東來(lái)的話。
“王教授,你剛才提到第一階段要完成的模塊功能是能做到寫(xiě)郵件、文案創(chuàng)作等,可據(jù)我所知,這樣的技術(shù)就算是在白頭鷹也沒(méi)有完成。”
“谷歌的GPT項(xiàng)目,我也有聽(tīng)聞,根據(jù)和一些海外朋友的交流,GPT是由Opanai的研究團(tuán)隊(duì)首次提出,其主要是利用神經(jīng)網(wǎng)絡(luò),通過(guò)機(jī)器深度學(xué)習(xí),從而使得機(jī)器獲得強(qiáng)大的自然語(yǔ)言處理的能力,如此這般,才能讓該模型擁有生成文本、回答問(wèn)題并進(jìn)行語(yǔ)言翻譯等任務(wù)。”
“姑且不說(shuō)能不能做到這一點(diǎn),單單只是自然語(yǔ)言處理,就已經(jīng)是一項(xiàng)難度極大的課題,更不要說(shuō)人工智能涉及計(jì)算機(jī)科學(xué)、心理學(xué)、數(shù)學(xué)等多領(lǐng)域的,研究領(lǐng)域包括不限于機(jī)器人、圖像識(shí)別、專家系統(tǒng)等等?!?/p>
“就算是我們目前要完成的人工模型,也不是一個(gè)簡(jiǎn)單的課題,說(shuō)是人工模型應(yīng)該不準(zhǔn)確,更應(yīng)該稱之為大型語(yǔ)言模型才對(duì),large language model也被稱為L(zhǎng)LM,它是一種使用深度學(xué)習(xí)算法來(lái)處理自然語(yǔ)言的模型,可以根據(jù)海量的數(shù)據(jù)來(lái)識(shí)別、總結(jié)、翻譯、預(yù)測(cè)和生成文本和其他內(nèi)容?!?/p>
“所以,這么一來(lái),我們這個(gè)研究團(tuán)隊(duì)的任務(wù)很重,不是我在打擊王教授和各位的信心,就目前的團(tuán)隊(duì),其實(shí)我并不怎么看好?!?/p>
姚啟智在王東來(lái)說(shuō)話之前,就搶先地出聲問(wèn)道:“劉工,那你有什么想法?只要你說(shuō)的有道理,在這個(gè)團(tuán)隊(duì)可以暢所欲言!”
被稱為劉工的中年研究員看了一眼姚啟智,再看了看沒(méi)有說(shuō)話的王東來(lái),便接著說(shuō)道:“很簡(jiǎn)單,那就是再增加人手!”
聽(tīng)到這里,王東來(lái)笑了出來(lái)。
“劉工,沒(méi)想到你對(duì)人工智能有如此研究和了解,看來(lái)這次項(xiàng)目完成的可能性更大一分?!?/p>
“而針對(duì)劉工剛才提出來(lái)的問(wèn)題,其實(shí)我早已有過(guò)考慮?!?/p>
“首先,我們這次的項(xiàng)目是大型語(yǔ)言模型,這一點(diǎn)想必劉工沒(méi)有問(wèn)題,而大型語(yǔ)言模型無(wú)非就是利用機(jī)器深度學(xué)習(xí)來(lái)完成,我們可以開(kāi)發(fā)出一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型,用于生成連貫的文本等?!?/p>
“其次,便是劉工提到的自然語(yǔ)言處理,這一點(diǎn)我也有了解決辦法,那就是基于Transformer的解碼器,在沒(méi)有標(biāo)注的大數(shù)據(jù)下完成一個(gè)語(yǔ)言模型,作為預(yù)訓(xùn)練模型,然后在子任務(wù)上做微調(diào)獲得不同任務(wù)的分類器,實(shí)現(xiàn)自然語(yǔ)言推理、問(wèn)答和常識(shí)推理、語(yǔ)義相似度識(shí)別、分類等?!?/p>
“最后,便是劉工說(shuō)到的算法、圖像識(shí)別、專家系統(tǒng)等領(lǐng)域,我也同樣有所準(zhǔn)備?!?/p>
“劉工恐怕對(duì)我不夠了解,并不知道其實(shí)我第一篇SCI論文就是關(guān)于算法的,我自認(rèn)在算法這方面還是不弱于人的?!?/p>
王東來(lái)吐字清晰,語(yǔ)氣平靜,說(shuō)出這一番話的時(shí)候,自帶一種無(wú)言的壓迫氣勢(shì)。
這一刻,在眾人的心里對(duì)王東來(lái)的印象有了一個(gè)天翻地覆的變化。
剛才王東來(lái)表現(xiàn)的有多么的溫文爾雅,現(xiàn)在便有多么的反差。
沒(méi)有一句臟話,語(yǔ)氣也沒(méi)有什么變化。
可是在話語(yǔ)之中充斥著強(qiáng)烈的自信和霸道,令得眾人不由自主地對(duì)王東來(lái)刮目相看。
王東來(lái)的表現(xiàn)也并沒(méi)有讓眾人覺(jué)得意外,能夠在這個(gè)年紀(jì)取得這樣的成就,有這樣的表現(xiàn)才是正常的。
不少人把目光放到了劉工的身上,想要看看還會(huì)不會(huì)說(shuō)出什么話來(lái)。
卻不料,得到王東來(lái)這樣的回答,劉工的臉上浮現(xiàn)出一絲思索之色。
“王教授,你剛才提到的開(kāi)發(fā)出一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型,還有自然語(yǔ)言處理,聽(tīng)上去頗有幾分可行性,能不能詳細(xì)講講,我感覺(jué)如果這些技術(shù)都已經(jīng)解決的話,我們?cè)谌斯ぶ悄茴I(lǐng)域的研究恐怕就要走在世界前列了?!?/p>
“哪怕這只是人工智能的一個(gè)方面,應(yīng)用產(chǎn)品,但是只要在這個(gè)領(lǐng)域完成突破,所帶來(lái)的影響就會(huì)是巨大的,足以在社會(huì)上引起巨大的震動(dòng)?!?/p>
越說(shuō),劉工的眼神越是明亮,神情也變得激動(dòng)起來(lái)。
見(jiàn)此,王東來(lái)在心里對(duì)這位劉工也有了一個(gè)清楚的認(rèn)識(shí)。
純正的研究員!
剛才打斷自己,也并非是對(duì)自己有什么意見(jiàn),只是見(jiàn)不得有人在大放厥詞,所以出聲打斷。
可是在自己說(shuō)出一些想法之后,劉工卻能夠在這么短的時(shí)間內(nèi)反應(yīng)過(guò)來(lái),這就證明了這位劉工的卓越眼光和深厚的知識(shí)技術(shù)儲(chǔ)備。
對(duì)于研究團(tuán)隊(duì)有這么一位能力超強(qiáng)的研究員,王東來(lái)心里頗為滿意,臉上頓時(shí)露出笑意,說(shuō)道:“劉工,人工智能的應(yīng)用領(lǐng)域廣泛,涉及的問(wèn)題也非常多樣化?!?/p>
“眼下,能夠搞出一款國(guó)產(chǎn)的人工智能聊天通用模型,這就已經(jīng)夠了!”
王東來(lái)并沒(méi)有多說(shuō),更不會(huì)在這里把關(guān)鍵點(diǎn)都說(shuō)出來(lái)。
正如他所說(shuō)的,一些核心的算法都會(huì)由他來(lái)完成,其他人先是做不到,其次才是出于保密的需要。
領(lǐng)先時(shí)代半步是天才,領(lǐng)先一步是妖孽,可要是領(lǐng)先了幾百米,那就是禍端了。
劉工聽(tīng)到王東來(lái)這么說(shuō),張了張嘴,卻沒(méi)有再說(shuō)什么,點(diǎn)了點(diǎn)頭便安靜下來(lái)。
見(jiàn)此,姚啟智順勢(shì)接過(guò)話題。
“關(guān)于此次研究項(xiàng)目的情況,想必大家之前都已經(jīng)看過(guò)了,我們這個(gè)項(xiàng)目目前在國(guó)內(nèi)是第一例,所以我們身上還承擔(dān)著一份開(kāi)辟的責(zé)任?!?/p>
“而關(guān)于這一次的課題研究,王教授才是核心,說(shuō)出來(lái)也不怕大家笑話,我感覺(jué)在人工智能這一方面,王教授其實(shí)比我更懂,知識(shí)儲(chǔ)備也更多,剛才王教授和劉工的討論就證明了這一點(diǎn)?!?/p>
“更何況,這一次的課題項(xiàng)目,也是由銀河科技出資研究,成果和專利由銀河科技獨(dú)享?!?/p>
“接下來(lái)的研究工作,我雖然是帶頭人,但是希望諸位能夠在研究過(guò)程中,拿出真正的實(shí)力,并且在遇到問(wèn)題的時(shí)候,可以多聽(tīng)取王教授的建議。”
姚啟智拿起話筒,無(wú)比認(rèn)真地對(duì)著眾人如此說(shuō)道。
隨著姚啟智這么說(shuō),在場(chǎng)眾人的神情頓時(shí)變得認(rèn)真起來(lái)。
其實(shí),有了之前王東來(lái)和劉工的交流,眾人都已經(jīng)看明白了。
王東來(lái)其實(shí)在這方面的造詣并不低,甚至可以說(shuō)是超過(guò)了在座的大部分人。
一些有心人更是細(xì)數(shù)了一下,王東來(lái)在數(shù)學(xué)方面的成就不提,在計(jì)算機(jī)方面的成績(jī)也是不低,這個(gè)項(xiàng)目五道口能夠這么爽快地和銀河科技合作,恐怕也是因?yàn)橥鯑|來(lái)的原因。
有這樣的一位天才加入其中,對(duì)于人工模型項(xiàng)目而言,只有好處沒(méi)有壞處。
這一點(diǎn),眾人都能想的明白。
所以,眾人在姚啟智話音落下之后,都紛紛點(diǎn)頭起來(lái)。
“姚院長(zhǎng)放心,王教授的成就擺在這里,我們自然不會(huì)熟視無(wú)睹?!?/p>
“人工智能技術(shù)要是能夠突破,不管是對(duì)國(guó)家還是對(duì)學(xué)術(shù)界,都擁有極大的意義,我們自然不會(huì)藏拙,必然全力以赴!”
“正好,我的手上也沒(méi)有什么要忙的項(xiàng)目,接下來(lái)我倒是可以將更多的精力放到這個(gè)項(xiàng)目上面?!?/p>
“巧了不是,我手上的幾個(gè)課題也到了結(jié)尾工作,交給帶的學(xué)生就行,正好投入到這個(gè)課題中來(lái)!”
“……”
一時(shí)間,會(huì)議室里的眾人紛紛表態(tài)起來(lái)。
對(duì)于眾人的表現(xiàn),王東來(lái)并沒(méi)有太過(guò)吃驚。
高校教授手上的課題其實(shí)并不少,尤其是京城的這些高校教授,就更是如此了。
而一項(xiàng)課題,大部分的工作其實(shí)都是交給了下面的學(xué)生,在讀博士和研究生才是干活的主力。
臟活累活都是他們的,而這些教授也只是在關(guān)鍵的地方進(jìn)行指點(diǎn)而已。
這并不是說(shuō)這些教授在故意壓榨,而是因?yàn)樗麄兊氖稚系恼n題項(xiàng)目很多,分身乏術(shù)下的最好選擇罷了。
也有出于鍛煉帶的學(xué)生能力的考慮。
當(dāng)然了,一樣米養(yǎng)百樣人,自然也會(huì)有那種壓榨學(xué)生勞動(dòng)力的無(wú)良教授,這是不可避免的事情。
就連唐都交大也有,不過(guò)在王東來(lái)的提議下,鄭華和徐松堯強(qiáng)硬無(wú)比地對(duì)這方面進(jìn)行了嚴(yán)格的限制和監(jiān)察,倒也使得唐都交大的學(xué)術(shù)氛圍好上許多。
但是現(xiàn)在。
這些高校教授和研究所研究員,紛紛將手上的其他課題項(xiàng)目拋到了一旁,交給了帶的研究生和博士們,自己將主要精力放到人工智能大數(shù)據(jù)上面。
原因簡(jiǎn)單的很!
人工智能大數(shù)據(jù)模型的價(jià)值更大。
同時(shí),可行性也更高。
一旦課題完成的話,對(duì)于他們而言,就是巨大的利益。
不管是發(fā)表論文,還是評(píng)職稱等,都有著幫助。
人工大模型的研發(fā),主要有三大難題,分別是數(shù)據(jù)、神經(jīng)網(wǎng)絡(luò)架構(gòu)以及硬件部分。
數(shù)據(jù)方面,因?yàn)槭且ㄓ么竽P停孕枰臄?shù)據(jù)很大,不過(guò)還好這方面國(guó)內(nèi)有優(yōu)勢(shì),所以問(wèn)題倒也不太大。
而神經(jīng)網(wǎng)絡(luò)架構(gòu)這一點(diǎn),有姚啟智這位大佬以及諸多高校教授一同出手,最后還有王東來(lái)在,自然也是問(wèn)題不大。
最后便是硬件部分了。
雖然可以借用五道口的‘探索1000’超算,但是并不是長(zhǎng)久之計(jì)。
為了日后的發(fā)展,就必須要有自己的機(jī)器。
而這就需要有高性能的CPU和GPU,這些東西都需要從國(guó)外進(jìn)口,還要受到鉗制。
就算是這樣,也只能硬著頭皮買(mǎi)。
目前,國(guó)內(nèi)根本無(wú)法滿足需求。
當(dāng)王東來(lái)提出要人工智能大模型的時(shí)候,其實(shí)都已經(jīng)想到了這個(gè)問(wèn)題。
買(mǎi)!
只有這一個(gè)選擇,在西方還沒(méi)有制裁,國(guó)內(nèi)沒(méi)有追趕上來(lái)之前,這些東西只能買(mǎi)。