在杭城,陳澈布局了MCN公司、直播電商產(chǎn)業(yè)、線上電商。
但這些都是表面上的,在NSC方面,他對(duì)杭城的未來(lái)也是寄予厚望。
比如云計(jì)算、人工智能等,都是未來(lái)陳澈落地杭城的企業(yè)。
京津冀、江浙滬、大灣區(qū),這三個(gè)地方陳澈要放的東西都不一樣,起碼在他的主張規(guī)劃里,是要大方向區(qū)分開(kāi)的。
如今既然聊起來(lái)了,陳澈也是趁機(jī)試探一番的心思,拿起茶杯看向徐陽(yáng)道:
“姐夫,在杭城這地界,你們技術(shù)圈子里AI這波浪潮動(dòng)靜大不大?
徐陽(yáng)謝過(guò)倒茶的服務(wù)員,把茶杯往旁邊放了放,沉吟了一陣笑道:
“算是熱火朝天吧,余杭那邊未來(lái)科技城天天都有新公司冒出來(lái),大數(shù)據(jù)、智能推薦的概念滿天飛,我們組里最近也在討論怎么用AI優(yōu)化后臺(tái)的一些流程,比如日志分析、異常檢測(cè)這方面,不過(guò)感覺(jué)現(xiàn)在很多還是在應(yīng)用層打轉(zhuǎn),真正底層創(chuàng)新的,感覺(jué)不多?!?/p>
陳澈聞言眼前一亮,看樣子是他低估了徐陽(yáng)的水平了,放下茶杯道:
“應(yīng)用層當(dāng)然重要,但我覺(jué)得未來(lái)真正能拉開(kāi)差距的,還是在更基礎(chǔ)、更“聰明”的AI上,姐夫,你對(duì)大模型這塊有研究嗎?就是那種...能理解語(yǔ)言、能生成內(nèi)容、能做復(fù)雜推理的模型?!?/p>
“大模型?”
徐陽(yáng)思索片刻問(wèn)道:
“你是說(shuō)類似Google的BERT那種?或者OpenAI的GPT?”
陳澈點(diǎn)點(diǎn)頭。
OpenAI已經(jīng)在上半年推出了1,為此他還專門(mén)讓伊芙琳進(jìn)行了滲透。
徐陽(yáng)繼續(xù)思索著道:
“嗯,關(guān)注過(guò),這東西現(xiàn)在很火,算是NLP領(lǐng)域的新突破吧,核心是Transformer架構(gòu),靠海量數(shù)據(jù)和巨大算力堆出來(lái)的,BERT主要擅長(zhǎng)理解語(yǔ)義,GPT更偏向生成文本...不過(guò)國(guó)內(nèi)真正敢大規(guī)模投入做這個(gè)的好像還不多,主要是成本太高了,訓(xùn)練一次燒錢(qián)燒得厲害,對(duì)數(shù)據(jù)、算力、算法人才要求都極高?!?/p>
陳澈深深皺起眉,隨即身體微微前傾,語(yǔ)氣帶著憧憬笑了笑道:
“對(duì),就是這個(gè)方向,姐夫你說(shuō)到點(diǎn)子上了,成本高門(mén)檻高,恰恰意味著機(jī)會(huì)啊,我最近在鵬城、香江和杭城打聽(tīng),就是想看看有沒(méi)有團(tuán)隊(duì)在深耕這個(gè)領(lǐng)域。”
徐陽(yáng)聞言暗想自己猜對(duì)了,只是他想到深處表情凝重了些。
陳澈沒(méi)等他說(shuō)話,便主動(dòng)碰了碰他的胳膊在其看來(lái)之際,珉著笑繼續(xù)道:
“姐夫,你別看它現(xiàn)在燒錢(qián),等模型真正練成了,它的通用能力、泛化能力,是那些專用小模型沒(méi)法比的。
徐陽(yáng)點(diǎn)點(diǎn)頭,算是認(rèn)可。
陳澈抓起茶杯,略顯激動(dòng)道:
“姐夫你想象一下,未來(lái)它能寫(xiě)代碼、做翻譯、分析報(bào)告、甚至進(jìn)行復(fù)雜的對(duì)話和推理...應(yīng)用空間太大了,我甚至有個(gè)夢(mèng)想,想著未來(lái)能支持做出一個(gè)像DeepSeek這樣名字的、具有深度探索和理解能力的大模型平臺(tái)?!?/p>
面對(duì)徐陽(yáng)這樣的人,陳澈稍微帶了一點(diǎn)熱血中二,提出了“夢(mèng)想”的字眼。
“Deep…Seek?”
果然,徐陽(yáng)被陳澈的熱情和“DeepSeek”這個(gè)名字觸動(dòng),饒有興致。
只是如今在他嘴里,Deep…Seek這是兩個(gè)單詞,組在一起就是深度探索。
正好陳澈提到了,他想做具有深度探索和理解能力的大模型平臺(tái)。
“DeepSeek,這名字有意思?!?/p>
徐陽(yáng)頓了頓,笑著回應(yīng)道:
“新新,你這么說(shuō)我現(xiàn)在十分理解你的興奮點(diǎn),大模型的潛力確實(shí)誘人,就像給AI裝了個(gè)更接近人類理解力的大腦,不過(guò)這其中挑戰(zhàn)也擺在眼前,還不小呢?!?/p>
…
“不是哥們?!?/p>
郭景林握著酒瓶回來(lái),發(fā)現(xiàn)他們兩個(gè)人還在聊這些,都有點(diǎn)無(wú)語(yǔ)了。
他無(wú)語(yǔ)的不是兩人還在聊。
他是無(wú)語(yǔ)兩人在聊這些。
重新坐在自己的位置上,郭景林碰了碰陳澈的胳膊,對(duì)著徐陽(yáng)道:
“姐夫,吃飯啊?!?/p>
徐陽(yáng)聞言看過(guò)去,他甚至都不知道郭景林離開(kāi)過(guò),點(diǎn)點(diǎn)頭看向周圍。
服務(wù)員剛好端著開(kāi)胃湯過(guò)來(lái),依次放到了幾人面前,很快在場(chǎng)所有人都有了。
餐桌前眾人已經(jīng)開(kāi)始吃了起來(lái),餐具碰撞的聲音不絕于耳。
徐陽(yáng)拿起小碗里的湯勺,輕撥了一下湯面從三塊排骨里首先挖了一勺湯。
郭景林拿起白色的公筷,伸向緩緩轉(zhuǎn)動(dòng)的餐盤(pán)里,夾了一些到餐盤(pán)上道:
“快吃吧,等會(huì)兒好好喝幾杯?!?/p>
陳澈喝著湯沒(méi)搭理郭景林,而是重新看向徐陽(yáng),繼續(xù)剛才的話題道:
“姐夫覺(jué)得這中間的挑戰(zhàn)是什么?”
徐陽(yáng)聞言,立馬放下湯勺,把鮮美的湯汁咽進(jìn)嘴里,笑了笑說(shuō)道:
“我只是拙見(jiàn),并不權(quán)威啊?!?/p>
陳澈道:
“沒(méi)事姐夫,咱們就是聊聊嘛,我現(xiàn)在是真有這方面需求,姐夫可別藏私?!?/p>
徐陽(yáng)連忙道:
“肯定不藏私,就是一點(diǎn)認(rèn)識(shí)?!?/p>
陳澈洗耳恭聽(tīng)道:
“姐夫你說(shuō)。”
徐陽(yáng)當(dāng)下攤開(kāi)手掌,說(shuō)道:
“我是覺(jué)得第一是算力,訓(xùn)練需要大量GPU集群,持續(xù)投入巨大,杭城那邊雖然有阿里云,但自建或租賃的成本都是天文數(shù)字,真要自己做成本是大問(wèn)題,第二是數(shù)據(jù)上的,想要搞那種大模型平臺(tái)需要高質(zhì)量、海量、多樣化的數(shù)據(jù),特別是中文數(shù)據(jù),數(shù)據(jù)的清洗、標(biāo)注、合規(guī)性都是大問(wèn)題,算法上Transformer是基礎(chǔ),但如何優(yōu)化架構(gòu)、提升訓(xùn)練效率、降低推理成本?如何解決模型幻覺(jué)偏見(jiàn)和安全問(wèn)題?這些都需要頂尖的算法團(tuán)隊(duì),最后也是最重要的一點(diǎn),無(wú)論成功與否還是要找到能賺錢(qián)的場(chǎng)景,是提供API服務(wù)?賦能特定行業(yè)?還是做成產(chǎn)品?現(xiàn)在大家都在摸索,不知要多久?!?/p>
期間,徐陽(yáng)聲情并茂。
他是一個(gè)老實(shí)人,平常話不多,只有涉及到他熟悉的專業(yè)才顯得侃侃而談。
陳澈認(rèn)真聽(tīng)著,不時(shí)點(diǎn)頭道:
“姐夫分析得很透徹啊,其實(shí)最大的痛點(diǎn)就是投資的價(jià)值所在嘛,算力問(wèn)題,隨著芯片發(fā)展和云服務(wù)成熟,成本曲線肯定是下降的,數(shù)據(jù)需要長(zhǎng)期積累和有策略地獲取,說(shuō)到底,算法和人才,這正是我投資最看重的——有沒(méi)有核心的、能攻堅(jiān)的團(tuán)隊(duì)。
徐陽(yáng)點(diǎn)點(diǎn)頭。
陳澈在這時(shí)笑了笑又道:
“至于落地...我相信,當(dāng)模型足夠強(qiáng)大時(shí)應(yīng)用場(chǎng)景會(huì)自己涌現(xiàn)出來(lái),甚至創(chuàng)造出我們現(xiàn)在想不到的需求,關(guān)鍵在于先把這個(gè)“大腦”練好、練強(qiáng),杭城有阿里達(dá)摩院這樣的機(jī)構(gòu)在引領(lǐng),還有浙大等高校的人才基礎(chǔ),大環(huán)境方面我覺(jué)得土壤是有的?!?/p>
徐陽(yáng)點(diǎn)頭道:
“嗯,達(dá)摩院確實(shí)在NLP和視覺(jué)方面很強(qiáng),他們肯定也在布局大模型,高校實(shí)驗(yàn)室也有一些前沿研究,不過(guò)從實(shí)驗(yàn)室成果到產(chǎn)業(yè)化、工程化落地,中間還有很長(zhǎng)的路要走,需要巨大的資金支持和商業(yè)化的魄力?!?/p>
說(shuō)到這里,徐陽(yáng)看向陳澈,其實(shí)心里已經(jīng)有了猜想,最后遲疑又問(wèn)道:
“所以你是想找那些已經(jīng)有一定技術(shù)積累,敢于挑戰(zhàn)這個(gè)大方向的初創(chuàng)團(tuán)隊(duì)?”
陳澈喝了一口湯道:
“沒(méi)錯(cuò),最好是那種如今有清晰技術(shù)路線圖,核心團(tuán)隊(duì)背景過(guò)硬,比如有Google Brain, FAIR,或者國(guó)內(nèi)頂尖實(shí)驗(yàn)室經(jīng)驗(yàn)的,并且對(duì)模型的理解超越簡(jiǎn)單應(yīng)用的團(tuán)隊(duì),他們可能現(xiàn)在還在早期,模型規(guī)模不大,但方向明確,有潛力,姐夫你在杭城圈子里有沒(méi)有聽(tīng)說(shuō)過(guò)這樣的苗子?”
陳澈早就去尋找這樣的團(tuán)隊(duì)了,只是他上一世不知道那些成功的團(tuán)隊(duì)如今在干嘛,只知道未來(lái)杭城的環(huán)境很不錯(cuò)。
這方面,唐智賢已經(jīng)在準(zhǔn)備了,只是時(shí)至今日都沒(méi)有給陳澈準(zhǔn)確答復(fù)。
如今他面對(duì)徐陽(yáng),當(dāng)然沒(méi)有提NSC已經(jīng)開(kāi)始準(zhǔn)備,只是當(dāng)做一次閑聊的探底,如果有機(jī)會(huì),他自然想對(duì)方幫自己。
至于讓徐陽(yáng)幫忙找人,陳澈對(duì)此沒(méi)有抱太大希望,他之所以還要這么說(shuō),主要是把關(guān)系拉近,畢竟這不是純商業(yè)飯局。
另外,就是陳澈碰運(yùn)氣,以及想看看徐陽(yáng)對(duì)這件事的態(tài)度和上心程度。
截止目前聊的這些,其實(shí)陳澈已經(jīng)非常驚喜了,他還真不知道對(duì)方對(duì)此有所了解,或許以后真能成為他的助力呢。
徐陽(yáng)確實(shí)不適合去樂(lè)旗文化和環(huán)客,要是真能在這方面幫他,是再好不過(guò)了。
場(chǎng)間,徐陽(yáng)陷入沉思,他回憶著自己這方面認(rèn)識(shí)的人,輕聲道:
“我倒是知道幾個(gè)從大廠出來(lái)、背景不錯(cuò)的工程師,但具體方向是不是純大模型,我還得再打聽(tīng)打聽(tīng),回頭我問(wèn)問(wèn),不過(guò)你要是真想搞,杭城倒是也真不錯(cuò)?!?/p>
陳澈正準(zhǔn)備說(shuō)話,郭景林卻把酒杯遞了過(guò)來(lái),帶著一絲催促和幽怨道:
“來(lái)來(lái)來(lái),喝一杯?!?/p>
陳澈和徐陽(yáng)抬頭看去,原來(lái)是陳天宏和郭啟東帶頭,大家一起干杯。
兩人對(duì)視一眼,倒是暫停話題,陳澈更是十分輕松的和二人一一碰杯道:
“來(lái),喝一個(gè)。”
徐陽(yáng)不怎么喝酒,但還是喝了好大一口酒,喝完便示意陳澈二人先吃菜。
餐廳里鬧哄哄的,因?yàn)檫@餐桌夠大,基本上也是一小波人各聊各的。
郭景林喝了一杯,看向陳澈和徐陽(yáng)時(shí)眼睛里帶著幽怨,放下酒杯道:
“你們倆剛才在聊什么呢?”
陳澈攤手道:
“就是你聽(tīng)到的這些啊?!?/p>
郭景林追問(wèn)道:
“你什么時(shí)候懂這些東西了?”
陳澈輕輕敲了敲桌面笑道:
“讓你平常多學(xué)習(xí),你不聽(tīng),以后什么新興產(chǎn)業(yè)都得了解啊你?!?/p>
正在這時(shí)徐陽(yáng)笑出了聲,在陳澈二人看過(guò)來(lái)之際,帶著調(diào)侃道:
“新新這些東西,估計(jì)不是在學(xué)校里面學(xué)的吧,我跟新新聊天總有一種對(duì)方工作了好多年的錯(cuò)覺(jué),這一點(diǎn)算是天賦吧?!?/p>
郭景林十分認(rèn)可道:
“對(duì),你小子就是天賦比我好?!?/p>
陳澈哈哈笑道:
“不止呢,我還比你努力。”
郭景林聞言故意臉黑道:
“我就知道你肯定背著我努力了!”