當(dāng)前,作為數(shù)字經(jīng)濟(jì)時代的重要基礎(chǔ)設(shè)施、關(guān)鍵技術(shù)、先導(dǎo)產(chǎn)業(yè)以及賦能引擎,人工智能已在自動駕駛、智慧城市等領(lǐng)域廣泛應(yīng)用,成為改善人民生活質(zhì)量、推動產(chǎn)業(yè)優(yōu)化升級的重要驅(qū)動力。黨的二十大報告指出,加快發(fā)展數(shù)字經(jīng)濟(jì),促進(jìn)數(shù)字經(jīng)濟(jì)和實體經(jīng)濟(jì)深度融合,打造具有國際競爭力的數(shù)字產(chǎn)業(yè)集群。
近日,北京智源人工智能研究院院長、北京大學(xué)計算機(jī)學(xué)院教授黃鐵軍,清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授、清華大學(xué)人工智能研究院常務(wù)副院長孫茂松,阿里云智能首席技術(shù)官周靖人做客《人民會客廳》欄目,圍繞大模型驅(qū)動下AI產(chǎn)業(yè)發(fā)展進(jìn)行交流。
從日常生活中人臉識別的廣泛應(yīng)用,到街上行駛的無人駕駛汽車,再到工廠內(nèi)相互配合的機(jī)器人……類似的智能場景在生產(chǎn)生活中并不少見。作為數(shù)字經(jīng)濟(jì)時代的重要基礎(chǔ)設(shè)施、關(guān)鍵技術(shù)、先導(dǎo)產(chǎn)業(yè)以及賦能引擎,人工智能(AI)已在自動駕駛、智慧城市等領(lǐng)域廣泛應(yīng)用,成為改善生活質(zhì)量、推動產(chǎn)業(yè)優(yōu)化升級的重要驅(qū)動力。
近日,行業(yè)專家和企業(yè)代表做客人民網(wǎng)《人民會客廳》視頻訪談欄目時表示,大數(shù)據(jù)、大算力推動了人工智能發(fā)展走向大模型時代,要加快人工智能技術(shù)創(chuàng)新,建設(shè)開源開放生態(tài),降低模型應(yīng)用成本,拓展人工智能應(yīng)用場景,推動數(shù)字經(jīng)濟(jì)和實體經(jīng)濟(jì)融合發(fā)展,為經(jīng)濟(jì)社會高質(zhì)量發(fā)展注入智慧動能。
【更多】北京智源人工智能研究院院長、北京大學(xué)計算機(jī)學(xué)院教授黃鐵軍:經(jīng)過十幾年發(fā)展,人工智能已發(fā)展到大模型時代。大模型是一個智能載體,而智能來自于海量的數(shù)據(jù)。計算機(jī)具有超強(qiáng)算力,能夠從海量數(shù)據(jù)中提煉出智能模型。再加上人工智能算法的進(jìn)步,能夠訓(xùn)練出智能水平比較高的模型。要建設(shè)開源開放的大模型技術(shù)體系,讓更多人的聰明才智以開放的方式匯聚在一起,推動智能社會更快到來。
清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授、清華大學(xué)人工智能研究院常務(wù)副院長孫茂松:大模型和AIGC實際上為數(shù)字經(jīng)濟(jì)開創(chuàng)了無限可能性。借助于計算機(jī)可以對所有信息,包括文本信息、圖像信息從計算的角度進(jìn)行處理,在深度和廣度上比以前有一個質(zhì)的提升。要把這種可能性落實到現(xiàn)實中的應(yīng)用場景里有一定的難度,需要付出艱苦的智力勞動,要打破數(shù)據(jù)間的行業(yè)壁壘,在符合國家法律法規(guī)的前提下,共享、利用、開發(fā)好數(shù)據(jù)。
阿里云智能首席技術(shù)官周靖人:推動我國AI創(chuàng)新發(fā)展,一是要在基礎(chǔ)設(shè)施上提供相應(yīng)的算力支持,能夠有更大規(guī)模的提供公共服務(wù)的算力平臺,為我國AI快速發(fā)展奠定基礎(chǔ)。二是模型生態(tài)建設(shè)上要有開源共享的目標(biāo),不僅要關(guān)注基礎(chǔ)模型,也要探索每個行業(yè)的相關(guān)模型,包括人工智能一系列應(yīng)用,這對我國AI發(fā)展發(fā)揮著重要作用。三是要降低AI使用門檻,降低模型應(yīng)用成本,讓各行各業(yè)的人將人工智能應(yīng)用到實際場景中,真正讓AI做到普惠、創(chuàng)新發(fā)展。
人民網(wǎng)主持人吳婧:
各位好!歡迎走進(jìn)《人民會客廳》。近年來我國人工智能加速發(fā)展,形成了較為完整的產(chǎn)業(yè)體系,人工智能日益融入千行百業(yè),成為驅(qū)動產(chǎn)業(yè)轉(zhuǎn)型升級、推動新型工業(yè)化建設(shè)的重要驅(qū)動力量。今年的政府工作報告也強(qiáng)調(diào),大力發(fā)展數(shù)字經(jīng)濟(jì),這意味著人工智能等數(shù)字經(jīng)濟(jì)將迎來新的發(fā)展前景。
今天我們的演播室為大家邀請到了北京智源人工智能研究院院長、北京大學(xué)計算機(jī)學(xué)院教授黃鐵軍,清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授、清華大學(xué)人工智能研究院常務(wù)副院長孫茂松,阿里云智能首席技術(shù)官周靖人。歡迎大家。
今天我們將要圍繞大模型驅(qū)動下中國AI產(chǎn)業(yè)發(fā)展進(jìn)行探討。我們知道,近期國內(nèi)外出現(xiàn)了一系列的自然語言生成的現(xiàn)象級AI產(chǎn)品。我們想先請教一下三位,這樣一款產(chǎn)品出現(xiàn)根本的原因是什么?
北京智源人工智能研究院院長、北京大學(xué)計算機(jī)學(xué)院教授黃鐵軍:
可能大家關(guān)注的是產(chǎn)品,事實上整個AI的趨勢到了今天這個時候,無論是哪款產(chǎn)品出現(xiàn),背后的整個大的趨勢是不變的,產(chǎn)品只是一個典型的大家接觸到的東西。實際上人工智能發(fā)展,當(dāng)然我們也可以說經(jīng)歷了差不多六七十年,也可以說經(jīng)過2012年以來十多年的發(fā)展,已經(jīng)到了這樣一個時刻。什么樣的時刻呢?就是今天大家說的大模型。大模型是什么東西呢?其實就是一個智能的載體,智能的來源來自于大數(shù)據(jù),海量的數(shù)據(jù)。人類像生物這種智能來自于地球這樣一個復(fù)雜的環(huán)境把我們進(jìn)化出來我們的智能。今天大家用的人工智能這種用計算機(jī)算法產(chǎn)生的人工智能,背后實際上來自于海量的數(shù)據(jù),數(shù)據(jù)也是環(huán)境的一種表達(dá)方式。經(jīng)過差不多新世紀(jì)以來,海量數(shù)據(jù)的產(chǎn)生,使得產(chǎn)生智能的物質(zhì)條件具備了。這是第一個。
第二個,今天計算機(jī)的算力特別強(qiáng),它能夠從海量的數(shù)據(jù)中提煉出一個智能模型,這也是一個基本條件,這個條件以前也不具備,今天的算力也已經(jīng)具備了這樣的條件。再加上人工智能算法的進(jìn)步,使得今天能夠訓(xùn)練出智能水平比較高的模型。有了這樣的模型在背后,出現(xiàn)各種各樣的產(chǎn)品也就不奇怪了。
清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授、清華大學(xué)人工智能研究院常務(wù)副院長孫茂松:
剛才黃老師說了,實際上是三個“大”,三駕馬車,大數(shù)據(jù)、大模型、大算力。這三件事不是放到一起就出這個東西,實際上是產(chǎn)生了化學(xué)反應(yīng)。但是沒這三件事肯定不行,應(yīng)該說這三個“大”風(fēng)云際會的結(jié)果。這里面特別重要的就是自然語言的作用,自然語言就是人類語言,人類語言的重要性不言而喻,我們大家都有認(rèn)識,語言是人類所獨有的,可以反映非常深刻的思想,我們很多人類獨有的活動,比如說推理、決策等等,其實都依賴于語言。但是以前沒有找到一個很好的計算的辦法,把它打到模型里面去。這些年發(fā)展,實際上我們找到了一種通過計算的手段把人類的語言可以無遺漏地表示出來,處理一遍。這件事導(dǎo)致了什么結(jié)果呢?我們?nèi)祟悡碛械娜魏蔚母拍,這個概念非常龐大,有粗力度的概念,有細(xì)力度的概念,任何概念都可以以一種隱藏的我們所謂向量表示的形式,向量表示其實就是數(shù)字,以一種可計算的數(shù)字的方式建立聯(lián)系,建立聯(lián)系就可以相互作用,相互作用的話就可以有些更加復(fù)雜的行為,比如大模型和大數(shù)據(jù)融合,可能就會產(chǎn)生涌現(xiàn)現(xiàn)象,涌現(xiàn)現(xiàn)象就會導(dǎo)致它的性能出現(xiàn)一些突變,所以,才有最近這段時間大模型有些表現(xiàn),包括AIGC的表現(xiàn),非常讓人驚艷,我們對語言的處理是一個很重要的原因。
另外,這套理念,就是我們進(jìn)一步拓展了多模態(tài),比如說到圖像,以自然語言為橋梁,然后再結(jié)合圖像本身的優(yōu)勢,把文本和圖像的各自的長處結(jié)合起來,就產(chǎn)生了現(xiàn)在做圖像生成效果也很好,這也是語言做橋梁,往前又走了一大步。我覺得這幾點可能是我們現(xiàn)在產(chǎn)品做得不錯的一個內(nèi)在的原因。
阿里云智能首席技術(shù)官周靖人:
剛才黃教授和孫教授的觀點我都非常認(rèn)同,主要的幾個原因來源于三個元素,包括數(shù)據(jù)、算力,特別是云計算的誕生,以及本身算力模型方面的一系列的進(jìn)展。數(shù)據(jù),剛才黃教授提到了,整個數(shù)據(jù)現(xiàn)在是以非常豐富的形態(tài)的存在,不光光指數(shù)級的增長,以前可能我們更多的是文本的數(shù)據(jù),現(xiàn)在有圖片,有各種的多媒體的數(shù)據(jù),整個的數(shù)據(jù)的體量也是在以指數(shù)級的規(guī)模不斷地發(fā)展。有了數(shù)據(jù),就需要有計算的能力去處理這些數(shù)據(jù)。正好這幾年我們整個云計算得到了長足的發(fā)展。不光是單臺服務(wù)器的計算能力有一個突飛猛進(jìn)的發(fā)展,包括我們的云計算也有效地把成千上萬的機(jī)器有效地連接起來,組成了一個超級計算機(jī),也為今天模型的發(fā)展提供了一個堅實的基礎(chǔ)。
另外,我們在模型方面也有很大的突破。首先,模型本身越來越復(fù)雜,特別是近幾年的Transformer模型的架構(gòu),能夠讓模型的參數(shù)非常龐大,參數(shù)越多,在一定程度上讓模型可以能夠捕捉到很多知識細(xì)節(jié)。另外,在模型訓(xùn)練的范式也發(fā)生了一系列的變化,以前我們?nèi)斯ぶ悄艿哪P,更多的是從?biāo)注的數(shù)據(jù)開始,也就是說需要人提前去標(biāo)注,告訴機(jī)器,學(xué)習(xí)什么樣的結(jié)果,但今天由于新的人工智能范式的誕生,我們更多的是通過一個所謂自監(jiān)督學(xué)習(xí)的方式,能夠從我們海量數(shù)據(jù)里面自動進(jìn)行數(shù)據(jù)的標(biāo)注,只有這樣我們對模型的訓(xùn)練才能有規(guī)模性的發(fā)展,才能真正地能夠創(chuàng)造這樣一個大模型。
回到模型的本質(zhì),為什么今天的模型有這么非常有力的一系列的應(yīng)用呢?我們也在不斷地探索。中間可能有幾個原因。我們知道今天的這些大模型在一定程度上已經(jīng)代表著近似于人類的智能體,人的智力很重要的一點是記憶力,也就是說首先要有記憶才能有其他的一些推演的能力。今天,在大模型,因為它能夠海量去處理今天互聯(lián)網(wǎng)上看到的各種信息,或者說書本上的信息,首先對所有的信息能夠看過一遍,而且本身模型有強(qiáng)大的記憶的能力,它能通過內(nèi)部強(qiáng)大的網(wǎng)絡(luò),非常有效地把我們的信息、把我們的知識組合起來,組織起來,也就是我們常常講到的高效的縮影,也就是它有高效的存儲讓這些知識有效地存儲起來。有了這些知識過后,當(dāng)我們解決實際問題中間的時候,就會發(fā)現(xiàn)我們是可以舉一反三的,經(jīng)常我們講熟讀唐詩三百首不會做詩也會吟,我們往往遇到實際的問題是可以通過我們的知識體系進(jìn)行解答的。甚至今天在模型的時候我們也引入了一些隨機(jī)變量,能夠讓今天有這么靈機(jī)一動的感覺,讓今天的基于大模型的深層的應(yīng)用變得非常豐富、非常有力。
我們認(rèn)為今天大模型還是在一個發(fā)展的初期,所謂大模型所帶來的一系列的應(yīng)用,以及大模型真正的核心的能力,我覺得我們現(xiàn)在也許只看到了一部分,今后的幾年我們應(yīng)該能夠看到更多這樣創(chuàng)新式的應(yīng)用發(fā)展起來。
人民網(wǎng)主持人吳婧:
清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授、清華大學(xué)人工智能研究院常務(wù)副院長孫茂松:
AIGC是生成,所以,首先應(yīng)該會對內(nèi)容制作和內(nèi)容創(chuàng)作產(chǎn)生直接的深刻的影響。我想可能有這么幾點。一個是它可以顯著地降低制作成本,以前你要作一幅畫,很多功夫要下,現(xiàn)在用大模型,他把人類的畫作都學(xué)了一遍,之后他可以很快地,不需要你做很多的事情,從制作的角度,如果從工業(yè)生產(chǎn)的角度,他會顯著地降低成本。
再一個,會顯著地降低準(zhǔn)入的門檻。原來比如說你要做內(nèi)容的制作,通常是要大的機(jī)構(gòu),或者是大的企業(yè),個人很難做這件事。從制作。但是現(xiàn)在有了AIGC的人工智能工具,不光是2B,不光是大的B可以做這件事,個體也可以做,2C和2B說不定在一個平面上了,這樣其實大大有利于大眾創(chuàng)業(yè)、萬眾創(chuàng)新。
再一點,它會顯著提高生產(chǎn)的效率,它快。這個顯然,秒級就出來。
再一個,它會顯著提升產(chǎn)品的質(zhì)量。特別是多樣性和個性化生產(chǎn),計算機(jī)作一幅畫,人工智能作一幅畫你不滿意,我再給你弄一個,這幾乎是無限的,直到一款符合你的要求,契合上,你在這種基礎(chǔ)上修改,還是啟發(fā)你,機(jī)器可能的生成空間比我們?nèi)讼胂蟮目臻g可能要大,它啟發(fā)你,可能不一定完全合理,啟發(fā)你,你再去做一些創(chuàng)意,也很重要,在這個基礎(chǔ)上做創(chuàng)意,這樣就使它的多樣性和個性化就會有一個很大的提升。
直接的效應(yīng),包括相關(guān)產(chǎn)業(yè),是很明確的,這個空間是非常廣闊的。再往前走,不僅限于此,有了大模型,因為它把信息以一種知識的形式整理了一遍,給它打通,這時候我們做其他更復(fù)雜的任務(wù),比如說做宏觀經(jīng)濟(jì)決策,做更復(fù)雜的任務(wù),可能就會比以前做得好。直接就是生產(chǎn),但是,再往前走一步,會有更廣闊的應(yīng)用空間。
人民網(wǎng)主持人吳婧:
北京智源人工智能研究院院長、北京大學(xué)計算機(jī)學(xué)院教授黃鐵軍:
AIGC,人工智能產(chǎn)生內(nèi)容。之前我們知道,幾年之前,UGC,用戶產(chǎn)生內(nèi)容。再往前,大家不說,但是大家都知道,是專業(yè)人員產(chǎn)生內(nèi)容,是作家、畫家經(jīng)過長期訓(xùn)練之后才能產(chǎn)生有質(zhì)量的內(nèi)容。現(xiàn)在AI都可以做了,肯定會對人的各方面會產(chǎn)生很深刻的影響。
一方面我們傳統(tǒng)認(rèn)為的創(chuàng)造性,比如說我是個作家,我寫一篇大家很愿意讀的小說,我覺得這是很有創(chuàng)造性。我一個畫家,美院畢業(yè),我畫一幅畫價值多少。那個時候認(rèn)為這就是創(chuàng)造性,今天我們回過頭來看,這種創(chuàng)造性大概要一分為二的看,一種是真正的原創(chuàng)性和根據(jù)前人的作品組合、模仿畫或者是創(chuàng)作,這是兩種創(chuàng)作性,后面這一種現(xiàn)在AI是可以做的,真正原創(chuàng)的,比如說齊白石畫派,出現(xiàn)了一個全新的畫種,以前沒有,從他開始有了。物理學(xué)的愛因斯坦,之前我們沒有相對論的觀念,他在腦子里面有了這么個靈光一閃,產(chǎn)生了一套新的理論。這種創(chuàng)造性,今天的AI,我認(rèn)為是做不到的,至少目前的AI還缺乏這樣的能力。但是像剛才說的其他的,我們原來認(rèn)為百分之九十幾的創(chuàng)造性,AI都可以做了,因為大多數(shù)從事的是這百分之九十多,而不是那最頂尖的創(chuàng)造性,一定會對這一類的職業(yè)、工作帶來很深刻的影響。
因為今天我們很多人,除了剛才說頂尖的少數(shù)人在做,從事物質(zhì)生產(chǎn)的也有一部分人在做,中間有很大量的人是在做內(nèi)容或者是文化產(chǎn)品或者是精神產(chǎn)品,這些工作就會受到直接的影響。但是我覺得可能最大的影響是說,如果這個東西能被AI替代之后,如果人不去做這件事了,AI的成本也低,又方便,很容易得到,其實最后那個頂尖的成果的產(chǎn)生也可能被影響了,因為人不去努力地走前面這些沒那么創(chuàng)造性的工作,他可能走不到那么原創(chuàng)的東西。所以,這個對人類社會的發(fā)展,我們要想想,原來說把體力勞動希望交給機(jī)器,現(xiàn)在我們把大部分腦力勞動也要交給機(jī)器的話,還要我們干嗎?盡管我剛才說,還保留了一定的人,特殊的只有人能做的創(chuàng)新,但是問題是可能根本就走不到那一步。所以,這是一個很深遠(yuǎn)的問題,一方面,某種意義上是福利,AI幫我們做了這么多腦力勞動的事情,但是另外一方面我們想想這個社會結(jié)構(gòu),以及我們?nèi)祟惖降自趺窗l(fā)展的。
人民網(wǎng)主持人吳婧:
北京智源人工智能研究院院長、北京大學(xué)計算機(jī)學(xué)院教授黃鐵軍:
人民網(wǎng)主持人吳婧:
北京智源人工智能研究院院長、北京大學(xué)計算機(jī)學(xué)院教授黃鐵軍:
人民網(wǎng)主持人吳婧:
北京智源人工智能研究院院長、北京大學(xué)計算機(jī)學(xué)院教授黃鐵軍:
人民網(wǎng)主持人吳婧:
阿里云智能首席技術(shù)官周靖人:
我們剛才提到大模型特別是超大規(guī)模模型的發(fā)展是需要強(qiáng)大的算力,以及模型本身的一系列的研發(fā)。今天到了超大規(guī)模模型,實際上是AI+云計算全面的整體的技術(shù)的表征。也就是說,今天所有的大模型離不開下面的基礎(chǔ)設(shè)施,特別是云計算這樣的計算能力,能夠幫助我們?nèi)プ瞿P偷挠?xùn)練,去做模型的服務(wù)。在這兩個方面,我們國家都有很早期的投入,而且在這方面也是有非常多的創(chuàng)新。比如說在基礎(chǔ)整個算力這部分,在云計算方面,阿里云也是全球前三的云服務(wù)商,特別是阿里云也有自研的超大規(guī)模的操作系統(tǒng),飛天云操作系統(tǒng),也就是說能夠把數(shù)百萬的機(jī)器有機(jī)地能夠聯(lián)系在一起,形成一個超級的計算機(jī)。通過公共服務(wù)的方式,為大家提供相關(guān)的算力。整個操作系統(tǒng)也是通過今天內(nèi)部的軟件各個方面的資源調(diào)度,能夠為我們的AI各個方面的訓(xùn)練,包括數(shù)據(jù)的處理,提供一個堅實的基礎(chǔ)。
我們大模型的訓(xùn)練,還需要特別的智能計算的一些硬件和場景,特別是我們需要一個高密度的計算的集群,在這方面,不光光是每臺機(jī)器有足夠多的計算算力。這些再加上我們的存儲,再加上我們的網(wǎng)絡(luò),再加上我們軟件調(diào)度的一系列的優(yōu)化,才真正為我們大模型以及AI的發(fā)展奠定一個堅實的基礎(chǔ)。我相信,首要的第一個條件就是今天如何能夠用好云計算,能夠讓云計算為我們的AI算力有效地快速地創(chuàng)新、快速地發(fā)展起來奠定了一個堅實的基礎(chǔ)。
第二方面,在模型方面。我們國家在模型方面也是有非常多的一些創(chuàng)新,今天包括孫教授和黃教授這邊的學(xué)院等等,其實在這方面都有非常多的研究。
我們國家研究大模型方面,還是起步很早的,舉例而言,即使在我們阿里,阿里達(dá)摩院這邊也是很早就在做相關(guān)的一系列多模態(tài)預(yù)訓(xùn)練的大模型。最初我們的想法很簡單,當(dāng)我們看到一個事物的時候,如何理解一個事物,這個事物有可能是一個商品,有可能是一個服務(wù),關(guān)于這樣一個事物,是有語言的描述、文本的描述,也有圖片的描述。我們意識到今天為了有效地去理解這樣一個萬物,其實我們是需要從多個渠道理解這樣一個物體,從文本、從自然語言的角度,從圖片、從視覺的角度,去多方面地通過我們的知識體系,去理解這樣一個商品,能夠把知識融會貫通,這樣才能有效地去完成萬物的識別、萬物的理解。這也是我們最開始去做多模態(tài)預(yù)訓(xùn)練大模型的初衷。大概在2019年、2020年的時候我們開始在這方面有很多的投入。我們過去這幾年,從2021年我們也發(fā)布了一個百億參數(shù)規(guī)模的中文的預(yù)訓(xùn)練多模態(tài)大模型。之后我們從百億又到了萬億,到了十萬億也代表了我們國家是有訓(xùn)練整個超大規(guī)模模型技術(shù)的能力。在這之后,我們也在相關(guān)的,包括對話、視覺各個方面也都有非常多的多模態(tài)模型的研發(fā)和創(chuàng)新,特別是我們在過去幾年讀圖會意的競賽VAQ里面,首次能夠讓模型超越人類的評測標(biāo)準(zhǔn),在中文的閱讀理解方面,也是首次超過了人類的評測標(biāo)準(zhǔn),這也是代表了今天我們所有的模型在過去幾年有長足的發(fā)展。
去年阿里這邊把所有的模型匯集在一起,對外發(fā)布了“通義”的大模型系列,我們之所以把所有的模型匯聚在一起能夠形成多模態(tài)訓(xùn)練的范式,能夠提供統(tǒng)一的訓(xùn)練的框架,更重要的是把這些模型能夠分享給大家,能夠開源,能夠開放給大家,能夠讓各行各業(yè)在上面進(jìn)行創(chuàng)造和繼續(xù)地二次開發(fā),只有這樣我們才能為今天這個模型整個的生態(tài)逐漸地建立起來。
人民網(wǎng)主持人吳婧:
北京智源人工智能研究院院長、北京大學(xué)計算機(jī)學(xué)院教授黃鐵軍:
我們在做AI的人與廣大網(wǎng)友大家所關(guān)注的可能還不太一樣,比如產(chǎn)品出來之后,大家會突然眼睛一亮,好象AI突然發(fā)生了什么巨大變化。但是對于做AI的人來說,大概那條河流本來就在流,到了這個節(jié)點出現(xiàn)了一些浪花現(xiàn)象。所以,我想從這個角度來說,我說河流的時候,實際上是全世界上很多人都在做AI的研究,中國有很多人做AI的研究,而且中國的研究本來就是世界研究的一部分,中國的人才、論文等各種貢獻(xiàn)現(xiàn)在也是有目共睹,是整個全球做AI研究的一個重要的力量。所以,在這個意義上來講,我們認(rèn)為這個時間到了這個點,中國有這個技術(shù)的積累、人才的積累,我們現(xiàn)在要做一個產(chǎn)品或者做一個服務(wù),這些條件都是具備的。但是,從一個真正的我們搞AI研究的人,到變成千家萬戶能用的服務(wù),這之間還是有很多企業(yè)、產(chǎn)業(yè)的投入。首先,我們基本的條件還是相當(dāng)不錯的。但是,如果要說大模型這樣一個基礎(chǔ)設(shè)施或者大模型這樣一個時代來看這個問題的話,這中間還有大量的工作要做。
我稍微說得長遠(yuǎn)一點,不在乎今年、明年又發(fā)了幾個大模型或者有多少產(chǎn)品上市了,當(dāng)然對大家有很直接的感受。我想我們從稍微長遠(yuǎn)一點的角度來看待這件事情,大模型本身是一個時代,一個什么樣的時代呢?它從海量的數(shù)據(jù)里面抽取出來,凝練出這樣一個模型,以智力的方式給千家萬戶提供服務(wù)的。這種服務(wù)你要想,我們講未來是智能時代,智能時代是什么感覺?家里面所有的東西都是在跟一個具有智力的云、網(wǎng)絡(luò)聯(lián)在一起的,就像今天家里的電器接著電一樣的,打開就亮了。將來我們每一個設(shè)備或者我們用的東西都是聰明的,它聰明來自于哪里?來自于通過網(wǎng)絡(luò)源源不斷送過來的智力。所以,在那個意義下,整個社會構(gòu)造的是一套智力基礎(chǔ)設(shè)施,就跟今天正在用的電力基礎(chǔ)設(shè)施是類似的,是一個道理。所以,整個會有成千上萬的企業(yè)在上面在不同的環(huán)節(jié)給大家提供服務(wù)。所以,在那個意義來看這件事,一方面,這件事并不是特別的技術(shù)秘密,好象誰能用、誰能做、誰不能做,不是那樣一回事。就像發(fā)電,全世界會發(fā)電的人多了,能夠運營大的電廠也很多,但最終電網(wǎng)只有極少數(shù)的電網(wǎng),中國只有兩家電網(wǎng),國家電網(wǎng)、南方電網(wǎng)。將來智力也是這樣類似的形態(tài)。要把這樣的基礎(chǔ)設(shè)施和智力服務(wù)構(gòu)造出來,需要從多方面推動這件事情的形成,而不是幾個簡單的產(chǎn)品?赡懿煌臋C(jī)構(gòu)、不同的產(chǎn)學(xué)研用、全社會,包括投融資,大家要從這個角度來看,找到自己更恰當(dāng)?shù)奈恢,為未來共同的愿景作出自己的貢獻(xiàn)。
像我們學(xué)校,或者我現(xiàn)在所在的智源研究院這樣的機(jī)構(gòu),因為我們是做技術(shù)的,最終我們的貢獻(xiàn)還是體現(xiàn)在技術(shù)上。我們現(xiàn)在的重點實際上是做開源、開放的大模型技術(shù)體系,因為你早晚不管這個模型誰做誰運營,總要訓(xùn)練模型的技術(shù)是越先進(jìn)越好,那樣才能把成本降下來普及千家萬戶。所以,我們?yōu)榱俗鲩_源開放,很多研究學(xué)者都在做,不做開源開放,這些東西會封閉在少數(shù)壟斷企業(yè)手上。比如我們關(guān)心國內(nèi)國外的,這個產(chǎn)品當(dāng)然是要直接面對用戶。但是像我剛才說,長遠(yuǎn)來說,這個東西是普惠的東西,普惠的東西就需要跟多的人把自己的聰明才智,比如算法的改進(jìn)、訓(xùn)練東西的改進(jìn)能夠以開放的方式匯聚在一起推動這個社會更快到來,F(xiàn)在整個社會,可能大家看到產(chǎn)品有點著急,這是著急不來的,一定是在建造一個智力社會,至少要有幾年的眼光,絕對不要幾個月,現(xiàn)在著急,馬上要做出,有點過激反應(yīng),這不太好。
人民網(wǎng)主持人吳婧:
清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授、清華大學(xué)人工智能研究院常務(wù)副院長孫茂松:
我特別同意剛才黃老師說的,我們應(yīng)該從更高的角度來看待這個問題,風(fēng)物長宜放眼量。著名的哲學(xué)家維特根斯坦曾經(jīng)說過一句話,非常深刻,他說“我的語言的極限就是我的世界的極限”。這句話我們給它推演一下,人類語言的極限就是人類世界的極限。大模型實際上通過語言把我們世界上所有的文本信息以及進(jìn)一步拓展圖像信息、多模態(tài)信息等等,它給它融通起來。這件事實際上可以說是大模型的極限,就是我們未來智能信息處理的極限,可能也不夸張,就是剛才黃老師說的,它是一個智能信息處理的基礎(chǔ)設(shè)施。可能我們要從這個角度來看這個問題,如果這樣來看,就不光是企業(yè)的問題,就上升到國家層面。
我們國家應(yīng)該說從2010年開始,這一波人工智能的高潮到來這十來年,我們國家在人工智能方面還是取得顯著進(jìn)步,剛才黃老師也說了,我們做這件事的能力是有的,這個不容易,非常不容易。人工智能實際上是全世界各種,包括國家,包括企業(yè),包括個人,各種力量博弈的一個結(jié)果,它是競爭的一個巔峰對決,我的話叫巔峰對決,非常不容易,我們能跟上。所以,這應(yīng)該是我們國家可以在大模型和AI技術(shù)方面已經(jīng)作出很多成果的一個重要保障。我們?nèi)跏侨踉谀哪?我們跟跑能力很?qiáng),我們領(lǐng)跑能力現(xiàn)在是一大短板?偟膩碚f,跟我們是能跟上,但是領(lǐng)跑幾乎很少,這是我們將來要深刻思考的問題。但是跟跑的能力也很重要,為什么?我們能跟上,就說明我們有能力在AI一些重要應(yīng)用場景方面作出創(chuàng)新。因為AI應(yīng)用場景也是重大挑戰(zhàn),國外在這方面也在探索。貌似在應(yīng)用層面,實際上它和國計民生更密切,這一大塊是短板,全世界都是一大短板,我們能在前沿技術(shù)上跟上,就預(yù)示著我們有能力在重大應(yīng)用場景方面取得突破,這也非常重要。
當(dāng)然,如果我們將來可以領(lǐng)跑就更理想了,這個問題比較復(fù)雜,今天可能不一定有時間來討論。你剛才講的人才培養(yǎng),其實是其中一個重要的因素。我們國家培養(yǎng),平均意義來說,高質(zhì)量的人才、人工智能的人才,這些年是沒有問題的,這些年培養(yǎng)了大量的人才,支撐了我們國家包括大學(xué)、科研院所乃至企業(yè)的人工智能的發(fā)展。但是我們在頂尖人才培養(yǎng)方面也是一大短板,這和我們頂尖成果、領(lǐng)跑是匹配的。當(dāng)然,這個問題就比較深刻。比如我就講一點,我們可能要進(jìn)一步提高學(xué)生的視野,就是他的學(xué)術(shù)視野。比如說人工智能真是要有重大創(chuàng)新,可能要多學(xué)科的交叉,特別是要有非常深厚的數(shù)學(xué)基礎(chǔ)。包括從物理、化學(xué)里面都應(yīng)該可以接到很好的借鑒,這塊我們學(xué)生是弱的。比如學(xué)計算機(jī)的,可能只關(guān)注計算機(jī)的知識。但是從國外發(fā)展,比如這段Diffusion model,實際上從物理、從化學(xué)那邊有所借鑒,你看他們學(xué)生讀的論文,會讀《Physical Review》,我們學(xué)生可能就少。所以,交叉學(xué)科合作的意識可能需要培養(yǎng)。總之,這個問題很復(fù)雜,今天不一定有時間展開了。
人民網(wǎng)主持人吳婧:
阿里云智能首席技術(shù)官周靖人:
我們剛才提到其實大模型本質(zhì)都是算力及模型上的突破,為了進(jìn)一步促進(jìn)我們國家在AI上面的整個創(chuàng)新和不斷探索,我覺得從幾個方面:第一方面,我們還是要能夠在整個基礎(chǔ)設(shè)施上提供相應(yīng)的算力支持。因為所有模型的訓(xùn)練基礎(chǔ)還是依賴于通用的計算能力。在這方面,我們是希望能夠有更加大規(guī)模的、更加能提供公共服務(wù)的算力的平臺,或許更多是跟當(dāng)前云計算發(fā)展能夠有機(jī)結(jié)合在一起。
剛才講到模型訓(xùn)練的范式也在發(fā)生一系列的變化。往往以前我們是訓(xùn)練一個特定問題的模型,因為有了這樣一個預(yù)訓(xùn)練的模型框架,我們可以最開始的階段,更多的是一個知識的積累,并沒有帶有任何一個特定問題訓(xùn)練這個模型。這部分,在這個階段,我們往往叫預(yù)訓(xùn)練的階段,是需要大量的算力,需要大量數(shù)據(jù)的處理。在這方面,剛才兩位教授講到,今天我們要在跟海外的頂尖機(jī)構(gòu)在這方面進(jìn)行競爭。今天的競爭,不單單是一個AI方面的競爭,這是今天AI+整個計算算力全方面的競爭。在這方面,我們一定要在基礎(chǔ)設(shè)施方面能夠為我們接下來整個國家的AI快速發(fā)展奠定一個堅實的基礎(chǔ),這是第一點。
第二點,我也非常同意剛才兩位教授的觀點,今天我們要講到AI快速發(fā)展,需要我們模型有這樣的生態(tài),更多的是要讓大家有開源共享的一個目標(biāo)。其實今天我們大家更多的關(guān)注是底層的模型,也就是今天關(guān)注的比如說像語言模型等等,這些我們一般來講,專業(yè)人士講的是叫基礎(chǔ)模型;A(chǔ)模型需要大量算力、大量的知識積累。同時,我們也需要行業(yè)模型,比如真正要把這些模型應(yīng)用在一個行業(yè)里面,其實我們是需要大量的行業(yè)的算法工程師來根據(jù)我們當(dāng)前的問題來進(jìn)行不斷地去調(diào)優(yōu)。當(dāng)然,隨著今天整個大模型的發(fā)展,上層模型的調(diào)優(yōu)也發(fā)生了一系列的變化。過去我們更多的是做一些微調(diào),其實現(xiàn)在我們看到,現(xiàn)在微調(diào)都不需要,可以通過指令性的一系列創(chuàng)新,能夠改變今天模型在實際過程中的一系列行為,幫助我們有效解決問題。所以,在這方面,整個模型的生態(tài)發(fā)展,我希望大家不光光關(guān)注我們的底層模型,其實每一條行業(yè)線相關(guān)模型的探索,包括人工智能一系列的應(yīng)用,這對我們國家全方面的AI的發(fā)展也是起到一個至關(guān)重要的作用。
第三點,隨著我們今天AI的發(fā)展,我們還是需要降低AI使用的門檻。剛才講到所有都提到AI訓(xùn)練成本比較高,有時候也需要相當(dāng)專業(yè)的知識,包括今天到了每一個行業(yè)也需要進(jìn)行特定為這個行業(yè)進(jìn)行制作,怎樣讓AI使用的成本進(jìn)一步降低。甚至我們今天能夠讓學(xué)生甚至讓小學(xué)生,今天我們的小學(xué)生也都可以在PAD上進(jìn)行編程,其實他們也應(yīng)該能快速使用這些模型。去年我們搭建了一個社區(qū)叫魔搭社區(qū),就是嘗試解決這方面的問題。魔搭社區(qū)短短幾個月也出現(xiàn)了將近有幾十萬的開發(fā)者到我們的網(wǎng)站上來下載模型。特別是我們提供一個簡單易用的編程接口,能夠幾行代碼就可以使用非常復(fù)雜的模型,這只是一個例子。我是希望講到今天我們需要讓模型的應(yīng)用成本不斷地降低,能夠讓今天我們各行各業(yè)的人,即使你是非計算機(jī)專業(yè)的人,也能夠使用到人工智能的方方面面,能夠應(yīng)用到你實際的場景里面,只有這樣我們才能真正做到AI的普惠、AI的創(chuàng)新能夠共同發(fā)展。
人民網(wǎng)主持人吳婧:
北京智源人工智能研究院院長、北京大學(xué)計算機(jī)學(xué)院教授黃鐵軍:
剛才講數(shù)字經(jīng)濟(jì)與實體經(jīng)濟(jì)的結(jié)合,可能還需要從更長遠(yuǎn)一點角度看這個問題。我甚至想這樣去打一個比方,比如工業(yè)革命,蒸汽機(jī),原來以人力動物的力量進(jìn)入到以機(jī)械為主體的那樣一個時代,大概有幾百年。電力,應(yīng)該說一九幾幾年開始,整個電力開始進(jìn)入千家萬戶,進(jìn)入企業(yè)。我們想一想當(dāng)時有電和沒電這個社會的那種差別有多大。過去一百多年,計算機(jī)、互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)這些信息,其實我認(rèn)為信息本身可能都難以跟我們接著要出現(xiàn)的智力時代相提并論。因為信息的時候是給人提供信息,還是人作為主體來加工使用這些信息。所謂智力時代是整個信息系統(tǒng),AI系統(tǒng)在利用這些信息產(chǎn)生新的能力、新的智力。所以,我剛才講,從當(dāng)時工業(yè)革命、電力革命、智力革命這三個是同樣量級的。而信息前面那些都是前奏,都是為了這次智力革命準(zhǔn)備素材,數(shù)據(jù)、算力這些條件。只有智力像電一樣的源源不斷地給全社會供應(yīng)的時候,我們就進(jìn)入了一個全新的時代。
在這種意義上我們怎么看待這個問題呢?我們講數(shù)字經(jīng)濟(jì),數(shù)字經(jīng)濟(jì)肯定是建立在數(shù)據(jù)、大數(shù)據(jù)、AI這些新技術(shù)基礎(chǔ)之上的,讓各種應(yīng)用,剛才說人、企業(yè)、全社會各個要素能夠很簡單地使用智力來驅(qū)動。因為這個社會運行的很多東西是靠智力的。我們建房子,我們農(nóng)業(yè)、工業(yè),更別說所有的這些跟內(nèi)容加工、信息生產(chǎn)相關(guān)的活動,背后都是智力。以前是靠人的智力,剛才說工業(yè)革命讓我們的體力一定程度上解放了,這次要解放我們的智力。它會帶來特別深刻的巨大的變化。像剛才講,我們中國在這個時代是走在前沿的,我們并沒有落后,不像前兩次時代的時候,歷史的原因,某種意義上是我們錯過了一段時間。這次我們幾乎是在人類要進(jìn)入這個時代,我們準(zhǔn)備好了。
人民網(wǎng)主持人吳婧:
清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授、清華大學(xué)人工智能研究院常務(wù)副院長孫茂松:
大模型和AIGC實際上是為數(shù)字經(jīng)濟(jì)開創(chuàng)了無限的可能性,這是一條。因為它是借助于計算機(jī)對人類所有信息、文本信息、圖像信息、各類信息從計算的角度進(jìn)行了理解,在這個基礎(chǔ)上我再去做信息處理,所以它的深度和廣度比以前有一個質(zhì)的提升,所以可能性是無限的。但是要把可能性落實到現(xiàn)實性其實還是蠻困難,你不能指望大模型是一個靈丹妙藥,放之四海而皆準(zhǔn),吃一片就靈,不能指望這個。到了重大應(yīng)用場景,還是需要一個場景一個場景的深耕,深深的耕作,要付出艱苦的智力勞動,它不是一個簡單的事。
在這一點上,全世界其實都在摸索階段,你可以認(rèn)為大模型AIGC是一個概念,這個概念顯示了一個無比美妙的前景。這個概念進(jìn)入到千家萬戶可以進(jìn)行銷售,還有一段路要走,這實際上給我們國家,因為我們國家市場很大,各種應(yīng)用場景很大,實際上給我們國家?guī)硪粋很好的機(jī)會。同時,也給各類比如企業(yè),不管是大型企業(yè)還是中小型企業(yè),特別是新興創(chuàng)業(yè)的企業(yè)也帶來了很多機(jī)會,也個人發(fā)展也帶來了很多空間。我剛才也講過AIGC本身是個性化可以很強(qiáng)的,降低了門檻。
總的來說,我們國家這幾年再加把勁,以我們有很強(qiáng)的跟跑能力這件事,在重大的應(yīng)用場景方面應(yīng)該能作出世界領(lǐng)先的成績來。這里面當(dāng)然有很多問題要解決,比如剛才黃教授說了,數(shù)據(jù)有很大的問題。
人民網(wǎng)主持人吳婧:
清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授、清華大學(xué)人工智能研究院常務(wù)副院長孫茂松:
人民網(wǎng)主持人吳婧:
謝謝孫教授。AI產(chǎn)業(yè)的發(fā)展應(yīng)該有很寬廣的未來,但是路上的艱辛還是可以看得見的。
清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授、清華大學(xué)人工智能研究院常務(wù)副院長孫茂松:
人民網(wǎng)主持人吳婧: