文檔幫助中心
中國逐鹿人工智能,哪些關(guān)鍵技術(shù)被國外壟斷著?怎么破?
中國逐鹿人工智能,哪些關(guān)鍵技術(shù)被國外壟斷著?怎么破?
來源:中國新聞網(wǎng)
作為引領(lǐng)未來的戰(zhàn)略性技術(shù)——人工智能是中國提高經(jīng)濟(jì)與科技水平、提升國際競爭力的重要算力基礎(chǔ)設(shè)施,目前各地掀起了人工智能計(jì)算中心的建設(shè)熱潮。人工智能計(jì)算中心如何才能發(fā)揮出最大價(jià)值?中國人工智能計(jì)算中心技術(shù)自主可控水平如何?哪些關(guān)鍵技術(shù)被國外壟斷著?近日,中國工程院院士、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授鄭緯民接受“中國焦點(diǎn)面對(duì)面”專訪,進(jìn)行權(quán)威解讀。
訪談實(shí)錄摘編如下:
給三句話,它就能寫50集連續(xù)劇
記者:近期,中國“人工智能計(jì)算中心訂單爆單”的話題引發(fā)不少關(guān)注。武漢市5月底建成的第一個(gè)人工智能計(jì)算中心,剛開張就天天客滿,滿負(fù)荷運(yùn)行,目前預(yù)約已經(jīng)排到半年以后。人工智能(AI)計(jì)算中心是算什么的?為何市場(chǎng)需求這么強(qiáng)?
鄭緯民:人工智能有多種多樣的應(yīng)用場(chǎng)景,需求很旺。根據(jù)場(chǎng)景可以分為三大類應(yīng)用:
一、圖像檢測(cè)、視頻檢索類??梢杂迷诎卜?、醫(yī)療診斷、自動(dòng)駕駛。核心是卷積網(wǎng)絡(luò),這一類應(yīng)用落地做得很好,已經(jīng)起到了很好的作用。
二、決策類。比如交通規(guī)劃等,這個(gè)類型也已經(jīng)起到了很好的效果,核心是強(qiáng)化學(xué)習(xí)。
三、自然語言處理類。比如搜索與推薦,智能人機(jī)接口,核心是Transformer。在應(yīng)用方面,語言翻譯,把中文翻譯成英文,英文翻譯成日文等,問什么問題都能回答,這樣的機(jī)器需要非常大才行。又比如生成文本摘要,你給它三句話,能給你寫成50集電視連續(xù)劇。
這三類應(yīng)用的需求很多,所以才會(huì)(出現(xiàn)訂單)排隊(duì)排到半年后這樣一個(gè)情況。
記者:目前流行的人工智能計(jì)算中心與傳統(tǒng)數(shù)據(jù)中心有何不同?日前,工信部印發(fā)《新型數(shù)據(jù)中心發(fā)展三年行動(dòng)計(jì)劃(2021-2023年)》,《行動(dòng)計(jì)劃》中定義的新型數(shù)據(jù)中心和人工智能計(jì)算中心是一回事嗎?
鄭緯民:傳統(tǒng)數(shù)據(jù)中心主要由通用CPU架構(gòu)的服務(wù)器集群構(gòu)成。近年來,隨著人工智能的發(fā)展,數(shù)據(jù)中心也逐漸包括了很多具有高性能人工智能算力(GPU或人工智能加速器)的機(jī)器。
而人工智能計(jì)算中心是什么呢?主要由具有高性能人工智能算力(GPU或人工智能加速器)的機(jī)器組成。因此可以說,數(shù)據(jù)中心概念的覆蓋面會(huì)更大一些,包含了人工智能算力。
中國技術(shù)自主可控嗎?
記者:人工智能和大數(shù)據(jù)中心都屬于“新基建”,當(dāng)前全球主要國家都在大規(guī)模建設(shè)人工智能、大數(shù)據(jù)基礎(chǔ)設(shè)施,有人說未來人工智能算力將會(huì)像水和電一樣,成為一種公共基礎(chǔ)資源,對(duì)此您怎么看?中國建設(shè)人工智能基礎(chǔ)設(shè)施有哪些核心優(yōu)勢(shì)?中國人工智能計(jì)算中心的技術(shù)自主可控水平如何?哪些關(guān)鍵技術(shù)被國外壟斷著?
鄭緯民:從全球公有云市場(chǎng)的快速發(fā)展可以看出,通用算力和人工智能算力都是公共基礎(chǔ)設(shè)施,是一種重要的趨勢(shì),過去通用的算力是基礎(chǔ)設(shè)施,現(xiàn)在把人工智能算力也作為基礎(chǔ)設(shè)施,正在被越來越多的用戶認(rèn)可。
但是我們也要注意到,算力作為基礎(chǔ)設(shè)施,需要相關(guān)的數(shù)據(jù)作為基礎(chǔ),把機(jī)器包括普通的機(jī)器,包括人工智能的機(jī)器都放在云上,不少行業(yè)的數(shù)據(jù)隱私性和保密性,對(duì)其上云仍然有很大的限制,怎么把數(shù)據(jù)放在云上是一個(gè)值得考慮的問題。
中國在建設(shè)人工智能基礎(chǔ)設(shè)施上的主要優(yōu)勢(shì),是政府主導(dǎo)的投入較多。但在市場(chǎng)化建設(shè)和運(yùn)營,整體人工智能算力基礎(chǔ)軟硬件的技術(shù)水平和自主可控程度上,還與美國有一定的差距,如,編程框架目前以TensorFlow和Pytorch為主。智能計(jì)算芯片方面,華為昇騰和寒武紀(jì)在人工智能算力體系結(jié)構(gòu)上取得了很好的進(jìn)展,但受制于先進(jìn)芯片制程,或在軟件生態(tài)環(huán)境上仍然與Nvidia產(chǎn)品有明顯差距,仍然需要盡快發(fā)展。
記者:“人工智能計(jì)算中心訂單爆單”話題之外,近期鵬城實(shí)驗(yàn)室大科學(xué)裝置“鵬城云腦II”接連斬獲多項(xiàng)國際獎(jiǎng)項(xiàng),也受到業(yè)界關(guān)注。作為“新基建”,它們可以為科研創(chuàng)新項(xiàng)目提供哪些強(qiáng)大支持?在賦能行業(yè)應(yīng)用等方面有哪些價(jià)值?
鄭緯民:在科研創(chuàng)新方面,目前一個(gè)非常重要的趨勢(shì)是HPC(高性能計(jì)算)+AI(人工智能),就是把傳統(tǒng)基于模擬方法的高性能計(jì)算應(yīng)用與AI模型結(jié)合起來。解決過去解決不了的問題,或是把過去耗時(shí)很長的問題加速成千上萬倍。
這方面,AlphaFold(DeepMind人工智能系統(tǒng))給出了非常好的例子,用人工智能方法來協(xié)助進(jìn)行蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),解決了過去使用純科學(xué)計(jì)算模擬方法由于計(jì)算量過大無法解決的問題。HPC和AI結(jié)合是我們創(chuàng)新的一個(gè)非常明顯的優(yōu)勢(shì)。
在賦能行業(yè)方面,鵬城實(shí)驗(yàn)室可以為智慧城市提供強(qiáng)大的人工智能算力,承載智慧城市應(yīng)用中的智能交通、智能公共衛(wèi)生等功能,鵬城云腦II也在開展“一帶一路”語言的自動(dòng)翻譯,為“一帶一路”(倡議)提供重要支持。
大模型方面,目前主要在自然語言處理效果方面取得了比較大的進(jìn)展,但具體應(yīng)用領(lǐng)域還在探索之中。
記者:各界都認(rèn)為依靠人工智能實(shí)現(xiàn)智能轉(zhuǎn)型是必修課,但目前中國產(chǎn)業(yè)主體存在著發(fā)展著力點(diǎn)分散等問題,從這個(gè)角度來看,政府統(tǒng)籌建設(shè)大規(guī)模的人工智能基礎(chǔ)設(shè)施是否是一個(gè)比較好的解決企業(yè)轉(zhuǎn)型的路徑?大規(guī)模、集約型基礎(chǔ)設(shè)施有哪些獨(dú)特優(yōu)勢(shì)?
鄭緯民:目前,各地政府在建設(shè)人工智能基礎(chǔ)設(shè)施上有很大的積極性,對(duì)本地產(chǎn)業(yè)的人工智能賦能,應(yīng)該說能夠起到很好的推動(dòng)作用。但也要注意,要因地制宜地分析本地產(chǎn)業(yè)人工智能化的路徑和節(jié)奏。
大規(guī)模、集約型基礎(chǔ)設(shè)施,主要是在完成超大規(guī)模模型的訓(xùn)練方面起到關(guān)鍵作用。目前看大模型確實(shí)是重要的發(fā)展趨勢(shì),但人工智能算法的規(guī)模大小是否有局限性仍是一個(gè)開放的問題。
各地為何掀人工智能計(jì)算中心建設(shè)潮?
記者:當(dāng)前國內(nèi)掀起了人工智能計(jì)算中心建設(shè)熱潮,有20多個(gè)城市在規(guī)劃建設(shè)人工智能計(jì)算中心,目前中國人工智能計(jì)算中心運(yùn)營和落地情況如何?
鄭緯民:從武漢和鵬城云腦的經(jīng)驗(yàn)看,目前的人工智能計(jì)算中心運(yùn)行情況還是很好的,需要機(jī)時(shí)的用戶很多,需要排很長時(shí)間的隊(duì)才能用到機(jī)器,這也體現(xiàn)出國內(nèi)用戶對(duì)于人工智能算力的強(qiáng)勁需求。
所以我覺得,建設(shè)一個(gè)人工智能計(jì)算中心為當(dāng)?shù)氐钠髽I(yè)、研究單位、高等院校等進(jìn)行創(chuàng)新賦能,都是會(huì)起到很大作用。
記者:作為各方資源極度聚合的龐大基礎(chǔ)設(shè)施,人工智能計(jì)算中心建設(shè)之后的運(yùn)營同樣是一大命題,在這點(diǎn)上您有什么建議?如何科學(xué)運(yùn)營才能讓各地人工智能計(jì)算中心發(fā)揮出最大價(jià)值?人工智能計(jì)算中心有哪些運(yùn)營評(píng)估維度?
鄭緯民:我覺得特別要注重?cái)?shù)據(jù)治理。算力提供了,數(shù)據(jù)該怎么提供?
隨著《個(gè)人信息保護(hù)法》的出臺(tái),對(duì)數(shù)據(jù)的使用增加了很多合規(guī)性要求,作為地方政府主導(dǎo)建設(shè)的人工智能計(jì)算中心,除了算力以外,是否能夠提供重要價(jià)值的相關(guān)的數(shù)據(jù)。如何在既遵守《個(gè)人信息保護(hù)法》,又能夠讓智能算法獲得所需要的數(shù)據(jù)是人工智能計(jì)算中心運(yùn)營中的一大課題。
再有就是運(yùn)營要注意財(cái)務(wù)上的可持續(xù)性,一定要收費(fèi)運(yùn)行。避免用戶無償大量使用資源,這樣看起來利用率很高,但很可能算的東西沒有價(jià)值。對(duì)特殊的需要賦能支持的用戶,可以采用發(fā)放機(jī)時(shí)券的方式來支持。這方面,過去不少超算中心,比如廣州超算、無錫超算已經(jīng)有很成熟的體系,可以借用。
人工智能計(jì)算中心的運(yùn)營評(píng)估可以包括利用率、投資回報(bào)率、功耗以及應(yīng)用效果等。其中,利用率我想多說一點(diǎn),并不是100%的利用率是最好的,因?yàn)槔寐试礁撸馕吨鳂I(yè)排隊(duì)時(shí)間越長,因此一般來說60%-70%左右的利用率就是個(gè)很好的平衡了,不必追求接近100%的利用率。
記者:結(jié)合數(shù)字經(jīng)濟(jì)和產(chǎn)業(yè)發(fā)展趨勢(shì),您認(rèn)為未來人工智能計(jì)算中心的發(fā)展方向如何,會(huì)不會(huì)在一段時(shí)期的建設(shè)爆發(fā)后又迅速轉(zhuǎn)入冷淡期?
鄭緯民:人工智能與產(chǎn)業(yè)的結(jié)合剛剛開始,我對(duì)人工智能在各行各業(yè)的應(yīng)用擴(kuò)展還是充滿信心的,我認(rèn)為人工智能計(jì)算中心還是有很大的發(fā)展空間。對(duì)我們科研的創(chuàng)新,對(duì)企業(yè)的賦能,對(duì)人民生活的改善都會(huì)有很大的好處。
中國有能力“從頭先進(jìn)”
記者:中國“十四五”規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要提出,加強(qiáng)關(guān)鍵數(shù)字技術(shù)創(chuàng)新應(yīng)用,加快推進(jìn)基礎(chǔ)理論、基礎(chǔ)算法等研發(fā)突破與迭代應(yīng)用。關(guān)鍵數(shù)字技術(shù)創(chuàng)新,中國已經(jīng)取得了哪些優(yōu)勢(shì)?在當(dāng)前國際環(huán)境下,面臨哪些難題要“啃”?哪些與人工智能計(jì)算中心密切相關(guān)?預(yù)計(jì)未來發(fā)展趨勢(shì)如何?
鄭緯民:中國在基礎(chǔ)理論和算法上還很難談優(yōu)勢(shì),但是基本上可以跟隨第一梯隊(duì),就是美國人提出來的算法和理論,我們很快能夠跟上并加以改進(jìn)應(yīng)用。
整個(gè)數(shù)字技術(shù)中,除了硬件的芯片制造產(chǎn)業(yè)鏈,我想特別強(qiáng)調(diào),中國在基礎(chǔ)軟件方向還是有很多的課要補(bǔ)。我們現(xiàn)在大量的軟件,包括操作系統(tǒng)、數(shù)據(jù)庫、編譯器、人工智能編程框架等,不是自己從頭構(gòu)建的,而是在開源基礎(chǔ)上修改的。
應(yīng)該說,能夠在開源軟件基礎(chǔ)上進(jìn)行大量修改,已經(jīng)證明我們?nèi)〉昧撕艽蟮倪M(jìn)步,對(duì)我國數(shù)字技術(shù)的自主化具有重大意義。但是我們?nèi)绻麑?duì)自己提出更高的要求,就必須擁有自主從頭構(gòu)建先進(jìn)的基礎(chǔ)軟件的能力。
這里的“先進(jìn)”是指,我們構(gòu)建的新軟件要比現(xiàn)有的軟件在性能和功能方面有代差的優(yōu)勢(shì)。這方面產(chǎn)業(yè)界,華為的鴻蒙操作系統(tǒng)、人工智能編程框架MindSpore等給出了很好的范例。我們學(xué)術(shù)界,清華大學(xué)的時(shí)序數(shù)據(jù)庫、圖計(jì)算系統(tǒng)、儲(chǔ)存系統(tǒng)也取得了一定的進(jìn)展,我們期待國內(nèi)的產(chǎn)業(yè)界和高校能夠更加重視從頭構(gòu)建先進(jìn)的基礎(chǔ)軟件,為中國和世界的數(shù)字產(chǎn)業(yè)界提供更多革命性的基礎(chǔ)系統(tǒng)軟件。因此,我特別強(qiáng)調(diào)“從頭先進(jìn)”這四個(gè)字,“從頭”就是我們從頭做,“先進(jìn)”就是比現(xiàn)有的軟件好10倍20倍,我們有這個(gè)能力,希望通過這個(gè)辦法,來改善我們國家IT行業(yè)的現(xiàn)狀。