伴隨著數(shù)字經(jīng)濟(jì)的快速發(fā)展,人工智能技術(shù)持續(xù)突破,智能時(shí)代正加速到來(lái)。在人工智能浪潮席卷下,以生成式人工智能、大模型為代表的算力應(yīng)用落地開(kāi)花,也引發(fā)了算力需求的進(jìn)一步增長(zhǎng)。一直以來(lái),我國(guó)東部地區(qū)特別是上海深入挖掘算力融合應(yīng)用場(chǎng)景,各類大模型應(yīng)用不斷推出,加速釋放算力資源服務(wù)潛能。面對(duì)新一輪人工智能發(fā)展熱潮,上海如何乘勢(shì)而上加速推進(jìn)算力在更多場(chǎng)景的應(yīng)用落地?如何促進(jìn)算力更好融合實(shí)體經(jīng)濟(jì)?
上海市日前印發(fā)的《立足數(shù)字經(jīng)濟(jì)新賽道推動(dòng)數(shù)據(jù)要素產(chǎn)業(yè)創(chuàng)新發(fā)展行動(dòng)方案(2023—2025年)》明確提出,建設(shè)高效協(xié)同的算力體系,建設(shè)“E級(jí)”超算載體、人工智能公共算力平臺(tái),因地制宜部署邊緣計(jì)算資源池,對(duì)接“東數(shù)西算”國(guó)家戰(zhàn)略,建設(shè)樞紐型算力調(diào)度平臺(tái),到2025年,算力總規(guī)模較“十三五”時(shí)期末翻兩番。
上海迅速布局算力這一新基建,正是基于當(dāng)前以大模型為代表的算力應(yīng)用的落地開(kāi)花。最近1年,人工智能成為全球科技產(chǎn)業(yè)的熱門(mén)焦點(diǎn)領(lǐng)域。爆款產(chǎn)品ChatGPT(自然語(yǔ)言處理大模型)以其強(qiáng)大的對(duì)話輸出功能,讓人工智能有效輔助生產(chǎn)生活,人工智能產(chǎn)業(yè)隨之向前邁進(jìn)一大步,迅速成為資本青睞的“香餑餑”。
隨著全球科技巨頭紛紛入局,人工智能應(yīng)用在大模型領(lǐng)域打開(kāi)新局面。普遍觀點(diǎn)認(rèn)為,上游算力基礎(chǔ)設(shè)施的持續(xù)建設(shè)、算力規(guī)模的不斷擴(kuò)大、數(shù)據(jù)處理能力的迅速提升,造就了下游算力應(yīng)用端ChatGPT等大模型的成功崛起,讓人工智能發(fā)展迎來(lái)“拐點(diǎn)”。
在這場(chǎng)全球參與的科創(chuàng)競(jìng)技中,我國(guó)緊跟趨勢(shì)走在前沿。其中,以上海為代表的生成式人工智能(AIGC)探索將人工智能帶到新高度,國(guó)家也出臺(tái)了《生成式人工智能服務(wù)管理暫行辦法》,及時(shí)規(guī)范AIGC的開(kāi)發(fā)及應(yīng)用。作為算力落地場(chǎng)景的最大突破口,國(guó)內(nèi)AIGC的發(fā)展態(tài)勢(shì)如何?應(yīng)用效果如何?面臨哪些挑戰(zhàn)?記者走訪了諸多業(yè)內(nèi)企業(yè)與專家,探尋在算力支撐下,人工智能到底怎樣“為我所用”。
大模型火爆
今年的中考、高考結(jié)束后,ChatGPT、文心一言、復(fù)旦MOSS、訊飛星火等大模型緊跟熱點(diǎn),紛紛下場(chǎng)寫(xiě)起作文??戳薓OSS寫(xiě)的上海中考語(yǔ)文作文《會(huì)心之樂(lè)》后,上海市市南中學(xué)語(yǔ)文高級(jí)教師陶璐說(shuō):“我覺(jué)得MOSS總體上寫(xiě)得不錯(cuò),但大模型沒(méi)有自我意識(shí),它怎么能真正理解‘會(huì)心之樂(lè)’呢?”上海復(fù)旦五浦匯實(shí)驗(yàn)學(xué)校校長(zhǎng)、語(yǔ)文特級(jí)教師黃玉峰更是笑言,“如果要我打分,它肯定不及格”。
盡管人們對(duì)生成式人工智能抱有不同態(tài)度,但它已經(jīng)進(jìn)入我們的生產(chǎn)生活。
“大模型是指具有大量參數(shù)的機(jī)器學(xué)習(xí)模型,可以在訓(xùn)練過(guò)程中處理大規(guī)模的數(shù)據(jù)集。ChatGPT就是具有超大規(guī)模參數(shù)的大模型。要實(shí)現(xiàn)大模型的訓(xùn)練,必須有強(qiáng)有力的算力支撐。”天風(fēng)全球前瞻產(chǎn)業(yè)研究院聯(lián)席院長(zhǎng)孔蓉表示,按照國(guó)內(nèi)的發(fā)展速度,預(yù)計(jì)今年國(guó)內(nèi)大模型可以達(dá)到GPT3.5的技術(shù)水平;得益于海外開(kāi)源大模型的技術(shù),會(huì)有一批國(guó)內(nèi)企業(yè)達(dá)到這一水平。
國(guó)內(nèi)大模型的涌現(xiàn)速度,也印證了孔蓉的判斷。3月16日,百度推出搭載文心大模型的文心一言;4月8日,華為更新盤(pán)古大模型;4月10日,商湯科技推出商量SenseChat;4月11日,阿里巴巴推出通義千問(wèn);此后,360、字節(jié)跳動(dòng)、科大訊飛、京東、騰訊等公司也紛紛推出了自己的大模型??萍疾咳斯ぶ悄馨l(fā)展研究中心5月底發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,當(dāng)前國(guó)內(nèi)10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè),“百模大戰(zhàn)”并非戲言。7月份在上海舉辦的第六屆世界人工智能大會(huì)上,國(guó)內(nèi)通用型大模型頂尖產(chǎn)品悉數(shù)到位,集中展示國(guó)內(nèi)外總計(jì)30多款大模型。
國(guó)內(nèi)大模型發(fā)展火爆,離不開(kāi)國(guó)內(nèi)算力資源作為基礎(chǔ)。
燧原科技創(chuàng)始人、董事長(zhǎng)兼CEO趙立東表示,在大模型的技術(shù)萌芽期,訓(xùn)練一個(gè)GPT3參數(shù)規(guī)模的大模型成本極為高昂。根據(jù)谷歌的經(jīng)驗(yàn),用大模型來(lái)代替谷歌每秒32萬(wàn)個(gè)查詢,將新增約360億美元推理成本。此后,發(fā)展到應(yīng)用加速膨脹期,大模型應(yīng)用賦能千行百業(yè),所需算力又會(huì)是一波乘數(shù)效應(yīng)。
上海市集成電路行業(yè)協(xié)會(huì)會(huì)長(zhǎng)張素心表示,“為解決算力需求問(wèn)題,國(guó)產(chǎn)芯片應(yīng)匯聚合力,擴(kuò)大開(kāi)發(fā)者群體,形成生態(tài)閉環(huán),繼而加速產(chǎn)業(yè)發(fā)展乃至國(guó)際化之路”。
東浩蘭生會(huì)展集團(tuán)董事長(zhǎng)陳小宏告訴記者,在第六屆世界人工智能大會(huì)上,圍繞大模型的訓(xùn)練需求,沐曦曦思N100、瀚博SG100、昆侖芯2代AI芯片等大模型應(yīng)用芯片集中亮相,夯實(shí)了國(guó)內(nèi)算力資源的底氣??梢哉f(shuō),隨著大模型的火爆,算力領(lǐng)域既感到壓力,也充滿動(dòng)力。
應(yīng)用突圍
無(wú)論是實(shí)現(xiàn)大模型落地應(yīng)用,還是提升算力供應(yīng),都需要努力構(gòu)建自主創(chuàng)新架構(gòu)、滿足市場(chǎng)多元需求。當(dāng)前無(wú)疑是一個(gè)極佳的時(shí)間窗口。
孔蓉在美國(guó)硅谷調(diào)研發(fā)現(xiàn),相比國(guó)內(nèi)企業(yè)爭(zhēng)相布局大模型,美國(guó)科技企業(yè)的研發(fā)已經(jīng)以AI應(yīng)用為主。在美國(guó)企業(yè)中,AI應(yīng)用已相當(dāng)普遍,寫(xiě)文章、寫(xiě)郵件、數(shù)據(jù)分析、發(fā)布招聘廣告等都離不開(kāi)AI。“國(guó)內(nèi)大模型井噴之后,當(dāng)務(wù)之急是應(yīng)用落地。畢竟大模型研發(fā)出來(lái)就是要為生活和工作服務(wù)的。”孔蓉表示。
“歷經(jīng)4年技術(shù)深耕和研發(fā)迭代,百度現(xiàn)已升級(jí)到文心大模型3.5。”百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主任王海峰表示,文心大模型3.5在效果、功能、性能等方面有了明顯提升。“凡是與語(yǔ)言文字或程序代碼打交道的應(yīng)用場(chǎng)景,都可能有文心一言的用武之地。”王海峰表示,不少行業(yè)如能源、金融、教育等,已經(jīng)成為文心一言的應(yīng)用場(chǎng)景。
要把通用大模型應(yīng)用到不同行業(yè)中,仍存在不少突破口。對(duì)此,垂直的行業(yè)大模型應(yīng)運(yùn)而生。這類行業(yè)模型、專屬模型脫胎于通用大模型,經(jīng)過(guò)有針對(duì)性的專業(yè)數(shù)據(jù)精調(diào)后,就可適用于垂直領(lǐng)域,為某些特定行業(yè)服務(wù)。
不久前,星環(huán)信息科技(上海)股份有限公司發(fā)布了為金融領(lǐng)域量身定做的大模型“無(wú)涯”。作為業(yè)界首款面向金融智能量化投研的領(lǐng)域大模型,它將在金融投研、量化投資和智能推理等領(lǐng)域有力輔助分析師、研究員和投資經(jīng)理的日常工作,對(duì)股票、債券、基金、商品等各類市場(chǎng)事件進(jìn)行復(fù)盤(pán)、傳播和推演。同時(shí),基于大模型的事件驅(qū)動(dòng)與深度圖引擎,其可實(shí)現(xiàn)對(duì)事件語(yǔ)義刻畫(huà)、定價(jià)因子挖掘、時(shí)序編碼、異構(gòu)關(guān)系圖卷積傳播等功能,幫助企業(yè)更好應(yīng)對(duì)復(fù)雜的市場(chǎng)環(huán)境和業(yè)務(wù)需求。
不過(guò),目前來(lái)看,大模型應(yīng)用仍存在一些問(wèn)題。星環(huán)科技創(chuàng)始人孫元浩表示,大模型有時(shí)會(huì)一本正經(jīng)“胡說(shuō)八道”,原因之一在于訓(xùn)練大模型至少用時(shí)半年,這導(dǎo)致實(shí)時(shí)新聞資訊、市場(chǎng)行情等快速變化的信息難以內(nèi)置到模型中,因此需要各類大模型發(fā)布商不斷更新語(yǔ)料與數(shù)據(jù),這是一個(gè)不小的挑戰(zhàn)。
北京中關(guān)村科金技術(shù)有限公司專注于垂直行業(yè)和細(xì)分領(lǐng)域的大模型應(yīng)用,瞄準(zhǔn)新一代得助對(duì)話引擎,他們推出了全新的AIGC應(yīng)用——“超級(jí)員工”,如智能客服、外呼機(jī)器人、智能陪練、智能質(zhì)檢、坐席助手等。該公司副總裁張杰介紹,“超級(jí)員工”以助手的形式在金融、零售、政務(wù)等多個(gè)行業(yè)頭部企業(yè)試用,原先需要10分鐘完成的營(yíng)銷文案,現(xiàn)在10秒即可完成;外呼客服話術(shù)師助手讓原來(lái)30個(gè)話術(shù)師的工作量如今由2人即可完成,且語(yǔ)義理解準(zhǔn)確度從85%提升至94%。“大模型具備的超強(qiáng)語(yǔ)言理解能力,讓‘最后一公里’的銷售過(guò)程實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型成為可能。這既能幫助企業(yè)通過(guò)智能對(duì)話服務(wù)實(shí)現(xiàn)降本增效,也能有效提升用戶體驗(yàn)、拓展服務(wù)外延。”張杰說(shuō)。
眾多通用大模型和垂直大模型同臺(tái)競(jìng)技,結(jié)果必然是優(yōu)勝劣汰。張杰表示,在成本約束以及充分的市場(chǎng)競(jìng)爭(zhēng)環(huán)境下,眾多大模型產(chǎn)品必然面臨“洗牌”。
面臨“洗牌”的不僅是大模型,算力領(lǐng)域同樣如此。“百模大戰(zhàn)”可喜亦可憂,必須直面算力“燒不燒得起”的課題。大模型訓(xùn)練和推理最終要回歸商業(yè)邏輯,實(shí)現(xiàn)經(jīng)濟(jì)效益而非“不計(jì)代價(jià)”,這就涉及算力能否像水電煤一樣“普惠”。
燧原科技創(chuàng)始人兼COO張亞林表示,“隨著大模型間的競(jìng)爭(zhēng)逐漸展開(kāi),大模型在數(shù)量上會(huì)收斂,生態(tài)也會(huì)相應(yīng)濃縮和集約,這對(duì)于建立AI芯片新生態(tài)來(lái)講,是非常有利的機(jī)會(huì)”。
上海天數(shù)智芯半導(dǎo)體有限公司不久前宣布,天垓100加速卡的算力集群,基于北京智源人工智能研究院70億參數(shù)的Aquila語(yǔ)言基礎(chǔ)模型,使用代碼數(shù)據(jù)進(jìn)行訓(xùn)練,已穩(wěn)定運(yùn)行19天,且模型收斂效果符合預(yù)期,測(cè)試證明天數(shù)智芯已經(jīng)具備支持百億級(jí)參數(shù)大模型訓(xùn)練的能力。天垓100加速卡的算力集群率先完成百億級(jí)參數(shù)大模型訓(xùn)練,邁出了自主通用GPU大模型應(yīng)用的重要一步。這一成果證明天垓產(chǎn)品可以支持大模型訓(xùn)練,打通了國(guó)內(nèi)大模型創(chuàng)新發(fā)展的關(guān)鍵“堵點(diǎn)”,對(duì)于我國(guó)大模型自主生態(tài)建設(shè)、產(chǎn)業(yè)鏈安全保障具有重要意義。
孔蓉說(shuō),“像ChatGPT這樣級(jí)別的大模型需要上萬(wàn)張芯片和加速卡支持,就目前國(guó)內(nèi)一些商業(yè)化應(yīng)用來(lái)看,不需要比拼最高算力,而是應(yīng)比拼實(shí)際效率,因此性價(jià)比會(huì)是重要的影響決策因素”。趙立東也認(rèn)為,“芯片是‘用進(jìn)廢退’,越用才能越好用。在漸進(jìn)式過(guò)程中培育算力生態(tài)、迭代算力產(chǎn)品,這個(gè)過(guò)程是我們必須經(jīng)歷的”。
提升競(jìng)爭(zhēng)力
不久前印發(fā)的《上海市推進(jìn)算力資源統(tǒng)一調(diào)度指導(dǎo)意見(jiàn)》提出,開(kāi)展上海全市算力基礎(chǔ)設(shè)施及算力資源輸出能力摸排,形成算力清單。基于算力資源底數(shù),推動(dòng)頭部企業(yè)接入上海市人工智能公共算力服務(wù)平臺(tái),構(gòu)建一體化算力調(diào)度服務(wù)體系和平臺(tái)基礎(chǔ)框架,實(shí)現(xiàn)算力資源統(tǒng)一編排。
“某種程度上,算力決定了市場(chǎng)競(jìng)爭(zhēng)力。”商湯科技董事長(zhǎng)兼CEO徐立說(shuō),在AI大模型時(shí)代,模型參數(shù)量將以指數(shù)級(jí)速率提升,數(shù)據(jù)量隨著多模態(tài)的引入將大規(guī)模增長(zhǎng),由此帶來(lái)算力需求劇增。
上海市經(jīng)信委副主任湯文侃表示,“十四五”期間,上海將加強(qiáng)全市算力資源統(tǒng)籌、調(diào)度和共享,提升算力資源利用率,加速數(shù)據(jù)要素流通,全面釋放數(shù)據(jù)價(jià)值。
上海臨港新片區(qū)6月份發(fā)布的《臨港新片區(qū)加快算力產(chǎn)業(yè)集聚發(fā)展三年行動(dòng)方案》提出,到2025年,臨港新片區(qū)將形成以智算算力為主、基礎(chǔ)算力和超算算力協(xié)同的多元算力供給體系,總算力超過(guò)5EFLOPS(FP32),AI算力占比達(dá)到80%,算力產(chǎn)業(yè)總體規(guī)模突破100億元,集聚相關(guān)企業(yè)及機(jī)構(gòu)超過(guò)100家,打造具有全國(guó)影響力的算力產(chǎn)業(yè)集聚區(qū),建設(shè)一批算力示范應(yīng)用標(biāo)桿場(chǎng)景。
一系列算力布局,是為了夯實(shí)大模型應(yīng)用的底座。隨著AIGC深度應(yīng)用的展開(kāi),不僅對(duì)算力、數(shù)據(jù)、算法提出了更高要求,也對(duì)安全、隱私、倫理提出更多挑戰(zhàn)。只有在確保數(shù)據(jù)安全和隱私保護(hù)、健全人工智能倫理與安全的前提下,才能讓AI技術(shù)真正釋放出應(yīng)用價(jià)值。
針對(duì)算力問(wèn)題,華為輪值董事長(zhǎng)胡厚崑表示,華為已在內(nèi)蒙古烏蘭察布市建設(shè)數(shù)據(jù)中心,初期階段部署了數(shù)千卡規(guī)模的人工智能集群,在同等算力下,計(jì)算效率提升10%以上。
不久前,UCloud優(yōu)刻得AIGC算力底座正式亮相。優(yōu)刻得董事長(zhǎng)兼CEO季昕華表示,優(yōu)刻得推出涵蓋數(shù)據(jù)中心、計(jì)算平臺(tái)、管理平臺(tái)、網(wǎng)絡(luò)服務(wù)、應(yīng)用服務(wù)、生態(tài)接口的一系列產(chǎn)品和解決方案,可為用戶提供完全物理隔離的獨(dú)享機(jī)柜、服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)資源,結(jié)合完整的安全方案和專家服務(wù),確保用戶的大模型平穩(wěn)運(yùn)行。
“歷史的機(jī)遇、技術(shù)的變革,將數(shù)據(jù)智能推向了前所未有的高潮,也帶來(lái)了更加嚴(yán)峻的數(shù)據(jù)安全挑戰(zhàn),數(shù)據(jù)流通邁向密態(tài)化是未來(lái)趨勢(shì)。數(shù)據(jù)密態(tài)要求下,隱私計(jì)算的方法體系、平臺(tái)框架、技術(shù)標(biāo)準(zhǔn)都面臨全新變革。”螞蟻集團(tuán)副總裁兼首席技術(shù)安全官韋韜呼吁更多同行參與到開(kāi)源和生態(tài)建設(shè)工作中。“開(kāi)源隱私計(jì)算核心產(chǎn)品一直是我們對(duì)行業(yè)的態(tài)度,未來(lái)將進(jìn)一步加大隱私計(jì)算的開(kāi)放力度和廣度,與行業(yè)一道構(gòu)筑AI智能時(shí)代數(shù)據(jù)安全護(hù)城河。”韋韜說(shuō)。
盡管挑戰(zhàn)不少,但不可否認(rèn),以大模型為核心的人工智能時(shí)代正加速到來(lái)。“未來(lái)10年,新一輪科技周期將啟動(dòng)。”孔蓉認(rèn)為,在AI推動(dòng)下,XR、機(jī)器人、自動(dòng)駕駛、影視內(nèi)容等行業(yè)將進(jìn)入爆發(fā)式變革時(shí)期。
騰訊研究院、同濟(jì)大學(xué)、騰訊云共同發(fā)布的《人機(jī)共生——大模型時(shí)代的AI十大趨勢(shì)報(bào)告》明確指出,通過(guò)建設(shè)可控、可用的安全生態(tài),推動(dòng)模型落地和應(yīng)用,AI技術(shù)將為各行業(yè)帶來(lái)更多機(jī)遇。大模型時(shí)代帶來(lái)的創(chuàng)新和發(fā)展,將推動(dòng)人工智能走向更廣闊的未來(lái)。
正如工業(yè)和信息化部副部長(zhǎng)徐曉蘭所言,以深度學(xué)習(xí)為代表的新一代人工智能和以大模型為代表的通用人工智能不斷取得技術(shù)突破,將成為智能產(chǎn)業(yè)的根技術(shù)和智能經(jīng)濟(jì)的基礎(chǔ)設(shè)施。這意味著人工智能產(chǎn)業(yè)生態(tài)將醞釀一個(gè)又一個(gè)“爆點(diǎn)”,并等待著創(chuàng)業(yè)者去把握與挖掘。