青青青手机视频在线观看,中文字幕老视频平台网站,国产在线精品观看一区,天天干天天草天天av,2023草草影院最新入口,日本黄色网站在线视频,亚洲日本欧美产综合在线

網(wǎng)站首頁(yè) | 網(wǎng)站地圖

大國(guó)新村
首頁(yè) > 經(jīng)濟(jì)金融 > 科技視野 > 正文

以算力為基,算法為翼,中國(guó)國(guó)產(chǎn)大模型以提質(zhì)增效——

錨定AI普惠“新坐標(biāo)”

2024年12月15日,上海國(guó)家會(huì)展中心,青少年選手參加全球青少年人工智能競(jìng)賽全球總決賽。

張明偉攝(人民圖片)

2024年12月27日,在廣東省深圳市筆架山公園里,小朋友和家長(zhǎng)一起使用智能互動(dòng)屏鍛煉身體。

新華社記者 梁 旭攝

2024年12月10日,在江蘇省蘇州市國(guó)際博覽中心,觀眾在2024全球人工智能產(chǎn)品應(yīng)用博覽會(huì)上體驗(yàn)手寫(xiě)翻譯系統(tǒng)。

張從余攝(人民圖片)

2024年9月19日,在浙江省杭州市,參觀者在2024杭州云棲大會(huì)上參觀了解相關(guān)的AI技術(shù)。

龍 巍攝(人民圖片)

今年年初,在世界經(jīng)濟(jì)論壇2025年年會(huì)開(kāi)幕當(dāng)天,一款由中國(guó)初創(chuàng)企業(yè)——杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(以下簡(jiǎn)稱“DeepSeek”)發(fā)布的開(kāi)源模型DeepSeek—R1驚艷了世界。

這一模型在技術(shù)上實(shí)現(xiàn)了重要突破——用純深度學(xué)習(xí)的方法讓AI(人工智能)自發(fā)涌現(xiàn)出推理能力。高性價(jià)比是該模型的優(yōu)勢(shì)。據(jù)該公司介紹,DeepSeek—R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力,用較低的成本達(dá)到了接近于美國(guó)開(kāi)放人工智能研究中心(OpenAI)開(kāi)發(fā)的GPT—o1模型的性能。

不鳴則已,一鳴驚人。DeepSeek的成功,破解了全球人工智能產(chǎn)業(yè)長(zhǎng)期以來(lái)對(duì)“堆算力”的路徑依賴,引發(fā)了人工智能領(lǐng)域的“一場(chǎng)地震”。業(yè)界人士認(rèn)為,DeepSeek模型是“一座里程碑”,有望激發(fā)一波創(chuàng)新浪潮,推動(dòng)全球AI繼續(xù)進(jìn)步。

近年來(lái),以DeepSeek為代表中國(guó)國(guó)產(chǎn)大模型正在加快發(fā)展步伐。隨著產(chǎn)業(yè)鏈條的完善、使用場(chǎng)景的豐富、市場(chǎng)空間的打開(kāi)和人才儲(chǔ)備的拓展,中國(guó)國(guó)產(chǎn)大模型正在形成從技術(shù)到應(yīng)用,再?gòu)膽?yīng)用反哺技術(shù)創(chuàng)新的完整閉環(huán)。以算力為基,算法為翼,如今,中國(guó)國(guó)產(chǎn)大模型正通過(guò)提質(zhì)增效的方式錨定AI普惠“新坐標(biāo)”。

創(chuàng)新:

“小力創(chuàng)造奇跡”

作為一家專注通用人工智能(AGI)的中國(guó)科技公司,DeepSeek主攻大模型研發(fā)與應(yīng)用。DeepSeek—R1是其開(kāi)源的推理模型,擅長(zhǎng)處理復(fù)雜任務(wù)且可免費(fèi)商用。

DeepSeek—R1模型能做什么呢?

它可以直接面向用戶或者支持開(kāi)發(fā)者,提供智能對(duì)話、文本生成、語(yǔ)義理解、計(jì)算推理、代碼生成補(bǔ)全等應(yīng)用場(chǎng)景。DeepSeek—R1支持聯(lián)網(wǎng)搜索與深度思考模式,同時(shí)支持文件上傳,能夠掃描讀取各類文件及圖片中的文字內(nèi)容。

如果用一句話總結(jié)DeepSeek—R1的技術(shù)特點(diǎn),那便是“小力創(chuàng)造奇跡”。

DeepSeek模型既具備基礎(chǔ)模型的廣泛適應(yīng)性,又以推理模型的精準(zhǔn)性重塑行業(yè)標(biāo)準(zhǔn)。DeepSeek的API(軟件系統(tǒng)間交互的標(biāo)準(zhǔn)化接口,允許開(kāi)發(fā)者調(diào)用其他系統(tǒng)功能而無(wú)需理解內(nèi)部實(shí)現(xiàn)細(xì)節(jié))價(jià)格遠(yuǎn)低于海外頭部大模型,其低成本策略推動(dòng)了AI技術(shù)從“奢侈品”向“日用品”轉(zhuǎn)型。

2024年12月底,DeepSeek發(fā)布V3模型,其性能與海外頭部大模型相近,但訓(xùn)練成本極低,整個(gè)訓(xùn)練在2048塊英偉達(dá)H800 GPU(圖形處理器)集群上完成,訓(xùn)練成本550多萬(wàn)美元。相比之下,訓(xùn)練GPT—4o等模型,至少要使用上萬(wàn)塊性能更為優(yōu)越的H100 GPU,訓(xùn)練成本達(dá)到約1億美元。DeepSeek這個(gè)土生土長(zhǎng)的中國(guó)大模型用自己的成功證明:AI大模型的比拼或許并不只靠規(guī)模,更重要的是看實(shí)際效果。有句話形象地概括出DeepSeek的優(yōu)勢(shì):“不是GPT用不起,而是DeepSeek更有性價(jià)比。”

更為引人關(guān)注的是,DeepSeek在架構(gòu)效率上的提升幅度。通過(guò)算法創(chuàng)新,如GRPO(一種專為優(yōu)化大型語(yǔ)言模型設(shè)計(jì)的強(qiáng)化學(xué)習(xí)算法)優(yōu)化策略,DeepSeek打破了大模型訓(xùn)練的“算力依賴”。相比海外頭部大模型,DeepSeek采用混合專家模型,可將任務(wù)拆分給多個(gè)專用子模塊處理,資源利用率更高,大幅降低了大模型訓(xùn)練所需的算力要求。

與海外大模型相比,DeepSeek訓(xùn)練數(shù)據(jù)以漢語(yǔ)為主,對(duì)復(fù)雜的漢語(yǔ)詞匯和語(yǔ)境處理更為精準(zhǔn),使其文字輸出更為流暢自然,符合漢語(yǔ)環(huán)境。同時(shí),它的邏輯推導(dǎo)過(guò)程透明,并支持針對(duì)特定場(chǎng)景的深度優(yōu)化。

不同于先發(fā)者的閉源式“護(hù)城堡壘”,DeepSeek贏得贊譽(yù)的還有它的開(kāi)源路線。DeepSeek將代碼、模型權(quán)重和訓(xùn)練日志全部公開(kāi),降低了中小企業(yè)部署AI的門(mén)檻,這一舉動(dòng)不僅需要格局,更需要勇氣與實(shí)力。

“在顛覆性技術(shù)面前,閉源形成的護(hù)城河是短暫的。即使OpenAI閉源,也無(wú)法阻止被別人趕超。”DeepSeek創(chuàng)始人梁文鋒這樣解釋選擇開(kāi)源的原因,“開(kāi)源、發(fā)論文,其實(shí)并不會(huì)失去什么。對(duì)于技術(shù)人員來(lái)說(shuō),被follow(追隨模仿)是很有成就感的事。”

英國(guó)《金融時(shí)報(bào)》的對(duì)此評(píng)論稱,開(kāi)源模型DeepSeek—R1對(duì)全球用戶產(chǎn)生極大吸引力,有利于推動(dòng)人工智能技術(shù)的開(kāi)發(fā)和應(yīng)用。文章說(shuō),對(duì)于大多數(shù)商業(yè)用戶來(lái)說(shuō),擁有一款足夠可靠并且好用的模型比擁有絕對(duì)領(lǐng)先的模型更重要。“并不是每個(gè)司機(jī)都需要一輛法拉利。像R1這樣模型的推理能力進(jìn)步,可能會(huì)為與客戶互動(dòng)或處理工作任務(wù)的‘智能體’帶來(lái)突破性變化”“如果能以更低的成本擁有這些模型,企業(yè)的盈利能力將提升”。美國(guó)云軟件企業(yè)賽富時(shí)公司的人工智能可持續(xù)發(fā)展主管鮑里斯·加馬扎伊奇科夫認(rèn)為,DeepSeek推動(dòng)了人工智能降低能耗的步伐。“它是開(kāi)源的,其用戶不必預(yù)先訓(xùn)練一個(gè)類似大小的模型,而是可以從已有模型開(kāi)始(研發(fā)),這樣可以節(jié)省大量能源。對(duì)全世界來(lái)說(shuō),這是一件非常好的事情,我希望看到更多像這樣的開(kāi)源創(chuàng)新。”

開(kāi)源生態(tài)里,每一行代碼都是創(chuàng)新的火種;協(xié)同創(chuàng)新中,每一個(gè)企業(yè)都是生態(tài)的支點(diǎn)。近日,全球知名開(kāi)源平臺(tái)抱抱臉公司等多個(gè)團(tuán)隊(duì)已宣布復(fù)現(xiàn)了DeepSeek—R1的訓(xùn)練過(guò)程。

通過(guò)底層架構(gòu)創(chuàng)新降低AGI成本,同時(shí)以開(kāi)源策略構(gòu)建生態(tài)護(hù)城河,DeepSeek提供了中小型機(jī)構(gòu)突破算力限制的可行路徑。

“DeepSeek出圈,很好地證明了我們的競(jìng)爭(zhēng)優(yōu)勢(shì):通過(guò)有限資源的極致高效利用,實(shí)現(xiàn)以少勝多。中國(guó)與美國(guó)在AI領(lǐng)域的差距正在縮小。”面壁智能首席科學(xué)家劉知遠(yuǎn)說(shuō)。

使命:

“探索未知之境”

一直以來(lái),驅(qū)動(dòng)DeepSeek的目標(biāo)并非利潤(rùn)而是使命。正如其公司之名深度求索,“探索未至之境”既是這幫中國(guó)本土年輕科技工作者的愿景,也是他們雄心。

“中國(guó)也要逐步成為貢獻(xiàn)者。”梁文鋒說(shuō),“我們已經(jīng)習(xí)慣摩爾定律從天而降,躺在家里18個(gè)月就會(huì)出來(lái)更好的硬件和軟件,Scaling Law(規(guī)模定律)也在被如此對(duì)待。但其實(shí),這是西方主導(dǎo)的技術(shù)社區(qū)一代代孜孜不倦創(chuàng)造出來(lái)的,只因?yàn)橹拔覀儧](méi)有參與這個(gè)過(guò)程,以至于忽視了它的存在。很多國(guó)產(chǎn)芯片發(fā)展不起來(lái),也是因?yàn)槿狈ε涮椎募夹g(shù)社區(qū),只有第二手消息,中國(guó)必然需要有人站到技術(shù)的前沿。”

“我們創(chuàng)新缺少的不是資本,而是信心,以及組織高密度人才的能力。”梁文鋒說(shuō)。

從技術(shù)到愿景,DeepSeek堅(jiān)定選擇的始終是一條難且正確的路。這也是為什么,即便別國(guó)在人工智能領(lǐng)域已坐享先發(fā)優(yōu)勢(shì),后發(fā)者依然有機(jī)會(huì)憑借技術(shù)創(chuàng)新、成本優(yōu)化打破大模型競(jìng)爭(zhēng)的傳統(tǒng)邏輯,打破人工智能行業(yè)競(jìng)爭(zhēng)格局,打破“他國(guó)更擅長(zhǎng)從0到1的原始創(chuàng)新,而中國(guó)更擅長(zhǎng)從1到10的應(yīng)用創(chuàng)新”的成見(jiàn),重塑競(jìng)爭(zhēng)優(yōu)勢(shì)的奧秘。

隨著AI浪潮的襲來(lái),中國(guó)科技工作者一直在追夢(mèng)。“追”不僅僅是“跟”,目的在“超”。不僅是DeepSeek的科研團(tuán)隊(duì),還有更多的科技工作者推動(dòng)原始創(chuàng)新和顛覆性創(chuàng)新,腳踏實(shí)地潛心研究關(guān)鍵核心技術(shù),以科技創(chuàng)新鍛造新質(zhì)生產(chǎn)力。

1月15日,科大訊飛發(fā)布了當(dāng)前全國(guó)產(chǎn)算力平臺(tái)上唯一的深度推理大模型——訊飛星火X1。該模型中文數(shù)學(xué)能力國(guó)內(nèi)第一,并率先應(yīng)用于教育、醫(yī)療等剛需場(chǎng)景。發(fā)布會(huì)上,科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題以及高中奧賽題的表現(xiàn)。訊飛星火X1不僅準(zhǔn)確給出了這些題目的答案,還對(duì)解題思路和步驟進(jìn)行了詳細(xì)拆解。與通用大模型相比,其解題過(guò)程更接近人類的“慢思考”方式。

“一直以來(lái),訊飛星火堅(jiān)持走全國(guó)產(chǎn)化路線。”科大訊飛相關(guān)負(fù)責(zé)人對(duì)記者說(shuō),“盡管在全國(guó)產(chǎn)算力平臺(tái)上訓(xùn)練深度推理模型遭遇了諸多挑戰(zhàn),但科大訊飛攜手華為,成功攻克了訓(xùn)練推理強(qiáng)交互、高吞吐推理優(yōu)化以及國(guó)產(chǎn)算子優(yōu)化等一系列難題。”

其他中國(guó)公司在其大模型性能方面也取得巨大進(jìn)步。2024年底,阿里巴巴和騰訊投資的創(chuàng)業(yè)公司月之暗面表示,自己開(kāi)發(fā)了一個(gè)專門(mén)研究數(shù)學(xué)的模型,性能接近海外頭部大模型。月之暗面創(chuàng)始人楊植麟說(shuō):“公司專注于強(qiáng)化學(xué)習(xí),也就是模仿人類的試錯(cuò)過(guò)程。這種方法或許能夠在提升模型性能的同時(shí)不需要那么多的算力。”

2024年12月,字節(jié)跳動(dòng)的豆包系列多款大模型選擇在上海首發(fā),涉及視覺(jué)理解、3D生成等領(lǐng)域。“豆包視覺(jué)理解模型能精準(zhǔn)識(shí)別視覺(jué)內(nèi)容,且具備出色的理解和推理能力,可根據(jù)圖像信息進(jìn)行復(fù)雜的邏輯計(jì)算,完成分析圖表、處理代碼、解答學(xué)科問(wèn)題等任務(wù)。”火山引擎總裁譚待說(shuō)。首次亮相的還有豆包3D生成模型。如同一套支持AIGC(人工智能生成內(nèi)容)創(chuàng)作的物理世界仿真模擬器,該模型與云服務(wù)平臺(tái)火山引擎的數(shù)字孿生平臺(tái)結(jié)合使用,可以完成智能訓(xùn)練、數(shù)據(jù)合成和數(shù)字資產(chǎn)制作。

近年來(lái),中國(guó)AI技術(shù)人才的創(chuàng)業(yè)信心也在不斷提高。國(guó)家互聯(lián)網(wǎng)信息辦公室近期發(fā)布的信息顯示,截至2024年12月31日,共有302款生成式人工智能服務(wù)在國(guó)家網(wǎng)信辦完成備案,其中2024年新增238款備案。

根據(jù)《2024年度人才遷徙報(bào)告》,AI相關(guān)崗位需求在2024年激增,算法工程師、大模型算法等職位位列熱招榜前20。技術(shù)崗位平均月薪前十名中,大模型相關(guān)崗位占據(jù)半數(shù)。

“熱愛(ài)、扎實(shí)的基礎(chǔ)能力,是我們招人的標(biāo)準(zhǔn)。”梁文鋒說(shuō),自己在招聘時(shí)會(huì)挑選并培養(yǎng)幾乎沒(méi)什么工作經(jīng)驗(yàn)的中國(guó)頂尖大學(xué)應(yīng)屆畢業(yè)生,“創(chuàng)新需要信心,而年輕人往往更有信心。”

應(yīng)用:

“全家齊玩AI”

近日,廣東省深圳市龍崗區(qū)在區(qū)政務(wù)外網(wǎng)成功部署上線了DeepSeek—R1全尺寸模型(含6710億參數(shù)),并于2月11日在龍崗區(qū)“龍i企”企業(yè)服務(wù)小程序正式上線DeepSeek AI助手功能,為企業(yè)提供更加智能、便捷的政務(wù)辦理、在線咨詢、政策解讀等高效智能政務(wù)服務(wù)。

據(jù)悉,“龍i企”接入DeepSeek AI助手功能后,依托海量的政府政策資訊以及政務(wù)辦理信息,運(yùn)用先進(jìn)的自然語(yǔ)言處理和機(jī)器學(xué)習(xí)技術(shù),為企業(yè)用戶打造了全方位、智能化的服務(wù)體系。企業(yè)用戶只需登錄“龍i企”小程序端,在首頁(yè)點(diǎn)擊“龍i企AI助手”,即可便捷體驗(yàn)各類貼心的企業(yè)服務(wù)。

“AI+”政務(wù)服務(wù),是人工智能賦能千行百業(yè)的一個(gè)縮影。對(duì)大模型而言,訓(xùn)練成本每降1個(gè)百分點(diǎn),產(chǎn)業(yè)應(yīng)用便能擁有更多可能。

今年以來(lái),大眾的AI參與感、討論度、情緒值一齊攀升,“全家老少一起玩AI”成為潮流。百度方言語(yǔ)音搜索的日均調(diào)用量中,河南、四川等地下沉用戶占比越發(fā)凸顯,文旅智能體在縣域旅游的使用率也在上升。而就在去年此時(shí),引發(fā)AI熱潮的還是尚未出圈的Sora(海外文生視頻模型),只在從業(yè)者小圈子里引發(fā)了熱議。

截至2024年11月,百度文心大模型的日均調(diào)用量超15億次,較2023年增長(zhǎng)約30倍。截至2024年12月,豆包通用模型日均tokens(將文本分割為一個(gè)個(gè)有意義的片段)使用量超4萬(wàn)億,較7個(gè)月前首發(fā)時(shí)增長(zhǎng)33倍。截至2025年1月,百度文庫(kù)AI功能月活用戶突破9000萬(wàn),同比增長(zhǎng)230%。2025年2月,DeepSeek登頂全球140個(gè)國(guó)家及地區(qū)的應(yīng)用市場(chǎng),DeepSeek的日活躍用戶數(shù)突破3000萬(wàn)大關(guān)……一根根陡峭的增長(zhǎng)曲線中,我們可以看見(jiàn)大模型的“真需求”。

DeepSeek的持續(xù)破圈,“點(diǎn)燃”了中國(guó)AI產(chǎn)業(yè)鏈。云服務(wù)廠商、互聯(lián)網(wǎng)平臺(tái)企業(yè)紛紛接入,AI應(yīng)用等產(chǎn)業(yè)鏈企業(yè)競(jìng)相使用。

不少產(chǎn)業(yè)鏈中上游企業(yè)爭(zhēng)相“搶灘”DeepSeek。此前,騰訊云、阿里云、百度智能云、火山引擎等國(guó)內(nèi)云計(jì)算企業(yè)已宣布對(duì)DeepSeek的支持。十余家國(guó)產(chǎn)AI芯片企業(yè)也相繼宣布,適配或上架DeepSeek模型服務(wù)。

與此同時(shí),包括汽車(chē)、金融、智能硬件等不少產(chǎn)業(yè)鏈下游企業(yè),也持續(xù)展開(kāi)對(duì)DeepSeek系列模型的應(yīng)用探索。隨著需求與場(chǎng)景的不斷滿足,更多搭載輕量化AI模型的創(chuàng)新型智能硬件密集涌現(xiàn)。

其中,PC外設(shè)硬件的接軌速度較快,如部分“AI鼠標(biāo)”“AI鍵盤(pán)”,可一鍵拉起其提供的AI問(wèn)答頁(yè)面,其中包含基于DeepSeek-R1的深度思考選項(xiàng)。AI PC、AI手機(jī)同樣是這次DeepSeek浪潮的受益者,如聯(lián)想、華為等品牌,已在其AI智能體中接入了DeepSeek,提供“開(kāi)箱即用”的AI功能。

眼下,DeepSeek掀起的熱潮還在持續(xù),“朋友圈”加速擴(kuò)容,進(jìn)一步激活人工智能產(chǎn)業(yè)鏈上下游。目前,中國(guó)移動(dòng)、中國(guó)聯(lián)通、中國(guó)電信等三大運(yùn)營(yíng)商均宣布接入DeepSeek模型。與此同時(shí),北京寶蘭德軟件股份有限公司等公司宣布接入文心一言大模型、上海風(fēng)語(yǔ)筑文化科技股份有限公司等公司宣布接入豆包大模型。

“面向未來(lái),人工智能有三大主戰(zhàn)場(chǎng):人工智能科學(xué)化、計(jì)算系統(tǒng)智能化、應(yīng)用領(lǐng)域廣譜化。一個(gè)影響深遠(yuǎn)的智能時(shí)代,正在向我們走來(lái)。”劉知遠(yuǎn)說(shuō)。

[責(zé)任編輯:曲統(tǒng)昱]