近日,深度求索(DeepSeek)旗下全系列大模型——包括專注自然語言處理的DeepSeek-R1、聚焦圖像生成的DeepSeek-V3以及針對(duì)快速代碼生成的DeepSeek-Coder——正式接入國家超算互聯(lián)網(wǎng)平臺(tái)。憑借在文本生成、圖像創(chuàng)作和程序開發(fā)輔助等多個(gè)場(chǎng)景的強(qiáng)大功能,DeepSeek系列的“國家級(jí)”上線不僅拓寬了其應(yīng)用領(lǐng)域,也為國產(chǎn)AI技術(shù)的生態(tài)發(fā)展和普及注入了新動(dòng)能。
國家超算互聯(lián)網(wǎng)平臺(tái)以互聯(lián)網(wǎng)思維運(yùn)營(yíng)超算中心,連接產(chǎn)業(yè)生態(tài)中的算力供給、應(yīng)用開發(fā)、運(yùn)營(yíng)服務(wù)、用戶等各方資源與能力,形成一體化超算算力網(wǎng)絡(luò)與服務(wù)平臺(tái)。平臺(tái)自去年4月正式上線以來,致力于促進(jìn)超算算力一體化運(yùn)營(yíng)、打造國家算力底座,已覆蓋科學(xué)計(jì)算、工業(yè)仿真、人工智能(AI)模型訓(xùn)練等各類應(yīng)用領(lǐng)域。截至今年1月,平臺(tái)上已有超過6500款各類算力商品,其中模型服務(wù)近240款,包括DeepSeek、Qwen等國內(nèi)開源大模型,以及Llama、Stable Diffusion、Gemma、Mistral、StarCoder、ChatGLM等國外開源模型。
作為國內(nèi)AI領(lǐng)域的新銳力量,DeepSeek系列在性能上與國際頂尖大模型不相上下,卻借助算法優(yōu)化有效降低了計(jì)算資源消耗。此次接入國家超算互聯(lián)網(wǎng)平臺(tái)后,用戶無需本地下載,即可在線部署、推理并進(jìn)行定制化訓(xùn)練與開發(fā),大幅降低AI技術(shù)使用門檻;平臺(tái)依托國產(chǎn)深算智能加速卡與全國一體化算力服務(wù)體系,也為DeepSeek等模型提供了豐富的異構(gòu)算力資源,進(jìn)一步保證了國產(chǎn)AI應(yīng)用與創(chuàng)新所需的持久算力支持。
國家超算互聯(lián)網(wǎng)平臺(tái)相關(guān)負(fù)責(zé)人表示,此次DeepSeek的全面上線,是“國產(chǎn)AI技術(shù)與國家級(jí)綜合算力服務(wù)平臺(tái)融合”的前沿實(shí)踐。在市場(chǎng)、技術(shù)、創(chuàng)新、產(chǎn)品及用戶層面,DeepSeek系列的規(guī)模化應(yīng)用有望推動(dòng)國內(nèi)AI技術(shù)生態(tài)的多元化發(fā)展,加速中國乃至全球AI市場(chǎng)的應(yīng)用落地和產(chǎn)業(yè)化進(jìn)程。業(yè)界普遍認(rèn)為,隨著DeepSeek對(duì)更多使用場(chǎng)景的支持,國內(nèi)AI行業(yè)對(duì)海外閉源模型的依賴或?qū)⒅鸩綔p輕,未來國產(chǎn)AI技術(shù)的規(guī)?;瘧?yīng)用潛力也將進(jìn)一步釋放。