4月10日,商湯科技董事長兼CEO徐立在商湯技術(shù)交流日上發(fā)布“日日新”大模型體系,取自《禮記·大學》,湯之盤銘:茍日新,日日新,又日新?!叭杖招隆贝竽P腕w系包含自然語言生成、照片生成服務、感知模型預標注、模型研發(fā)。商湯發(fā)布中文語言大模型應用平臺“商量”,1800億參數(shù)中文大語言模型支持超長文本知識理解,支持問答、理解與生成等中文語言能力,可實現(xiàn)多輪對話、邏輯推理、語言糾錯、內(nèi)容創(chuàng)作、情感分析等。
現(xiàn)場演示了中文語言大模型寫作廣告語、續(xù)寫兒童故事、編程等。編程核心功能包括代碼補全、擴寫、翻譯、重構(gòu)、修正,以及注釋生成代碼、復雜度分析、測試用例生成等。徐立表示,內(nèi)部實測代碼編寫效率提升62%,HumanEval測試集一次通過率40.2%。下一代軟件開發(fā)范式是AI for AI,代碼=80% AI生成 20%人工。
超10億參數(shù)自研文生圖生成模型“秒畫”,支持二次元等多種生成風格。單卡A100支持,2秒生成1張512K分辨率的圖片。用戶可基于單卡A100自訓練?;谄脚_發(fā)布的模型,可設置toB服務API(應用程序編程接口),結(jié)合商湯大算力對外提供服務。
此外,商湯科技對外發(fā)布3D內(nèi)容生成平臺“瓊宇”(場景生成)、“格物”(物體生成),基于3D內(nèi)容生成技術(shù)對空間和物體的復刻與交互。100平方公里城市級生成,“瓊宇”用時2天,具有厘米級重建精度,還原場景的真實細節(jié)和光照效果,應用場景涵蓋城市及園區(qū)數(shù)字孿生、建筑設計、影視創(chuàng)作、文旅和電商等。
徐立對澎湃科技(www.thepaper.cn)表示,在這個時間點推出大模型體系,是希望吸引更多下游用戶,自然語言模型能夠把各種垂直類的任務串聯(lián)起來,用多模態(tài)混合的模式迭代行業(yè)場景。通過提供新的多模態(tài)訓練框架,訓練下一個階段的多模態(tài)大模型,通過細分場景端到端的迭代和應用,幫助多模態(tài)大模型的發(fā)展。目前已有8家商業(yè)客戶使用商湯多模態(tài)訓練框架進行大模型訓練?!拔覀兿M覀兊拇竽P腕w系能夠幫助行業(yè)生產(chǎn)出下一代最領(lǐng)先的多模態(tài)模型,并且升級性能?!?