在過去的一周,人工智能領域發(fā)生了多項重要事件,涵蓋技術創(chuàng)新、產(chǎn)品發(fā)布和行業(yè)動態(tài)。以下是對這些事件的詳細回顧:
阿里通義千問推出Qwen-Agent框架
1月4日,阿里通義千問團隊發(fā)布了全新的AI Agent開發(fā)框架——Qwen-Agent。該框架基于通義千問模型(Qwen),旨在幫助開發(fā)者利用模型的指令遵循、工具使用、規(guī)劃和記憶能力,快速構建定制化的AI Agent應用。Qwen-Agent采用兩層架構設計,底層提供語言模型和基礎工具,頂層提供現(xiàn)成的智能體組件,開發(fā)者可以靈活組合這些組件,構建能夠執(zhí)行復雜任務的智能體。此外,Qwen-Agent還提供了瀏覽器助手、代碼解釋器、自定義助手等示例應用,供開發(fā)者參考和使用。為了降低使用門檻,阿里巴巴近期下調(diào)了API AI服務價格,并提供了DashScope云服務,方便開發(fā)者自行部署Qwen模型。Qwen-Agent框架還提供了GUI界面,開發(fā)者可以使用Gradio框架創(chuàng)建交互式網(wǎng)頁演示,進一步提升開發(fā)效率和用戶體驗。
Meta開源“記憶層”技術,優(yōu)化Transformer架構
1月3日,Meta宣布開源一項名為“記憶層”(Memory layers)的創(chuàng)新研究,旨在解決Transformer架構在處理大規(guī)模數(shù)據(jù)時的算力瓶頸。隨著模型參數(shù)的增加,傳統(tǒng)的查詢方法需要遍歷整個記憶層,導致效率低下且消耗巨大算力和時間?!坝洃泴印碧岢隽诵碌母咝Р樵儥C制,通過比較查詢鍵與兩個較小集合中的鍵,可以快速找到最相關的鍵,而無需遍歷整個記憶層。這意味著在不增加算力的情況下,可以顯著增加大模型的參數(shù),從而提高模型的性能和效率。Meta的“記憶層”技術通過優(yōu)化查詢過程,使得大模型能夠在更高效的環(huán)境下運行,為AI技術的發(fā)展提供了新的可能性。
智譜AI發(fā)布GLM-Zero-Preview推理模型
12月31日,智譜AI推出了旗下首個推理模型——GLM-Zero-Preview。該模型專注于增強AI的推理能力,擅長處理數(shù)理邏輯、代碼和需要深度推理的復雜問題。與基座模型相比,GLM-Zero-Preview在不顯著降低通用任務能力的情況下,顯著提升了專家任務能力。在AIME 2024、MATH500和LiveCodeBench等評測中,其表現(xiàn)與OpenAI的o1-preview相當。用戶可以在“智譜清言”中免費使用GLM-Zero-Preview,開發(fā)者也可以在“智譜開放平臺”中通過API進行調(diào)用,進一步拓展其應用場景。
百度上線“AI搜”功能,提升搜索體驗
1月1日,百度在網(wǎng)頁端首頁上線了“AI搜”入口?!癆I搜”是基于百度文心大模型打造的桌面端AI搜索引擎,內(nèi)容側已經(jīng)打通百度搜索引擎、百度健康、百度文庫等內(nèi)容生態(tài),確保搜索結果的可靠性和權威性?!癆I搜”主要提供話題探索、問題解決、決策輔助、知識答疑、主題研究、學習創(chuàng)作等功能,覆蓋文生圖、文生文、邏輯推理、多輪對話、智能摘要、AI修圖等AI技術。此外,“AI搜”還提供了文心智能體入口,用戶可以通過@方式與不同智能體進行交互,方便使用和創(chuàng)建智能體。百度“AI搜”的推出,標志著百度在AI搜索引擎領域的進一步發(fā)展,將為用戶提供更智能、更便捷的搜索體驗。
英偉達計劃2025年推出Jetson Thor機器人芯片
據(jù)英國《金融時報》報道,英偉達計劃于2025年上半年推出最新一代人形機器人芯片——Jetson Thor。英偉達機器人業(yè)務負責人兼副總裁Deepu Talla表示,物理AI領域和機器人領域的“ChatGPT”時代即將到來,市場已經(jīng)到了“轉(zhuǎn)折點”。他認為,當前生成式AI的爆發(fā)式增長以及通過模擬生成的環(huán)境,將推動甚至突破機器人市場的增長。在過去12個月里,英偉達已經(jīng)能夠結合生成式AI進行模擬實驗。然而,英偉達目前正面臨多家廠商的競爭,多家廠商也在減少對英偉達的依賴。據(jù)報道,今年2月,包括微軟和OpenAI在內(nèi)的幾家公司均投資了具身機器人公司Figure AI。
我國首個通用具身智能機器人數(shù)據(jù)集發(fā)布
1月3日,由國家地方共建具身智能機器人創(chuàng)新中心與北京大學計算機學院聯(lián)合打造的我國首個通用具身智能機器人訓練開源數(shù)據(jù)集正式發(fā)布。該數(shù)據(jù)集對多種形態(tài)的機器人本體進行了數(shù)據(jù)采集,包含了兩百多個不同任務的多類場景,旨在加速推動具身智能產(chǎn)業(yè)的發(fā)展。具身智能賦予機器人思考和執(zhí)行復雜任務的能力,而高質(zhì)量的數(shù)據(jù)集是訓練此類機器人的關鍵。該數(shù)據(jù)集通過多種方式采集機器人數(shù)據(jù),如操作機械臂、遠程遙控設備、捕捉機器人動作等,以訓練機器人模仿人類行為。
xAI的Grok 3模型預訓練完成
1月3日,馬斯克在社交平臺X上透露,xAI團隊開發(fā)的下一代大語言模型Grok 3的預訓練已經(jīng)完成。Grok 3的算力投入相比前一代的Grok 2提升了10倍。這一模型的訓練依托于xAI在美國孟菲斯建成的超級計算機集群Colossus,該集群擁有10萬塊英偉達H100 GPU,是全球最強大的AI訓練系統(tǒng)之一。
馬斯克此前曾表示,Grok 3有望成為全球最強大的AI模型,與OpenAI的最新模型形成直接競爭。雖然他尚未公布具體的發(fā)布時間,但這一模型預計將在文本生成、推理、編程和多模態(tài)任務中展現(xiàn)出更強的性能。
Grok 3的研發(fā)反映了xAI在AI技術領域的雄心壯志,同時也展示了其與OpenAI等行業(yè)領先者競爭的潛力。業(yè)內(nèi)人士預測,Grok 3的發(fā)布可能引發(fā)新一輪的大模型競爭,加速全球AI技術的發(fā)展。