国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

京東MALL現(xiàn)場直擊多款多噴頭3D打印機實操評測 消費級3D打印機迎來新突破里程碑時刻!縱橫第100家體驗中心榮耀啟幕,筑牢中國豪華越野品類生態(tài)根基惡意利用“七無天無理由退貨”政策法律不予支持!央視曝光“摸摸黨”拼多多聯(lián)席董事長趙佳臻:Temu將All In中國供應鏈以科技守味非遺!卡薩帝冰箱冬至將全國啟幕「好好吃」餃子館字節(jié)TRAE,正悄悄“解放”600萬工程師酷開再獲國家級“信任牌照”:數(shù)據(jù)安全彰顯戰(zhàn)略定力ThinkPad 2025黑FUN禮——了不起的offer,企業(yè)采購專享狂歡來襲!拼多多宣布實行聯(lián)席董事長制度 下一個三年爭取再造一個拼多多菜鳥將入股九識智能 無人車業(yè)務有望大整合抖音上線“長輩防走失模式”同程旅行發(fā)布2025年度旅行榜:長線出行北上廣至川藏航線熱度居首XR專利首案在歐洲落地,中國智造出海風險與機遇并行超能小度,賦能生長,小度全屋智能舉辦年終核心服務商成長特訓營破“內(nèi)卷”、立標準、向未來 光伏行業(yè)領袖共話行業(yè)生態(tài)重塑之道AI重構(gòu)2026年線上帶貨新生態(tài):零庫存爆單、小紅書月銷百萬,開啟AI小店副業(yè)新時代人形機器人租賃市場大幅降溫 行業(yè)商業(yè)化路徑仍待探索阿里云AI Landing Zone正式發(fā)布,助力企業(yè)從“上好云”到“用好AI”的戰(zhàn)略升級118家標桿企業(yè)脫穎而出,定義AI時代的雇主標桿!2025NFuture最佳雇主AI榜單重磅發(fā)布昇思人工智能框架峰會 | MindSpore Lite混合精度推理,實現(xiàn)內(nèi)存節(jié)省30%,助力鴻蒙翻譯模型輕量化部署
  • 首頁 > 產(chǎn)經(jīng)新聞頻道 > 科技資訊

    英偉達與 MIT、香港大學聯(lián)手推出 Fast-dLLM 框架,推理速度提升驚人

    2025年06月03日 16:07:17 來源:AIbase基地

      在最近的科技進展中,英偉達與麻省理工學院(MIT)和香港大學聯(lián)合推出了名為 Fast-dLLM 的新框架,顯著提升了擴散模型(Diffusion-based LLMs)的推理速度,最高可達27.6倍。這一創(chuàng)新的成果為語言模型的應用開辟了新天地。

      擴散模型被視為自回歸模型的有力競爭者,采用了雙向注意力機制,使其在理論上能夠?qū)崿F(xiàn)多詞元同步生成,從而加快解碼速度。然而,實際應用中,擴散模型在推理速度上卻常常無法與自回歸模型相媲美,因為每一次生成都需要重復計算所有注意力狀態(tài),這使得計算成本居高不下。此外,在進行多詞元解碼時,詞元之間的依賴關系易被破壞,影響生成質(zhì)量,導致其在實際應用中受到限制。

      為了克服這些瓶頸,英偉達的研發(fā)團隊在 Fast-dLLM 框架中引入了兩項核心創(chuàng)新:塊狀近似 KV 緩存機制和置信度感知并行解碼策略。KV 緩存通過將序列劃分為塊,預計算并存儲其他塊的激活值,減少了計算冗余;而其 DualCache 版本更是進一步提升了效率,利用相鄰推理步驟的高相似性來緩存前后綴詞元。

      同時,置信度解碼策略則根據(jù)設定的閾值選擇性解碼高置信度的詞元,從而避免了同步采樣可能帶來的依賴沖突,確保生成質(zhì)量不受影響。

      Fast-dLLM 在多項基準測試中表現(xiàn)出色。在 GSM8K 數(shù)據(jù)集上,該框架在生成長度為1024詞元時,8-shot 配置下實現(xiàn)了驚人的27.6倍加速,并達到了76.0% 的準確率;在 MATH 基準測試中,其加速倍數(shù)為6.5倍,準確率約為39.3%;而在 HumanEval 和 MBPP 測試中,分別實現(xiàn)了3.2倍和7.8倍的加速,準確率保持在54.3% 和接近基線水平。

      Fast-dLLM 在加速的同時,準確率僅下降了1-2個百分點,展示了其在速度與質(zhì)量之間的良好平衡。這一研究成果為擴散模型在實際語言生成任務中的應用提供了更為強大的支持,使其有能力與自回歸模型進行競爭,為未來的廣泛應用奠定了堅實基礎。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創(chuàng)作社區(qū)回歸!海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

    海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創(chuàng)作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調(diào)研機構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業(yè)IT

    華為坤靈發(fā)布IdeaHub千行百業(yè)體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業(yè)體驗官計劃發(fā)布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發(fā)布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |