當(dāng)前位置：

首次超越自回歸模型！螞蟻集團開源業(yè)內(nèi)首個高性能擴散語言模型推理框架dInfer

時間:2025-11-30 18:23:07 出處:時尚閱讀（143）

　　新浪科技訊 10月13日下午消息，首次螞蟻集團正式開源業(yè)界首個高性能擴散語言模型推理框架dInfer。歸模個高

　　據(jù)介紹，型螞性在基準測試中，蟻集源業(yè)語dInfer將擴散語言模型的團開推理推理速度相比于英偉達擴散模型框架Fast-dLLM提升了10.7倍；在代碼生成任務(wù)HumanEval上，dInfer在單批次推理中創(chuàng)造了1011Tokens/秒的內(nèi)首速度，首次在開源社區(qū)中實現(xiàn)擴散語言模型的擴散框架單批次推理速度顯著超越自回歸模型。dInfer的模型工作表明，擴散語言模型具備顯著的首次效率潛力，可以通過系統(tǒng)性的歸模個高創(chuàng)新工程兌現(xiàn)，為通往AGI的型螞性架構(gòu)路徑提供極具競爭力的選項。

　　在配備8塊NVIDIA H800 GPU的蟻集源業(yè)語節(jié)點上，dInfer的團開推理性能表現(xiàn)令人矚目：

　　在與先前的dLLM推理方案Fast-dLLM的對比中，dInfer在模型效果持平的內(nèi)首情況下，平均推理速度（avg TPS）實現(xiàn)了10.7倍的擴散框架巨大提升（681 vs 63.6）；在代碼生成任務(wù)HumanEval上，dInfer在單批次推理中創(chuàng)造了1011 tokens/秒的速度；與在業(yè)界頂尖的推理服務(wù)框架vLLM上運行的、參數(shù)量和性能相當(dāng)?shù)腁R模型Qwen2.5-3B相比，dInfer的平均推理速度是其2.5倍（681 vs 277）。

　　螞蟻集團表示，dInfer連接了前沿研究與產(chǎn)業(yè)落地，標(biāo)志著擴散語言模型從“理論可行”邁向“實踐高效”的關(guān)鍵一步。此次開預(yù)案，也是誠邀全球的開發(fā)者與研究者共同探索擴散語言模型的巨大潛能，構(gòu)建更加高效、開放的AI新生態(tài)。

分享到：

上一篇：臺灣當(dāng)局接二連三“力挺”高市早苗，外交部：令人不齒！

下一篇：競彩大勢：霍芬海姆主場值得信任巴薩大勝可期

溫馨提示：以上內(nèi)容和圖片整理于網(wǎng)絡(luò)，僅供參考，希望對您有幫助！如有侵權(quán)行為請聯(lián)系刪除！

久久久6,国产999久久久,久久国产精品网,99久久精品国产91久久久,久久精品区,国产精品96久久久久久久,久久精品之

素昧平生網(wǎng)

首次超越自回歸模型！螞蟻集團開源業(yè)內(nèi)首個高性能擴散語言模型推理框架dInfer

猜你喜歡

熱門排行

看了又看

最新標(biāo)簽

友情鏈接：

久久久6,国产999久久久,久久国产精品网,99久久精品国产91久久久,久久精品区,国产精品96久久久久久久,久久精品之

素昧平生網(wǎng)

首次超越自回歸模型！螞蟻集團開源業(yè)內(nèi)首個高性能擴散語言模型推理框架dInfer

猜你喜歡

熱門排行

看了又看

最新標(biāo)簽

友情鏈接：

首次超越自回歸模型！螞蟻集團開源業(yè)內(nèi)首個高性能擴散語言模型推理框架dInfer