英偉達與麻省理工學院(MIT)近日聯合發布了一項突破性技術——Audio-SDS。
該技術基于文本條件的音頻擴散模型擴展,首次將Score Distillation Sampling(SDS)方法引入音頻領域。
通過結合預訓練模型的生成能力與參數化音頻表示,Audio-SDS無需依賴大規模特定數據集,即可高效完成FM合成器參數校準、物理沖擊音合成和音源分離三大任務。
這項創新技術利用解碼器SDS、多步去噪及多尺度頻譜圖等方法,在主觀聽覺測試與客觀指標上均表現優異。其核心優勢在于單一預訓練模型即可支持多種音頻任務,顯著降低了對領域特定數據的依賴。
盡管如此,研究團隊仍指出模型覆蓋范圍及優化敏感性等問題有待進一步完善。這一成果為高質量音頻生成開辟了全新路徑。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。