阿里云通義千問開源兩款語音基座模型，識(shí)別效果優(yōu)于 OpenAI Whisper

2024年07月09日 11:12:59 沛霖來源：IT之家

　　阿里云通義千問開源了兩款語音基座模型 SenseVoice(用于語音識(shí)別)和 CosyVoice(用于語音生成)。

　　SenseVoice 專注于高精度多語言語音識(shí)別、情感辨識(shí)和音頻事件檢測，有以下特點(diǎn)：

　　多語言識(shí)別：采用超過 40 萬小時(shí)數(shù)據(jù)訓(xùn)練，支持超過 50 種語言，識(shí)別效果上優(yōu)于 Whisper 模型

　　富文本識(shí)別：具備優(yōu)秀的情感識(shí)別，能夠在測試數(shù)據(jù)上達(dá)到和超過目前最佳情感識(shí)別模型的效果;支持聲音事件檢測能力，支持音樂、掌聲、笑聲、哭聲、咳嗽、噴嚏等多種常見人機(jī)交互事件進(jìn)行檢測

　　高效推理： SenseVoice-Small 模型采用非自回歸端到端框架，推理延遲極低，10s 音頻推理僅耗時(shí) 70ms，15 倍優(yōu)于 Whisper-Large

　　微調(diào)定制：具備便捷的微調(diào)腳本與策略，方便用戶根據(jù)業(yè)務(wù)場景修復(fù)長尾樣本問題

　　服務(wù)部署：具有完整的服務(wù)部署鏈路，支持多并發(fā)請求，支持的客戶端語言有 python、c++、html、java 與 c#等

　　與開源情感識(shí)別模型進(jìn)行對(duì)比，SenseVoice-Large 模型可以在幾乎所有數(shù)據(jù)上都達(dá)到了最佳效果，而 SenseVoice-Small 模型同樣可以在多數(shù)數(shù)據(jù)集上取得超越其他開源模型的效果。

　　CosyVoice 模型同樣支持多語言、音色和情感控制，該模型在多語言語音、零樣本語音生成、跨語言語音克隆和指令跟隨等功能方面表現(xiàn)出色。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

海報(bào)生成中...

即時(shí)

全球頂級(jí)AI創(chuàng)作社區(qū)回歸！海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

海藝AI的模型系統(tǒng)在國際市場上廣受好評(píng)，目前站內(nèi)累計(jì)模型數(shù)超過80萬個(gè)，涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場景，基本覆蓋所有主流創(chuàng)作風(fēng)格。

OPPO A6l發(fā)布：售價(jià)1799元搭載六年長壽大電池

華為Mate X7今日開售：售價(jià)12999元起

新聞

市場占比高達(dá)35.8%，阿里云引領(lǐng)中國AI云增長

9月9日，國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場，1H25》報(bào)告。中國AI云市場阿里云占比8%位列第一。

企業(yè)IT

華為坤靈發(fā)布IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃，助力中小企

9月24日，華為坤靈召開“智能體驗(yàn)，一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。

3C消費(fèi)

雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機(jī)，分別是平板振膜的YH-4000和動(dòng)圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報(bào)告，2025年第二季度》顯示，上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺(tái)，同比增長33%，顯示出品類強(qiáng)勁的市場需求。

專題

禮儀主持_商業(yè)活動(dòng)模特演藝服務(wù)公司
九章智算云Alaya NeW Cloud 2.0發(fā)布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關(guān)于我單位網(wǎng)站被仿冒一

返回主頁 ┊ 關(guān)于我們 ┊ 內(nèi)容聯(lián)系 ┊ 聯(lián)系我們 ┊ 免責(zé)聲明 ┊ 原創(chuàng)新聞 ┊ 門戶版

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
| | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

阿里云通義千問開源兩款語音基座模型，識(shí)別效果優(yōu)于 OpenAI Whisper

最新新聞

熱門新聞

即時(shí)

全球頂級(jí)AI創(chuàng)作社區(qū)回歸！海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

新聞

市場占比高達(dá)35.8%，阿里云引領(lǐng)中國AI云增長

企業(yè)IT

華為坤靈發(fā)布IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃，助力中小企

3C消費(fèi)

雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

研究

IDC：2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

專題

阿里云通義千問開源兩款語音基座模型，識(shí)別效果優(yōu)于 OpenAI Whisper

擴(kuò)展閱讀

最新新聞

熱門新聞