近日,SpeechIO TIOBE評(píng)測(cè)(簡(jiǎn)稱(chēng)“評(píng)測(cè)”)第三季度結(jié)果公布,喜馬拉雅自動(dòng)語(yǔ)音識(shí)別技術(shù)(簡(jiǎn)稱(chēng)“ASR”)在本次評(píng)測(cè)中榮獲第一名。喜馬拉雅這一技術(shù)已在喜馬拉雅App的“AI文稿功能”中廣泛應(yīng)用,為讀者帶來(lái)邊聽(tīng)邊看、聽(tīng)看一體的內(nèi)容消費(fèi)體驗(yàn)。
SpeechIO TIOBE評(píng)測(cè)是國(guó)內(nèi)較為權(quán)威的行業(yè)公開(kāi)評(píng)測(cè)項(xiàng)目,旨在客觀評(píng)估并記錄各個(gè)公共語(yǔ)音識(shí)別服務(wù)在不同領(lǐng)域的識(shí)別準(zhǔn)確率,以字準(zhǔn)確率為測(cè)試指標(biāo)。該評(píng)測(cè)每個(gè)季度進(jìn)行一次,喜馬拉雅ASR技術(shù)在今年第三季度的評(píng)測(cè)中脫穎而出,以2.16%的超低錯(cuò)誤率榮獲冠軍。參與此次評(píng)測(cè)的其他公司還包括依圖、騰訊、Bilibili、阿里、微軟、訊飛、百度等。
喜馬拉雅ASR技術(shù)是喜馬拉雅智能語(yǔ)音實(shí)驗(yàn)室所研發(fā)的一項(xiàng)重要語(yǔ)音技術(shù),該技術(shù)可以對(duì)喜馬拉雅平臺(tái)中無(wú)文稿的聲音內(nèi)容進(jìn)行語(yǔ)音轉(zhuǎn)寫(xiě),并輸出相應(yīng)的文字,從而便于聽(tīng)眾更好地理解聲音內(nèi)容。隨著語(yǔ)音識(shí)別功能使用率的提高,細(xì)節(jié)上的極致優(yōu)化成為技術(shù)產(chǎn)品制勝的關(guān)鍵。喜馬拉雅在研發(fā)時(shí),基于WeNet開(kāi)發(fā)了自研的“端到端”語(yǔ)音識(shí)別框架,并在數(shù)據(jù)讀取、模型結(jié)構(gòu)、訓(xùn)練方式、熱詞增強(qiáng)、部署流程等全鏈路進(jìn)行了深度優(yōu)化,不斷嘗試新的論文方案,融合吸收到自研框架當(dāng)中,從而有效降低了錯(cuò)誤率,達(dá)到行業(yè)領(lǐng)先水平。
喜馬拉雅ASR技術(shù)現(xiàn)在已經(jīng)廣泛應(yīng)用到了喜馬拉雅App的AI文稿功能上,能有效識(shí)別無(wú)文稿聲音內(nèi)容,為無(wú)文稿聲音內(nèi)容生成文稿。同時(shí),對(duì)于已經(jīng)有原始文稿的聲音內(nèi)容,喜馬拉雅AI文稿功能則應(yīng)用超長(zhǎng)音頻與文本的對(duì)齊技術(shù),將聲音與文稿進(jìn)行時(shí)間戳對(duì)軌,在聲音播放的同時(shí),對(duì)相應(yīng)文字進(jìn)行同步高亮,讓用戶(hù)能更便捷地享受邊聽(tīng)邊看的內(nèi)容消費(fèi)體驗(yàn)。
近期,喜馬拉雅即將上線(xiàn)全新版本的AI文稿功能,全面提升用戶(hù)體驗(yàn),大家敬請(qǐng)期待。
喜馬拉雅已在AI語(yǔ)音技術(shù)領(lǐng)域潛心鉆研多年,并在內(nèi)部專(zhuān)門(mén)成立了喜馬拉雅智能語(yǔ)音實(shí)驗(yàn)室這一核心部門(mén),長(zhǎng)期專(zhuān)注于語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)音信號(hào)處理、編解碼以及智能音效的研究和開(kāi)發(fā)。除了ASR技術(shù),喜馬拉雅的TTS(語(yǔ)音合成)技術(shù)也處于行業(yè)前列,并已經(jīng)廣泛被運(yùn)用于評(píng)書(shū)、新聞、小說(shuō)等多種內(nèi)容的制作中,正助力喜馬拉雅在現(xiàn)有的“UGC+ PGC+ PUGC”內(nèi)容生態(tài)之外,進(jìn)一步拓展AIGC的可能性。同時(shí),今年喜馬拉雅自研的跨語(yǔ)言語(yǔ)音合成創(chuàng)新技術(shù)論文,以及和中國(guó)科學(xué)技術(shù)大學(xué)合作的說(shuō)話(huà)人日志技術(shù)相關(guān)論文,先后兩次被國(guó)際音頻頂級(jí)會(huì)議ICASSP(International Conference on Acoustics, Speech, and Signal Processing,國(guó)際音頻、語(yǔ)音與信號(hào)處理會(huì)議)錄用,展現(xiàn)了喜馬拉雅在語(yǔ)音技術(shù)領(lǐng)域強(qiáng)大的實(shí)力。
未來(lái),喜馬拉雅將繼續(xù)用科技賦能文化,提升內(nèi)容消費(fèi)體驗(yàn),豐富內(nèi)容生態(tài),用技術(shù)加持聲音、用聲音服務(wù)生活。