發布語(yu)音(yin)合(he)成(cheng)(cheng)技(ji)(ji)術KAN-TTS,基(ji)于KAN-TTS技(ji)(ji)術的合(he)成(cheng)(cheng)語(yu)音(yin)可將該數據提高到97%以上。融合(he)了端到端TTS技(ji)(ji)術和傳統(tong)TTS技(ji)(ji)術,從多個(ge)方面改(gai)進了語(yu)音(yin)合(he)成(cheng)(cheng)。普通用戶定制“AI聲音(yin)”的門檻更低了。
發布(bu)語音合成(cheng)技術KAN-TTS,據介紹,該技術可(ke)大(da)幅提高(gao)合成語音與真人發聲的相似度,并將語音合成定制成本降低10倍(bei)以上。
KAN-TTS技術由達摩(mo)院機(ji)器智(zhi)能實驗(yan)室自主研發。阿里方面稱,基于KAN-TTS技術的合成語音可將該數據(ju)提高到97%以上。
據悉,KAN-TTS深度(du)融合了端到端TTS技術和傳統(tong)TTS技(ji)術,從(cong)多個(ge)方面(mian)改進了語(yu)音(yin)合成。傳統(tong)語(yu)音(yin)合成定制需要(yao)10小時以上的數據(ju)錄(lu)制(zhi)和標注,對錄(lu)音人和錄(lu)音環境要求很(hen)高。從啟動定制(zhi)到最終(zhong)交付,項目周期(qi)長成本高。
而阿里利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結合的方法,將語(yu)音合成定制周期壓縮3倍(bei)以(yi)上。也就(jiu)是說(shuo),用1小時有效錄音數據(ju)和不(bu)到兩個月(yue)制作周期,就能完成一(yi)次標(biao)準TTS定制。
此外,這使得(de)普通用戶(hu)定制(zhi)“AI聲(sheng)音”的(de)門檻(jian)更低。只需手機錄(lu)音十分鐘,就能(neng)獲得與錄(lu)制聲(sheng)音高度相似的(de)合成(cheng)語音。
阿里巴巴集團(tuan)正式在香港(gang)交易所掛牌上市,成(cheng)為首個(ge)同時(shi)在美(mei)股和港(gang)股上市的中國互(hu)聯網公司。這個(ge)行...
杭(hang)州(zhou)2022年(nian)第19屆(jie)亞運(yun)會組委會宣(xuan)布,阿里巴巴成為杭(hang)州(zhou)亞運(yun)會官方合作伙伴。作為創新技術,...
阿里巴巴集團正式在港(gang)交(jiao)所掛牌上市(shi),開盤187港(gang)元,阿里巴巴此次發(fa)行5億股(gu)新股(gu),另有7500...
收購(gou)是(shi)企業資(zi)本經(jing)營的一種形(xing)式,是(shi)一個公(gong)司(si)通(tong)過產權(quan)交易取得其他公(gong)司(si)一定程度(du)的控制權(quan),以實(shi)現一...