數碼錄音筆工作原理
數(shu)碼錄音筆通(tong)過(guo)(guo)對聲音的(de)模(mo)擬(ni)信(xin)號(hao)的(de)采樣、編碼,將(jiang)模(mo)擬(ni)信(xin)號(hao)通(tong)過(guo)(guo)數(shu)模(mo)轉(zhuan)換器轉(zhuan)換為數(shu)字(zi)信(xin)號(hao),并進行(xing)壓(ya)縮后進行(xing)存儲(chu)。
智能錄音筆工作原理
語(yu)音(yin)交(jiao)互(hu),只需要短短幾秒鐘便可翻譯(yi)出文(wen)字。所謂(wei)語(yu)音(yin)轉換成文(wen)字用到(dao)了語(yu)音(yin)交(jiao)互(hu)中一(yi)項ASR技(ji)術。
建立聲學模型(xing):由于(yu)每個人發音、語調(diao)、語速等各不相同,需(xu)要將同一個單詞或漢字讓不同用戶錄(lu)取,以(yi)便機(ji)器識別(bie)更多的(de)人。聲學模型(xing)建立過程需(xu)要錄(lu)入(ru)大量的(de)原始用戶聲音,以(yi)從中提取特征建立聲學模型(xing)數據(ju)庫。
建立語(yu)言(yan)模型(xing):同聲(sheng)學(xue)模型(xing),也(ye)需要大量文字信息的儲存。語(yu)言(yan)模型(xing)可以對聲(sheng)學(xue)模型(xing)進(jin)行匹配與調整(zheng),讓正確率盡可能提(ti)高,語(yu)句更加通順(shun)。
語(yu)音識別(bie):有前兩步作為(wei)基礎的情況下(xia),最(zui)終形成的數據(ju)庫存儲在設備(bei)本(ben)地或(huo)(huo)云端(duan),再進行實時語(yu)音識別(bie)。將(jiang)用戶的語(yu)音輸(shu)入進行編(bian)碼和特征提取,將(jiang)提取到(dao)(dao)(dao)的特征拿到(dao)(dao)(dao)聲學模(mo)型庫中去查(cha)詢,得(de)到(dao)(dao)(dao)單個(ge)的單詞或(huo)(huo)漢字(zi);然后再拿到(dao)(dao)(dao)語(yu)言模(mo)型庫中去查(cha)詢,得(de)到(dao)(dao)(dao)最(zui)匹配的單詞或(huo)(huo)漢字(zi)。