數碼錄音筆工作原理
數碼錄音筆通過對聲音的模擬信號(hao)的采樣(yang)、編碼,將模擬信號(hao)通過數模轉換器轉換為數字信號(hao),并進(jin)行壓(ya)縮后進(jin)行存儲。
智能錄音筆工作原理
語(yu)音交互,只需(xu)要短短幾秒鐘便可(ke)翻譯出文字。所謂語(yu)音轉換成文字用到了語(yu)音交互中一項ASR技術。
建(jian)(jian)立聲(sheng)(sheng)學(xue)模型(xing):由(you)于每(mei)個人發音(yin)、語(yu)(yu)調、語(yu)(yu)速等各不相同(tong),需要將同(tong)一個單詞(ci)或漢字讓不同(tong)用戶錄取(qu),以(yi)便(bian)機器識別更多(duo)的(de)人。聲(sheng)(sheng)學(xue)模型(xing)建(jian)(jian)立過程需要錄入大量的(de)原始用戶聲(sheng)(sheng)音(yin),以(yi)從(cong)中提(ti)取(qu)特征建(jian)(jian)立聲(sheng)(sheng)學(xue)模型(xing)數(shu)據庫(ku)。
建立語言模(mo)型:同聲學模(mo)型,也需要大量文字(zi)信(xin)息的儲存。語言模(mo)型可(ke)以對聲學模(mo)型進行匹配與調整,讓正確率盡可(ke)能提高,語句更(geng)加通順。
語(yu)(yu)音(yin)識(shi)別(bie):有(you)前兩步作(zuo)為(wei)基礎的情(qing)況(kuang)下(xia),最(zui)終形成的數據庫(ku)存儲在設備(bei)本(ben)地或云(yun)端,再進行實時語(yu)(yu)音(yin)識(shi)別(bie)。將(jiang)用戶的語(yu)(yu)音(yin)輸入進行編碼和特(te)征提(ti)(ti)取(qu),將(jiang)提(ti)(ti)取(qu)到(dao)(dao)的特(te)征拿(na)到(dao)(dao)聲學模(mo)型(xing)庫(ku)中(zhong)去查(cha)詢,得到(dao)(dao)單個的單詞(ci)或漢(han)(han)字;然后再拿(na)到(dao)(dao)語(yu)(yu)言模(mo)型(xing)庫(ku)中(zhong)去查(cha)詢,得到(dao)(dao)最(zui)匹配的單詞(ci)或漢(han)(han)字。