語音識別芯片的原理
嵌入式語(yu)(yu)音(yin)(yin)識別系統都采用了模式匹配的(de)原(yuan)理。錄入的(de)語(yu)(yu)音(yin)(yin)信號(hao)(hao)首先(xian)經過預處(chu)理,包括語(yu)(yu)音(yin)(yin)信號(hao)(hao)的(de)采樣、反混疊濾波、語(yu)(yu)音(yin)(yin)增(zeng)強,接下來是特征提(ti)取(qu),用以從語(yu)(yu)音(yin)(yin)信號(hao)(hao)波形中提(ti)取(qu)一(yi)組(zu)或(huo)幾組(zu)能夠描述語(yu)(yu)音(yin)(yin)信號(hao)(hao)特征的(de)參(can)數。特征提(ti)取(qu)之后的(de)數據(ju)一(yi)般分為兩個步(bu)驟,第一(yi)步(bu)是系統“學習”或“訓練”階段,這一階段的任務是構建參考模式庫,詞表中每個詞對應一個參考模式,它由這個詞重復發音多遍,再經特征提取和某種訓練中得到。第二是“識別”或“測試”階段,按照一定的準則求取待測語音特征參數和語音信息與模式庫中相應模板之間的失真測度,最匹配的就是識別結果。
語音識別芯片分類
按照使用者的限制而言,語音識別芯片可以分為特定(ding)人語音識(shi)(shi)別(bie)(bie)芯片和(he)非(fei)特定(ding)人語音識(shi)(shi)別(bie)(bie)芯片。
特定人語音識別
特定(ding)人語(yu)音(yin)(yin)識別芯(xin)片是針對(dui)指(zhi)定(ding)人的語(yu)音(yin)(yin)識別,其(qi)他人的話不識別,須先把使用(yong)者的語(yu)音(yin)(yin)參考樣本存入當成比(bi)對(dui)的資料庫,即特定(ding)人語(yu)音(yin)(yin)識別在使用(yong)前必(bi)須要進行語(yu)音(yin)(yin)訓(xun)練,一般按(an)照機(ji)器提示訓(xun)練2遍(bian)語(yu)音詞條即可使用。
非特定人語音識別
非特(te)定(ding)人語(yu)音識別(bie)是(shi)不用針對指定(ding)的(de)人的(de)識別(bie)技術,不分年齡(ling)、性別(bie),只要說相(xiang)同(tong)語(yu)言就可(ke)以,應用模式是(shi)在(zai)產品定(ding)型前按(an)照確定(ding)的(de)十幾個語(yu)音交(jiao)互詞條,采(cai)集200人左右(you)的聲音樣本,經過PC算法處理得到交互詞條(tiao)的語(yu)音模型(xing)和(he)特征數據(ju)庫(ku),然后(hou)燒錄(lu)到芯片上(shang)。應用這種芯片的機器(智能娃(wa)(wa)娃(wa)(wa)、電(dian)子(zi)寵物、兒童電(dian)腦)就(jiu)具有交互功能了。
非特定人(ren)(ren)語音識(shi)別(bie)應用(yong)有的是基(ji)于(yu)音素的算法,這種模(mo)式下不需要采集很多人(ren)(ren)的聲(sheng)音樣(yang)本就可(ke)以做交(jiao)互識(shi)別(bie),但是缺點是識(shi)別(bie)率不高,識(shi)別(bie)性能不穩(wen)定。
按(an)照說話(hua)方式(shi)的連續性,語(yu)音(yin)識(shi)別芯片又可分為非連續語(yu)音(yin)識(shi)別和連續語(yu)音(yin)識(shi)別。
非連續語音識別
對于非連續語音來說(shuo),識(shi)別所說(shuo)的每一個字(zi)必須(xu)分開(kai)辨認,要(yao)求說(shuo)完(wan)每個字(zi)后都要(yao)停頓(dun)。
連續語音識別
連(lian)續(xu)語(yu)音(yin)識別可以一般自然(ran)流利(li)的(de)說話方式來進行人性化(hua)的(de)語(yu)音(yin)識別,但由(you)于關系到相(xiang)連(lian)音(yin)的(de)問題(ti),很難達到好的(de)辨認效(xiao)果。
申明:以上內容源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,請注意甄別內容來源的真實性和權威性。