近期,無論國(guo)(guo)外(wai)還是(shi)國(guo)(guo)內,智能語音助(zhu)手都是(shi)一個(ge)相當火熱的話題。
在國外,谷歌的(de)Google Home 和(he)亞(ya)馬遜(xun)Echo的(de)斗爭十分激烈,一方面不斷(duan)升級語音(yin)助手(shou)服務,另一方面不斷(duan)向(xiang)第三方開(kai)放其(qi)語音(yin)助手(shou)平臺。如(ru)4月(yue)15日亞(ya)馬遜(xun)向(xiang)第三方授權其(qi)Echo的(de)關鍵語音(yin)技術;再如(ru)4月(yue)20日Google Home 推出其(qi)智能音(yin)箱可同時支持6人(ren)使用,提(ti)供個性化服務 。此外,4月(yue)23日奔馳也將(jiang)其(qi)新(xin)車接入Alexa和(he)Google Assistant,提(ti)升其(qi)車載系統(tong)和(he)對智能家居等的(de)遠距離控制(zhi)。
而在國內,4月(yue)(yue)14日(ri),樂視推出(chu)(chu)其語(yu)音助(zhu)手“樂樂”來實現(xian)對手機APP的(de)語(yu)音操作。4月(yue)(yue)18日(ri)人工智能(neng)公司(si)出(chu)(chu)門問問推出(chu)(chu)其語(yu)音助(zhu)理“問問”和智能(neng)音箱Tichome,并向第三方開放語(yu)音平臺。4月(yue)(yue)25日(ri),騰(teng)訊(xun)推出(chu)(chu)語(yu)音助(zhu)手“騰(teng)訊(xun)叮當”,又一巨頭入(ru)局智能(neng)交互領域。
隨著(zhu)人工智(zhi)(zhi)能和(he)智(zhi)(zhi)能家(jia)居(ju)(ju)的發展,以音(yin)箱或(huo)手機等為(wei)硬件的語音(yin)助手可能將成為(wei)家(jia)庭的交互入口(kou),而這背后是整個智(zhi)(zhi)能家(jia)居(ju)(ju)產業(ye)鏈和(he)廣闊的市場。誰將掌握這個控制中(zhong)心,誰就贏得(de)了(le)未來(lai)。
一、智能語音助手大盤點
目(mu)前,語音(yin)助手的硬件載體已經開始從(cong)(cong)智能手機(ji)向音(yin)箱(xiang)、汽車、機(ji)器人等蔓延。預計這一趨勢(shi)會愈演愈烈,語音(yin)助手將會連接更多的設備(bei),從(cong)(cong)而(er)成為智能生活(huo)的核心控制中心之一。
盡管當下市(shi)場上有(you)許多語音助(zhu)手(shou)(shou),但由于語音技術的(de)(de)(de)(de)(de)研(yan)發周期長,投入大,行(xing)業進入壁壘較高,全(quan)球范圍內應用成熟的(de)(de)(de)(de)(de)語音助(zhu)手(shou)(shou)并不(bu)多。知名度(du)(du)較高的(de)(de)(de)(de)(de)有(you)國外谷歌的(de)(de)(de)(de)(de)Google Home、亞馬遜的(de)(de)(de)(de)(de)Alexa、蘋果的(de)(de)(de)(de)(de)Siri、微(wei)軟的(de)(de)(de)(de)(de)Cortana小娜(na),以及(ji)尚(shang)未謀(mou)面的(de)(de)(de)(de)(de)三星Bixby。國內知名度(du)(du)較高的(de)(de)(de)(de)(de)有(you)百度(du)(du)的(de)(de)(de)(de)(de)度(du)(du)秘和(he)科大訊飛的(de)(de)(de)(de)(de)靈犀語音助(zhu)手(shou)(shou)。
BAT三巨頭在語音助手領域再相(xiang)遇
就在(zai)近日騰訊也推(tui)出其(qi)語(yu)音助手(shou)(shou)“騰訊叮(ding)當”,騰訊表示,其(qi)最新人(ren)工智(zhi)能(neng)助手(shou)(shou)騰訊叮(ding)當在(zai)功能(neng)上(shang)與(yu)亞(ya)馬遜Alexa相似。而(er)到(dao)此,加上(shang)百(bai)度的(de)度秘和(he)阿(a)里iDST的(de)語(yu)音助手(shou)(shou),BAT三巨頭(tou)都(dou)進入了智(zhi)能(neng)語(yu)音助手(shou)(shou)領域,可見他(ta)們對于語(yu)音交互這一大“入口”的(de)認同。
度(du)(du)秘(mi)是李彥宏在(zai)(zai)2015年百(bai)(bai)度(du)(du)世(shi)界大會上推(tui)出的(de)機器人助理。依托(tuo)百(bai)(bai)度(du)(du)的(de)搜索和智能(neng)交互技術(shu),度(du)(du)秘(mi)可以通過對話,進而在(zai)(zai)索引現實(shi)的(de)服(fu)務(wu)和信息的(de)基礎(chu)上,為(wei)用戶提供服(fu)務(wu)。度(du)(du)秘(mi)主要的(de)能(neng)力集(ji)中在(zai)(zai)美食推(tui)薦(jian)(jian)、電影(ying)推(tui)薦(jian)(jian)和生活(huo)服(fu)務(wu)推(tui)薦(jian)(jian)。度(du)(du)秘(mi)服(fu)務(wu)更多的(de)集(ji)中在(zai)(zai)消(xiao)費上,它(ta)連接(jie)的(de)是廣泛的(de)現實(shi)行(xing)業,涵(han)蓋(gai)吃、住、行(xing)、玩等方面,這更多的(de)是依托(tuo)百(bai)(bai)度(du)(du)搜索能(neng)力、百(bai)(bai)度(du)(du)地圖、百(bai)(bai)度(du)(du)糯米等O2O類(lei)的(de)服(fu)務(wu)。
但目(mu)前的度秘需要下載手機百(bai)度客戶端才能使(shi)用,也(ye)沒(mei)有(you)語(yu)音服務和日(ri)常(chang)生(sheng)活(huo)提(ti)醒等(deng)功(gong)能。度秘的交互性和趣味性并不強,打(da)開方(fang)式也(ye)略顯麻煩。
阿里的(de)語(yu)(yu)(yu)(yu)音(yin)(yin)助(zhu)手(shou)(shou)是(shi)由iDST部門開發的(de),提供(gong)實(shi)(shi)時智能語(yu)(yu)(yu)(yu)音(yin)(yin)識別技術,可實(shi)(shi)現(xian)語(yu)(yu)(yu)(yu)音(yin)(yin)操控、語(yu)(yu)(yu)(yu)音(yin)(yin)搜索(suo)、購物(wu)等功(gong)能。iDST部門的(de)語(yu)(yu)(yu)(yu)音(yin)(yin)識別技術主要致力于(yu)兩(liang)個(ge)方面,一是(shi)建立自(zi)然語(yu)(yu)(yu)(yu)音(yin)(yin)交互平(ping)臺,連(lian)接更多的(de)終端(duan),獲取(qu)互聯網上的(de)各種服(fu)(fu)務;二是(shi)通過輸出語(yu)(yu)(yu)(yu)音(yin)(yin)能力,幫助(zhu)合(he)作伙伴去做具(ju)體業(ye)務。依(yi)托系統,加上阿里在(zai)新聞(wen)、飲食、地(di)圖(tu)、娛(yu)樂等領(ling)域的(de)布局,阿里語(yu)(yu)(yu)(yu)音(yin)(yin)助(zhu)手(shou)(shou)可獲得強大的(de)數據(ju)(ju)資(zi)源、數據(ju)(ju)處理能力,以及多元的(de)服(fu)(fu)務。而未來其將成為阿里商業(ye)的(de)交互中心,連(lian)接人與商品和(he)服(fu)(fu)務,提升購物(wu)交易(yi)的(de)便捷化。
至于剛剛推出(chu)的(de)騰訊(xun)叮當,根(gen)據騰訊(xun)科技報道,目前騰訊(xun)叮當涵蓋的(de)服務很(hen)廣泛,已經覆蓋新聞、體(ti)育(yu)賽事、票務、快(kuai)遞、音(yin)樂、股票、文學、基于LBS的(de)附近資(zi)源(yuan)等領域(yu)。如(ru)用戶對著騰訊(xun)叮當說“查詢天氣”它(ta)就會提供(gong)當天和以后三天的(de)預報。問及足球比(bi)賽結(jie)果時,它(ta)也會在1秒內給出(chu)針(zhen)對性(xing)的(de)答復。
可(ke)以看出三家的語(yu)音(yin)助手服(fu)(fu)務有重合,也有自己的特色。如(ru)度秘(mi)在(zai)搜索和生活消費上(shang)更有優(you)勢,阿里(li)語(yu)音(yin)助手在(zai)購物(wu)、商務服(fu)(fu)務上(shang)更有優(you)勢,而騰訊將在(zai)泛娛樂上(shang)更有優(you)勢。
通過BAT三家的(de)布局,可以看出,他們在(zai)打造一個人機交互(hu)的(de)入(ru)口,無論是在(zai)家庭中,還是在(zai)個人的(de)工作(zuo)生(sheng)(sheng)活中。通過語音助(zhu)手來(lai)鏈接(jie)其生(sheng)(sheng)態中的(de)更(geng)多(duo)產品,來(lai)為消費者提供整合性的(de)服務。而(er)在(zai)技(ji)術相差不大的(de)當下,誰(shui)的(de)連接(jie)能(neng)力更(geng)強(qiang),誰(shui)的(de)生(sheng)(sheng)態更(geng)廣,無疑更(geng)有利于占(zhan)領(ling)當下的(de)市場(chang)。
三星Bixby與蘋果Siri 將有一戰?
早在2011年,蘋果(guo)就在其iPhone4S上推出了智(zhi)能(neng)語(yu)音助(zhu)(zhu)手(shou)——Siri,隨(sui)(sui)后語(yu)音助(zhu)(zhu)手(shou)也逐漸進入大(da)家視野。隨(sui)(sui)著(zhu)Siri的(de)不斷(duan)升級(ji),儼然成為(wei)一個生活管家。Siri可以為(wei)你查閱信息(xi),充當時間助(zhu)(zhu)手(shou)、郵件助(zhu)(zhu)手(shou),進行歌(ge)曲識別(bie),還(huan)是算(suan)數高手(shou),還(huan)可以為(wei)你提供生活消費娛樂等服務。此(ci)外(wai),隨(sui)(sui)著(zhu)蘋果(guo)Homekit智(zhi)能(neng)家居平臺的(de)搭(da)建,Siri作(zuo)為(wei)語(yu)音助(zhu)(zhu)手(shou)將在智(zhi)能(neng)家居中發(fa)揮更大(da)作(zuo)用。
然而,在今年(nian)3月29日的(de)三星S8發(fa)布會上,三星推出了(le)其AI語(yu)音(yin)助手Bixby。在三星S8發(fa)布會上,為了(le)和Siri區別開,也為了(le)體現Bixby人工智能特性,三星重點強(qiang)調了(le)Bixby的(de)內容(rong)理解能力和學習能力。
內容理解(jie)能力(li)體現在當你(ni)告訴Bixby把截圖發(fa)(fa)送給朋友時,如果有多個友人重名,Bixby不(bu)會因(yin)為不(bu)知道發(fa)(fa)給誰而崩(beng)潰,而是會主動(dong)詢問(wen)你(ni)到底要發(fa)(fa)給誰。而在學習能力(li)上(shang),Bixby主要通過積累用(yong)(yong)戶(hu)的(de)使用(yong)(yong)習慣來(lai)構(gou)建(jian)用(yong)(yong)戶(hu)的(de)日常使用(yong)(yong)模式(shi)。比(bi)如你(ni)每天定點用(yong)(yong)Uber打車,如果今天你(ni)忘了,那么(me)Bixby很可能會通過長期觀察你(ni)的(de)日常而提前(qian)幫你(ni)在Uber上(shang)叫車。
此外,三(san)(san)星(xing)(xing)還(huan)可通過(guo)Bixby接(jie)入Sumsung Connect來控制三(san)(san)星(xing)(xing)系的(de)智(zhi)能(neng)(neng)家電,以(yi)期(qi)在智(zhi)能(neng)(neng)家居中(zhong)發(fa)揮更大的(de)作(zuo)用。然(ran)而(er),可惜的(de)是Bixby因為種種原因并(bing)未上市,也不被裝(zhuang)入三(san)(san)星(xing)(xing)S8中(zhong),而(er)很可能(neng)(neng)載入三(san)(san)星(xing)(xing)今年下半年的(de)Note8中(zhong)。
有趣(qu)的是(shi),為Bixby提供技(ji)術支持的是(shi)三(san)星去(qu)年(nian)收購(gou)的Viv Labs實(shi)驗室,沒(mei)錯就是(shi)蘋(pin)(pin)果Siri締造者Adam Cheyer、Dag Kittlaus 和 Chris Brigham離(li)開蘋(pin)(pin)果后聯合成立(li)的創業公司!作(zuo)為智(zhi)能手(shou)機市場(chang)的兩(liang)個(ge)霸主,三(san)星與(yu)蘋(pin)(pin)果也在不斷暗自較(jiao)勁。三(san)星遲遲不推出Bixby,是(shi)否(fou)為了憋大招?是(shi)否(fou)為了與(yu)蘋(pin)(pin)果在語音助手(shou)領域展開一(yi)戰(zhan)?一(yi)切只能等(deng)待。
亞馬遜Alexa與Google Assistant的相愛相殺
亞馬遜的(de)Echo和谷歌的(de)Google Home是在智能家(jia)居中相對比較成(cheng)熟的(de)兩(liang)(liang)款產品。目前兩(liang)(liang)款產品都(dou)已具備超過5000項的(de)技能。
亞(ya)馬遜于(yu)2014年推出智能(neng)(neng)音(yin)(yin)箱Echo,搭載Alexa語(yu)音(yin)(yin)助手,隨(sui)著(zhu)不(bu)斷升級,Echo已成(cheng)為家(jia)(jia)庭的(de)交互入口。除(chu)了日常生活化(hua)的(de)服務外,Echo的(de)主要功能(neng)(neng)集中(zhong)在語(yu)音(yin)(yin)購物和(he)對智能(neng)(neng)家(jia)(jia)居的(de)控制上。而這也(ye)正是(shi)亞(ya)馬遜的(de)野心(xin),建立下一代計(ji)算平臺(tai),并稱為家(jia)(jia)庭交互的(de)入口。
通過亞(ya)馬遜Alexa與智能(neng)家居(ju)設(she)備(bei)的(de)(de)連接(jie)(jie),你就可(ke)以輕(qing)松的(de)(de)控制(zhi)家庭(ting)環境(jing),如開(kai)關(guan)(guan)燈、開(kai)關(guan)(guan)窗簾、開(kai)關(guan)(guan)電視等。其(qi)獨(du)特的(de)(de)麥克風,可(ke)以實現較遠距(ju)(ju)離的(de)(de)聲音(yin)接(jie)(jie)收(shou)(shou)。據(ju)知乎用戶反饋,相比Siri需要掏出手機(ji),按(an)鈕(niu)觸(chu)發,并且(qie)距(ju)(ju)離較遠就無(wu)法聽到(dao);Echo的(de)(de)麥克風設(she)計的(de)(de)很贊,可(ke)以實現遠距(ju)(ju)離的(de)(de)聲音(yin)接(jie)(jie)收(shou)(shou),且(qie)不需要按(an)鈕(niu)觸(chu)發,它會是(shi)你的(de)(de)第二老(lao)婆!
而(er)Google Home出(chu)現的(de)(de)較晚,它于(yu)2016年5月(yue)份(fen)才(cai)推出(chu),之后便(bian)一直追趕亞馬遜的(de)(de)Echo的(de)(de)步伐。此外,Google Home的(de)(de)功能(neng)和(he)Echo相差不大(da),主要(yao)用于(yu)個人生活和(he)智能(neng)家居(ju)的(de)(de)控(kong)制。Google Home的(de)(de)優(you)勢在于(yu)其搜索優(you)勢和(he)功能(neng)更加齊全,而(er)Echo的(de)(de)優(you)勢在于(yu)購物和(he)更多的(de)(de)第三(san)方接入,以及先發(fa)入場(chang)優(you)勢。
有(you)趣(qu)的(de)是(shi)(shi),兩款智能(neng)家(jia)居(ju)設備,兩個語(yu)音(yin)(yin)助手,從出生時(shi)仿佛就(jiu)是(shi)(shi)宿敵。亞(ya)(ya)馬遜(xun)(xun)于2015年(nian)6月向第三方開(kai)(kai)放其Alexa語(yu)音(yin)(yin)技術,而(er)不(bu)必通(tong)過智能(neng)音(yin)(yin)箱Echo;而(er)谷(gu)歌在2016年(nian)12月才向第三方開(kai)(kai)放,為的(de)是(shi)(shi)于亞(ya)(ya)馬遜(xun)(xun)展(zhan)開(kai)(kai)競爭。而(er)在今(jin)年(nian),雙(shuang)方在技術和連接上的(de)競爭更加白熱(re)化。一(yi)方面(mian),雙(shuang)方不(bu)斷通(tong)過各自語(yu)音(yin)(yin)助手整合和連接更多(duo)的(de)設備與服務,亞(ya)(ya)馬遜(xun)(xun)甚至向第三方開(kai)(kai)放了Alexa核心的(de)麥克風(feng)語(yu)音(yin)(yin)技術;另一(yi)方面(mian),谷(gu)歌也在技術上有(you)所突破,實(shi)現一(yi)臺設備的(de)多(duo)人(ren)使用,目前可支持(chi)6人(ren)。
而這背(bei)后正是家庭(ting)入口(kou)的(de)爭奪,誰搶占了這個入口(kou),就可以掌控所(suo)有信息的(de)輸入,以及數據(ju)流和(he)消費(fei)流,其市場規模和(he)潛力難(nan)以想象。
二、智能語音助手的技術邏輯
1950年,計(ji)算(suan)機(ji)科學(xue)家阿(a)蘭(lan)·圖(tu)靈就在其論文《計(ji)算(suan)機(ji)與智(zhi)能》中提出(chu)了(le)著名(ming)的“圖(tu)靈測試”,這是(shi)最早探討機(ji)器智(zhi)能與人機(ji)交互的代(dai)表。
在1952年,貝爾實(shi)驗室研制出首個利用分離技術的實(shi)用語音識(shi)別(bie)設(she)備,能(neng)識(shi)別(bie)出10個英語數(shu)字(zi)發音。
從(cong)1950年開始至(zhi)今(jin),語(yu)(yu)音識(shi)(shi)(shi)別(bie)(bie)(bie)技術經(jing)歷了由(you)小詞匯、孤立詞匯的識(shi)(shi)(shi)別(bie)(bie)(bie),到大(da)詞匯量、特定聲音識(shi)(shi)(shi)別(bie)(bie)(bie)的飛躍發展。然而(er),語(yu)(yu)音識(shi)(shi)(shi)別(bie)(bie)(bie)技術只是智能語(yu)(yu)音助手實現(xian)工作(zuo)的第一步。
總的(de)來說,語(yu)音(yin)(yin)助手實現其工(gong)作大體(ti)要經過三(san)(san)步(bu):其一(yi)是(shi)前端的(de)語(yu)音(yin)(yin)識別,即將聲音(yin)(yin)轉換成(cheng)文字;其二是(shi)自然語(yu)言的(de)理解,將文字解讀成(cheng)行(xing)為;其三(san)(san)是(shi)通(tong)過開放API接口等技術(shu)來實現行(xing)為等操作。
因此,語(yu)(yu)(yu)(yu)音(yin)(yin)(yin)助手能(neng)否提供強大的服務,主要(yao)取決于其技術(shu)和連接整合能(neng)力。在(zai)技術(shu)上(shang),主要(yao)使(shi)用云計(ji)算、語(yu)(yu)(yu)(yu)音(yin)(yin)(yin)識別(bie)、語(yu)(yu)(yu)(yu)音(yin)(yin)(yin)合成(cheng)(cheng)(cheng)等(deng)AI技術(shu)。即(ji)在(zai)前端(duan)面(mian)向用戶時(shi),主要(yao)需要(yao)語(yu)(yu)(yu)(yu)音(yin)(yin)(yin)識別(bie)、語(yu)(yu)(yu)(yu)音(yin)(yin)(yin)合成(cheng)(cheng)(cheng)技術(shu)。在(zai)語(yu)(yu)(yu)(yu)音(yin)(yin)(yin)識別(bie)時(shi),系統需要(yao)把語(yu)(yu)(yu)(yu)音(yin)(yin)(yin)轉化成(cheng)(cheng)(cheng)文字,這就需要(yao)強大的語(yu)(yu)(yu)(yu)音(yin)(yin)(yin)庫作為支撐,就需要(yao)云計(ji)算技術(shu)。而語(yu)(yu)(yu)(yu)音(yin)(yin)(yin)合成(cheng)(cheng)(cheng)則(ze)是將反饋的文字結果轉化成(cheng)(cheng)(cheng)語(yu)(yu)(yu)(yu)音(yin)(yin)(yin)輸出。
在后端則是人工智能技術的(de)使用(yong)。面對(dui)用(yong)戶的(de)眾多(duo)請(qing)求,語音助手(shou)需要通過機器學(xue)習(xi)(深度(du)神經(jing)網絡)來不斷自我學(xue)習(xi),了解用(yong)戶的(de)說話方式(shi)和愛好需求,進而輸出(chu)個性化(hua)的(de)服(fu)務。
而(er)其連接(jie)整(zheng)合能(neng)(neng)力就是(shi)(shi)指,語(yu)音(yin)助(zhu)手(shou)將越來(lai)越多的(de)(de)設備(bei)和(he)服(fu)(fu)務(wu)(wu)接(jie)入(ru),從而(er)構建自身生態的(de)(de)能(neng)(neng)力。尤其是(shi)(shi)在智(zhi)能(neng)(neng)家庭中,用戶最(zui)終獲得的(de)(de)是(shi)(shi)體驗和(he)服(fu)(fu)務(wu)(wu),單一(yi)(yi)(yi)設備(bei)單一(yi)(yi)(yi)APP控制(zhi)不是(shi)(shi)智(zhi)能(neng)(neng)家居的(de)(de)追(zhui)求,智(zhi)能(neng)(neng)家居需(xu)要的(de)(de)是(shi)(shi)形成一(yi)(yi)(yi)個(ge)(ge)生態,形成一(yi)(yi)(yi)個(ge)(ge)閉環,從而(er)通過(guo)一(yi)(yi)(yi)個(ge)(ge)入(ru)口(kou)來(lai)更(geng)便捷的(de)(de)控制(zhi)所有設備(bei)。而(er)這(zhe)需(xu)要語(yu)音(yin)助(zhu)手(shou)平臺一(yi)(yi)(yi)方(fang)面開(kai)放其語(yu)音(yin)助(zhu)手(shou),另一(yi)(yi)(yi)方(fang)面也要加強商務(wu)(wu)合作,來(lai)聚合服(fu)(fu)務(wu)(wu)。
三、智能語音市場將達百億
據(ju)工業(ye)和(he)信(xin)(xin)息化部電子科(ke)技信(xin)(xin)息情報研究(jiu)所數據(ju)顯示,2012年(nian)以來,全球(qiu)智能(neng)(neng)語音(yin)產(chan)(chan)業(ye)規(gui)(gui)模持續快(kuai)速增(zeng)(zeng)長(chang)(chang)。2013年(nian),全球(qiu)智能(neng)(neng)語音(yin)產(chan)(chan)業(ye)規(gui)(gui)模整體達(da)33.7億美元,同比增(zeng)(zeng)長(chang)(chang)38.1%;2014年(nian)較2013年(nian)同比增(zeng)(zeng)長(chang)(chang)41.0%,產(chan)(chan)業(ye)規(gui)(gui)模大(da)幅(fu)提升。預計到2017年(nian),全球(qiu)智能(neng)(neng)語音(yin)規(gui)(gui)模將達(da)112.4億美元,復合增(zeng)(zeng)長(chang)(chang)率達(da)35.1%。
據了解,語音(yin)技(ji)術(shu)以其(qi)廣闊(kuo)的(de)產業(ye)(ye)應(ying)用(yong)席(xi)卷人們的(de)日(ri)常生活(huo)和工作(zuo),其(qi)產業(ye)(ye)規模(mo)大幅提升主要(yao)得益(yi)于三(san)方面。第一(yi)是大數據、云計算等技(ji)術(shu)的(de)發(fa)展使得智(zhi)能語音(yin)技(ji)術(shu)的(de)應(ying)用(yong)不斷成熟;第二是各國政府、相關行(xing)業(ye)(ye)及資本的(de)持(chi)續關注推動語音(yin)技(ji)術(shu)的(de)研(yan)發(fa)和產業(ye)(ye)化;第三(san)是隨著(zhu)(zhu)移動互聯網(wang)技(ji)術(shu)的(de)發(fa)展,智(zhi)能語音(yin)技(ji)術(shu)正在快速成為(wei)人們日(ri)常生活(huo)的(de)組成部(bu)分(fen),并顯(xian)著(zhu)(zhu)改變消費者的(de)交互方式。
但(dan)智能(neng)語(yu)音(yin)市場(chang)在帶來高(gao)價(jia)值的(de)(de)同時,也將導致行業(ye)(ye)的(de)(de)壟斷。據MBA報告,智能(neng)語(yu)音(yin)產業(ye)(ye)是(shi)技(ji)(ji)術先導型的(de)(de)新興產業(ye)(ye),存在核心(xin)技(ji)(ji)術壁(bi)壘、行業(ye)(ye)應用壁(bi)壘和(he)語(yu)音(yin)資(zi)源壁(bi)壘,具有(you)顯著的(de)(de)“馬太效應”。從全球范圍來看(kan),僅有(you)少數廠商(shang)在語(yu)音(yin)市場(chang)具有(you)競爭力,一(yi)類是(shi)傳統語(yu)音(yin)技(ji)(ji)術廠商(shang),擁有(you)長期(qi)技(ji)(ji)術和(he)用戶(hu)積(ji)累,如美國(guo)的(de)(de)Nuance公(gong)司,但(dan)近年(nian)逐漸衰(shuai)落,而讓位給互(hu)聯網巨頭(tou)。另一(yi)類是(shi)以IBM、微(wei)軟、谷歌、蘋果等(deng)為(wei)代表的(de)(de)IT巨頭(tou),憑(ping)借在互(hu)聯網端的(de)(de)優勢迅(xun)速搶占語(yu)音(yin)信息(xi)流入(ru)口。
資料顯示,早(zao)在2009年(nian),Nuance公司占有全球語音(yin)識別市(shi)(shi)場(chang)(chang)約(yue)69%的(de)市(shi)(shi)場(chang)(chang)份額(e)。在2012年(nian),Nuance的(de)市(shi)(shi)場(chang)(chang)份額(e)下(xia)降到(dao)62%,Nuance、谷歌、微(wei)軟、蘋(pin)果(guo)、IBM、科大(da)訊(xun)飛五家企業(ye)占據市(shi)(shi)場(chang)(chang)份額(e)超95%。2013年(nian),Nuance市(shi)(shi)場(chang)(chang)份額(e)下(xia)降到(dao)51%,而(er)谷歌依靠其(qi)在互聯(lian)網(wang)(wang)和(he)移動互聯(lian)網(wang)(wang)領域(yu)的(de)優(you)勢,市(shi)(shi)場(chang)(chang)份額(e)由16.9%上升至28%;蘋(pin)果(guo)、微(wei)軟、科大(da)訊(xun)飛以4.7%、4.4%、4.3%的(de)市(shi)(shi)場(chang)(chang)份額(e)分(fen)列第三(san)、第四、第五位(wei)。可見智能語音(yin)行業(ye)的(de)寡頭壟(long)斷特征十分(fen)明顯。
此外,隨著智能(neng)家(jia)居已(yi)從概念向商業(ye)化階段發(fa)展,語音控制和交互將是智能(neng)家(jia)庭的一大趨勢。根據市(shi)(shi)場研究公司(si)Juniper發(fa)布的數據,2018年(nian)全球智能(neng)家(jia)居市(shi)(shi)場規模將達710億美元。以蘋(pin)果、三(san)星、海爾為代表(biao)的消費電(dian)子廠商和以谷歌、小米、樂視等為代表(biao)的互聯網企業(ye)開始紛(fen)紛(fen)推出智能(neng)家(jia)電(dian)產品,為智能(neng)家(jia)居市(shi)(shi)場打前站。而智能(neng)家(jia)居的發(fa)展也將帶動智能(neng)語音服(fu)務的快(kuai)速增長。
由于智能語音(yin)助手將會是(shi)家庭(ting)的(de)(de)中心入(ru)口,占(zhan)據了這個入(ru)口,就占(zhan)據了家庭(ting)服務的(de)(de)大部分,接入(ru)其中的(de)(de)服務將會獲(huo)(huo)得(de)(de)更多的(de)(de)市場份額。另一方面,語音(yin)助手也將獲(huo)(huo)得(de)(de)海量的(de)(de)家庭(ting)數據信息,這些海量、動態的(de)(de)數據可以用來優化算法(fa)的(de)(de)迭代(dai),也可以用于其他云服務,產生更高(gao)的(de)(de)價(jia)值(zhi)。
結語:助力智能化生活
在(zai)人(ren)類文(wen)明的技(ji)術史中,由(you)于通(tong)信(xin)的需要,我(wo)們創造了(le)文(wen)字,它是我(wo)們在(zai)歷史長(chang)河中由(you)于自(zi)身局限不得不做(zuo)的選擇(ze)(ze)。而今天我(wo)們由(you)于技(ji)術的進步,將擺脫文(wen)字的束(shu)縛,再次選擇(ze)(ze)口語作(zuo)(zuo)為我(wo)們的通(tong)訊方式,讓我(wo)們的生(sheng)活更(geng)加便捷(jie)、高效化。或許這也是蘋果、亞馬遜當初選擇(ze)(ze)語音這種最原(yuan)始的方式作(zuo)(zuo)為交互入口的原(yuan)因。
試想(xiang)一下,在(zai)不(bu)遠將來的(de)(de)一個(ge)早(zao)晨,你(ni)從睡夢中醒(xing)來,輕輕喚醒(xing)你(ni)的(de)(de)語(yu)音助(zhu)手。它(ta)為(wei)你(ni)打開(kai)窗簾,為(wei)你(ni)播報今天的(de)(de)天氣,建議你(ni)穿什(shen)么樣的(de)(de)衣服。同時喚醒(xing)廚房,預熱你(ni)事(shi)先準備好的(de)(de)早(zao)餐(can)。在(zai)你(ni)吃(chi)早(zao)餐(can)時,你(ni)的(de)(de)語(yu)音助(zhu)手為(wei)你(ni)播報昨晚和(he)今日(ri)的(de)(de)要聞(wen)。當你(ni)感(gan)覺室內的(de)(de)光(guang)(guang)線略暗時,它(ta)為(wei)你(ni)調節室內燈(deng)光(guang)(guang)。它(ta)會根據空氣質量來決定是否(fou)開(kai)窗以及(ji)啟(qi)動空氣凈化器(qi)。并在(zai)你(ni)出門時,為(wei)你(ni)安排好上班的(de)(de)行程以及(ji)交(jiao)通方(fang)式(shi)。而這只在(zai)不(bu)遠的(de)(de)未(wei)來。
隨著(zhu)人(ren)工智(zhi)(zhi)能(neng)的(de)發(fa)展,智(zhi)(zhi)能(neng)語(yu)音(yin)助(zhu)手將會(hui)更加(jia)智(zhi)(zhi)能(neng),融入我(wo)們(men)的(de)家庭和(he)我(wo)們(men)的(de)生(sheng)活。盡管也會(hui)面臨種種隱(yin)私、數(shu)據泄露和(he)營(ying)銷行為,但(dan)它們(men)將便(bian)捷和(he)高效(xiao)化我(wo)們(men)的(de)生(sheng)活。我(wo)們(men)將獲得更多控制,解放雙手,從(cong)而將時間精力(li)用到更有意義、更有價(jia)值(zhi)的(de)事情上。