一、自主機器人的系統組成
1、視覺系統
負責感知球(qiu)場(chang)上(shang)的(de)態勢,視覺系統獲得球(qiu)場(chang)上(shang)的(de)實(shi)時圖像(xiang),對圖像(xiang)進行顏色分割(ge),識別出球(qiu)場(chang)上(shang)的(de)各個(ge)目標,然后進行距離校正,將結果發給決策程(cheng)序(xu)。
2、決策系統
接(jie)收視覺系統的(de)辨(bian)識結果,對球(qiu)場態勢進行分析,然后做出合理決策(ce),將命令發送給底(di)層控(kong)制(zhi)系統。
3、底層控制系統
通過串(chuan)口(kou)接收(shou)上位機(ji)的(de)命(ming)令,控制(zhi)各輪走行電機(ji)按照指定(ding)速(su)度運行,控制(zhi)彈射和持球電機(ji),將底(di)層傳感(gan)器的(de)數據通過串(chuan)口(kou)發送給上位機(ji) 。
4、通信系統
通過(guo)無線網絡(luo)聯系場內機器(qi)人(ren)和場外計算機,進(jin)行遙控測試,參(can)數設置(zhi)等操作以及(ji)控制比賽(sai)的開始和終止(zhi)。
二、自主機器人如何實現學習
絕大多數(shu)的(de)(de)(de)(de)基于行(xing)為的(de)(de)(de)(de)實現(xian)(xian)方法(fa)都是對(dui)不同的(de)(de)(de)(de)任務(wu)進行(xing)手工編(bian)程的(de)(de)(de)(de),這(zhe)需要編(bian)程人(ren)員能(neng)充(chong)分(fen)地考慮到(dao)各種可能(neng)出現(xian)(xian)的(de)(de)(de)(de)情況,對(dui)機器人(ren)與(yu)環(huan)境之間的(de)(de)(de)(de)交互有(you)充(chong)分(fen)的(de)(de)(de)(de)理解,雖然有(you)些設(she)計出的(de)(de)(de)(de)系(xi)統(tong)對(dui)于很(hen)多任務(wu)和(he)環(huan)境而言(yan)性能(neng)都是魯棒(bang)的(de)(de)(de)(de),但系(xi)統(tong)對(dui)環(huan)境并不具有(you)適應性。
人(ren)不能(neng)窮盡一(yi)(yi)切(qie)可(ke)能(neng)。機(ji)器人(ren)能(neng)否通過學習獲得不能(neng)由程(cheng)序員手工編碼進去的(de)知(zhi)識(shi),比如構(gou)建一(yi)(yi)個未(wei)知(zhi)環(huan)(huan)境的(de)地圖,在(zai)任何(he)環(huan)(huan)境的(de)性質隨時(shi)間變化的(de)任務中都是必要的(de)。
當機(ji)器人元件老化后,機(ji)器人的傳感器和執行(xing)機(ji)構(gou)的性質(zhi)是可能會發生(sheng)改變(bian)的。
機器(qi)人(ren)在多機器(qi)人(ren)的環境中(zhong)執行(xing),由(you)于需要對其他機器(qi)人(ren)作出反應,它(ta)的策略(lve)是需要改變的。學習方(fang)法(fa)在這些情(qing)況下(xia)都能發揮重要的作用。用學習方(fang)法(fa)為機器(qi)人(ren)進行(xing)編程(cheng),而無須(xu)告訴(su)它(ta)怎樣達到它(ta)的目(mu)(mu)標,只(zhi)要告訴(su)它(ta)目(mu)(mu)標是什么,讓它(ta)通過(guo)學習去滿(man)足(zu)這個目(mu)(mu)標,無疑,這種方(fang)法(fa)具(ju)有(you)很大的吸(xi)引力(li)。它(ta)是提高機器(qi)人(ren)的適應性,降(jiang)低(di)編程(cheng)人(ren)員編程(cheng)強度的必(bi)由(you)之路。
分類
機器人有(you)不(bu)(bu)同(tong)層次的(de)(de)行為,它們(men)由(you)不(bu)(bu)同(tong)層次的(de)(de)信息(xi)表(biao)達所決定,因此就存在著不(bu)(bu)同(tong)類型(xing)(xing)的(de)(de)學習。Broo ks和(he)Mataric總結出了以下類型(xing)(xing)的(de)(de)學習:
1、為(wei)傳感設備標定或則參(can)數調節進(jin)行學習。這種(zhong)類(lei)型的學習只在(zai)一個特定行為(wei)結構中優化操作(zuo)參(can)數。
2、學(xue)習真(zhen)實(shi)世(shi)界(jie)的知識。這種類(lei)型的學(xue)習構(gou)建與修改機(ji)器(qi)(qi)人對(dui)于真(zhen)實(shi)世(shi)界(jie)的內部表(biao)達,以利于機(ji)器(qi)(qi)人作(zuo)出行為(wei)規(gui)劃和(he)決策等高層的智(zhi)能(neng)行為(wei)。
3、學習(xi)已有行為的協(xie)調(diao)。這種類型(xing)的學習(xi)中(zhong)通過(guo)協(xie)調(diao)已經存在的行為被(bei)觸發和被(bei)執行的順序來改變它們對世界的作用。
4、學習新的行為。這(zhe)種類型的學習建立新的行為結構。
實際問題
機器人領域對任何學(xue)習(xi)算法而言都是一個挑戰。在構建擁(yong)有(you)學(xue)習(xi)能(neng)力,能(neng)自動(dong)進(jin)行(xing)知識(shi)獲取的(de)自主機器人的(de)過程(cheng)中(zhong)必須(xu)面對許多煩瑣的(de)有(you)關真實(shi)世界的(de)問題。
1、傳(chuan)感器(qi)噪(zao)聲。大多數(shu)機器(qi)人(ren)的傳(chuan)感器(qi)是(shi)不可靠(kao)的。于是(shi)由傳(chuan)感器(qi)信號得(de)到的狀(zhuang)態(tai)描述注定是(shi)不精確的。學習(xi)算法必須能夠處理噪(zao)聲,因此(ci)經常需要用統計(ji)平滑技術克服噪(zao)音(yin)的影響。
算法的易駕馭性。機器(qi)人必(bi)須(xu)對不可預見的環境進(jin)行實時響應。因此學習(xi)算法必(bi)須(xu)不能過(guo)于復雜,算法的每(mei)一次迭(die)代(dai)都必(bi)須(xu)能實時地完成(cheng)。
2、增量式(shi)的算法。學(xue)(xue)(xue)習(xi)算法必須(xu)允許機器人(ren)邊學(xue)(xue)(xue)習(xi)邊改善自己的性能(neng)。因為(wei)機器人(ren)必須(xu)一邊收集經(jing)(jing)驗一邊進(jin)行學(xue)(xue)(xue)習(xi). 形(xing)成經(jing)(jing)驗的數據不能(neng)離線獲(huo)得(de)。
3、有限(xian)的(de)(de)訓練(lian)時(shi)間。機器(qi)人(ren)的(de)(de)訓練(lian)時(shi)間是非常(chang)有限(xian)的(de)(de)。學習(xi)算法(fa)必須在合理的(de)(de)運算次數中收斂(lian),因為機器(qi)人(ren)需要完(wan)成任務,在真實的(de)(de)機器(qi)人(ren)上進行(xing)上百萬次的(de)(de)動作(zuo)是極為困難的(de)(de)。
堅實的(de)(de)信息來源。 所有機(ji)器(qi)人(ren)(ren)可以(yi)獲得的(de)(de)信息都必(bi)須最終來至從它的(de)(de)傳感(gan)器(qi)抽取得到的(de)(de)信息或初始(shi)狀態(tai)時強行(xing)編碼進去的(de)(de)知識。由于狀態(tai)信息是由傳感(gan)器(qi)數(shu)據計算得到的(de)(de),學習(xi)算法必(bi)須能和感(gan)知設備的(de)(de)限制一起工作.明顯地,能否(fou)解決以(yi)上提(ti)出的(de)(de)一些問題決定了用在真實機(ji)器(qi)人(ren)(ren)上的(de)(de)學習(xi)算法的(de)(de)成功(gong)與(yu)否(fou)。
學習方法
在(zai)機器人研(yan)究領(ling)域(yu)中(zhong)有三種主(zhu)要的(de)(de)學習(xi)(xi)方(fang)(fang)(fang)法(fa)變得越(yue)來(lai)越(yue)流行。它(ta)們是(shi)強化(hua)學習(xi)(xi)( RL) ,進化(hua)方(fang)(fang)(fang)法(fa)( GA和(he)EP)和(he)基(ji)于(yu)人工神經網絡( ANN )的(de)(de)方(fang)(fang)(fang)法(fa)。其中(zhong)應用得最為廣泛的(de)(de)方(fang)(fang)(fang)法(fa)是(shi)強化(hua)學習(xi)(xi)方(fang)(fang)(fang)法(fa).在(zai)學習(xi)(xi)新(xin)的(de)(de)行為和(he)學習(xi)(xi)協調已(yi)經存在(zai)的(de)(de)行為兩種情況下都可以(yi)用到(dao)強化(hua)學習(xi)(xi)的(de)(de)方(fang)(fang)(fang)法(fa)。 強化(hua)方(fang)(fang)(fang)法(fa)是(shi)一種無監(jian)督的(de)(de)學習(xi)(xi)算法(fa),它(ta)比較好地符合人們解決問題(ti)的(de)(de)心理習(xi)(xi)慣,和(he)傳統人工智能以(yi)及優(you)化(hua)算法(fa)聯系緊密,有普遍適的(de)(de)用性,因此獲(huo)得了最廣泛的(de)(de)關注。
申明:以上方法源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,證明有效,請注意甄別內容來源的真實性和權威性。