創(chuàng)澤機器人
CHUANGZE ROBOT
當前位置:首頁 > 新聞資訊 > 機器人應用 > 機器人示教學習:高級技能學習方法(學習計劃和學習目標)

機器人示教學習:高級技能學習方法(學習計劃和學習目標)

來源:CAAI認知系統與信息處理專委會     編輯:創(chuàng)澤   時間:2020/6/9   主題:其他 [加盟]
機器人可以在人類教師反饋的基礎上來探索某項任務。反饋提供了關于機器人嘗試的任務滿足目標的程度的信息。大多數基于反饋的工作傾向于采用強化學習。傳統的RL算法提供了一個反饋(獎勵)信號,在這種情況下使用了人工響應。在某些情況下,除了人類的反饋,任務的表現直接受到老師的影響,老師允許選擇下一步行動。在[10]中,這種方法將任務學習表現提高了約50%。

需要注意的是,有時選擇的示教方法和獲取的數據類型與學習算法的選擇有關。一方面來自多個模態(tài)的示范增加了維數,增加了學習的復雜性。數據的維數可以降低,但是有些信息被忽略,導致從示教數據中學習不當。另一方面,缺少傳感模態(tài)可能會在一開始就提供不完整的信息,導致學習算法表現不理想。

高級技能可以認為是一組低級技能或一組動作基元。除此之外,高級技能還包括對象可視性,涉及構建物理世界對象和機器人動作之間關系的知識。高級技能學習方法可以大致分為學習計劃和學習目標。

1)學習計劃:在這種高級技能的學習方法中,學習計劃為從初始狀態(tài)到最終狀態(tài)的一系列動作。因此,動作是根據前置條件和后置條件定義的。前置條件為動作執(zhí)行前的狀態(tài),后置條件為動作執(zhí)行后的狀態(tài)。除此之外,人類教師還用注釋的形式提供附加信息。注釋可以通過觸覺、視覺或語義來提供。額外的信息允許更好地概括高水平的技能?蓤(zhí)行的動作可以是簡單的低級技能,如抓住目標對象,拾起綠色的對象等,組合起來形成一個高級任務,如排序綠色的對象。另一方面,有一些方法可以通過在示教數據中尋找重復的結構來從高級技能示教中提取低級技能,這樣就可以在不同的示教中識別它。在[2]中,一個示教學習范例是通過人類示教和在程序界面輸入的用戶目的來描述的。在[18]中,一些涉及一系列順序旋轉和轉換的日常對象操作的示教被用來提取順序的低級技能,并進一步構建一個計劃。這項工作還示教了從一個對象到其他類似對象的學習知識轉移。


2)學習目標:推斷高級技能的目標。人類教師提供的示教被用來推斷執(zhí)行高級技能的意圖。通過生成假設,可以從重復的示教中推斷出目標,F代方法也使用基于獎勵函數的強化學習方法來實現期望目標。如果獎勵函數是從給定的示教中學習的,那么它就被認為是目標學習。一些基于強化學習的方法得到了很好的研究[19]。


3、討論總結

技能的學習直接依賴于示教的準確性。大多數方法[20]手動消除了部分示教中的噪聲。結合強化學習,在獎勵和探索機制的基礎上對技能學習進行改進。另一種改進技能的方法涉及示教者反饋[21]。當機器人在一個稍微不熟悉的情況下執(zhí)行學習到的技能時,從人類教師那里得到關于執(zhí)行技能可取性的反饋。目前為了實現這種技能細化的方法,研究人員主要從兩個方面進行了研究:(1)控制機器人和人類教師之間的信息交互,(2)提供反饋。





蘇州行政審批局實現導引機器人導覽服務

蘇州行政審批局實現機器人導覽服務。5G 高速互聯網接入服務。異地超高清視頻通話

農業(yè)機器人視覺識別雜草技術

由于機器視覺可以提供目標物的顏色、形狀、紋理、深度等豐富的信息,且精度相當高,成本相對較低,因此以往關于植物檢測的研究大多基于機器視覺

武漢大學研發(fā)可精準控制迷你軟體機器人

武漢大學薛龍建教授團隊研制出一種迷你軟體機器人Geca-Robot,其可精準控制方向和速度,可在廢墟狹縫、生物體內完成各種復雜作業(yè)

方濱興院士:人工智能安全之我見

人工智能技術在安全領域的應用需求日益迫切,人工智能自身的安全問題也不容小覷,安全與人工智能并舉,雙方的融合發(fā)展與創(chuàng)新是我強國戰(zhàn)略中不可忽視的重要助推因素

淺談機器人的靈巧手

專注于極簡主義設計方法。在保留擬人化設計的許多優(yōu)點的同時,在設計和控制方面進行原則性的簡化,可以合理地降低系統的復雜度,包括執(zhí)行器、傳感器和程序代碼的數量

輔助機器人對機器人靈巧手的應用要求

輔助機器人必須能夠在日常生活活動中與環(huán)境和人類安全地互動和合作,這意味著手需要小、輕、靈活

獵戶星空:醫(yī)療服務機器人

醫(yī)療服務機器人根據醫(yī)院需求分別執(zhí)行遞送化驗單、藥物等工作,用機器人代替醫(yī)護過程中簡單但耗力的流程化工作

極飛科技:無人機抗疫解決方案

在巨大的公共衛(wèi)生危機面前,無人機能夠進入疫情嚴重區(qū)域自動噴灑消毒劑,降低應急人員被病毒感染的風險

水下機器人靈巧操作的新型觸覺感知

泵和傳感器可以安裝在靠近手臂的機器人底座上進行保護,并實現與機械手遠程連接

國內安防AI芯片型號,類型,處理速度和功能一覽表

Hi3559AV100 Hi3519AV100 Hi3516DV300 Hi3516CV500 昇騰310 旭日 聽濤 思元220 BM1682 BM1880 DeepEye1000 T01

機器人守護人類生命線,六大趨勢凸顯前景無限

機器人也都成為應急救援搶險的標配,救援機器人發(fā)展空間和潛力的爆發(fā),既得益于需求的釋放,也離不開技術突破與商用價值的支撐

追一科技:智能營銷機器人應用案例

智能營銷機器人能夠基于營銷、催收等不同場景配置外呼對話流程,細分場景、描繪精準客戶畫像并對應采取不同話術,成為該銀行智能化轉型的合作廠商。
資料獲取
機器人應用
== 最新資訊 ==
ChatGPT:又一個“人形機器人”主題
ChatGPT快速流行,重構 AI 商業(yè)
中國機器視覺產業(yè)方面的政策
中國機器視覺產業(yè)聚焦于中國東部沿海地區(qū)(
從CHAT-GPT到生成式AI:人工智能
工信部等十七部門印發(fā)《機器人+應用行動實
全球人工智能企業(yè)市值/估值 TOP20
創(chuàng)澤智能機器人集團股份有限公司第十一期上
諧波減速器和RV減速器比較
機器人減速器:諧波減速器和RV減速器
人形機器人技術難點 高精尖技術的綜合
機器人大規(guī)模商用面臨的痛點有四個方面
青島市機器人產業(yè)概況:機器人企業(yè)多布局在
六大機器人產業(yè)集群的特點
機械臂-高度非線性強耦合的復雜系統
== 機器人推薦 ==
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人開發(fā)平臺

機器人開發(fā)平臺


機器人招商 Disinfection Robot 機器人公司 機器人應用 智能醫(yī)療 物聯網 機器人排名 機器人企業(yè) 機器人政策 教育機器人 迎賓機器人 機器人開發(fā) 獨角獸 消毒機器人品牌 消毒機器人 合理用藥 地圖
版權所有 創(chuàng)澤智能機器人集團股份有限公司 中國運營中心:北京 清華科技園九號樓5層 中國生產中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728