你家萌寵也能成為人工智慧機器人的訓練師~可能嗎?(下)

你家萌寵也能成為人工智慧機器人的訓練師~可能嗎?(上)
你家萌寵也能成為人工智慧機器人的訓練師~可能嗎?(上)

你沒想過可代的萌寵也能成為人工智慧的訓練師對吧!!今天要帶大家來一探究竟喔~(下)

本篇為上篇,下篇請點此你家萌寵也能成為人工智慧機器人的訓練師~可能嗎?(上)

讓機器人能自立自強的人工智慧技術

而 Google 研究人員的下一個目標,就是如何用最少的人力、讓機器人在現實世界中正常運作。

儘管機械手臂的技術已經大有突破,比如同樣為 Google 研發人員設計的分散式 Q 學習演算法(QT-Opt)。但是,將相同的方法應用於四足機器人卻很困難,因四足機器人更可能會因事故損壞自身、離開訓練區域,相較之下更需要人工干預。

▲四足機器人的自動化學習系統面臨安全性與自動化的挑戰。

首先研究人員通過多任務學習(multitask learning)生成,將機器人驅動到工作空間,防止機器人離開訓練區域;並通過設計安全約束,將機器人跌倒的次數降到最低。

例如:若當前有兩項任務,「向前」與「向後」行走。如果機器人處在工作區的後面,調度程序將選擇「向前」任務,反之亦然。如果機器人掉落,則將調用自動起身控制器,接著進行下一個任務。

該框架成功地訓練了從無到有的策略,無需人工干預,機器人就可以朝不同的方向走,還使機器人能挑戰非平坦的地面,例如記憶泡棉床墊和鏤空的地墊。

四足機器人的未來展望

四足機器人能夠像真正的狗一樣走路,但依然有不足之處:由於算法和硬體的限制,它不能完成高度動態的行為,如大幅度的跳躍。也不比全手動設計的控制器穩定;並且絆倒後雖能重新站起來,但仍然不甚靈活。

不過即使如此,研究人員相信,他們的方法可以促進人工智慧機器人的發展,未來更能獨立運作,足以完成現實世界中的工作,像是在多層倉庫或是訂單履行中心裡運輸物料;並表示,未來也有興趣繼續研發,將自動培訓系統應用於更複雜的現實環境中。

 

更多人工智慧相關文章請點閱下方連結!!

 

 

 

其他閱讀

AI人工智慧救地球!Google:AI 保護環境還比人類快 3000 倍

CSS教學-display與visible屬性介紹

用Python寫出唐鳳「番茄鐘工作法」程式,讓AI幫你集中注意力!

AI機器狗Aibo成最新愛寵 真狗會被取代嗎?

新一代Google人工智慧眼鏡功能大進化!還兼具外型喔~(上)

台灣人工智慧學校創辦人陳昇瑋英年早逝!

人工智慧狗狗Aibo超擬真!!真狗要被取代了嗎?(上)

你家萌寵也能成為人工智慧機器人的訓練師~可能嗎?(上)

你家萌寵也能成為人工智慧機器人的訓練師~可能嗎?(上)
你家萌寵也能成為人工智慧機器人的訓練師~可能嗎?(上)
你沒想過可代的萌寵也能成為人工智慧的訓練師對吧!!今天要帶大家來一探究竟喔~(上)

 

 

Google 人工智慧研究團隊最新發表的機器人研究日誌中,詳細介紹了他們所研發的四足機器人如何流暢動作和透過 AI 技術自學行走。目前的機器人仍需要許多人工參與,而 Google 建立的技術,讓機器人只需 8 分鐘的動作資料,就能自己學會向前、向後以及左右轉彎等運動,再也不用常常得扶起翻倒的機器人。

Google人工智慧研究員讓機器人「向狗學習」

為了開發出行動敏捷、不需要人工協助的機器人,Google 的人工智慧機器人研究科學家可說是絞盡腦汁,在觀察到自然界各種動物矯健又不費力的身手後──如翻身飛躍咬住飛盤的狗兒;研究人員決定向大自然取經,讓這些動作靈巧的小生物擔任機器人的老師,學習快速流暢的動作。

運動模仿、強化學習與自適應控制技術

研究人員先建立一套能夠模仿學習的人工智慧技術,旨在讓四足機器人可以通過模仿真實世界的狗來學習敏捷的動作。

首先,研究人員捕捉真狗的各種動作,諸如小跑、跳躍與起身等等, 做為機器人執行各種技能的參考運動,並使用強化學習(Reinforcement Learning;RL)技術訓練控制策略,以仿效真實狗狗的動作。

▲強化學習技術用於訓練模擬機器人來仿效狗的動作。

在物理模擬的策略訓練上,通過對不同的參考運動使用不同的獎勵函數,在每個連續時步密切跟蹤參照的動作,訓練模擬機器人模仿各種不同的動態。

研究人員先在模擬環境完成訓練機器人的策略,接著再使用自適應控制技術(Adaptive control)將訓練好的策略實現在真實世界中,利用真實機器人的資料,高效地自適應策略,使研究人員能「教」一台四足機器人快走、跳躍或轉彎。

但由於模擬終究無法匹敵真實,模擬中訓練的策略應用在真實機器人上效果不甚佳。

為此,研究人員使用潛在空間(Latent Space)適應技術,通過改變機器人的質量和摩擦等物理量來隨機化模擬訓練中的動力學,將數值用編碼器映射到一個數字表示(即編碼),在訓練過程中將此編碼作為附加輸入傳遞給控制策略,當將該策略部署到一個真實的機器人上時,研究人員刪除編碼器,並直接在潛在空間中搜索一組允許機器人成功執行技能的變量。

這個方式十分成功,讓機器人能夠成功地執行現實世界中所需的動作。並且只要有 8 分鐘的資料供機器人參照,不只能從影片學會狗的走路動態,即使是動畫師製作的動畫,機器人也能從中學會轉頭等的複雜動作。

 

本篇為上篇,下篇請點此你家萌寵也能成為人工智慧機器人的訓練師~可能嗎?(下)

更多人工智慧相關文章請點閱下方連結!!

 

 

 

其他閱讀

AI人工智慧救地球!Google:AI 保護環境還比人類快 3000 倍

CSS教學-display與visible屬性介紹

用Python寫出唐鳳「番茄鐘工作法」程式,讓AI幫你集中注意力!

AI機器狗Aibo成最新愛寵 真狗會被取代嗎?

新一代Google人工智慧眼鏡功能大進化!還兼具外型喔~(上)

台灣人工智慧學校創辦人陳昇瑋英年早逝!

人工智慧狗狗Aibo超擬真!!真狗要被取代了嗎?(上)