為了避開捕食者,剛出生的長頸鹿或者馬駒等動物必須學會用腿盡可能快地走路。
然而,學會精確協調腿部肌肉和肌腱,還是要花費一些時間。
最初,小動物嚴重依賴于天生的脊髓反射,運動控制反射幫助它們在第一次嘗試行走時避免摔倒和受傷。
之后,它們必須學習更先進、更精確的肌肉控制,直到神經系統最終適應腿部肌肉和肌腱。
最后,它們就像成年動物一樣,再也不會有不受控制的跌跌撞撞了。
這個過程可能非常短(比如牛羊剛出生就會走路),也可能是幾天到幾周(比如貓咪和狗子需要一些時間學習),也可能長達 1 年(比如人類幼兒學走路就很慢)。

(來源:Pixabay)
那么,問題來了,動物是如何學會行走并從磕磕絆絆中學習的?
為此,馬克斯 · 普朗克智能系統研究所(MPI-IS)的研究團隊進行了一項研究,他們制造了一個四條腿、狗一樣大小的機器人,希望借此來回到這一問題。

圖|在跑步機上行走(素材來源:Morti)
相關研究論文以 "Learning plastic matching of robot dynamics in closed-loop central pattern generators" 為題,已發表在科學期刊 Nature Machine Intelligence 上。
" 作為工程師和機器人專家,我們通過制造一個機器人來尋找答案,它具有像動物一樣的反射能力,并從錯誤中學習。" 論文第一作者、通訊作者 Felix Ruppert 說。
" 如果動物跌倒了,這是一個錯誤嗎?如果只發生一次,就不是錯誤。但是,如果它經常跌倒,就可以為我們提供一個衡量機器人行走能力的標準。"
用算法優化 " 虛擬脊髓 "
據論文描述,該機器狗名為 Morti,只用了一個小時學習走路,就很好地掌握了復雜的腿部力學。

圖|機器狗 Morti(來源:MPI-IS)
在這一過程中,研究團隊利用一種貝葉斯優化算法來指導機器狗學習:測量到的足部傳感器信息與虛擬脊髓模型的目標數據相匹配,脊髓模型作為程序運行在機器人的 " 大腦 " 中。
機器人通過不斷比較發送和期望的傳感器信息、運行反射回路和調整其運動控制模式來學習行走。
該學習算法類似于中樞模式發生器(CPG)的控制參數。
在人類和動物中,這些 CPG 是脊髓中的神經元網絡,它們產生周期性的肌肉收縮,而不需要來自大腦的輸入。CPG 網絡幫助產生有節奏的任務,比如走路、眨眼或消化。
此外,反射是由連接腿部傳感器和脊髓的硬編碼神經通路觸發的無意識的運動控制行為。
只要小動物在一個完美的平面上行走,CPG 就足以控制來自脊髓的運動信號。
然而,僅僅是與地面的一次小碰撞,就能改變它們的行走方式。
這時,它們自身的(機體)反射開始發揮作用,幫助調整運動模式,防止摔倒。
這些運動信號的瞬間變化是可逆的,或者說是 " 有彈性的 ",運動模式在受到調控后會恢復到原來的形態。
但是,如果它們在多次循環的運動后仍然會磕磕絆絆——盡管是主動的反射——那么這些運動模式必須重新學習,并使其 " 不可逆轉 "。
在動物剛出生的階段,它們的 CPG 還沒有調整好,它們在平坦或不平的地形上都會表現得跌跌撞撞。但是,這些動物很快就能學會 CPG 和反射是如何控制腿部肌肉和肌腱的。

(來源:MPI-IS)
拉布拉多犬大小的機器狗 "Morti" 也是如此。
更重要的是,Morti 優化運動模式的速度比小動物還快,只需要大約一小時。
Morti 的 CPG 是在一臺控制機器人腿部運動的小型計算機上模擬的。
這個虛擬脊髓被放置在 Morti 的背部,也就是頭部所在的位置。
在機器人平穩行走的過程中,Morti 足部的傳感器數據會不斷與它自身 CPG 預測的預期觸地進行比較。
如果機器人摔倒了,學習算法會改變腿前后擺動的距離、速度以及腿在地面上的長度。

調整后的運動也會告訴 Morti 之后如何更好地利用腿部力學。
在學習過程中,Morti 的 CPG 會發送適應的運動信號來優化自身行走,進而減少磕磕絆絆。
在這個框架中,Morti 的虛擬脊髓并不了解自身的腿部設計、動力來源和身體結構。由于對自身物理結構一無所知,Morti 缺少一個機器人 " 模型 "。
對此,Ruppert 解釋說:"Morti 實際上并不知道它的腿部解剖結構以及它們是如何工作的。"
"CPG 類似于天然提供的內置自動行走智能,我們已經將其轉移到機器人身上。計算機產生信號控制腿部的馬達,機器人就會行走和跌倒。數據從傳感器傳到虛擬脊髓,與 CPG 數據進行對比。如果傳感器數據與預期數據不匹配,學習算法就會改變行走行為,直到機器人走得很好,不會絆倒。學習過程的核心部分是改變 CPG 的輸出,同時保持反應的活躍,并監測機器人的跌跌撞撞。"
節能的機器狗控制
Morti 的小型計算機在行走過程中只消耗了 5 瓦的能量。
但是,大多數現有的工業四足機器人對電力的需求要大得多。它們的控制器使用機器人的模型,根據機器人的精確質量和身體幾何形狀進行編碼,通常消耗幾十到幾百瓦。
兩種類型的機器人都是動態高效運行的,但 Morti 的能量消耗要低得多,而且還提供了對動物解剖學的重要見解。
" 我們不能輕易地研究活體動物的脊髓。但我們可以在機器人中建立一個模型," 論文作者之一 Alexander Badri-Spröwitz 說。
" 我們知道這些 CPG 存在于許多動物身上。我們知道反射是內在的;但如何將兩者結合起來,讓動物學習反射和 CPG 運動?這是機器人與生物學交叉領域的基礎性研究。針對生物學無法回答的問題,我們的機器人模型給出了答案。"
在未來的工作中,研究團隊將繼續擴展 CPG,在產生臀部軌跡時將機體俯仰動作考慮其中。通過慣性測量裝置,機體俯仰可以反饋到 CPG 中。
原文地址:http://www.myzaker.com/article/62d7c16d8e9f09407d0f2b60