中信證券(600030)發(fā)布研報(bào)稱,特斯拉(TSLA.US)于9月24日發(fā)布官方視頻,更新了其人形機(jī)器人(300024)方面的進(jìn)展。視頻顯示TeslaBot通過視覺和位置編碼器實(shí)現(xiàn)了肢體的校準(zhǔn),且展示了其人形機(jī)器人出眾的姿態(tài)控制能力。此次展示再次凸顯端到端算法在人形機(jī)器人應(yīng)用端的不斷成熟,且再次展示出特斯拉在數(shù)據(jù)量、算法及算力方面的優(yōu)勢(shì)。此外,其僅靠視覺、編碼器和IMU就完成了任務(wù),展現(xiàn)出超強(qiáng)的硬件控制能力。鑒于人形機(jī)器人可用數(shù)據(jù)集迅速攀升及算法、算力的不斷成熟,維持人形機(jī)器人行業(yè)“強(qiáng)于大市”評(píng)級(jí),建議持續(xù)關(guān)注人形機(jī)器人板塊及相關(guān)廠商投資機(jī)會(huì)。
同時(shí),鑒于端到端深度學(xué)習(xí)框架逐步完善,算法泛化能力持續(xù)增強(qiáng),市場(chǎng)可調(diào)取數(shù)據(jù)集持續(xù)增加,機(jī)器人識(shí)別交互及執(zhí)行能力有望在數(shù)據(jù)快速量變的背景下加速實(shí)現(xiàn)質(zhì)變;且隨著控制端硬件規(guī)模化生產(chǎn)的擴(kuò)大及實(shí)用性研發(fā)的深入有望加速人形機(jī)器人本體的落地應(yīng)用。建議關(guān)注視覺/力學(xué)/IMU傳感器、位置編碼器、控制系統(tǒng)、關(guān)節(jié)/靈巧手、芯片及算法上市(擬上市)公司。
(資料圖片)
輸入端:特斯拉端到端模型輸入端為視頻信號(hào),即圖像及音頻信號(hào)的混合輸入,但此次展示顯示其識(shí)別部分神經(jīng)網(wǎng)絡(luò)算法僅使用視覺信息
特斯拉于9月24日發(fā)布官方視頻,視頻內(nèi)容展示的算法凸顯出TeslaBot復(fù)雜真實(shí)條件下的分類分揀能力,且展現(xiàn)出對(duì)目標(biāo)擺放物姿態(tài)的精準(zhǔn)識(shí)別及糾正能力。盡管人形機(jī)器人與汽車在輸入視覺信息方面存在一定差異,但基于特斯拉基于V12自動(dòng)駕駛的算法體系同時(shí)應(yīng)用于人形機(jī)器人及汽車是可行的,且有利于加速提升識(shí)別算法的泛化能力。此次視頻展示暫未提及所選用相機(jī)類別,基于目前圖像識(shí)別算法框架原理,我們認(rèn)為此類識(shí)別2D及3D相機(jī)都可實(shí)現(xiàn),選配核心為成本控制因素,國內(nèi)視覺鏡頭及相機(jī)等核心零部件廠商已具備此類產(chǎn)品生產(chǎn)能力,產(chǎn)品配套方案及產(chǎn)品性價(jià)比值得關(guān)注。
輸出端:特斯拉人形機(jī)器人輸出端為信號(hào)及姿態(tài)控制
TeslaBot手指的靈活性在視頻中得到良好展示,其可以以人類速度完成抓取并分類,即使在快速變化的環(huán)境下其信號(hào)處理及關(guān)節(jié)控制依然保持良好反應(yīng)能力及較高輸出穩(wěn)定性,手指抓取力度同樣表現(xiàn)出較高水平。此外視頻同樣展示了TeslaBot出眾的姿態(tài)控制能力,其已可以初步展示部分類瑜伽動(dòng)作。關(guān)節(jié)、傳感器、控制系統(tǒng)對(duì)輸出端穩(wěn)定性至關(guān)重要,盡管國內(nèi)廠商此類產(chǎn)品在產(chǎn)品產(chǎn)出一致性及可靠性存在一定短板,但產(chǎn)品升級(jí)迭代速度快,且此領(lǐng)域可選方案較多,不同廠商有望在不同價(jià)格段占據(jù)優(yōu)勢(shì)。
算法:特斯拉端到端學(xué)習(xí)框架不斷成熟,泛化能力持續(xù)增強(qiáng)。
端到端框架能夠直接從原始輸入端到最終輸出端進(jìn)行訓(xùn)練,無需進(jìn)行手動(dòng)特征工程(manual feature engineering)或中間階段的處理,端到端依然利用深度神經(jīng)網(wǎng)絡(luò)能力,優(yōu)勢(shì)在于能極大程度減少手工設(shè)計(jì)組件,可以直接通過從原始數(shù)據(jù)中學(xué)習(xí),捕獲復(fù)雜關(guān)系和細(xì)微差別,而這些微妙之處可能很難通過手動(dòng)特征工程來明確指定,這項(xiàng)優(yōu)勢(shì)可以提高性能、縮短開發(fā)周期并減少開發(fā)者對(duì)領(lǐng)域?qū)I(yè)知識(shí)的依賴;缺點(diǎn)在于所需數(shù)據(jù)量極大,數(shù)據(jù)收集成本及模型訓(xùn)練成本較高。盡管此視頻未展示其具體算法,但基于其輸入輸出信息,建議關(guān)注基于強(qiáng)化學(xué)習(xí)框架的機(jī)器人控制算法。
硬件:機(jī)器人“瑜伽”展現(xiàn)出超強(qiáng)的硬件控制能力, IMU、編碼器等傳感環(huán)節(jié)的重要性愈發(fā)顯現(xiàn)
特斯拉Optimus機(jī)器人在最新視頻中展現(xiàn)出較強(qiáng)的身體平衡能力,包括單腿站立時(shí)前后平衡能力和平行與身體方向的平衡能力,表明特斯拉機(jī)器人的靜態(tài)運(yùn)動(dòng)控制穩(wěn)定性以及用以控制平衡的IMU的較高精度。此外,特斯拉機(jī)器人的靈巧手表現(xiàn)更加靈活,身體控制更加順滑,表明了關(guān)節(jié)模組中的“雙編碼器”并非存在阻滯性較強(qiáng)的缺點(diǎn),靈巧手中的編碼器也同樣具備較高精度。特斯拉機(jī)器人優(yōu)秀的硬件控制能力表明從硬件、傳輸再到軟件,其均較2023年5月官方團(tuán)隊(duì)中展示的機(jī)器人有較多硬件優(yōu)化。
風(fēng)險(xiǎn)因素:
人形機(jī)器人政策執(zhí)行及支持力度低于預(yù)期;國內(nèi)廠商及特斯拉人形機(jī)器人任務(wù)攻關(guān)進(jìn)度不及預(yù)期;人形機(jī)器人市場(chǎng)需求低于預(yù)期;國產(chǎn)人形機(jī)器人產(chǎn)業(yè)化低于預(yù)期;人形機(jī)器人主流技術(shù)方案發(fā)生重大變化;國產(chǎn)機(jī)器人廠商響應(yīng)程度低于預(yù)期。
關(guān)鍵詞: