8月16日至21日,2023世界機器人(300024)大會在北京舉行。大會期間,北京市政府發(fā)布了《北京市機器人產(chǎn)業(yè)創(chuàng)新發(fā)展行動方案(2023—2025年)》,提出著眼世界前沿技術(shù)和未來戰(zhàn)略需求,加緊布局人形機器人,帶動醫(yī)療健康、協(xié)作、特種、物流四類優(yōu)勢機器人產(chǎn)品躍升發(fā)展。
(資料圖片)
機器人的應(yīng)用場景可謂極其廣泛,人形機器人自然也不例外,在小米集團高級副總裁曾學忠的設(shè)想里,未來的智能制造體系中,70%的工作由自動化設(shè)備來完成;20%應(yīng)當由仿真機器人來完成;剩下的10%需要人來完成。
今年以來,在AI浪潮的推動下,AI+人形機器人帶來的“具身智能”受到了市場關(guān)注。工業(yè)和信息化部副部長徐曉蘭表示,以人形機器人和通用人工智能為代表的新技術(shù)、新產(chǎn)品、新業(yè)態(tài)蓬勃發(fā)展,正成為全球科技創(chuàng)新的制高點。
人形機器人前景廣闊
機器人的發(fā)展跟隨制造業(yè)自動化程度不斷提升,從最早的單任務(wù)起重機式臂到機器人,再到能夠與人直接交互的協(xié)作機器人,再發(fā)展到與人工智能結(jié)合的人形機器人。
受全球勞動力缺口持續(xù)擴大影響,人形機器人替代帶動巨大市場需求,東吳證券(601555)預(yù)計,在特斯拉人形機器人標桿引領(lǐng)作用下,全球在2025年初步實現(xiàn)人形機器人商業(yè)化,實現(xiàn)銷量2萬-3萬臺。到2030年,新增需求100萬臺,2035年銷量有望突破1000萬臺。
隨著人形機器人技術(shù)的不斷發(fā)展和應(yīng)用場景的不斷拓展,市場規(guī)模有望不斷擴大,其中,核心零部件方向是多家機構(gòu)預(yù)計受益的重點方向。具體而言,人形機器人身體核心零部件可以分為諧波減速器、行星滾柱絲杠、伺服電機三部分;手部核心零部件可以分為空心杯電機、微型行星齒輪箱兩部分。
結(jié)合2030年人形機器人需求數(shù)量,西南證券(600369)測算,五大核心零部件的市場空間于2030年市場規(guī)模如下:
1)諧波減速器:單臺機器人諧波減速器數(shù)量為14個,2030年單價有望降到600元,樂觀/中性/悲觀情景下市場空間分別為168/126/67億元;
2)行星滾柱絲杠:單臺機器人行星滾柱絲杠數(shù)量為14個,2030年單價有望降到2000元,樂觀/中性/悲觀情景下市場空間分別為560/420/224億元;
3)伺服電機:單臺機器人伺服電機數(shù)量28個,2030年單價有望降到300元,樂觀/中性/悲觀情景下市場空間分別為168/126/67億元。
4)空心杯電機:單臺機器空心杯電機數(shù)量為12個,2030年單價有望降到400元,樂觀/中性/悲觀情景下市場空間分別為96/72/38億元;
5)微型行星齒輪箱:單臺機器人行星滾柱絲杠數(shù)量為12個,2030年單價有望降到200元,樂觀/中性/悲觀情景下市場空間分別為48/36/19億元。
據(jù)國際機器人協(xié)會預(yù)測,2021年到2030年,全球人形機器人市場規(guī)模年復(fù)合增長率將高達71%。中國電子學會數(shù)據(jù)顯示,到2030年,我國人形機器人市場規(guī)模有望達到約8700億元。
AI如何賦能“具身智能”?
從產(chǎn)業(yè)角度考慮,人形機器人是AI和機器人兩大產(chǎn)業(yè)的共同發(fā)展方向,是技術(shù)、制造、服務(wù)三個核心能力的交匯點,也是軟硬件跟AI技術(shù)融合的制高點。目前,人形機器人的硬件主要包括五部分:
1)感知系統(tǒng),相當于機器人的“五官”,包括聲音、光、溫度、壓力、定位、接觸等傳感器,用以將外部環(huán)境信號轉(zhuǎn)換為機器人可以理解的信息或數(shù)據(jù);2)驅(qū)動系統(tǒng),相當于機器人的“肌肉”,電機驅(qū)動包括電機、減速器、編碼器等;3)末端執(zhí)行系統(tǒng),相當于機器人的“手”,用以和外界環(huán)境進行交互;4)能源供應(yīng),電源或電池;5)運算系統(tǒng)及軟件,相當于機器人的“大腦”。
各大科技巨頭紛紛推出AI大模型,有望解決人形機器人的通用性問題。AI大模型對人形機器人的賦能可以從語音、視覺、決策、控制等多方面實現(xiàn),形成感知、決策、控制閉環(huán),使機器人具備常識。國泰君安(601211)認為,具體可以分為三個方向:
1)語音:語言大模型為機器人的自主語音交互難題提供了解決方案,在上下文理解、多語種識別、多輪對話、情緒識別、模糊語義識別等通用語言任務(wù)上,ChatGPT顯著優(yōu)于深度學習,表現(xiàn)出了不亞于人類的理解力和語言生成能力。
2)視覺:人形機器人的場景相對工業(yè)機器人更通用、更復(fù)雜,通用視覺大模型的All in One的多任務(wù)訓練方案能使得機器人更好地適應(yīng)人類生活場景。大模型的強擬合能力使人形機器人在進行目標識別、避障、三維重建、語義分割等任務(wù)時,具備更高的精確度;通用視覺大模型通過大量數(shù)據(jù)學到更多的通用知識,并遷移到下游任務(wù)中,基于海量數(shù)據(jù)(603138)獲得的預(yù)訓練模型具有較好的知識完備性,提升場景泛化效果。
3)決策:基于多模態(tài)的預(yù)訓練大模型將增強機器人可完成任務(wù)的多樣性與通用性,讓其不局限于文本和圖像等單個部分,而是多應(yīng)用相容,拓展單一智能為融合智能,使機器人能結(jié)合其感知到的多模態(tài)數(shù)據(jù)實現(xiàn)自動化決策。
多個難題依舊待解
在AI浪潮下,2023年,人形機器人受到了不同以往的密集關(guān)注,商業(yè)化落地的大方向是有的,但目前,產(chǎn)業(yè)發(fā)展還面臨著諸多挑戰(zhàn)。
清華大學交叉信息研究院院長姚期智指出,目前人形機器人還面臨三個發(fā)展問題:首先,機器人還需要像大語言模型一樣擁有一個具身模型,一步到位做好最底層的控制;其次,在計算能力方面,即使是谷歌的Robotic Transformer模型,也只能達到3個赫茲水平,距離真正需要的500個赫茲還有很大差距;此外,機器人多模態(tài)的感官感知融合和數(shù)據(jù)收集方面,還有大量的挑戰(zhàn)和問題。
在AI部分,通用大模型本身并不是給通用人形機器人使用的,即使目前通用大模型已經(jīng)能很好地處理文本或者基本文字邏輯,但是它對環(huán)境的認知和感知能力基本是零,無法認知物理環(huán)境,也沒法抓取做操作,需要新的模型來訓練。
除此之外,硬件性能與成本的平衡也是一大問題。
星動紀元創(chuàng)始人陳建宇表示,對硬件來說,行業(yè)希望機器人同時兼顧力量、速度、精度以及成本,但是目前所有技術(shù)都無法同時兼顧這幾項,例如液壓的技術(shù)速度和力量都很強,但是它成本太貴。
而高減速比諧波技術(shù),可能精度比較高,但是靈巧性又降低;而新的轉(zhuǎn)制期技術(shù)雖然成本比較低,但是卻犧牲了載荷和精度,因此現(xiàn)在還沒有一個能夠兼顧所有達到滿意的情況。
至于“具身智能”真正落地的時間,陳建宇表示,當前人形機器人、通用機器人還處于一個剛剛開始的階段,問題不會很快得以解決,這是比較長期的過程,可能是5-10年,也可能更長。
關(guān)鍵詞: