月4日,在2024世界人工智能大會拍攝的“十八金剛 眾創(chuàng)未來——人形機器人先鋒陣列”( 王翔/攝)
8月21-25日,在北京舉行的2024世界機器人大會上,27款國產(chǎn)人形機器人引發(fā)廣泛關(guān)注。“他們”在大會現(xiàn)場演奏揚琴、潑墨揮毫、比球賽、打辯論、跳“科目三”,賺足了流量。
7月4日,在上海開幕的2024世界人工智能大會(WAIC)上,由15款、18臺人形機器人組成的“十八金剛”陣列,向現(xiàn)場觀眾做出整齊的動作,分外吸睛。國家地方共建人形機器人創(chuàng)新中心的“青龍”、智元機器人的遠(yuǎn)征A2、宇樹科技的Unitree H1、傅利葉的GR-1、達(dá)闥的雙足XR4等國產(chǎn)具身機器人產(chǎn)品紛紛亮相。
7月6日,在2024世界人工智能大會上,人們觀看宇樹科技通用人形機器人Unitree H1表演“科目三”舞蹈(王翔/攝)
“具身智能是人工智能發(fā)展的下一個浪潮。”中國工程院院士、清華大學(xué)信息學(xué)院院長、北京信息科學(xué)與技術(shù)國家研究中心主任、中國人工智能學(xué)會理事長戴瓊海說。
所謂“具身智能”,就是給能理解、推理并與物理世界互動的AI“頭腦”再加上一個“身體”,“身體”可以是手機、汽車、機床、機械臂等等,而完整、逼真的“人形”身體,因?qū)θ祟愑歇毺氐挠H和力、有望實現(xiàn)復(fù)雜功能等特性,被視為AI的一種理想載體,甚至“終極形態(tài)”。這兩年,在大模型高速發(fā)展帶動下,人形機器人產(chǎn)業(yè)迎來風(fēng)口,成為全球科技業(yè)最熱的賽道之一。
2024年8月,美國具身智能公司Figure AI發(fā)布二代人形機器人Figure02。此前,F(xiàn)igure 01已進(jìn)入寶馬工廠工作。國內(nèi),優(yōu)必選的人形機器人Walker S先后走進(jìn)比亞迪、蔚來、東風(fēng)柳汽、極氪等汽車工廠“打工”,智元機器人的人形機器人遠(yuǎn)征A1也在汽車工廠完成底盤裝配和外觀質(zhì)檢等任務(wù)……
“AI大模型將賦能人形機器人走向主動交互,成為繼計算機、智能手機、新能源汽車后的顛覆性產(chǎn)品。”8月13日,十四屆全國政協(xié)常委、工業(yè)和信息化部原副部長、中國電子學(xué)會理事長徐曉蘭在2024世界機器人大會新聞發(fā)布會上說。
越來越“像”人
在位于上海浦東張江科學(xué)城的國家地方共建人形機器人創(chuàng)新中心(以下簡稱“國地中心”)內(nèi),身高185厘米、體重80公斤,擁有多達(dá)43個主動自由度的人形機器人“青龍”雙臂輕展,用五根鋼鐵手指,將面包輕輕捏起。
全球首款全尺寸通用人形機器人開源公版機——“青龍”機器人正在展示(萬宏蕾/攝)
“‘青龍’具有五感能力:能看,能聞,能聽,有觸覺,還有姿態(tài)傳感器。它雙手非常靈活,能精準(zhǔn)抓取兩厘米的小物件,能用工具在小米里挑出芝麻。”國地中心總經(jīng)理許彬告訴《瞭望東方周刊》,“‘青龍’機器人平臺的核心技術(shù)前期經(jīng)過了十余年的沉淀。從國地中心成立到最近在世界人工智能大會上整機亮相,我們團(tuán)隊在短短半年時間內(nèi),厚積薄發(fā),從無到有,實現(xiàn)了突破。”
“端水、抓取,聽起來簡單,做起來復(fù)雜,涉及從感知、決策到控制的多項技術(shù)。”國地中心首席科學(xué)家江磊說,“‘青龍’一條手臂有7個自由度、末端手指有6個自由度,指尖有觸覺傳感器,因此可以完成對抓取的自主判斷。”
“對人形機器人來說,大腦對應(yīng)智能系統(tǒng),小腦對應(yīng)控制系統(tǒng),五官對應(yīng)機器人的感知,執(zhí)行則通過關(guān)節(jié)進(jìn)行。”上海機器人產(chǎn)業(yè)技術(shù)研究院副院長周梅杰說。
“‘青龍’之所以聰明,在于機器人和大模型的深度融合,負(fù)責(zé)人機交互和決策的‘大腦’(朱雀具身大腦大模型)、負(fù)責(zé)穩(wěn)定行走的‘小腦’(玄武小腦模型),共同形成人形機器人的技術(shù)基座。”江磊介紹說,朱雀具身大腦如同一個智能化指揮調(diào)度中心,以多模態(tài)大模型為核心,能夠接收文字信息、圖像信息等多種輸入,并輸出精準(zhǔn)的語音交互以及明智的任務(wù)決策信息;玄武小腦模型側(cè)重于任務(wù)執(zhí)行,其軌跡規(guī)劃模塊采用“端到端”模仿學(xué)習(xí)驅(qū)動的方式。
“在大數(shù)據(jù)、大模型和大算力的支持下,人形機器人正在變得越來越聰慧,逐漸具備自主完成任務(wù)的能力。”徐曉蘭說。
機器人產(chǎn)業(yè)已發(fā)展多年,過去的機器人一般只側(cè)重一個“技能點”,“寫一段代碼做一件事”。比如:一些工業(yè)機器人,主要比“肌肉”,側(cè)重發(fā)展運動控制技術(shù);掃地機器人是否好用,取決于能否規(guī)避障礙,把屋子打掃干凈,主要側(cè)重發(fā)展導(dǎo)航傳感技術(shù)。而人形機器人,要和人一樣有“知行合一”的綜合能力,就要在芯片、傳感器、軟件、人工智能、通信、機械、材料等諸多前沿技術(shù)以及綜合應(yīng)用上實現(xiàn)突破。
“在此輪發(fā)展大模型之前,在機器人‘大腦’層面,技術(shù)上幾乎沒有什么水花,各家推出的模型,基本都只能實現(xiàn)簡單任務(wù)。這兩年,相關(guān)技術(shù)迎來質(zhì)變的拐點。”許彬說,“未來,隨著人形機器人高速‘成長’,其心智或許很快會脫離稚嫩,邁向‘成年人’的賽道。”
“深度學(xué)習(xí)讓人工智能對世界有了感知,大模型則讓人工智能有了自主生成的決策能力。”北京新鼎榮盛資本管理有限公司董事長、創(chuàng)始合伙人張弛說,“不遠(yuǎn)的未來,人形機器人將走向通用和商業(yè)化”。
多城市布局