讓機(jī)器人通過身體認(rèn)知世界
- 來源:中國報(bào)道 smarty:if $article.tag?>
- 關(guān)鍵字:機(jī)器人,認(rèn)知,世界 smarty:/if?>
- 發(fā)布時間:2025-03-29 19:30
當(dāng)前,全球主要經(jīng)濟(jì)體、企業(yè)和研究機(jī)構(gòu)均高度重視具身智能發(fā)展,不斷加大對相關(guān)技術(shù)領(lǐng)域的研究和對商業(yè)化應(yīng)用前景的探索。
文 | 《中國報(bào)道》記者 王焱
2023年5月,在ITF World 2023半導(dǎo)體大會上,英偉達(dá)(NVIDIA)創(chuàng)始人兼首席執(zhí)行官黃仁勛在演講中預(yù)測下一個科技浪潮時,提到了一種新型人工智能——“具身智能”。
在2025年央視春晚的舞臺上,十幾個人形機(jī)器人身著秧歌服、手持紅手帕登上舞臺,與舞蹈演員們默契配合,上演了一場創(chuàng)意融合舞蹈《秧BOT》。它們動作精準(zhǔn)流暢,機(jī)械臂靈活揮舞著手帕,步伐與鼓點(diǎn)完美契合,每一個舞步都充滿科技感,贏得了全國觀眾的喝彩。這些人形機(jī)器人之所以能夠完成如此復(fù)雜精彩的動作,正是得益于具身智能技術(shù)。
什么是“具身智能”?
什么是“具身智能”?一般認(rèn)為,具身智能(Embodied Artificial Intelligence,簡稱“EAI”)是指通過機(jī)器人等物理實(shí)體與環(huán)境交互,能進(jìn)行環(huán)境感知、信息認(rèn)知、自主決策和采取行動,并能夠從經(jīng)驗(yàn)反饋中實(shí)現(xiàn)智能增長和行動自適應(yīng)的智能系統(tǒng)。
“具身”是具身智能的必要前提,但“具身”一詞并不只是“具有身體”,而是指身體會參與認(rèn)知,并影響邏輯判斷的過程。
北京工業(yè)大學(xué)教授、北京智同精密傳動科技有限責(zé)任公司首席科學(xué)家張躍明在接受《中國報(bào)道》記者專訪時舉例說,現(xiàn)在的工業(yè)機(jī)器人具有身體,但它的身體行動完全是由事先編好的程序控制,一步一步去執(zhí)行,只有簡單的邏輯、判斷能力,不能算是具身智能。
與“具身”相對的概念是“離身”,即認(rèn)知與身體分離。ChatGPT就是典型的離身智能。離身智能沒有可以感知世界并與之交互的身體,雖然通過采集的海量數(shù)據(jù)來標(biāo)記世間萬物,卻無法理解這些文本、圖片在物理交互中真實(shí)的意義。當(dāng)需要處理復(fù)雜現(xiàn)實(shí)任務(wù)時,由于缺少對真實(shí)環(huán)境的感知和交互能力,傳統(tǒng)人工智能就很容易發(fā)生誤判。
2021年7月,國外一社交網(wǎng)站用戶分享了一則視頻:他駕駛某款電動車開到一條高速公路時,自動駕駛系統(tǒng)將天空中的滿月錯誤地識別為交通信號燈的黃燈信號,并試圖使原本在高速巡航行駛中的車輛保持減速。
而具身智能則打破了傳統(tǒng)人工智能中“身體”與“大腦”分離的模式,彌補(bǔ)了傳統(tǒng)人工智能對環(huán)境感知和交互能力的不足,使機(jī)器能夠像自然生物體一樣,通過其身體與環(huán)境的互動,實(shí)現(xiàn)多模態(tài)、多尺度的環(huán)境適應(yīng),從而在復(fù)雜環(huán)境中自主決策,完成任務(wù)。
張躍明認(rèn)為,具身智能的發(fā)展方向是使其具有類似人類的主觀判斷能力和邏輯推理能力,不僅可以獨(dú)立完成以往人類才能勝任的任務(wù),還要能與人協(xié)作共同完成任務(wù)。要實(shí)現(xiàn)這種智能,不僅靠算法和計(jì)算,還需要大數(shù)據(jù)的支持和具有學(xué)習(xí)能力。
具身智能機(jī)器人在未知的環(huán)境中執(zhí)行物理任務(wù)時,更多依賴“感知—行動回路”,即先主動感知環(huán)境、對環(huán)境建模,進(jìn)而采取行動、進(jìn)行驗(yàn)證,并根據(jù)結(jié)果不斷調(diào)整和優(yōu)化自身的行動,從而更高效地完成任務(wù)。這個過程很類似人類兒童的學(xué)習(xí)過程。古人講“知行合一”,具身智能的“知”建立在“行”之上,在具身本體與環(huán)境的交互中實(shí)現(xiàn)可持續(xù)的智能進(jìn)化。
被視作未來實(shí)現(xiàn)通用人工智能的
關(guān)鍵路徑
具身智能的概念可以上溯到英國科學(xué)家艾倫·圖靈于1950年發(fā)表的論文《計(jì)算機(jī)器與智能》(Computing Machinery and Intelligence)。此時,距離世界上第一臺通用計(jì)算機(jī)“ENIAC”在美國賓夕法尼亞大學(xué)誕生僅過去4年。當(dāng)時的機(jī)器單純依賴預(yù)設(shè)程序行事,并不具有智能,但圖靈卻在論文中就“機(jī)器能否思考”進(jìn)行了大膽探討。為此,他構(gòu)想了著名的“圖靈測試”,以驗(yàn)證一臺機(jī)器是否具備能模擬人類的智能。
為了讓機(jī)器能夠通過“圖靈測試”,圖靈提出了“學(xué)習(xí)機(jī)器”的概念。他寫道:“與其試圖編程模擬成人大腦,不如模擬兒童大腦。”圖靈提出,通過對“兒童機(jī)器”的教育,讓機(jī)器最終獲得“成人大腦”。
在論文結(jié)尾,圖靈展望了兩條可能的發(fā)展道路:一條是聚焦發(fā)展抽象計(jì)算(比如國際象棋)所需的智能;另一條是購買最先進(jìn)的傳感器,然后教機(jī)器聽說,就像教正常的孩子一樣。后來,前一條道路發(fā)展出了離身智能,而后一條道路被認(rèn)為是具身智能的思想萌芽。
1956年,在美國舉行的達(dá)特茅斯會議正式確立“人工智能”這一術(shù)語。在人工智能發(fā)展初期,研究主要聚焦于抽象的符號處理和邏輯推理,試圖讓計(jì)算機(jī)通過程序模擬人類的智能行為,但這種方式在處理實(shí)際物理世界的復(fù)雜問題時遭遇了困境。
隨著對智能本質(zhì)研究的深入,一些研究者逐漸意識到,在過去的數(shù)億年里,地球上包括人類在內(nèi)的所有動物都是通過身體體驗(yàn)逐步產(chǎn)生智能。因此,身體與環(huán)境的交互在智能發(fā)展中起到了關(guān)鍵作用,具身智能的理念由此逐漸形成。
20世紀(jì)80年代,著名機(jī)器人制造專家羅德尼·布魯克斯提出了行為式機(jī)器人概念,強(qiáng)調(diào)智能是具身化和情境化的,主張應(yīng)當(dāng)以“行為”為核心發(fā)展人工智能,為具身智能概念奠定了理論基礎(chǔ)。羅德尼·布魯克斯還親自設(shè)計(jì)了一個六足步行機(jī)器人,通過簡單的行為模塊組合實(shí)現(xiàn)了穩(wěn)定的行走,展示了具身智能的可行性,引發(fā)了學(xué)界對具身智能的廣泛關(guān)注。此后,有更多學(xué)者進(jìn)一步闡明“具身性”對理解智能本質(zhì)的意義,不斷完善和發(fā)展相關(guān)理論。
進(jìn)入21世紀(jì)后,機(jī)器人技術(shù)、傳感器技術(shù)以及機(jī)器學(xué)習(xí)算法迎來快速發(fā)展,為具身智能帶來新的發(fā)展機(jī)遇。
在機(jī)器人硬件方面,各種類型的機(jī)器人不斷涌現(xiàn),從用于工業(yè)生產(chǎn)的固定基座機(jī)器人,到適應(yīng)復(fù)雜地形的四足和履帶式機(jī)器人,再到模仿人類形態(tài)和行為的人形機(jī)器人,機(jī)器人的性能和功能得到了極大提升。同時,傳感器技術(shù)的進(jìn)步使得機(jī)器人能夠更精確地感知周圍環(huán)境,為其智能決策提供了豐富的數(shù)據(jù)支持。
在軟件算法層面,機(jī)器學(xué)習(xí)尤其是深度神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí))的興起,為具身智能的發(fā)展注入了強(qiáng)大動力。深度神經(jīng)網(wǎng)絡(luò)在圖像識別、語音處理等領(lǐng)域取得的巨大成功,被廣泛應(yīng)用于具身智能系統(tǒng)中,提升了機(jī)器人的感知、學(xué)習(xí)和決策能力。例如,在視覺導(dǎo)航任務(wù)中,基于深度學(xué)習(xí)的算法能夠讓機(jī)器人更準(zhǔn)確地識別環(huán)境特征,規(guī)劃出合理的行動路徑。
近年來,各種大模型的出現(xiàn),進(jìn)一步推動了具身智能的發(fā)展。多模態(tài)大模型能夠融合多種感知信息,使機(jī)器人具備更強(qiáng)大的感知和理解能力;世界模型則幫助機(jī)器人更好地模擬和預(yù)測環(huán)境變化,從而作出更具前瞻性的決策。
目前,具身智能機(jī)器人已經(jīng)能夠根據(jù)動態(tài)變化的環(huán)境進(jìn)行自適應(yīng)決策,并向著能夠完全自主執(zhí)行任務(wù)的技術(shù)方向發(fā)展。具身智能也被視作未來實(shí)現(xiàn)通用人工智能的關(guān)鍵路徑。
具身智能時代到來?
當(dāng)前,全球主要經(jīng)濟(jì)體、企業(yè)和研究機(jī)構(gòu)均高度重視具身智能發(fā)展,不斷加大對相關(guān)技術(shù)領(lǐng)域的研究和對商業(yè)化應(yīng)用前景的探索。
2024年4月,美國高校聯(lián)合發(fā)布2024版《美國機(jī)器人路線圖:機(jī)器人讓明天更美好》,旨在重振美國在機(jī)器人技術(shù)上的領(lǐng)先地位。該路線圖預(yù)測,機(jī)器人有可能在未來10年內(nèi)變得無處不在,并可能在未來數(shù)十年內(nèi)徹底改變?nèi)蚪?jīng)濟(jì)、社會、政治、環(huán)境和技術(shù)格局。
2024年2月,日本豐田研究所公布了一款人形機(jī)器人Punyo。該機(jī)器人的定位是“幫助人們在家中和其他地方完成日常任務(wù)”。因?yàn)橐M(jìn)入復(fù)雜多變的家庭環(huán)境,因此配備了內(nèi)置傳感器的柔軟肢體。
2025年2月,特斯拉首席執(zhí)行官埃隆·馬斯克透露,特斯拉將致力于在2025年生產(chǎn)10000部“擎天柱”人形機(jī)器人。未來其產(chǎn)量還將進(jìn)一步提高。預(yù)計(jì)從2026年開始向第三方售賣。
有消息稱,蘋果公司也正在為其未來的智能家居生態(tài)系統(tǒng)探索人形和非人形機(jī)器人。目前這些產(chǎn)品處于早期概念驗(yàn)證階段,最快可能在2028年或更晚一些實(shí)現(xiàn)量產(chǎn)。
中國已經(jīng)走在具身智能機(jī)器人領(lǐng)域的研發(fā)和應(yīng)用前沿。2025年春晚上人形機(jī)器人的舞蹈,不僅展示了中國在機(jī)器人領(lǐng)域的技術(shù)突破,也標(biāo)志著具身智能進(jìn)入應(yīng)用創(chuàng)新的新階段。這些機(jī)器人走紅的同時,全國各地積極布局具身智能產(chǎn)業(yè)。
2025年1月,北京市發(fā)布《北京具身智能科技創(chuàng)新與產(chǎn)業(yè)培育行動計(jì)劃(2025—2027年)(征求意見稿)》,計(jì)劃培育一批具身智能領(lǐng)域獨(dú)角獸企業(yè)、科技型領(lǐng)軍企業(yè)、國家高新技術(shù)企業(yè)和專精特新“小巨人”企業(yè)。
北京、山東、重慶等十余個省市將具身智能/人形機(jī)器人寫入2025年政府工作報(bào)告,并將其作為推動經(jīng)濟(jì)高質(zhì)量發(fā)展和產(chǎn)業(yè)升級的重要抓手。
據(jù)市場監(jiān)管總局?jǐn)?shù)據(jù)顯示,截至2024年12月底,全國共有45.17萬家智能機(jī)器人產(chǎn)業(yè)企業(yè),注冊資本共計(jì)64445.57億元,企業(yè)數(shù)量較2020年底增長206.73%,較2023年底增長19.39%,呈穩(wěn)健上揚(yáng)態(tài)勢。
人形機(jī)器人:具身智能的最佳載體
位于北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)的國家地方共建具身智能機(jī)器人創(chuàng)新中心(以下簡稱“國創(chuàng)中心”),是中國國內(nèi)最早聚焦于具身智能機(jī)器人核心技術(shù)、產(chǎn)品研發(fā)和應(yīng)用落地的科技企業(yè)之一。
國創(chuàng)中心品牌公關(guān)負(fù)責(zé)人魏嘉星告訴《中國報(bào)道》記者,具身智能機(jī)器人涵蓋多種類型,可以是人形機(jī)器人、固定基座機(jī)器人、輪式機(jī)器人,也可以是履帶式機(jī)器人或者四足機(jī)器人。其中,人形機(jī)器人是具身智能的最佳載體。不同類型具身智能機(jī)器人可以對應(yīng)不同的應(yīng)用場景。比如固定基座機(jī)器人活動范圍受限但操作精度高,適合用于實(shí)驗(yàn)室和工業(yè)制造;履帶式機(jī)器人越野能力強(qiáng),可適用于野外復(fù)雜地形作業(yè);輪式機(jī)器人移動效率高,可以用于巡檢。
國創(chuàng)中心2024年8月發(fā)布的具身智能機(jī)器人“天軼”,就是一款輪式機(jī)器人。“天軼”身高163cm,體重72.5kg,擁有輪式全向移動能力,腿部具備升降功能,可智能適配服務(wù)對象的身高和狀態(tài),配合完整雙臂和胸口大屏,能夠?qū)崿F(xiàn)定位導(dǎo)航、平穩(wěn)移動、自然對話和精細(xì)手臂操作,可應(yīng)用于接待、導(dǎo)覽、咨詢問答、場館介紹等多種場景。通過觀察對象面部動作表情,“天軼”能夠?qū)崿F(xiàn)精確識別人類情感與情緒,進(jìn)行更深層次的智能交互。
目前,國創(chuàng)中心還是將人形機(jī)器人作為具身智能的重點(diǎn)研發(fā)載體。魏嘉星告訴記者,一個原因是人形機(jī)器人能更好地適應(yīng)人類現(xiàn)有的工作和居住場景;另一個原因是,人形機(jī)器人對人類而言更具親和力。
2023年10月20日,工業(yè)和信息化部印發(fā)《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見》,該意見對人形機(jī)器人的發(fā)展作出了全面的戰(zhàn)略部署。如今,作為衡量國家科技創(chuàng)新和高端制造業(yè)水平的重要標(biāo)志,人形機(jī)器人已經(jīng)成為科技競爭的新高地、未來產(chǎn)業(yè)的新賽道。
2024年4月,國創(chuàng)中心發(fā)布了全國首個通用機(jī)器人母平臺“天工1.0 LITE”,實(shí)現(xiàn)了全球首例純電驅(qū)全尺寸人形機(jī)器人的擬人奔跑。同年8月,國創(chuàng)中心發(fā)布了“天工1.1 PRO”。“天工1.1 PRO”擁有完整的手臂功能,身高163cm,體重56kg,具有42個自由度,內(nèi)置多個視覺感知傳感器及六維力傳感器,配備慣性測量單元(IMU)和3D視覺傳感器,每秒可進(jìn)行550萬億次計(jì)算,具有更強(qiáng)的智能交互和任務(wù)執(zhí)行能力。
日前,具身智能機(jī)器人“天工”已在亦莊供電公司10千伏實(shí)訓(xùn)基地高基配電室展開實(shí)地操作。“天工”可在臺階、窄道等地形自如穿梭,手持溫度檢測設(shè)備,對高基配電室的多臺電柜進(jìn)行多點(diǎn)位測溫,執(zhí)行巡檢任務(wù)?;陟`巧的上肢能力,“天工”還可操作復(fù)雜的245母聯(lián)柜,嚴(yán)格按照電力操作規(guī)程操作旋鈕、按鈕,順利完成合閘、分閘等倒閘操作任務(wù)。
魏嘉星表示,作為通用機(jī)器人母平臺,“天工”將持續(xù)進(jìn)行技術(shù)迭代和功能升級,以適應(yīng)更多復(fù)雜場景,服務(wù)于工業(yè)、制造業(yè)、商業(yè)、家庭等多個領(lǐng)域,更好地助力新質(zhì)生產(chǎn)力的發(fā)展。
