服務(wù)熱線
新一輪科技浪潮的推動下,具身智能(Embodied Intelligence, EI)這一智能系統(tǒng)與物理實體相結(jié)合的科技創(chuàng)新產(chǎn)物,正悄然改變著世界。它不僅超越了單純的技術(shù)革命范疇,更預(yù)示著未來對人類生活方式、制造模式乃至社會結(jié)構(gòu)都將帶來一次深刻的重塑。
據(jù)不完全統(tǒng)計,僅2024年上半年,關(guān)于具身智能的研討已多達500余次。來自不同領(lǐng)域的行業(yè)精英、產(chǎn)業(yè)高管、高校學者,都在試圖找到具身智能技術(shù)進化的規(guī)律性與確定性。
盡管從2020年以來,斯坦福、伯克利、MIT、CMU、谷歌、微軟、亞馬遜、OpenAI、英偉達等眾多學者與企業(yè)家,對該領(lǐng)域的進化路徑孜孜以求。但至今尚未找到機器人或具身智能的通用大模型Scaling Law。
盡管訓練參數(shù)還在“無限”增加,這一現(xiàn)狀甚至不可避免地導致算力需要“無限”增加,能源也需要“無限”增加,相關(guān)大模型的單次訓練成本已經(jīng)少則1千萬美元,多則接近上億美元。但大力并沒有出奇跡,諸如功能、安全、質(zhì)量以及實時性等關(guān)鍵指標并沒有明顯提高。
一種對技術(shù)與供應(yīng)鏈迭代的“無力感”,在業(yè)界蔓延。7月22日,馬斯克在推特上宣布,特斯拉Optimus人形機器人二代因未能獲得高性價比的成熟供應(yīng)鏈支持,而推遲發(fā)布。據(jù)悉,這代機器人將自主設(shè)計全新雙手、FSD芯片等核心零部件,以便提高30%的行走速度、減輕10kg的重量,并將成本控制在1萬美元,售價控制在2萬美元左右。但供應(yīng)鏈因素直接導致了馬斯克的夢想,被延遲實現(xiàn)。
在中國,人形機器人也是熱鬧非凡,一級市場可落地產(chǎn)品尚待成熟,二級市場卻已率先上揚;人形樣機尚未明確具體的應(yīng)用場景,量產(chǎn)之路也大受供應(yīng)鏈掣肘,人形機器人的價格戰(zhàn)卻已打響。此外,隨著7月武漢蘿卜無人出租車在指定區(qū)域以低速模式嘗試商業(yè)化短途打車服務(wù),人們開始對未來社會的就業(yè)問題產(chǎn)生擔憂。
在這樣的背景下,“2024科技創(chuàng)變者大會”即將開啟。政產(chǎn)學研金多方力量的匯聚與助力,推動了這次大會的籌備工作。在此我由衷地感謝北京市科委、中關(guān)村管委會各位領(lǐng)導的鼎力支持,還有海淀區(qū)、中關(guān)村科學城管委會以及東升鎮(zhèn)領(lǐng)導的竭力相助,感謝參與并貢獻智慧的各位知名大學院所頂級專家、奮斗在科研一線的青年科學家、大廠杰出的企業(yè)家、資深投資人、獨角獸企業(yè)的CEO以及初創(chuàng)企業(yè)的創(chuàng)變者們。
8月8日,期待與各界精英在北京中關(guān)村東升科技園萬麗酒店相聚一堂,聚焦《具身智能 產(chǎn)業(yè)智變新引擎》這一主題,圍繞具身智能如何實現(xiàn)高質(zhì)量發(fā)展并探索出一條有效的進化路徑展開深入探討。以下為本次大會的核心議題與前置性思考:
什么是具身智能?它是未來社會的長期剛性需求嗎?它是推動新質(zhì)生產(chǎn)力的重要引擎嗎?
沿著熱潮的方向出發(fā),你會發(fā)現(xiàn),當下幾乎所有的困惑與糾結(jié)都聚焦在人形機器人身上。這個“笨手笨腳的家伙”距離能力爆發(fā)到底還要多久?人類還有沒有超級場景留給它?未來,真如馬斯克所言,全球?qū)⒂?00億臺套人形機器人的市場嗎?也許,將視野打開,答案也躍然紙上了。
我想,擁有智慧大腦的人形機器人,固然是具身智能的一種形態(tài)。但是具身智能并不局限于“AI+人形機器人”這一范疇,它同樣涵蓋“AI+通用機器人結(jié)構(gòu)”、“AI+高端制造裝備”等多種形式。
自1950年圖靈在其論文《計算機器與智能》中提出“非具身或具身智能”概念以來,具身智能這一概念逐漸被廣義理解為:智能系統(tǒng)通過物理實體(機器人、無人機、無人車、制造裝備甚至各類終端設(shè)備等)與環(huán)境互動時所展現(xiàn)的一種智能能力。簡單理解,具身智能是生成式AIGC與機器人RT的融合,通過人機或環(huán)境交互,基于底層模型與數(shù)據(jù)驅(qū)動的離線或在線感知學習、認知判斷、智能控制等技術(shù),提升智能機器在本體層、環(huán)境層、任務(wù)層的人機交互、決策推理及操作行動等智能化水平,并增強其適應(yīng)不同環(huán)境的泛化能力。
而具身智能突出的特點主要體現(xiàn)在兩個方面:一方面,它具備人機交互、自然語言理解與認知能力,通過機器學習或大模型,讓機器按照人的意圖,將目標分解系列化的子目標或思維鏈,以完成相應(yīng)的復(fù)雜任務(wù);另一方面,具身智能可通過感知、認知、決策,與時變環(huán)境及對象進行實時校準互動,在非結(jié)構(gòu)化的復(fù)雜環(huán)境中,它能夠?qū)崟r在線學習、識辨或修正補償時變環(huán)境。由此看來,只要把感知、學習、判斷和認知能力有效嵌入到任何形態(tài)的硬件中,都可以被視為廣義上的具身智能。
將具身智能落地到服務(wù)、制造、商務(wù)等多元化的場景中,面對錯綜復(fù)雜的動態(tài)環(huán)境,我們進而發(fā)現(xiàn)具身智能以其自主感知、快速決策、行動與學習迭代的技術(shù)能力,展現(xiàn)出前所未有的靈活性和適應(yīng)性潛力。這不僅有望為傳統(tǒng)工業(yè)帶來新一輪革命性影響,更是未來社會的長期剛性需求。
在這個“布局未來”的過程中,具身智能領(lǐng)域的企業(yè)百花齊放,他們各自在奮斗與攻克中展現(xiàn)獨特風采。有的專注于人形機器人的研發(fā),力求在人機交互、情感識別等方面取得突破;有的則深耕于高端制造裝備領(lǐng)域,通過優(yōu)化算法、提升精度和效率,推動制造業(yè)的智能化升級。
從無人快遞車,到無人外賣車,再到如今的蘿卜快跑;從智能家電,到智能家居,再到智慧城市;從智能裝備,到智能制造,再到柔性供應(yīng)鏈……實際上,具身智能已經(jīng)潛移默化的深入到人類社會的方方面面。
但未來,隨著社會發(fā)展的不斷演進,一系列趨勢性變化凸顯了具身智能的長期剛性需求。由于人們不愿意從事單獨枯燥繁重甚至危險勞動,同時智慧城市人口在不斷增加,這對工業(yè)制造的效率要求越來越高,社會化智能服務(wù)更是期待著更加便捷的模式出現(xiàn)。此外,老齡化社會的加劇將引發(fā)更為迫切的康養(yǎng)需求,搶險救災(zāi)等高風險工作也亟待智能化的解決方案。從這樣的必然趨勢看,具身智能是長期的剛性需求。未來在工業(yè)制造、商業(yè)服務(wù)、家庭服務(wù)甚至國防軍事等方面,將具有廣泛的應(yīng)用市場。
基于上述分析,我愈發(fā)認定:具身智能將成為未來新質(zhì)生產(chǎn)力的一個重要引擎。其將AIGC+RT兩者結(jié)合,極大的推動了機器人、制造裝備、智能終端以及其大腦的進一步進化、泛化與遷移,有望將“一腦多機”與“一腦多型”的技術(shù)創(chuàng)想變?yōu)楝F(xiàn)實。我們相信,語言“認知”世界,具身智能工具“改造”世界!它終將改變?nèi)?、工具、社會三者之間的生產(chǎn)關(guān)系,極大提高生產(chǎn)力效率,這一變革不僅對促進我國實體經(jīng)濟的高質(zhì)量增長發(fā)揮作用,更將對未來國際產(chǎn)業(yè)競爭格局與我國綜合新質(zhì)生產(chǎn)力的發(fā)展產(chǎn)生重大影響。
具身智能百花齊放,創(chuàng)新的熱點方向又有哪些?
盡管大模型在通用性和知識覆蓋廣度上擁有優(yōu)勢,但其泛化能力在某些特定場景的局限性依舊存在。疊加經(jīng)濟性、落地性等一系列現(xiàn)實問題,行業(yè)走向了多模態(tài)、專業(yè)化、輕量化的探索之路。
圍繞這些方面,近期領(lǐng)域內(nèi)的研究取得了多項引人注目的進展。在法國,Mistral模型以70億參數(shù)擊敗了擁有130億參數(shù)的LLama模型,展示了參數(shù)效率的提升;在中國,面壁智能的MiniCPM模型以僅24億參數(shù)就達到了接近1750億參數(shù)GPT-3的性能水平,其背后的首席科學家——清華大學劉知遠教授,更是提出“知識密度=模型能力/模型參數(shù)”的創(chuàng)新概念,強調(diào)模型效率的重要性。
此外,年輕科學家馬毅教授預(yù)告將在斯坦福大學主持召開“簡約與學習”的學術(shù)會議,聚焦于低維結(jié)構(gòu)的研究,這進一步推動AI模型向更加精簡、高效的方向發(fā)展。
而在7月30日的SIGGRAPH大會上,黃仁勛與扎克伯格的對話也聚焦于小模型或分段模型的應(yīng)用前景上。黃仁勛不僅展示了英偉達在具身智能領(lǐng)域的布局,還透露了由90后華人博士Jim Fan領(lǐng)導的具身智能實驗室的研究成果:基于定義具身智能結(jié)構(gòu),感知環(huán)境、潛在學習完成技能等相互嵌入的動態(tài)Agents思路。
另一方面,7月25日,斯坦福大學計算機系的李飛飛教授在短短三個月內(nèi)就完成了一個AI獨角獸企業(yè)的誕生,該企業(yè)利用“三維空間智能技”實現(xiàn)了機器對環(huán)境的理解與導航能力,通過模擬貓與桌子上玻璃杯等物體的空間、幾何及關(guān)系作用,探索了機器“看”與“做”的良性閉環(huán)。
7月29日,騰訊RoboticsX實驗室張正友團隊在《自然機器智能》(Nature子刊)封面發(fā)表了重要研究成果,該團隊成功將生成式AI-Agent嵌入機器人智能控制系統(tǒng)中。在本體、環(huán)境、任務(wù)三個層面中,通過快速系統(tǒng)1處理90%的簡約感知、認知和行動決策,同時利用復(fù)雜認知慢系統(tǒng)2進行知識學習、歸納、推理及決策,實現(xiàn)了機器在本體、環(huán)境和任務(wù)三個層次上的高效協(xié)同。
伴隨著具身智能的發(fā)展,科學家們對規(guī)律的渴求還遠不止于此。目前,盡管任務(wù)規(guī)劃的Scaling Law已有一定進展,但環(huán)境空間和操作本體的Scaling Law仍處于探索階段。是堅定不移?還是轉(zhuǎn)變路徑?雖沒有絕對答案,但我堅信中國的工程師紅利即將在其中發(fā)揮作用。
甚至在不久的將來(3-5年),我們是不是就將見證一個全新的智能時代到來呢?那時候,API免費,AI服務(wù)80%由機器完成,20%通過人工對齊完成,通用的AI服務(wù)或產(chǎn)品會不會就像水、電、煤氣等基礎(chǔ)設(shè)施一樣,無處不在,觸手可得?當終端客戶已經(jīng)不知道他所獲得的咨詢與解決方案來自哪個具體大模型公司時,這又會引發(fā)科技創(chuàng)新領(lǐng)域中怎樣的連鎖反應(yīng)呢?
如今,科技創(chuàng)新的浪潮以前所未有的速度席卷全球,顯著縮短了從科研探索到商業(yè)應(yīng)用的周期。昔日需數(shù)十載方能達成的技術(shù)飛躍,如今幾年間甚至更短便能觸手可及。科技創(chuàng)新的加速,不僅體現(xiàn)在時間維度上,更體現(xiàn)在探索的深度與覆蓋的廣度上。當多學科交叉融合成為新常態(tài),基礎(chǔ)科學、工程技術(shù)、經(jīng)濟學及人文社科等領(lǐng)域的深度融合,構(gòu)建了一個多元共生、相互推動的創(chuàng)新生態(tài),驅(qū)動著科技與產(chǎn)業(yè)不斷向前躍進。新技術(shù)、新業(yè)態(tài)、新模式不斷涌現(xiàn),不僅為傳統(tǒng)產(chǎn)業(yè)注入創(chuàng)新活力,同時也催生了一批高技術(shù)含量、高附加值、高成長性的新興產(chǎn)業(yè),成為推動未來經(jīng)濟發(fā)展的新引擎。
與此同時,市場快速變化與競爭也在日益激烈。面對挑戰(zhàn),小微企業(yè)需要聚焦于細分領(lǐng)域,深耕細作,以“專精特新”為路徑,鍛造核心競爭力;而大型企業(yè)則可依托資源優(yōu)勢,構(gòu)建平臺型或鏈主型生態(tài)系統(tǒng),整合上下游資源,實現(xiàn)規(guī)模效應(yīng)與協(xié)同效應(yīng)的雙贏,穩(wěn)固市場領(lǐng)先地位。
另一方面,具身智能領(lǐng)域的“行業(yè)依附性”特點,又將深入挖掘應(yīng)用場景的價值提到了更重要的位置上。技術(shù)創(chuàng)新,只有與產(chǎn)業(yè)需求緊密結(jié)合,才能推動具身智能產(chǎn)品的不斷升級。這一過程不僅是技術(shù)的精進,更是對市場需求的精準把握與快速響應(yīng)。同時,具身智能形態(tài)作為未來發(fā)展的重要趨勢,其確立對于企業(yè)的長遠發(fā)展具有關(guān)鍵意義。通過場景資源、融資資源等多方資源的交叉融合與螺旋式迭代發(fā)展,方能避免“醒得早,起得晚”的遺憾,防止在時代的洪流中被邊緣化甚至淘汰。
回望歷史長河,每一次科技的里程碑式突破,都無可避免地伴隨著質(zhì)疑的眼光和挑戰(zhàn)的洗禮。數(shù)百年前,世界第一艘輪船“克萊蒙特號”在眾人懷疑的目光中入水,它搖搖晃晃地模樣仿佛隨時都會淪為笑柄。然而,正是這份“不在乎他人眼光”的探索精神,讓人類得以跨越海洋的阻隔。
在眼前的具身智能浪潮中,顛覆傳統(tǒng)、重塑未來的歷史再次上演。我無比相信:擁抱變革,穿越周期,堅定信念的創(chuàng)變者們,終將是這次浪潮的贏家!
讓我們懷揣著對具身智能的美好期待,在8月8日的“2024科技創(chuàng)變者大會”上,不見不散。