一区二区欧美日韩专区-久久亚洲综合九九-国产精品福利片一区二区在线观看-国产毛片一区高清完整视频

對話智元合伙人姚卯青:具身智能淘汰賽即將開啟|界面新聞 · 科技

對話智元合伙人姚卯青:具身智能淘汰賽即將開啟|界面新聞 · 科技

nanyao 2025-05-11 京東 46 次瀏覽 0個評論

界面新聞記者 | 李如嘉

界面新聞編輯 | 文姝琪

在智元位于上海張江機(jī)器人谷的數(shù)采工廠里,采集人員正在操縱機(jī)械臂完成數(shù)據(jù)采集。從夾取各類物品,到鏟貓砂、晾衣服,工廠里設(shè)置了多個細(xì)分場景,每隔一段時間就會進(jìn)行更換。去年,智元數(shù)采工廠采集了100萬條數(shù)據(jù),今年希望能有1000萬條數(shù)據(jù)產(chǎn)出。

對話智元合伙人姚卯青:具身智能淘汰賽即將開啟|界面新聞 · 科技

在姚卯青的構(gòu)想下,如果能夠有一億條真機(jī)數(shù)據(jù),機(jī)器人就可以達(dá)到類比ChatGPT-3的智商,與常見物品、設(shè)備互動,并與人類進(jìn)行簡單交互。

姚卯青畢業(yè)于清華大學(xué)電子工程系,曾在Waymo、蔚來汽車等任職。2024年,他加入智元,擔(dān)任合伙人、具身業(yè)務(wù)部總裁、具身研究院執(zhí)行院長,負(fù)責(zé)AI技術(shù)開發(fā)及軟件研發(fā)工作。

成立于2023年的智元機(jī)器人,是目前中國估值最高的具身智能企業(yè),最新估值達(dá)150億,融資方有紅杉中國、高瓴等投資機(jī)構(gòu),也有上汽、比亞迪等車企,以及騰訊這樣的大廠。

作為曾經(jīng)的智能駕駛從業(yè)者,姚卯青認(rèn)為,與智能駕駛相比,具身智能雖然在硬件系統(tǒng)架構(gòu)上非常類似,但在技術(shù)、場景和應(yīng)用等方面都有更大的想象空間,大模型的突破則讓大家看到了具身智能成功大規(guī)模落地的可能性。

對話智元合伙人姚卯青:具身智能淘汰賽即將開啟|界面新聞 · 科技

他提到,具身智能真正的壁壘在于操控和大腦。而要完成這些,需要大量數(shù)據(jù),這也是智元成立數(shù)采工廠的原因。他的樂觀估計是,再需要五年,機(jī)器人或許就可以進(jìn)入家庭,而在第一階段,工廠仍是具身智能最大的需求方。

“機(jī)器人不是大模型,最終還是要拼硬件、拼制造。”姚卯青在采訪中還表示,在機(jī)器人實際落地中,管好一萬多個零件的供應(yīng)鏈,實現(xiàn)規(guī)?;慨a(chǎn)是一大難關(guān)。截至目前,智元已量產(chǎn)下線1000臺機(jī)器人,今年的出貨計劃保持在數(shù)千臺。

在他看來,主流資本已經(jīng)站好隊,留給新成立的公司的機(jī)會已經(jīng)不多,目前牌桌上的玩家要做的就是在更快的創(chuàng)業(yè)節(jié)奏下,做差異化,做量產(chǎn)和商業(yè)閉環(huán)。

對話智元合伙人姚卯青:具身智能淘汰賽即將開啟|界面新聞 · 科技
智元機(jī)器人合伙人、具身業(yè)務(wù)部總裁、具身研究院執(zhí)行院長 姚卯青

以下是界面新聞與智元機(jī)器人合伙人姚卯青的采訪,略經(jīng)編輯:

大模型讓具身智能的成功初見端倪

界面新聞:你之前在Waymo、蔚來,都是在做智能駕駛,為什么會選擇切入機(jī)器人賽道?

姚卯青:現(xiàn)在這么多人從智駕切換到機(jī)器人賽道,我可以說是最早做出這個選擇的。大部分人都是從去年下半年到今年上半年才集中開始換賽道,我在2023年就已經(jīng)看到具身智能這個新生事物的潛力和想象力,2024年上半年正式開始做機(jī)器人。

在機(jī)器人之前,我也嘗試過智能駕駛的創(chuàng)業(yè),現(xiàn)在比較火的一段式端到端,我在2023年上半年就已經(jīng)著手在做。但當(dāng)時在找融資的時候,就發(fā)現(xiàn)投資人會覺得自動駕駛好像已經(jīng)沒那么性感了。智能駕駛發(fā)展到現(xiàn)在,可以實現(xiàn)的功能還比較有限,商業(yè)模式也比較趨同,最終還是作為供應(yīng)商的角色和車企打交道,生存空間也很有限。當(dāng)時也有人建議我來做機(jī)器人,在了解之后,我覺得它的想象空間會更大。

界面新聞:你當(dāng)時覺得轉(zhuǎn)型具身智能的機(jī)會點在哪里?

姚卯青:智能駕駛和機(jī)器人從硬件系統(tǒng)的架構(gòu)來講是極其相似的,尤其是在電子電器和傳感器這一層具體的控制器、執(zhí)行器可能不一樣但是從域控制器以上的維度來講,兩者的系統(tǒng)架構(gòu)是高度一致的。所以很多過去在智能駕駛工程上、資源上的積累,其實都可以直接復(fù)制過來。

但從技術(shù)上來說,具身智能更適合做大模型。智能駕駛現(xiàn)在所謂端到端的這些模型,其實都還是小模型。也不是說因為技術(shù)能力不足做不了大模型,而是智能駕駛本身的特點就是低延時、高速、安全要求極高,不能讓推理慢且存在幻覺的系統(tǒng)來控制車輛,這是不可能通過安全測試的,所以大家也只能講講概念。但在機(jī)器人上,像現(xiàn)在我們外面跑的一些算法已經(jīng)是大模型,雖然沒有到幾千億參數(shù),也有幾十億參數(shù)。

界面新聞:所以大模型這波熱潮也讓你對具身智能更有信心?

姚卯青:對,大模型首先確實是一個劃時代的東西有了大模型,在2023年具身智能發(fā)展早期,谷歌RT-X等幾份工作給大家看到了一個新的范式,機(jī)器人不用再分模塊去做感知、規(guī)劃與控制,用一個大模型就可以端到端地解決這一整套系統(tǒng)。

智能駕駛是讓車從一個結(jié)構(gòu)化的道路從A點走到B點,場景是可預(yù)期的,地上有哪些線、哪些交通燈,包括交通規(guī)則也是制定好的。但大家對機(jī)器人的想象是和人類一樣的存在,可以在開放世界里執(zhí)行任意任務(wù)。原來為自動駕駛這樣專用功能設(shè)計的系統(tǒng)是無法適用于這種通用智能的,是大模型的出現(xiàn)讓大家看到了一些成功的端倪。

界面新聞:轉(zhuǎn)型后為什么選擇加入智元,你覺得智元和其他公司有什么不一樣?

姚卯青:我當(dāng)時看過很多具身智能的創(chuàng)業(yè)公司,其實最初也沒有特別關(guān)注到智元。后來也是有投資人介紹,交流了幾次發(fā)現(xiàn),首先智元確實資金比較充足。不得不承認(rèn),資金是最重要的事情。無論是自動駕駛、大模型,還是具身智能,做這些大賽道,前提就是要有錢。其次智元是有規(guī)劃的,要拿這些錢來堅定投入AI。

雖然整個行業(yè)現(xiàn)在還很早期,但從終局來看,AI能力是必備的,否則機(jī)器人就沒有任何用處。雖然算力、算法工程師、數(shù)據(jù)這些都很貴,但當(dāng)時智元已經(jīng)決定一年要用500臺機(jī)器人去采數(shù)據(jù)、做大模型。雖然當(dāng)時已經(jīng)有十幾億融資,一年投入這么多在這方面也是風(fēng)險很大的事情,我覺得這是很難的一個決定。

其次智元整個團(tuán)隊也更加成熟。做公司只有學(xué)術(shù)是不夠的,創(chuàng)業(yè)不只是要做科研,還要做生產(chǎn)制造、采購、供應(yīng)鏈管理,產(chǎn)品、市場銷售戰(zhàn)略、政府關(guān)系、投融資等等,需要非常綜合的能力。尤其機(jī)器人也不是大模型,最終還是要拼硬件、拼制造。現(xiàn)在機(jī)器人制造還在一個很初期的階段,要在產(chǎn)業(yè)鏈很不成熟的情況下,帶著供應(yīng)鏈慢慢成長,做出一個穩(wěn)定可量產(chǎn)的產(chǎn)品,你的團(tuán)隊要足夠成熟和完整

一億條數(shù)據(jù)和五年

界面新聞:剛才提到的大模型主要是在機(jī)器人大腦方面的進(jìn)步。在本體和小腦方面,最近有一些比較大的進(jìn)展嗎?

姚卯青:本體的話,我覺得重點還是要看誰的作業(yè)能力進(jìn)展比較快。運動能力雖然比較博眼球,但對ToB(企業(yè))客戶來說,做demo、展示極限運動能力這些意義不是很大,他們關(guān)心的還是機(jī)器人的負(fù)載、速率、穩(wěn)定性等等,能不能去完成工廠里一些復(fù)雜的、靈巧的,現(xiàn)在需要大量的工人去完成的事情。比如蘋果這種代工廠,全球有幾十萬工人,這對它們是巨大的負(fù)擔(dān)。未來工廠可能每年都有削減5%-10%工人數(shù)量的指標(biāo)要求,這就是具身智能第一階段最大的需求方,去做這些傳統(tǒng)工業(yè)自動化做不到的事情。

界面新聞:你覺得現(xiàn)在市面上的這些做機(jī)器人本體和小腦運動控制的公司,他們之間有很大壁壘嗎?

姚卯青:我覺得確實不存在太高的壁壘?,F(xiàn)在即使估值沒那么高,人員沒那么多的公司,做出的demo也完全不輸一些大一些的公司。只要是1.3米左右的機(jī)器人,結(jié)合模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)算法,完全可以去拍一拍demo視頻。

界面新聞:那真正的壁壘在哪里呢?

姚卯青:真正的壁壘肯定在“manipulation”(操控)上,通過操作去完成任務(wù)。因為它要求的精度很高,是更加復(fù)雜的一套組合操作。走路這種能力其實是固定模式的重復(fù)運動,但去完成一個操作任務(wù),涉及到跟物體的交互,還要深度規(guī)劃、組合各種技能。在這個過程中,和機(jī)器人交互的物體也在隨著作用力改變狀態(tài),機(jī)器人要去動態(tài)閉環(huán)地完成這個任務(wù)。

讓機(jī)器人翻跟頭,跳起來把自己扔到空中,其實只需要很短的時間,視頻拍十次有一次成功就好了,這些都屬于開環(huán)任務(wù)。但像倒水就是一個閉環(huán)的任務(wù),機(jī)器人要決定什么時候要倒?jié)M了,什么時候該停下。

界面新聞:那想要完成操控的部分,背后需要做一些什么事情?

姚卯青:需要采集大量的數(shù)據(jù)。在采集過程中,一是要學(xué)會這種物理規(guī)律,二是學(xué)會操作時候的接觸位置,三是要學(xué)會操作的技術(shù)。

我們認(rèn)為,采集到一億條數(shù)據(jù)以后,機(jī)器人應(yīng)該可以達(dá)到Chat GPT3的智商。去年我們的數(shù)采工廠采集了100萬數(shù)據(jù),今年希望能夠有1000萬數(shù)據(jù)產(chǎn)出來。

界面新聞:數(shù)據(jù)采集的動作精細(xì)度要求也很高,耗時長。這樣采下去的話,1億條數(shù)據(jù)似乎遙遙無期。

姚卯青:其實也還好,因為進(jìn)行數(shù)據(jù)采集的機(jī)器人數(shù)量還可以增大。如果用1000臺機(jī)器人進(jìn)行規(guī)?;杉?億條數(shù)據(jù)可能一年時間就能采夠了。

界面新聞:機(jī)器人有Chat GPT3的智商是什么效果?

姚卯青:比如二指夾爪的機(jī)器人,可以做到對于常見的物品的抓放、擺布、推拉,操作一些常見設(shè)備,也可以和人做一些交互。人通過語言指令的形式,可以讓機(jī)器人在環(huán)境中去理解、定位,完成相應(yīng)動作。

界面新聞:具身智能的商業(yè)化什么時候能到來?

姚卯青:今年應(yīng)該可以出現(xiàn)局部的一些商業(yè)化場景,包括我們內(nèi)部就已經(jīng)在做一些工業(yè)和商業(yè)場景。

界面新聞:你也提到過,五年之后機(jī)器會進(jìn)入家庭,這個五年是怎么估算的?

姚卯青:一個是數(shù)據(jù)量,我覺得五年就能收集得差不多。另一個是回過頭看大語言模型的話,從2020年左右GPT 2讓大家有了耳目一新的感覺之后,到現(xiàn)在成為一個成熟的產(chǎn)品,甚至現(xiàn)在一些agent能調(diào)用各種應(yīng)用幫你完成任務(wù),這個周期是五年。那類比到機(jī)器人,現(xiàn)在它開始蹣跚學(xué)步,可以去顫顫巍巍幫你抓一些東西,已經(jīng)是一種初期端到端的系統(tǒng)了,而不是寫規(guī)則,用模塊化的方法搞感知規(guī)控,技術(shù)的發(fā)展會不斷加速,我覺得五年的時間是可以暢想一下的。

從demo到量產(chǎn),管好一萬多個零件的供應(yīng)鏈

界面新聞:你剛才提到機(jī)器人和大模型不一樣,最終還是要拼制造?,F(xiàn)在很多具身智能公司都選擇自己做工廠、做供應(yīng)鏈,建工廠這件事難在哪里呢?

姚卯青:你要管好機(jī)器人的這一萬多個零件。首先供應(yīng)鏈管理不僅僅是說砍價的能力,雖然砍價也重要,但你沒有量,人家都不會搭理你,不會去給你做定制。其次要保證質(zhì)量,造1000臺機(jī)器人,做到一致其實是很難的。因為機(jī)器人的控制最主要就是在一些動力參數(shù),像螺絲和結(jié)構(gòu)件這種零部件有誤差,就會嚴(yán)重影響到動力學(xué)模型。還有可靠性,能保證終生壽命維持在幾萬小時,或者核心零部件能保證十萬小時、一百萬小時的運行。

我們在做的時候,前期其實踩了很多這方面的坑。你以為這些參數(shù)設(shè)定好了,找人打樣就行,以為是和汽車一樣有很成熟的供應(yīng)鏈,最后發(fā)現(xiàn)這些供應(yīng)商都太初期了,經(jīng)常干著干著都想自己來做,但作為一個小公司,其實不應(yīng)該什么都自己做,還是要帶著他們成長。

界面新聞:智元現(xiàn)在自己干的部分能有多少呢?

姚卯青:核心的關(guān)節(jié),還有電路板這些硬件我們會自己設(shè)計,剩下我們更多想做系統(tǒng)的方案設(shè)計和集成。

界面新聞:智元前幾天已經(jīng)開了第一屆供應(yīng)商大會,這對一個初創(chuàng)公司來說也不是很常見。

姚卯青:確實現(xiàn)在已經(jīng)用到了上百個供應(yīng)商,我們需要通過供應(yīng)商大會總結(jié)一下過去一年的量產(chǎn)成果和成績,更重要是對齊我們今年更大的目標(biāo),讓他們提前在質(zhì)量和產(chǎn)能的規(guī)劃上能夠跟上我們。

界面新聞:今年的目標(biāo)是什么?

姚卯青:我們自己的規(guī)劃是今年有數(shù)千臺機(jī)器人量產(chǎn)下線,應(yīng)該是全球來講最大數(shù)量了。我們的優(yōu)勢就在比別人量產(chǎn)的早一些,早踩過一些坑。在量產(chǎn)規(guī)模比較大的情況下,對供應(yīng)鏈才有真正的掌控能力。一方面量大了在開模這些成本上可以分?jǐn)偅刂瞥杀?,另一方面也有更大話語權(quán),對各種工藝、測試、質(zhì)量標(biāo)準(zhǔn)都能提出自己的規(guī)范。

更快的創(chuàng)業(yè)節(jié)奏下,淘汰賽即將開啟

界面新聞:我們談具身智能經(jīng)常會談到兩個其他行業(yè)——大模型,還有自動駕駛。你覺得和這兩個行業(yè)相比,具身智能的創(chuàng)業(yè)節(jié)奏有明顯加快嗎?比如市場會很早就要求看到商業(yè)化的結(jié)果。

姚卯青:確實有感覺到。大模型大家搞了一年才發(fā)現(xiàn)不能商業(yè)閉環(huán),對具身智能就會有一些杯弓蛇影的情況。和自動駕駛那時候比的話,因為10年前有美元基金,還是存在耐心資本的,現(xiàn)在就少一些。

界面新聞:你會擔(dān)心具身智能也像自動駕駛一樣,剛開始期望很高,但發(fā)展了10年也沒能大規(guī)模落地嗎?

姚卯青:技術(shù)的發(fā)展肯定是有不確定性,說不擔(dān)心是假的。今天沒有人敢說五年后機(jī)器人就和人一樣,什么都會、什么都懂,運控和操作能力做的都很完美。但我相信在一些細(xì)分領(lǐng)域,它一定比自動駕駛有更大的機(jī)會去先實現(xiàn)商業(yè)落地。本質(zhì)上還是因為車是一個功能已經(jīng)被定義好的明確形態(tài),對安全性和效率的要求非常高,但機(jī)器人的應(yīng)用場景更廣,總能找到一些適合的場景先落地。

界面新聞:整體創(chuàng)業(yè)節(jié)奏的加快會對企業(yè)帶來一些壓力嗎?

姚卯青:肯定是會的。所以明顯能感覺到中國的具身智能公司和美國是很不一樣的氛圍。美國頭部公司可以不斷去融資、做研究,完全不想商業(yè)化的事,按照OpenAI的路徑走。OpenAI這種燒了這么多錢,還沒有盈利的公司在當(dāng)下的創(chuàng)業(yè)環(huán)境中是很難存活下來的。

界面新聞:中美之間具身智能公司在估值上也有差距嗎?

姚卯青:中國美國差太多了。我們的能力應(yīng)該和美國頭部的人形機(jī)器人團(tuán)隊相當(dāng),但在硅谷的估值體系下,美國公司的估值確實比國內(nèi)高很多。

界面新聞:你會不會覺得大家對中國公司的要求太高,又太卷了?

姚卯青:中國公司就是太卷了。

界面新聞:認(rèn)為未來中美在具身智能賽道上會是怎樣的競爭關(guān)系?

姚卯青:我覺得一定是中國公司勝出。因為機(jī)器人就是一個硬件制造業(yè),你看新能源汽車、無人機(jī)現(xiàn)在已經(jīng)沒有美國什么事情了,這個只是歷史的反復(fù)上演而已而且美國的制造業(yè)是越來越弱的,加上中國的產(chǎn)業(yè)鏈和高素質(zhì)的工程師學(xué)者越來越多,這是一個此消彼長、差距越來越大的一個過程。

界面新聞:你們怎么看這個大廠未來可能下場做具身智能這件事情?特別是騰訊也投了你們,上汽、比亞迪都在投你們,未來會不會被他們收購?

姚卯青:收購肯定不可能的,在中國這個市場里面不存在估值100 多億公司被收購。我們肯定是要去上市,但上市不是我們的終極目的,是為了支撐我們實現(xiàn)我們的長期愿景。大廠來做機(jī)器人的話,和大模型不同,大的互聯(lián)網(wǎng)公司不太會做硬件,包括字節(jié)也明確說自己不會去看硬件這些重資產(chǎn)的東西。

未來我覺得具身智能賽道肯定也不會只有我們一家活下來,但是估計現(xiàn)在這么多創(chuàng)業(yè)公司也就會剩下兩三家,因為主流的資本都已經(jīng)站隊了,新出來的創(chuàng)業(yè)項目持續(xù)融資的難度會大不少。

界面新聞:這意味著現(xiàn)在具身智能賽道開始進(jìn)入一個冷靜期了嗎?

姚卯青:肯定是開始會進(jìn)入收斂,然后一些同質(zhì)化的公司拿錢就會越來越,或者只能拿個一輪兩輪。到后面大家如果沒有差異化東西出來,也沒有量產(chǎn)或者商業(yè)化閉環(huán),慢慢就會開始淘汰了。

界面新聞:你覺得是軟件還是硬件的企業(yè)會活得更長一些?

姚卯青:我覺得號稱做大腦的公司應(yīng)該比較困難一些,因為一這個耗錢,二它這個東西很難去商業(yè)化。做硬件的話投入稍微小一點,跟跑可能還能堅持的時間久一點,歷史上也不乏跟跑然后能跟上的例子。但一個公司如果只是做一米三的機(jī)器人,只做運動控制,那應(yīng)用場景確實會比較有限。

界面新聞:所以覺得智元是一個領(lǐng)跑的位置。

姚卯青:是的。

界面新聞:最近智元也宣布了很多合作,包括和階躍星辰還有Physical Intelligence,在合作這件事情上是怎么看的?

姚卯青:我們是很開放的,不會擔(dān)心合作方我們將來產(chǎn)生商業(yè)上的一些競爭和沖突,更多是我們希望去利用他們一些已有的能力來為我們的行業(yè)做賦能。比如階躍用幾萬張卡訓(xùn)練出基礎(chǔ)模型,我們就沒有必要從頭再干一遍,那就看能不能利用它的多模態(tài)模型來賦能我們機(jī)器人的大腦。

像Pi的話,具身智能的算法本身還遠(yuǎn)遠(yuǎn)沒有到終局,必須要以開放的心態(tài)跟進(jìn)現(xiàn)在最主流的一些方向,和最有可能成為將來頭部玩家的一些人去組建一個好的生態(tài)。將來其實我們并不排斥說,有一個特別好的算法大腦,我們?nèi)ヮA(yù)裝到我們的機(jī)器上去賣給用戶,這也是一個好的模式。

轉(zhuǎn)載請注明來自浙江久大氣動液壓有限公司,本文標(biāo)題:《對話智元合伙人姚卯青:具身智能淘汰賽即將開啟|界面新聞 · 科技》

百度分享代碼,如果開啟HTTPS請參考李洋個人博客
每一天,每一秒,你所做的決定都會改變你的人生!

發(fā)表評論

快捷回復(fù):

驗證碼

評論列表 (暫無評論,46人圍觀)參與討論

還沒有評論,來說兩句吧...

Top
 最新家政信息發(fā)布廣告  大同鎮(zhèn)近期招工信息最新  濟(jì)南小馬達(dá)招聘信息最新  鄞州區(qū)人才最新招聘信息  夏邑最新人員任免信息  疾控最新信息長春疫情  長春市最新辟謠信息  永康58最新招聘信息  益民金融招聘信息最新  荔浦最新工廠招工信息  長春別墅最新發(fā)布信息  邯鄲碧桂園最新頭條信息  花園湖附近租房信息最新  億清家園招聘信息最新  浦東育嬰嫂招聘最新信息  汝南古城最新房價信息  濱合畢方最新信息  棗陽最新文員招聘信息  韓城消防工招聘最新信息  江西瑞昌最新招聘信息  北京最新招聘監(jiān)理信息  滬錫先揚最新信息  赤峰高爾夫招聘最新信息  安慶涂層廠招聘信息最新  巨達(dá)汽車招聘信息最新  上??】妥钚滦畔⒌刂?/a>  興仁賣水果招聘信息最新  安徽防水信息網(wǎng)最新  春興精工最新信息好嗎  惠州園洲鎮(zhèn)招工信息最新