
互聯(lián)網(wǎng)戰(zhàn)投、大美元、大國資都來了。
近日,自變量機(jī)器人完成近 10 億元 A+輪融資。本輪由阿里云、國科投資領(lǐng)投,國開金融、紅杉中國、渶策資本跟投。老股東美團(tuán)戰(zhàn)投超額跟投,聯(lián)想之星、君聯(lián)資本持續(xù)追投,其中聯(lián)想之星為天使輪股東。
在全球熱錢加速涌入、賽道估值快速攀升的背景下,此次融資呈現(xiàn)出罕見的「多元資本聚合」態(tài)勢:不僅有長期深耕硬科技領(lǐng)域的大美元資本入局,亦涵蓋布局戰(zhàn)略性新興產(chǎn)業(yè)的大國資,同時(shí)疊加互聯(lián)網(wǎng)戰(zhàn)投的深度參與。
三方資本力量就單一具身智能標(biāo)的形成「同頻注資」,標(biāo)志著該融資并不是盲目追逐概念熱度的投機(jī)性出手,而是押注產(chǎn)業(yè)未來的戰(zhàn)略性布局下,對自變量機(jī)器人技術(shù)壁壘與商業(yè)化潛力的深度篩選。
以此次領(lǐng)投方阿里云為例,作為國內(nèi)少數(shù)具備 AI 大模型底層能力、且深度鏈接產(chǎn)業(yè)場景的云廠商,其此前在具身智能領(lǐng)域始終保持「觀望」態(tài)度,此次選擇自變量機(jī)器人作為賽道「首投標(biāo)的」,不僅是基于對自變量機(jī)器人技術(shù)硬實(shí)力的認(rèn)可,更是對于具身智能產(chǎn)業(yè)價(jià)值「分水嶺」的精準(zhǔn)研判。
從產(chǎn)業(yè)視角來看,具身智能已經(jīng)進(jìn)入「腦力角逐」階段,從「勉強(qiáng)能用」到「通用好用」,站在金字塔尖的「大腦」,決定了具身智能能力的上限。自變量機(jī)器人作為國內(nèi)最早實(shí)現(xiàn)端到端具身智能大模型的公司,其自主研發(fā)「WALL-A」系列 VLA(Vision-Language-Action)操作大模型,構(gòu)建統(tǒng)一的認(rèn)知與行動框架。模型同時(shí)處理感知、推理和行動,直接進(jìn)行跨模態(tài)的因果推理和行動決策,讓機(jī)器人能夠在真實(shí)物理世界中,像人類一樣思考和工作。
本輪融資,體現(xiàn)的是多元資方對具身智能產(chǎn)業(yè)未來演進(jìn)方向的深度戰(zhàn)略布局。
01
具身智能 大規(guī)模落地,
要先理解物理世界「潛臺詞」
一個(gè)清晰的產(chǎn)業(yè)共識為,「大腦」能力不足導(dǎo)致技術(shù)落地與產(chǎn)業(yè)期待存在顯著落差。當(dāng)前業(yè)內(nèi)大部分「大腦」普遍處于「三重限定」?fàn)顟B(tài):場景限定于預(yù)設(shè)的標(biāo)準(zhǔn)化環(huán)境、動作限定于固定軌跡的機(jī)械執(zhí)行、任務(wù)限定于單一指令的簡單響應(yīng)。
而真實(shí)物理世界的復(fù)雜性遠(yuǎn)超預(yù)設(shè),一個(gè)僅能在「限定框架」內(nèi)運(yùn)作的「大腦」,顯然無法承接產(chǎn)業(yè)對具身智能「實(shí)時(shí)響應(yīng)」的核心訴求。
這一供需落差的核心 gap,在于大部分「大腦」僅能實(shí)現(xiàn)「表層物理世界理解」,識別可見的物體形態(tài)、空間位置,卻無法「讀懂」物理世界的「潛臺詞」,即深層語義理解與復(fù)雜推理能力的缺失。
得益于自變量機(jī)器人率先實(shí)現(xiàn)了端到端具身思維鏈推理框架,其恰好填補(bǔ)了產(chǎn)業(yè)空白?;诙嗄B(tài)輸入進(jìn)行深度推理并生成多模態(tài)輸出,形成模型自主決策、執(zhí)行、探索和反思的完整閉環(huán)。使模型能夠?qū)⒄Z言理解、視覺感知與動作執(zhí)行緊密結(jié)合,形成更接近人類思維的推理過程,成功突破多步驟長序列任務(wù)瓶頸。同時(shí),據(jù)了解,自變量已在部分完全未訓(xùn)練過的新任務(wù)類型中展現(xiàn)出零樣本泛化能力。
02
具身智能「GPT 時(shí)刻」難盼?
中國也有了真正意義的具身智能基礎(chǔ)大模型開源
當(dāng)前具身智能產(chǎn)業(yè)正陷入「期待與現(xiàn)實(shí)錯位」的顯著怪象:外部市場始終聚焦「GPT 時(shí)刻」的降臨,篤信技術(shù)拐點(diǎn)將快速激活萬億級產(chǎn)業(yè)空間;但產(chǎn)業(yè)內(nèi)部卻深陷「重復(fù)造輪子」的低效循環(huán)。企業(yè)在底層算法框架、基礎(chǔ)感知模塊、運(yùn)動控制邏輯上各自為戰(zhàn),難以形成協(xié)同突破,導(dǎo)致技術(shù)落地進(jìn)度遠(yuǎn)滯后于市場預(yù)期,成為行業(yè)隱性痛點(diǎn)。
要打破這一困局,「開源」無疑是最關(guān)鍵的破局抓手。
誠然,產(chǎn)業(yè)不乏開源動作,但并非所有「開源」都能承擔(dān)產(chǎn)業(yè)破壁的重任,業(yè)內(nèi)長期存在「真開源」與「假開源」的本質(zhì)分野。部分企業(yè)的「開源」,僅開放表層代碼片段或閹割版模型,核心訓(xùn)練框架、預(yù)訓(xùn)練權(quán)重、關(guān)鍵參數(shù)仍處于封閉狀態(tài),開發(fā)者難以基于此進(jìn)行深度二次開發(fā);或附加嚴(yán)苛的商用授權(quán)限制,無法真正形成技術(shù)共創(chuàng)生態(tài)。
而「真開源」的核心,是能讓開發(fā)者能從「直接使用」到「迭代優(yōu)化」再到「場景創(chuàng)新」,實(shí)現(xiàn)技術(shù)價(jià)值的共建共享。
在融資落錘官宣之際,自變量機(jī)器人在毫無預(yù)告的情況下,同步開源了其大規(guī)模真實(shí)數(shù)據(jù)訓(xùn)練的開源具身基礎(chǔ)模型 WALL-OSS。而且開源得極徹底,這次放出的,是一整套完整可復(fù)現(xiàn)的具身大模型方案。包括預(yù)訓(xùn)練模型權(quán)重、訓(xùn)練代碼、數(shù)據(jù)集接口,甚至還附帶了詳細(xì)部署文檔,開發(fā)者可以在自己的機(jī)器人上直接跑通閉環(huán)流程。即使是具身領(lǐng)域在 WALL-OSS 之前唯一可用的開源模型 Pi0,也未曾開源其推理及訓(xùn)練代碼。而更多的模型,則停留在發(fā) paper,或者較小數(shù)據(jù)量訓(xùn)練的階段。
WALL-OSS 自采大規(guī)模真機(jī)數(shù)據(jù),多樣性場景及任務(wù)高質(zhì)量數(shù)據(jù);在模型架構(gòu)上,創(chuàng)新性設(shè)計(jì)「共享注意力 + 專家分流 (FFN)」架構(gòu);在訓(xùn)練方式上,首創(chuàng)「先離散、后連續(xù)、再聯(lián)合」的多階段訓(xùn)練范式;統(tǒng)一跨層級思維鏈實(shí)現(xiàn)了跨層級抽象層面的前向任意映射,模型能夠在單一可微分框架內(nèi)無縫切換高層決策與底層執(zhí)行。。
自變量機(jī)器人不斷突破技術(shù)卡點(diǎn)后,WALL-OSS 具備強(qiáng)大的泛化性和推理能力、良好的因果推理、空間理解和反思能力,在長程操作任務(wù)方面表現(xiàn)優(yōu)于其他基礎(chǔ)模型。據(jù)自變量評測,在嚴(yán)格的 ID(分布內(nèi))和 OOD(分布外)評測中均驗(yàn)證了 WALL-OSS 的卓越性能:例如在指令描述、動作動詞、物體方位等發(fā)生變化的 OOD 場景下,WALL-OSS 依然保持高成功率和指令遵循度;在需要細(xì)分指令的長程任務(wù)上,WALL-OSS 顯著優(yōu)于扁平化策略的基線模型(如 π0-flat);在需要 CoT 的推理類任務(wù)上,WALL-OSS 同時(shí)優(yōu)于 π0-flat 和 pi-gpt-prompt 等強(qiáng)基線;在空間 VQA、定位和場景描述等多模態(tài)基準(zhǔn)測試中,WALL-OSS 表現(xiàn)出色,成功保留并強(qiáng)化了 VLM 的核心能力。
通過開源將自變量機(jī)器人技術(shù)優(yōu)勢轉(zhuǎn)化為產(chǎn)業(yè)協(xié)同動能,加速具身智能從「技術(shù)單點(diǎn)突破」向「產(chǎn)業(yè)工程化落地」的關(guān)鍵躍遷,為行業(yè)真正迎來「GPT 時(shí)刻」筑牢根基,因此,行業(yè)內(nèi)有種說法
「硬件 看宇樹,大腦 看自變量」。
03
模型快速迭代之下,
AI 開始掌握硬件的定義權(quán)
在物理世界展現(xiàn)「能力涌現(xiàn)」時(shí),新的問題也隨之而來。現(xiàn)有的硬件還是否適配于「進(jìn)化后」的大腦?
在自變量機(jī)器人看來,AI 的發(fā)展不僅帶動了軟件水平躍升,一定程度上也影響了硬件性能的發(fā)展走向。換言之,硬件是否適配,機(jī)器人的大腦或許比人類更懂。
只做大模型或是硬件或許很快就會觸碰到天花板,畢竟,商業(yè)化強(qiáng)如宇樹,也面臨著大腦「缺位」的爭議。
自變量機(jī)器人始終堅(jiān)持軟硬一體發(fā)展,并打造了模型原生的本體結(jié)構(gòu)。今年新發(fā)布的量子 2 號,就是這樣一個(gè)「模型原生」的硬件。它的五指靈巧手采用仿生結(jié)構(gòu)設(shè)計(jì),單手擁有 20 個(gè)自由度,能感知細(xì)微的壓力變化?;诒凼忠惑w化外骨骼技術(shù),自變量首創(chuàng)行業(yè)領(lǐng)先的「仿人機(jī)械臂+高自由度靈巧手」一體化全身遙操方案,量子 2 號不僅能采集高質(zhì)量數(shù)據(jù)反哺模型訓(xùn)練,也將與自研模型深度融合,真正進(jìn)入到現(xiàn)實(shí)場景中落地應(yīng)用。
在過去不到半年時(shí)間內(nèi),自變量就已實(shí)現(xiàn)了機(jī)器人本體整機(jī)、高自由度靈巧手、外骨骼遙操數(shù)采設(shè)備等全棧自研。
04
技術(shù)快進(jìn)+資本同頻,
自變量機(jī)器人用商業(yè)化定力回應(yīng)期待
無論是近十億融資的加持還是開源基礎(chǔ)模型,都再次印證了自變量機(jī)器人「加速度」發(fā)展的鮮明特征。
2024 年 3 月,成立僅 3 個(gè)月的自變量機(jī)器人,推出國內(nèi)首款以具身智能基礎(chǔ)大模型為核心的復(fù)雜操作系統(tǒng),時(shí)隔 3 月后,該模型便在特定任務(wù)中顯現(xiàn)出少樣本學(xué)習(xí)與自發(fā)跨任務(wù)遷移能力;同年 10 月,其進(jìn)一步研發(fā)出當(dāng)時(shí)參數(shù)規(guī)模領(lǐng)先的具身智能通用操作大模型 Great Wall 系列(GW)之 WALL-A,公開的多組操作動作精度達(dá)世界一流水準(zhǔn)。
2024 年 11 月,自變量的模型展現(xiàn)出長序列訓(xùn)推能力和泛化性,并首次展現(xiàn)出零樣本泛化能力;魯棒性、復(fù)雜任務(wù)成功率優(yōu)勢顯著。同時(shí)在數(shù)據(jù)質(zhì)量控制與數(shù)據(jù)收集效率方面達(dá)到世界領(lǐng)先水平,
步入 2025 年后,自變量機(jī)器人在語義導(dǎo)航等方面取得突破,4 月,自變量在具身思維鏈技術(shù)方面展現(xiàn)出強(qiáng)大優(yōu)勢,WALL-A 模型在更多未接觸過的新任務(wù)場景中展現(xiàn)出零樣本泛化能力。
硬件側(cè),成立僅兩年的自變量機(jī)器人,已基于自研大模型搭建起「輪式雙臂機(jī)器人+輪式人形機(jī)器人+靈巧手」的本體產(chǎn)品矩陣。
自變量機(jī)器人不斷挑戰(zhàn)具身智能技術(shù)無人之境的同時(shí),資本也展現(xiàn)出對其技術(shù)價(jià)值與產(chǎn)業(yè)潛力的長期「戰(zhàn)略錨定」。成立至今,自變量機(jī)器人已完成八輪融資,集結(jié)了多元化資本。形成「技術(shù)突破-資本注入-持續(xù)拓展」的正向循環(huán)。
值得關(guān)注的是,在技術(shù)與資本雙輪驅(qū)動的背后,自變量始終保持著清晰的商業(yè)化定力。在商業(yè)化落地場景選擇上,自變量機(jī)器人的定力體現(xiàn)在場景甄別中,堅(jiān)定選擇有真實(shí)數(shù)據(jù)價(jià)值、商業(yè)價(jià)值的場景,規(guī)避短期爆發(fā)的「偽需求」。
目前自變量的機(jī)器人,已與頭部服務(wù)業(yè)、工業(yè)客戶達(dá)成合作,在多場景中投入使用。未來自變量也將與客戶圍繞模型和硬件共建開放生態(tài),推動具身智能的進(jìn)一步發(fā)展。
從 2023 年到現(xiàn)在,國內(nèi)具身企業(yè)百花齊放,商業(yè)模式也五花八門,各類公司在落場景、沖營收的同時(shí),行業(yè)不斷反思其間的客戶價(jià)值是否持續(xù)、技術(shù)是否有效迭代。技術(shù)的快進(jìn)是產(chǎn)業(yè)的根基,多元化資本同時(shí)下注基礎(chǔ)模型及技術(shù)全棧的公司,或許為行業(yè)提供了期許的答案。