日均 1 起融资,具身智能的疯狂 7 月,背后藏着这些信号

在 7 月过去的上半月,国内具身智能领域的融资共有 16 起,也就是日均 1 起,频率之高,令人咋舌。

而且,融资总金额超过 30 亿元。对比 2024 年全年,具身领域总共 90 起融资,融资总金额 89.33 亿元。那么钱都去了哪里?42 号电波对此进行了梳理。

从这些融资数据中可以看到,超过半数企业的融资集中在 A 轮和 B 轮阶段,在已披露融资金额的企业中,星动纪元、汉阳科技、云深处、小雨智造、它石智航、星海图、跨维智能等企业的融资规模也超过了 1 亿元大关。其中投资方不乏美团、滴滴等巨头,如果时间拉到稍早一些的 6 月,我们还可以看到腾讯和阿里的身影,大厂扎堆做具身智能「金主」已经不稀奇了。

大厂的密集入局,也为具身智能企业带来了资金、资源等多维度加持。

具身智能关乎 AI 的下一波浪潮

其实,从行业长期跟踪者的视角看,资本密集投资具身智能不是偶然和跟风,而是产业发展的必然趋势。

持续关注资本流向的观察者,应该可以注意到一个信号,那就是资本把重心逐步从大模型转向了具身智能。据 IT 桔子数据,2025 年上半年大语言模型领域融资事件为 72 起,这一数据在 2024 年同期是 44 起;而具身智能则是 116 起,去年同期是 30 起,大语言模型融资事件在增长速度方面跟具身智能相比显然是落后了。

而这,背后反映出来的则是资本的深层次思考。

本征资本的邢大地博士表示,大模型赛道基本到了收官状态,头部公司已经确立了优势,也不大可能再有新玩家要进入。

现在的大模型竞争早已不是 23 年「百模大战」时的群雄割据,新问世大模型的刺激效应随着时间的推进在边际减弱。到目前为止,头部大模型已经瓜分了用户群体,占据了竞争优势。而新玩家若想在这种环境下异军突起,难度很高,要么在技术上有所突破,要么「烧钱」足够任性,而训练大模型需要大量的 GPU、TPU 等硬件资源,对于资方来说,性价比显然不高。而具身智能则处于前期的押注阶段,资本出现转向也就不难理解了。

其次,我们正在迈向 AI 的下一波浪潮,具身智能正是关键。在生成式 AI 和推理 AI 的浪潮中,我们已经见识过了 AI 理解信息、拆解信息并生成信息的能力。但大多数情况下,它们也只能是「工具」,而不是「生命」。

在这种情况下,可实现自我学习、自我改进、自我调整,进而解决任何问题且不需要人为干预的 AGI 远未到来,要想通往 AGI,就要积累同物理世界交互的能力。因此,「将人工智能带进物理世界,并由此驱动物理世界」成为了比上述「工具」更动人的故事,具身智能的宏大叙事就此展开。

当 AI 真正学会了在物理世界中稳健行走、灵巧操作、安全共存,它才真正迈出了从「智能工具」到「智能伙伴」的关键一步。

黄仁勋在这方面就曾公开表态:「人工智能的下一波浪潮是物理 AI,也就是 Physic AI。AI 可以进入物理机器,比如机器人。」而具身智能在这个环节中就是 AI 走向物理世界的重要途径。

大举投资具身智能的美团也有类似的考量,在王兴的视角中,人工智能必须进入物理世界,而美团则起到了数字世界和物理世界的连接者作用,在具身行业的投资和对投资企业的合作,是美团实现这一愿景的重要布局。

VLA 已成具身行业共识

在今年这波具身融资潮中,我们也明显可以接收到这样一个信号:那就是「大脑+本体」两条腿走路已经成为了主流,并且「大脑」的地位越来越高。在今年融资金额和轮次最多的头部具身公司中,他们大都选择了两条腿走路、且「大脑」优先的路线,而不同于以往的硬件占据绝对优势。

在这一路线中,VLA 模型(视觉语言动作模型)已经成为了具身智能行业的共识,被视为连接感知、语言与行为的通用架构,也让机器人拥有了将语言意图、视觉感知与物理动作编织成连续决策流的能力。

Physical Intelligence 联合创始人兼 CEO Karol Hausman表示,VLA 是通往通用智能的重要基石,能够让机器人从互联网等多源数据中学习并转化为具体行动。

成立不到一年半就完成 7 轮融资,累计融资金额超 10 亿元的自变量机器人,它自成立起就押注 VLA,从早期只输出动作,到现在融合输出动作、语言、视觉和思维链。他们所坚持的「大小脑统一的端到端大模型」路线,正是多家投资机构青睐自变量机器人的核心原因。

此外,国内机器人公司在 VLA 模型上的布局速度也在今年开始加快。比如,智元机器人 3 月发布首个通用具身基座模型智元启元大模型(GO-1),采用了 ViLLA 架构,由 VLM 和 MoE 组成,实现了可以利用人类视频学习,完成小样本快速泛化。银河通用在 6 月推出自主研发的产品级端到端导航大模型 TrackVLA,具备纯视觉环境感知、语言指令驱动、可自主推理、具备零样本泛化能力。

如今的 VLA 已不再只是简单的模型,更是一种快速进化的思维方式:让机器人直接「读懂世界」并「动起来」,成为连接人工智能和物理世界的关键桥梁。

资金不停押注,在具身智能行业的不断深入,其实也是一场让 AI 回归智能本源的过程:智能并非只存在于抽象的符号里,而应是根植于身体与物理世界的持续互动之中。

而赋予 AI 在真实物理空间中感知环境、理解物理、规划动作、执行任务并从中学习的能力,便是具身智能的终极目标,让 AI 更好的进入物理世界并服务人类,也是资金疯狂涌入具身智能的宏大愿景。在通往 AI 下一波浪潮的过程中,没有人会停下脚步。