易特艾弗网络科技

推荐

东吴证券:具身智能行业面临挑战 建议重点关注布局具身智能数据集企业

时间:2025-06-05 16:47 浏览:

  东吴证券发布研报称,数据是推动具身智能技术快速突破和落地应用的关键,建议重点关注布局具身智能数据集的企业,包括均胜电子、海天瑞声、索辰科技、华如科技等标的。该行指出,优质数据集能加速智能体环境感知与任务执行能力训练,但当前行业面临真实数据采集成本高、仿真数据标准化不足等挑战。

  东吴证券主要观点如下:

  数据是推动具身智能技术快速突破和落地应用的关键

  借鉴自动驾驶汽车发展的路径,数据对于具身智能同样至关重要。优质的数据集能够驱动智能体感知与理解环境,能够加速具身智能模型的训练与部署,帮助机器人有效完成复杂任务。不同于大语言模型可以使用互联网海量信息作为训练数据,机器人所用的具身智能模型没有现成数据可以使用,需要投入大量时间和资源进行机器人操作实践或仿真模拟,以收集

  具身智能数据按采集方式主要分为真实数据和仿线)真实数据:真实数据是智能体通过自身物理身体上的各类传感器,在与真实物理环境进行交互过程中,实时采集获取的数据。真实数据主要

  当前具身智能数据多为厂商自采集,存在丰富开源数据集

  当前给人形机器人采集的高质量数据通常在现实世界中获取,采集方式主要有直接接触数据和间接接触数据两种。最理想的数据采集方式是通过人形机器人本体直接触达物理世界,让其准确理解真实环境。大规模真机数据的采集成本高昂,需要投入许多人力、物力和时间资源,数据标注和采集设备都存在门槛。目前市面上存在丰富的高质量具身智能开源数据集,如智元、谷歌、国地共建中心等均开源了丰富的具身智能数据集,具备丰富的演示数量、场景任务和动作技能等。

  机器人仿真数据主要依赖虚拟场景,而场景的合成方案可拆解成两个关键部分:场景生成与模拟

  场景生成引擎主要有两种技术路径:合成+3D重建:基于像素流驱动,先生成或图像,再重建为点云或mesh等非结构化3D数据,最终转为结构化语义模型。如Hillbot、群核科技、World labs等。AIGC直接合成3D数据:利用图神经网络、扩散模型、注意力机制等方法,直接合成结构化空间数据。如ATISS、LEGO-Net、DiffuScene、RoomFormer等代表模型,部分方案结合程序化生成技术,如Infinigen。