随着互联网上的自然语言数据逐渐耗尽,AI想要获得进一步的突破性成长,需要走出数字世界,迈向物理世界。7月27日,商汤科技在世界人工智能大会大模型论坛上发布“悟能”具身智能平台。该平台以商汤具身世界模型为核心引擎,能够为机器人、智能设备提供感知、视觉导航以及多模态交互能力,推动智能终端向更高层次的自主化与智能化演进。
“咱们来算一笔账,按唐朝的银子换算,一次运输得花掉今天的1000万人民币!”在世界人工智能大会现场,基于“悟能”具身智能平台的人形机器人以风趣幽默语言风格对《长安的荔枝》电影介绍PPT进行生动讲解,还能在讲解同时实时响应用户提问、回翻到相应页面,敏锐捕捉用户意图,期间有用户打断其提问,机器人完成回答后还能回到原有进程中继续讲解。据了解,“悟能”具身智能平台可以赋能机器人具备和现实世界的交互能力,具备有温度、长记忆、稳定性强等能力特点。
商汤科技董事长兼CEO徐立说,人类终将面临一个根本性问题:当书本与互联网知识穷尽时,下一代的人工智能将从何处获取?这即需要强大的现实世界理解模型+深度3D理解模型来协同提升该能力,“感知世界,进而更好地理解世界生成世界,最后与现实的硬件交互来改变我们的世界。”
例如在机器人领域,基于“悟能”平台的赋能,机器人能够通过主动探索生成更多高质量的现实世界数据,在具身智能数据匮乏的当前环境下,平台可以通过构建面向人、物、场的4D真实世界,突破模型在真实世界“举一反三”等能力的边界。例如用户只需要给出简单的提示语,比如“在厨房区域的架子上找东西”“进入娱乐室、向右转,然后打开通往院子的门”等等,具身世界模型就能自主进行位姿、动作骨架和指令的生成。
当前,大模型发展进入“深水区”,能否理解并模拟物理世界,推动人工智能从“认知”走向“行动”,成为大模型发展下一步要解决的重要问题。在汽车领域,商汤旗下“商汤绝影”在会上展示了行业首个已量产、可交互的“绝影开悟”世界模型。作为应用于真实训练数据生产的世界模型,“绝影开悟”生产效率很高,基于一张A100的GPU,“绝影开悟”每天生成的数据,相当于10台真实车或者是100台路测车的数据采集能力,比得上500台量产车。“目前,商汤绝影20%的数据是通过世界模型生产。”商汤绝影相关负责人表示。
除商汤外,腾讯、蘑菇车联近期也相继公布了在世界模型方面的进展。
记者:孙奇茹
伍伍策略-炒股配资网站拾必选配资-郑州股票配资-专业的股票配资价格提示:文章来自网络,不代表本站观点。