澎湃新闻记者 李晶昀 AI 创意
“杭州六小龙”企业之一群核科技3月19日宣布,公司自主研发的空间理解模型SpatialLM正式开源。该模型能够基于从视频中提取的点云数据,准确认知和理解其中的结构化场景信息,并将它以脚本语言的形式呈现出来。
“就像我们环顾四周环境便可以理解背后的空间结构一样。”群核科技如此比喻。具体运行中,可以简单理解,给SpatialLM“刷”一段视频,它便能生成物理正确的3D场景布局。
据介绍,该模型特点之一是更通用的数据输入模式。SpatialLM无须借助智能穿戴设备作为传感器输入数据,手机、相机所拍摄的视频均可以成为数据来源,大大降低了开发者的数据采集门槛。
其次是物理正确的场景创建能力。空间场景是否符合物理正确原则,是影响机器人空间理解效果的关键。
SpatialLM 基于视频重建的3D结构化场景
群核科技称,这得益于公司在过去十余年中积累了海量的3D数据和空间认知数据。该公司由黄晓煌、陈航、朱皓于2011年联合创办,主要以空间设计软件市场为目标。旗下产品包含空间设计软件酷家乐、海外版产品Coohom,以及为AIGC、具身人工智能、AR/VR、机器人等提供虚拟环境训练的群核空间智能平台SpatialVerse。
根据弗若斯特沙利文的资料,按2023年的平均月活跃用户(MAU)数目计量,群核科技是全球最大的空间设计平台;按2023年的收入计量,公司亦是中国最大的空间设计软件提供商,约占22.2%的市场份额。2024年,群核科技的平均月活跃访客数为8630万名。
群核科技方面表示,SpatialLM突破了大语言模型对物理世界几何与空间关系的理解局限,让机器具备空间认知与推理能力,为具身智能等相关领域提供空间理解基础训练框架。
值得一提的是,群核科技去年已发布群核空间智能解决方案(下称“SpatialVerse”),SpatialVerse主要通过合成数据方案为机器人搭建起接近物理真实的“数字道场”,帮助它们在仿真环境下完成例如叠被子、递送水杯、开关冰箱门等行动的交互训练。
群核科技称,有了SpatialLM模型和SpatialVerse,机器人将获得从认知理解到行动交互的完整闭环训练,也就是既能“看懂”世界,又能学会行动决策,进而在真实世界里顺利“上岗”。
实际上,去年12月,群核科技联合创始人兼董事长黄晓煌在一次公开演讲中即提到,当我们谈到具身智能或者机器人的时候,“叠被子困境”是一个非常典型的场景。
“目前的 ChatGPT 大语言模型,可以很容易地让机器人理解人类的指令,‘给我叠一个被子’,它也可以通过视觉判断哪床被子是叠好的、哪床被子没叠好,但它很难执行。或者当它学会叠一床被子后,换个形状可能就又不会了。”黄晓煌指出,“机器人的大脑在数字世界里,但身体却在物理世界中。”
而如何让机器人正确理解物理世界,黄晓煌认为关键是要有海量可交互的三维数据。
群核科技最新也提及,开源仅仅是一个起点。“具身智能正处在爆发式发展的新阶段,我们希望以空间模型和数据开源为契机,让更多具身智能从业者有机会参与二次创新,共同推动产业技术底座持续进化。”
此外值得关注的是,今年的2月14日,群核科技已正式向港交所递交上市申请,也是“杭州六小龙”中首家启动IPO进程的公司。
成立至今,该公司已获得包括IDG资本、纪源资本、顺为资本、云启资本、经纬创投、线性资本、Hearst、Pavillion、高瓴创投、Coatue等多家机构投资。IPO前,IDG资本、纪源资本、高瓴创投均持有群核科技超10%的股份。
澎湃新闻记者 贺梨萍
4月30日,鹿明机器人项目签约仪式在苏州市吴中区举行。此次合作标志着吴中区正加速人形机器人产业集聚,为区域产业发展注入新动力。鹿明机器人专注于具身智能赛道,主要从事通用模块化人形机器人本体及算法的研发与生产,在具身智能核心技术研发方面积累深厚,同时具备消费电子行业大规模量产交付和极致成本控制的宝贵经
2025-05-01 08:36:00近年来,上海农商银行积极拥抱早期孵化和成果转化,通过创新服务体系、开发特色产品等举措,大力推进对孵化器及在孵企业的“最早一公里”和“最难一公里”支持。上海“模速空间”大模型创新生态社区(以下简称“模速空间”)正是该行着力打造的“科创鑫孵化”基地之一。模速空间是全国首个大模型创新生态社区,坐落于西岸传
2025-04-30 18:23:00“五一”假期即将到来,多地推出丰富的文旅活动,为海内外游客提供更为多元的出行选择。综合多地发布的数据及各大在线旅游平台预订数据,“五一”旅游市场热度有望再创新高。与此同时,服务品质正成为目的地文旅经济比拼的重要一环。今年以来,贵州、浙江、湖北等地探索旅游大模型。专家认为,地方政府加码布局AI,或推动
2025-04-30 10:05:004月29日,在数字中国建设峰会期间,蚂蚁数科正式对外发布智能体开发平台Agentar,这是一款为金融机构提供一站式、全栈的智能体开发工具,助力金融机构高效打造能够自主决策、可信可靠的金融智能体应用。据介绍,Agentar平台以可信智能体技术为底座,能够在大模型侧、智能体供给侧、智能体执行侧及场景评测
2025-04-29 16:05:00记者从4月29日在福建福州开幕的第八届数字中国建设峰会上获悉2024年我国数字经济提档加速数字经济核心产业增加值占GDP比重10%左右数据要素市场日趋活跃数据生产总量达41.06 ZB同比增长25%数字基础设施不断扩容提速数字中国建设加快推进记者:唐诗凝、董建国设计:贾稀荃新华社国内部、新华社福建分
2025-04-29 11:23:00