(图片来源:钛媒体AGI编辑林志佳拍摄)
近日,京东已切入“具身智能”的消息引发关注,集团已成立相关业务部门和技术布局。
3月初,京东探索研究院发布文章称,该团队开发了一套高扩展性的具身智能系统架构,面向双臂灵巧手的一体式高频率遥操技术,基于末端模仿的泛化操作方法,以及国内首个双臂移动机器人操作的开源数据集JD ManiData,全面应用于咖啡机器人等家庭场景。其中,这套具身智能系统架构突破了简单结构化的实验室场景局限,成功率达到80%。
针对近期火热的“具身智能”相关话题,3月25日,京东科技人工智能(AI)相关负责人对钛媒体AGI表示,京东云持续深耕大模型技术并大力推进在产业应用的落地。在团队看来,发展通用人工智能(AGI)有三个方向要走:第一是大语言模型;第二是多模态,大模型必须具有视觉能力,未来甚至可以更进一步延伸向嗅觉、触觉;第三是走向“具身智能”,包括机器人、机械臂、无人车等,让AGI从数字世界走向物理世界。
“数字人是多模态的代表,走到物理世界,我们也一直在推动这方面的研究。随着硬件制造愈加成熟,软件即智能模型会成为(机器人)领域越来越重要的差异化和竞争能力,最后智能机器人领域,京东主要聚焦于机器人和大模型的深度结合,以及新应用场景的探索,包括世界模型、深度推理模型等,最终将机器人希望做到可执行、可操作的‘具身智能’,无论是机器人、车,还是机器狗,都是如此。”上述负责人表示。
据悉,京东探索研究院成立于2020年10月25日,是以京东集团各事业群与业务单元的技术发展为基础,集合全集团资源和能力,成立的专注于前沿科技探索的研发部门,是实现研究和协同创新的生态平台,主要深耕人工智能、数据科学工程与管理、去中心化计算等数智技术领域,致力于从基础理论层面实现颠覆式创新,助力数智化产业发展及变革,以原创性科技赋能京东的零售、物流、健康、科技等全产业链场景。
近几年,京东加速且全面向技术转型。财报显示,2017年-2024年,京东集团累计研发投入超过1400亿元人民币。其中,2024财年,京东集团研发支出就达到创纪录的170.31亿元。
得益于京东近几年持续加码 AI 与机器人技术,截至2024年底,京东AI技术已深度应用于物流、零售场景,并成功推出了多款应用于仓储、分拣、配送等环节的智能机器人。京东集团CEO许冉近期表示,“AI在京东整体业务中发挥越来越重要的价值。”
2024年底举行的京东云峰会上,京东云发布企业大模型服务、言犀智能体平台、智能编程助手JoyCoder、言犀数字人3.0等三大智能平台和五大技术产品。
其中,作为最能体现京东云的技术能力之一的言犀数字人持续发力,在DeepSeek热潮下,言犀数字人全面接入DeepSeek,并且已经有200余家品牌正在使用DeepSeek辅助生成数字人直播脚本,文案参考率高达90%,24小时在线不停播、成本仅为真人1/10、平均带来30%转化提升。
数据显示,目前已经有超过9000家品牌都选了言犀数字人进行入驻带货,GMV增量超140亿。同时,数字人直播商家数已同比增加200%以上。这意味着,京东言犀数字人已经率先完成了规模化产业应用。
近日,中国人工智能学会发布2024年度“吴文俊人工智能科学技术奖”,京东科技人工智能团队凭借“多模态交互式数字人关键技术及产业应用”项目荣获中国智能科学技术最高奖——吴文俊人工智能科学技术奖的特等奖,也是本年度唯一的特等奖。
此次获奖信息中,京东言犀数字人主要在三方面实现技术突破:提出了低成本、高保真人体建模技术,解决了人体建模成本高、观感差难题;提出了语义一致多模态应答技术,解决了多模态语义难对齐、应答弱难题;提出了多模态自然化行为生成技术,解决了多样化行为难协调、交互假难题。
如今,京东言犀数字人技术再度进化,该团队打造的数字人通用的基座大模型,通过语音合成大模型LiveTTS及通用数字人大模型LiveHuman,仅需输入自然语言或1秒视频/照片,即可生成4K超高清、100%口型匹配、98%声纹还原度的数字人,彻底告别数字人制作依赖于线下拍摄、建模以及成本过高等因素,实现中小企业、个人可“开箱即用”。
据相关负责人透露,京东言犀数字人正布局“千人千面”功能,实现每个商家和用户都会有一个栩栩如生的个性化直播助手,同时让主播数字人精细化的服务于每位消费者,产品体验会有更大一步提升。该功能最快在今年4月上线。
“现在数字人技术,特别是 AI 技术,不是纯算法问题,也不是纯数据问题,而是需要在算法工程优化方面突破挑战。”上述负责人表示。
事实上,除了京东,近期腾讯、蚂蚁、小米、华为等多家国内科技大厂都在布局“具身智能”技术。
近期,腾讯领投了智元机器人B轮融资;而蚂蚁集团也注册成立了蚂蚁灵波科技有限公司,聚焦具身智能技术和产品研发;而华为也在深圳成立全球具身智能产业创新中心,国泰君安证券研究所认为,华为在人形机器人产业的定位可能更像英伟达,将以“卖铲人”定位存在。
可以预见,接下来,国内科技大厂通过布局具身智能,抢占垂直市场的激烈程度将更上一层,包括具身智能拥有巨大潜力的制造业、医疗、家庭服务等领域。
展望未来,京东也表示,其将持续优化具身智能技术以快速应用于新场景,通过整合”视觉-语言-动作”大模型与预训练和强化学习方法,提高机器人的操作成功率和泛化能力,将技术扩展到更广泛的业务领域,加速具身智能技术探索与产业应用。
“最终,人类需要造的机器人,是要服务于人的。比如,你想让机器人倒杯咖啡,所以需要机器人识别咖啡类别、识别杯子大小。”相关负责人表示,如果用端到端的具身智能技术就可以真正实现机器人全自动化。“所以从某种意义上来说,世界都是为人而生的。”
(本文首发于钛媒体App,作者|林志佳)