把数字人成本从数万元打到几十块,京东斩获这项唯一特等奖

0次浏览     发布时间:2025-03-20 07:57:00    

据公号“京东黑板报”3月19日消息,近日,中国人工智能学会发布2024年度“吴文俊人工智能科学技术奖”公告,京东科技人工智能团队凭借“多模态交互式数字人关键技术及产业应用”项目荣获中国智能科学技术最高奖——吴文俊人工智能科学技术奖的特等奖,也是本年度唯一的特等奖。

资料显示,在本次获奖项目中,京东科技人工智能团队在以下三方面实现了技术突破:

提出了低成本、高保真人体建模技术,解决了人体建模成本高、观感差难题

提出了语义一致多模态应答技术,解决了多模态语义难对齐、应答弱难题

提出了多模态自然化行为生成技术,解决了多样化行为难协调、交互假难题

近期,京东言犀数字人技术再度进化。京东科技人工智能团队打造的数字人通用的基座大模型,通过语音合成大模型LiveTTS及通用数字人大模型LiveHuman,仅需输入自然语言或1秒视频/照片,即可生成4K超高清、100%口型匹配的数字人,彻底告别数字人制作对线下拍摄、建模与耗时训练的依赖。

LiveTTS语音合成基座模型,可以基于20万小时数据训练的扩散模型,实现“零样本”声音合成与多语种情感化输出,音色相似度较其它头部厂商高出1.3倍、字符错误率(CER)降低最高5.12%;LiveHuman数字人基座模型有创新性的人体过渡帧生成技术,解决多片段衔接卡顿难题,在遮挡、大角度、动态背景、多人直播等极端条件下仍有流畅表现。

这一系列突破将单个数字人生产成本从数万元拉低至两位数,较真人拍摄模式成本降幅超90%,标志着数字人从“专业工具”正式成为“普惠生产力”。这将为广告素材批量生成、新媒体投放、个人IP打造等场景应用拆掉技术藩篱,走向工业级应用。

数字人直播引发关注 央广网报道截图

谈到AI数字人的产业应用,在2024世界人工智能大会上,京东云言犀负责人曾对我们表示,用户已经跨过了AI数字人直播的“恐怖谷效应”。一旦人们接受了这样的内容,那么AI数字人直播带来的好处就很多了:不只是解放人们的时间,可以实现一天24小时直播,它还可以实现多个数字人之间的互动,给用户带来更加丰富的呈现内容,其中很多形态还是真人不一定能做到,甚至做不到的。

数字人正在涌入电商等各类产业场景 2024年WAIC现场图

本文系观察者网独家稿件,未经授权,不得转载。

相关文章
  • 6月13日,2025年世界泳联花样游泳世界杯总决赛在西安奥体中心跳水游泳馆拉开战幕。在首个比赛日,中国花样游泳队强势夺得3枚金牌和1枚银牌。在女子单人技术自选项目决赛中,中国选手徐汇妍以“望相思”为主题,凭借极具艺术感染力的表现以258.7933分技压群芳,夺得本次赛事的首枚金牌。该成绩刷新了她同年
  •   新华社合肥6月11日电 题:以时代新风塑造和净化网络空间——2025年中国网络文明大会观察  新华社记者王思北、徐海涛、刘美子  汇聚网络正能量,引领时代新风尚。6月10日至11日,2025年中国网络文明大会在安徽合肥举行。大会期间,举办了开幕式、主论坛、14场分论坛等活动,与会嘉宾围绕网络文明
  • 在学区研修班黄建初老师的引领下,我们聚焦《新课标何以落地——小学数学“幻方”课例研究与课堂观察》展开研讨。上海中医药大学附属浦东鹤沙学校顾老师执教二年级《幻方》一课,旨在引导学生初步认识幻方、探索规律并迁移应用。作为研究伙伴,我们首次尝试课堂观察员角色,黄老师建议我运用课后访谈和问卷调查方式,探寻证
  • 6月3日,国务院新闻办公室举行新闻发布会,介绍第二届“一带一路”科技交流大会有关情况。第二届“一带一路”科技交流大会将于6月10日至12日在四川成都举办。发布会现场。图/国新网四川省副省长李文清介绍,本届大会四川聚焦推进创新链、产业链、资金链、人才链深度融合,创新实施了企业找技术、成果找市场“双向揭
  • 当前,生成式人工智能技术的迅猛发展正在深刻重塑人类知识生产的逻辑与范式,在哲学、伦理学、认知科学等领域引发了关于“知识本质”“主体性重构”与“认知范式转型”的深层讨论。日前,由复旦大学哲学学院主办的“大模型与知识生产范式转型”研讨会上,与会学者围绕“知识生产转型的理论反思”“大模型如何赋能学术研究”