把数字人成本从数万元打到几十块,京东斩获这项唯一特等奖

0次浏览     发布时间:2025-03-20 07:57:00    

据公号“京东黑板报”3月19日消息,近日,中国人工智能学会发布2024年度“吴文俊人工智能科学技术奖”公告,京东科技人工智能团队凭借“多模态交互式数字人关键技术及产业应用”项目荣获中国智能科学技术最高奖——吴文俊人工智能科学技术奖的特等奖,也是本年度唯一的特等奖。

资料显示,在本次获奖项目中,京东科技人工智能团队在以下三方面实现了技术突破:

提出了低成本、高保真人体建模技术,解决了人体建模成本高、观感差难题

提出了语义一致多模态应答技术,解决了多模态语义难对齐、应答弱难题

提出了多模态自然化行为生成技术,解决了多样化行为难协调、交互假难题

近期,京东言犀数字人技术再度进化。京东科技人工智能团队打造的数字人通用的基座大模型,通过语音合成大模型LiveTTS及通用数字人大模型LiveHuman,仅需输入自然语言或1秒视频/照片,即可生成4K超高清、100%口型匹配的数字人,彻底告别数字人制作对线下拍摄、建模与耗时训练的依赖。

LiveTTS语音合成基座模型,可以基于20万小时数据训练的扩散模型,实现“零样本”声音合成与多语种情感化输出,音色相似度较其它头部厂商高出1.3倍、字符错误率(CER)降低最高5.12%;LiveHuman数字人基座模型有创新性的人体过渡帧生成技术,解决多片段衔接卡顿难题,在遮挡、大角度、动态背景、多人直播等极端条件下仍有流畅表现。

这一系列突破将单个数字人生产成本从数万元拉低至两位数,较真人拍摄模式成本降幅超90%,标志着数字人从“专业工具”正式成为“普惠生产力”。这将为广告素材批量生成、新媒体投放、个人IP打造等场景应用拆掉技术藩篱,走向工业级应用。

数字人直播引发关注 央广网报道截图

谈到AI数字人的产业应用,在2024世界人工智能大会上,京东云言犀负责人曾对我们表示,用户已经跨过了AI数字人直播的“恐怖谷效应”。一旦人们接受了这样的内容,那么AI数字人直播带来的好处就很多了:不只是解放人们的时间,可以实现一天24小时直播,它还可以实现多个数字人之间的互动,给用户带来更加丰富的呈现内容,其中很多形态还是真人不一定能做到,甚至做不到的。

数字人正在涌入电商等各类产业场景 2024年WAIC现场图

本文系观察者网独家稿件,未经授权,不得转载。

相关文章
  • 近日,全球首个人形机器人运动会开幕式在北京举行。来自全球16个国家的280支参赛队伍,在三天内展开了数百场比赛。在这一全球首个为人形机器人组织的综合性竞技赛事中,各种各样的机器人以“越来越像人”的表现,向世界宣告有关未来的更多可能。为助力机器人走进更多用户的日常生活,8月18日,智元机器人六大核心产
  • 2025年的夏天,高温和“国补”一样热。朋友圈、家人群里几乎每天都有人在讨论:“补贴又开了,赶紧去抢!”确实,8月初暂停一个月的国家消费补贴正式重启,财政部下发的第三批690亿元资金已经落地,各地线上、线下通道全面恢复。政策明确延续到2025年12月31日24时,全国统一执行,不会提前收尾,也不会补
  • 上半年,朝阳区广告业发展势头强劲,营收达749.02亿元,同比增速27%,规上广告经营单位727家,占全市的60%以上,稳居全市第一。成绩背后,是一系列政策组合拳的精准发力。一起来了解——01筑巢引凤推动广企聚集全力打造数字广告产业高地在广告产业蓬勃发展的当下,朝阳区凭借其独特的产业优势,汇聚了阳狮
  • 8月8日,一场在万象举行的合作交流会,让中老铁路沿线开发的蓝图愈发清晰。当两国政商界代表齐聚一堂,围绕这条钢铁大动脉共商发展大计,我们看到的不仅是一条铁路的延伸,更是两个国家在互利共赢中迈向深度融合的生动实践。中老铁路从来不止是运输线,更是两国友谊的“连心桥”与合作的“加速器”。从通车至今,它不仅缩
  • 前几天,国家互联网信息办公室就H20算力芯片漏洞后门安全风险约谈英伟达公司。英伟达在随后的自辩声明中提到,芯片没有“后门”,他们还专门提到了“Clipper芯片”事件。△英伟达公司于2025年8月5日发表声明称:芯片不存在“后门”、终止开关和监控软件。1992年,美国电话电报公司(AT&T)面向美国