2024 年 10 月,在信息检索和数据挖掘的国际学术会议 CIKM (International Conference on Information and Knowledge Management) 上,京东探索研究院院长、京东科技人工智能业务负责人何晓冬博士发表的研究成果 DSSM 模型(基于点击数据学习用于网络搜索的深度结构化语义模型:Learning deep structured semantic models for web search using clickthrough data)因对内容推荐架构产生重大影响并为产业带来巨大的经济效益,荣获 CIKM 2024 年唯一的“最佳时间检验奖(Test of Time Award)”。
CIKM 由 ACM SIGIR 分会主办,是信息检索和数据挖掘领域的顶级学术会议之一,因 CIKM 论文的研究成果经常得到产业界的采纳,所以 CIKM 也是少数受到学术界和产业界共同关注的活动,只有少数高质量的论文能够脱颖而出被录用,2024 年 CIKM 的录用率仅为 23%。每年的“最佳时间检验奖”更是彰显了论文在学术和产业上的双重价值 —— 以在过去 10 年产生重大和持续影响为评选标准。
本次获评的 DSSM 双塔模型是各类双塔模型的开山之作,奠定了召回和粗排阶段的基础架构,为后续众多改进型双塔模型奠定了基础。
DSSM 双塔模型最大的特点是,user 和 item 是独立的两个子网络,即分别使用相对独立的两个复杂网络构建用户相关特征的 user embedding 和 item 相关特征的 item embedding,因而被称为双塔模型。
DSSM 模型不仅为内容推荐系统的基础模型和架构奠定了坚实的基础 —— 是深度语义学习方向最基础的模型结构,解决了语义相似度计算的问题。2016 年,图灵奖得主 Yoshua Bengio 和 Ian Goodfellow(GAN 的发明者)、Aaron Courville 三人共同编撰的深度学习领域奠基性教材《Deep Learning》(引用量 3 万余次)一书中就将本次获评的 DSSM 模型视为基于内容的推荐系统的基础架构。同时,因为兼顾性能与效率,DSSM 模型对产业界十分友好,在发布后的 10 年中得到了大量的应用。
DSSM 深度语义匹配模型最早是应用于 NLP 领域中计算语义相似度任务。语义匹配本身是一种排序问题,和推荐场景不谋而合,所以 DSSM 模型被自然的引入到推荐领域中,如搜索引擎检索、广告相关性、问答系统、机器翻译等。过去 10 余年,深度学习技术的应用极大地提升了互联网搜索引擎的语义理解能力、信息检索效率和用户搜索体验,使得搜索结果更加精准、丰富和个性化。头部搜索引擎,电商平台的搜索、推荐和广告业务中都大量采用了该技术,产生了巨大的经济价值。
何晓冬博士曾表示,“在多年的技术落地实践中,我们意识到,用 AI 来提升、赋能传统实体行业才能最大化影响力和应用价值,传统实体行业的体量足够大,提升 1% 就能创造巨大的应用价值。”何晓冬博士在京东科技负责人工智能在产业上的落地应用,近年来陆续与团队研发出了智能客服、数字人直播、智能外呼等多项专业可信赖的 AI 产品,在零售、物流、金融、政务文旅等领域获得了广泛应用。据公开消息,京东云言犀数字人已服务超 5000 家品牌,带动销售额超百亿;智能客服覆盖了消费者进店后 30 多个关键环节,可自动化应答售前、售中、售后全场景 90% 的服务咨询,服务品牌商家数量超 40 万;智能外呼与政务热线紧密结合,助力大同、东莞、保定、芜湖多地 12345 热线实现数智升级……
技术创新是企业发展的重要驱动力。不少技术人认为,能否让技术拥有广袤的实践场景,产生应用价值,是考评是否加入该企业的终极门槛。以京东为例,京东创立 20 多年来,持续投入供应链基础设施和技术创新应用,为用户带去“多快好省”的极致体验,也推动品牌和商家实现降本增效,不仅拥有海量应用场景,更积累了大量专业数据。可以说,技术与创新的基因早已植入京东的发展脉络。这也是京东可以让大量技术人在真实场景中充分发挥创造力,持续推出多项专业可信赖的 AI 等技术创新的重要原因。