在互联网行业迅猛发展的当下,加强多模态、预训练排序等新兴技术研究工作,对于推动互联网建设发展至关重要。多年来,度小满积极开展多模态、预训练排序等创新技术研究,不断提升技术实力,其围绕多模态、预训练排序撰写的两篇论文入选了国际顶级会议,表明度小满在人工智能领域再获新进展。
据悉,由度小满数据智能应用部AI-Lab撰写的两篇论文分别入选了ACM MM和CIKM国际顶级会议。两篇论文分别就多模态和预训练排序等多个热门话题提出了新颖的算法,并在相关任务上达到了国际顶尖水平,获得了审稿人的一致好评并最终录用。这标志着度小满在自然语言处理和计算机视觉等人工智能前沿领域的研究得到了国际同行的认可。
Transformer模型可有效提升度小满视觉风控方面的技术能力
其中,度小满关于具有实体对齐网格的位置增强Transformer论文被ACM MM国际顶级会议录用。该模型能够整合目标检测、OCR以及基于Transformer的文本表示等多种方法的优势,增强算法对于图像中场景信息的理解,更精准的融合图像与文本多模态的信息,进一步助力证件识别、人脸与活体检测等业务场景,提升度小满在视觉风控方面的技术能力。
以下为该论文简介:
许多图像除了实际的物体和背景等信息外,通常还包含着很有价值的文本信息,这对于理解图像场景是十分重要的。因此本文主要研究基于文本的视觉问答任务,这项任务要求机器可以理解图像场景并阅读图像中的文本来回答相应的问题。然而之前的大多数工作往往需要设计复杂的图结构和利用人工指定的特征来构建图像中视觉实体和文本之间的位置关系。为了直观有效地解决这些问题,我们提出了具有实体对齐网格的位置增强Transformer。
动态多粒度排序模型为度小满业务稳健发展提供保障
度小满另一篇基于BERT的动态多粒度排序模型的论文被CIKM国际顶级会议录用。该模型有效地提升了长文本理解与排序任务的性能,特别是其中所用到的预训练语言模型已经成为度小满在自然语言处理方面的基础架构,在获客、信贷等业务场景被广泛地使用,为业务模型提供了更加丰富的文本表示和精准的文本特征,在保障业务稳健发展中起到了十分重要的作用。
以下为该论文简介:
近年来,预训练的语言模型广泛应用于文本的检索排序任务中。然而,在真实场景中,用户的行为往往受到选择或曝光偏差的影响,这可能会导致错误的标签进而引入额外噪声。而对于不同候选文档,以往的训练优化目标通常使用单一粒度和静态权重。这使得排序模型的性能更容易受到上述问题的影响。因此,在本文中我们重点研究了基于BERT的文档重排序任务,开创性地提出了动态多粒度学习方法。此外,该方法还同时考虑了文档粒度和实例粒度来平衡候选文档的相对关系和绝对分数。
度小满在多模态、预训练排序方面的研究取得优异成绩,为接下来布局前沿技术奠定了有利基础。未来,多模态、预训练排序等创新技术仍将是金融行业技术焦点。在以度小满为首的金融科技企业携手助推下,多模态、预训练排序等新兴技术将深入运用到金融各大使用场景中,驱动金融服务行业创新可持续发展。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com近日,华为AppTouch受邀出席由扬帆出海主办的2022PAGC产品与增长大会,AppTouch凭借与全球运营商深度合...