科技
设为书签Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。
业 界/ 互联网/ 行 业/ 通 信/ 数 码/ 手 机/ 平 板/ 笔记本/ 相 机
当前位置:科技 > 快讯 >

展现科技硬实力 天翼云国际AI顶会再露锋芒

展现科技硬实力 天翼云国际AI顶会再露锋芒
2023-03-28 14:52:42 来源:看点时报

近日,国际人工智能顶会CVPR 2023举办的第5届自然场景情感行为分析挑战赛(5th Workshop and Competition on Affective Behavior Analysis in-the-wild,简称ABAW)公布比赛结果,天翼云AI团队(CtyunAI)在情感分类任务中表现出色,凭借极高的性能指标荣获本届大赛季军。

据了解,CVPR会议是由IEEE主办的关于计算机视觉和模式识别的国际学术会议,收录了该领域最新的研究成果和技术发展,是全球计算机视觉三大顶级会议之一。

ABAW竞赛是由国际顶级计算机视觉研究者和科学家们共同发起的竞赛,致力于解决自然情境下计算机对人的情感行为进行分析的问题,并以此提升人机交互系统的场景应用能力,目标是创造出能够理解人的感觉、情绪和行为的机器和机器人,从而让机器能够以“以人为本” 的方式与人类互动,并有效地作为人类的数字助手。

比赛共吸引了来自世界各地的100多支团队参加,其中不乏业内知名的机构和公司,如网易、思图等。参赛队伍需要对来源于现实场景的594个视频共300万帧图像进行分析,通过视频中的图像、人物、声音来预测指定人物在连续时间下情感。

相较上届竞赛,本届竞赛的数据标签极度不平衡且标签噪声多,给参赛队伍带来了一定挑战。由于现实世界的环境不受条件控制,所以竞赛所使用的视频数据相较往届呈现更加多样的视频录制条件、背景和显示方式。同时,为了考验算法对不同拍摄环境、不同人群等情况的适应能力(迁移学习能力),竞赛数据的样本分布极不均衡,也增加了竞赛难度。

天翼云AI团队在本次竞赛中使用了多模态融合技术,通过不同模型同时提取视频的图像和音频特征,将这些特征进行融合后利用时域卷积网络(Temporal Convolutional Network,TCN)和Transformer对数据在时间维度上进行建模,从而使模型能够通过视频的上下文对结果进行预测,大大提升了模型的任务表现。在情感识别任务中,该模型针对人类的六个基本情感(快乐、厌恶、悲伤、愤怒、惊奇、恐惧),以及中立情感进行识别,实现了F1-score超过0.35的好成绩。

本次天翼云AI团队能够在竞争激烈的ABAW竞赛中取得优异成绩,得益于天翼云多年来在图像、音频及多模态领域的深厚积累和不断创新。通过在更广阔的人工智能领域中继续研究和探索,天翼云致力于以更先进的技术和更优秀的成果回报社会和用户,将有助于推动千行百业共享数字化发展成果。

 

关键词:

责任编辑:kj005

文章投诉热线:156 0057 2229  投诉邮箱:29132 36@qq.com
关键词:

首个!火山语音立项有声阅读标准,获CCSA工作组一致通过

2023-03-13 15:22:46首个!火山语音立项有声阅读标准,获CCSA工作组一致通过

供应布局,服务加速!浙江中力湖北生产基地正式投产

2023-02-21 17:34:36供应布局,服务加速!浙江中力湖北生产基地正式投产

usmile笑容加,重新定义口腔清洁

2023-02-20 14:45:57usmile笑容加,重新定义口腔清洁

春节红包封面大比拼,科技文化交相辉映,中国广电别具特色

2023-01-18 10:03:57春节红包封面大比拼,科技文化交相辉映,中国广电别具特色

SD-WAN是什么?详解三大优势及SD-WAN解决方案

2023-01-12 12:32:55SD-WAN是什么?详解三大优势及SD-WAN解决方案

打造操作系统“大生态” 筑牢数字经济底座 麒麟软件助推网信产业发展质效双提

2023-01-09 21:05:58打造操作系统“大生态” 筑牢数字经济底座 麒麟软件助推网信产业发展质效双提

相关新闻

最新资讯