OPPO获人工智能会议CVPR 2020两项第一
通信产业网|2020-06-17 10:59:16
作者:通文来源:通信产业网

【通信产业网讯】2020年6月17日,一年一度的全球计算机视觉顶级会议CVPR(Conference on Computer Vision and Pattern Recognition国际计算机视觉与模式识别会议)落下帷幕,该会议是由IEEE(国际计算机视觉与模式识别会议)举办的计算机视觉和模式识别领域的顶级会议。每年汇聚全球顶尖的相关专家、学者和研究者,共同关注和探讨计算机视觉技术的发展方向与趋势。

在这届会议上,OPPO取得了非常优异的成绩:获得两项第一名、两项第三名,展现了OPPO在人工智能领域的科技领导力,以及新成立的智能感知与交互研究部门强大的研发实力。

OPPO多项AI核心技术斩获大奖

在本次大会上OPPO获得第一名的技术成果为将模糊图片”算“清晰的“极端超级分辨率感知”技术;此外,通过照片计算拍照方位的"手持设备视觉定位"技术则获得第三名和分项第一;通过读取录像智能识别其中人类行为的“长视频行为识别”技术,同时获得第三名。

OPPO智能感知首席科学家郭彦东表示:“非常高兴能在今年的CVPR竞赛中取得优秀成绩,这是OPPO研究院智能感知与交互研究部成立以来首次公开展示研发成果,分别对应环境感知、以人为本的计算、以及数字生成三个核心研究方向,充分反映了OPPO在人工智能领域的深厚积淀与实力。”

“图形界面和鼠标的使用造就了个人电脑,触屏成就了智能手机,每一次智能感知技术的突破、人机交互模式的提升,都在推进着全新的科技潮流。我们致力于让智能硬件更聪明,更理解用户,从而开发全新的人机交互方式,引领下一代科技潮流,” 郭彦东更进一步说明,OPPO对于智能感知与交互领域的前沿探索,将在未来全面赋能OPPO的技术与产品,也将孕育更新的硬件产品,为用户提供更具创新性的交互方式与服务体验。

除OPPO研究院智能感知与交互研究部之外,OPPO美国研究所也在CVPR上展露风采,取得“真实世界超分辨率图像处理技术”(Real-World Super-Resolution Challenge:Track 1: Image Processing artifacts)第六名的成绩,OPPO美研所时空实验室主管孟子博在CVPR做了暗光影像技术演讲“穿透黑暗:从图像到视频”(Looking into the dark: from image to video), 美研所AI计算机视觉高级技术总监全书学做了“从零开始构建可在智能手机和AR眼镜上运行的统一SLAM系统”演讲(Building a unified SLAM system running on both smartphone and AR glass from scratch),与全球学界分享OPPO在影像方面的最新成就。

OPPO超分技术成果,凭空将模糊图片算清晰

“极端超分辨率感知”( Perceptual Extreme Super-Resolution)是CVPR难度最高的赛项之一,要求从模糊的低分辨率图片中,获得细节更清晰、更接近真实情况的高清图像。这是计算机视觉技术中难度最大的领域之一,需要尽可能地平衡图像的画质与真实性。针对这项挑战,OPPO提出了独创的神经网络架构RFB-ESRGAN,通过更智能的方式提取原图特征,用分布式算法提高计算效率,以更多元的采样与计算模型配合,通过计算把模糊的图片清晰放大了16倍,从全球280多个顶尖参赛团队中脱颖而出,获得了第一名,其他参赛者,不乏来自脸书、百度、微软、亚马逊、中科院、UIUC等国际顶尖科技公司与院校的团队。

1231231.png

这项技术将在未来为诸多应用场景提供帮助,例如将用户手机拍摄到的模糊影像处理成细节丰富的高清效果,修复图像受到损坏的老照片、老电影,或者对卫星、航天图像进行细节分析等工作。

2441.png

在“手持设备视觉定位”挑战(Visual localization for handheld devices challenge)中,OPPO获得了面向室外场景的数据集(Aachen Day-Night)第一名,与面向室内场景的数据集(InLoc)第三名。“视觉定位”是通过搜集和分析图像中的海量信息,对自身拍摄方位作出精确判断。OPPO团队自主设计的全新分析流程,可以智能分析图像信息的分类标签及图像深浅信息,大量排除错误结果,从而显著提升分析准确程度。这一技术对未来的AR眼镜,智能机器人,精准导航等应用都能起到重要作用。例如,当智能机器人助手安装了摄像头之后,就可以利用视觉定位技术对拍摄到的图像作运算分析,获得准确定位,从而精准的移动。

此外,OPPO还在“长视频行为识别”(Activity detection in extended videos)赛项中获得了第三名。“视频行为识别”是指在某段视频中分析并判断人或物体对象的行为动作。OPPO的智能程序可高效识别并重组每一帧画面中的人物,辨别复杂动态视频中的人类行为。在一段数十人出镜的长视频中,它准确识别了视频中每个人走动或是聊天等的数十种动作。这项技术在未来能广泛应用在人机交互、运动分析等领域,例如未来的手机产品便可以自动识别正在运动的拍摄对象,并自动调节快门对焦。

352.png

智能感知与交互研究部成立,赋能OPPO前沿技术探索

2020年初,OPPO研究院正式成立智能感知与交互研究部,邀请行业领军人物郭彦东博士加盟并担任OPPO智能感知首席科学家,领导快速组建并逐步完善专业科研团队。

目前,智能感知与交互研究部已初具规模,并引进了诸多顶尖科技公司与科研院校人才。此次OPPO参加CVPR 2020的多项获奖成果均来自该团队。

一直以来,OPPO都认为,人工智能与通信技术是相辅相成,既可以断地互相赋能与提升,也可以共同为万物互融打下坚实的技术基础,设备、服务与网络的智能化都将是未来的必然趋势。智能感知与交互研究部的成立,标志着OPPO对人工智能前沿科技探索的进一步深化,并将大力推动OPPO在智能感知及交互这两项核心领域的研发工作。

重视人工智能研发,OPPO夯实技术领先地位

自2015年起,OPPO就开始在人工智能领域投入研究,并成立了相关研发团队,主要关注语音语义、计算机视觉等领域,也屡次获得国内外权威竞赛的奖项肯定。同时,OPPO一直积极进行相关专利布局,截至2020年3月,OPPO在人工智能领域的全球专利申请已超过1,900件。

OPPO 创始人兼首席执行官陈明永曾在2019年OPPO 未来科技大会上表示,未来三年将投入500 亿人民币研发预算,推进5G、人工智能、AR、大数据等核心技术的研究,并构建底层硬件核心技术以及软件工程和系统能力。面向万物互融的未来,人工智能领域将是OPPO一如既往关注的研发重点,而基于这些前沿科技领域不断的研发投入,OPPO也将持续展开多智能终端生态的全方位布局。


1

责任编辑:周腾

【欢迎关注通信产业网官方微信(微信号:通信产业网)】

版权声明:凡来源标注有“通信产业报”或“通信产业网”字样的文章,凡标注有“通信产业网”或者“www.ccidcom.com”字样的图片版权均属通信产业报社,未经书面授权,任何人不得复制、摘编等用于商业用途。如需转载,请注明出处“通信产业网”。

发表评论
评论More+
合作伙伴
×