您现在的位置是:主页 > 78222曾夫人论坛 >

搜狗获ICPR 2020人脸关键点检测挑战赛冠军

2020-10-29 04:17      点击次数:

作为3D 人脸重建、人脸识别、表情迁移及美化等应用的核心基础技术,人脸关键点检测算法一直是工业界和学术界的研究热点。 近日,在第25届国际模式识别大会(ICPR 2020)举办的人脸106关键点检测挑战赛中,搜狗AI团队荣获冠军,彰显其在计算机视觉领域的核心技

  作为3D 人脸重建、人脸识别、表情迁移及美化等应用的核心基础技术,人脸关键点检测算法一直是工业界和学术界的研究热点。

  近日,在第25届国际模式识别大会(ICPR 2020)举办的人脸106关键点检测挑战赛中,搜狗AI团队荣获冠军,彰显其在计算机视觉领域的核心技术实力。

  ICPR 2020大会是模式识别领域的顶级国际会议,由国际权威学术组织---国际模式识别协会(The International Association for Pattern Recognition,IAPR)主办,在本届大会组织的人脸识别领域竞赛单元-人脸106关键点检测比赛中,搜狗AI 团队在预赛验证和决赛测试两阶段均取得第一,击败OPPO研究院、美团视觉中心、东南大学、西安交大等多支强队,最终一举摘得桂冠。

  人脸关键点检测算法的研究重点是在不同表情、性别、年龄、姿态、光照条件下,准确定位人脸轮廓及五官关键点,近年来偏向实用的人脸关键点检测的国际评测陆续举办,国际顶级计算机会议ICME 2019就曾举办人脸关键点检测的比赛。

  人脸106关键点检测挑战赛(Grand Challenge of 106-p Facial Landmark Localization)是ICPR 2020举办的八项比赛之一,相较于之前的评测,本次ICPR 2020大会举办的评测难度更大。其测试样本涵盖大姿态、极端表情、遮挡等多种高难度、复杂的情况,且训练样本少,对算法的泛化能力、准确性及鲁棒性等多个方面提出了巨大的挑战,在比拼检测精度的同时,更加追求技术的实用化程度,对模型复杂度做了更加严格的要求,模型大小需要低于20 MB,运算复杂度不超过 1GFLOPs,希望推动更加高效并且鲁棒的轻量级人脸关键点检测算法的技术进步,因此极富学术和实用价值,吸引了数十家企业和高校的参赛队伍参赛。

  作为本届赛事的冠军队伍,搜狗AI团队在人脸关键点检测技术上有三个重要突破。

  首先,采用基于HRNet基础模型的改进版本,利用不同分辨率之间特征全融合的方式,有效学习不同尺度图像的语义信息,同时为了保证算法的精度,搜狗增加了HRNet不同分辨率分支的通道数,从而在人脸关键点检测任务上表现出了出色的效果;

  其次,在卷积层部分采用组卷积,并且把其中的瓶颈层(BottleNeck)改换为MobileNet V2中的逆残差结构(Inverted Residuals),设置逆残差结构的扩展参数为1,从而有效的降低了模型的复杂度;经典残差结构:1x1(压缩)-3x3(卷积)-1x1(升维),逆残差结构:1x1(升维)-3x3(dw conv+relu)-1x1(降维+线性变换),这对基于移动端设计的小模型有广泛的效果提升作用。

  最后,除了使用常规的平移、旋转等数据增强策略,还使用了PDB(Pose-based Data Balancing)策略。该策略统计训练数据集中的不同姿态的图片的数量,然后通过简单的复制数量较少的姿态的图片,从而解决了不同的姿态的数据不均衡的问题,对大姿态下关键点的预测起到有效的作用。

  最终搜狗的算法在模型大小12MB,模型计算复杂度0.887GFLOPs的基础上,取得了本次比赛中最好的性能,模型累计误差分布曲线面积指标(AUC)达到80.52,归一化平均误差(NME)为1.58,预测失误率(FR@0.08)只有0.05。

  搜狗在自然交互与知识计算的人工智能战略指引下,坚持以语言为核心的人工智能研究,近年来在语音、计算机视觉、问答、翻译、对话等核心技术领域取得突破性进展。

  在技术创新方面,搜狗在计算机视觉领域一直保持着强劲实力。通用技术方向,于2018 年在CVPR WAD自动驾驶视觉竞赛中夺得道路目标检测任务第一名;在国际自动驾驶领域权威评测集Cityscapes实例分割评测任务中同样拿到第一名的好成绩。OCR方向,于2019年11月刷新了ICDAR 2019 ArT检测、识别、端到端三项单元的新记录;人脸识别方向,于2018年11月在人脸识别顶级评测 MegaFace 的Face Identification(人脸识别)任务中,基于百万规模级别的人脸数据库以 99.939% 的识别准确率斩获大赛第一名;本次ICPR 2020人脸106关键点检测挑战赛中又一次取得技术突破获得冠军,证明了搜狗在计算机视觉领域的领先实力。

  在应用落地方面,搜狗自研的人脸相关技术已经应用于搜狗核心产品及解决方案中,其中,领先行业的数字人解决方案-搜狗分身已大量使用了自研的人脸关键点检测、识别以及生成技术,技术的不断突破有力确保了搜狗分身的领先优势;搜狗首创的基于模态注意力机制的语音+唇语的多模态识别技术,强噪声场景下识别准确率提升36%;搜狗最新发布的搜狗AI录音笔-E2在语音能力之外新增了视觉能力,能够支持文档图像识别OCR等技术,后续会陆续扩展人脸识别等相关应用。本次参赛的技术以应用落地为导向,已具备了大规模部署的能力,不久的将来会与搜狗分身、AI硬件、多模态识别等能力产生联动效应,进一步提升搜狗AI创新产品的用户体验。

  未来,搜狗将持续在计算机视觉领域推动核心技术研发及创新,不断扩展技术成果的应用落地,带给用户更多差异化的优质体验。(一鸣)

  随着北半球冬季来临、气温不断下降,研究人员提示,新冠病毒的传播可能进一步恶化,这与病毒本身特性、人群社交特点等多个因素有关。冬季人们更常在通风条件不佳的室内空间进行社交等各种活动,会增加病毒传播风险。

  针对直播行业用户的痛点,盒子科技推出了年度战略新品——卡多希“战疫者”,为直播行业赋能的同时,向抗疫勇士致敬,向伟大祖国致敬。据悉,卡多希为自主研发、技术首创的直播硬件设备,能够提高直播设备管理效率和运营效率,提升产品性能与用户体验。

  得益于国家加大对“新基建”的支持力度,越来越多的企业开始关注传统制造流程的数字化改造。融入云计算、大数据、物联网技术实现“互联网+包装”的发展模式,将推进产业的转型升级,为传统行业带来新的机遇。

  一直以来,化学家们的工作都通过人工方式完成,虽然自动化在化学领域并非新鲜事,比如多肽的自动合成以及高通量筛选等,但这些自动化合成仅囿于单一类型的化学反应或流程,目前还没有可以涵盖所有合成有机化学的数字自动化标准和通用的化学操作编程语言。

  2020智能联盟第十一届机器人创客教育高峰论坛26日在徐州召开,此届峰会主题为“逆增长”,探讨了新冠肺炎疫情常态化趋势下,人工智能及机器人创客教育的未来发展。海纳深机器人联合创始人黎明和围绕“教育机器人的发展史及其教育价值”进行分享,解读了从木制积木、塑料积木、编程积木、积木机器人到人工智能编程机器人共五代机器人的前世今生。

  外周神经组织可以将生物电信号从大脑传递到身体其他部位。而外周神经的损伤通常会导致慢性疼痛、神经紊乱、瘫痪或残疾。

  专攻神经细胞损伤与再生机制研究的姚凯深知,哺乳动物眼体里的感光神经元一旦受损死亡,无法自主再生,最终会导致失明。如何在不损伤视网膜的情形下将“米勒”细胞改造成神经干细胞,是摆在姚凯面前的第一道难题。

  恶性疟原虫是导致疟疾的最主要寄生虫。在全球范围内,疟疾平均每天导致1200人死亡——这也是非洲的主要致死疾病,在2018年夺去了40万人的生命,其中绝大多数都是不到5岁的儿童。

  巴西是南美人口最多、面积最大的国家,也是南美最大的电信市场,拥有巨大的发展潜力。随着扩大宽带互联网覆盖面,提升互联网普及水平,促进电信企业进入新的投资周期,都将为巴西电信行业带来新的发展机遇。

  比如,克罗宁团队研发出了“化学机器人”以及化学描述语言和相应的计算机软件,这套系统可以将化学文献翻译成机器人可以理解的分子配方,并自动生产这些分子。研究人员称,这些研究和尝试有望引领化学走入自动化时代,加速药物研发进程,催生更高效的太阳能电池并助力太空探索。

  据当地媒体日前报道,以色列耶路撒冷工学院大卫·森费尔德教授与美国康奈尔大学研究小组合作,借助康奈尔大学开发的先进显微成像方法,获得了成年斑马鱼大脑的精细结构图像。

  外周神经组织可以将生物电信号从大脑传递到身体其他部位。对此,南京大学教授沈群东、南京工程学院副教授王倡春、南京鼓楼医院主任医师朱泽章等学者试图开发一种有效、迅速起作用的治疗方法来替代自体神经移植。

  无人收获机、倒伏收割“神器”、“空调”粮仓……东北秋收季“刮”起智能风

  为适应倒伏作物收割要求,加快抢收,黑龙江省财政下拨1.7亿元,用于收获机械改装补贴,目前已改装近2万台机械用于秋收,努力将灾害损失降到最低。

  10月26日23时19分,我国在西昌卫星发射中心用长征二号丙运载火箭,成功将遥感三十号07组卫星送入预定轨道,发射获得圆满成功。

  在国际热核聚变实验堆、平方公里阵列射电望远镜、国际大洋发现等国际大科学计划和大科学工程中,我国积极承担项目任务,深度参与运行管理。

  10月26日23时19分,我国在西昌卫星发射中心用长征二号丙运载火箭,成功将遥感三十号07组卫星送入预定轨道,发射获得圆满成功。

  通过“基地+农户”的模式,叶文盛把贵州省湄潭县高台镇、新南镇、茅坪镇、石莲镇等相对较为贫困的镇作为“茶树新品种种植示范区”。仅在高台镇就发展了1000亩智慧茶园基地,不仅为村民们解决了就业问题,还带动高台镇农户新建茶园3万亩。

  尼龙是一种应用非常广泛的合成纤维,尼龙种类较多,其中尼龙66是最重要的一种。尼龙66的主要原料之一己二酸属于二元羧酸类尼龙单体,其合成主要依赖高污染、高能耗的多步骤化学氧化过程。

  依据不同磁场模型 科学家发现伽马射线日了解到,中国科学院云南天文台的一项新研究,给出了大尺度衰减磁场环境下伽马暴同步辐射的偏振特性,发现在大尺度的环形磁场模型下,偏轴观测的伽马暴理论上都会在单脉冲内发生偏振面旋转90度的现象。

  在天文学中,金属丰度比太阳低的恒星被称为贫金属星,往往诞生时间比较早;富金属星则与太阳金属丰度差不多甚至更高,也比较年轻。

推荐阅读

教大家解决无法切换到搜狗输入法的方法

今天小编来给大家针对这个教大家解决无法切换到搜狗输入法的方法的问题来进行一个介绍,毕竟当下也是有诸多的小伙伴对于教大家解决无法切换到搜狗输入法的方法这个问题非常的重视的,下面大家可以看下具体的详情 结束之后,按住win+r键,打开运行窗口,输入

热点新闻

潮酷跨界!Jeep指南者夜鹰版联手小米之家打造快闪潮店

广汽菲克Jeep品牌带领旗下极具个性化的全新Jeep指南者夜鹰版登陆广州保利广场,全方位打造出了跨界生活方式。 全新Jeep指南者x MI夜鹰暗盒空间,为消费者带来了充满潮酷与科技感的全新体验,是两大品牌跨界的又一次成功尝试。 科客点评:全新Jeep指南者x MI

Power by DedeCms