搜索
当前位置:首页 > 资讯详情
 从感知到认知:全面构建“视觉+”智能体系
作者:苏 舟 胡 平 蔡东琪 王山东 姚安邦 郭怡文 李建国 侯宇清 陈玉荣 作者单位:人工智能 所属类别:高端装备 2017-12-05 17:06:03 浏览:78188

         2017年7月26日,在计算机视觉顶级会议CVPR 2017上,ImageNet大规模视觉识别挑战赛正式宣布结束。这标志着一个时代的终结:图像识别的错误率已经达到2.3%,远低于人类的5.1%。但这同时也意味着一个新时代的开启:计算机视觉的重点将由感知转向认知,更加侧重对视觉内容的学习和理解。

  目前,英特尔中国研究院正在全面发力视觉认知计算领域,从2D/3D人脸分析与情感识别合成、深度网络结构设计和压缩、视觉内容解析与多模态分析三个方向,构建一个以视觉为中心的智能体系。

  一、2D/3D人脸分析与情感识别

  基于多年研究,英特尔中国研究院开发了一整套领先的2D人脸分析技术,包括人脸检测跟踪、人脸关键点检测跟踪、人脸识别,以及人的表情、性别、年龄识别等。这套技术具有十余项自主知识产权,并被成功地应用到英特尔的硬件(英特尔集成显卡)、软件(英特尔实感技术SDK)、应用(视频实时美颜)以及解决方案(物联网视频分析端对端解决方案),帮助提升英特尔架构的用户体验。

  自然场景下的聚合监督情感识别算法

  自动捕捉、识别乃至理解人类的情感,一直是人工智能领域中一项意义非凡却极具挑战性的技术。在人工智能空前闪耀、飞速发展的今天,我们看到了情感识别在机器人、动画制作、在线教育、精神疾病诊治等行业的广泛应用前景。Gartner甚至预测,情感分析作为一个分裂性的消费市场将在未来5-10年内成熟,且市场规模将高达320亿美元。数据、算法和计算能力的繁荣与融合点燃了人工智能,催生了深度学习技术的迅速崛起,奠定了深度卷积神经网络在诸多计算机视觉任务中的统治地位。经过多年发展,深度卷积神经网络在情感识别方面已经取得了全面领先的性能。

 

聚合监督表情识别类型

 

  然而,在情感识别领域,绝大多数的方法依然是将时下最主流的深度卷积神经网络直接迁移到情感识别的任务中。神经网络结构的加宽加深,可以有效提高识别的准确率,但由于只引入了输出层的监督信号,模型的训练效率受到很大限制。

  英特尔中国研究院提出了SSE深度卷积神经网络,使用了两个独特设计:(1)聚合监督信号的引入;(2)分数连接结构,使识别准确度提高到了60.34%,超过了目前所有的公开结果。

  首先,在网络的浅层、中间层和深层设计中,我们设计了Supervised Blocks,分别命名为SS_Block、IS_Block、DS_Block,将监督信号引入除了输出层外的隐层。

  其次,我们设计了分数连接层,将不同Supervised Blocks的预测概率进行概率分数的融合,使监督信号能有效地在不同的block发挥作用。

  至此,我们见证了SSE深度卷积神经网络的诞生:一种高精度的深度卷积神经网络情感识别解决方案。相关文章已经发表在了2017年度的ACM ICMI国际会议上,与论文相关的源代码正在逐步开源中。

 

以上内容精选于《人工智能》杂志第一期p30—p43

 

本文作者

         苏 舟

  现任英特尔研究院软件工程师。主要研究方向为图片描述生成和图片问答。2014年本科毕业于清华大学计算机系,2015年硕士毕业于卡耐基梅隆大学信息技术专业。拥有数篇国际会议论文和十余项国际专利。

  胡 平

  博士,现任英特尔研究员。主要研究领域包括计算机视觉、模式识别等,主要从事基于深度学习的人脸以及与人相关的各种特性的识别。发表学术论文10余篇,拥有20余项美国/国际专利及申请。

  蔡东琪

  目前是英特尔中国研究院认知计算实验室和清华大学电子系联合培养博士后研究员,研究兴趣是高级视觉分析与理解。2016年毕业于北京邮电大学。目前的研究方向包括端到端的基于RGB/RGB+D视频的行为识别算法和应用。

  王山东

  博士,现任英特尔研究员。主要研究领域为计算机图形学、3D人脸建模及人脸表情识别等。中国科学院软件研究所博士,曾就职于三星研究院任高级研究员。曾为李宇春《今天雨,可是我们在一起》提供三维人脸技术创作。

  姚安邦

  博士,现任英特尔高级主任研究员。主要负责人脸分析、场景理解和深度网络结构设计及压缩方向的研究。发表国际顶级会议论文与期刊论文二十余篇, 拥有60余项美国/国际专利及申请。曾连续三年获得英特尔研究院戈登·摩尔奖。

  郭怡文

  博士,目前是英特尔中国研究院认知计算实验室和清华大学自动化系联合培养博士后研究员,主要研究方向为网络压缩和超分辨率研究等。曾在ICLR、CVPR、NIPS等国际顶级会议上发表多篇论文。

  李建国

  博士,现任英特尔中国研究院高级主任研究员。2006年在清华大学自动化系获得博士学位。研究兴趣包括深度学习网络结构优化、目标检测、视觉内容理解、人脸分析等。发表40余篇论文,包括十余篇CVPR、ICCV、ICML等顶级会议论文。多项研究成果转换为英特尔公司产品,包括一项CPU/GPU硬件特征。

  侯宇清

  博士,目前是英特尔中国研究院认知计算实验室和清华大学计算机系联合培养博士后研究员,研究兴趣是强化学习的理论以及应用,研究方向为基于深度强化学习的视觉信息处理以及元学习。2016年毕业于北京大学,研究方向是多模态学习。

  陈玉荣

  博士,现任英特尔首席研究员、英特尔中国研究院认知计算实验室主任。负责领导视觉认知和机器学习研究工作,推动基于英特尔平台的智能视觉数据处理技术创新。发表学术论文40余篇,拥有40余项美国/国际专利及申请。

 

欲阅读完整文章,可通过以下方式购买《人工智能》杂志!

订阅2018年《人工智能》杂志6期共计360元
银行转账:北京赛迪出版传媒有限公司
开户行及账号:北京银行北洼路支行20000030565000007701154
银行转账,请备注:人工智能
接收详细信息请发到:aiview@ccidmedia.com;或是添加客服微信:13601092749

参与评价

最新评价

相关推荐

最热资讯

账号密码登录
第三方快速登录
找回密码