王亮:区政协委员、中国科学院自动化研究所模式识别国家重点实验室副主任、智能感知与计算研究中心副主任
计算机视觉就是给计算机安装上眼睛(摄像机)和大脑(算法),使其能模拟人类视觉系统的结构和功能,实现对周围环境视觉信息(图像
/
视频)的智能分析与处理,进而感知环境、适应环境。
2004
年,王亮在中科院自动化所获得工学博士学位。
2004
~
2010
年,他先后在英国帝国理工学院、澳大利亚莫纳什大学、澳大利亚墨尔本大学及英国巴斯大学工作。
他告诉记者:“我在前面三所大学主要从事博士后的研究工作,
2009
年在墨尔本大学的博士后项目结题后我开始找正式工作,当时收到来自英国和澳大利亚的两份录用通知书,最终选择了巴斯大学的讲师工作。”
6
年、两个国家、
4
所高校的工作和学习,王亮收获颇丰。无论是在英国还是在澳大利亚,王亮称自己不仅了解了异国的文化及风土人情,还接受了不同的教育和科研理念。
“要玩就玩得痛快,要学就学得踏实。”这是国外导师对科研工作和生活态度的真实写照。“在国内从事科研工作加班加点是常事,但国外科研工作者将工作和生活通常划分得很清楚。”王亮说,“导师在周末或度假的时候几乎是不会处理工作事情的。”
除了高效的研究小组讨论会外,他还发现,国外导师不管多忙,每周都会认真阅读学生的工作周报并给出意见和建议;同时每周也会留出固定时间与每位学生面对面地交流。通过在巴斯大学的工作经历,王亮也体会到了不同的教育体制和教学经验。
通过比较国内外的科研环境,王亮认为,国内的硬件设施并不比国外差,可能比国外还好;但软实力还有待提升,比如科研基础和创新性等。
“我是在国内读的博士,当时毕业时很想出去看看和体验一下。”王亮向记者回忆了他当初回国的想法,“在国外呆得越久,越发感觉原来的好奇和新鲜感正在慢慢褪去,从国外可以学习的东西也越来越有限。”一旦动了回国的念头,便一发不可收拾。
2010
年,王亮成功入选自动化所 “百人计划”招聘,为此他辞退了巴斯大学的终身教职。“我忘不了当时辞职时系主任惊愕的表情,他说海外经济不景气找正式工作是多么不易,一再问我你确定辞职吗?他不能了解,这对我来说,不仅仅是回国,更是回家。”中科院自动化所就是王亮口中所说的那个“家”。
如果自己所学能为自己的国家作点贡献,哪怕只是一点点,心里的满足感也将是不可言喻的。回国
5
年来,王亮获得了国家杰出青年科学基金,“百人计划”终期评估优秀。因在模式识别领域的突出贡献,王亮在
2014
年被授予“国际模式识别学会会士”荣誉称号。目前他是中科院脑科学与智能技术卓越创新中心骨干人员、中国计算机学会计算机视觉专委会秘书长、中国电子学会青年科学家俱乐部副主席、中国图像视频大数据产业技术创新战略联盟秘书长等。
如今,王亮已申请或授权发明专利
47
项,出版编著、专著
7
部,发表或接收论文
176
篇,其中发表在《
IEEE
模式分析与机器智能汇刊》《
IEEE
图像处理汇刊》等领域高质量国际期刊
38
篇;发表在
IEEE
国际计算机视觉大会、
IEEE
国际计算机视觉与模式识别会议等领域顶级国际会议
27
篇。
王亮向记者透露,他们团队的远距离步态识别技术已经顺利实现转化,成立了银河水滴(北京)科技有限公司。公司将专注于人工智能和计算机视觉技术,引领作为人工智能核心的深度学习技术的突破与革新,提供世界领先的视觉大数据分析技术。
从自动化所出国,再回到自动化所,并取得了一系列的成绩,王亮非常感谢自己的导师——中科院副院长谭铁牛院士。刚回国的时候,王亮在谭老师指导下,主要致力于拓展智能识别与数字安全团队的研究工作,主要研究方向是“视觉模式分析与理解”。
在动态图像序列模式分析与理解方面,“我们针对监控视频,不仅要分析场景中人是谁(身份)的问题,更要解决他或他们在执行什么活动(行为)的问题,同时考虑人的身高、性别、年龄、体态等相关属性的推理问题。”王亮介绍道。
王亮在国际上较早开始步态识别研究,并系统研究了步态识别理论与方法。他发表在国际顶级期刊《
IEEE
模式分析与机器智能汇刊》上的首篇步态识别论文成为该领域经典文章,目前已经实现步态识别从单一视角到跨视角的突破,较好解决了步态识别易受视角变化影响这一难题。
他进一步解释道,我们力争通过系统性的研究,实现从“简单、个体”行为到“复杂、群体”行为的深度研究,为行为识别技术的研究与应用提供算法基础。
在图像模式分析与理解方面,王亮主要研究图像分类、检索和分割三块相互关联的重要内容。他还就这三块内容进行了说明:图像分类是判断图像中目标的类别或者场景类别,图像检索是根据图像的表达来寻找与其相似的图像,图像分割是找到图像中属于某个特定类别目标的区域。
王亮团队提出了图像分类中特征编码的一般理论框架,给出了局部特征编码方法的族谱图和演化图,
2014
年连续
4
个月成为《
IEEE
模式分析与机器智能汇刊》的热点文章。
此外,王亮团队提出了基于深度语义排序的哈希编码方法,较好解决了多标签图像中如何保留复杂的多级语义结构的难题;提出多尺度上下文深度卷积神经网络的前景分割算法,提升了复杂图像目标分割的精确度和鲁棒性。
除了步态识别、个体
/
群体行为识别、图像分类与分割等应用研究外,王亮还针对大规模、多模态数据分析和深度学习及应用等方面开展一系列理论和方法研究。
多年的科研工作也让王亮发现,虽然国内很多技术在国际上已经处于领先地位,但仍缺少原创性的发现,一些研究工作不够深入和系统。他希望自己和团队能够潜心科研,做出一些真正有影响力的、原创性的、有价值的工作。