8大技术优势,6个发展趋势,人脸识别已经深入到了生活的方方面面。
编辑 | 智东西内参
近年来, 随着人工智能、计算机视觉、大数据、云计算、芯片等技术的迅速发展,人脸识别技术取得了长足的进步并且在众多场景中得以成功应用并大规模商业化普及,为经济社会的发展以及人们日常生活带来便捷 。
就市场发展趋势而言, 人脸识别应用场景虽然渗透各个行业场景, 但市场规模增长趋势出现分化, 国内市场呈现从算法竞争到芯片全产业链激烈竞争的状态;就技术发展层面, 边缘端 SOC 芯片算力的提升使得人脸识别系统中的部分甚至全部算法可以运行在边缘设备上, 从而使云边结合已成为人脸识别产品和应用方案的发展趋势。
本期的智能内参,我们推荐全国信息技术标准化技术委员会的研究报告《2020 年人脸识别行业研究报告》,从技术特点、行业发展趋势和标准化现状三方面还原人脸识别技术的最新发展状况。如果想收藏本文的报告,可以在智东西(公众号:zhidxcom)回复关键词“nc515”获取。
本期内参来源:全国信息技术标准化技术委员会
原标题:
《2020 年人脸识别行业研究报告》
作者:蒋慧 等
01.
什么是人脸识别?
人脸识别 ( Face Recognition) 是一种基于人的面部特征信息进行身份识别的生物特征识别技术 。近年来 , 随着人工智能 、 计算机视觉 、 大数据 、 云计算 、 芯片等技术的迅速发展 , 人脸识别技术取得了长足的进步并且在众多场景中得以成功应用 。
广义的人脸识别实际包括构建人脸识别系统的一系列相关技术 , 包括人脸视图采集 、 人脸定位 、 人脸识别预处理 、 身份确认以及身份查找等 ;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术和系统 。此外 , 部分应用场景下还可能涉及质量评价 、 活体检测等算法模块。
人脸识别的应用模式主要包括三种:
(1)、人脸验证 (Face Verification) : 判定两张人脸图像是否属于同一个人 ,常用于身份认证如人证核验 。
(2)、人脸辨识 ( Face Identification) : 给定一张人脸图像 , 判断是否在注册库中 , 若在则返回具体的身份信息 , 常用于静态检索或动态布控 。
(3)、人脸聚类 ( Face Clustering) : 给定一批人脸图像 , 将相同人的图像归类到同一个类 , 不同人的划分为不同的类 , 常见的应用有智能相册 、 一人一档等 。
1、发展历程
人脸识别的研究开始于 20 世纪 60 年代 , 到 90 年代进入了初级应用阶段 ,主要停留在学术研究和小范围的实验室环境应用 , 直到 2012 年后的深度学习的复兴 , 人脸识别技术取得历史性的进步 , 真正实现大规模商业化普及 , 且识别能力已经远远超过了人类的常规辨识度 。
目前 , 从全球人脸识别技术领域的应用场景布局来看 , 安防 、 金融 、 交通 、 楼宇等是相对较为成熟的领域 , 而在零售 、 广告 、 智能设备 、 教育 、 医疗 、 娱乐等领域也均有较多应用场景 , 为经济社会的发展以及人们日常生活的便捷带来了新机遇 。
2、政策现状
随着人工智能技术水平的迅速发展与经济发展水平的稳步踏进 , 在大数据应用的带领下 , 人脸识别技术在智慧城市 、 安防市场等行业得到了广阔的应用 ,与此同时人脸识别技术应用过程所涉及的监管问题也面临着越来越高的挑战 。面对目前正飞速发展的人脸识别技术 , 我国制定了一系列政策来促进其更健康的发展。
2017 年 7 月 , 国务院发布 《 新一代人工智能发展规划 》 ( 国发 〔 2017 〕 35 号 )指出建设安全便捷的智能社会 , 围绕行政管理 、 司法管理 、 城市管理 、环境保护等社会治理的热点难点问题 , 促进人工智能技术应用 , 推动社会治理现代化 。同时 , 围绕社会综合治理 、 新型犯罪侦查 、 反恐等迫切需求 , 提出研发视频图像信息分析识别技术 、 生物特征识别技术的智能安防与警用产品 , 建立智能化监测平台的要求。
全国人大在 2018 年修正的 《 中华人民共和国反恐怖主义法 》 第五十条提到 :公安机关调查恐怖活动嫌疑 , 可以依照有关法律规定对嫌疑人员进行盘问 、 检查 、 传唤 , 可以提取或者采集肖像 、 指纹 、 虹膜图像等人体生物识别信息和血液 、 尿液 、 脱落细胞等生物样本 , 并留存其签名 。
2019 年 9 月 , 中国人民银行印发的 《 金融科技 ( FinTech ) 发展规划 ( 2019-2021 年 ) 》 ( 以下简称规划 ) , 明确提出构建适应互联网时代的移动终端可信环境 , 充分利用可信计算 、 安全多方计算 、 密码算法 、 生物识别等信息技术,建立健全兼顾安全与便捷的多元化身份认证体系 , 不断丰富金融交易验证手段,保障移动互联环境下金融交易安全 , 提升金融服务的可得性 、 满意度与安全水平 。
同时 , 《 规划 》 也提出强化需求引领作用 , 主动适应数字经济环境下市场需求的快速变化 , 在保障客户信息安全的前提下 , 利用大数据 、 物联网等技术分析客户金融需求 , 借助机器学习 、 生物识别 、 自然语言处理等新一代人工智能技术 , 提升金融多媒体数据处理与理解能力 , 打造 “ 看憧文字 ” 、 “ 听懂语言 ” 的智能金融产品与服务 , 这也为人脸识别的安全应用提供了思路 。
2019 年 9 月 , 工业和信息化部公开征求对 《 关于促进网络安全产业发展的指导意见 》 ( 征求意见稿 ) , 表示支持构建基于商用密码 、 指纹识别 、 人脸识别等技术的网络身份认证体系 , 着力提升支撑网络安全管理 、 应对有组织高强度攻击的能力 , 明确了生物特征识别技术在网络安全产业发展中的重要意义 。
2020 年 11 月初 《 中华人民共和国国民经济和社会发展第十四个五年规划纲要 ( 建议稿 ) 》 ( 以下简称 《 建议稿 》 ) 全文发布 , 其中明确提出加快壮大新一代信息技术 、 生物技术等产业 , 推动互联网 、 大数据 、 人工智能等同各产业深度融合 , 培育新技术 、 新产品 、 新业态 、 新模式 。
发展数字经济 , 加强数字社会 、 数字政府建设 , 提升公共服务 , 社会治理等数字化智能水平 。同时提出 , 统筹发展和安全 , 建设更高水平的平安中国 , 加强社会治安防控体系建设 。该规划的出台为人脸识别技术和行业未来 5 年的发展规定了目标和方向 。
信息安全层面 , 2016 年 11 月全国人大通过的 《 网络安全法 》 中将个人生物识别信息的管理进一步细化 , 范围进一步明确 。国家网信办有关负责人表示,《 网络安全法 》 的公布和施行不仅保障广大群众的切身利益 , 还有利于高新技术的应用 , 进而激发互联网的巨大潜力 。
2020 年 7 月由全国人大公布的 《 数据安全法 》 草案为数据加上 “ 防护罩 ” , 明确数据活动的红线 , 将来在 “ 数据主权 、 数据经营 、 数据交易 ” 等方面 , 通过法律条文的形式 , 推动数据时代的快速发展 。国家坚持保障数据安全与发展并重 , 鼓励研发数据安全保护技术 ,积极推进数据资源开发利用 , 保障数据依法有序自由流动 。
2020 年 10 月 21日全国人大公布的 《 个人信息保护法 ( 草案 ) 》 规定了个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息 ;规定了个人信息的处理包括个人信息的收集 、 存储 、 使用 、 加工 、 传输 、 提供 、 公开等活动的要求 。
02.
技术细节
1、 人脸识别技术原理
当今主流的人脸识别算法 , 主要包括人脸检测 、 人脸预处理 、 特征项提取 、比对识别 、 活体鉴别五大步骤 。其中人脸检测 、 人脸预处理 、 特征项提取可统称为人脸视图解析过程 , 即从视频和图像中检测出人脸 , 通过图像质量判断 ,选取合适的人脸图片 , 提取人脸特征向量 , 用于后续比对识别 ;比对识别处理可以分为人脸验证 ( 1 :1 ) 和人脸辨识 ( 1 :N ) 两类 ;活体鉴别算法用以判断人脸识别处理中的人脸图像 , 是否采集自真实人体 。
在实际应用中 , 除了上述人脸识别算法 , 前端视图采集技术 、 人脸数据存储技术 、 应用软件管理技术也是人脸识别技术应用中重要的技术部分 。
2、 人脸识别的研究机构介绍
人脸识别作为最受关注的生物特征识别技术 , 国内外有众多科研院所 、 高等院校 、 企业等机构开展人脸识别相关技术的研究 、 开发和应用 。截止 2020年 10 月 , 据企查查数据统计 , 全国共有 10443 家企业的名称 、 产品 、 品牌 、经营范围涵盖 “ 人脸识别 ” , 从成立时间来看 , 近 5 年相关企业数量不断剧增 ,2019 年成立了 1955 家,2020 年仅 10 月前就新增 1139 家 。
科研机构。人脸识别技术广受学术和产业研究机构关注 。全球范围内 , 有众多知名学术机构在从事人脸识别领域的技术研究 , 比较有代表性的人脸识别技术研究机构包括斯坦福大学 、 加州大学伯克利分校 、 美国马萨诸塞大学 、 牛津大学 、 多伦多大学 、 香港中文大学 、 中科院自动化所 、 清华大学等 。
(1)、斯坦福大学。斯坦福大学是最早在人脸识别技术上取得突破的研究机构之一 。由华人科学家李飞飞教授领街的计算机视觉实验室 , 通过每年度基于 ImageNet 数据库举办的大规模视觉识别挑战赛 ( ILSVRC) , 极大的促进了人脸识别和计算机视觉技术的发展 。
近期 , 斯坦福大学的研究团队研发出一款人脸跟踪软件 Face2Face, 它可以通过摄像头捕捉用户的动作和面部表情 , 然后使用 Face2Face 软件驱动视频中的目标人物做出一模一样的动作和表情 , 效果极其逼真 。这项技术使用一种密集光度一致性方法 (dense photometric consistency measure) 来实时跟踪源和目标视频中的面部表情 。
研究人员们称 ,由于源素材与被拍摄者之间快速而有效的变形传递 , 从而使复制面部表情成为可能 。由于嘴形与其所说的内容高度匹配 , 因此可以产生非常准确 、 可信的契合 。
(2)、加州大学伯克利分校。加州大学伯克利分校是国外人脸识别技术研究的重要发源地 , 早在 2005年就有关于人脸识别相关研究的理论工作 。其中马毅 2008 年发表的 Sparsity and Robustness in Face Recognition, 在谷歌学术已获得 6321 余次的引用 , 在深度神经网络被大家广泛应用之前 , 是主流的人脸识别算法 。在这篇文章中作者把稀疏表示理论应用到人脸识别这个场景中 , 提出了一个通用分类算法用于人脸识别 。
这个新的框架为人脸识别领域的两个关键课题(特征项提取和对遮挡的鲁棒性)上提供了更好的理论指导。此外,该实验室近期在用低维模型处理高维数据、 特征选择等理论方向上有一定的产出, 提出了一种新型特征选择方法 (Conditional Covariance Minimization, CCM) , 该方法基于最小化条件协方差算子的迹来进行特征选择, 取得了较为突出的效果 。
(3)、美国马萨诸塞大学。美国马萨诸塞大学也是国外人脸识别技术研究的重要发源地 , 开源了知名的人脸检测数据库 FDDB 和人脸识别数据集 LFWo FDDB 是全世界最具权威的人脸检测评测平台之一 , 其中包含 2845 张图片 , 共有 5171 个人脸作为测试集 。测试集范围包括不同姿势 、 不同分辨率 、 旋转和遮挡等图片 , 同时包括灰度图和彩色图 , 截止到目前 FDDB 所公布的评测集仍然代表了目前人脸检测的世界最高水平 。
马萨诸塞大学还在 2007 年建立了人脸识别评测数据集 LFW, 用于评测非约束条件下的人脸识别算法性能 , 截至到目前是人脸识别领域使用最广泛的评测集合 。该数据集由 13000 多张全世界知名人士互联网自然场景不同朝向 、 表情和光照环境人脸图片组成 , 共 5000 多人 , 其中 1680 人有 2 张或 2张以上人脸图片 。每张人脸图片都有其唯一的姓名 ID 和序号加以区分 。LFW测试正确率 , 代表了人脸识别算法在处理不同种族 、 光线 、 角度 、 遮挡等情况下识别人脸的综合能力。
(4)、牛津大学。牛津大学 VGG (视觉几何)组实验室从 2015 年开始人脸识别相关研究 ,包括具有影响力的人脸数据库的发布以及深度人脸识别算法的研究 。该实验室 2015 年在 BMVC 发表的 a Deep Face Recognition" 论文在谷歌学术已获得3600 余次的引用 , 其中发布的 VGG-Face 已成为深度人脸识别领域最常用的数据库之 一 。
2018 年发布了大规模人脸识别数据 VGG — Face2, 是 VGG-Face的第二个版本 , 包含 331 万图片 , 9131 个 ID, 平均图片数为 362.6, 且覆盖了大范围的姿态 、 年龄和种族等 。VGG-Face2 发布两年 , 已经获得了 800 余次引用 。此外 , 该实验室近期在人脸识别置信度预测 、 基于集合的人脸识别等子方向上 , 每年产出一定量的学术工作 。
(5)、多伦多大学。加拿大多伦多大学是基于深度学习的人脸识别技术发展的重要推手之一 。著名 “ 神经网络之父 ” Geoffrey Hinton 是该校的代表性学者 , 在 Hinton 的带领下 ,多伦多大学的研究者将反向传播 (Back Propagation) 算法应用到神经网络与深度学习 , 通过应用这项算法技术 , 人脸识别技术的识别性能得到极大提高 。
近期 , 多伦多大学的研究人员在人脸识别隐私保护技术领域取到了一些新的进展 , 开发了一种动态干扰算法来进行人脸隐私保护 。这种技术原理基于 “ 对抗性训练 ” , 通过建立起两种相互对抗的算法 , 当发现某种检测算法正在寻找脸部特征 , 干扰算法会自动调整这些特征 , 在照片中产生非常细微的干扰 , 通过这些干扰来阻碍整个检测系统的检测效果 。
(6)、香港中文大学。作为最早投入深度学习技术研发的华人团队 , 在多年布局的关键技术基础之上 , 香港中文大学教授汤晓鸥率领的团队迅速取得技术突破 。2012 年国际计算视觉与模式识别会议 ( CVPR ) 上仅有的两篇深度学习文章均出自其实验室 ;2011-2013 年间在计算机视觉领域两大顶级会议 ICCV 和 CVPR 上发表了 14 篇深度学习论文 , 占据全世界在这两个会议上深度学习论文总数 ( 29 篇)的近一半 。他在 2009 年获得计算机视觉领域两大最顶尖的国际学术会议之一 CVPR最佳论文奖 , 这是 CVPR 历史上来自亚洲的论文首次获奖 。
(7)、中科院自动化所。中科院自动化所是国内领先的模式识别领域研究机构 。多年来 , 在人脸识别领域开展了广泛的研究 。自动化所李子青研究员领导的人脸识别研究团队 ,提出了基于近红外的人脸识别技术 , 对光照变化影响的处理有较好的效果 ,并将该技术应用于 2008 年北京奥运会安保项目 。
自动化所孙哲南研究员团队 , 在生成对抗网络基础上提出高保真度的姿态不变模型 (High Fidelity Pose Invariant Model, HF — PIM) 来克服人脸识别任务中最为经典的姿态不一致问题 。实验结果表明 , 该方法在基准数据集上的表现的视觉效果和定量性能指标都优于目前最好的基于对抗生成网络的方法 。此外 , HF-PIM 所支持的生成图像分辨率也在原有方法的基础上提升了一倍 。
(8)、清华大学。清华大学是国内最早从事人脸识别技术研究的研究机构之一 。清华大学苏光大教授 , 自 1980 年代就开始了人脸识别技术研究工作 。苏教授提出了 1 :1 图像采样理论和邻域图像并行处理机理论 , 并在 2005 年通过多计算机并行处理技术 , 显著提高了人脸识别处理的性能 。
这项技术与 2012 年由多伦多大学 Hinton 团队提出的利用并行计算来提高反向传播算法的运算效能有异曲同工之妙 。同时 , 苏教授团队提出了最佳二维人脸 、 不同类别的多特征描述以及MMP — PCA 等一系列人脸识别的理论和方法 。
科技类企业。在人脸识别技术研究领域 , 众多科技类企业也起到了至关重要的作用 。微软亚洲研究院较早就开始了人脸识别技术研究 , 发表了大量优秀的学术论文 ,2018 年 , 微软亚洲研究院提出的深度学习残差网络 RESNET, 在研究领域得到了广泛认可 ;苹果公司在人脸识别技术上进行了深入研究 , 自 2017 年开始 ,就在其 iphoneX 手机上引入了刷脸解锁功能 ;
日本电气 (NEC) 公司也是国际上人脸识别技术的先 行者之 一 , 很早就提出了基于人脸识别技术的公共安全解决方案 ;
国内有 “ 人工智能四小龙 ” 之称商汤 、 旷视、 依图 、 云从等企业 , 在人脸领域 , 从学术研究到产业实践 , 都做了大量的工作 , 在复杂场景 , 大规模处理等领域 , 不断取得新的成果 ;国内传统科技企业百度 、 阿里 、 腾讯 、 平安科技 、 海康 、 大华等 , 也在人脸识别技术领域开展广泛深入的研究 , 并结合其原有的业务领域的场景 , 取得显著的技术研究成果 。
3、人脸识别技术优势及局限性
技术优势。在不同的生物特征识别方法中 , 人脸识别技术有其自身特殊的优势 , 因而在生物识别中有着重要的地位 。
(1)、 非侵扰性 , 人脸识别无需干扰人们的正常行为就能较好地达到识别效果 , 只要在摄像机前自然地停留片刻 , 用户的身份就会被正确识别 。
(2)、便捷性 , 人脸识别采集设备简单 , 使用快捷 。一般来说 , 常见的摄像头就可以用来进行人脸图像的采集 , 不需特别复杂的专用设备 。图像采集在数秒内即可完成 。
(3)、友好性 , 通过人脸识别身份的方法与人类的习惯一致 , 人和机器都可以使用人脸图片进行识别 。
(4)、非接触性 , 人脸图像采集 , 用户不需要与设备直接接触 。另外 , 可以在比较远的距离进行人脸图像的采集 。装配了光学变焦镜头的摄像头 , 焦距可以提高到 10 倍以上 , 使景深范围扩展到 50 米以外 , 实现对远景清晰拍照 ,有效采集远处的人脸图像 。
(5)、可扩展性 , 在人脸识别后 , 通过对识别结果数据进行下一步处理和应用 , 可以扩展出众多实际应用方案 , 如应用在出入门禁控制 、 人脸图片搜索 、上下班刷卡 、 非法人员识别等各个领域 。
(6)、隐蔽性强 , 安全领域对于系统隐蔽性有较强要求 , 人脸识别在这方面比指纹等方式更具优势 。
(7)、强大的事后追踪能力 , 系统记录的人脸信息是非常重要且易于利用的线索 , 更加有利于进行事后追踪应用 。
(8)、准确度高 , 相比于人体 、 步态等其特征 , 人脸特征具备更强的鉴别性与更低的误报率 , 所能应用的底库规模上高出许多 , 目前超大规模 ( 十亿级别 ) 的人脸检索已经可以实用 。
技术局限。人脸识别技术由于相似脸 、 年龄 、 算法偏见 、 面临的场景多样化以及人脸图像更易公开获取等原因 , 技术本身也面临着一定的局限性 。
(1)、相似脸较难解决 。双胞胎或者长相很相近的人脸容易识别错误 , 而该问题在目前暂时没有新技术能完全解决 。NIST 分析报告指出 , 大部分情况下双胞胎仍能区分分数高低 , 但是往往都在阈值之上 , 在开放环境下应用效果较差 。
(2)、算法偏见问题 。由于当前人脸识别算法很大程度依赖于数据样本 ,但是不同人群的人脸数据样本存在差别 , 这导致了算法对不同地域 、 不同年龄人群的识别能力有差别 。
美国国家技术标准研究院 NIST 的检查表明 , 人脸识别软件在不同地域 、 种族 、 性别 、 年龄上存在较大差异 。比如 , 小孩子 , 老年人以及其他很少出现的人种或者肤色的人脸识别率相对较低 , 该问题亟需解决 。
(3)、人脸识别率易受多种因素影响 。现有的人脸识别系统在用户配合 、采集条件比较理想的情况下可以取得令人满意的结果 。但是 , 在用户不配合 、采集条件不理想的情况下 , 会影响现有系统的识别率 。例如根据 NIST 的测试报告 , 戴口罩情况下大部分算法的错误率会提高 1 个数量级以上 , 跨年龄 、 大角度等因素也会造成不同程度的下降 。
(4)、年龄变化的影响 。随着年龄的变化 , 面部外观也会变化 , 特别是对于青少年 , 这种变化更加明显 。对于不同的年龄段 , 人脸识别算法的识别率也不同。
(5)、安全性问题 。人脸识别系统信息存储同样会面临黑客的攻击 。所以对数据加密很重要 。随着技术的不断提升 , 人脸识别技术在安全性上需要加强 。
同时 , 人脸暴露度较高 , 相比对其它生物特征数据更容易实现被动采集 。这也同时意味着人脸信息的数据更容易被窃取 , 不仅可能侵犯个人隐私 , 还会带来财产损失 。大规模的数据库泄露还会对一个族群或国家带来安全风险 。
4、 人脸识别技术的发展趋势
随着人脸识别技术的广泛应用 , 也在不断促进技术本身持续发展 。基础算法研究 、 人脸重建技术 、 戴口罩人脸识别 、 3D 人脸识别技术 、 新型人脸采集技术 、人脸聚类技术 、 和低质量人脸识别技术 , 是产业界和学术界关注的热点课题 ,也预示了人脸识别技术的发展趋势 。
基础算法技术热点包括模型结构设计 、 损失函数设计 、 无监督 / 半监督学习算法和分布式自学习算法等 。模型结构设计目前主要有手工设计与网络结构搜索 (NAS) 两种思路 。ICCV 2019 轻量级人脸识别 (Lightweight Face Recognition) 竞赛结果显示 , 虽然对大模型场景下结构改进带来的提升则较为有限 , 但是轻量级场景下网络结构改进对于识别率提升较为明显 。
损失函数设计的核心在于学习具备鉴别性且足够鲁棒的特征 。近年来基于度量学习与各类 margin — based 方法逐渐成为主流。在特征提取加速方面 , 主要的方法有轻量级网络 、 模型蒸惚 、 稀疏量化等 ;在特征比对加速方面 , 主要的思路有量化以及各类近似最近邻检索技术 。
低质量人脸识别技术。在实际的动态应用场景下 , 人脸识别技术由于场景的不可控因素 , 采集到的图片质量与训练图片的质量有很大差异 , 如人脸偏转 , 大幅度侧脸 ;运动模糊和失焦模糊 ;遮挡物(例如口罩 , 墨镜) ;低的光照强度和对比度 ;视频传输由于编解码过程产生的人脸信息丢失等 , 这些因素导致准确率极度下降 。
针对这些具体问题 , 研究人员提出综合利用各种图像增强技术和图像生成技术对人脸识别算法准确率进行提升的方法 , 如采用对抗式生成网络对摄像头的风格进行迁移 , 采用基于深度学习的方法对小尺寸模糊人脸进行超分辨率重建和基于注意力机制对人脸图片进行去模糊处理等 。
此外 , 3D 人脸识别技术也可以有效解决复杂场景下人脸单模态鲁棒性不足问题 , 如大角度 、 遮挡引起的效果下降问题 , 常用的融合策略有相似度融合 、 特征融合 、 决策融合等 。
戴口罩人脸识别技术。今年新型冠状病毒疫情期间戴口罩人脸识别受到较大关注 。常用的解决方法有数据增强 、 遮挡恢复 、 多部件模型融合等 , 可应用在人脸布控 、 陌生人检测 、 无感通行中 , 均不需要摘下口罩 , 在 30 万人像库的规模下 , 戴口罩人脸识别准确率可大于 90% 。
人脸聚类无论是在个人领域的相集管理还是在智慧城市治理领域都有较为广泛的应用 。早期主要基于传统的聚类方法如 k-means 等 , 但效果不佳 。近年来 , 基于 GCN 的人脸聚类方法崭露头角 。实际业务中 , 时空信息的挖掘也是研究的热点 。
特定群体识别技术。针对儿童/老人 、 不同肤色群体的人脸识别 , 有标签的数据较少 , 而无标签的数据更多些 。研究人员提出可以利用半监督/无监督学习方法带来性能的进一步提升 。同时 , 对抗 、 域适应等方法也是研究人员较为关注的方法 。在特定群体识别中 , 应考虑如何方便老年人使用人脸识别系统 。
为了防范照片 、 视频 、 头模等假体对人脸识别系统的攻击 , 呈现攻击检测算法也是研究的热点 , 主要检测原理包括 :
a ) 离散图像检测方式 , 即利用一幅或多幅图像进行判断 ;
b ) 连续图像检测方式 , 即采用连续图像序列进行判断,如检测显示器边缘 、 边框 、 屏幕反光 、 像素点 、 条纹分析等进行判断 ;
c ) 用户主动配合检测方式 , 即通过指令要求用户完成相应动作如点头 、 抬头 、左右转头 、 张嘴 、 眨眼 、 跟读屏显提示信息等进行判断 ;
d ) 基于辅助硬件设备的检测方式 , 即利用辅助硬件设备获取更多判断依据辅助进行判断 , 如利用深度摄像头采集人脸深度信息或利用特定波长光源投射并检测在皮肤或非皮肤材质上产生的发射率差异等 ;
e ) 用户被动配合检测方式 , 如 :利用静脉血管 、 肌肉 、骨骼 、 静脉血液中脱氧血色素对红外线的吸收特性 , 判断其是否来自活体 ;通过特定指令引导用户眼球运动 , 并通过跟踪眼球运动以判断是否为真实活体 。
多模态融合识别技术。多模态融合识别技术可以有效解决复杂场景下人脸单模态鲁棒性不足问题 。如大角度 、 遮挡 、 像素过低引起的效果下降问题或应用场景对于安全性可靠性要求很高的场景 , 多模态可以增强识别的可信度 。
多模态识别有两个发展方向 , 一个方向是在脸部图像特征识别的基础上 , 增加头肩和形体的识别 , 这种技术的好处是可以不必增加额外的采集单元 ;另外一个方向是 , 融合其他生物识别模态 , 如静脉纹理 , 声纹信息等 , 这种技术除了能够提高算法的鲁棒性之外 , 还可以提高活体验证的可信度 , 在行业里受到了较为广泛的关注 。
03.
行业发展
1、行业发展概述
随着云计算 、 大数据 、 物联网 、 人工智能等计算机科学技术的飞速发展以及人脸识别技术在实际应用中的不断成熟 , 人脸识别技术在智慧安防 、 智慧城市 、 智能家居 、 移动支付等领域继续大放异彩 , 并且人脸识别的一些新应用场景也不断地被挖掘出来 。
全球人脸识别行业规模依然在以非常高的速度进行增长 。根据MarketsandMarkets 发布的全球人脸识别市场相关报告 , 预计全球人脸识别市场规模将从 2019 的 32 亿美元增长到 2024 年的 79 亿美元 , 在预测期内( 201 9-2024 年 ) 将以 16.6% 的复合年增长率进行增长 。
国内方面 , 中国人脸识别技术投入在 2017-2018 年达到巅峰 , 根据 IHSMarkit 的数据 , 2018 年 , 中国在全球人脸识别市场的业务占据了将近一半的份额 。2019 至 2020 年 , 人脸识别技术发展趋于平缓 , 进入理智期 。依据 IT 桔子数据统计 , 截至目前 , 中国人脸识别技术总投资额达到 406 亿元 。前瞻产业研究院预计 , 未来五年人脸识别市场规模将保持 23% 的平均复合增长速度 ,到 2024 年市场规模将突破 100 亿元 。
2、 行业发展现状
人脸识别产业链以人脸识别算法作为中间层 , 其上游为器件 、 通用硬件 、基础软件 , 上游提供了人脸识别算法的输入 、 训练 、 开发和运行环境 ;下游为设备和产品 , 最终体现为解决方案 , 下游是人脸识别算法的产品形态 。
从产业链上游来看 , 国内厂商 ( 以华为 、 寒武纪为代表 ) 在芯片设计方面有较强实力 , 在芯片制造方面 , 除去手机等对芯片精密程度要求较高的设备 ,国内厂商具备制造芯片的能力 。但高端芯片的制造工艺以及基本元器件都被国外垄断 , 成为制约上游厂商发展的瓶颈 。
从人脸识别算法层面来看 , 国内厂商具备优势 , 但数据隐私问题 、 人种 /地域带来的算法性能公平性问题 , 是国内厂商急需解决的问题 。
产业链下游 , 人脸识别应用越来越广泛 , 甚至出现过度滥用盗取用户隐私的事件 。黑客攻击 、 非活体攻击对人脸识别系统安全性也提出了挑战 , 用户隐私保护和安全性成为掣肘 , 急需相关政策法规来规范市场 。
基础器件:
通用处理器。目前 , 通用处理器主要包括 x86 、 ARM 、 RISC — V 三大系列 。x86 处理器仍是服务器端主处理器的首选 。出于稳定性考虑 , Intel 的 xeon 系列占据了市场的主导地位 , AMD 鲜有应用 , 反而国内的海光 、 兆芯的 x86 处理器因国产化替代等原因得到了少量的份额 。ARM 处理器是手机等智能终端的首选 , 随着性能提升和软件生态的完善 , ARM 处理器也逐渐向服务器扩张 , ARM 公司也推出了一系列高性能核心和 Server Reday 认证支持这一举措 。
应用于智能终端的 ARM 芯片的代表包括海思的麒麟系列 、 高通的骁龙系列 、 联发科的 MTK 和瑞芯微的 RK 等 ;应用于服务端的 ARM 芯片的代表包括海思的鲤鹏芯片和飞腾的腾云 S 系列等 。RISC V 是开源的处理器架构 , 随着美国对中国高科技领域的打压 , 该架构也成为国产化的重要选择 。
平头哥推出的铉铁 910 芯片就是采用RISC — V 架构 , 中天微和小米松果电子也在做 RISC-V 的相关工作 。国内主流的通用处理器还包括采用 MISP 架构的龙芯和采用 Alpha 架构的申威 。总体来说,在通用处理器领域的选择相对丰富 , 以海思为代表的国内芯片设计公司已经走到与国外老牌芯片设计公司对等的位置 , 主要问题在于先进制程的芯片代工制造的风险 。
AI 加速 SOC。与采用 GPU 的通用并行计算不同 , AI 加速 SOC 是通过内置专门针对 AI 算法设计的加速单元 , 实现针对 AI 的高运算效率 , 随着人工智能落地快速崛起的专用芯片 。
NVIDIA 最早针对 GPU 通用并行计算建立了 CUDA 生态环境 , 使其成为 AI 落地最大的算力提供商 , 也在 AI 进一步发展阶段 , 适时推出了面向张量运算的 TensorCore 和面向深度学习的 NVDLA 加速单元 , 进一步巩固了其在 AI 加速领域的地位 。Google 依赖其软件优势 , 推出了与 Tensorflow 紧密结合的 TPU, 但是除了 Google 大规模使用外 , 并没有得到市场的广泛应用。
海思在 AI 加速领域也是颇有建树 , 先后推出了 hisi 35xx 系列芯片和昇腾系列芯片 。定位端侧的 hisi 35xx 系列 Al 加速芯片主张图像 +AI 合一 SOC 设计,能提供 0.5TOPS 〜 4TOPS 不等的算力 , 在平安城市 、 交通 、 电力 、 人脸门禁 、车载等市场广受青睐 ;定位边缘侧和云中心的昇腾系列 AI 加速芯片能够提供16TOPS-512TOPS 不等的算力 , 具有算力高功耗低的特点 , 鲍鹏+昇腾的专用服务器也在数据中心取得应用 。
中科院背景的寒武纪 , 依托在芯片领域的深厚积累 , 成为科创版第一个上市的 AI 芯片公司 , 其推出的 MLU220 和 MLU270 芯片分别能够提供 8TOPS 和128TOPS 的算力 , 也已经在多个行业取得应用 。除寒武纪以外 , 还有众多创业公司切入 AI 加速 SOC 的赛道 , 如地平线的征程 、 旭日芯片 , 依图的求索芯片等 。与通用处理器类似 , 国内不乏能够设计顶级 AI 加速 SOC 的厂商 , 主要风险在于先进制程芯片的代工制造 。
CMOS 传感器。视频图像的采集质量 , 直接关系到人脸识别系统的准确率 , 而视频图像的采集 , 则离不开 CMOS 传感器 。目前主流的 CMOS 传感器的供应商包括索尼 (SONY) 、 三星 ( SANSUNG ) 、 豪威科技 (Ominivison) 和安森美 (ON Semiconductor ) 等 。
其中 SONY 以其长期的技术积累 , 无论是消费电子还是安防等专业应用领域 , 都占据了较高的市场份额 。三星主要应用于手机等消费电子 , 豪威科技和安森美则集中在安防 、 汽车电子专业领域发力 。国产 CMOS的选择有中星微 、 格科微等 , 不过目前主要仍然应用在 USB 摄像头等一些消费领域 , 尚未进入专业市场 。
随着疫情的发展 , 测温需求快速爆发 。热成像传感器是一种特殊的成像传感器 , 因其属于军民两用的特性 , 国内传统供应商包括高德红外 、 大立科技等 。海康威视以创新业务的方式持续加大在热成像传感方面的投入 , 今年 4 月更是从福建安芯半导体采购光刻机用于热成像传感芯片的生产 。大华股份则于2018 年与FLIR建立合作 , 切入此项业务 。
存储芯片。存储芯片在智能终端中占据了较大一部分成本 , 具体包括 RAM 芯片和 FLASH 芯片 , 其中 FLASH 芯片又可以进一步分为 NOR FLASH 和 NAND FLASH 。
面向通用服务器的 RAM 芯片的供应商主要包括三星 ( SANSUNG ) 、 海力士 ( Hynix ) 等 , 因规模效应 , 韩系供应商的地位难以撼动 。面向嵌入式设备的选择更加丰富 , 合肥长鑫和紫光半导体等国内厂家也在积极投入 , 已经进入到投产阶段 。
与 NAND FLASH 广泛应用于 SSD 相比 , NOR FLASH 则相对小众 , 主要应用于嵌入式设备 。我国的兆易创新是该领域的主流供应商之一 , 占据全球第四的市场排名 。NAND FLASH 与 RAM 类似 , 具有通用性 , 是半导体行业的必争之地 , 除三星和海力士之外 , 东芝 、 镁光 、 西部数据等也都是这一领域的角逐者 。国内的长江存储推出了与主流产品性能相当的 64 层 3D NAND, 并在华为mate 系列高端手机中取得了应用。
其他器件。其他的应用于人脸识别行业的器件则与通用的电子行业类似 , 主要包括电源芯片 、 电阻 、 电容 、 电感 、 PCB 敷铜板等 。总体来说 , 国内的供应基本可控,但在高精度要求方面 , 仍需要借助国外供应商 。在全球化产业链高度发展的今天 , 各个领域都有深度耕耘者 , 全球化采购最优器件 , 仍然度的最佳选择 。
通用硬件:
通用服务器。通用服务器在人脸识别系统中的主要作用是业务系统和管理节点 , 从软件生态的完备性角度 , 通用服务器以 X86 架构为主 , 但 ARM 、 RISC-V 等其他架构的服务器已经崭露头角 。x86 服务器的供应商主要包括 Dell 、 联想 、 曙光 、浪潮等 , 华为的泰山服务器则是 ARM 架构的典型代表 。
计算服务器。AI 服务器是采用异构形式的服务器 , 出于生态友好和总算力高两方面因素,目前的主流方案仍是 Intel x86CPU+Nvidia GPU, 最新的 8 卡 T4 GPU 服务器 ,能够提供 1040T ( 单卡 130T ) 的算力 。随着专门为 AI 计算设计的 SOC 的成熟,采用 SOC 作为加速卡也成为性价比和功耗比更优的选择 。在 Al SOC 的选择面上 , 国内已然走在行业前列 , 如华为的昇腾 310 芯片 , 单颗算力 16T, 四颗组成半高的计算卡总算力 64T, 但相同算力下功耗只有 GPU 的 l/7o 其他的如寒武纪的 MLU220 和 MLU270 、 比特大陆的算丰芯片等 , 也都已经取得了应用 。
存储服务器。存储服务器是人脸识别系统中的重要构成 , 是专门针对存储任务进行优化的专用设备 。在硬件形态上 , 其主要特点是硬盘多 , 通常包含 8 至 48 块硬盘 。为了保证效率 , 硬盘通常以 SAS 硬盘或者 SSD 为主 。SAS 硬盘的主要供应商以希捷和西部数据为主 , SSD 的供应商则更为丰富 , Intek 三星以及国内的存储厂商也积极参与 SSD 的竞争 。存储服务器针对软件的优化主要是采用 RAIDs多机分布式等增加存储数据的安全性 , 相关技术相对成熟 。
智能终端。包括智能手机 、 智慧屏在内的通用智能终端 , 是人脸识别应用的重要领域 。从操作系统层面将智能终端分为两大类 , 一类是采用自有 iOS 系统的 iPhone,牢牢占据了市场占有率的榜首 , 另一类则是应用更加广泛的 Android 系统的设备,又以华为占据 Android 榜单的榜首 , 我国的小米 、 OPPO 、 vivo 也是建树颇丰 。值得注意的是 , 华为和苹果是仅有的两家能够从芯片到操作系统再到软件生态全流程优化的供应商 , 在一定程度上解释了这两家企业的竞争优势 。
基础软件:
训练框架。目前人脸识别算法大多基于深度学习技术 , Tensorflowx Pytorch 、Mxnet 、 Caffe 是最常用的训练框架 。由于人脸识别存在类别大 、 loss 多样等特点 , 在上述深度学习框架基础上需要结合人脸识别本身的特点进一步的优化扩展 , 其中代表性的开源框架为 lnsightface。在工业界 , 各企业内部往往也有各自的训练平台 , 以实现数据 、 训练 、 部署等环节的协同 , 一些优秀的内部框架也在逐步开源 。但由于训练框架切换学习成本高 , 整体的生态建设仍待加强 。
推理引擎。推理引擎与训练框架相对应 , 主要用于模型在设备端的高效 ( 前向 ) 运行 。一些训练框架会配套对应的推理引擎 , 也有一些独立于训练框架的推理引擎软件 。此外 , 深度学习芯片也会提供各自的推理引擎软件实现加速 。由于推理引擎往往针对特定结构或者硬件深度优化 , 对于一些新型的网络结构扩展性较差或者优化效率不高 , 容易导致一些新算法无法快速落地 。
其他环节。人脸识别完整流程除深度学习神经网络外还包括图像预处理 、 特征后处理等流程 。目前缺乏效果且通用的实现方式 , 尤其是在芯片端 ,征比对之类图像处理和数学运算类的功能缺失 , 增加开发成本性能损失 。
算法技术:近年来随着深度学习的发展 , 人脸识别技术取得了突破性进步 , 全球范围内相关研究团队众多 , 以中美俄日欧等国家和地区较为领先 。根据 NISTFR 町2020 年 10 月的测试结果 , 全球排名前 10 的算法半数以上来自中国 。
虽然各国的人脸识别算法有性能上的差异 , 但差距并不大 。以 FR 町 VISA测试集为例 , 百万分之一误报对应正确率前 30 厂家性能都已超过或者接近99% 。人脸识别的技术发展已由注重算法精度提升向以改善实际应用效果的方向转变 , 并出现了以下应用趋势 。
由简单场景向复杂场景转变。简单场景人脸识别精度趋于饱和已经成为业界的共识 , 业界将注意力转移到复杂场景人脸识别问题并表现在具体应用场景上 。从高分辨率 、 小姿态 、 光照适中的优质人脸卡口场景转变到低分辨率 、 大姿态 、 低照度 、 模糊等低画质开放式场景 , 这对人脸识别算法适应能力提出了新的挑战 , 也是业界努力提升的方向 。
3D 人脸成为配合式应用的重要方向,随着 2017 年 iPhone X 首次将 Face ID 引入手机端 , 3D 人脸识别技术逐渐成为手机厂商旗舰机型的标准配置 。相比于 2D 人脸 , 3D 人脸包含更为丰富的人脸信息 , 对旋转 、 遮挡 、 光照 、 照片攻击等具有更好的抗干扰能力 。在以门禁考勤 、 金融支付为代表近距离配合式应用中 3D 人脸逐渐成为常用的技术解决手段 。
多生物特征融合成为新的趋势。多生物特征融合能弥补单生物特在的不足 , 实现优势互补 , 提升系统精度,改善应用体验 。在近距离配合式应用中 , 采用人脸识别与虹膜识别技术融合可解决双胞胎等人脸识别难以解决的问题 , 增强双胞胎金融支付应用的安全 ;在安防场景 , 相机角度 、 分辨率等问题存在人脸质量较差以及获取不到人脸等情况 , 步态识别 、 行人重识别等技术的融入能进一步扩大整个身份识别系统的算法边界 。
人脸识别公平性问题亟待解决。由于安全隐私顾虑 、 经济科技水平落后和贸易壁垒等因素 , 人脸识别技术在全球的整体普及程度仍然偏低且存在发展不平衡现象 。根据 NIST 的分析报告 , 欧美 、 亚洲为人脸识别技术主要供应商 , 各国算法优化主要依赖本国环境,跨人种 、 跨地域 、 跨场景等仍会给人脸识别算法带来一定影响 。除了准确率的持续优化 , 全球范围内安全隐私 、 公平性等问题亟待解决。
设备及产品:
人脸抓拍机:人脸抓拍机内置 AI 芯片和深度学习算法 , 适应于人流密集的通道 、 出入口等多种场景需求 , 实现对人群中人脸的精准捕捉 。人脸抓拍机目前已普遍部署在汽车站 、 火车站 、 机场 、 港口 、 娱乐场所 、 街道 、 社区等人员复杂场景的重点监控区域 , 对场景的适应性是其性能的重要指标 。在大姿态 、 遮挡 、 光照异常等复杂情况下的人脸抓拍成功率 , 在自然监控环境中误抓率都是设备性能体现 , 也是用户的选择依据 。
随着安防监控智能化的发展 , 捕捉更精细更全面的结构化信息成为趋势 。目前各大厂商都推出了抓拍人脸 、 人体 、 车辆 、 车牌等多维信息的面向视频结构化应用的抓拍机 , 多 AI 算法的集成以及多路实时抓拍的需求 , 要求前端设备厂商进一步压缩算法模型和提升芯片处理速度 。另外 , 前端设备脱离于后端服务器 , 功能从单纯捕捉信息到捕捉 、 分析 、 决策方向发展 , 这也符合智能前移为边缘节点赋能 , 让边缘感知信息的发展趋势。
门禁设备:门禁设备是以人脸识别技术为核心的身份识别终端产品 , 它集成了视频采集 、 人脸识别 、 证件识别 、 红外侦测及网络传输等多种功能 。目前市场上的门禁产品发展比较成熟 , 同质化严重 , 但也展露一些新趋势 。
随着门禁设备的普及化和民用化 , 安全问题越来越受到重视 , 防伪功能成为标配 。由于攻击方式多样性 , 即使配备防伪功能的设备也存在技术缺失或适应性差的问题 , 安全性能有待持续提升并完善 。今年由于疫情管控的需要 , 集成测温功能的门禁设备逐渐普及 。未来安全性和差异化满足个性化需求将成为门禁类产品的重要发展方向 。
网络硬盘录像机设备:网络硬盘录像机 (Network Video Recorder, NVR) 最主要的功能是通过网络接收 IPC (网络摄像机)设备传输的数字视频码流 , 并进行存储与管理 。NVR 设备内置人脸检测 、 人脸识别功能可提升存储数据的有效性以及关键数据的检索效率 , 目前已成为 NVR 设备的主要卖点 。
移动终端:随着刷脸功能的普及 , 手机逐步成为人脸识别的重要终端之一 , 通过手机即可完成刷脸登录和刷脸支付 。相对于传统的密码解锁和支付 , 刷脸具有更高的便捷性和安全性 。未来人脸识别在智能手机的普及率会进一步提升 , 也将有越来越多的手机应用借助人脸识别进行身份验证 。
人脸分析服务器:基于深度学习的人脸识别算法在实际应用中需要消耗大量的计算资源 , 长期以来 GPU 为首的通用架构芯片是进行深度学习计算最常用的计算资源 。然而 , GPU 服务器体积大 、 能耗高 , 在很多应用场景中已成为限制人工智能发展的瓶颈 。
基于人脸识别专用 ASIC 芯片的解析一体机或服务器 , 在性能 、 成本 、功耗 、 可靠性及适用范围等方面都具有明显的优势 。在很多实际应用场景中 ,专用解析一体机或服务器在提供同等算力的情况下 , 消耗更少的能量 , 占用更小的体积 , 发热量也更小 。例如搭载 “ 求索 ” 芯片的 1 台 1U 依图原子服务器无需英特尔 CPU, 与 8 卡英伟达 P4 服务器对比 , 解析路数相同情况下单路功耗不到后者的 1 0%。
人脸比对服务器:随着智慧城市 、 一人一档等人脸大数据应用 , 对人脸特征比对支持的库容规模 、 并发量 、 响应速度提出新的要求 , 随之产生专用的比对服务器 。GPU由于生态友好且算力高 , GPU 卡的比对服务器在各行业应用中有较大占比 。与分析服务器类似 , GPU 比对服务器存在体积大 、 功耗高的缺点 。
FPGA 芯片更合适人脸特征比对运算 , 具有大库容高并发的特点 , 基于 FPGA 的人脸比对服务器在性能 、 层本 、 功耗等方面皆具备明显优势 , 该类产品已崭露头角 。此外,随着 CPU 芯片计算能力和指令集的不断优化 , 芯片厂家和服务器厂家也在联合尝试基于 CPU 的人脸比对服务器产品 , 基于 CPU 的产品方案也值得关注 。
解决方案:
人脸识别系统业务功能主要包括人脸核验 、 人脸布控 、 人脸检索 、人脸聚类等 , 可以通过上述不同的设备构建不同的解决方案 。按照应用场景和数据规模 , 解决方案可以归纳为人脸考勤方案 、 人脸布控方案和人脸大数据应用方案 。
人脸考勤解决方案:人脸考勤解决方案可以由单个门禁设备构成 , 亦可由人脸抓拍机 +NVR 或人脸服务器的方式构成 , 包含人脸注册 、 人脸抓拍 、 人脸建模和人脸比对功能,并配备管理系统 , 具备考勤权限 、 数据存删 、 参数设置和隐私保护等功能 。
人脸布控解决方案:人脸布控解决方案 , 通常由人脸抓拍机+人脸分析服务器构成 。当单台人脸分析服务器不足以提供所需性能时 , 可以采用多集群方式 ;当系统需要接入传统 IPC 视频码流时 , 亦可在分析服务器实现人脸抓拍 。
人脸大数据应用解决方案:省级 、 全国级静态库检索 , 市 / 县级人脸聚类是常见的人脸大数据应用 ,其解决方案通常由人脸抓拍机+人脸分析服务器+人脸比对服务器构成 , 其系统通常为分布式系统 , 图像处理单元和特征比对单元按照应用所需的处理并发数进行部署 。该类系统通常与其他智能分析系统(如人体分析 、 步态分析)进行打通 , 并利用大数据分析技术进一步提升系统的可用性和整体性能。
不同厂家人脸产品形态有所差异 , 但其人脸产品的核心功能大同小异 , 因此由人脸产品组成的人脸识别系统功能和流程相对固定 , 上述解决方案具有极高的通用性 。产业链中基础层 、 算法和设备的发展主要在于提升人脸识别的效果和效率 , 不会影响整体功能和流程 , 解决方案是相对稳定的环节 。
3、典型应用领域
科技金融。人脸识别在金融领域的应用已经相当普遍 , 如远程银行开户 、 身份核验 、保险理赔和刷脸支付等 。人脸识别技术的接入 , 能有效提高资金交易安全的保障 , 也提高了金融业务中的便捷性。
2013 年芬兰公司 Uniqul 成为首批吃螃蟹的公司 , 面向全球首次推出人脸识别支付这一创新支付技术 。2015 年在德国汉诺威 CeBIT 展会上马云第一次向德国总理默克尔展示了支付宝的人脸识别支付技术 。同年 , 招商银行在一些支行柜面和ATM业务也开始应用人脸识别 , 随后包括建设银行 、 农业银行等四大行在内的数十家银行都纷纷将人脸识别产品引入ATM 、 STM 、 柜面 、 网点 、手机银行等各个业务环节 , 并逐渐全客户覆盖 。
时至今日 , 人脸识别技术在国内金融领域已经得到了非常广泛的部署和应用 , 消费者在各个渠道中都可以利用人脸识别技术使用金融服务 ,中国在人脸识别技术的应用上已经大幅度领先国外市场。
智慧安防。安防是人脸识别市场最早渗透 、 应用最广泛的领域 。根据亿欧研究 , 2018年 , 安防行业在中国人脸识别市场占比 61.2% 。当前人脸识别技术主要为视频结构化 、 人脸检索 、 人脸布控 、 人群统计等软硬件一体形态产品提供基础支撑,重点应用于犯罪人员的识别追踪 、 失踪儿童寻找 、 反恐行动助力等场景 。
视频监控系统通过庞大的监控网络进行图像采集 、 自动分析 、 人脸比对 , 基于视频帧的 1 :1 及 1 :N 人脸比对 , 可分析人员轨迹 、 出行规律等 , 实现重点人员的识别及跟踪 , 在公安应用场景中达到事前预警 、 事中跟踪 、 事后快速处置的目的 。在雪亮工程 、 天网工程 、 智慧社区 、 反恐及重大活动安保等公安项目发挥了重要的作用 。
此外 , 在企业楼宇 、 社区住宅的人员管理和安全防范需求场景下 , 人脸识别技术应用非常广泛 , 通过人脸的黑白名单录入 , 可有效管控区域人员出入 ,机器识别的高效率也大幅节省了人力资源。
智慧交通。国外的公共交通领域对人脸识别技术的应用主要集中在机场安检以及入境管理等特别强调安全的场景 。加拿大渥太华国际机场 、 澳大利亚当地移民及边境保护局与美国海关与边境保护局皆已尝试部署人脸识别出入境系统。
国内交通领域的人脸识别应用主要包括 1 :1 人脸验证和 1 : N 人脸辨识 。目前利用人脸核验证技术的刷脸安检已进入普遍应用阶段 , 在高铁站 、 普通火车站和机场皆已大面积推广 。而应用 1 :N 人脸比对技术的刷脸支付主要落地在地铁公交等市内交通 , 这种技术能够极大提高通勤人员的出行效率 , 释放大量的人力资源 , 提升出行体验 。同时 , 人脸识别可以对交通站点进行人流监测 ,根据人员出行规律预测交通人流高峰 , 提前做好疏导预案 。
除此之外 , 在交通违规管控方面 , 人脸识别技术可以帮助执法人员更快速高效地找到违规人员身份信息 , 并结合车辆识别等技术进行跟踪拦截。
民生政务。政务互联网平台、 公积金 、 社保 、 税务 、 网证 、 交通管理 、 行人闯红灯 、缴交交通罚款 、 住建等民生政务系统 , 已经使用或正在使用人脸识别系统 。政务服务领域的业务点主要有私有云平台搭建 、 政务服务自助终端 、 便民服务平台 。
人脸识别在政务系统的落地 , 提升了民众的办事效率 , 公民可以不用窗口排队 , 实现自助办事 , 节省了因人工效率低下产生的耗时 。部分政务还可以通过在线人脸识别认证 , 在移动端线上办理 , 减轻了 “ 办事来回跑 、 办事地点远 、办事点分散 ” 的困扰 。
教育考试。智慧教育在高速发展的同时 , 不断深入采用物联网 、 云计算 、 大数据等先进信息技术手段 , 实现各种教育管理与教学过程数据的全面采集 、 存储与分析,并通过可视化技术进行直观的呈现 。
在这个过程中 , 相关科技企业基于自身在人工智能 、 视频可视化技术 、 出入口门禁管理 、 大数据 、 云计算等领域积累的技术产品经验 , 致力于推动智慧教育的行业发展 , 打造升级智慧校园 、 智慧教室 、 智慧宿舍 、 智慧图书馆 、 智慧食堂 、 智慧超市等教育相关的安全管控 、 课堂考勤 、 刷脸消费和智能化体验 。同时 , 人脸识别技术也应用在考生身份确认 。
智能家居。人脸识别在智能家居中主要应用在安全解锁和个性化家居服务两个场景 。在安全防范方面 , 人脸识别可以提供相对安全和便捷的入户解锁技术 , 将可能逐步替代传统密码或指纹门锁 。智能门铃可以通过人脸识别对访客身份进行识别 。另外家中的监控摄像头可以实时监测 , 如发现陌生人脸立即提醒住户并报警 。
在个性化家居服务方面 , 智能电视可以采用人脸信息录入的方式创建账号 ,机器通过人脸识别认证 , 有针对性的进行内容推送 , 实现个性化定制 ;智能冰箱可通过人脸识别技术 , 针对不同的用户爱好 、 人脸状态 , 推送菜谱及营养建议 。人脸识别技术在智能家居行业的应用 , 为市民带来了更便捷 、 舒适的生活方式 。
4、 行业发展趋势
应用场景向各行业渗透 , 市场规模增长趋势出现分化。随着技术发展和安全性要求的提高 , 人脸识别技术在行业应用中发生巨大变化 , 从安全性可靠性要求较低的行业上升到金融社保 、 证券 、 银行 、 互联网金融等安全可靠性要求较高的行业 。我国人脸识别技术目前主要运用在公共安防 、 门禁考勤 、 金融支付三大领域 。
区分不同的应用领域来看 , 其趋势逐渐出现分化 。从 2019 年看 , 安防作为人脸识别最早应用的领域之一 , 其市场份额占比在 30% 左右 。随着雪亮工程 、 智慧城市建设的逐步完成 , 人脸识别在安防领域逐渐从增量市场转变为存量市场 。
人脸识别在门禁考勤领域的应用最为成熟 , 约占行业市场的 42% 左右 , 随着智慧楼宇 、 智慧社区 、 智慧家居的进一步发展 , 人脸识别门禁考勤市场也将随之增长 。金融作为人脸识别未来重要的应用领域之一 , 目前约占行业的 20%, 并且市场规模在逐步扩大 。
全球公共卫生环境变化 , 人脸识别迎来应用新需求。新冠肺炎疫情的爆发并在全世界流行 , 威胁人类生命安全与健康 , 引发了一场全球公共卫生危机 。相对于指纹 、 刷卡等接触式身份识别模式 , 人脸识别等非接触式识别模式更适用于当前受新冠病毒影响的全球公共卫生环境 , 减少病毒通过接触感染人群 。
一方面 , 人脸识别技术结合红外体温监测技术 , 获取人员身体健康状况信息 , 能及时反馈并控制疫情源头 ;另一方面 , 监控系统的全面布控 , 可检测获取重点人员流动信息 , 帮助政府防控管制措施做到有的放矢。
目前全球公共卫生环境形式依旧严峻 , 根据智源发布的 《 人脸识别与公共卫生调研报告 》 显示 , 受访者普遍赞同加强人脸识别技术的能力 , 81.9% 的人同意增强对戴有口罩的人的面部识别 。为完善疫情防控体系 , 进一步阻断传播源 , 戴口罩人脸识别技术的新需求浮出水面 。
计算芯片技术发展 , 支撑人脸识别大规模应用。人脸识别算法的工业应用和算法性能除了自身模型性能外 , 依赖于算法运行的硬件芯片环境 。以英伟达的 GPU 和英特尔的 CPU 为代表的通用架构芯片作为人脸识别算法训练和推理最常用的计算资源 。
同时 , 为了满足人脸识别应用场景的不断拓展和数据量的急剧增长对算力的强烈需求 , 基于领域专用架构 ( Domain Specific Architectures, DSA) 理念的行业专用定制芯片凭借着对特定领域的算法优化 , 可以充分发挥计算资源和算法模型的效能 , 已经被部分厂商应用于人脸识别算法的训练和推理应用 , 如海思 、 依图 、 寒武纪等企业推出的云端计算芯片 , 可以逐渐替代 GPU 成为其人脸识别技术应用的主流计算资源。
近年来 , 信息量的爆炸式增长给数据传输存储及中心计算带来了巨大的压力 , 边缘计算应运而生 。随着 AI 芯片技术的飞速发展 , 边缘计算设备的算力不断提高 , 越来越多的计算由边缘侧承担 。一方面 , 边缘计算能有效缓解带宽承载 , 提高计算传输效率 , 满足实时响应需求 , 增强数据安全性 ;另一方面 ,模型压缩及加速技术以及适合人脸识别算法运算的专用 AI 芯片不断完善 , 边缘设备的人脸识别算法精度持续提升 , 目前基于 AI 芯片的边缘设备应用基本覆盖社区 、 学校 、 医院 、 园区 、 交通等场景 , 支撑人脸识别的大规模应用 。
云边端协同部署 , 人脸识别应用迎来新场景新模式。云边端的协同部署模式将人脸识别应用模块分摊到各部分 , 通过前端边缘计算实现布控报警 , 边端对人脸特征做聚类分析 , 云端汇聚有效信息 , 进行大数据对比分析 , 开展调度工作 。
云边端协同部署方式缓解了云端压力 , 支持业务分级响应 , 云边结合人脸识别系统通过对云端和边缘端资源的统一配置 、 管理 、 调度 , 融合了边缘计算敏捷性和云端大数据全局性的优势 , 使人脸识别系统在带宽 、 并发数 、 响应速度等维度性能全面提升。
在未来 , 边缘端设备的视频编码能力和视频特征抽取能力将进一步加强 ,AI 应用也会将越来越多的计算承载分摊到前端 。云端则由人像系统 、 视频结构化系统 、 人脸人体聚类分析等服务组成 , 通过分析 、 聚类 、 归档形成各种主题库 , 跟各种业务应用打通 , 满足更多复杂场景下的智能化应用需要。
算法技术国际领先 , 国内市场竞争激烈。从全球竞争格局上看 , 中国公司在人脸识别算法上具备相当大国际竞争力 。从最新 NIST 主办的人脸识别算法测试 FR 町来看 , 参加评测的供应商有 207 家,其中中国大陆供应商有 31 家 。
在其公布的几个主要测试集上 , 共有 7 家中国人脸识别算法供应商取得过前三 , 5 家取得过第一 , 且在近一年内保持这一优势 。总体来说 , 中国的人脸识别算法在国际上已处于领先地位 。
国内市场竞争激烈一方面体现在竞争厂商多 , 包括传统安防企业 、 AI 初创企业和平台生态企业 。传统安防企业从安防市场出发 , 对安防视频行业的痛点和客户需求理解较深 , 拥有产品+集成的优势 , 已构建起很强的规模效应壁垒 。
AI 初创企业主要是一些新兴的专注于做算法的计算机视觉 ( CV ) 初创企业 ,以 AI 算法为核心优势 , 同时兼顾 “ 硬件落地 ” 及 “ 产品化 ”。平台生态企业 ,依托其强大的云平台以及云计算能力 , 以云平台为核心横向切入 , 整合合作伙伴的应用方案 , 构建统一的生态体系 , 并形成差异化竞争。
国内市场竞争激烈另一方面体现在全产业链竞争 , 从算法竞争延伸到芯片和平台竞争 。主要市场参与者都已经加入 AI 芯片竞争中 , 安防企业注重边缘侧和端侧的推理芯片 , 初创公司更注重边缘侧推理芯片 , 而平台生态企业则注重端 / 云一体 , 构建从训练到推理的全栈 AI 生态 。下游的竞争主要是应用层的竞争 , 是生态的竞争 , 是深耕行业的竞争 。
04.
人脸识别标准化
1、 标准化组织情况
国际标准化方面 , 人脸识别标准化工作主要属于生物特征识别标准化分技术委员会 (ISO/IEC JTC1/SC37 ) 工作范畴 , 其重点关注人脸识别基础标准 , 如图示图标符号 、 样本质量等 , 以及数据交换格式及符合性测试方法等。
其它关注人脸识别的国外先进组织包括电气与电子工程师协会 ( Institute of Electrical and Electronics Engineers, IEEE) 、 美国消费技术协会 (Consumer Technology Association, CTA) 等,其关注的方向在于生物特征识别呈现攻击检测 、 人脸生物特征识别信息的性能评估等 。ITU 与生物特征识别标准相关的主要是 ITU-T SG1 7 安全标准工作组下设的 Q9 和 Q10 。Q9 主要关注在通信应用环境中应用生物特征识别及其标准化工作 。
随着生物特征识别技术在电子商务 、 电子健康和移动支付领域中的广泛应用 , 该工作组同样关注生物特征数据的隐私保护 、 可靠性和安全性等方面的各种挑战 。Q10 关注身份管理架构和机制 , 部分标准项目与基于生物特征识别身份认证相关 。进几年 , ITU-TSG16 媒体工作组基于视频监控 、 机器视觉等应用场景 、 功能需求 、 业务需求 、 性能需求以及安全需求 , 在 Q12 、 Q21 等课题组先后开展人脸识别标准的研究和制定工作 。
国内组织方面 , 主要是全国信息技术标准化技术委员会生物特征识别分技术委员会 ( SACOC28/SC37 ) 和全国安全防范报警系统标准化技术委员会人体生物特征识别应用分技术委员会(简称 SAC/TC100/SC2 ) 负责生物特征识别标准的制定 。其中 SACATC28/SC37 成立了人脸识别 、移动设备生物特征识别等多个工作组 , 发布了人脸样本质量 、 人脸图像数据交换格式 、 移动设备人脸识别等标准 。SA5C100/SC2 发布了视频监控 、 出入口控制等公共安全领域的多项人脸识别标准 。
此外 , 国内组织方面 , 全国防伪标准化技术委员会 ( SAC/TC218 ) 发布了国家标准 《 生物特征识别防伪技术要求第 1 部分 :人脸识别 》 。全国金融标准化技术委员会 ( SAC/TC 180 ) 发布了国家标准 《 金融服务生物特征识别安全框架 》 , 并且正在制定 《 人脸识别技术线下支付安全应用规范 》 等生物特征识别行业标准 。
公安部社会公共安全应用基础标准化技术委员会发布了行业标准 《 视频图像分析仪第 4 部分 :人脸分析技术要求 》 。全国信息安全标准化技术委员会 ( SAC/TC260 )发布了国家标准 《 信息安全技术远程人脸识别系统技术要求 》 等。
2、标准制修订情况
国际标准化组织和其他国外先进标准组织人脸识别相关的标准统计情况见下表。
▲ISO 国际标准统计表
我国人脸识别相关的标准情况见下表。
▲我国人脸识别相关的标准情况见表
当前 , 我国的人脸识别技术与应用在国际上处于领先地位 ,在科技金融 、 智慧安防 、 智慧交通 、 民生政务 、 教育考试 、 智能家居等多个领域得到了广泛应用。但是,近一年人脸识别技术也出现了很多不良影响,“售楼处暗藏人脸识别”、人脸信息泄露等问题屡见不鲜。随着技术门槛的逐步降低,加强安全技术的研发和应用,完善相关的法律法规变得尤为重要。