• 发文
  • 评论
  • 微博
  • 空间
  • 微信

百度ai系列研究:开放能力——人脸与人体识别

智先声 2021-08-24 09:40 发文

每周一篇原创,关注5G、物联网、人工智能,跟着我的【头号观点】坚持利用碎片时间学习

今天我们一起研究百度的“人脸与人体识别”开放能力,随着摄像头的大量普及,人脸与人体识别领域的应用越来越广泛,也是人工智能落地的重要一环。

百度的“人脸与人体识别”能力包括:

人脸识别

人像特效

人体分析

行为分析

人脸识别

分类

人脸检测:返回人脸框与关键点,识别多种人脸属性

人脸对比:评判两张人脸图片的相似程度

人脸搜索:将一张图片在指定人脸库中进行1:N搜索

活体检测:抵御人脸识别过程中的图片、模具等作弊攻击

1、人脸检测快速检测人脸并返回人脸框位置,输出人脸150个关键点坐标,准快速检测人脸并返回人脸框位置,输出人脸150个关键点坐标,准确识别多种属性信息

人脸检测定位:检测图片中的人脸并标记出人脸坐标,支持同时识别多张人脸

人脸属性分析:准确识别多种人脸属性信息,包括年龄、性别、颜值、表情、情绪、脸型、头部姿态、是否闭眼、是否配戴眼镜、人脸质量信息及类型等

150个关键点识别:精准定位包括脸颊、眉、眼、口、鼻等人脸五官及轮廓的150个关键点

情绪识别:分析检测到的人脸的情绪,并返回置信度分数,目前可识别愤怒、厌恶、恐惧、高兴、伤心、惊讶、嘟嘴、鬼脸、无情绪等9种情绪

图片质量预处理:分析图片中人脸的遮挡度、模糊度、光照强度、姿态角度、完整度、大小等特征,确保图片符合质量标准,保障后续人脸对比、搜索的准确性

在线图像活体检测:基于单张图片中人像的破绽(摩尔纹、成像畸形等),判断图片是否为二次翻拍,过滤检测中不符合标准的人脸

备注:什么是摩尔纹?摩尔纹是一种在数码照相机或者扫描仪等设备上,感光元件出现的高频干扰的条纹,是一种会使图片出现彩色的高频率不规则的条纹。

应用场景:

智能会员管理:基于人脸检测与追踪功能,摄像头实时捕捉进入店铺的客户人脸,识别如年龄、性别、颜值等属性特征,对顾客画像自动分类,结合客户消费记录等信息,提供更精准的客群分层流量分析;同时结合产品促销信息,根据不同客群的属性,提供更生动的互动营销体验,提升顾客满意度,促进购物消费转化

智慧校园管理:将人脸识别技术应用于摄像头监控,对学生、教职工、及陌生人进行实时检测定位,解决校园安防监控、校内考勤、学生自助服务、课堂专注度分析等场景的需求,打造智能化校园细分管理,提升校园生活体验和安全性

人脸美颜特效:基于150关键点识别,对人脸五官及轮廓自动精准定位,可自定义对人脸特定位置进行修饰美颜;同时获取表情、情绪等人脸属性信息,实现特效相机、动态贴纸等互动娱乐功能

互动娱乐营销:基于人脸检测和属性分析,精准识别图片中人脸150个关键点信息,实现多种线上互动娱乐营销模式,如脸缘测试、名人换脸、颜值比拼等,提升用户体验趣味性,有助于娱乐产品的市场推广

2、人脸对比

两张人脸进行 1:1 比对,得到人脸相似度

人脸相似度对比:比对图片中两张人脸的相似度,并返回相似度分值

支持四种图片类型:支持生活照、证件照、身份证芯片照、带网纹照4种图片类型的人脸对比

图片质量控制:分析图片中人脸的遮挡度、模糊度、光照强度、姿态角度、完整度、大小等特征,基于输出的符合质量标准的图片,返回准确的相似度评分

在线活体检测:分析单张图片中人像的破绽(摩尔纹、成像畸形等),判断图片中目标对象否为真人,确保比对效果真实可靠

应用场景:
金融远程开户:在远程身份验证环节,获取用户身份证照片和现场拍摄的真人照片,进行1:1对比,判断用户信息真实性。随时随地快速开户,优化金融等高风险行业的身份核验流程,实现“事中控制,事后追溯“系统化管理,低成本、低风险完成开户流程

服务人员身份监管:在快递运输、家政保洁等服务领域,服务人员在开始业务前完成人脸1:1验证,确保身份真实性;同时,实现全流程服务管控,规避业务人员不良行为,保障高质量服务水平

智慧刷脸考勤:用人脸识别替代刷工卡、指纹识别的考勤方式,实现多人同时考勤,后台系统全方位实时记录,确保准确识别签到人员身份,1秒内快速完成人脸1:1对比验证,有效防止代打卡、盗刷等作弊行为,提升企业信息化员工管理

酒店自助入住:在用户办理入住手续时,将现场拍摄的人脸与身份证提取的芯片照片,或拍摄的身份证照片,进行1:1对比,判断用户信息真实性,完成身份核验。将酒店式物业运营转变成「无人化」智能管理,住客刷脸自助办理入住,减少人工审核成本的同时,确保住客身份安全性

3、人脸搜索

给定一张照片,对比人脸库中N张人脸,进行1:N检索,找出最相似的一张或多张人脸,并返回相似度分数。支持百万级人脸库管理,毫秒级识别响应,可满足身份核验、人脸考勤、刷脸通行等应用场景

1:N搜索:将一张人脸图片在人脸库的中进行搜索,返回最相似的一张或多张人脸及对应相似度

M:N搜索:如果一张图片中存在 M 张人脸,支持一次性在人脸库中搜索全部人脸,并返回每个人脸对应的用户和相似度

1:N对比:支持用一张人脸图片,与某一指定用户在人脸库中的多张照片进行对比,返回与该用户的相似度分值

4、活体检测

提供 6 种在线/离线活体检测服务,识别业务场景中的用户是否为「真人」,有效抵御照片、视频、3D模具等作弊行为,保障业务安全性

在线图片活体检测:基于图片中人像的破绽(摩尔纹、成像畸形等),判断目标是否为活体,有效防止屏幕二次翻拍等作弊攻击,支持单张或多张判断逻辑

在线H5视频活体检测:现场录制视频,读出随机分配的数字,确保视频的即时性,而非事先录制,上传视频到云端进行活体分析,提升抵御攻击的能力

动作配合式活体检测:配合SDK 完成眨眼、张嘴、摇头、左右转头、上下点头等7种预设动作,随机抓取多图进行活体判断,可自定义生效动作及校验顺序

离线红外检测:利用近红外成像原理,实现夜间或无自然光条件下的活体判断,在屏幕无法成像、材质反射率不同等情况下维持高鲁棒性

利用3D结构光原理:基于3D结构光成像原理,通过人脸表面反射光线构建深度图像,判断目标是否为活体,可强效防御图片、视频、屏幕、模具等攻击

人像特效

人脸融合:将两张人脸的外貌特征融合并生成新的人脸图片

人像分割:识别图像中的人体轮廓,与背景进行分离

人像动漫化:为用户量身定制千人千面的二次元动漫形象

人体分析

1、人体关键点识别:检测图像中的人体并返回人体矩形框位置,精准定位21个核心关键点,包含头顶、五官、颈部、四肢主要关节部位,支持多人检测、大动作等复杂场景

多人活体检测:检测图像中的所有人体,标记出每个人体的坐标位置;不限人体数量,适应人体轻度遮挡、截断的情况

关键点定位:精准定位人体的21个主要关键点,包含头顶、五官、颈部、四肢主要关节部位;支持人体背面、侧面、中低空斜拍、大动作等复杂场景

2、人流量统计:统计图像中的人体个数和流动趋势,以头肩为主要识别目标统计人数,无需正脸、全身照,适应人群密集、各种出入口场景

静态人流统计:适用于3米以上的中远距离俯拍,以头部为识别目标统计图片中的瞬时人数;无人数上限,广泛适用于机场、车站、商场、展会、景区等人群密集场所

动态人流统计:面向门店、通道等出入口场景,以头肩为识别目标,进行人体检测和追踪,根据目标轨迹判断进出区域方向,实现动态人数统计,返回区域进出人数

3、人体检测与属性:检测图像中的所有人体,返回每个人体的位置坐标;识别人体的20余类属性信息,包含性别年龄、服饰类别、服饰颜色、戴帽子(可区分安全帽/普通帽)、戴口罩、背包、抽烟、使用手机等

4、手部关键点检测:检测图片中的手部并返回手部矩形框位置,定位手部的21个主要骨节点,可用于自定义手势检测、AR特效、人机交互等场景

行为分析

驾驶行为分析:识别驾驶员抽烟、使用手机等违规行为

手势识别:识别24种常见手势,支持自拍、他人拍摄

危险行为识别:针对5S内的监控视频片段,识别常见危险行为

指尖识别:定位食指指尖的坐标位置,用于点读搜题等场景

总结

人脸识别这个词太大,经过以上内容的详细分析,准确的概念应该是:人脸对比是指1:1,人脸搜索是指1:N或者M:N。随着5G基础设施的部署,视频绝对是未来的主流媒介,所以广义的人脸识别或者分析来讲都是图像处理的范畴,而且会越来越细。将百度基础技术平台研究完后,我们将应广大粉丝要求推送一批有趣的人工智能应用。

免责声明:

本公众号为个人研究专题学习分享,非商业公众号无任何商业目的,如果文章内容有侵权或者非法信息,请立即与本号联系删除谢谢

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    智先声

    新科技观察者与实践者...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码