为什么香港中文大学研发的adaboost人脸检测算法识别算法能够击败人类

点击联系发帖人 时间：2015-08-01 07:16

opencv人脸识别算法

为什么香港中文大学研发的人脸识别算法能够击败人类_百度知道
为什么香港中文大学研发的人脸识别算法能够击败人类
提问者采纳
难度在业界属于顶尖。而我们实验室的最高水平(也是国内除face++外的最高水平)大约是92左右。52006年全面超过人脸时的条件是实验室内部拍摄条件。FRVT2012中期结果中最好的单位(不出意外应该是日本的NEC公司)的错误率已经达到了我们06年系统的1%左右。但一篇正常pami的水准肯定是有的，引用量近万.arxiv和CVPR等顶会完全不矛盾。该库09年公布后至今没有难度更大的静态照片库出现。第二个算法细节不明。2，所以真正的历史地位，deepface的97。我们06年的系统跑lfw也就70+的水平。当然lda珠玉在前.52%，本文自然不可能赶上lda。难度相当但数据量更大的库倒是有两三个。唯有gaussianface的训练库仅2万余。只提一篇paper。3，难以在这里深入浅出.2014年的三个逆天结果。这种条件下的人脸识别错误率的进展大约是每3年下降10倍，deep learning风头正劲。Blei的latent dirichlet allocation，目前在中期结果中排名6-7名。先发上来只是为了不让别人抢先.27%.25%。4，2003年的jmlr，懂行的人自然知道这句话的分量。而我手上的系统相比06年大约提升了十几倍。第一个训练数据400万，但deeplearning向来吃样本。本文对人脸的贡献方式大概相当于lda对文档分类的贡献方式。大概相当于2012年底的state-of-the-art。估计未来的顶刊顶会上很快会出现这个结果.lfw数据库直接是从雅虎网上抓的照片，就不多介绍了、正面姿态.算法细节太过技术、gaussianface的98，想来训练库也是百万量级，前两者都用了deep learning、face++的97、正面光照
来自团队：
其他类似问题
为您推荐：
人脸识别的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁98.52% vs 97.53%：人脸识别算法终于超过了人类本身 - 博客 - 伯乐在线
& 98.52% vs 97.53%：人脸识别算法终于超过了人类本身
计算机科学家已经开发出一种新的人脸识别算法，在识别人脸的能力上比人类本身更加强大。
我们每个人都有过认不出某个自己曾经认识的人的经历，在不同的姿势、光照和表情下，这其实是一件比较困难的事情。计算机识别系统同样存在这些问题。事实上，尽管全世界的计算机科学家努力了这么多年，还是没有任何一种计算机识别系统在识别人脸方面能够像人类一样强大。
但这并非是说人脸识别系统不够准确。恰恰相反，最好的人脸识别系统在理想情况下比人类识别的表现要好的多。但是一旦环境情况变糟，系统的表现就差强人意了。而计算机科学家们当然是非常想要开发出一种算法，在各种情况下都能够表现优异。
现在，香港中文大学的汤晓鸥教授和他的学生路超超（对不起，译者没有找到这名学生的名字，只能音译了）宣布他们攻克了这个难题。他们开发了一种叫“高斯”的人脸识别算法首次超过了人类自身。
新的识别系统对于各种平台都能够提供人类级别的识别能力，从手机到电脑游戏中的人脸识别，从安全系统到密码控制等等。
任何一个人脸自动识别程序，首先要考虑的就是去构建一个合适的数据集来测试算法。那需要一个非常大范围的，各种各样的，带着各种复杂动作、光线和表情的，不同脸的图像，各种人种、年龄和性别都要考虑在内。然后还要考察服装、发型以及化妆等其他因素的影响。
比较幸运的是，已经有这么一个拥有各种不同人脸的标准数据库——Labelled Faces。它拥有超过13,000张不同人脸的图片，它们是从网络上收集的6000个不同的公众人物。更重要的是，每个人都拥有不止一张人脸图片。
当然也存在其他的人脸数据库，但是Labelled faces目前是计算机科学家们所公认的最具参考价值的测试数据集。
面部识别的任务是去比较两张不同的图片，然后判断他们是否是同一个人。（你可以试试看，能否看出这里展示的每对图片是否是同一个人。）
人类在这个数据库上的表现可以达到97.53%的准确度。但是没有任何一个计算机算法能够达到这个成绩。
直到这个新算法的出现。新的算法依照5点图片特征，把每张脸图规格化成一个150*120的像素图，这些特征分别是：两只眼睛、鼻子和嘴角的位置。
然后，算法把每张图片划分成重叠的25*25像素的区域，并用一个数学向量来描述每一个区域的基本特征。做完了这些，就可以比较两张图片的相似度了。
但是首先需要知道的是到底要比较什么。这个时候就需要用到训练数据集了。一般的方法是使用一个独立的数据集来训练算法，然后用同一个数据集中的图片来测试算法。
但是当算法面对训练集中完全不同的两张图片的时候，经常都会识别失败。“当图片的分布发生改变的时候，这种训练方法就一点都不好了。”超超和晓鸥说到。
相反，他们用四个拥有不同图片的，完全不同的数据集来测试“高斯”算法。举个例子，其中一个数据集是著名的Multi-PIE数据库，它包含了337个不同的物体，从15种不同的角度，在19种不同的光照情况下，分别拍摄4组图片。另一个数据库叫做Life Photes包含400个不同的人物，每个人物拥有10张图片。
用这些数据库训练了算法后，他们最终让新算法在Labelled Faces数据库上进行测试。目标是去识别出所有匹配和不匹配的图片对。
请记住人类在这个数据库上的表现是97.53%的精确度。“我们的“高斯”算法能够达到98.52%的精确度，这也是识别算法第一次击败人类。”超超和晓鸥说到。
这是一个令人印象深刻的结果，因为数据中的照片包含各种各样不同的情况。
超超和晓鸥指出，仍然有很多挑战在等着他们。现实情况中，人们可以利用各种附加的线索来识别，比如脖子和肩膀的位置。“超过人类的表现也许只是一个象征性的成就罢了”他们说。
另一个问题是花费在训练新算法上的时间，还有算法需要的内存大小以及识别两幅图所需要的时间。这可以用并行计算和特制处理器等技术来加快算法的运行时间。
总之，精确的人脸自动识别算法已经到来了，而且鉴于现在的事实，这只会更快。
关于作者：
可能感兴趣的话题
the&Chinese&University&of&Hong&Kong是香港中文大學……
关于伯乐在线博客
在这个信息爆炸的时代，人们已然被大量、快速并且简短的信息所包围。然而，我们相信：过多“快餐”式的阅读只会令人“虚胖”，缺乏实质的内涵。伯乐在线博客团队正试图以我们微薄的力量，把优秀的原创/译文分享给读者，做一个小而精的精选博客，为“快餐”添加一些“营养”元素。
新浪微博：
推荐微信号
（加好友请注明来意）
– 好的话题、有启发的回复、值得信赖的圈子
– 分享和发现有价值的内容与观点
– 为IT单身男女服务的征婚传播平台
– 优秀的工具资源导航
– 翻译传播优秀的外文文章
– 国内外的精选文章
– UI,网页，交互和用户体验
– 专注iOS技术分享
– 专注Android技术分享
– JavaScript, HTML5, CSS
– 专注Java技术分享
– 专注Python技术分享
& 2016 伯乐在线
赞助云主机为什么香港中文大学研发的人脸识别算法能够击败人类_百度作业帮
为什么香港中文大学研发的人脸识别算法能够击败人类
为什么香港中文大学研发的人脸识别算法能够击败人类
人脸识别算法是给人们的生活带来便捷，是没法击败人类的为什么香港中文大学研发的人脸识别算法能够击败人类？ | 知乎精选
为什么香港中文大学研发的人脸识别算法能够击败人类？
【梁亦聪的回答(158票)】: 和
提到的清华2006年那个系统的完成人是我同实验室的直系师兄。这个系统09年以后一直是我负责改进。还参加了最新的frvt2012。此外题主说的那篇paper我上周组会刚讲过。因此自认为有点发言权。先给出观点，如果数据没有注水的话，这个绝对是突破性的成果。lfw上超过人脸意味着在80%的应用环境下机器的性能可以超过人脸。而06年的结果只意味着在身份证比对、小型办公场所签到等极少应用下机器的性能超过人脸。1.2006年全面超过人脸时的条件是实验室内部拍摄条件、正面姿态、正面光照。这种条件下的人脸识别错误率的进展大约是每3年下降10倍。FRVT2012中期结果中最好的单位(不出意外应该是日本的NEC公司)的错误率已经达到了我们06年系统的1%左右。而我手上的系统相比06年大约提升了十几倍，目前在中期结果中排名6-7名。2.lfw数据库直接是从雅虎网上抓的照片。难度在业界属于顶尖。该库09年公布后至今没有难度更大的静态照片库出现。难度相当但数据量更大的库倒是有两三个。我们06年的系统跑lfw也就70+的水平。而我们实验室的最高水平(也是国内除face++外的最高水平)大约是92左右。大概相当于2012年底的state-of-the-art。3.2014年的三个逆天结果，deepface的97.25%、face++的97.27%、gaussianface的98.52%，前两者都用了deep learning。第一个训练数据400万。第二个算法细节不明，但deeplearning向来吃样本，想来训练库也是百万量级。唯有gaussianface的训练库仅2万余。4.arxiv和CVPR等顶会完全不矛盾。先发上来只是为了不让别人抢先。估计未来的顶刊顶会上很快会出现这个结果。5.算法细节太过技术，难以在这里深入浅出，就不多介绍了。只提一篇paper。Blei的latent dirichlet allocation，2003年的jmlr，引用量近万。本文对人脸的贡献方式大概相当于lda对文档分类的贡献方式，懂行的人自然知道这句话的分量。当然lda珠玉在前，deep learning风头正劲，所以真正的历史地位，本文自然不可能赶上lda。但一篇正常pami的水准肯定是有的。=============================5月21日更新================================居然上了知乎日报好激动～那就再说一下我对GaussianFace的理解了。只说我认为最有突破性的地方吧。具体推导过程一来论文中有，二来比较复杂，三来我自己还没重复实验不确保细节理解都正确，这里就从略了。1.解决的问题是模式认证问题，就是说输入两个向量和（可以是人脸照片或别的），输出相似度表示这两个向量属于同一类的概率。（人脸识别中就是两张照片是同一个人的概率）。训练集有一堆向量，有些属于同一类，有些不属于同一类。目标就是根据训练集来猜这个函数.2.GaussianFace以前成功的算法分两类：metric learning和bayesian framework。它们都是假设这个函数具有一个参数的形式。然后利用训练集估计出一个最好的。2.1 metric learning中是显式的，比如是二次型的形式，就是中间的那个矩阵。2.2 bayesian framework是隐式的，认为训练、测试样本都有同一个随机model生成，代表这个model的各种参数，由训练集根据最大似然／最大后验／beyesian方法估计得到。然后在给定model的情况下推导的最优表达式。3.这两类问题都有一个硬伤：训练集样本和测试集样本分布情况不同（比如拍摄条件不同、人种不同等等）时，由训练集估计的对测试集不适用，这样这些训练集就用不上了，只会添乱。4.GaussianFace声称的牛逼之处在于，用他们的算法，训练集只需少量和测试集分布一致的样本＋大量其他样本，算法就能从这些其他样本中获益。5.他们的关键在于，不认为具有参数形式，而是认为它是一个随机函数。6.一个函数，在不严谨的说法下，可以看成一个无穷维的向量。7.一个有限维随机向量可以假设符合多维正态分布－即gaussian分布。类似的，一个无穷维向量，或一个函数，可以假设服从无穷维正态分布－即gaussian过程。8.决定gaussian分布的参数为均值和协方差矩阵。同样，决定gaussian过程的参数为均值函数和协方差函数。文章中假设，因此参数只剩协方差函数。9.通过训练集估计的算法是个优化过程，定性的说，就是尽量同时让1.那个和测试集分布一致的少量训练集的出现概率尽可能高。2.其他训练集对这个训练集提供的信息尽可能多。整个优化过程相当麻烦，我也不确保细节都理解正确。总之这个是可以估计出结果的。10.有了，就有了明确的先验分布，接着就用普通Bayesian方法，给定测试样本时可以将不相关的变量都积分消除，得到最终的相似度。这一步用了些近似处理，细节不表。11.GaussianFace相比与之前算法最大的区别在于，认为相似度函数是随机的而非确定的。这样从模型上认可了不同样本可能具有不同的相似度函数。因此从原理上克服了第3点提到的问题。12.缺点在于，的估计只能通过kernel的形式，空间复杂度为样本数的平方，这个限定了在一般实验室中，训练样本数只能限制在量级。【知乎用户的回答(64票)】:谢邀。文章细节
有分析了。重点是强调了训练的generalization，通俗来讲就是在A数据库上训练的模型，在B数据库上测试毫无压力。关于这个“训练的问题”有篇很有意思的论文：Unbiased Look at Dataset Bias 之前有人讨论过：算法的细节以后看了再评论。我主要想答“计算机超过人类”这点。其实个人感觉这个“outperforms humans for the first time” 有点标题党。实际上在2006年的大规模人脸测试
上，来自清华丁晓青老师研究组的TS2-NORM算法就已经超过人的识别率了。测试报告参见：如图所示，曲线越往左下角靠表示性能越好。黑色的是人类，可以看出有两个算法(V-NORM，ST-NORM)已经很接近人类的性能，而TS2-NORM就已经比人类好了。这个实验采用的是80对人脸图像，分别是在可控光照和不可控光照下拍摄的，人需要在两秒之内判断每一对人脸是否来自同一个人（给出1到5的打分，1表示十分确定是同一个人，5表示十分确定不是同一个人）。一共有26个参与者参加了实验。需要注意的是，这些图片仅包含光照变化，而且都是高清的。本题报道的论文是在LFW（）这个库上测试的。这个库是“非约束人脸识别”的一个最著名的标准库。库里的图像参见，这些图像是网络上收集的，包含了很大的变量，例如光照、姿势、表情、遮挡、分辨率。可以说这个实验比2006那个要难很多。但是，题主问的这篇也不是“第一篇”声称自己超过人类的。之前Facebook的Deepface也声称自己超过了人类：我个人感觉这些算法声称“超过人类”，都有点为了夺眼球的意思(但是引发大众关注、讨论是很好的)。从LFW的结果页面来看：人类在LFW库上最好的识别结果是99.2%，题主提到的论文对比的是97.53%那个结果。两者不同是因为采用的图像裁剪、对齐方法不同(仅仅裁剪出含人脸的部分)。这个对齐方法对识别的影响是很大的。人类在LFW库上最好的识别结果是99.2%，题主提到的论文对比的是97.53%那个结果。两者不同是因为采用的图像裁剪、对齐方法不同(仅仅裁剪出含人脸的部分)。这个对齐方法对识别的影响是很大的。那么回到问题上来，现在的人脸识别算法是否已经超越了人类呢？我个人觉得还没有那么乐观。正如题目这篇论文 Surpassing Human-Level Face Verification Performance on LFW with GaussianFace
的讨论部分提到的，人脸其实比较善于识别“熟悉人脸”，比如一个人可以在很昏暗的环境下快速认出自己的朋友、可以从人群里快速找到自己的家人……2006年的那个测试和LFW上的这些测试，对于人类来讲，都是“不熟悉的人脸”，其实是很不公平的。有点像用计算机的长处去比了人类的短处。自动人脸识别技术发展了40多年，False reject rate从1993年的79%降到2010年的0.3%(false accept rate=0.1%)，LFW库上的算法识别率从2007年的60%升到2014年的97~98%，可见是取得了巨大进步的。现在人类到底是如何识别人脸的，机制还不是很清楚。但是，总体来说人脸识别算法还是在一步一步接近人类识别的。----- 补充回答 ----------在这里要提供一些真正的人类识别人脸的能力的资料！！！关于人类对人脸识别的一些有趣现象，大家可以看这篇科普性的文章：Face Recognition by Humans: Nineteen Results All Computer Vision Researchers Should Know About 人对于“熟悉”人脸的识别能力可以看一个例子(图来自于上面这篇文章)：即便是在分辨率如此低的情况下，要认出4是克林顿，10是查尔斯王子也不是很难吧？这篇综述有讲关于“熟悉人脸”识别的研究： Familiar and unfamiliar face recognition: A review 另外，总是有人提到自己是脸盲，可以到这里测试一下自己认脸的能力：严重的脸盲是连自己的脸也认不出的，据一个严重的患者说每次在公共卫生间大家排着队等时，从镜子里看到很多人脸，不知道哪一张是自己的，需要先做一个鬼脸才知道哪个是自己的人脸……与此相对的，是一些超级认脸者，就是从来不会忘记曾经见过的人脸！！！(这样其实也很痛苦吧……) 英国的Channel 4曾经做过一档节目，在请了一些这样的超级认脸者来PK，在英国一个火车站，找了一些志愿者穿上一模一样的套头衫，戴上套头然后混在火车站人群里面，请这些认脸者来观察；观察结束后，这些志愿者混入一些没有出现在火车站的志愿者中，脱去套头衫，然后请认脸者把他们挑出来~【知乎用户的回答(39票)】:谢邀！我是半个专家，所以，可能有一半是错的。Surpassing the human-level performance may only be symbolically significant。就这句就比国内的无脑媒体记者实在好太多了，也是对全文的总结。首先，要理解这种测试的场景，跟我们日常环境下所说的识别场景是不同的。大家想象下，我们拍两张照片，切割掉衣服、肩膀，就剩一张脸——你甚至连喉结都看不到。然后呢，人识别两张照片是一个0/1选项，是或者不是；但是计算机不一样啊，它识别的是两张照片的相似度，比如相似度60%，或者相似度76%。换句话说，人天然不适合定量，你看两张照片，作为人类，你不好判断说，嘿，这两张照片有87.456%的相似度，所以是一个人！但是计算机很流氓啊，他先验知识可以知道，某种类型的照片，当相似度超过AAA的时候有99.9999%的置信度是同一个人。计算机得到相似度就能判断是不是一个人。第三呢，我们人类的识别能力受很多因素的影响——比如你昨晚撸过头了、比如识别的是汉族人还是藏族人还是黑人。想想大家看外国电影的时候，各种分不清演员就很容易理解了——我小时候经常觉得曼德拉跟弗里德曼是一个人——还都有个曼字呢？所以，说计算机识别能力超越人类，是一个有极大局限条件下的结论；第一是特定类型的照片，而不是日常我们经常会遇到识别的场景第二是平均而言，假设在上述特定类型照片下，我们如果只识别本民族的人，不见得比算法差——我个人判断会好很多第三计算机预先对某种类型的照片的相似度有先验判断，如果你随机拿潮女自拍效果的照片过去，可能当前所有算法都会吐血身亡，不具备稳定性和普遍适用性。因为有些照片我们判断是同一个人的相似度阈值是60的时候置信度就够高，有些相似度阈值要90才可靠。换个环境，就废了，这个问题可能会在模式识别领域未来很长时间内无法解决。但是，在特定环境下，计算机识别人脸比人类更有优势，这个结论在2006年的FRVT就已经存在了——莫非那个时代科技博客还不流行现在的科技博客就可以乱说了？如图是2006的数据啊，看起来至少清华当时是全面超过人眼啊。我说的一半可能是错了，我也不知道错的是哪一半。我说的一半可能是错了，我也不知道错的是哪一半。PS:关于题主关注的这个算法是不是出类拔萃的问题，我个人持保留态度。我个人估计是因为他拥有巨大的一个训练库，20000个人，接近100000张照片。而其他人可能只有LFW的训练集。在高度依赖数据的时代，这20000个人会带来较高的提升。并不能证明算法的鹤立鸡群。【知乎用户的回答(23票)】:谢邀！文章刚出来时，叫一实习生业余去研究番，但到目前他还没来得及做报告，这里仅以我有限的了解回答下。（多图）暂不究算法细节，就此新闻，需要发问的是“文章中的识别准确度98.52%是怎么得来”以及“人类的人脸识别能力（Human-Level Face Verification Performance）是如何度量的”，要查清这些问题，还得从LFW说起。1、LFW数据集及人脸识别实验设计1.1 LFW人脸数据集LFW（Labeled faces in the wild[1]）是人脸识别研究领域比较有名的人脸图像集合，其图像采集自Yahoo! News，共13233幅图像，其中5749个人，其中1680人有两幅及以上的图像，4069人只有一幅图像；大多数图像都是由Viola-Jones人脸检测器得到之后，被裁剪为固定大小，有少量的人为地从false positive中得到[2]。所有图像均产生于现实场景（有别于实验室场景），具备自然的光线，表情，姿势和遮挡，且涉及人物多为公物人物，这将带来化妆，聚光灯等更加复杂的干扰因素。因此，在该数据集上验证的人脸识别算法，理论上更贴近现实应用，这也给研究人员带来巨大的挑战。图1. LFW人脸图像示例图1. LFW人脸图像示例1.2 LFW数据集上的识别实验设计官方文档[2]详细给出了待测算法在LFW上实验的规范，以便于不同算法间的比较。识别算法要完成的工作是人脸验证（Face verification），即判断给定的两张图片（一对）中的人脸是否来自同一个人。LFW将数据集分作两大块，[View 1]用做供研究人员选择其算法模型所用，包括一个训练集和一个测试集，不管是训练集还是测试集，其图片都是由M对来自同一人脸的图像和N对来自不同人脸的图像构成；当确定了模型后，算法将在[View 2]上实验，[View 2]包含10个子集，每个子集构成规则同刚讲到的训练集或测试集，实验过程大抵为：A、每次从10个子集中选一个做为测试集，其余9个做为训练集；B、通过训练集确定模型的参数；C、对测试集进行预测；D、计算预测的准确度；进行十次之后，平均的准确度即为该算法在LFW上的识别准确度，GaussianFace的98.52%即是如此计算的。图2. 训练集示例图2. 训练集示例1.3 其他的人脸数据库这里顺带把文章[0]中用到的两个公开数据集在这说下：A、Multi-PIE[3]在可控环境下人为产生的337个人的750,000张图片，包含15个视角及19种光照变化。图3. Multi-PIE图像示例图3. Multi-PIE图像示例B、MORPH[4]多种族多年龄段图像集，成像条件类似证件照过程。图4. MORPH图像示例图4. MORPH图像示例图5.MORPH图像集统计信息图5.MORPH图像集统计信息粗略看来，LFW较之上面二者，更贴近人类活动的现实场景，在LFW上验证的识别算法理论上可能应对现实中特定的或基本的人脸识别应用。当然，还有其他诸多公共数据集，在[2]中有详细列表，或在获知。2、人类的人脸识别能力最让人类纠结的事情莫过于明知自身有着高度的智慧，却不知这种智慧的运作机理，难道这种智慧里面就不包含了解这种智慧运作机理的智慧吗？人类想创造出拥有同等智慧的物体却始终不能得偿所愿。对人脸的识别能力是人类智慧中的一种，确切地说是人类视觉认知能力之一。如果说不能了解这种能力的运作机理，那是否可以对这种能力进行度量呢？比如说，人类在体育竞技上取得的成绩即可以认为是人类所具备的那些能力的度量，同理，也可以设计类似的分值以粗略量化人类对人脸的识别能力。文章[0]中提到的人类的人脸识别能力（Human-Level Face Verification Performance）是引自文章[5]的。作者利用Amazon众包服务[6]，对选自LFW的6000对图片，平均每对图片进行10人（不同人）次的识别，大约分配给了240000个用户去进行人脸识别的测试，准则如下图：此项实验其考察了人类在三种情形下对人脸的识别能力：此项实验其考察了人类在三种情形下对人脸的识别能力：对包含人脸的图像整体的识别能力，也就是说，不只是人脸，其他诸如体态、服饰，场景等也可能做为识别成功的因素，自然这种情形的准确度是最高--99.20%；对人脸部图像的识别能力，也是一般人脸识别算法的处理对象，准确度为97.53%；对不包含人脸的图像整体的识别能力，也就是说，遮上人脸，只通过诸如体态、服饰，场景等信息进行识别，自然这种情形的准确度要低--94.27%；好了，被打败的人类识别能力就是这样定义的，做为人类一分子的你，不管是拖了后腿还是低估了你，你就是这样被算法打败的！不服？你上最吊大脑秀去啊。。。好了，被打败的人类识别能力就是这样定义的，做为人类一分子的你，不管是拖了后腿还是低估了你，你就是这样被算法打败的！不服？你上最吊大脑秀去啊。。。当然，所谓的人类识别能力也不是只有这家子的定义，还有好几个呢，当然，它们都不出意外地被这个或那个算法打败了！！！所以，媒体宣传说人类识别能力首次被超越是不严肃的。我们过一下文章[0]提到的那几个被打败的人类识别能力的定义：[7]中的人类代表是作者在AiT（现3M）公司的同事，共21男（16男5女），年龄在20-40；[8]中的人类代表是Texas大学的91名学生；[9]中的人类代表是43名在校大学生；3、关于GaussianFace终于轮到主角出场了，是不是等了好久了，伦家可是打败了人类，上了头条的X星人。。。你这么吊你家里人知道吗！知道吗！关于算法，
已经细读了文章，也给了详细的解释；
也提到多任务学习（multi-task learning），这方法是用做得到模型，提升性能而已；GaussianFace（下面用GF表示）的核心在于高斯过程（Gaussian Processes，GPs）[10]的应用，包括Gaussian Processes for classification和Gaussian Process Latent Variable Model (高斯过程隐变量模型，GPLVM)，其优点如下：高斯过程是一种基于核函数的方法，是一种非参数概率模型，具有完全的贝叶斯公式化表示；根据训练样本，可以从先验分布转换到后验分布，不仅能对未知输入做输出预测，同时也能给出该预测的精度参数。（原文描述为：Moreover, the GaussianFace model is a reformulation based on the Gaussian Processes (GPs), which is a non-parametric Bayesian kernel method）GPLVM的特性在于，当观测数据的样本个数比较少时，仍然可以用来寻找观测数据的低维流形，也就是说GPLVM非常适合处理小样本的高维数据。这就是GF只需要少量样本（约40000），便在LFW上取得了良好的结果；相比于SVM的参数需要通过交叉验证方法或者经验法得到，高斯过程隐变量模型中需要确定的模型参数包括核函数中的超参数（(hyper parameter）和隐变量Z，采用的方法是共扼梯度优化法（ Conjugate Gradient）；至于神经网络或深度学习，那更是门调参数的艺术；与其说GF打败了人类，不如说其打败了深度学习，至少目前在LFW是这样，FaceBook的DeepFace或是Face++的人脸DL表述都得屈居其后。同时不负责任地说句，这可不是GPs首次打败神经网络，就在DeepLearning就要一统江湖的时候，GF是不是让还没摊DL这趟浑水的同学看到了希望呀。那是不是说GF就是人脸识别的终极方案呢?4、人脸识别碎碎念说到人脸识别，很多人都要说这不很成熟的玩意嘛。确实，毕竟大年轻的人工智能历程上有着悠久的历史，随便找个这方向的研究生，甚至是做过这方向毕设的本科生，也能捣鼓出将一宿舍人识别出来的程序，EignFace/FisherFace，PCA/LDA，或是LBP/Gabor/HOG/MBLBP/SIFT...扔到SVM/LR/Adaboost...里去，或是赶赶DL的时髦，哥也是搞过智能的，人脸识别有那么难吗，骗谁呢，当我没上过大学是吧。。。大伙儿接触到的人脸识别场景大致如下：人脸考勤：当然要求正脸了，光照较稳定；智能设备的人脸登录：正脸，光照可能有变化，但识别不出来也不负责；安检（室内）：固定的机位得到合适的人脸，采用近红外摄像头可一定程度避免光照影响；总之，都不是将被识别对象放置于生活场景的应用，而且不容许被动失败，这样，大家当然觉得人脸识别还挺成熟。但当我们考虑到全网人脸搜索，SNS上人脸识别的时候，问题的难度便呈几何级增长；5、参考[0].Surpassing Human-Level Face Verification Performance on LFW with GaussianFace.[][1]. [2]. Labeled Faces in the Wild: A Database for Studying Face Recognition in Unconstrained Environments.[3].[4]. [5]. [6]. [7].Comparing Human and Automatic Face Recognition Performance.[8].Face Recognition Algorithms Surpass Humans Matching Faces over Changes in Illumination.[9].Comparing Face Recognition Algorithms to Humans on Challenging Tasks.[10]. 【知乎用户的回答(3票)】:看到时间线上出现的题目我就不请自来了。Face verification remains a challenging problem in verycomplex conditions with large variations such as pose,illumination, expression, and occlusions. This problemis exacerbated when we rely unrealistically on a singletraining data source, which is often insufficient to coverthe intrinsically complex face variations. This paper pro-poses a principled multi-task learning approach based onDiscriminative Gaussian Process Latent Variable Model,named GaussianFace, to enrich the diversity of trainingdata. In comparison to existing methods, our modelexploits additional data from multiple source-domains toimprove the generalization performance of face verificationin an unknown target-domain. Importantly, our modelcan adapt automatically to complex data distributions, andtherefore can well capture complex face variations inherentin multiple sources. Extensive experiments demonstratethe effectiveness of the proposed model in learning fromdiverse data sources and generalize to unseen domain.Specifically, the accuracy of our algorithm achieves animpressive accuracy rate of 98.52% on the well-known andchallenging Labeled Faces in the Wild (LFW) benchmark[?]. For the first time, the human-level performance in faceverification (97.53%) [?] on LFW is surpassed. 以上是 Chaochao Lu 和 Xiaoou Tang 论文的Abstract，最近写毕业设计没有时间看全文，但如果不想深层次了解算法，看看摘要也就够了。简单点来说这用的是一种机器学习的方法，就是要计算机做有答案的练习题，它做完你告诉它对错。计算机自己总结方法/原则后，它就将这种方法/原则用于未知答案的问题。通过大量的学习校正，计算机可以总结出大量人脸的特征变量，通过这些变量来判定人脸相似度。我对其他人脸识别的算法不算很了解，但大多数算法应该都是固定的变量。固定的变量就存在考虑不够周全的情况，比如我考虑了眼睛的大小却没考虑耳朵的大小。但基于学习的方法会自己总结变量，只要这种有答案的样本够大，那么就可以得到足够的变量来判断。顺便说一下，作者用到的样本是现有的数据库。若有错误，敬请前辈斧正。【李旭的回答(1票)】:个人认为这篇文章的训练要优于之前世界前几名的facebook或face++，不得不承认，没有一个大的数据库会使认证率降低，但是这篇文章的训练库数量级远小于facebook和face++的数量级，这是一个很大的进步。如果全球只有个别的实验室可以做这些实验，其他小型的实验室的存在还有意义吗？【知乎用户的回答(0票)】:补充个有趣的链接：（前面的介绍很全面）后面的测试题到第3-4关难度就很高了。【张绽的回答(0票)】:因为它专注于此，哈哈，人类关注的太多…【黄灿的回答(0票)】:我觉得计算机与人类处理问题的方式根本不是一回事，人可以通过各方面判断一个人是谁，比如背影，走路的动作，神态，这些东西貌似计算机判断不出来。原文地址:
【上一篇】
【下一篇】
您可能还会对这些文章感兴趣！
最新评论文章}

叫阿莫西中心