有哪些机器学习,图像识别方面的机器人入门书籍籍

有哪些机器学习,图像识别方面的入门书籍_百度知道
有哪些机器学习,图像识别方面的入门书籍
我近习机器习看《机器习实战》用python实现面都实例熟悉些见机器习算coursera吴恩达machine learning课程错~
来自团队:
其他类似问题
为您推荐:
图像识别的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁机器学习和图像识别是怎样彻底改变搜索的? - 博客 - 伯乐在线
& 机器学习和图像识别是怎样彻底改变搜索的?
文本内容一般很好搜索,但有很多信息是以其他形式存在的。语音识别将音频-以及视频配乐-转换成可以索引和搜索的文本。但如果是视频本身,或其它的图片内容呢?
如果不仅仅是在页面上寻找指出图片相关性的文字或是说明,那么在网络上搜索图片将准确很多。幸好有使用神经网络和深度学习的机器学习技术,使得这个设想成为可能。
微软和Facebook的研究人员创建了一个含有人工标记250万个物品、超过300,000张图片的大规模数据库(被称为Common Objects in Context),他们声称四岁孩子都可以识别出这些对象。所以微软的一批机器学习方面的研究人员决心看看他们的系统对同样的图片能处理到何种程度——不仅仅是识别它们,还要把它们分离为不同的对象,为每个对象命名并写下能描述整张图片的标题。
为了评测结果,他们请一部分人写下个人认为的图片标题,再请另外一部分人比较图片的两个标题并选出他们认为比较适合的标题。
“这是真正能检测质量的办法,”微软研究院的著名科学家约翰·普莱特(John Platt)说道,“到底人们对这些标题是什么看法呢?23%的标题被认为和人总结写下的标题水平相当。也就是说大概有四分之一的时候这台机器能够达到人的水平。”
部分问题是视觉识别器。有时它可能会把猫识别成狗,或是认为长毛的都是猫,又或是把人指着雕塑的图片识别为包含足球。这是一个小团队历经夏天的四个月就能达到的水平,而且这是他们第一次标记这么大规模的数据集来训练和测试。
“我们可以做得更好,”普莱特自信地说道。
机器学习在辨别只包含一种事物的简单图片上已经做的相当不错了。“这个系统已经被赋予一个未经训练的人的水平了,”普莱特解释道。这是针对一个称作ImageNet的图片集的测试,图片集中的图片被标记为2200个不同分类。
“那包含了一些未经训练的人不知道的细微区别,”他宣称。“像彭布鲁克威尔士柯基犬和卡迪根威尔士柯基犬一样——其中一个的尾巴稍长。人可以研究很多小狗的特征然后学会了解之前并不知道的一些不同之处。如果是你非常熟悉的物体,识别它们会很简单,但当2200个陌生物体放在你面前时,你可能会完全混淆。”人在ImageNet测试中会有5%的错误率,而机器学习系统则会降至6%。
这意味机器学习系统在识别事物如狗的种类或是有毒植物方面可能比普通人的能力更好。另外一个叫作Project Adam的识别系统也正尝试在手机端做到这些,就是MSR的负责人Peter Lee今年早些时候炫耀的那个。
Project Adam专注于研究是否能够使用分布式系统而不是配置较高的单机来提高图片识别的速度(所以它就可以运行在云端然后在你的手机端工作)。然而,它的训练集合中只有仅包含一种物品的图片。
“他们会问‘图片里的是什么东西?’”普莱特解释道,“我们将图片分解为小方格然后去估测这个图片的碎片,检测其共同内容。图片中物体是什么?这些都是名词。他们在干什么?这些都是如飞行和看之类的动词。”
“然后还有一些邻接和上下关系,以及物品的属性,一些形容词如红的,紫的,漂亮的。识别完整张图片后自然就是将一张图片中的多个物品放在一起然后提出一个具体的描述。你可以看着图片能检测出一些动词和形容词,这是非常有趣的一件事。”
强大的搜索
让图片更加有用
很多自动给图片写标题做标记的方法将会派上用场,特别在当你是一个主动去图片库或新闻网站寻找正确图片的敏锐摄影师的时候。
“想到整理图片很自然就想到了用图片中的人物索引该图片,”普莱特指出。有了更强大的标签技术,就能够搜索图片中的对象(比如猫的图片)或是动作(猫在喝水的图片)又或是图片中不同对象之间的关系。“如果我只记得我有一张图片,其中有一个男孩和一匹马,我希望能为它建立索引——既有男孩和马,又要有他们的关系——然后将他们放到一个索引中以便我以后能搜索到他们。”
如果你正在汇总一个产品目录,有一个能自动产生的标题将是非常有用的,但普莱特没有发现太多这种特定需求。在微软,不同的产品团队对此都很有兴趣,他说,但不是创建标题,他希望的是“这些板块能被不同产品复用;在不同的场景下,这些代码都能运行。”
处理视频意味着需要加速识别过程,并研究出如何发现感兴趣的地方(因为并不是每一帧都有用)。但这里重要的不仅仅是速度,还有那些潜存于复杂图片自动标题技术之下的理解方式,它将改变搜索。
这里图片识别使用的深度学习神经网络和机器学习系统是相同的技术,都彻底变革了近几年的语音识别和翻译技术(促使微软推出Skype翻译)。“每次你对着手机上的必应搜索引擎说话就是在和一个深度网络说话,”普莱特表示。微软的视频搜索系统,MAVIS,使用的就是深度网络。
下一步就是要做到不只能识别,还能理解事物实际代表的意义。
他还表示,他们的目标是“真正理解对象的语义,这里的对象包括视频、语音、图片、文本。而不是停留在语言或颜色的表面形式上。”
关于作者:
可能感兴趣的话题
关于伯乐在线博客
在这个信息爆炸的时代,人们已然被大量、快速并且简短的信息所包围。然而,我们相信:过多“快餐”式的阅读只会令人“虚胖”,缺乏实质的内涵。伯乐在线博客团队正试图以我们微薄的力量,把优秀的原创/译文分享给读者,做一个小而精的精选博客,为“快餐”添加一些“营养”元素。
新浪微博:
推荐微信号
(加好友请注明来意)
– 好的话题、有启发的回复、值得信赖的圈子
– 分享和发现有价值的内容与观点
– 为IT单身男女服务的征婚传播平台
– 优秀的工具资源导航
– 翻译传播优秀的外文文章
– 国内外的精选文章
– UI,网页,交互和用户体验
– 专注iOS技术分享
– 专注Android技术分享
– JavaScript, HTML5, CSS
– 专注Java技术分享
– 专注Python技术分享
& 2016 伯乐在线
赞助云主机图像识别中的深度学习---王晓刚_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
图像识别中的深度学习---王晓刚
上传于||文档简介
&&深​度​学​习​入​门
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
下载文档到电脑,查找使用更方便
还剩6页未读,继续阅读
你可能喜欢& & 前面有一篇机器学习经典论文/survey合集,本文总结了机器学习的经典书籍,包括数学基础和算法理论的书籍。本文会保持更新,欢迎推荐。入门书单《数学之美》PDF& & 作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。《Programming Collective Intelligence》(《集体智慧编程》)PDF& & 作者Toby Segaran也是《BeautifulData : The Stories Behind Elegant Data Solutions》(《数据之美:解密优雅数据解决方案背后的故事》)的作者。这本书最大的优势就是里面没有理论推导和复杂的数学公式,是很不错的入门书。目前中文版已经脱销,对于有志于这个领域的人来说,英文的pdf是个不错的选择,因为后面有很多经典书的翻译都较差,只能看英文版,不如从这个入手。还有,这本书适合于快速看完,因为据评论,看完一些经典的带有数学推导的书后会发现这本书什么都没讲,只是举了很多例子而已。《Algorithms of the Intelligent Web》(《智能web算法》)PDF& & 作者Haralambos Marmanis、Dmitry Babenko。这本书中的公式比《集体智慧编程》要略多一点,里面的例子多是互联网上的应用,看名字就知道。不足的地方在于里面的配套代码是BeanShell而不是python或其他。总起来说,这本书还是适合初学者,与上一本一样需要快速读完,如果读完上一本的话,这一本可以不必细看代码,了解算法主要思想就行了。《统计学习方法》PDF& & 作者李航,是国内机器学习领域的几个大家之一,曾在MSRA任高级研究员,现在华为诺亚方舟实验室。书中写了十个算法,每个算法的介绍都很干脆,直接上公式,是彻头彻尾的&干货书&。每章末尾的参考文献也方便了想深入理解算法的童鞋直接查到经典论文;本书可以与上面两本书互为辅助阅读。《Machine Learning》(《机器学习》)PDF& & 作者Tom Mitchell是CMU的大师,有机器学习和半监督学习的网络课程视频。这本书是领域内翻译的较好的书籍,讲述的算法也比《统计学习方法》的范围要大很多。据评论这本书主要在于启发,讲述公式为什么成立而不是推导;不足的地方在于出版年限较早,时效性不如PRML。但有些基础的经典还是不会过时的,所以这本书现在几乎是机器学习的必读书目。《Mining of Massive Datasets》(《大数据》)PDF& & 作者Anand Rajaraman[3]、Jeffrey David Ullman,Anand是Stanford的PhD。这本书介绍了很多算法,也介绍了这些算法在数据规模比较大的时候的变形。但是限于篇幅,每种算法都没有展开讲的感觉,如果想深入了解需要查其他的资料,不过这样的话对算法进行了解也足够了。还有一点不足的地方就是本书原文和翻译都有许多错误,勘误表比较长,读者要用心了。《Data Mining: Practical Machine Learning Tools and Techniques》(《数据挖掘:实用机器学习技术》)PDF& & 作者Ian H. Witten 、Eibe Frank是weka的作者、新西兰怀卡托大学教授。他们的《ManagingGigabytes》[4]也是信息检索方面的经典书籍。这本书最大的特点是对weka的使用进行了介绍,但是其理论部分太单薄,作为入门书籍还可,但是,经典的入门书籍如《集体智慧编程》、《智能web算法》已经很经典,学习的话不宜读太多的入门书籍,建议只看一些上述两本书没讲到的算法。《机器学习及其应用》& & 周志华、杨强主编。来源于&机器学习及其应用研讨会&的文集。该研讨会由复旦大学智能信息处理实验室发起,目前已举办了十届,国内的大牛如李航、项亮、王海峰、刘铁岩、余凯等都曾在该会议上做过讲座。这本书讲了很多机器学习前沿的具体的应用,需要有基础的才能看懂。如果想了解机器学习研究趋势的可以浏览一下这本书。关注领域内的学术会议是发现研究趋势的方法嘛。《Managing Gigabytes》(深入搜索引擎)PDF& & 信息检索不错的书。《Modern Information Retrieval》PDF& & Ricardo Baeza-Yates et al. 1999。貌似第一本完整讲述IR的书。可惜IR这些年进展迅猛,这本书略有些过时了。翻翻做参考还是不错的。另外,Ricardo同学现在是Yahoo Research for Europe and Latin Ameria的头头。《推荐系统实践》PDF& & 项亮,不错的入门读物深入《Pattern Classification》(《模式分类》第二版)PDF& & 作者Richard O. Duda[5]、Peter E. Hart、David。模式识别的奠基之作,但对最近呈主导地位的较好的方法SVM、Boosting方法没有介绍,被评&挂一漏万之嫌&。《Pattern Recognition And Machine Learning》PDF& & 作者Christopher M. Bishop[6];简称PRML,侧重于概率模型,是贝叶斯方法的扛鼎之作,据评&具有强烈的工程气息,可以配合stanford 大学 Andrew Ng 教授的 Machine Learning 视频教程一起来学,效果翻倍。&《The Elements of Statistical Learning : Data Mining, Inference, andPrediction》,(《统计学习基础:数据挖掘、推理与预测》第二版)PDF& & 作者RobertTibshirani、Trevor Hastie、Jerome Friedman。&这本书的作者是Boosting方法最活跃的几个研究人员,发明的Gradient Boosting提出了理解Boosting方法的新角度,极大扩展了Boosting方法的应用范围。这本书对当前最为流行的方法有比较全面深入的介绍,对工程人员参考价值也许要更大一点。另一方面,它不仅总结了已经成熟了的一些技术,而且对尚在发展中的一些议题也有简明扼要的论述。让读者充分体会到机器学习是一个仍然非常活跃的研究领域,应该会让学术研究人员也有常读常新的感受。&[7]《Data Mining:Concepts andTechniques》(《数据挖掘:概念与技术》第三版)PDF& & 作者(美)Jiawei Han[8]、(加)Micheline Kamber、(加)Jian Pei,其中第一作者是华裔。本书毫无疑问是数据挖掘方面的的经典之作,不过翻译版总是被喷,没办法,大部分翻译过来的书籍都被喷,想要不吃别人嚼过的东西,就好好学习英文吧。《AI, Modern Approach 2nd》PDF& & Peter Norvig,无争议的领域经典。《Foundations of Statistical Natural Language Processing》PDF& & 自然语言处理领域公认经典。《Information Theory:Inference and Learning Algorithms》PDF《Statistical Learning Theory》PDF& & Vapnik的大作,统计学界的权威,本书将理论上升到了哲学层面,他的另一本书《The Nature ofStatistical Learning Theory》也是统计学习研究不可多得的好书,但是这两本书都比较深入,适合有一定基础的读者。数学基础《矩阵分析》PDF& & Roger Horn。矩阵分析领域无争议的经典《概率论及其应用》PDF& & 威廉&费勒。极牛的书,可数学味道太重,不适合做机器学习的《All Of Statistics》PDF 扫描版PDF 高清版& & 机器学习这个方向,统计学也一样非常重要。推荐All of statistics,这是CMU的一本很简洁的教科书,注重概念,简化计算,简化与Machine Learning无关的概念和统计内容,可以说是很好的快速入门材料。《Nonlinear Programming, 2nd》PDF& & 最优化方法,非线性规划的参考书。《Convex Optimization》PDF配套代码& & Boyd的经典书籍,被引用次数超过14000次,面向实际应用,并且有配套代码,是一本不可多得的好书。《Numerical Optimization》PDF& & 第二版,Nocedal著,非常适合非数值专业的学生和工程师参考,算法流程清晰详细,原理清楚。《Introduction to Mathematical Statistics》PDF& & 第六版,Hogg著,本书介绍了概率统计的基本概念以及各种分布,以及ML,Bayesian方法等内容。《An Introduction to Probabilistic Graphical Models》PDF& & Jordan著,本书介绍了条件独立、分解、混合、条件混合等图模型中的基本概念,对隐变量(潜在变量)也做了详细介绍,相信大家在隐马尔科夫链和用Gaussian混合模型来实现EM算法时遇到过这个概念。《Probabilistic Graphical Models-Principles and Techniques》PDF& & Koller著,一本很厚很全面的书,理论性很强,可以作为参考书使用。具体数学PDF& & 经典
声明:该文章系网友上传分享,此内容仅代表网友个人经验或观点,不代表本网站立场和观点;若未进行原创声明,则表明该文章系转载自互联网;若该文章内容涉嫌侵权,请及时向
上一篇:下一篇:
相关经验教程
的原创经验被浏览,获得 ¥0.001 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.001 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.001 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.001 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.001 收益
的原创经验被浏览,获得 ¥0.001 收益
的原创经验被浏览,获得 ¥0.005 收益
的原创经验被浏览,获得 ¥0.001 收益
的原创经验被浏览,获得 ¥0.005 收益}

我要回帖

更多关于 数字图像处理入门书籍 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信