如何通过深度学习来预测pr图像序列列

摘要: 本文讲的是深度学习论文笔记:YOLO, Abstract 之前的物体检测的方法是使用分类器来进行检测。 相反,本论文将对象检测作为空间分离的边界框和相关类概率的回归问题。 本论文的YOLO模型能达到45fps的实时图像处理效果。 Fast YOLO:小型的网络版本,可达

Abstract 之前的物体检测的方法是使用分类器来进行检测。 相反,本论文将对象检测作为空间分离的边界框和相关类概率的回归问题。 本论文的YOLO模型能达到45fps的实时图像处理效果。 Fast YOLO:小型的网络版本,可达到155fps。 与目前的检测系统相比,YOLO会产生更多的定位错误,但是会更少的去在背景中产生false positive。 Introduction

YOLO在准确性方面依旧落后与其他先进的检测系统,但是可以快速的标注图片中的物体,特别是小物体。 Unified Detection

本论文将物体检测中单独的组件统一到一个单一的神经网络中。网络利用整个图像的各个特征来预测每一个BB。而且同时为一张图片中所有的类预测所用的BB。

YOLO可以end-to-end来训练,而且能在保持高平均准确率的同时达到实时要求。

系统将输入图片分为 S?S 的网格单元。如果物体的中心落入某个格子,那么这个格子将会用来检测这个物体。

每个网格单元会预测B个bounding box以及这些框的置信值。

每个网格单元也预测C个条件类概率, Pr(Classi|Object) ,在一个网格单元包含一个物体的前提下,它属于某个类的概率。我们只为每个网格单元预测一组类概率,而不考虑框B的数量。

起初的卷积层用来从图像中提取特征。

全连接层用来预测输出的概率和坐标。

24个卷积层,之后跟着2个全连接层

Fast YOLO和YOLO之间所有的训练和测试参数一样。

将预训练的模型用来检测,论文Ren et al.显示给与训练好的模型添加卷积和连接层能够提高性能。所以添加了额外的4个卷积层和2个全连接层,其权值随机初始化。

由于sum-squared error的缺点,增加边界框坐标预测的损失,并减少对不包含对象的框的置信度预测的损失。

YOLO为每一个网格单元预测多个BB,但是在测试期间,我们只想每一个物体有一个BB预测框来做响应,我们选择具有最高IOU的BB来作为响应框。

Systems 检测流水线往往开始于提取健壮特征集(Haar, SIFT, HOG, convolutional features),然后分类器或者定位器用来识别特征空间的物体,这些分类器或者定位器往往在整个图像上或者在图像的子区域中滑动窗口。 与DPM的比较。 与R-CNN的比较。每个图片值预测98个bounding boxes。 与其他快速检测器的比较。相比于单类检测器,YOLO可以同时检测多种物体。 与Deep MultiBox的比较。YOLO是一个完整的检测系统。 与OverFeat的比较。OverFeat是一个disjoint的系统,OverFeat优化定位,而非检测性能。需要大量的后处理。 与MultiGrasp的比较。执行比目标检测更简单的任务。

以上是云栖社区小编为您精心准备的的内容,在云栖社区的博客、问答、公众号、人物、课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索深度学习 , 目标检测 , 论文笔记 yolo ,以便于您获取更多的相关知识。

}

【新智元导读】谷歌用深度学习分析电子病例的重磅论文给出了一个意外的实验结果,DNN与逻辑回归效果一样,引发了热烈讨论。不仅如此,最近Twitter讨论最多的论文,是UC戴维斯和斯坦福的一项合作研究,作者发现神经网络本质上就是多项式回归。下次遇到机器学习问题,你或许该想想,是不是真的有必要用深度学习。

近来,谷歌一篇关于使用深度学习进行电子病例分析的论文,再次引发热议。

起因是以色列理工学院工业工程与管理学院的助理教授 Uri Shalit 在 Twitter 上发文,指出这篇论文的补充材料里,有一处结果非常值得注意:标准化逻辑回归实质上与深度神经网络一样好

Uri Shalit 的研究方向是将机器学习应用于医疗领域,尤其是在向医生提供基于大型健康数据的决策支持工具方面。其次,他也研究机器学习和因果推断的交集,重点是使用深度学习方法进行因果推断。在加入以色列理工学院以前,他先后在 David Sontag 教授在纽约大学和在 MIT 的临床机器学习实验室当博士后。 Uri Shalit 说的补充材料中的结果是指这个:

注意到基线模型(红框标识)和深度模型在 AUCs 置信区间的重叠了吗?

Uri Shalit 表示,他由此得出的结论是,在电子病例分析这类任务中,应该选择使用逻辑回归,而不是深度学习,因为前者更加简单,更具可解释性,这些优点要远远胜过深度学习带来的微小的精度提升。

或者,Uri Shalit 补充说,这表明我们目前还没有找到正确的深度学习结构,能实现在图像、文本和语音建模领域中那样的性能提升。

谷歌首篇深度学习电子病历分析论文,Jeff Dean 等大牛扛鼎之作,结果出人意料

UCSF、斯坦福、芝加哥大学众多大牛,与全球顶级医学院联合完成,从题目到作者都吊足了大家的胃口。

实际上,早在今年初,新智元就介绍过这篇论文,当时它还只是挂在 arXiv 上,康奈尔大学威尔医学院助理教授王飞对当时的 arXiv 版本进行了解读

这项工作是在 UCSF 和 UChicago 这两大医院系统的电子病历数据上,用深度学习模型预测四件事:1)住院期间的死亡风险;2)规划之外的再住院风险;3)长时间的住院天数;4)出院的疾病诊断。

文章仔细介绍了实验信息,例如如何构建病人队列、特征如何变换、算法如何评价等等。对于每一个预测任务,作者也都选取了临床上常用的算法作为基线来进行比较,例如评价死亡风险的  EWS 分数,以及评价再住院风险的 HOSPITAL 分数,并对这些模型做了微小的改进。最终结果,作者提出的深度学习模型在各项任务中都显著优于传统模型(AUC

新智元 AI 技术 + 产业社群招募中,欢迎对 AI 技术 + 产业落地感兴趣的同学,加小助手微信号: aiera2015_3  入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 - 公司 - 职位;专业群审核较严,敬请谅解)。

本文来自大风号,仅代表大风号自媒体观点。

}

  但是怎样着手统计呢?这些都是图像啊。

  为了激发大家的思考,我们从一个很好理解、可以写成简洁形式的概率分布开始:一个正态分布。这是正态分布的概率密度函数(PDF)。你可以将PDF理解成在输入空间横向移动,纵轴表示某个值出现的概率。(如果你感兴趣,绘制这幅图的代码可以从⑥下载。)

  将生成对抗网络类比为街机游戏。两个网络相互对抗,共同进步。就像两个人类在游戏中对抗一样。

  我们通过对梯度进行梯度下降,可以迭代地求出。 我们定义了损失函数之后,Tensorflow 的 automatic differentiation可以自动地为我们计算出这个值! 所以, 完整的基于DCGANs的实现可以通过在现有的DCGAN实现上添加4行Tensorflow代码来完成。(当然,实现它还需要一些非 Tensorflow 代码。)

  接下来,我们定义掩码。我只是在图像的 中央区域加了一个, 你可以加一些别的, 比如随机掩码, 然后发一个pull请求。

  梯度下降方面,我们对于z在[-1, 1]上的投影,使用小批量、含动量的投影梯度下降。

《全球人工智能》旗下业务

  AIJobs:免费为全球数万名AI开发者提供求职服务,目前提供约2000个AI技术岗位

  (咨询加微信:aihr007

  OpenAI:免费为全球Top30AI开放平台的数十万AI开发者提供最新动态、交流和学习

  AISchool:专注为全球AI科学家和学习者提供线上线下的技术交流、学习和直播等

}

我要回帖

更多关于 图像序列 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信