目前有什么好的机器学习方法可做雾霾预测

深思丨面对雾霾,程序员可以利用自己的专业做些什么?
虽然远在硅谷,但是朋友圈里的每一张关于国内雾霾的照片都牵动着我们的神经。所以太阁决定写这篇文章,探索程序员们应对雾霾到底能做些什么。
03-08年,北京的雾霾越来越严重,帝都人民感觉经常“见不到蓝天,天总是灰蒙蒙的”,但是鲜少有人知道雾霾这个词。到了08年北京奥运会的前后,官方要求一部分工厂迁址。在迎来“奥运蓝”的同时,也引起了人们对空气质量的关注。从11年左右开始,美国大使馆持续播报 PM2.5 的行为终于引发了社会关注,加之政府承认了 “雾霾” 的问题。时至今日,雾霾在今天的中国可以说无处不在。
这是从北京上空的飞机拍摄到的图片。
这是在雾霾笼罩下的城市。
现实与过往的图片反差显得触目惊心。
这是NASA 2010年发布的 年全球PM2.5污染地图,颜色越接近红色就表示PM2.5的浓度越高。可以看到,相较于蓝绿色的美洲大陆,中国的大部分国土都被红黄色占据,华北地区的颜色甚至红的发黑。
与上图类似,下图显示的能见度数据表中,颜色越接近红色表示能见度越低。可以看到,中国的东部地区正在被鲜艳的红色所攻占。
面对着雾霾缭绕的“人间仙境”,没有人想一直在这样的环境里凑合地活着。除了出门去当一个人肉吸尘器,作为一个负责任的程序员,你可以做些什么来改变这个状况?
?进一步优化你的代码
写的一手好代码不仅可以提升程序运行的效率,优化用户体验,而且可以减少CPU的使用,降低计算机的负荷。同时,程序员可以更高效地按时完成工作,避免过度地加班,从而准时上下班,既节约了能源,又保证了健康的生活方式。
?更多的开源你的代码
作为一个程序员,每天你有多少时间是花在造轮子上面?如果可以,请尽量开源你的代码,为其他程序员提供便利,减少大家的在造轮子方面花的成本。从科技公司的角度来说,更多的开源程序可以节省企业的研发投入,进一步提高ROI,减少产能的浪费。
诚然,以上两点对于改善雾霾的整体状况来说可能是杯水车薪,但是我们猜测以下的几点可能会为对抗雾霾事业带来巨大的推动。
?用数据分析来探寻雾霾的源头
最理想的状况是,我们可以利用数据科学来寻找气象与环境污染之间的关系,最终用数据可视化的方式将结果直观的呈现给民众。
比如在今年的4月27日,在云栖大会·南京峰会上,阿里巴巴公益基金会、中国气象局公共气象服务中心主办的天池数据可视化创新大赛就邀请参赛者对阿里云天池平台上的各类气象数据与公共环境数据进行分析挖掘,寻找空气、水质、企业排放、气象等数据之间的关系,最终用可视化的形式展现出来。浙江大学CAD&CG国家重点实验室的陈为教授认为,如果能够将细粒度的风场数据、企业废气排放情况以及PM2.5空气质量的状况呈现在一张图上,将有助于观察与研究风向同污染物扩散之间的关系,为公众以及政府决策者提供详实可靠的支撑数据。
?建立雾霾天气预测模型
在雾霾问题得到了大量的曝光之后,也有更多的商业公司加入到这一行业中,探索利用机器学习和人工智能解决问题的可能。比如IBM就与北京市政府合作,帮助将雾霾的预测准确率提高到3天80%正确率以及7-10天75%正确率(来自雷锋网数据)。现在,我们已经可以对1~6小时的空气质量逐小时进行预测,对7~12小时、12~24小时、24~48小时进行最大值和最小值的预测。相较于传统的重污染天气6小时的预测工作,我们已经可以在几秒钟之内快速算出重污染空气质量数据。
但是,这些还远远不够,我们需要更多的数据样本来进一步提高大数据预测的精准度。
?分享知识,帮助改善中国产业结构
国家能源委员会专家咨询委员会主任、国家能源局原局长张国宝认为,造成中国雾霾问题的根本原因之一就是在国家产业结构中,很大一部分都是制造业。在所有用电中,有超过65%的用电是工业用电,而在美国,这一比例低于30%。作为高端技术人才,我们可以更多的分享我们的知识,有时候或许你的一个知乎回答或许就可以帮助一个懵懂的少年走上计算机科学之路。
?和别人一样,从小事做起
多使用公共交通工具,注重生活垃圾的分类,购买新能源汽车,种种不起眼的小事都可以为改善空气环境做出些许的贡献。
?一些大家可以爬雾霾相关数据的网站
这里我们搜集了一些与气象数据有关的网站,大家有兴趣的话可以爬一爬,有兴趣的同学可以把分析报告投稿给太阁,我们会帮你发表(版权依旧归你所有),让更多的人看到中国雾霾的现状。
Word History & Data Archive,这个网站记录了有气象记录开始至今的所有主要数据
https://www.wunderground.com/history/
World Climate data,数据比上面那个网站更加精确一些
http://en.tutiempo.net/
国际交换站08/20时探空资料,需提前查站号
http://weather.uwyo.edu/upperair/europe.html
中国国家气候中心
http://ncc.cma.gov.cn/cn/
中国气象局国家气候中心,不太明白和上面那个有什么区别
http://cmdp.ncc-cma.net/cn/index.htm
世界银行公开数据,各种数据都可以爬
http://data.worldbank.org.cn/
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点普通码农入门机器学习,必须掌握这些数据技能
其实,机器学习一直在解决着各种重要的问题。比如说90年代中期,人们已经开始用神经网络来扫描信用卡交易记录,从中找到欺诈行为;90年代末,Google把这项技术用到了网络搜索上。
但在那个时候,机器学习还和普通的工程师无缘。开发一个机器学习系统,需要读个PhD,还得找到一群想法类似、志同道合的朋友。
现在,机器学习终于更强大也更亲民了。
一个普通的软件工程师,不需要去专门回炉重造读个研究生,就能运用机器学习开发出非常不错的系统。
当然,普通的码农要用好机器学习,还得补一些课,学一些数据技能。InforWorld的这篇文章就讲述了一些技巧和策略,能够帮助开发者们更有效地使用机器学习。
让数据说话
在良好的软件工程实践过程中,你经常能通过推理得到所需的设计,写好软件部分,然后直接且独立地对这个解决方案进行检验。
有时候,你甚至能从数学上证明你软件是正确的。但这在实际问题中往往较难实现,尤其是要考虑人类参与的时候,但如果你有良好的规范,你仍可以执行一个正确的解决方案。
但机器学习不一样。大体上,你不需要一个严格的规范。你有了能表示系统以往经验的数据,然后需要的是建立一个能够在未来奏效的系统。
为了测试系统是否真的奏效,你需要在真实情况中评估它的表现。切换到这种“重数据,轻阐述”的开发模式会有很大阻力,但这是你构建机器学习系统的关键一步。
学会辨识更优的模型
比较两个数字的大小是很简单的事情。假设它们都是有效的值(不是非数字类型),你只需要判断哪个值更大,就结束了。
而在比较机器学习的准确性时,问题就不这么简单了。
你要比较的模型有大量的输出结果,而没有一个明确的答案。构建机器学习系统所需的一项非常基本的能力,就是通过观察两个模型之前制定的决策,决定哪个模型更符合你的问题情境。
做出这个判断,你需要将这些数据做整体考虑而不是某个单一的值。这通常也需要你能够很好地进行数据可视化,比如说使用柱状图,散点图和许多其他相关的数据表示方式。
对你的结论保持怀疑
与判断哪个模型更好一样,对你自己的结论保持怀疑同样很重要。
你的结果是否只是统计上的偶然,数据变多后就不再成立?在你评估后情况是否发生了变化,因此之前的决策是否仍有效?
搭建一个内嵌机器学习的系统意味着你需要时刻确认系统依然在做你一开始布置的任务。这种怀疑精神是在变化的现实情况中进行模糊比较所必须的品质。
搭建多个模型以便筛选
在软件行业有一句老话,你构建的第一版系统是注定要扔掉的。这句话的含义是,直到你实实在在搭建了一个有效的系统之后,你才能充分理解问题从而更好地搭建系统。所以你可以先通过构建一个版本来积累经验,随后把学到的经验应用到设计中,构建出实际的系统。
对于机器学习来说,情形相同乃至更甚。搭建一个系统来练手还不够,你要做好搭建数十上百个版本的准备。有些版本可能用的是不同的学习方式,或者只是不同的参数设置;另外一些版本则是对问题或者训练数据完全不同的重述。
举例来说,你可能会发现在你想预测的信号之外,还可以用其它的替代信号来训练模型。这样,你可能会有十倍于原始的数据来训练。或者你可以去尝试用另一种方式来重述问题,使其变得更易解决。
这个世界瞬息万变。比如说你搭建模型检测欺诈行为的时候,即便你已经搭建了一个成功的系统,仍需要在未来适时做出改变。因为骗子会识别出你的漏洞,从而改变它们的行为。你将会被迫采取新的对策。
所以为了取得成功,你需要搭建一系列用来丢弃的机器学习模型。不要寄希望于有一个永久适用的万能模型。
无畏于改变
开始你想用机器学习解决的问题情景通常是不对的,甚至可能大错特错。因此,可能会遇到根本无法训练的模型,或是收集不到用于训练的数据,又或者模型训练出的最优结果却价值有限。
重新审视这个问题,可能会使得一个简单的模型就具有很高的价值。
我曾经遇到过一个有关推荐商品的问题,哪怕用上一些高大上的技能,想获得一点微博的收益也很难。
但实际上,我们应该关注的高价值问题是优秀的商品何时上市。只要你知道了这个时间点,就有很多好商品可供选择,“推荐什么产品”这个问题就迎刃而解了。
重新定义问题,让整个项目更容易解决了。
“从小处做起”
将你的原始系统应用到一些简单情形或者是一个子问题上,是有很价值的。这会让你集中精力获得该问题领域的专业知识,并在搭建模型的过程中得到同伴的支持。
“从大处落笔”
确认你拥有足够多的训练数据。事实上,如果可能的话,你要收集10倍于本来预想中所需的数据量。
专业知识仍然很重要
在机器学习中,搞清楚一个模型怎样决策或预测是一件事,更重要的是搞清楚真正的问题在哪。
就这点而论,如果你已经拥有很多专业知识,那你更有可能提出恰当的问题,从而能够将机器学习用到一个可行的产品中。要正确判断哪里需要仔细检查,专业知识非常关键。
编程能力仍然很重要
有很多工具意图让你仅通过简单拖拽就完成搭建机器学习模型的过程。事实上,搭建机器学习系统的大部分工作跟机器学习或者模型毫无关系,而是在于收集数据以及搭建能够使用模型输出结果的系统。
于是,拥有良好的编程技能尤为重要。
尽管不同人在处理数据的代码上存在一些风格的差异,但彼此间要相互理解并不难。所以开发的能力在很多机器学习的问题中非常有用。
现在有很多工具和新兴技术,让几乎所有的软件工程师能够针对有趣的问题开发出相应的机器学习系统。基本的程序开发技能将会在这个搭建过程中非常有用,但在使用它们的时候你需要多多关注数据。
掌握这些新技能的最好方式,是从现在开始动手搭建一些有趣的东西。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。1399人阅读
机器学习(33)
如果要人们评选当今最受关注话题的top10榜单,雾霾一定能够入选。如今走在北京街头,随处可见带着厚厚口罩的人在埋头前行,雾霾天气不光影响了人们的出行和娱乐,对于人们的健康也有很大危害。本文通过爬取并分析北京一年来的真实天气数据,挖掘出二氧化氮是跟雾霾天气(这里指的是PM2.5)相关性最强的污染物,从而为您揭秘形成雾霾的罪魁祸首。
这里我们是用阿里云机器学习平台来完成实验:
登陆阿里云机器学习平台,即可在demo页选择实验并且亲手实现整个机器学习的预测分析,完全零门槛。
二、数据集介绍
数据源:采集了2016全年的北京天气指标。
采集的是从号以来每个小时的空气指标,。具体字段如下表:
日期,精确到天
表示的是时间,第几小时的数据
pm2.5的指标
pm10的指标
二氧化硫的指标
一氧化碳的指标
二氧化氮的指标
三、数据探索流程
阿里云机器学习平台采用拖拉算法组件拼接实验的操作方式,先来看下整个实验流程:
我们把整个实验拆解成四个部分,分别是数据导入及预处理、统计分析、随机森林预测及分析、逻辑回归预测及分析。下面我们分别介绍一下这四个模块的逻辑。
1.数据导入及预处理
(1)数据导入
在“数据源”中选择“新建表”,可以把本地txt文件上传。
数据导入后查看:
(2)数据预处理
通过类型转换把string型的数据转double。把pm2这一列作为目标列,数值超过200的情况作为重度雾霾天气打标为1,低于200标为0,实现的SQL语句如下。
select time,hour,(case when pm2&200 then 1 else 0 end),pm10,so2,co,no2 from ${t1};
(3)归一化
归一化主要是去除量纲的作用,把不同指标的污染物单位统一。
2.统计分析
我们在统计分析的模块用了两个组件:
(1)直方图
通过直方图可以可视化的查看不同数据在不同区间下的分布。通过这组数据的可视化展现,我们可以了解到每一个字段数据的分布情况,以PM2.5为例,数值区间出现最多的是11.74~15.61,一共出现了430次。
(2)数据视图
通过数据视图可以查看不同指标的不同区间对于结果的影响。
以no2为例,在112.33~113.9这个区间产生了7个目标列为0的目标,产生了9个目标列为1的目标。也就是说当no2为112.33~113.9区间的情况下,出现重度雾霾的天气的概率是非常大的。熵和基尼系数是表示这个特征区间对于目标值的影响,数值越大影响越大,这个是从信息量层面的影响。
3.随机森林预测及分析
本案其实是采用了两种不同的算法对于结果进行预测,我们先来看看随机森林这一分支。我们通过将数据集拆分,百分之八十的数据训练模型,百分之二十的数据预测。最终模型的呈现可以可视化的显示出来,在左边模型菜单下查看,随机森林是树状模型。
通过这个模型预测结果的准确率:
我们看到AUC是0.99,也就是说如果我们有了本文用到的天气指标数据,就可以预测天气是否雾霾,而且准确率可以达到百分之九十以上。
4.逻辑回归预测及分析
再来看下逻辑回归这一分支的预测模型,逻辑回归是线性模型:
模型预测准确率:
逻辑回归的AUC为0.98,比用随机森林计算得到的结果略低一点。如果排除调参对于结果的影响因素,可以说明针对这个数据集,随机森林的训练效果会更好一点。
四、结果评估
上面介绍了如何通过搭建实验来搭建针对PM2.5的预测流程,准确率达到百分之九十以上。下面我们来分析一下哪种空气指标对于PM2.5影响最大,首先来看下逻辑回归的生成模型:
因为经过归一化计算的逻辑回归算法有这样的特点,模型系数越大表示对于结果的影响越大,系数符号为正号表示正相关,负号表示负相关。我们看一下正号系数里pm10和no2最大。pm10和pm2只是颗粒尺寸大小不同,是一个包含关系,这里不考虑。剩下的no2(二氧化氮)对于pm2.5的影响最大。我们只要查阅一下相关文档,了解下哪些因素会造成no2的大量排放即可找出影响pm2.5的主要因素。
下面网上是找到的关于no2排放的论述,文中说明了no2主要来自汽车尾气。
参与讨论:
免费体验:
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
为了方便大家学习与交流,凡人云近日已开通机器学习社群!
分享“凡人机器学习”公众号名片到40人以上的大群并截图给小助手,小助手就会拉你入群
在这里你可以得到:
1.各种学术讨论
2.最新的资料分享
3.不定期的征文以及联谊活动!
小助手微信号:meiwznn
主要讲述算法和业务的结合,适合初学者
访问:806666次
积分:10855
积分:10855
排名:第1722名
原创:230篇
转载:40篇
评论:458条
文章:12篇
阅读:24458
文章:31篇
阅读:38022
阅读:7796
文章:14篇
阅读:125166
文章:20篇
阅读:97348
阅读:22925
(1)(4)(3)(1)(9)(3)(6)(6)(3)(2)(2)(1)(1)(2)(12)(2)(7)(21)(17)(3)(3)(7)(5)(7)(10)(7)(9)(7)(11)(8)(7)(5)(13)(11)(10)(4)(24)(6)(2)(1)(7)点击播放GIF/1720K
图:pixabay
原文来源:machine learning mastery
作者:Jason Brownlee
「机器人圈」编译:多啦A亮
神经网络诸如长短期记忆(LSTM)循环神经网络(RNN)能够几乎无缝地模拟多个输入变量的问题。
这是时间序列预测中的一大优点,而经典线性方法难以适应多变量或多输入预测问题。
在本教程中,你将发现如何在Keras深度学习库中开发多变量时间序列预测的LSTM模型。
完成本教程后,你将知道:
o如何将原始数据集转换为可用于时间序列预测的内容。
o如何准备数据并适应多变量时间序列预测问题的LSTM。
o如何做出预测并将结果重新调整到原始单位。
让我们开始吧。
本教程分为3部分,他们是:
o空气污染预报
o基本数据准备
o多变量LSTM预测模型
Python环境
本教程假定你已安装Python SciPy环境。你可以在本教程中使用Python 2或3。
你必须使用TensorFlow或Theano后台安装Keras(2.0或更高版本)。
本教程还假定你已经安装了scikit-learn、Pandas、NumPy和Matplotlib。
如果你需要安装环境方面的帮助,请参阅这篇文章:
《如何用Anaconda设置机器学习和深度学习的Python环境》
空气污染预报
在本教程中,我们将使用空气质量数据集。
这是一个数据集,在美国驻北京的大使馆五年内每小时报告天气和污染水平。
数据包括日期时间, PM2.5污染物,以及天气信息,包括露点、温度、气压、风向、风速以及降雨和降雪的累积小时数。原始数据中的完整功能列表如下:
1.No: 行号
2.year: 这一行的一年数据
3.month: 这一行的月数据
4.day: d这一行的日数据
5.hour: 这一行的小时数据
6.pm2.5: PM2.5浓度
7.DEWP: 露点
8.TEMP: 温度
9.PRES:气压
10.cbwd: 组合风向
11.Iws: 累积风速
12.Is: 积雪时间
13.Ir: 累积的降雨时间
我们可以使用这些数据并构建一个预测问题,鉴于天气条件和前几个小时的污染,我们预测下一个小时的污染。
此数据集可用于构建其他预测问题。
你可以从UCI Machine Learning Repository下载数据集。
o北京PM2.5数据集
下载数据集并将其放在你当前的工作目录中,文件名为“raw.csv”。
基础数据准备
数据没还有准备好去使用。所以,我们必须先做好准备。
以下是原始数据集的前几行:
第一步是将日期时间信息整合到一个单独的日期时间,以便我们可以将其用作Pandas的索引。
快速检查显示前24小时pm2.5的NA值。 因此,我们需要删除第一行数据,在数据集中还有几个分散的“NA”值; 我们现在可以用0值标记它们。
以下脚本加载原始数据集,并将日期时间信息解析为Pandas DataFrame索引。No列被删除,然后为每列指定更清晰的名称。最后,将NA值替换为“0”值,并删除前24小时。
运行该示例打印转换后数据集的前5行,并将数据集保存到“pollution.csv”。
现在我们以简单易用的形式提供数据,我们可以创建每个系列的快速图,来看看我们得到的。
下面的代码加载了“pollution.csv”文件,并将每个系列作为单独的子图绘制,除了风速是分类的。
运行示例创建一个具有7个子图,显示每个变量的5年数据。
空气污染时间序列线图
多变量LSTM预测模型
在本节中,我们将使用LSTM解决问题。
LSTM数据准备
第一步是为LSTM准备污染数据集。
这涉及将数据集视为监督学习问题并对输入变量进行归一化。
考虑到上一个时间段的污染测量和天气条件,我们将把监督学习问题作为预测当前时刻(t)的污染情况。
这个构想是直接的,只是为了这个演示。你可以探索的一些替代方法包括:
o根据过去24小时的天气和污染情况,预测下一个小时的污染。
o预测下一个小时的污染,并给予下一个小时的“预期”天气条件。
我们可以使用在下列文章中开发的series_to_supervised()函数来转换数据集:
o如何将时间序列转换为Python中的监督学习问题。
首先,加载“pollution.csv”数据集。风速特征是标签编码(整数编码)。如果你有兴趣探索,这可能会在将来进一步被热编码。
其次,所有功能都被归一化,然后将数据集转换为监督学习问题。然后删除要预测的小时的天气变量(t)。
完整的代码清单如下:
运行示例打印转换后的数据集的前5行。我们可以看到8个输入变量(输入序列)和1个输出变量(当前小时的污染水平)。
这个数据准备很简单,我们可以探索更多的东西。你可以看到的一些想法包括:
o独热编码风速。
o通过差分和季节性调整使所有系列固定。
o提供超过1小时的输入时间步长。
最后一点可能是最重要的,因为在学习序列预测问题时,LSTMs通过时间使用反向传播。
定义和拟合模型
在本节中,我们使用多变量输入数据的LSTM。
首先,我们必须将准备好的数据集分成训练集和测试集。为了加快对这次示范的训练速度,我们将仅适用于数据第一年的模型,然后对其余4年的数据进行评估。如果你有时间,请考虑浏览此测试工具的倒置版本。
下面的示例将数据集分成训练集和测试集,然后将训练集和测试集分成输入和输出变量。 最后,将输入(X)重构为LSTM预期的3D格式,即[样本,时间步长,特征。
运行此示例打印训练集的形状,并测试输入和输出集合约9000小时的数据进行训练,约35000小时的数据进行测试。
现在我们可以定义并配置LSTM模型
我们将在第一个隐藏层中定义具有50个神经元的LSTM以及输出层中用于预测污染的的1个神经元。输入形式将是一个时间具有8个特征的步长,。
我们将使用平均绝对误差(MAE)损失函数和随机梯度下降的高效Adam版本。
该模型将配置为适用于50个批量大小为72的训练周期。请记住,每个批处理结束时,Keras中的LSTM的内部状态都将重置,因此一个内部状态是一个有关大量天数的函数将会有所帮助。(不妨试一试)。
最后,我们通过在fit()函数中设置validation_data参数来跟踪训练过程中的训练和测试损失,然后在运行结束时,绘制训练和测试损失曲线图。
当模型配置好之后,我们可以对整个测试数据集进行预测。
我们将预测与测试数据集相结合,并进行反缩放,我们还用预期的污染数据对测试数据集进行反缩放。
以预测值和实际值为原始尺度,我们可以计算模型的误差值。在这种情况下,我们计算出在与变量本身相同的单位中产生误差的均方根误差(RMSE)。
完整的示例如下所示:
想要运行示例的话,首先需要创建一个绘图,显示训练期间的训练和测试损失。
有趣的是,我们可以看到测试损失低于训练损失。该模型可能过度拟合训练数据。在训练过程中测量和绘制RMSE曲线可能会使这一点显现得更加明显。
训练期间多元LSTM的训练集和测试线路图
训练和测试损失在每个训练时期结束时都会打印出来。在运行结束时,打印测试数据集上模型的最终RMSE。
我们可以看到,该模型实现了3.836的可观RMSE,这显著低于用持续模型发现的30 RMSE。
进一步阅读
如果你想进一步深入了解,本部分将提供更多关于该主题的资源。
o在UCI机器学习库中的北京PM2.5数据集。
oKeras长短期记忆模型的5步生命周期。
o使用Python中的长短期记忆模型进行时间序列预测。
o用Python中的长短期记忆模型进行多步时间序列预测。
在本教程中,你发现了如何将LSTM适用于多变量时间序列预测问题。
具体来说,通过本教程你将学到:
o如何将原始数据集转换为可用于时间序列预测的内容。
o如何准备数据并配置用于多变量时间序列预测问题的LSTM。
o如何做出预测并将结果重新调整到原始单元中。
文章转载自网络,作者观点不代表本网站立场,如需处理请联系客服
机器人圈其它文章
原文来源:biorxiv作者:Guohua Shen、Tomoyasu Horikawa1、Kei Majima、Yukiyasu Kamitani「雷克世界」编译:嗯~阿童木呀、KABUDA你有没有想象过,将来的某一天,计算机可以“看到”你在想什么。图表由Kamitani实验室提供这听起来是不是很遥远?但得益于日本京都的京都
原文来源:freeCodeCamp作者:Thalles Silva「雷克世界」编译:嗯~阿童木呀、KABUDA让我们假设这样一种情景:你的邻居正在举办一场非常酷的聚会,你非常想去参加。但有要参加聚会的话,你需要一张特价票,而这个票早就已经卖完了。而对于这次聚会的组织者来说,为了让聚
来源:PEXELS原文来源:Towards Data Science作者:Isaac Godfried「雷克世界」编译:嗯~阿童木呀今年,我出席了NIPS医学影像研讨会,并在会议上展示了一张海报。本次研讨会的重点是将来自医学影像和机器学习社区的专家聚集在一起。总共有十一个演讲和两个海报会议。接下
原文来源:buZZrobot作者:Harshvardhan Gupta「雷克世界」编译:KABUDA、嗯~阿童木呀深度学习正在被广泛地运用于各项日常任务当中,尤其是涉及到一定程度“ 人性化”的领域,例如,图像识别。与其他机器学习算法不同,深度网络最突出的特点是随着获得数据的增多,其性能
原文来源:arxiv作者:Alexander Kirillov、Kaiming He1、Ross Girshick、Carsten Rother、Piotr Dollar「雷克世界」编译:嗯~阿童木呀、KABUDA现如今,我们提出并研究了一种新的“全景分割”(Panoramic segmentation,PS)任务。可以这样说,全景分割将传统意义上相互
原文来源:arxiv作者:Angela Dai、Daniel Ritchie、Martin Bokeloh、Scott Reed、Jurgen Sturm、Matthias Niessner「雷克世界」编译:嗯~阿童木呀、KABUDA在这里,我们向大家介绍一下ScanComplete,它是一种全新的数据驱动方法,用于将场景的不完整3D扫描作为输入,然后
原文来源:arxiv作者:Yuval Tassa, Yotam Doron, Alistair Muldal, Tom Erez,Yazhe Li, Diego de Las Casas, David Budden, Abbas Abdolmaleki, Josh Merel,Andrew Lefrancq, Timothy Lillicrap, Martin Riedmiller「雷克世界」编译:嗯~阿童木呀、KABUDADeepMind Cont
原文来源:arxiv作者:Hao Li、Zheng Xu、Gavin Taylor、Tom Goldstein「雷克世界」编译:嗯~阿童木呀、KABUDA一般来说,我们对于神经网络的训练,往往依赖于找到高度非凸损失函数的“极好”极小值的能力。众所周知,某些网络体系结构的设计(例如,跳过连接)能够产生更
图:pixabay不知不觉,2017年已然接近尾声,回首这一年,AI江湖风起云涌,每一个AI大事件就像石子掷入湖面,激荡起层层浪。如果让你选择一些关键词描述2017年的AI江湖,你会想到什么?o关键词:柯洁VS AlphaGo2.0日—27日,AlphaGo2.0与围棋现排名世界第一的
4G移动通信技术的普及,为人们的生活带来了翻天覆地的变化,而即将到来的5G技术,又会怎样影响人们的生活?在“万物互联”的时代,服务机器人会有怎样的升级?作为驶上5G高速公路的“第一家”机器人公司,云迹科技旗下的机器人“老司机”云帆和润有话说。云帆:可以这么
原文来源:arXiv作者:Tali Dekel、Chuang Gan、Dilip Krishnan、Ce Liu、William T. Freeman「雷克世界」编译:嗯~阿童木呀、KABUDA我们研究这样一个问题,根据稀疏轮廓位置存储的信息重构图像。研究结果证明,我们可以从稀疏输入中获得对源图像的高保真度的高质量重构
图:pixabay原文来源:the robot report作者:Frank Tobe「雷克世界」编译:嗯~阿童木呀、KABUDA在这一系列涉及30份研究报告的新闻稿中一致认为,至少到2022年,机器人行业的大部分领域都将以两位数的速度增长。尽管这些报告在预测方面存在着很大的差异——通常是同一主
原文来源:Lemberg Solutions Ltd作者:Zahra Mahoor、Jack Felag、 Josh Bongard「雷克世界」编译:嗯~阿童木呀、KABUDA现如今,与智能手机进行交互的方式有很多种:触摸屏、硬件按钮、指纹传感器、视频摄像头(如人脸识别)、方向键(D-PAD)、手持设备控制等等。但是
原文来源:arXiv作者:Zahra Mahoor、Jack Felag、 Josh Bongard「雷克世界」编译:嗯~阿童木呀、KABUDA现如今,随着越来越多的机器人在物理表现上与人类相接近,确保他们做出的决定以及执行的行为与人类价值观具有一致性变得至关重要。为了实现这一目标,机器人需要了解
回顾历史,每一次经济的跨越式增长都伴随着技术突破与产业革新。前不久,在浙江乌镇举办的第四届世界互联网大会提出了“发展数字经济”的口号。日,以“智能引领数字经济”为主题的2017中国ICT企业家大会在北京顺利召开。可见,新一轮的产业变革正在悄然进行
原文来源:arXiv、LabSix作者:Andrew Ilyas、 Logan Engstrom、 Anish Athalye、Jessy Lin「雷克世界」编译:嗯~阿童木呀、哆啦A亮对真实世界AI的局部信息攻击我们已经开发出一种查询有效的方法,以寻找用于黑盒机器学习分类器的对抗样本。我们甚至可以在局部信息黑盒设
金鸡交好卷,锦犬送佳音!我们的年度趋势报告再度无偿奉献给大家。日,“Forecast2018”趋势报告在“ICT企业家大会”上正式发布。会上,赛迪智库工业经济研究所秦海林所长代表赛迪智库发布了《2018年中国工业和信息化发展形势展望系列报告》,既展望系列;赛
原文来源:arXiv作者:Wieland Brendel、Jonas Rauber、Matthias Bethge「雷克世界」编译:嗯~阿童木呀、哆啦A亮众所周知,强化学习(RL)是一种强大的技术,它能够解决诸如移动(locomotion)、Atari游戏、赛车游戏以及机器人操作等复杂的任务,而这些全部是通过在一个
两年半之前,他的头衔一直是百度深度学习研究院(IDL)的创立者和负责人,国家千人计划特聘专家,曾在百度领导了语音识别、图像搜索、百度大脑、百度无人驾驶等项目。其实他可以一直继续这样的生活,高职、高薪、升职加薪。可他的脑海里总是萦绕着这样一幅景象,大航海时
原文来源:arXiv作者:Wieland Brendel、Jonas Rauber、Matthias Bethge「雷克世界」编译:嗯~阿童木呀、哆啦A亮不知道大家有没有注意到,许多机器学习算法很容易受到几乎不可察觉的输入干扰的影响。到目前为止,我们还不清楚这种对抗干扰将为现实世界中机器学习应用的安}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信