如何成为 ai 游戏ai工程师师

你的位置:
> 大疆工程师教你如何成为一名机器人工程师(下)
发表于( 00:11) 本文标签:
浏览量:54次
&&&&值班编辑QQ:
雷锋网(搜索“雷锋网”公众号关注)按:本文作者YY硕,来自大疆工程师。原文标题《机器人工程师学习计划》,全文篇幅较长,为了方便阅读,故分为三篇,此为下篇。
研究生一年级
研究生的时候,你的目标比较清晰了,就是做一种机器人至少两年时间,并从中发掘出可以发表论文的知识点。上面我给出的书单里面,你要开始精读里面的几本。
如果做机器人视觉定位、传感器融合方面的研究,1、4、5、7四本书一定要精读。
如果做控制系统的研究,3、8、9、10一定要精读。
如果做规划算法的研究,那么还要读其他偏CS一些的书,比如讲A* search,random forest,图论方面知识的教材。由于我在这方面造诣不深,就不托大了。
如果学习随机系统的控制和最优控制,除了1、2、3,还要读一本神书Stochastic models estimation and control。
如果研究机器人视觉定位,几种常用的定位算法:PTAM,ROS的标配VO,SVO,LSD-SLAM,ORB-SLAM,都必须自己学习之后全部跑一遍。只会用OpenCV的函数和这些工具包并不能说明你会视觉定位,必须要能自己手写出一个能用的才算。国内有一个很厉害的SLAM专家叫高翔,他的博客要关注一下:机器人 - 标签。由于SLAM这两年很火,研究的人很多,所以网上可以参考的资料也很多,比如/hcdth011/ROS-Hydro-SLAM,就在ROS上实现了几种定位算法的对比。
我现在非常不建议同学们选择从四旋翼飞行器的动力学控制里找问题作为研究课题。因为四旋翼飞行器的特点已经被研究透了。目前国际上对多旋翼飞行器的研究主要集中在造一些奇葩形状的飞行器,以及给多旋翼飞行器上安装一个机械臂去做力控制,这样做就对多旋翼飞行器控制的动力学造成了一些影响。因此需要同学对动力学和多自由度机械臂控制有比较深的认识。
自动导航和驾驶是这两年的热点,一方面汽车的自动化是大势所趋,另一方面多旋翼飞行器异军突起,产生了很多对自动飞行的需求。除了机器人视觉定位算法以外,同学还需要学习其他的传感器,以及这些传感器与视觉定位算法怎么融合。这里面有很多坑,比如计算量的问题,怎么保证融合算法不崩,怎么处理传感器的延时等等,都需要同学结合自己的项目去踩,坑踩得多了才能成长。如果大家想找一个多旋翼飞行器平台研究自动导航,我推荐大疆的M100,我已经在知乎回答“RoboMasters2015夏令营是怎样的?” 里吹过一波M100,前面说过的今年夏令营的知乎回答“参加Robomasters 2016夏令营是怎样一种体验? ”里也有人帮我吹了一波。
一些大学里学过的知识点,是必须结合研究生期间的项目的需求弄得很清楚的,比如三大变换(傅里叶变换,拉普拉斯变换,Z变换),旋转表示法(欧拉角、四元数、旋转矩阵),数值计算怎么防止矩阵出现数值问题等等。除了自己的项目,还需要把凸优化、微分方程、卡尔曼滤波还有多自由度机械臂的控制学习一下。这三个领域的知识,是任何一种机器人都会用的到比较难的知识。
凸优化和凸优化的各种变形是非常重要的知识,因为各行各业里的研究问题,多半是会建立一个优化问题去解决的。上面提到的《Convex Optimization》,也是一本神书,同学们一定要认真读一读。Matlab、Python、C++都有一些现成的工具包可以帮助你解优化问题,不过最好同学们能自己手写一些基本的优化算法,比如gradient descend,barrier method等等。另外现在主流的SLAM算法,后端都是通过一种叫做g2o的优化算法来出效果的。而且g2o能够整合bundle adjustment 和structure-from-motion这两大计算机视觉里的关键问题,可以说是一种很好的计算思想了,非常有必要学习一下g2o。
卡尔曼滤波在上面书单里的1和3都有提到,同时在神书Stochastic models estimation and control也有相当多的篇幅。卡尔曼滤波有好几种证明的方法,同学最好能自己学会1-2种。
多自由度的机械臂的难点在于机械臂的运动学正反解、运动学控制和动力学控制,基本是一个建模分析和数值算法实现的问题。如果你所在的学校没有一个财力雄厚的机器人实验室的话,你基本上没有机会接触到多自由度的机械臂。这时候之前学到的Simulink和就要学的Gazebo就派上用场了,你可以用Simscape里面的刚体搭一个多自由度机械臂,然后通过Simulink仿真去学习机械臂的控制;也可以用Gazebo的URDF语言写一个机械臂,然后通过Gazebo和ROS的接口去控制机械臂;也可以用ROS里面的著名工具包MoveIt! Motion Planning Framework,不过MoveIt的问题是,他只能仿真运动学,而不能仿真动力学。工业领域对多自由度的机械臂控制通常用一个叫做D-H表示法的建模工具(Denavit),这个东西我并不太会。我只会向同学们推荐我导师的著作《A mathematical introduction to robotic manipulation》。
有一个非常神奇的事实:《A mathematical introduction to robotic manipulation》这本机械臂控制领域的著名教材的第二章和计算机视觉领域的著名教材《An Invitation to 3-D Vision》的第二章基本是一样的,都在讲旋转表示法。这是因为所有的旋转表示法都可以归纳为一种优雅的李群结构:SO(3)群。而计算机视觉和机械臂控制都涉及到理解刚体的旋转,事实上用计算系统去观测和控制所有的刚体构成的系统,理解旋转都是很关键的问题。旋转表示法应该作为研究生阶段的一个重要学习的知识点。
李群和李代数是刚体旋转表示背后的数学理论,如果想要深挖一些,可以看这篇文章An elementary introduction to groups and representations的前50页。这是我自己读着觉得最好的文章,当然网上也有很多其他的介绍。
研究生阶段还要培养的一个能力是借助各种工具仿真机器人系统的能力。显然地,很多机器人系统真的造出来的话造价昂贵,需要在实际制造之前写一个比较真实的仿真系统出来测试算法。我觉得做仿真系统的能力直接衡量了机器人工程师的技术水平。当你开始要搭一个仿真系统的时候,第一步是通过欧拉方程和牛顿方程确定刚体的运动特点,甚至要自己写刚体二阶微分方程;第二步是确定刚体之间的互联关系,设计不同类型的关节,如果有软性连接需要加入弹簧阻尼模型;第三步是确定被仿真的刚体系统会不会和外界产生碰撞或者其他形式的力,如果有的话,需要设计合适的接触力和摩擦力仿真的模型。多旋翼飞行器的仿真是很简单的,不需要考虑什么接触力。但是多自由度机械臂基本都需要仿真接触力,不和物理世界去交互的机械臂只有很小的实用意义。而能够自行运动locomotion系统,比如双足、多足机器人,则涉及到更多的接触力,多到接触力都会影响仿真系统的数值稳定性。搭建一个仿真系统需要很强的系统建模能力和数值分析的能力,虽然Simulink、Gazebo、Vrep提供了不同程度的工具简化你的工作,但是要让仿真系统能够稳定运行,必须要能深入其中的细节。有些看起来很高大上的仿真工具,比如Nvida的PhysX,在仿真的时候是忽略掉科里奥利力的,如果不理解仿真的本质,可能就会忽略这一个重要的缺陷。
研究生二年级
你的学习计划接近尾声。现在你已经进入了一个很好的状态:看到一个机器人,能够很果断地分析出它用了什么传感器、执行器、计算平台大概是什么量级,他的执行机构能够承受多少力量。看到一个新的算法,能够大约判断清楚它的执行流程,在什么环节做了优化。看到一个新的没学过的知识,能够分析出它和你以前学过的什么知识有联系,你还需要再学什么才能弄明白这个知识点。
研究生二年级要深化第一年学到的那些技术和知识,要做到完整地读过四五本书,五十篇以上的论文。你已经积累了几万行代码的经验,也能熟练地谈论谁家的电机回差小,谁家的电机线性程度好。
你这个时候可以去写作一些论文,也可以开始学习一些更高级的技术和工具,比如用FPGA和GPU优化算法、魔改Linux内核、玩玩液压系统、了解更多机器学习的知识比如强化学习等等。你也可以从计算机图形学或者计算力学里面找到一些帮助你更好进行机器人仿真和系统分析的工具。由于你懂很多机器人方面的知识,你可以给学校的机器人队做指导,或者带队参加一些比较有挑战性的机器人比赛。
写到这里,我就不可能给出很多不同领域的指导了,因为随着学习的进一步深化,我自己熟悉的领域也在收缩。我只能对几个领域给出我的意见。
对视觉定位和传感器融合来说,SLAM急需新的突破,目前通过几何约束去实现loop closure看起来已经走入了死路,没法有更多的发展了,下一步可行的方向是与深度学习进行结合。具体的一些介绍可以阅读行业中大牛的一篇文章/2016/01/why-slam-matters-future-of-real-time.html,记述了几个业界大牛们最新的观点。传感器融合技术,目前还有很多问题可以探索,因为传感器的延时、不均匀的信号,会给定位系统造成困扰,如何去除这些干扰,需要建立比较复杂的非线性优化问题,具体可以关注香港科技大学Shaojie Shen的工作。
对于多自由度机械手和机器人的locomotion来说,这里面还有非常多可以探索的研究问题。我前面提过接触力和摩擦力很难仿真,大神告诉我现在没有任何一种工具和理论能把接触力和摩擦力正确仿真出来,因此如何在机器人系统里妥善处理对这些力的控制,就是很难的问题了。现在业界的一个前沿发展方向,也是利用机器学习技术来帮助机器人学会处理这些外力,不过人类目前最优秀的多自由度机器人系统,Berkeley的Brett机器人,叠几块积木就要用十分钟(New ‘deep learning’ technique enables robot mastery of skills via trial and error),显然还有很多提升的空间。这方面的问题同学可以关注知乎大神@戴泓楷@周佳骥。
最后我想再强调一遍表达能力的重要性。你可以从自己带的课程和机器人队入手,把自己这几年来学过的知识做成PPT讲给学生们听,然后让他们给你反馈。多做这样的练习,提升自己做演讲的能力,这将来会让你受益匪浅。
研究生二年级之后,你可以准备进机器人公司工作了,也可以根据你自己感兴趣的研究方向申请博士接着努力。由于你已经掌握了广博的知识和技能,你的职业生涯将会大有作为。
我从2008年展开自己的机器人生涯。那一年波士顿动力刚刚发布他们的大狗机器人,Python还是很小众的语言,Ubuntu 8.04还很不稳定,Chrome还没有多少人知道。在之后的几年中我目击了深度神经网络的复兴,看到波士顿动力的机器人日渐强大,经历了ROS的起源和繁荣,帮助了大疆的崛起,深深为这个产业的未来感到激动。我希望这篇文章能够帮助更多的年轻人进入机器人学的海洋,为未来机器人学的继续发展贡献力量。
专访钱东奇:AI落地还要十年 你很酷不代表能存活
了解机器学习 只需了解“三大法宝”
Google的机器人公司还没卖,出了会跳高的机器人
一个由人工智能管理的世界将会是什么样?
揭秘Facebook的AI机器:AI已关乎存亡
从AWE看智能家居:语音公司或成未来最大赢家
编者按:媒体智能频道推出话题栏目《智能菌》,专注人工智能引发的社会热点,每周三、五推出。本文为第20期,讨论人工智能引发的伦理道德问题。转载请联系我们获得授权(公众号Smartman163)。 出品 | 媒体智能 策划 | 定西 编译 | 晗冰 现在人工智能堪称无
本报记者 高 博 人工智能经过60年的积淀,从去年开始在深度学习、跨界融合、人机协同和群体智能等方面,都出现重要新进展。 现在,科技界、企业界的专家和创新型企业,包括一些年轻的创业者正在共同制定促进中国人工智能创新发展的规划。这个规划旨在推动人
2016年吴文俊人工智能科学技术奖颁奖盛典 媒体智能讯 2月24日消息,记者从中国人工智能学会获悉,2017年度第七届吴文俊人工智能科学技术奖评选活动已正式启动。 据中国人工智能学会副秘书长、吴文俊人工智能科学技术奖办公室主任余有成介绍,该奖作为我国智
自从Google Assistant AI助手在去年5月份的谷歌I/O大会上由谷歌推出之后,行业就一直非常关注苹果、谷歌和微软的语音助手将会展开一场怎样的对决。 此前谷歌的这款语音助手服务一直为Pixel专享,但现在谷歌要将它下放给其他安卓智能机了。据悉,首款搭载该助
日前,在SXSW大会上,来自纽约 Huge 数字营销公司的资深用户体验研究员 Sophia Yeres 发表了一个题为量化思想的风险的演讲。她提到了诸如 Siri 一类的智能语音助手未来有可能朝着更通晓人类情感和自我优先的方向发展。 之所以在题目中用到风险一词,是因为越
科技讯2月21日消息,据《每日邮报》报道,自动驾驶汽车将开始驶入亚特兰大市满是私家车、公交车、自行车和大学生的道路,因为该市将与美国其他社区争相测试这种新兴技术。如果论证计划在9月初如期进行,亚特兰大将成为测试自动驾驶汽车最大的城区之一。 上月
百度人工智能深度学习研发又有新进展。 据科技媒体《麻省理工科技评论》近日报道,百度研发的深度语音文本阅读系统,可极大程度上减少幕后精调的工作量,让机器只需几小时就能学会说话,完全无需人类干预。 百度方面向澎湃新闻确认了其在深度学习领域的这一人工智能这么吃香,想转行的工程师看这篇就够了-基础器件-与非网
眼下,已经成为越来越火的一个方向。普通,如何转向人工智能方向,是知乎上的一个问题。本文是对此问题的一个回答的归档版。相比原回答内容上有所增加。
本文的目的是给出一个简单的,平滑的,易于实现的学习方法,帮助 &普通& 工程师踏入AI领域这个门。这里,我对普通工程师的定义是:拥有大学本科知识;平时工作较忙;自己能获取的数据有限。因此,本文更像是一篇 &from the scratch& 的AI入门教程。
二、 AI领域简介
AI,也就是人工智能,并不仅仅包括。曾经,符号与逻辑被认为是人工智能实现的关键,而如今则是基于统计的机器学习占据了主导地位。最近火热的深度学习正是机器学习中的一个子项。目前可以说,学习AI主要的是学习机器学习。
但是,人工智能并不等同于机器学习,这点在进入这个领域时一定要认识清楚。关于AI领域的发展历史介绍推荐看周老师写的《机器学习简介》。下面一个问题是:AI的门好跨么?其实很不好跨。我们以机器学习为例。
在学习过程中,你会面对大量复杂的公式,在实际项目中会面对数据的缺乏,以及艰辛的调参等。如果仅仅是因为觉得这个方向未来会&火&的话,那么这些困难会容易让人放弃。考虑到普通工程师的特点,而要学习如此困难的学科,是否就是没有门路的?答案是否定的。只要制定合适的学习方法即可。
三、 学习方法
学习方法的设定简单说就是回答以下几个问题:我要学的是什么?我怎样学习?我如何去学习?这三个问题概括说就是:学习目标,学习方针与学习计划。学习目 标比较清楚,就是踏入AI领域这个门。这个目标不大,因此实现起来也较为容易。&过大的目标时就是为了你日后放弃它时找到了足够的理由&。
学习方针可以总结为 &兴趣为先,践学结合&。简单说就是先培养兴趣,然后学习中把实践穿插进来,螺旋式提高。这种方式学习效果好,而且不容易让人放弃。有了学习方针以后,就可以制定学习计划,也称为学习路线。下面就是学习路线的介绍。
四、 学习路线
我推荐的学习路线是这样的,如下图:
图1 AI领域学习路线图
这个学习路线是这样设计的:首先了解这个领域,建立起全面的视野,培养起充足的兴趣,然后开始学习机器学习的基础,这里选择一门由浅入深的课程来学习, 课程最好有足够的实验能够进行实战。基础打下后,对机器学习已经有了充足的了解,可以用机器学习来解决一个实际的问题。
这时还是可以把 机器学习方法当作一个黑盒子来处理的。实战经验积累以后,可以考虑继续进行学习。这时候有两个选择,深度学习或者继续机器学习。深度学习是目前最火热的机器学习方向,其中一些方法已经跟传统的机器学习不太一样,因此可以单独学习。除了深度学习以外,机器学习还包括统计学习,集成学习等实用方法。
如果条件足够,可以同时学习两者,一些规律对两者是共通的。学习完后,你已经具备了较强的知识储备,可以进入较难的实战。这时候有两个选择,工业界的可以选择看开源项目,以改代码为目的来读代码;学术界的可以看特定领域的论文,为解决问题而想发论文。
无论哪者,都需要知识过硬,以及较强的编码能力,因此很能考察和锻炼水平。经过这个阶段以后,可以说是踏入AI领域的门了。&师傅领进门,修行在个人&。之后的路就要自己走了。
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
你与哪款手机更投缘……
旗下网站:
与非门科技(北京)有限公司 All Rights Reserved.
京ICP证:070212号
北京市公安局备案编号: 京ICP备:号(室内设计婷婷)
(飞翔的言)
(丫丫甜菜)
第三方登录:下载合伙投客户端
泊学:如何靠自学成为一名全栈工程师?
(文/杨昊东)
【猎云网西安】12月31日报道(文/杨昊东)
如今,“全栈工程师”(full-stack engineers)早已不再是一个新鲜的词汇。百度百科的解释是:“掌握多种技能,并能利用多种技能独立完成产品的人。”在OSCON会议上,一名Facebook的工程师就曾说过他们只聘请“全栈(Full stack)”的程序员。以前,软件工程师最在意的是成为某个领域的专家,如今,随着软件技术的不断发展以及需求的变化,许多技术问题不得不亲力亲为,这一点尤其是对资金和人力资源匮乏的创业公司来说。同时,许多工程师对未知的领域又充满了探索欲望,因此慢慢地就练就了精通多门技术的本领。简而言之,全栈工程师就像一把瑞士军刀,身兼十八般武艺。
今天,猎云网(微信: )介绍的泊学,就是一个提供全栈开发原创高清短视频和高质量读物的网站。用户可以学习到wift、Cocoa、PHP、Laravel、VueJS等构建现代iOS和Web应用的必备技能。
创始人崔轶和马一凌是多年的工作伙伴,曾共同就职于瑞星公司。后来投身创业,崔轶作为安全宝的联合创始人负责产品的全线开发工作,马一凌负责整个产品的销售。在离开安全宝后,崔轶前往一家传统企业,帮助其完成行业转型,建立了一个服装工业电商系统,后由于融资碰壁,企业停滞了这一计划,这时的马一凌也从自己作为联合创始人的洋葱令牌里抽身而退。在经过几次畅谈交流后,两人确立了创立“泊学”的计划。
在泊学里,你可以通过观看视频的方式自学成为一名全栈工程师。里面的教学视频均是崔轶自己录制的原创内容。“我们将每段视频的时长控制在10分钟以内,主要是考虑到用户的观看习惯,同时还希望帮助他们利用碎片化的时间,通过手机、iPad随时随地的观看学习。”同时,泊学还将视频教学内容整理成文稿读物,高亮了所有的关键字、 强调了所有的警告和最佳实践,还对视频中的内容作了补充,方便用户学习查阅,温故知新。
于日上线的泊学,教学视频主要围绕Swift2.1和PHP7,接下来除了继续完善这两项的内容,还会发布有关iOS9、WatchOS2、Laravel5.1等方面的视频。同时,泊学还将自己的教学视频放在swiftv课堂网上,“Swift2.1初上手编程”自2015年12月初上线,现已有573位学员订阅。
在课程的观看上面,泊学采用了半收费制的模式。“优秀的内容是有价值的,我们希望用户能够从我们的视频中真正学到知识。”在日泊学对付费会员制做了一次调整,现在用户可以根据自己的需求选择成为普通会员、年费会员、企业会员。“针对企业会员,我们还会提供一些测评和定制教程方面的服务,如SDK的应用、云服务的接入方式等。”
目前,泊学正在寻求天使融资,用以完成视频内容的扩充构建、团队的招募和进一步的推广工作。
产品:泊学
公司:北京泊学博阅科技有限公司
解码人工智能·猎云网2017产业创新峰会 4月13日北京等你参加:
本文来自猎云网,如若转载,请注明出处:/archives/144329
扫码关注猎云网
1.猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2.转载时须在文章头部明确注明出处、保留官方微信、作者和超链接。如转自猎云网(微信号:ilieyun)字样。
3.猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
热门关键词
用心服务创业者
扫码关注微信平台}

我要回帖

更多关于 游戏ai工程师 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信