如果你很想参加机器人比赛,身边也恰好有一些志同道合的小伙伴,但是学校不支持。没关系,来找我,我尽量通过大疆的关系说服你们学校支持你们参加RoboMasters。
虽然你是以机器人比赛为主线在探索机器人技术,但是要时刻记得,机器人比赛给你的理论方面的训练很差,还会让你养成一些坏习惯,比如凡事都希望用一些糙猛快的办法来解决。由于通常整个团队都没有太多的项目管理经验,到比赛前一段时间才会加紧功夫去做机器人,很多时候就会用“山寨”的办法去处理机器人的故障。比如说某个承重结构用久了会弯,为了赶比赛的进度,就拿锤子敲直了、再加一条辅助的结构在旁边继续用,而没有细致地去做建模、受力分析,思考是什么原因导致承重结构会变形。再比如说调PID参数就是生调乱改,而没有基于机器人的动力学模型去估测参数的大概范围。
大二的暑假,有可能你跟着学校的机器人队参加了一些机器人比赛。这是一个反思总结的好时机,为什么机器人队取得了这样那样的成绩?整个团队怎样才能更有效率?明年如何继续招新?暑假要把时间花在技术积累上面,这个时候可以回头思考思考之前准备比赛时用糙猛快的办法解决的问题如何能够细致地去解决。
如果大二的暑假没有参加机器人比赛,可以做一个舵机机器人,比如6条腿的蜘蛛,比如码垛机器人。舵机是机器人工程师的好朋友,一定要好好掌握。
另外你其他方面的能力也不能落下。大二结束的时候,你的Linux应该用的很熟练了,除了makefile,你也用起了cmake。你也应该开始理解Github存在的意义,因为你已经上去读了很多别人的代码,你也把自己的一些课程设计和小项目放在了Github上面。另外大二基本上了本专业一些比较难的基础课程,比如自动控制原理、机器学习、概率统计、材料和力学等课程,同学们会看到这些课程里又用到了线性代数和微积分的知识,以及建模的知识。这时候可以把大一的物理、线性代数和微积分再翻出来看看。
同学的学校应该给大二到大三的学生有开设面向对象的程序设计,一般用Java或C++教授。在面向对象的程序课里面,一定要积累3000行左右的代码的开发经验。经典的面向对象程序设计的练习通常是写游戏,比如俄罗斯方块,吃豆人等等,一定要自己能够做到完全手写一个完整的项目出来。
另外你可以开始学习Matlab当中的神器Simulink了。在大二这一年的学习中,你可能在不少课程里多多少少用到了Matlab。假设你已经在我的推荐下喜欢上了Python,你可能会觉得Matlab的计算工具没有比Python强多少;假设你自己在别人的推荐下喜欢上了mathematica(Mathematica 到底有多厉害? - Wolfram Mathematica),你可能会觉得和Mathematica这种神一样的语言比起来,Matlab弱爆了。但是要注意的是,Matlab最强大的工具是Simulink,通过它你几乎可以仿真一切的物理系统和控制系统。我建议同学可以通过Simulink实现一个倒立摆,然后理解Matlab的强大之处。对此我强烈推荐一个很好的教材(http://ctms.engin.umich.edu/CTMS/index.php?example=Introduction§ion=SimulinkControl),它详细介绍了一些经典的控制系统如何分析以及用Simulink实现。然后我再强烈推荐一个讲Simulink里面一个更加和物理仿真贴近的工具Simscape(Control of an Inverted Pendulum on a Cart)的文章。阅读并实现了这两篇文章里的内容,同学应该会对倒立摆有了比较深刻的认识。倒立摆是机器人学中一个非常重要的模型,因为火箭、导弹、双足机器人、四足机器人,基本都是倒立摆的变形。你自己实现出来的simulink模型一定要存好,以后可能还会再拿出来仔细看。
如果你按照我之前说的方法探索了一些HTML和Javascript的技术,那么JQuery,bootstrap,AngularJS你已经多多少少知道是怎么回事了。web后端的技术,比如PHP和MySQL,也可以了解一下,LAMP要学会怎么配置。如果有同学找你帮忙写小网站,尽量去帮个忙,帮别人做网站是提高自己系统编程能力的好练习。在做网站的过程中你可能还会顺便学一学如何用Photoshop和Illustrator让网站显得更漂亮。这些技能有最好,没空学也没关系。
大四开始了,你可以开始深挖自己的研究方向,同时也要开始学一些高级一点的通用技术和理论,这时候你和一般的机械、电子、计算机学生就不太一样了,你虽然也在狂编程,但也在狂学习物理和数学。通用技术包括ROS,simulink,gazebo和Vrep等工具。通用理论包括,再学一遍线性代数,学学凸优化、数值计算、旋转表示法等方面的知识。这些知识你在大四仅仅只能开一个头,因为你的大四要实习、毕业、考研、毕设,你会非常地忙。有些人会在大四进实验室和老师发论文,我个人觉得发论文这件事没必要操之过急。你的整个大学期间应该用在广泛涉猎各种各样的知识上面,而不是深入某一个细小的研究问题。
大四可以开始读一些著名入门书籍,我把这些书不分先后地列出来,你没有必要全部去读,而且每本书先读前几章就够了,能读多少尽量读多少。
1. 概率机器人学,http://www.amazon.com/Probabilistic-Robotics-Intelligent-Autonomous-Agents/dp/0262201623
2. 凸优化,http://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf
3. 线性系统理论,http://www.amazon.com/Linear-System-Electrical-Computer-Engineering/dp/0199959579
4. Multiple View Geometry in Computer Vision,Multiple View Geometry in Computer Vision
5. 线性估计,http://www.amazon.com/Linear-Estimation-Thomas-Kailath/dp/0130224642
6. 《机器学习》,周志华老师的书。
7. An Invitation to 3-D Vision,http://www.eecis.udel.edu/~cer/arv/readings/old_mkss.pdf
8. Modern Control Systems,http://www.amazon.com/Modern-Control-Systems-12th-Richard/dp/0136024580
9. Rigid Body Dynamics,http://authors.library.caltech.edu/25023/1/Housner-HudsonDyn80.pdf。说实话刚体动力学理论我没有找到特别好的书。但是刚体动力学理论很重要。
10. Feedback Systems: An Introduction for Scientists and Engineers,FBSwiki
研究生的时候,你的目标比较清晰了,就是做一种机器人至少两年时间,并从中发掘出可以发表论文的知识点。上面我给出的书单里面,你要开始精读里面的几本。
如果做机器人视觉定位、传感器融合方面的研究,1、4、5、7四本书一定要精读。
如果做控制系统的研究,3、8、9、10一定要精读。
如果做规划算法的研究,那么还要读其他偏CS一些的书,比如讲A* search,random forest,图论方面知识的教材。由于我在这方面造诣不深,就不托大了。
如果学习随机系统的控制和最优控制,除了1、2、3,还要读一本神书Stochastic models estimation and control(http://www.cs.unc.edu/~welch/kalman/media/pdf/maybeck_ch1.pdf)。
如果研究机器人视觉定位,几种常用的定位算法:PTAM(Parallel Tracking and Mapping for Small AR Workspaces (PTAM)),ROS的标配VO(viso2_ros - ROS Wiki),SVO(GitHub - uzh-rpg/rpg_svo: Semi-direct Visual Odometry),LSD-SLAM(http://vision.in.tum.de/research/vslam/lsdslam)ORB-SLAM(GitHub - raulmur/ORB_SLAM2: Real-Time SLAM for Monocular, Stereo and RGB-D Cameras, with Loop Detection and Relocalization Capabilities),都必须自己学习之后全部跑一遍。只会用OpenCV的函数和这些工具包并不能说明你会视觉定位,必须要能自己手写出一个能用的才算。国内有一个很厉害的SLAM专家叫高翔,他的博客要关注一下:机器人 - 标签。由于SLAM这两年很火,研究的人很多,所以网上可以参考的资料也很多,比如http://github.com/hcdth011/ROS-Hydro-SLAM,就在ROS上实现了几种定位算法的对比。
我现在非常不建议同学们选择从四旋翼飞行器的动力学控制里找问题作为研究课题。因为四旋翼飞行器的特点已经被研究透了。目前国际上对多旋翼飞行器的研究主要集中在造一些奇葩形状的飞行器,以及给多旋翼飞行器上安装一个机械臂去做力控制,这样做就对多旋翼飞行器控制的动力学造成了一些影响。因此需要同学对动力学和多自由度机械臂控制有比较深的认识。
自动导航和驾驶是这两年的热点,一方面汽车的自动化是大势所趋,另一方面多旋翼飞行器异军突起,产生了很多对自动飞行的需求。除了机器人视觉定位算法以外,同学还需要学习其他的传感器,以及这些传感器与视觉定位算法怎么融合。这里面有很多坑,比如计算量的问题,怎么保证融合算法不崩,怎么处理传感器的延时等等,都需要同学结合自己的项目去踩,坑踩得多了才能成长。如果大家想找一个多旋翼飞行器平台研究自动导航,我推荐大疆的M100,我已经在知乎回答RoboMasters2015夏令营是怎样的? - YY硕的回答里吹过一波M100,前面说过的今年夏令营的知乎回答参加Robomasters 2016夏令营是怎样一种体验? - DJI 大疆创新里也有人帮我吹了一波。
一些大学里学过的知识点,是必须结合研究生期间的项目的需求弄得很清楚的,比如三大变换(傅里叶变换,拉普拉斯变换,Z变换),旋转表示法(欧拉角、四元数、旋转矩阵),数值计算怎么防止矩阵出现数值问题等等。除了自己的项目,还需要把凸优化、卡尔曼滤波还有多自由度机械臂的控制学习一下。这三个领域的知识,是任何一种机器人都会用的到比较难的知识。
凸优化和凸优化的各种变形是非常重要的知识,因为各行各业里的研究问题,多半是会建立一个优化问题去解决的。上面提到的《Convex Optimization》http://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf,也是一本神书,同学们一定要认真读一读。Matlab、Python、C++都有一些现成的工具包可以帮助你解优化问题,不过最好同学们能自己手写一些基本的优化算法,比如gradient descend,barrier method等等。另外现在主流的SLAM算法,后端都是通过一种叫做g2o的优化算法来出效果的。而且g2o能够整合bundle adjustment 和structure-from-motion这两大计算机视觉里的关键问题,可以说是一种很好的计算思想了,非常有必要学习一下g2o。
卡尔曼滤波在上面书单里的1和3都有提到,同时在神书Stochastic models estimation and control(http://www.cs.unc.edu/~welch/kalman/media/pdf/maybeck_ch1.pdf)也有相当多的篇幅。卡尔曼滤波有好几种证明的方法,同学最好能自己学会1-2种。
多自由度的机械臂的难点在于机械臂的运动学正反解、运动学控制和动力学控制,基本是一个建模分析和数值算法实现的问题。如果你所在的学校没有一个财力雄厚的机器人实验室的话,你基本上没有机会接触到多自由度的机械臂。这时候之前学到的Simulink和就要学的Gazebo就派上用场了,你可以用Simscape里面的刚体搭一个多自由度机械臂,然后通过Simulink仿真去学习机械臂的控制;也可以用Gazebo的URDF语言写一个机械臂,然后通过Gazebo和ROS的接口去控制机械臂;也可以用ROS里面的著名工具包MoveIt! Motion Planning Framework,不过MoveIt的问题是,他只能仿真运动学,而不能仿真动力学。工业领域对多自由度的机械臂控制通常用一个叫做D-H表示法的建模工具(Denavit),这个东西我并不太会。我只会向同学们推荐我导师的著作《A mathematical introduction to robotic manipulation》(http://www.cds.caltech.edu/~murray/books/MLS/pdf/mls94-complete.pdf)。
有一个非常神奇的事实:《A mathematical introduction to robotic manipulation》这本机械臂控制领域的著名教材的第二章和计算机视觉领域的著名教材《An Invitation to 3-D Vision》的第二章基本是一样的,都在讲旋转表示法。这是因为所有的旋转表示法都可以归纳为一种优雅的李群结构:SO(3)群。而计算机视觉和机械臂控制都涉及到理解刚体的旋转,事实上用计算系统去观测和控制所有的刚体构成的系统,理解旋转都是很关键的问题。旋转表示法应该作为研究生阶段的一个重要学习的知识点。
李群和李代数是刚体旋转表示背后的数学理论,如果想要深挖一些,可以看这篇文章An elementary introduction to groups and representations的前50页(http://www.cmls.polytechnique.fr/perso/renard/Hall_Group.pdf)。这是我自己读着觉得最好的文章,当然网上也有很多其他的介绍。