怎么把若要在此处如何查看收藏夹位置，请依次选择

点击联系发帖人 时间：2017-07-24 03:35

如何查看收藏夹位置

&p&最近朋友圈都在心疼一个小男孩，他是云南昭通的一名小学生，被称作“冰花”男孩。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-ad64d1b3b55d26bf215b3_b.jpg& data-size=&normal& data-rawwidth=&690& data-rawheight=&920& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic4.zhimg.com/v2-ad64d1b3b55d26bf215b3_r.jpg&&&figcaption&云南昭通，身后的同学看着“冰花男孩”的造型大笑&/figcaption&&/figure&&p&天气很冷，孩子走了一个多小时才到学校，头发都被冰霜染白。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-d9de3b141fb1efe4dc49f_b.jpg& data-size=&normal& data-rawwidth=&690& data-rawheight=&920& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic4.zhimg.com/v2-d9de3b141fb1efe4dc49f_r.jpg&&&figcaption&小孩冻红的双手，转山包小学校长付恒供图&/figcaption&&/figure&&p&他今年八岁，是一名留守儿童。那天期末考试，他以为是晴天，所以只穿了两件衣服，等到了教室，同学提醒他才发现自己头发眉毛上全是冰霜。&/p&&p&&b&“上学冷，但并不辛苦。”&/b&这条上学的路，他和姐姐俩人每天都要走。&/p&&p&后来的新闻采访中，记者问他想到外面看看吗？&/p&&p&他说：“没有，我连镇上都没去过，没有走出过村里。我最想去北京，我想去看看那里的学生是怎么读书的。”&/p&&p&对无数个这样的孩子来说，应试教育，或许是唯一可行的捷径。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-29bd8a804ade3f21e222_b.jpg& data-size=&normal& data-rawwidth=&690& data-rawheight=&464& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic3.zhimg.com/v2-29bd8a804ade3f21e222_r.jpg&&&figcaption&2007年12月，马吉乡中心小学兄弟俩飞索过江上学。/ 视觉中国&/figcaption&&/figure&&figure&&img src=&https://pic1.zhimg.com/v2-1a70f07a5bdbe1ae64428_b.jpg& data-size=&normal& data-rawwidth=&690& data-rawheight=&448& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic1.zhimg.com/v2-1a70f07a5bdbe1ae64428_r.jpg&&&figcaption&日, 广西藤县，几名小学生乘竹筏渡过水库去上学。/ 视觉中国&/figcaption&&/figure&&figure&&img src=&https://pic2.zhimg.com/v2-e12f5f7b701f6d41ae9fc1_b.jpg& data-size=&normal& data-rawwidth=&690& data-rawheight=&454& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic2.zhimg.com/v2-e12f5f7b701f6d41ae9fc1_r.jpg&&&figcaption&日，四川凉山，放学路上，孩子们在攀爬藤梯。/ 视觉中国&/figcaption&&/figure&&p&1月8号晚，韩寒发长文称：&b&“退学是一件很失败的事情，说明我在一项挑战里不能胜任，只能退出，这不值得学习。”&/b&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-a39d560acc3dec5ccff59d63a3e67ebd_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&690& data-rawheight=&622& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic2.zhimg.com/v2-a39d560acc3dec5ccff59d63a3e67ebd_r.jpg&&&/figure&&p&曾经应试教育的“反叛者”，认为不用参加应试教育也能成才的韩寒，这一次承认了自己当年的错误。&/p&&p&曾经的他课上不听讲，不记笔记，被语文老师批评的时候，就说：“我是班里语文最好的。”在博客中diss高考作文很蠢，并庆幸没有去上大学。甚至声称即使是复旦邀请他去做老师，还要看自己有没有时间。&/p&&p&而今韩寒却坦言，听到别人得意洋洋地说“韩寒，我学你退学了。”他感到不理解。他认为这是自己做的不好的地方，有什么好学的呢？&/p&&p&很长时间内，我们反对应试教育，提倡素质教育。甚至有人认为退学是成功的第一步。&/p&&p&2008年，安徽省考生徐孟南，在高考试卷上乱写一通，认为这很酷。他找不到好工作，10年后想要重新高考。&/p&&p&2010年，陕西省考生张皎在高考时交白卷，声称自己要成为中国的比尔·盖茨，要在10年内赚到1000万。后因伪造金融票证罪、信用卡诈骗罪被判入狱。&/p&&p&车和家CEO李想称自己招聘的时候总有人留言，说公司歧视学历低的，“你李想不也没上过大学吗？”&/p&&p&而李想的回答是：“我如果能考上好大学找到好工作，我才不创业呢。”&/p&&p&△&/p&&p&&b&素质教育没有真正减压&/b&&/p&&p&目前越来越多的人提倡素质教育，“不能打骂孩子”，“给孩子减负”，“还孩子一个自由自在的童年”的呼声越来越高。一些明星夫妇也公开表明自己的教育理念：不会逼孩子考高分，尊重孩子的兴趣，让孩子做自己喜欢的事情就好。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-3b743ae0fb05be19145aaa_b.jpg& data-size=&normal& data-rawwidth=&690& data-rawheight=&1035& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic3.zhimg.com/v2-3b743ae0fb05be19145aaa_r.jpg&&&figcaption&日，黄多多在巴黎为某童装品牌走秀。/ 视觉中国&凤凰网&/figcaption&&/figure&&p&看见明星家一个个人见人爱的孩子，不少家长就把他们的育儿心经奉为圭臬，齐声反对“死读书”。&/p&&p&可是明星和普通家庭的起点不同，“星二代”童年时就可以走高级秀场，演电影，见各界名流。&/p&&p&普通人家的孩子就没这么幸运了，学历的高低可能直接影响你的收入、朋友、工作环境。当这些重担都压在身上，普通人家的孩子不敢不好好考试。&/p&&p&应试教育有肉眼可见的竞争比拼，素质教育同样有看不见的暗流涌动。&/p&&p&&b&关系、眼界、出身、阅历每一个都是比拼的标准。&/b&&/p&&p&一个在相对公平的应试教育中无法胜出的孩子，凭什么相信他能在素质教育中脱颖而出？&/p&&p&南京外国语学校（以下简称南外）是整个江苏省家长挤破头想进的地方。在2017年江苏省普通高校招收保送生拟录取名单中，共有173名保送生，其中南外和南外仙林分校就占了165名。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-10dcaad9afba_b.jpg& data-size=&normal& data-rawwidth=&636& data-rawheight=&382& class=&origin_image zh-lightbox-thumb& width=&636& data-original=&https://pic3.zhimg.com/v2-10dcaad9afba_r.jpg&&&figcaption&拟保送名额南外占了135位 /江苏省教育考试院&/figcaption&&/figure&&p&曾在南外读书的网友分享说，初中基本3点多就放学了，学校还有各种各样的艺术活动，这样的学校应该称得上是“素质教育”了。南外的同学家境都比较殷实，普通家庭的孩子很难进入南外的主流圈。&/p&&p&2015年高考，南京外国学校共有482名学生（含扩招生和借读生），保送166人，出国295人，最终21名学生参加高考。&/p&&p&无需高考，直接出国需要花费多少钱，从平时的社会新闻中，我们也能窥见一二。&/p&&p&而在南外以外的地方，对那些必须要参加高考的学生来说，却流行着这样一种现象：&b&素质教育越流行，补课的孩子越多。&/b&&/p&&p&事实上，学校减负并不能真正达到目的，反而给了外边的补课班可乘之机。&/p&&p&可见素质教育并没有从根本上解决大学生的就业和生存问题，反而给寒门子弟增加了更多的压力。&/p&&p&△&/p&&p&&b&素质教育寒门更难逆袭&/b&&/p&&p&去年，《月薪三万，还是撑不起孩子的一个暑假》一文刷爆朋友圈，一位女士是企业的高管，月薪3万，女儿读小学五年级。&/p&&p&暑假女儿去美国游学，10天花费2万元，为照顾女儿请的阿姨，5000元；钢琴课，2000元；游泳班2000元；英语、奥数、作文3科培训班6000元，这几项加起来就要35000元了……&/p&&p&&b&可见，要在素质教育中取胜，不仅要努力，还需要财力。&/b&&/p&&p&你能想象一个农村家庭的孩子对妈妈说“妈妈，我想学钢琴”吗？她的母亲该是怎样尴尬又拮据地搓搓手说，“宝宝，我们家买不起。”&/p&&figure&&img src=&https://pic2.zhimg.com/v2-7bc8ec7abebd_b.jpg& data-size=&normal& data-rawwidth=&690& data-rawheight=&459& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic2.zhimg.com/v2-7bc8ec7abebd_r.jpg&&&figcaption&日，青岛，孩子们对从没演奏过的钢琴很喜欢。/ 视觉中国&/figcaption&&/figure&&p&素质教育的成本是巨大的，仅设备一项就让许多家庭望而却步，就算家长花大价钱买了设备，请老师的费用也不是小数目。&/p&&p&当一些普通阶层家长认为课堂上讲讲世界各国风土人情就是素质教育时，财力宽松的家长已经带孩子到国外去真听真看真感觉了。&/p&&p&作家西坡在文章中描绘过这样一个场景“人家的孩子放学进补习班，周末上兴趣班，暑假出国游学，我放学去希望的田野上，周末去希望的田野上，暑假还去希望的田野上。&b&田野虽好，不考种地啊。&/b&”&/p&&figure&&img src=&https://pic4.zhimg.com/v2-a31a889fcecd041c30fdb_b.jpg& data-size=&normal& data-rawwidth=&690& data-rawheight=&460& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic4.zhimg.com/v2-a31a889fcecd041c30fdb_r.jpg&&&figcaption&连续两周，爷爷每天都用木盘将孙女送到学校，放学时再将她们接回家。/ 视觉中国&/figcaption&&/figure&&figure&&img src=&https://pic1.zhimg.com/v2-e1a7a629b5c_b.jpg& data-size=&normal& data-rawwidth=&690& data-rawheight=&460& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic1.zhimg.com/v2-e1a7a629b5c_r.jpg&&&figcaption&日，云南省禄劝中村小学，半路上喝水的小学生。/ ?视觉中国&/figcaption&&/figure&&p&最后他总结，&b&农村孩子应试都拼不过城里的孩子，拼“素质”那是找死。&/b&&/p&&p&如果普通的父母蹦着高去让孩子接受素质教育，孩子往往会背负过多的期望与压力，这与当初给孩子减负的初衷自相矛盾。&/p&&p&小时候邻居家的孩子一时兴起要一架钢琴，他爸爸觉得自己家孩子有音乐天赋，节衣缩食给他买了。&/p&&p&可后来小孩子并没有在这方面展现出什么特长。每次练琴的时候，我都能在家里听到他父亲的咒骂声：“老子花这么多钱给你买的钢琴，你就弹成这样子？”&/p&&p&对于有些家庭来说，买钢琴的钱只不过是添了一件闲置家具，对有些家庭来说则是一笔巨款。&/p&&p&当教育变得个性化、素质化，教育水平之间的差距就会越来越大。一个看书上的画报，一个看眼前的实景；一个是苦逼地自学，一个是私教陪读齐上阵。让教育资源天壤之别的两个孩子去面对同一场考试，结果可想而知。&/p&&p&△&/p&&p&&b&素质教育还要考验家长的素质&/b&&/p&&p&戴韵是典型的“别人家的孩子”，16岁考入北大，仅18个月就读完美国加州大学的博士。&/p&&p&她说自己能在这么短的时间内完成博士学习，要归功于从小的积累。&/p&&p&戴韵父母采用了良好的引导方法，他们不逼迫戴韵学习，而是鼓励她自己制定目标，之后再由父母来帮助检查。&/p&&p&&b&父母会为戴韵准备读物，书柜里的书，会随着她的年龄悄悄发生变化。&/b&从《男生贾里女生贾梅》到《神秘岛》再到《围城》，父母的良苦用心为戴韵打下了坚实的语言文字基础。&/p&&p&去年北京市的状元也说：“现在的状元都是家里又好又厉害这种，我父母都是外交官，从小就给我营造出一种很好的家庭氛围，甚至学习习惯，性格上的培养，都是潜移默化的。”&/p&&figure&&img src=&https://pic2.zhimg.com/v2-a3d889b8e5f0fca75c0039_b.jpg& data-size=&normal& data-rawwidth=&690& data-rawheight=&460& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic2.zhimg.com/v2-a3d889b8e5f0fca75c0039_r.jpg&&&figcaption&北京文科状元熊轩昂在新生入学报到当天接受媒体采访。/ 视觉中国&/figcaption&&/figure&&p&这段话被很多人诟病，被解读为他瞧不起农村人。话虽扎心，可它反映出的事实却不得不承认。&/p&&p&生在书香门第的孩子，自然而然比别人接触到更多知识；生在官宦之家的，那从小就耳濡目染人情世故；生在工人之家的，常见的便是日复一日的工作；如果生在农民之家，那目之所及之处便是农田和春种秋收的身影。&/p&&p&原生家庭带给一个人的印记一辈子都无法抹去，有些明星被群嘲土或丑，你可以不喜欢，却没资格说他low。&/p&&p&没人能决定自己出生在豪门还是寒门，寒门子弟可以穷，但不能脆弱到不敢承认出身所带来的差别。&/p&&p&寒门子弟最可悲的，就是生在寒门，还长了一颗玻璃心。&/p&&p&而应该像莱娅公主的那句话，“Take your broken heart. Make it into art.”。&b&带上你破碎的心，把它变成艺术。&/b&&/p&&p&&b&△&/b&&/p&&p&&b&应试教育是唯一捷径&/b&&/p&&p&网络上有很多人diss衡水中学，说它是考试加工厂，说它是人间地狱。&/p&&p&但在崔永元对衡水中学学生进行的回访中，几乎99%的孩子都表示，如果让他们再做选择，还会去这所学校，他们对学校根本没有“怨恨”。&/p&&p&&b&因为对于他们来说，想要离开偏远的家乡到大城市发展，只有走这条路，没有别的选择。&/b&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-bb13a89b66cccedd9fe3f_b.jpg& data-size=&normal& data-rawwidth=&496& data-rawheight=&354& class=&origin_image zh-lightbox-thumb& width=&496& data-original=&https://pic4.zhimg.com/v2-bb13a89b66cccedd9fe3f_r.jpg&&&figcaption&跑操时还在看书的学生&/figcaption&&/figure&&p&四川一高同学创作的高三标语受到网民关注，“吾日三省吾身，高否？帅否？富否？否，滚去学习”，还有“考过高富帅，战胜官二代”。&/p&&p&这些标语反映了普通家庭学子，想要通过高考改变命运的愿望。&/p&&p&应试教育是他们最有效的进阶之路，只有通过高考他才有可能和那些官二代富二代享受同样的资源和待遇。&b&毕竟函数不问出身，细胞不看背景。&/b&&/p&&p&&b&△&/b&&/p&&p&&b&高分高能大有人在&/b&&/p&&p&目前社会上流行着很多“学霸高分低能”的说法，例如湖南神童魏永康生活不能自理被学校劝退，14岁考入沈阳工业大学的王思涵，多门成绩零分，被学校“责令退学”。&/p&&p&可这些同学为什么会引起媒体和社会的关注？因为他们是特！例！啊！&/p&&p&&b&最可怕的，是将特例当普遍，把高分等同于低能。&/b&&/p&&p&IPIN人工智能公司统计发布了一份毕业五年的大学毕业生的平均薪酬。2016年，平均月薪过万的39所高校中，985、211院校占了30个，这足以证明高分学生并不低能。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-c1cc7dd3afb00f4e313158_b.jpg& data-size=&normal& data-rawwidth=&690& data-rawheight=&494& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&https://pic1.zhimg.com/v2-c1cc7dd3afb00f4e313158_r.jpg&&&figcaption&学历与收入规律&/figcaption&&/figure&&p&从图形中可以清楚看到，大专及以上学历的收入远远高于前者。&/p&&p&根据2017年中国大学校友捐赠排行榜，前15名皆为985高校，其中985，211高校在前100名中占了63个。&/p&&p&2017中国大学校友捐赠排行榜&/p&&figure&&img src=&https://pic3.zhimg.com/v2-5aff25e0f530a58c398f3ece969ba3ba_b.jpg& data-size=&normal& data-rawwidth=&543& data-rawheight=&518& class=&origin_image zh-lightbox-thumb& width=&543& data-original=&https://pic3.zhimg.com/v2-5aff25e0f530a58c398f3ece969ba3ba_r.jpg&&&figcaption&艾瑞深中国校友会网&/figcaption&&/figure&&p&如果名校学生不是毕业之后发展得好，又怎能回校一掷千金？&/p&&p&当你还在担心孩子未来会不会高分低能的时候，高分的孩子已经考入好大学，找到了好工作。&/p&&p&去年苏宁在招聘时，明确表示管培生只要985/211大学的毕业生。言论一出引起众多“双非”（非985/211）大学生的讨伐。最后苏宁诚挚道歉，可惜这次道歉并不能解决“双非”大学生的实际就业问题。&/p&&p&说什么“学霸都是情商低”“学习差的当老板，学习好的给他打工”，借用范伟老师的话diss“忽悠~接着忽悠~”&/p&&p&&b&读书不苦，不读书的人生才苦。毕竟，一个连读书的苦都吃不下的人，又如何咽下生活的委屈？&/b&&/p&&p&学生时代是增长能力和见识的时代，如果在学生时代追求自由，那要什么时候开始拼搏？童年是快乐了，那青年、中年和老年呢？这份无忧无虑又能持续多久呢？&/p&&p&若干年后你回看自己的学生时代，是后悔自己不够努力，还是感谢自己足够努力？&/p&&p&&b&人一出生，就被划分成寒门和豪门，这没有什么可怕的，真正可怕的，是你误以为寒门和豪门之间只差一个素质教育，不要欺骗自己。&/b&&/p&
最近朋友圈都在心疼一个小男孩，他是云南昭通的一名小学生，被称作“冰花”男孩。天气很冷，孩子走了一个多小时才到学校，头发都被冰霜染白。他今年八岁，是一名留守儿童。那天期末考试，他以为是晴天，所以只穿了两件衣服，等到了教室，同学提醒他才发现自…
加拿大房东把公寓恰好租给了四个房客：一个黑皮肤，一个棕色皮肤，一个黄皮肤，一个白皮肤。&br&&br&1994年，黄皮肤的我在杭州，跟随父亲和战士们住在军营。&br&同年，黑皮肤的房客亲身经历了卢旺达大屠杀，棕皮肤的房客国家正在内战。&br&白皮肤的法国房客那年刚出生，但是四年之后他就已经在Haute-Savoie (著名滑雪胜地）开始第一次滑雪训练了。&br&&br&&figure&&img src=&https://pic2.zhimg.com/4754fbeae83b06a62de2a10f_b.jpg& data-rawwidth=&1280& data-rawheight=&852& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/4754fbeae83b06a62de2a10f_r.jpg&&&/figure&&br&&br&&figure&&img src=&https://pic2.zhimg.com/2d319cdac38b92da913d7eb80b0dfd41_b.jpg& data-rawwidth=&1280& data-rawheight=&852& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/2d319cdac38b92da913d7eb80b0dfd41_r.jpg&&&/figure&&br&&br&&figure&&img src=&https://pic1.zhimg.com/9ea52dbb1a1ac3c0b4fdf4_b.jpg& data-rawwidth=&962& data-rawheight=&640& class=&origin_image zh-lightbox-thumb& width=&962& data-original=&https://pic1.zhimg.com/9ea52dbb1a1ac3c0b4fdf4_r.jpg&&&/figure&&br&&br&&figure&&img src=&https://pic4.zhimg.com/94a0f2c6bebb3a060edc27f_b.jpg& data-rawwidth=&1280& data-rawheight=&852& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/94a0f2c6bebb3a060edc27f_r.jpg&&&/figure&&br&&br&&figure&&img src=&https://pic4.zhimg.com/e8e66ce3a0ba38ecdc2d3_b.jpg& data-rawwidth=&1280& data-rawheight=&852& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/e8e66ce3a0ba38ecdc2d3_r.jpg&&&/figure&&br&&br&&br&&br&&figure&&img src=&https://pic2.zhimg.com/08d6eeec6d17a1d913bd_b.jpg& data-rawwidth=&1280& data-rawheight=&852& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/08d6eeec6d17a1d913bd_r.jpg&&&/figure&&br&&br&&br&&br&这段话是我当时聚会后的一个感慨，发在朋友圈之后，大家的第一反应便是：人生来而不公平。&br&不仅仅是城乡之间的差距：生在战乱的废墟中千辛万苦地想要存活，含着银汤匙的已在高谈自由和民主。&br&&br&&br&&br&&b&但是当时我没有写出的另一半故事，其实是：&/b&&br&&br&喝着红酒和香槟长大的白人小伙读到了高中，现在在餐馆打工。&br&童年在自己的国家经历了无数次恐怖袭击和反恐，长大以后被世界贴上“恐怖分子”的穆斯林小伙是航空航天学硕士，现在是一名飞行员教练。&br&亚洲的我，家庭平凡，拿着全奖在海外读到了硕士。&br&而在大屠杀中幸免，和母亲逃难了几个国家，辗转到了加拿大的非洲小伙，在加拿大最负盛名的麦吉尔大学生物医药专业就读。&br&&br&&br&我们的起点那么不一样，但我们坐在了一张桌上，云淡风轻地谈起世界的不公平。&br&当时就觉得，知识是可以诉求到的唯一公平。&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&-------------&br&不逐一回复或解释了。&br&来源于我生活的一个片段，描述了我当时的感受。文字表述的都是准确的事实，但是肯定不是完整全面的，毕竟回答不旨在叙事。大家看到不同的层面，给不同的解读都很好。&br&&br&关于肤色是因为在法语日常形容词中，确实会形容，白人blanc，黑人noir，黄种人不太说jaune（黄色），东亚会直接说asiatique，但是颜色稍深的例如印度、北非、南美会形容是brun（棕色）。我想了想，英语中好像也是这样，更多说asian。有意思的是，我学阿拉伯语的教材中，也是这个分类，亚洲人的肤色没有一个对应的词，但他们形容自己也是用棕色皮肤，这里不是讲人种。&br&&br&&br&殖民主义让肤色有了高低之分，在后殖民时期里很多观点colorblind，也有说因为我们还在谈论颜色才导致更多不公平，种族是“社会构建的”socially constructed，不是生物上人种的差别。&br&&br&&br&所以我很理解很多评论区里的一些观点批评我用颜色。我觉得提出这个点非常好，使用颜色不仅是描述我们的生理特征，也会粘带了我们各自的社会背景和际遇。可我想了想，这样表述确实最准确。&br&所以保持原贴，但是接受批评。
加拿大房东把公寓恰好租给了四个房客：一个黑皮肤，一个棕色皮肤，一个黄皮肤，一个白皮肤。 1994年，黄皮肤的我在杭州，跟随父亲和战士们住在军营。同年，黑皮肤的房客亲身经历了卢旺达大屠杀，棕皮肤的房客国家正在内战。白皮肤的法国房客那年刚出生，…
&h2&背景&/h2&&p&我的爸爸妈妈都是一个西南小城的大学老师。自从有记忆的时候开始，每次到他们期末考试的时候，他们就要花上好几天的时间改卷。最近几年，步入中年的他们开始老花了，改卷越来越费力，特别是我妈妈本身就高度近视，所以有时候得让学生帮忙。但是每张试卷四十到六十道选择题，我爸上的还是公共课，学生更多。&/p&&p&今年过年的时候，我刚毕业还没入职，赋闲在家，就请了两个研究生同学跑来家里玩，然后他们也“顺便”改了一下选择题。整个过程非常枯燥，得吃好几碗螺丝粉才能补回来。然后我忽然意识到，我们三个可能是家乡历史上出现过计算机水平最高的三颗大脑，还都是CMU毕业搞智能信息系统的，竟然还要做这种本应该交给计算机干的活儿，于是我自然而然想到了把它自动化。&/p&&hr&&h2&痛点&/h2&&p&答题卡读卡机是很早很早就有的东西了，但是主要有几点原因爸爸妈妈他们学校一直没有用上：&/p&&ul&&li&&b&设备太贵 &/b&&/li&&/ul&&p&淘宝答题卡读卡器5000元起。加上反腐之后，审计收紧，这种价格的设备需要统一通过政府采购，价格更加高昂，如果要购买这种设备手续非常复杂。&/p&&ul&&li&&b&需要专用答题卡 &/b&&/li&&/ul&&p&这进一步提升了使用成本，一般一张答题卡的采购价是一毛钱。&/p&&ul&&li&&b&使用复杂 &/b&&/li&&/ul&&p&爸爸妈妈虽然电脑已经用得很溜了，但是现在已有的软件的操作界面还是让老一辈教师望而却步——所以有的院校得专门雇人来操作答题卡读卡器。&/p&&hr&&h2&初期调研与设计&/h2&&p&刚好我本科接触过图像和视频处理技术，在CMU的时候某个课程项目是识别手写公式转换成Latex，个人有一定的技术积累。刚好签证例行被行政审查，暂时没法入职，过年期间就开始设计这么一个系统。针对上面三点，这个系统需要有以下几个特性，我一并做了调研：&/p&&ul&&li&&b&设备尽可能简单易用&/b&&/li&&/ul&&p&之前，在我印象中扫描还是手动模式，需要扫完一张，再放下一张……&/p&&p&直到我到CMU才第一次见识了自动送纸（Auto Document Feeder）扫描仪。&/p&&p&同时我在网上看了一下价格，自动进纸扫描仪最便宜的新品是国产的清华紫光-F20S，只要1150元包邮，这个价格就算我自己掏腰包也可以承受，而且50张的纸匣已经基本足够一般教学的使用了。&/p&&ul&&li&&b&普通打印机就能打印的黑白答题卡&/b&&/li&&/ul&&p&常见的答题卡的框线一般都做成红、绿、蓝三种颜色：&/p&&figure&&img src=&https://pic1.zhimg.com/v2-deeadcd59a218_b.jpg& data-size=&small& data-rawwidth=&724& data-rawheight=&608& class=&origin_image zh-lightbox-thumb& width=&724& data-original=&https://pic1.zhimg.com/v2-deeadcd59a218_r.jpg&&&figcaption&彩色硬纸答题卡&/figcaption&&/figure&&p&对应计算机中RGB的颜色表示方式，这样在做图像处理的时候，能够用阈值法轻松把框线等非答案的内容筛掉筛掉，只剩下学生填涂的结果。这样，再根据四周的定位块来确定学生的填涂内容。&/p&&p&如果变成黑白的，就需要把学生填涂的内容答案从背景中分离出来，这其实增加了一点难度，但是考虑到之前在CMU的课程设计里做过类似的事情，技术上是可以解决的。&/p&&ul&&li&&b&操作步骤尽可能简单&/b&&/li&&/ul&&p&所以我需要尽可能简化使用流程，让使用者少做选择，尽可能只需要三步：选择文件——处理——得到结果&/p&&p&&br&&/p&&p&除此之外，我还想整个东西看起来厉害一点。&/p&&p&前面说道我在CMU做过类似的事情，大概的项目效果是把手写公式转换成Latex公式：&/p&&figure&&img src=&https://pic3.zhimg.com/v2-b2f1bcab9ce0a7c7dedf386_b.jpg& data-size=&normal& data-rawwidth=&728& data-rawheight=&667& class=&origin_image zh-lightbox-thumb& width=&728& data-original=&https://pic3.zhimg.com/v2-b2f1bcab9ce0a7c7dedf386_r.jpg&&&figcaption&手写公式识别&/figcaption&&/figure&&p&看上去很酷，但实际上做了如下两个假设之后一点也不难：&/p&&ol&&li&字符之间没有粘连&/li&&li&同级的字母基本上都保持在一个水平线上&/li&&/ol&&p&难点就在有的字符是被分成两部分的，需要合并，比如等号，阶乘号和i,j……可以“启发式”合并，或者实在太难可以假设他们不存在好了……（科学就是这么进步的嘛，基础性、积累性的工作靠大部分普通人解决，挑战性的工作由少部分天才解决）&/p&&p&识别这一块，机器学习的库现在封装得太好用了，基本上搜集到数据丢进去无脑训练就行，更何况这个只是机器学习入门必读教程——识别手写数字的升级版。只需要多采集一些手写数据就好了。&/p&&p&当时我搞了这么一个表格，让爸爸妈妈在上课的时候找学生去填：&/p&&figure&&img src=&https://pic1.zhimg.com/v2-6a93ff20e169cbf7f98e96dc_b.jpg& data-size=&normal& data-rawwidth=&503& data-rawheight=&737& class=&origin_image zh-lightbox-thumb& width=&503& data-original=&https://pic1.zhimg.com/v2-6a93ff20e169cbf7f98e96dc_r.jpg&&&figcaption&手写字符采集卡&/figcaption&&/figure&&p&然后用了一些框线检测的算法和字符提取的算法搞出了个数据集，训练模型的测试效果也还行。&/p&&p&所以我刚开始做的时候野心比较大，想把填涂式改为手写式的答题卡，因为选项最多只有ABCDEFG和勾叉。&/p&&hr&&h2&实现&/h2&&p&有了之前的想法，我就开始动手实现。&/p&&p&&b&答题卡&/b&&/p&&p&第一步肯定是核心功能，识别。第一版的答题卡设计我已经找不到了，但是大致思想跟第二版差不多，学号部分也是手写的：&/p&&figure&&img src=&https://pic4.zhimg.com/v2-dd1c21ea23e0e9c21f2b102b_b.jpg& data-size=&normal& data-rawwidth=&441& data-rawheight=&417& class=&origin_image zh-lightbox-thumb& width=&441& data-original=&https://pic4.zhimg.com/v2-dd1c21ea23e0e9c21f2b102b_r.jpg&&&figcaption&手写版答题卡&/figcaption&&/figure&&p&不定向选择题之所以设计成这样，是因为实际使用中让学生写多个选项的时候不连笔这个假设很难成立：一方面自然是学生书写习惯的问题；另一方面，即便学生书写没有问题，也可能会因为纸张、扫描仪的问题意外出现一些笔迹的断裂和符号的粘连。&/p&&p&一旦出现笔迹断裂、字母粘连的情况，就需要加入切割算法——这恰恰是验证码中一个比较难解决的问题——更何况，验证码识别器只需要30%的准确率就能凑合用，达到60%的准确率就基本满足需求了，而评卷时的准确率是以人的识别准确率（95%以上）作为标准的。&/p&&p&同时，就算能够成功切割，往往也会引入一些变形，对识别准确率造成负面影响。&/p&&p&所以，这个表格定下来后，大致处理方法是这样：提取出三块最大的矩形，然后利用框线检测方法去掉框线，提取出表格中的字母，标准化（居中、放大、填补边缘）之后利用上次收集的手写字符数据训练分类器并识别。&/p&&p&然而，这时候我才发现，训练出来的模型能够平均达到97%的准确率，但是具体测试总会出现一些匪夷所思的识别错误，有点类似&a href=&//link.zhihu.com/?target=https%3A//arxiv.org/pdf/.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&One pixel attack for fooling deep neural networks&/a&（针对深度神经网络的单像素攻击）里面提到的问题。虽然97%的准确率也算可以接受了，因为要是我自己来改看走眼一两个很正常，但是我自己很不满意，毕竟如果有人刚好因为一个识别错误冤枉挂了那是很不好的（明明没过的过了那就不管了）。而且有一部分识别错误发生在学号部分，这会导致登记分数的时候需要额外的人工核对工作，尽管把学号改成填涂式能够解决这个问题。&/p&&p&主要原因我估计是数据集不够（总共加起来有效样本才一千来份），加上采集数据时示例字体是我手写的，可能很多人的写法会受到我的影响，然而真正测试的时候则会用自己的写法。再进行大规模采集的话，估计比较困难，所以我最后放弃了手写识别这个想法。&/p&&p&由于基于框线的定位在实际使用中并不是特别让人满意，我也没想出来什么简单可靠的算法，于是我打算另辟蹊径，寻找更好的定位的方法。普通识别卡是在角上放色块，但是色块本身也比较容易受干扰，调试起来也比较麻烦，还是不方便。&/p&&p&经过反复思考，第三版答题卡设计成了这样：&/p&&figure&&img src=&https://pic3.zhimg.com/v2-3abffa9acdd1ca6a29be_b.jpg& data-size=&normal& data-rawwidth=&633& data-rawheight=&448& class=&origin_image zh-lightbox-thumb& width=&633& data-original=&https://pic3.zhimg.com/v2-3abffa9acdd1ca6a29be_r.jpg&&&figcaption&第三版答题卡&/figcaption&&/figure&&p&没错，就是这么简单粗暴。角上借鉴了二维码的定位块技术。二维码还有一个名称叫做Quick Response Code，原因就在于这三个定位块，它能够让程序很方便地定位二维码的区域。定位这三个方块的算法有很多，具体实现我参照的是这篇文章：&a href=&//link.zhihu.com/?target=http%3A//dsynflo.blogspot.com/2014/10/opencv-qr-code-detection-and-extraction.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&OPENCV: QR CODE DETECTION AND EXTRACTION&/a&&/p&&p&大致的原理是对图像进行边沿检测，然后根据边沿的嵌套关系提取出候选块，最后抽出最可能的三个。&/p&&p&然后四周的黑块用于辅助答案的定位。其实，因为扫描仪扫描的图像基本没有形变，所以可以不需要的。但是当时考虑到我需要一次性设计多种满足不同需求的答题卡，所以采取了这种实现。后来想想其实如果在提交的时候已经知道答卷类型，其实完全可以去掉这些黑色辅助定位方块，以降低印刷难度（有的打印机在打印黑色色块的时候会有油墨不均匀的情况）和油墨消耗。&/p&&p&之后妈妈在年级搞英语能力竞赛，试用了一下，识别上没有什么大问题，但是这张答题卡的设计上却有些问题：由于空间不足的关系，我把学号拆成了两栏，内部横向填写，两栏却是纵向摆放，同时既有手写的框，又有填涂的框（主要想顺便采集手写数字的数据）。这样很多学生在填涂学号的时候就出现了如下情况：&/p&&ul&&li&写了学号没填涂&/li&&li&只填上面一栏学号，同时前五位学号手写，后五位学号填涂&/li&&li&漏填学号某一位&/li&&li&……&/li&&/ul&&p&真是感叹，你永远不知道用户会以什么奇怪的姿势用你的产品。于是，最后我把答题卡设计成了这样：&/p&&figure&&img src=&https://pic2.zhimg.com/v2-cf7c1f623aa380e7a36bacaf_b.jpg& data-size=&small& data-rawwidth=&627& data-rawheight=&789& class=&origin_image zh-lightbox-thumb& width=&627& data-original=&https://pic2.zhimg.com/v2-cf7c1f623aa380e7a36bacaf_r.jpg&&&figcaption&最终版全页答题卡&/figcaption&&/figure&&p&这样之后，学生犯错误的概率大大降低，也基本达到效果了，有时间的话，下一步就是把四周的黑色定位块给去掉。&/p&&p&&b&评卷系统&/b&&/p&&p&答题卡设计好之后，识别算法基本上水到渠成，只不过实际情况中会有一些琐碎的细节和特殊情况需要仔细调较。&/p&&p&下一步就是评卷系统了，从提交答案、答题卡到汇总成绩，要尽可能简单。首先我不想让他们安装任何软件，因为这会引入额外的操作步骤，每多一步他们就会困惑一点；其次，我要使用他们尽可能熟悉的操作模式和软件来完成我的功能。&/p&&p&于是我最后采用的是：扫描成PDF文件——网页提交——网页预览——下载详表的模式。&/p&&p&我自己买回来测试的是富士通（Fujitsu） IX500的扫描仪，这个扫描仪实在是太给力了，一键扫描保存成PDF，这给我省了很大的事。&/p&&p&后面的网页处理看似简单，但是实际上琐碎的事情非常多：&/p&&p&首先说网页提交吧，一个班扫描出来的文件往往3~20M大小（有的扫描仪扫出来的灰度模式，没有压缩），考虑到国内网站需要备案，而且国内运营商的上传带宽都小得可怜，所以我得把服务器放在大陆之外，这样一来上传时间过长会导致他们忍不住刷新，所以必须至少有一个上传进度条，更好的实现是切片上传。&/p&&p&其次，尽管识别算法已经足够强壮，但是仍然免不了一些识别不了的情况，比如学生把识别块给整个涂黑了（真有这样的学生），印刷缺陷等等，这时候必须把识别出错的答题卡给列出来，悄无声息地出错然后把学生的答题卡吞了就不好了。&/p&&p&还有，因为大部分情况下最后的个人总分、单项总分、平均分、每一题的正确率等信息都是需要汇总给教务处的，我需要一个方便他们提取这些信息的方式。&/p&&p&说起来上一次写这种网站还是三年前在大摩实习的时候，当时前端Bootstrap+jQuery，后端Django还是主流，本着先让它跑起来的目的我沿用了当时的架构，虽然可能已经有一点老了，但是至少一切都在我的控制之内。&/p&&p&具体实现细节没太多可以说的，三个字概括的话就是：糙快猛，要是在公司写这种代码的话是会被拖出去打的，就给大家简单看看效果吧。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-2daeec48bc5e246aa4f0b5a4929271cb_b.jpg& data-size=&normal& data-rawwidth=&594& data-rawheight=&543& class=&origin_image zh-lightbox-thumb& width=&594& data-original=&https://pic4.zhimg.com/v2-2daeec48bc5e246aa4f0b5a4929271cb_r.jpg&&&figcaption&提交界面&/figcaption&&/figure&&figure&&img src=&https://pic3.zhimg.com/v2-474ddf2ced8c4ec0ca3b1c36_b.jpg& data-size=&normal& data-rawwidth=&1228& data-rawheight=&449& class=&origin_image zh-lightbox-thumb& width=&1228& data-original=&https://pic3.zhimg.com/v2-474ddf2ced8c4ec0ca3b1c36_r.jpg&&&figcaption&预览界面1&/figcaption&&/figure&&figure&&img src=&https://pic1.zhimg.com/v2-afb2edc9811744_b.jpg& data-size=&normal& data-rawwidth=&1154& data-rawheight=&498& class=&origin_image zh-lightbox-thumb& width=&1154& data-original=&https://pic1.zhimg.com/v2-afb2edc9811744_r.jpg&&&figcaption&预览界面2&/figcaption&&/figure&&figure&&img src=&https://pic3.zhimg.com/v2-293bab892fcd1d120ede04a_b.jpg& data-size=&normal& data-rawwidth=&1296& data-rawheight=&892& class=&origin_image zh-lightbox-thumb& width=&1296& data-original=&https://pic3.zhimg.com/v2-293bab892fcd1d120ede04a_r.jpg&&&figcaption&Excel&/figcaption&&/figure&&p&值得一提的是，我在做Excel输出的时候费了很大的力气，因为我想做到以下几点：&/p&&ol&&li&保证数据一致性，即老师改了答案和分值，后面学生的得分也要改&/li&&li&支持筛选，比如提交了全年级的答卷，如果筛选了某个班级的学生，对应的统计数据也得改&/li&&li&支持多选题少选给一半分，不选错选给0分的情况&/li&&li&尽可能使表格好看、通用、易用&/li&&/ol&&p&为了保证一致性，我需要使用大量的公式，大部分公式还是比较简单，主要是公式多了工作比较琐碎，可谓牵一发而动全身。但是有少部分公式要写起来还是非常蛋疼的，主要原因是我想避免使用VBA，因为大部分老师的电脑安全设定是屏蔽VBA的，这大大增加了工作量，比如答案分值是一列，而学生的得分是一行，EXCEL里行列乘法是没有的。&/p&&p&还有第三点，大家可以想想怎么用EXCEL的公式实现这一点，我的实现方法非常的猥琐……&/p&&hr&&h2&实战&/h2&&p&经过三个月的开发和不停地调较，现在整个系统的稳定性和识别率都非常不错，后来给我中学老师拿去试用反馈也非常好，这可能是我目前为止自己做的最有用的一个项目了。&/p&&p&只是爸爸妈妈最后想拿去期末考试使用的时候，遇到了学院里面的一些阻力，某些认识了十几年的人以种种奇怪的理由作梗，最后我妈妈三番五次打报告，一再声明不要钱，并请计算机系的老师写书面测试证明了之后才同意使用。爸爸那边则只在他自己教的班级使用，不过这也就够了。&/p&&p&好在我写的代码质量还是可以的，成功经受住了接近两千多份的试卷的考验，办公室的老师也纷纷表示好使，写试卷分析也爽多了。他们也进一步提供了一些意见，比如最后每个学生的选项需要打印存档确认，所以需要用下划线标识对的、错的、部分对的各种细节等等。&/p&&hr&&h2&总结&/h2&&p&从工程上说，这其实算是我写的第一个比较大的实用型项目，给我最大的感受就是，你永远不知道客户以什么姿势用你的产品。在发布前进行内部封测还是很必要的，的的确确能够发现很多的问题和改进建议。&/p&&p&我最近在读《人月神话》，里面提到一点就是，如果说程序需要一倍的工作量，那么到程序系统产品组件需要九倍的工作量。我第一次切切实实感受到，此言不虚。写识别算法的时候尤其感受到回归测试的重要性——然而我一直没有写回归测试，因为工作量有点太大了。&/p&&p&回到题主的问题，什么时候觉得读书有用？我曾经回答过这样一个问题：&a href=&https://www.zhihu.com/question//answer/& class=&internal&&知乎用户：为什么软件工程专业要学习大学物理？&/a&这个回答引起了很多人的讨论，包括我一些很厉害的同学也有表示反对的。这一次，我觉得又可以增加一条论据了：在答题卡识别的算法中我使用了仿射变换，如果不是学过线性代数、大学物理、机器视觉，我可能会卡在那儿很久甚至放弃。&/p&&p&可能因为爸爸妈妈是老师的缘故，我一直觉得读书、做题、工作是一件很有意思的事情，有时候理论的确枯燥，但是绝大部分理论都是出自生活中非常有意思的问题。所以，就知识而言，它一定是有用的，只是需要在合适的地方发挥作用。&/p&&p&本科有一个同学是学临床医学的，但是他课余在心理学上花费了很多的时间。我们当时就问，心理学毕业的话，除了能做心理医生还能干嘛呢？他跟我说，很多啊，心理学有一个分支叫工程心理学，专门研究人、机器与环境的关系。很多毕业生都跑去飞机制造业，研究飞行员的心理，以设计出尽可能让飞行员操纵简单、不犯错的飞行控制系统。很多产品功能上完全一样，但是就是交互上有天壤之别，比如前面我提到的答题卡中学号的排布，以及飞机上操纵杆的位置，等等。&/p&&p&所以说，保持眼界开阔，多接触新知识，往往在意想不到的时候会对自身有所帮助。&/p&&p&另一方面，说实话，这个项目拉给任何一个合格的一流计算机专业毕业生来做应该都不是问题，现实中这样不需要太多技术就可以改进和提高的东西还有很多。哈哈，“改变世界”的门槛似乎并没有那么高嘛。很多人不太喜欢李开复老师的“鸡汤”，但是我很欣赏他自传《世界因你不同》中的信念，并且努力践行。女朋友一直说我是情怀党，做这个项目我慢慢感觉到，可能还真是。我很享受这种利用自己所学来产生正面影响的事情，哪怕只是一丁点。这一次，当满头华发的爸妈不再费劲地批阅选择题，远在他乡的我感到了一点点慰藉，我的所学似乎赚回了一点点学费。&/p&&p&最后，罗哩罗嗦写了这么多，非常感谢你能够听我分享这个故事。：）&/p&&hr&&h2&其它&/h2&&p&其实，我现在最想做的功能是手机拍照了之后就能识别，就像全能扫描王那样的，不需要专门扫描仪。这样会大大方便一些没法购买ADF扫描仪的老师。&/p&&p&但是手机拍照最大的问题是成像质量不稳定。可能会由于光照的原因导致现有的二值化算法不适用，同时在不同情况下会有形变和畸变，形变尚好解决，只需要一个坐标变换，但是畸变就难了。我有一些初步的想法，基于网格变换搞一个估价函数然后做梯度下降来寻找最优变换，但是这个工作量比较大也不知道效果如何，感觉这应该是一个很有趣的问题。&/p&
背景我的爸爸妈妈都是一个西南小城的大学老师。自从有记忆的时候开始，每次到他们期末考试的时候，他们就要花上好几天的时间改卷。最近几年，步入中年的他们开始老花了，改卷越来越费力，特别是我妈妈本身就高度近视，所以有时候得让学生帮忙。但是每张试卷…
二十岁最容易的是迷茫。&br&&br&如果想努力，有所成就。那么，不要做十成的努力，更不要做十二成，而是八成。&br&&br&年轻人容易气血上涌，发愤图强，苦字帖额头上，十成功力出去，多半半途而废。三天打鱼两天晒网，然后又突然气血上涌。又来一阵子十成功力。反复循环。&br&&br&最后平均一下，也就三四成的功力。&br&&br&如果能用八成功力坚持下来，那么你比七八成的人都要厉害了。&br&&br&剩下两成功力。用来偷懒，用来开小差，用来胡思乱想，也可以用来东张西望，反思反思。偷懒可以保证自己的功力不耗尽，东张西望，反思可以找到更好的路径，办法。&br&&br&JP 摩根，美国历史上最伟大的企业家之一，说，我能用九个月时间来完成工作，而不能用十二个月。&br&&br&工作，学习都一样。恋爱也是，八成去恋爱，两成也望望其他异性，保持些异性朋友。十成太满，十二成就变成浓的化不开。死去活来，像电视剧那样整天哭哭啼啼，不是雨夜狂奔就是上吊跳海。失去了爱的本意。&br&&br&做好人。做八成好人。不要十成，十成好人总是在心里嘀咕。妈的老子付出这么多，你们怎么这么对我。更不要做十二成好人，十二成好人是窝囊废。八成好人，两成任性。&br&&br&什么哈佛图书馆半夜都是人。什么nba球星的凌晨四点半。。。。都告诉你要花十二成甚至二十成功力。这是把年轻人三天打鱼两天晒网的循环更加加重了。半夜不睡觉还在图书馆学习。那不就是第二天睡的昏天暗地，或者长期睡眠不足记忆力下降。&br&&br&nba巨星，哈佛高材生。不是靠十成十二成功力去做到。是靠“命”。努力的年轻人何其多，马云就那一个。主要影响因素是“命”，这是有科学研究依据（科学研究的不是命，是随机概率）的。&br&&br&能做到八成功力，细水长流。坚持不懈。那就是做到了人群中的中上层。&br&&br&上面是做到了第一层。第二层。是热爱。&br&&br&热爱正在做的事，去做热爱的事。热爱就是享受。做到享受，就不在乎是八成。还是十成，还是十二层了。加班到了半夜。感受到的不是我真辛苦啊，工作真不容易啊。我这么努力，老板怎么还不加薪，怎么升职的还不是我啊。怎么我就拉不到投资啊……不会想去在朋友圈晒苦，不会想到怎么让老板看到自己多辛苦。&br&&br&而是我真他妈爽啊。真他妈过瘾啊。&br&&br&享受学习，就是看了半天的书，不觉得天都黑了，写的真牛逼啊，还能这么写啊。逻辑真清晰啊，豁然开朗啊。。。而不是闷头按着自己啃完了，想着考试能不能过啊，为什么别人都不看书成绩那么好啊……&br&&br&别听鸡汤误导，享受学习不一定就能拿状元，享受工作也不一定能成为职场精英。只是你不在乎这些了。过程已经足够享受。&br&&br&总结一下，二十岁的年轻人。为需要做的事做八成的坚持不懈的功力。能做到就很了不起。然后去靠近自己热爱的事，寻找正在做的事当中能够热爱的点，享受其中，能做到那就牛逼顶天了。
二十岁最容易的是迷茫。如果想努力，有所成就。那么，不要做十成的努力，更不要做十二成，而是八成。年轻人容易气血上涌，发愤图强，苦字帖额头上，十成功力出去，多半半途而废。三天打鱼两天晒网，然后又突然气血上涌。又来一阵子十成功力。反复循环。 …
这个问题我曾经在另一个类似的题目下回答过，有4100赞，既然有人邀请，我就复制粘贴过来。&br&&br&原文：&br&&figure&&img data-rawheight=&530& src=&https://pic1.zhimg.com/v2-f348d21bc8ca4ac2caa0e90eab3c2c6c_b.jpg& data-rawwidth=&400& class=&content_image& width=&400&&&/figure&&br&&br&1.&br&坚持+重复&br&&br&大一时，微博刚兴起，我们都有做微博的想法，但是因为自己的懒惰根本没有坚持下去。&br&我记得有个微博类似名字是帅哥美女排行榜，每天固定发几张帅哥美女的图片，复制性极强，我眼睁睁的看着他从几百粉丝到现在上百万粉丝，如果当时我有坚持下去，可能也能享受到微博的红利了。&br&这么多年，我唯一坚持的一样东西就是健身，刚好也是大一开始健身，这是我这5年来最大的骄傲。今天起，我在做公众号，希望下一个五年最大的骄傲是公众号。&br&希望大家能够坚持，重复的做一件事情，成为还领域的专家。&br&&figure&&img data-rawheight=&1490& src=&https://pic4.zhimg.com/v2-e8eca010dc9bb_b.jpg& data-rawwidth=&1336& class=&origin_image zh-lightbox-thumb& width=&1336& data-original=&https://pic4.zhimg.com/v2-e8eca010dc9bb_r.jpg&&&/figure&&figure&&img data-rawheight=&480& src=&https://pic2.zhimg.com/v2-d44ea2bcc8e9cdf230275_b.jpg& data-rawwidth=&640& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic2.zhimg.com/v2-d44ea2bcc8e9cdf230275_r.jpg&&&/figure&&figure&&img data-rawheight=&367& src=&https://pic1.zhimg.com/v2-aabf0ca0_b.jpg& data-rawwidth=&490& class=&origin_image zh-lightbox-thumb& width=&490& data-original=&https://pic1.zhimg.com/v2-aabf0ca0_r.jpg&&&/figure&&br&2.&br&放下你的功利性，对什么感兴趣就去学&br&&br&身边很多人做某样事情功利性很强，认为其他东西都没用，这样只会把自己弄得很累，对什么感兴趣想学什么就去学吧&br&你所有的努力都会在未来的某一天帮助到你&br&&br&&br&3.&br&方向永远比努力更重要&br&&br&不要沉迷于各种社交各种交际，方向永远比努力更重要。有个同学，大二是部长大三是学生会主席，大学时基本不在宿舍，每天都是各种交际各种应酬。现在他在做保险，以前玩的好的那一群人没有一个跟他买的。&br&与其将时间花在无意义的交际，不如充实自己。只有自己强大了，才可以认识更强大的人&br&&br&&br&4.&br&学会思考，学会倾听，学会辨别&br&&br&聚会中愿意倾听的人永远比一直在说的人更受欢迎，学会倾听并引诱对方继续讲下去，这是很受用的技能&br&&br&&br&5.&br&明确自己想要什么&br&&br&公众号里经常有朋友询问我不知道未来想做什么，很迷茫，我的建议是先确定你想从事的行业，然后百度这个职位所需要的技能，再去努力学习这些技能，有目标了自然就不颓废了。&br&我大学基本上都是在迷茫中度过，完全不知道自己想要什么，是在大三的时候才确定去考银行，当时却发现自己的四级没过，网申了十几家只有三家通知我去面试。虽然最后通过了，但是如果我早点确定银行这个目标，早点考过四级，可能就会有更好的选择。&br&人生最大的遗憾是有些东西明明能做到却因为自己的懒惰而没做。&br&&br&&br&6.&br&如果你在读大学，多点去旅游&br&&br&毕业前，我一个同学4月份就找到工作，7月份才上班，我一直建议他去旅游，他说没钱。我说你先借着，工作几个月就能还清了，但是他不敢。&br&现在，他一个月工资上万，每次见面都对我说后悔没有好好利用大学最后的空闲时间去玩。&br&人生最有空的就是大学时光，多去几个地方走走，你会感触良多。&br&对我自己而言，旅游是个跟同龄人打开话题的最好方式，如果对方去过的地方你也去过，那么接下来就很好聊了，不过前提是你去过的地方足够多。&br&&figure&&img data-rawheight=&1280& src=&https://pic1.zhimg.com/v2-77ede1e337ba49a71dd67f7ed5d73e9c_b.jpg& data-rawwidth=&720& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&https://pic1.zhimg.com/v2-77ede1e337ba49a71dd67f7ed5d73e9c_r.jpg&&&/figure&&br&&br&7.&br&少刷朋友圈少刷微博&br&&br&仔细想一想，朋友圈和微博在一天中耗费了你多少时间，你又从中学习到了什么？特别是微博，除了广告/段子/八卦之外真的很难学习到东西。&br&我的建议是朋友圈屏蔽大多数负能量的朋友，微博只关注几个真正能学到东西的微博号，知乎也是，虽然知乎很多干货，但是也有很多段子。关注一些干货写手，就够了&br&&br&8.&br&不要好高骛远，从低处做起&br&&br&上年王健林的“赚他一个亿”火遍网路，但是，如果你连1000块甚至连100块都还没有赚到，又有什么资格去赚取更多的钱呢？&br&很多目标，我们应该从低处开始计划，如果你想赚钱，就从小钱开始，边做边思考，边做边调整，一下子就给自己太大的压力，这样不切实际，也容易放弃&br&&br&9.&br&follow your heart！并告诉自己不要后悔&br&&br&很喜欢一句话，自己选择的路，跪着也要走完。每个人都有自己的选择，坚持自己所选择的，随心而走，这样，你将会走的更远。&br&我高考选专业的时候父母亲戚一直怂恿我选土木工程，因为我姐夫的父亲在某国企当高层，学这个专业毕业后应该可以直接进去。但是我坚持了自己内心的想法，选了市场营销专业。也很庆幸自己选了这个专业。&br&毕业前，我选择了银行这个行业，并努力研究笔试面试技巧考了进来，虽然我现在很后悔来了这个行业，感觉不适合自己，但是从来不会责怪任何人，因为这是我自己选择的路。&br&后来，通过知乎接触到了自媒体，每天晚上至少花两个小时在知乎与公众号上，这仍然是我自己的选择，就算没有成功，我也不会去怪任何人。&br&同样的，你可以听从别人的意见，但是请先告诉自己：这是自己选择的，未来不要后悔。&br&&br&&figure&&img data-rawheight=&1404& src=&https://pic1.zhimg.com/v2-6c1beec5c22aee2e992ca64_b.jpg& data-rawwidth=&440& class=&origin_image zh-lightbox-thumb& width=&440& data-original=&https://pic1.zhimg.com/v2-6c1beec5c22aee2e992ca64_r.jpg&&&/figure&&br&&br&10.&br&不要学习抽烟，喝酒&br&&br&这个真的是血的教训，有很多男生觉得喝酒抽烟很帅，我当年也是有这样的想法，沦落到现在一天一包烟，戒了多次都戒不了。特别是抽烟，如果你现在不会，真的不要去尝试第一根，有了第一根就会有第二根了！&br&&br&11.&br&控制自己的欲望&br&&br&还记得“裸贷”事件吗，不知道的可以去百度。别以为别人是傻子，到最后你会发现自己最傻&br&&br&12.&br&让自己做一个有趣的人&br&&br&不写鸡汤，给个干货，偶尔去看看网易轻松一刻专栏和暴走大事件，有些搞笑的段子背下来，偶尔拿出来说下，大家都会觉得你是个幽默的人。&br&&br&&figure&&img data-rawheight=&446& src=&https://pic3.zhimg.com/v2-adaa4b774bab09c209e4fe_b.jpg& data-rawwidth=&450& class=&origin_image zh-lightbox-thumb& width=&450& data-original=&https://pic3.zhimg.com/v2-adaa4b774bab09c209e4fe_r.jpg&&&/figure&&br&13.&br&珍惜现在的生活，别抱怨&br&&br&似乎我们总是很容易忽略当下的生活，忽略许多美好的时光。而当所有的时光在被辜负被浪费后，才能从记忆里将某一段拎出，拍拍上面沉积的灰尘，感叹它是最好的。——钱钟书&br&&br&14.&br&开始有意识的培养你的执行力&br&&br&我们远远达不到拼智商的地步，每天晚上主动学习一小时，已经可以超过大部分人了&br&&br&15.保持身材&br&&br&说实话，我认识的男生中，70%大学或工作几年后都增重20斤以上，有意识的保持你的身材，到了真的胖了，就瘦不下来了！&br&&br&&br&ps：有不是朋友说里面挺矛盾的，我的初衷是并不是所以得建议都要去做，而是要选择，你无趣就可以去尝试背背段子，你无聊就可以尝试什么都学，并不是说每一条都适合任意一个人的，每个人的情况不同，所以写起来肯定会有矛盾&br&&br&&br&在知乎这种非盈利平台，大部分人都是为赞而来。如果觉得这篇文章您有所启发，希望你能点个赞哈&br&&br&感谢阅读&br&&br&&br&关于转载&br&在这个盗版丛生的年代，原创根本不值钱，维权骑士如同虚设，我多次在其他平台发表原创文章却被告知“抄袭”而被退回，这是一个原创写手的悲哀，也是这个社会的悲哀。&br&&br&关于转载，我只有两点要求：&br&1.文章开头写上：该文章转载于原创公众号「毕业不等于失业」，ID：bybdysy&br&2.文章结尾能放上我的公众号二维码&br&&br&这两点要求很简单，希望大家能做个有良知，有道德底线的人，感谢大家。&br&&br&&br&安利一下公众号，这是一个所以大学生都会关注的公众号，有简历/面试/笔试等众多干货，你确定不关注吗？可能关注后能找到更好的工作哦&br&&p&&a href=&//link.zhihu.com/?target=http%3A//weixin.qq.com/r/NUh3b_TExLm7raAM9x0n& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&weixin.qq.com/r/NUh3b_T&/span&&span class=&invisible&&ExLm7raAM9x0n&/span&&span class=&ellipsis&&&/span&&/a& (二维码自动识别)&/p&
这个问题我曾经在另一个类似的题目下回答过，有4100赞，既然有人邀请，我就复制粘贴过来。原文： 1. 坚持+重复大一时，微博刚兴起，我们都有做微博的想法，但是因为自己的懒惰根本没有坚持下去。我记得有个微博类似名字是帅哥美女排行榜，每天固定发几张…
&figure&&img src=&https://pic1.zhimg.com/v2-dee4c90c316bf3a166ab3_b.jpg& data-rawwidth=&2016& data-rawheight=&1146& class=&origin_image zh-lightbox-thumb& width=&2016& data-original=&https://pic1.zhimg.com/v2-dee4c90c316bf3a166ab3_r.jpg&&&/figure&&p&&i&本文共9876字，阅读约需14分钟。&/i&&/p&&p&&br&&/p&&p&近期在公司内部做了一个关于人工智能/深度学习相关的主题分享讲座，为了准备这个演讲，我花了100个小时左右，接下来就把精心准备的内容分享给大家。&/p&&p&有一个好消息是，考虑文章比较长和文字本身表达的局限性，同时为了解答大家的疑问，我近期会&b&完全免费&/b&开一个视频直播，具体内容如下。 &/p&&p&1. 深度学习入门到晋级&/p&&p&2. 深度学习模型解析和代码实现展示&/p&&p&3. 答疑环节&/p&&p&-------------分割线---------------&/p&&p&&b&视频直播已经结束，获取录播视频方式如下：&/b&&/p&&p&&b&关注公众号“聊聊汽车那些事儿”，后台回复“人工智能视频直播”，即可获得视频链接~&/b&&/p&&p&&br&&/p&&p&-------------分割线---------------&/p&&p&好，内容正式开始。&/p&&p&一提到人工智能和深度学习，很多人觉得比较难，其实那只是因为没有遇到能够讲的清楚的人而已。&/p&&p&很多人喜欢把简单的事情说得玄乎，以显示自己很厉害，但其实真正厉害的人，是能够把复杂的事情讲解的很深入浅出、通俗易懂的，这也是我一直努力的方向。&/p&&p&看这篇文章的读者，估计大多数可能之前没有深入了解过深度学习，这么说来，我有幸成为各位在深度学习方面的启蒙老师了（笑）。&/p&&p&分享的内容分四部分，分别是&b&入门、基础、进阶和发展趋势&/b&。&/p&&p&&br&&/p&&h2&&b&深度学习简单入门&/b&&/h2&&p&2016年3月份，AlphaGo以4：1战胜韩国围棋手李世石，一举震惊了世界。&/p&&p&人工智能一下就引爆了整个世界。有种趋势就是，不谈人工智能，就落伍了。&/p&&p&以前资本圈融资都谈的是“互联网+”，现在都在谈“AI+”了。 &/p&&p&有人说，马上人工智能时代就要来了，甚至有人宣扬人工智能威胁论。&/p&&p&那么，当我们谈论人工智能的时候，我们究竟在谈论什么呢？&/p&&figure&&img src=&https://pic1.zhimg.com/v2-9e189bc1d61d604a7117bce1d5b43c74_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1419& data-rawheight=&958& class=&origin_image zh-lightbox-thumb& width=&1419& data-original=&https://pic1.zhimg.com/v2-9e189bc1d61d604a7117bce1d5b43c74_r.jpg&&&/figure&&p&我们先来讨论下“人工智能”的定义。&/p&&p&什么叫做智能呢？所谓智能，其实就是对人某些高级功能的模拟，让计算机去完成一些以前只有人才能完成的工作，比如思考、决策、解决问题等等。&/p&&p&比如以前只有人可以进行数学计算，而现在计算机也可以进行计算，而且算的比人还准，还快，我们说计算机有一点智能了。&/p&&p&人工智能的发展经历了好几个发展阶段，从最开始的简单的逻辑推理，到中期的基于规则（Rule-based）的专家系统，这些都已经有一定的的智能了，但距离我们想象的人工智能还有一大段距离。直到机器学习诞生以后，人工智能界感觉终于找到了感觉。基于机器学习的图像识别和语音识别在某些垂直领域达到了跟人相媲美的程度。人工智能终于能够达到一定的高度了。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-f8e4e1e3a5b006abfea67f_b.jpg& data-caption=&& data-size=&small& data-rawwidth=&989& data-rawheight=&989& class=&origin_image zh-lightbox-thumb& width=&989& data-original=&https://pic3.zhimg.com/v2-f8e4e1e3a5b006abfea67f_r.jpg&&&/figure&&p&当前机器学习的应用场景非常普遍，比如图像识别、语音识别，中英文翻译，数据挖掘等，未来也会慢慢融入到各行各业。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-c94c89c39ae3727cac1f6c_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&993& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic4.zhimg.com/v2-c94c89c39ae3727cac1f6c_r.jpg&&&/figure&&p&虽然都是机器学习，但是背后的训练方法和模型是完全不同的。&/p&&p&根据训练的方法不同，机器学习算法可以大致分类为&b&监督学习、无监督学习&/b&和&b&强化学习&/b&三种。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-29503cd3adfde9d7e267e_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1727& data-rawheight=&638& class=&origin_image zh-lightbox-thumb& width=&1727& data-original=&https://pic3.zhimg.com/v2-29503cd3adfde9d7e267e_r.jpg&&&/figure&&p&监督学习，就是训练数据是有标签的，也就是每个数据都是标注过的，是有正确答案的。训练的时候会告诉模型什么是对的，什么的错的，然后找到输入和输出之间正确的映射关系，比如物体种类的图像识别，识别一张图片内容是只狗，还是棵树。&/p&&p&非监督学习，就是训练数据没有标签的，只有部分特征。模型自己分析数据的特征，找到数据别后隐含的架构关系，比如说自己对数据进行学习分类等等，常见的算法有聚类算法，给你一堆数据，将这数据分为几类。比如在银行的数据库中，给你所有客户的消费记录，让你挑选出哪些可以升级成VIP客户，这就是聚类算法。&/p&&p&还有一种是强化学习，目标是建立环境到行为之间的最佳映射。强化学习的训练是不需要数据的，你告诉他规则或者给他明确一个环境，让模型自己通过不断地尝试，自己根据结果来自己摸索。&/p&&p&Deep Mind的AlphaGo Zero就是通过强化学习训练的,号称花了3天的训练时间就能100：0打败AlphaGo。&/p&&p&比较适合强化学习的一般是环境到行为之间的结果规则比较明确，或者环境比较单一、不太容易受噪音干扰等等，比如下围棋的输赢等等，还可以模拟直升机起降、双足机器人行走等等。&/p&&p&&b&我们今天讨论的就是基于监督学习在图像识别领域的应用。&/b&&/p&&p&&br&&/p&&p&接下来我们再看下人工智能的历史。&/p&&p&虽说我们感觉人工智能最近几年才开始火起来，但是这个概念一点也不新鲜。&/p&&p&起源于上世纪五、六十年代就提出人工智能的概念了，当时叫&b&感知机&/b&（perceptron），拥有输入层、输出层和一个隐含层。输入的特征向量通过隐含层变换达到输出层，在输出层得到分类结果，当时的人们对此非常乐观，号称要在10年内解决所有的问题。但是，单层感知机有一个严重得不能再严重的问题，即它对稍复杂一些的函数都无能为力（比如最为典型的“异或”逻辑），连异或都不能拟合。当时有一个专家叫明斯基，号称人工智能之父，在一次行业大会上公开承认，人工智能连一些基本的逻辑运算（比如异或运算）都无能为力，于是政府所有的资助全部都停掉了，于是进入人工智能的第一个冬天。&/p&&p&随着数学的发展，这个缺点直到上世纪八十年代才发明了&b&多层感知机&/b&克服，同时也提出了梯度下降、误差反向传播（BP）算法等当前深度学习中非常基础的算法。之前被人诟病的问题已经被解决了，希望的小火苗又重新点燃了，于是人工智能开始再次兴起。&/p&&p&但是没过多久大家发现了，虽然理论模型是完善了，但是并没有实际用途，还不能解决实际问题，于是又冷下去了，人工智能的第二个冬天降临。&/p&&p&直到2012年开始第三次兴起，也就是最近几年人工智能的热潮。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-e4ec4ed18a9da_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&939& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic3.zhimg.com/v2-e4ec4ed18a9da_r.jpg&&&/figure&&p&下面我们就来第三次热潮是如何兴起的。&/p&&p&在这之前，我们先介绍一个比赛。这个比赛是一项图像识别的挑战赛，给你大量图片去做图像识别，比赛看谁的识别错误低。在2012年之前，错误率降低到30%以后，再往下降就很难了，每年只能下降个2，3个百分点。&/p&&p&直到2012年，有一个哥们叫Alex，这哥们在寝室用GPU死磕了一个卷积神经网络的模型，将识别错误率从26%下降到了16%，下降了10%左右，一举震惊了整个人工智能界，当之无愧的获得了当年的冠军。&/p&&p&从此之后，卷积神经网络一炮而红。之后每年挑战赛的冠军，胜者都是利用卷积神经网络来训练的。2015年，挑战赛的错误率已经降低到3.5%附近，而在同样的图像识别的任务，人眼的辨识错误率大概在5.1%，也就是目前的深度学习模型的识别能力已经超过了人眼。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-db4b45bce30cd6a4ada61_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1155& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic1.zhimg.com/v2-db4b45bce30cd6a4ada61_r.jpg&&&/figure&&p&下图是最近几年比较有代表性的模型的架构。&/p&&p&大家可以看出来，深度学习的模型的发展规律，深，更深。没有最深，只有更深。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-6cf5ba224ea4ba_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1242& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic4.zhimg.com/v2-6cf5ba224ea4ba_r.jpg&&&/figure&&p&那么Alex的卷积神经网络这么厉害，是因为这个哥们是个学术大牛，有什么独创性的学术研究成果么？&/p&&p&其实并不是。&/p&&p&他所采用的模型是1998年Yann Lecun就提出了这个模型，当时Yann Lecun把这个模型应用在识别手写邮编数字的识别上，取得了很好的效果，他搭建的网络，命名为Lenet。这个人的名字——Yann Lecun，大家一定要记住，因为我们后面的内容将会以Lenet作为范本来讲解。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-d2ad5dfccd838b80eb417_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&534& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic4.zhimg.com/v2-d2ad5dfccd838b80eb417_r.jpg&&&/figure&&p&这个模型是1998年提出来的，可为什么时隔这么多年才开始火起来呢？&/p&&p&人工智能突然爆发背后深层次的原因是什么？我总结了一下，背后的原因主要有三个：&/p&&figure&&img src=&https://pic2.zhimg.com/v2-7a993ea464fa612de7af_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&476& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic2.zhimg.com/v2-7a993ea464fa612de7af_r.jpg&&&/figure&&p&1.算法的成熟，尤其是随机梯度下降的方法的优化，以及一些能够有效防止过拟合的算法的提出，至于什么是随机梯度下降和过拟合，后面我们会详细讲到&/p&&p&2.数据获取，互联网的爆发，尤其是移动互联网和社交网络的普及，可以比较容易的获取大量的互联网资源，尤其是图片和视频资源，因为做深度学习训练的时候需要大量的数据。&/p&&p&3.计算能力的提升，因为要训练的数据量很大（都是百万级以上的数据），而且训练的参数也很大（有的比较深的模型有几百万甚至上千万个的参数需要同时优化），而多亏了摩尔定律，能够以较低的价格获取强大的运算能力，也多亏了Nvida，开发了GPU这个神器，可以大幅降低训练时间。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-f218a41d127071ddc51f1ea_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&677& data-rawheight=&380& class=&origin_image zh-lightbox-thumb& width=&677& data-original=&https://pic4.zhimg.com/v2-f218a41d127071ddc51f1ea_r.jpg&&&/figure&&p&GPU的运算速度是CPU的5-10倍左右，同样的模型需要训练，如果用CPU训练需要一个礼拜的话，那使用GPU，只需要一天时间就可以了。&/p&&p&&i&截止到目前，我们汇总下我们的学习内容，我们了解了人工智能的简单介绍，大致了解了人工智能的算法分类以及发展历史。&/i&&/p&&p&&br&&/p&&h2&&b&深度学习基础知识&/b&&/h2&&p&接下来我们了解一下基础知识。&/p&&p&我们上面也提到了，我们这次主要以卷积神经网络在图像识别领域的应用来介绍深度学习的。&/p&&p&卷积神经网络，这个词听起来非常深奥。&/p&&p&但其实没什么复杂的，我们可以分开成两个词来理解，卷积和神经网络。&/p&&p&先看下卷积。&/p&&p&卷积时数学的定义，在数学里是有明确的公式定义的。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-cfce3aa9c184d67212a33bda4e1201d6_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&330& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic4.zhimg.com/v2-cfce3aa9c184d67212a33bda4e1201d6_r.jpg&&&/figure&&p&是不是觉得公式太抽象，看不明白？没关系，我们举个栗子就明白了。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-ded079e99535_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&291& data-rawheight=&290& data-thumbnail=&https://pic3.zhimg.com/v2-ded079e99535_b.jpg& class=&content_image& width=&291&&&/figure&&p&还是以图像识别为例，我们看到的图像其实是由一个个像素点构成的。&/p&&p&一般彩色图像的是RGB格式的，也就是每个像素点的颜色，都是有RGB（红绿蓝三原色混合而成的），是三个值综合的表现。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-27b835158bff6d44c6e7_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1701& data-rawheight=&910& class=&origin_image zh-lightbox-thumb& width=&1701& data-original=&https://pic2.zhimg.com/v2-27b835158bff6d44c6e7_r.jpg&&&/figure&&p&假设f函数为5x5（对应到图片上即为5x5像素）为例，h函数为3x3的函数，大家可以理解为为一个手电筒（也就是筛选器），依次扫过这个5x5的区间。在照过一个区域，就像对应区域里的值就和框里的数据去做运算。最终输出为我们的输出图。&/p&&p&手电筒本身是一个函数，在3x3的区域内，他在每个位置都有参数，它的参数和对应到图片上相应位置的数字，先相乘，然后再把相乘的数字相加的结果输出，依次按照这些去把整个图片全部筛选一遍，就是我们所说的卷积运算了。&/p&&p&还是比较抽象，没关系，看下面这个图片就清楚了。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-f9dabe62c1e5c63e418f1_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&487& data-rawheight=&168& data-thumbnail=&https://pic4.zhimg.com/v2-f9dabe62c1e5c63e418f1_b.jpg& class=&origin_image zh-lightbox-thumb& width=&487& data-original=&https://pic4.zhimg.com/v2-f9dabe62c1e5c63e418f1_r.gif&&&/figure&&p&那我们为什么要做卷积呢？我们其实就是建立一个输入和输出的函数，图像识别的目的就是把输入的信息（像素点信息）对应到我们输出结果（识别类别）上去，所以是逐层提取有用特征，去除无用信息的过程。&/p&&p&比如下图所示，第一层可以识别一些边缘信息，后面逐层抽象，汇总到最后，就可以输出我们想要的结果，也就是我们的识别结果。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-9cce8e646bf9dcfaff268_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&610& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic4.zhimg.com/v2-9cce8e646bf9dcfaff268_r.jpg&&&/figure&&p&虽然我们知道特征是逐层抽象提取的，但是不幸的是，我们并不知道那一层是具体做什么的，也就不知道那个层数具体是什么意思。&/p&&p&也就是说，其实深度学习网络对于我们而言，是个黑盒子，我们只能通过他的输出来判断其好坏，而不能直接去调整某个参数。&/p&&p&那么，什么是神经网络呢？其实这个模型来自于心理学和神经学，人工智能的专家借鉴了这个结构。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-66ee3dfbd_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&417& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic3.zhimg.com/v2-66ee3dfbd_r.jpg&&&/figure&&p&左侧为神经元，神经元接收外界的输入刺激或者其他神经元的传递过来的信号，经过处理，传递给外界或者给其他神经元。&/p&&p&右侧为我们根据神经元的生物学特征抽象出来的数学模型，其中x是输入，包括一开始数据来源（外部刺激）的输入，也包括其他节点（神经元）的输入。&/p&&p&w为参数（weight），每个节点还有一个b，这个b其实是一个偏置。&/p&&p&&b&大家在学习新东西的时候，凡事多问个为什么？只有知道背后的原因了，这样你才能理解的更深刻。有句话说得好，还有什么比带着问题学习更有效率的学习方法呢?&/b&&/p&&p&为什么要加这个b呢？大家想想看，如果没有b的话，当输入x为0的时候，输出全部为0，这是我们不想看到的。所以要加上这个b，引入更多的参数，带来更大的优化空间。&/p&&p&大家看一下，目前为止，这个神经元里的函数（对输入信号的处理）都还是线性的，也就是说输出与输入是线性相关的，但是根据神经元的生物学研究，发现其接受到的刺激与输入并不是线性相关的，也为了能够表征一些非线性函数，所以必须要再引入一个函数，也就是下面我们要讲的激活函数（activation function）。&/p&&p&为什么需要激活函数？因为需要引入一些非线性的特性在里面。&/p&&p&常见的激活函数有这些。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-f502b37edab36eac2e24e81_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&784& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic2.zhimg.com/v2-f502b37edab36eac2e24e81_r.jpg&&&/figure&&p&以前是sigmoid比较常见，但是现在ReLU用的比较多一些。&/p&&p&就类似于下图这样，在节点经过线性运算后，经过非线性的ReLU,然后进入下一层的下一个节点。中间的w和b，就是我们卷积神经网络的参数，也是我们模型中需要训练的对象。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-fcb230d603e_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&729& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic1.zhimg.com/v2-fcb230d603e_r.jpg&&&/figure&&p&大家看LeNet模型中，就是在输入数据多次进行卷积神经网络的处理。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-0a5c0f92bef5ea3d0b902cf_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&660& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic3.zhimg.com/v2-0a5c0f92bef5ea3d0b902cf_r.jpg&&&/figure&&p&对于模型而已，我们习惯把输入的数据叫做输入层，中间的网络叫做隐藏层，输出的结果叫做输出层。中间层数越多，模型越复杂，所需要训练的参数也就越多。&/p&&p&所谓的deep learning中的deep，指的就是中间层的层数，右图中GoogLenet有22层。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-7f90a17fdc71dd2ae810bcb91b1bade0_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&665& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic2.zhimg.com/v2-7f90a17fdc71dd2ae810bcb91b1bade0_r.jpg&&&/figure&&p&一般说来，模型越复杂，所能实现的功能也越强大，所能达到的精度也越高，目前最深的模型大概有10的7次方个神经元，其神经元比相对原始的脊椎动物如青蛙的神经系统还要小。&br&自从引入隐藏单元，人工神经网络的大小大约每 2.4 年翻一倍，按照现在的发展速度，大概要到2050年左右才能达到人类大脑的神经元数量的规模。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-6d9cd8c77e93_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&826& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic1.zhimg.com/v2-6d9cd8c77e93_r.jpg&&&/figure&&h2&损失函数&/h2&&p&怎么判断一个模型训练的好坏呢？我们需要一个评价指标（也就是KPI考核指标），也就是损失函数。&/p&&p&习大大教导我们不忘初心，那我们最初的目标是什么？是建立输入输出的映射关系。&/p&&p&比如我们的目标是判断一张图片上是只猫，还是一棵树。那这张图片上所有的像素点就是输入，而判断结果就是输出。&/p&&p&那怎么表征这个模型的好坏呢？很简单，大家应该很容易想到，就是把模型输出的答案和正确答案做一下比对，看一下相差多少。&/p&&p&我们一般用下面这个公式（平均平方误差，即MSE）来评估我们的模型好坏。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-8c1ebbf4a1b3_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1606& data-rawheight=&222& class=&origin_image zh-lightbox-thumb& width=&1606& data-original=&https://pic3.zhimg.com/v2-8c1ebbf4a1b3_r.jpg&&&/figure&&p&我们就是通过对比输出结果与预期结果的差异，其中带帽子的yu就是预期的结果（也就是标签值，即是真值），而前面的不带帽子的yu就是实际的输出结果。当训练结果非常好的时候，比如说是全对的时候，平均误差就是0。当训练结果非常差的时候，比如说全错的时候，误差即为1.&/p&&p&于是我们知道了，这个E越小越好，最好变成0.&/p&&p&大家注意下，这个求和的标识，表示是所有的数据的和，而不是一个的数值。我们常说大数据来训练模型，其实这就是大数据。我们训练的时候需要上百万张的图片，最终得出来的误差，就是这里，然后再除以数量，取平均值。&/p&&p&那怎么去降低这个误差呢？要回答这个问题，就涉及到卷积神经网络的核心思想了，也就是反向传播。&/p&&h2&反向传播/梯度下降&/h2&&p&既然讲到机器学习，那当然是让机器自己去通过数据去学习，那机器是如何进行自学习的呢？下面就要敲黑板，划重点了，因为这就是深度学习的重中之重了，也就是机器学习的核心了，理解了这个概念，基本上就理解了一多半了。&/p&&p&这个概念就是反向传播。听名字比较玄乎，其实这个概念大家在高等数学里都接触过这个概念了——梯度，其实也就是求导。&/p&&p&对于一维函数而言，函数梯度下降的方向就是导数的反方向。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-1c18ff5e9f43_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&606& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic4.zhimg.com/v2-1c18ff5e9f43_r.jpg&&&/figure&&p&对于二维函数而言，就是把误差对每个变量求偏导，偏导的反方向即为梯度下降的方向。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-5c5920ccd21c6ba36bbe6_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&626& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic2.zhimg.com/v2-5c5920ccd21c6ba36bbe6_r.jpg&&&/figure&&p&说起来有点抽象，我们举个实例来说明一下。&/p&&p&下面是我们的参数和损失函数的值。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-ec9bf81ff2c_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&888& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic2.zhimg.com/v2-ec9bf81ff2c_r.jpg&&&/figure&&p&我们先对第一个参数加一个极小值，算出新的损失函数。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-73d4438aef9dcfd91d28233a_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&901& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic1.zhimg.com/v2-73d4438aef9dcfd91d28233a_r.jpg&&&/figure&&p&然后用损失函数的变化去除这个极小值，就是这个参数的梯度了。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-afcd56df9bc0_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&893& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic3.zhimg.com/v2-afcd56df9bc0_r.jpg&&&/figure&&p&同样我们可以使用同样的方法去求得其他参数的梯度。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-a0d47ad39247a3aaee6a99_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&883& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic4.zhimg.com/v2-a0d47ad39247a3aaee6a99_r.jpg&&&/figure&&figure&&img src=&https://pic1.zhimg.com/v2-a0f3ae13ff9ca049c4a14f_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&868& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic1.zhimg.com/v2-a0f3ae13ff9ca049c4a14f_r.jpg&&&/figure&&p&只要找到梯度下降的方向，按照方向去优化这些参数就好了。这个概念就是梯度下降。&/p&&p&但是我们知道，我们要训练的参数非常多，数据量也非常大，经常是百万、千万量级的，如果每次都把全部训练数据都重新计算一遍，计算损失函数，然后再反向传播，计算梯度，这样下去，模型的误差优化的非常非常慢。&/p&&p&那有没有更快的方法呢？&/p&&p&当然有了。&/p&&p&这些参数（weights），数量非常多，大概有上百万个，为了保证能够更好、更快的计算，节省算力，一般选用随机梯度下降方法，随机抽取一定数量（即为批量，batch）的样本，去计算梯度值，一般选择32/64/128。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-4e874cea17cdeaa41fdb7b942b6d21cf_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1729& data-rawheight=&736& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&https://pic4.zhimg.com/v2-4e874cea17cdeaa41fdb7b942b6d21cf_r.jpg&&&/figure&&p&这个方法就是随机梯度下降，这个批量（batch）这也是大家经常要调的参数。&/p&&p&我们可以这样理解随机梯度下降，其核心思想是，梯度是期望。期望可使用小规模的样本近似估计。具体而言，在算法的每一步，我们从训练集中均匀抽出小批量样本来代替全部数据的梯度，因为其梯度期望是一致的。&/p&&p&值得一提是：这些batch中的样本，必须是随机抽取的，否则其期望就准确了。选的批量（batch）的值越小，进行一次参数优化的计算量越小，就越快，但是其随机性会比较大一些，如果选取的批量值比较大，则计算会稍微慢一些，但是随机性会小一些，这是我们需要权衡的。&/p&&p&前向计算一次，反向反馈一下，更新一下参数，叫做一个Epoch.&/p&&p&Epoch的次数也是个超参数，也是需要搭建模型的时候可以调整的参数。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-e82e5cddaecfb9f6e63c08e_b.jp}

叫阿莫西中心