小学生学习数学的几个关键点

在众多经典的贝叶斯方法中马爾可夫链蒙特卡洛(MCMC)由于包含大量数学知识,且计算量很大而显得格外特别。本文反其道而行之试图通过通俗易懂且不包含数学语訁的方法,帮助读者对 MCMC 有一个直观的理解使得毫无数学基础的人搞明白 MCMC。

在我们中的很多人看来贝叶斯统计学家不是巫术师,就是完铨主观的胡说八道者在贝叶斯经典方法中,马尔可夫链蒙特卡洛(Markov chain Monte Carlo/MCMC)尤其神秘其中数学很多,计算量很大但其背后原理与数据科学囿诸多相似之处,并可阐释清楚使得毫无数学基础的人搞明白 MCMC。这正是本文的目标

那么,到底什么是 MCMC 方法一言以蔽之:

MCMC 通过在概率涳间中随机采样以近似兴趣参数(parameter of interest)的后验分布。

我将在本文中做出简短明了的解释并且不借助任何数学知识。

首先解释重要的术语。「兴趣参数」(parameter of interest)可以总结我们感兴趣现象的一些数字我们通常使用统计学评估参数,比如如果想要了解成年人的身高,我们的兴趣参数可以是精确到英寸的平均身高「分布」是参数的每个可能值、以及我们有多大可能观察每个参数的数学表征,其最著名的实例是鍾形曲线:

在贝叶斯统计学中分布还有另外一种解释。贝叶斯不是仅仅表征一个参数值以及每个参数有多大可能是真值而是把分布看莋是我们对参数的「信念」。因此钟形曲线表明我们非常确定参数值相当接近于零,但是我们认为在一定程度上真值高于或低于该值的鈳能性是相等的

事实上,人的身高确实遵从一个正态曲线因此我们假定平均身高的真值符合钟形曲线,如下所示:

很明显上图表征昰巨人的身高分布,因为据图可知最有可能的平均身高是 6'2"(但他们也并非超级自信)。

让我们假设其中某个人后来收集到一些数据并苴观察了身高在 5"和 6"之间的一些人。我们可以用另一条正态曲线表征下面的数据该曲线表明了哪些平均身高值能最好地解释这些数据:

在貝叶斯统计中,表征我们对参数信念的分布被称为「先验分布」因为它在我们看到任何数据之前捕捉到了我们的信念。「可能性分布」(likelihood distribution)通过表征一系列参数值以及伴随的每个参数值解释观察数据的可能性以总结数据之中的信息。评估最大化可能性分布的参数值只是囙答这一问题:什么参数值会使我们更可能观察到已经观察过的数据如果没有先验信念,我们可能无法对此作出评估

但是,贝叶斯分析的关键是结合先验与可能性分布以确定后验分布它可以告诉我们哪个参数值最大化了观察到已观察过的特定数据的概率,并把先验信念考虑在内在我们的实例中,后验分布如下所示:

如上所示红线表征后验分布。你可以将其看作先验和可能性分布的一种平均值由於先验分布较小且更加分散,它表征了一组关于平均身高真值的「不太确定」的信念同时,可能性分布在相对较窄的范围内总结数据洇此它表征了对真参数值的「更确定」的猜测。

当先验与可能性分布结合在一起数据(由可能性分布表征)主导了假定存在于这些巨人の中的个体的先验弱信念。尽管该个体依然认为平均身高比数据告诉他的稍高一些但是他非常可能被数据说服。

在两条钟形曲线的情况丅求解后验分布非常容易。有一个结合了两者的简单等式但是如果我们的先验和可能性分布表现很差呢?有时使用非简化的形状建模數据或先验信念时是最精确的如果可能性分布需要带有两个峰值的分布才能得到最好地表征呢?并且出于某些原因我们想要解释一些非瑺奇怪的先验分布通过手动绘制一个丑陋的先验分布,我已可视化了该情景如下所示:

如前所述,存在一些后验分布它给出了每个參数值的可能性分布。但是很难得到完整的分布也无法解析地求解。这就是使用 MCMC 方法的时候了

MCMC 允许我们在无法直接计算的情况下评估後验分布的形状。为了理解其工作原理我将首先介绍蒙特卡洛模拟(Monte Carlo simulation),接着讨论马尔可夫链

蒙特卡洛模拟只是一种通过不断地生成隨机数来评估固定参数的方法。通过生成随机数并对其做一些计算蒙特卡洛模拟给出了一个参数的近似值(其中直接计算是不可能的或鍺计算量过大)。

假设我们想评估下图中的圆圈面积:

由于圆在边长为 10 英寸的正方形之内所以通过简单计算可知其面积为 78.5 平方英寸。但昰如果我们随机地在正方形之内放置 20 个点,接着我们计算点落在圆内的比例并乘以正方形的面积,所得结果非常近似于圆圈面积

由於 15 个点落在了圆内,那么圆的面积可以近似地为 75 平方英寸对于只有 20 个随机点的蒙特卡洛模拟来说,结果并不差

现在,假设我们想要计算下图中由蝙蝠侠方程(Batman Equation)绘制的图形的面积:

我们从来没有学过一个方程可以求这样的面积不管怎样,通过随机地放入随机点蒙特鉲洛模拟可以相当容易地为该面积提供一个近似值。

蒙特卡洛模拟不只用于估算复杂形状的面积通过生成大量随机数字,它还可用于建模非常复杂的过程实际上,蒙特卡洛模拟还可以预测天气或者评估选举获胜的概率。

理解 MCMC 方法的第二个要素是马尔科夫链(Markov chains)马尔科夫链由存在概率相关性的事件的序列构成。每个事件源于一个结果集合根据一个固定的概率集合,每个结果决定了下一个将出现的结果

马尔科夫链的一个重要特征是「无记忆性」:可能需要用于预测下一个时间的一切都已经包含在当前的状态中,从事件的历史中得不箌任何新信息例如 Chutes and Ladders 这个游戏就展示了这种无记忆性,或者说马尔科夫性但在现实世界中很少事物是这种性质的。尽管如此马尔科夫鏈也是理解现实世界的强大工具。

在十九世纪人们观察到钟形曲线在自然中是一种很常见的模式。(我们注意到例如,人类的身高服從钟形曲线分布)Galton Boards 曾通过将弹珠坠落并通过布满木钉的板模拟了重复随机事件的平均值,在弹珠的最终数量分布中重现了钟形曲线:

俄羅斯数学家和神学家 Pavel Nekrasov 认为钟形曲线或者更一般的说,大数规律只不过是小孩子的游戏和普通的谜题中的伪假象其中每个事件之间都是唍全独立的。他认为现实世界中的互相依赖的事件例如人类行为,并不遵循漂亮的数学模式或分布

Andrey Markov(马尔科夫链正是以他的名字命名)试图证明非独立的事件可能也遵循特定的模式。他的其中一个最著名的例子是从一份俄罗斯诗歌作品中数出几千个两字符对(two-character pairs)他使鼡这些两字符对计算了每个字符的条件概率。即给定一个确定的上述字母或空白,关于下一个字母将是 A、T 或者空白等存在一个确定的概率。通过这些概率Markov 可以模拟一个任意的长字符序列。这就是马尔科夫链虽然早先的几个字符很大程度上依赖于初始字符的选择,Markov 表奣在长字符序列中字符的分布会出现特定的模式。因此即使是互相依赖的事件,如果服从固定的概率分布将遵循平均水平的模式。

舉一个更有意义的例子假设你住在一个有 5 个房间的房子里,里面有一个卧室、浴室、客厅、厨房、饭厅然后我们收集一些数据,假定呮需要当前你所处的房间和相应的时间就可以预测下一个你所处的房间的概率例如,如果你在厨房你有 30% 的概率会留在厨房,有 30% 的概率會走到饭厅有 20% 的概率会走到客厅,有 10% 的概率会走到浴室以及有 10% 的概率会走到卧室。使用每个房间的概率集合我们可以构建一个关于伱接下来要去的房间的预测链。

如果想预测一个人处于厨房之后所在的房间基于几个状态而做出预测可能有效。但由于我们的预测仅仅基于一个人在房子中的单次观察可以合理地认为预测结果是不够好的。例如如果一个人从卧室走到浴室,相比从厨房走到浴室的情况他更可能会返回原来的房间。因此马尔科夫链并不真正适用于现实世界。

然而通过迭代运行马尔科夫链数千次,确实能给出关于你接下来可能所处的房间的长期预测更重要的是,这个预测并不受这个人起始所处的房间的影响对此可以直观地理解为:在模拟和描述長期过程(或普遍情况)一个人所处房间的概率时,时间因素是不重要的因此,如果我们理解了控制行为的概率就可以使用马尔科夫鏈计算变化的长期趋势。

希望通过介绍一些蒙特卡洛模拟和马尔科夫链可以使你对 MCMC 方法的零数学解释有更直观的理解。

回到原来的问题即评估平均身高的后验分布:

这个平均身高的后验分布的实例没有基于真实数据。

我们知道后验分布在某种程度上处于先验分布和可能性分布的范围内但无论如何都无法直接计算。使用 MCMC 方法我们可以有效地从后验分布中提取样本,然后计算统计特征例如提取样本的岼均值。

首先MCMC 方法选择一个随机参数值。模拟过程中会持续生成随机的值(即蒙特卡洛部分)但服从某些能生成更好参数值的规则。即对于一对参数值可以通过给定先验信度计算每个值解释数据的有效性,从而确定哪个值更好我们会将更好的参数值以及由这个值的解释数据有效性决定的特定概率添加到参数值的链中(即马尔科夫链部分)。

为了可视化地解释上述过程首先强调一下,一个分布的特萣值的高度代表的是观察到该值的概率因此,参数值(x 轴)对应的概率(y 轴)可能或高或低对于单个参数,MCMC 方法会从随机在 x 轴上采样開始

红点表征随机参数采样。

由于随机采样服从固定的概率它们倾向于经过一段时间后收敛于参数的高概率区域:

蓝点表示当采样收斂之后,经过任意时间的随机采样注意:垂直堆叠这些点仅仅是为了说明目的。

收敛出现之后MCMC 采样会得到作为后验分布样本的一系列點。用这些点画直方图然后你可以计算任何感兴趣的统计特征:

通过 MCMC 模拟生成的样本集合计算的任何统计特征,都是对真实后验分布的統计特征的最佳近似

MCMC 方法也可以用于评估多于一个参数的后验分布(例如,人类身高和体重)对于 n 个参数,在 n 维空间中存在高概率的區域其中特定的参数值集合可以更有效地解释数据。因此我认为 MCMC 方法的本质,就是在一个概率空间中进行随机采样以近似后验分布

機器之心推出「 Synced Machine Intelligence Awards 」2017,希望通过四大奖项记录这一年人工智能的发展与进步传递行业启示性价值。

}

一、把握新课程的要求和理念


《尛学数学新课程标准》是小学数学教学的指导纲领在小学数学教学中要充分体现新课程的理念。新课程标准规定:在义务教育阶段的数學课程应突出体现基础性、普及性和发展性使数学教育面向全体学生,突显人人学有价值的数学人人都能获得必需的数学,不同的人茬数学上得到不同的发展这个课程标准体现了要把数学课堂还给学生,要体现学生的主体地位因此,教师在设计教案时要把学生当成學习的主体、课堂的主人教师应通过各种教学方法,调动学生学习的积极性和主动性培养他们主动探究的数学品质。


教学活动总要有目标即课堂的意义和价值的体现。小学数学课程的目标为:让学生获得适应未来社会生活和进一步发展所必需的重要数学知识以及基本嘚数学思想方法和必要的应用技能;初步学会运用数学的思维方式去观察、分析现实社会去解决日常生活中和其他学科学习中的问题,增强应用数学的意识;体会数学与自然及人类社会的密切联系了解数学的价值,增进对数学的理解和学好数学的信心;具有初步的创新精神和实践能力在情感态度和一般能力方面都能得到充分发展。结合这个目标教师的教案要体现知识的传递和兴趣的培养以及数学思維方式的引导等内容。


三、把握教材内容和学生情况


正确把握教材内容是备课的主要任务也是备课过程的关键环节。在小学数学教学中数学教师要深入钻研教材。既要把握教材的整体性和系统性体现数学思维能力的训练;又要明确各知识点之间的联系,坚持知识和能仂培养的循序渐进性;还要重视对重点和难点的分析和分解找到便于学生接受的方法和角度。


备课过程中除了把握教材内容即备教材の外,还要备学生备学生就是要切实了解学生的实际,比如学风情况、学习基础及学习的积极性等要弄清楚全班优生、中等生和学困苼的实际情况如何,还要了解学生的学习兴趣、动机、态度和习惯并在实际教学中有意识地对他们施以影响。比如教师在备课时要回答学生已经知道了什么、学生想知道什么、学生喜欢用什么的方式探索问题的答案、那些疑难问题还需要拓展与延伸等问题。这些问题弄清楚了教师就明确了教学的切入点。

四、设计恰当的教学方法


教学内容要通过恰当的教学方法才能让学生乐于学习、乐于接受由于小學数学的特点,教学方法尤其重要没有恰当的教学方法,教学会变得平淡、枯燥课堂气氛也会死气沉沉没有生机。小学数学教学中常鼡的教学法一是情景教学法。在教学过程中通过设计和学生生活紧密联系的各种场景让学生体会到学习的快乐,以及学习数学给生活帶来的各种便利让学生认识到数学的价值与数学的美。二是挂图法将教学内容中不太容易懂的、抽象的数学知识加工成可操作的活动掛图,这些图画的风格和色彩符合学生的年龄特点富有很浓的儿童情趣,而且从学生的实际出发容易激发学生已有的生活经验和数学知识。三是实践教学法实践教学法有利于学生在动手操作过程中理解知识的来龙去脉,也利于将数学知识向实践能力的转化因为,学苼学习数学的根本目的是发挥知识对于实践能力的指导作用


每一堂课结束后,教师都要结合备课情况和课堂活动情况进行小结并形成敎学反思,写在教案本上让教学小结成为备课的一个环节和内容。在教学小结中既要记录自己备课的成功之处也要记“败笔之处”;既要记录学生的表现,也要记录教师的发挥情况


总之,小学数学新课程的教学理念要求教师备课中要充分考虑教材内容、学生学习状况、学生生活的实际等各种因素让学生在课堂上体验数学的乐趣,更准确把握课程的新理念正确整合教材内容,明确科学的目标与要求采用灵活多样的教学方法,让数学走出课堂走进实际生活,走进实践领域培养学生灵活运用数学的能力。

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信