的概率论假设检验是真随机还是假随机

(window.slotbydup=window.slotbydup || []).push({
id: '4016716',
container: s,
size: '800,80',
display: 'inlay-fix'
1987年,是印度传奇数学家拉曼努扬(SrinivasaRamanujan,)的百年诞辰。为了纪念他,有一系列的活动。当代著名统计学者, 出生于印度的劳氏(C. Radhakrishna Rao,1920),也应邀做了三场演讲。
来源:大数据文摘
中国IDC圈2月17日报道:1987年,是印度传奇数学家拉曼努扬(SrinivasaRamanujan,)的百年诞辰。为了纪念他,有一系列的活动。当代著名统计学者, 出生于印度的劳氏(C. Radhakrishna Rao,1920),也应邀做了三场演讲。之后,印度统计学研究所(IndianStatistical Institute)基于劳氏的演讲稿,于1989年,为他出版了统计与真理一书。此书于1997年发行第二版。
在第一版的序文中,劳氏提到:
学生时代,我主修数学一种从给定前提下演绎结果的逻辑。后来我念统计学一种从经验中学习的理性方法,及从给定的结果验证前提的逻辑。我已认识到数学及统计,在人类为提昇自然知识,及有效管理日常事务所做的一切努力中,占有重要性。
在最终的分析中,所有知识皆为历史。
在抽象的意义下,所有科学皆为数学。
在理性的世界里,所有判断皆为统计。
这一段话,大致说明数学及统计的重要性,及其各自的内涵。
翻开统计史,信赖区间,是另一著名统计学者,出生于波兰,1938年才移民至美国的奈曼(JerzyNeyman,),于1934年演讲中首度提出。他的演讲结束后,大会主席包雷(Arthur Lyon Bowley, )于致词中提到,&我不很确定此信心不是一信心戏法&。要知奈曼信赖区间的概念刚提出时,大部分的统计学者,包括被视为是现代统计学之创始者,英国的费雪(Sir Ronald Aylmer Fisher, ,常以R.A.Fisher称之)均难以接受。在所谓95%信赖区间中,那95%究竟是指什么?是概率吗?如果是,那又是什么的概率?虽奈曼取巧地以信赖区间,来称呼此一他创造出来的东西,而避用概率一词。但包雷及其同行,当然一眼便看穿这个手法。这段过程,可参考Salsburg(2001)Chapter12(但该书中的A.L.Bowley应该是G.M.Bowley),及Sawilowsky(2003)一文。
岁月匆匆,七十多年过去了,今日统计学家,当然已完全弄懂信赖区问的意义。对不同的参数,不同的分布,可有不同的信赖区间;即使同一参数且同一分布,也可以不同的方法,得到不同的信赖区间。有时因条件不足,或计算复杂等原因,只好退而求其次,得到近似的信赖区间。当然这时需要一些条件,及利用一些定理。信赖区间亦可比较优劣。要知统计里有各种推论方法,但因处理的是随机现象,少有&倚天既出,谁与争锋&的方法。而评比时,也要订出评比准则。否则就像有个停止不动的钟,及一每日慢1分钟的钟,如何判定何者较准?前者可是每日皆有完全准确的时刻,后者却是每1440天(一天有1440分),才有一完全准确的时刻。不讲清楚如何评比,将会各说各话。
追根究底,还是不少学习者,未能正确了解概率的涵意。
概率的意义
一骰子有6个面,一掷之下,会得到偶数之概率为何?骰子看起来没有异样,就假设每个面出现的概率皆相同,即均为1/6。而偶数面有2,4,及6等3个。因此所求之概率为3/6。这就是所谓古典的概率,基本假设是&相同的可能性&。先求出观测的现象共有几种可能,再求出其中有几件是我们有兴趣的。将后者除以前者,即为所要的概率。虽说是&古典&,这种概率的意义,至今仍处处可见。採用的范围包含诸如抽签、玩扑克牌,及玩乐透彩等。又如某项工作徵才,报名的有82人,录取5人。若没有什么特别的资讯,便只能假设每人被录取的概率皆相同,即皆为5/82。
2009年7月底8月初,世界高尔夫球王老虎伍兹(TigerWoods),参加在美国密西根州举行的别克公开赛(Buick Open)。第1轮打完,落后领先者多达8杆,排名并列95。引发他可能难逃职业生涯,首次连续2场比赛(前一场是英国公开赛(The Open Championship,在英国之外常称为BritishOpen)),提前被淘汰的话题。不过老虎毕竟不能小觑,打完前3轮后,伍兹跃居首位。
这时大家看法丕变,一致认为这座冠军盃,几乎可说是他的囊中物了。因过去的纪录显示,伍兹如能带着54洞领先进入决赛圈,战绩是35胜1败。你要不要猜后来他赢了没有?运动比赛,往往有过去资料可参考,此时相同的可能性便不宜用了。36次中成功35次,&相对频率&为35/36(约0.972)。这种以相对频率来解释概率,是常有的作法。适用能重复观测的现象。会不会有爆出冷门的时候?当然有。只是对一特定事件,用过去多次同样情况下,该事件发生的相对频率,来估计下一次事件发生的概率,乃是在没有更多资讯下,常被认为一属于客观的办法。
某君看上一女孩,惊为天人,觉得这是他今生的新娘。评估后信心满满,自认追上的机会有8成。旁人却都不看好,问他8成这一数字,是如何冒出来的?该君举证历历,一个又一个的迹象,显示那女孩对他很有好感。这个0.8的概率,就是所谓主观概率。主观概率当然也可基于过认识概率35去一些客观的事实。只是即使面对同样的资料,不同的人,可能有不同的判定,因而给出不同的主观概率(看过他其实没那么喜欢你(He&s Just Not That Into You)吗?片中那个叫Gigi的女孩,便常误解男生所透露的讯息)。有些现象就是不能重复观测。如核能电厂的意外,及彗星撞地球等。以追女孩为例,大约少有女孩,会让你做实验,反覆地追,然后数一数其中成功几次,来定下她会被你追上的概率。对这类无法重复观测的现象,在谈概率时,主观概率就常派上用场。每天早上出门,我们不是惯于抬头看天,判断一下今天下雨的概率有几成?只是往往父母认为的概率会大些,该带伞,而小孩所认为的下雨概率会小些。
虽说&主观&,但仍要合理。例如,考试有及格与不及格。若认为会及格的概率为0.9,这没问题,人总要有点自信,但若又同时担心有0.8的概率会不及格,那就不行了。各种可能性发生概率相加要为1。即使是主观,可以独排众议,仍须自圆其说。不能说,既然是主观,便可以任意自定各事件之概率。因此不论是那一种对概率的解释,都自然地,或说必须要满足一些共同的规则。这点大家应能理解。
上述三种是常见对概率的解释,大抵也就是人们评估事件发生可能性之大小的几种思维。虽是针对不同的情况,但常能交互着运用。大家都听过曾参杀人的典故吧!有个与曾子同名的人杀人,好心者告诉曾母&曾参杀人&。曾母说&吾子不杀人&,继续织布。过一会儿,又有人来说&曾参杀人&。曾母仍继续织她的布,这么好的儿子怎可能杀人?但当第三人跑来说&曾参杀人&,曾母就害怕了,丢掉织布器具翻墙而逃。所谓&其母惧,投杼踰墙而走&。这故事出自战国策秦策二。因此当拿到一铜板,可主观地认为,政府发行不该会有偏差,两面出现的概率,应皆为1/2(这也可以是基于相同可能性之想法)。若投掷10次,正面出现8次,可能觉得有些奇怪。若继续投掷,结果100次中,出现80个正面,这时相对频率的观点,很可能便将显现。类如曾母,调整看法,不再认为此铜板公正。
当然,你可以不信邪,不论投掷的结果如何,皆认为那只是短暂的情况,意志坚定地认为这是一公正的铜板。这并没有不行,就像会有母亲,即使再多的人证,只要她没亲眼看到,她就不信儿子会杀人。要知随机现象,事件只要概率为正,不论概率值多小,便皆可能发生。毕竟铜板正面出现的概率为何,只有天晓得。但引进概率与统计,乃为了协助我们做决策可以更精准。而决策可以与时推移,并非不能更改。有如气象局对颱风会带来多少雨量,须密切掌握新的动向,而随时修正。要有随机的思维,如前言中劳氏所说的,从给定的结果,验证前提。因此针对100次投掷,出现80个正面,多数人面对此结果,还是会认为0.8的正面出现概率,较0.5的概率可信。稍后我们会再来看,10次中的8次,与100次中的80次,相对频率同为0.8,但提供的资讯,是否有异?
虽然已有上述三种对概率的解释,也涵盖了不少实际生活中所遇到的情况,数学家当然不会在此止步。他们喜欢抽象化,及一般化。像解方程式,会寻求公式,以表示出某类方程式的解,而非只满足于求出一个个的特例之解。又如当完全了解实数系统后,便会以公理化的方式,定义实数系统。即给一集合,没说是数字的集合,对其中的元素定义二运算,并给出10条遵循的公理(axiom,规则)。你好奇该二运算是否一为加法,一为乘法?而怎么没有减法与除法?名可名,非常名,数学家不认为你提出的是重要的问题。但用心体会后,你终于发现原来二运算,其一等同于加法,其二等同于乘法。也看出此集合中,有一元素根本就是0,而有一元素根本就是1。数学家对你的洞察力,仍不以为意,但同意你可以这样想。
什么叫以公理化的方式,来引进概率?先要有一个集合,称做样本空间,当做某一观测之所有可能结果的集合。可以真的有这一观测,或只是虚拟的。样本空间的某些子集合,是我们有兴趣的,这些就是一个个的事件。所有事件也构成一集合。最后定出一概率函数,即对每一事件,给一介于0,1间的值,为该事件之概率。样本空间、事件的集合,及概率函数,三者便构成概率空间(probability space)。这其中对样本空间没有太大要求,但不可以是空集合。而事件的集合,要满足若干条件。简单讲,就是你有兴趣的事件不能太少。譬如说,不能只对某事件A发生有兴趣,却对A不发生没兴趣。因此事件的集合要够大,至少该有的都得纳入。这有点像婚宴前拟宾客名单。可以请很少人,如只有双方家长。而一旦多列了某人,与他同样亲近的人便也要一併请。所以每多列1人,将不只是增加1人而已,而会随之增加几位。又概率函数,既然以概率之名,当然要符合过去大家对概率的认知,满足一些基本的条件。
在概率空间的架构下,不论采用何种方式解释概率的人,都可各自表述,找到他所以为的概率意义。但因抽象化后,不再局限于铜板、骰子,及扑克牌等,便能讨论较一般的问题,有够多的理论可挖掘。
与数学的其他领域相比,概率论的发展是较晚的。但公理化后,概率论便快速地有了深而远的发展,并成为数学中一重要的领域。这都要归功于二十世纪那位重要的概率学家,俄国的科莫果洛夫(Andrey Nikolaevich Kolmogorov,),于他1933年出版,那本不到100页的小书概率论的基础(Foundationsof the Theory of Probability)中所奠定。在此书中,他说:
概率论作为数学学科,可以而且应该从公理开始发展,就如同几何、代数一样(Thetheory of probability as mathematical discipline can and shouldbe developed from axioms in exactly the same way as Geometry and Algebra)。
何处是概率天地
有法国牛顿之称的拉普拉斯(Pierre-Simon,Marquis de Laplace, )曾说:
这门源自考虑赌博中的机运之科学,必将成为人类知识中最重要的一部分,生活中最重要的问题中的大部分,都将只是概率的问题(This science, which originated in the consideration of games ofchance, should have become the most important object of human knowledge. Themost important questions of life are, for the most part, really only problemsof probability)。
概率是针对随机现象。但世上并非每件事都是随机的,我们说过还有必然性。假设投掷一两面皆是人头的铜板,并观察会得到那一面。你晓得这是一必然现象,但仍可说会出现人头的概率为1,而其他情况出现的概率为0。也就是视此为一&退化的&随机现象。
某些物理学家,说不定认为对投掷铜板,由给定投掷的速度、角度、地面的弹性、铜板的形状及重量等条件,可算出铜板落地后,会那一面朝上,因此这不是随机。至于乐透彩的开奖,只要起始条件都能测出,则会开出那一号球,也能算出,因此这也不是随机。但你大约也知道所谓蝴蝶效应(butterfly effect)。量测极可能有误差,而有时一些微小的改变,影响却可能很大。因此我们宁可相信这些都是随机现象。
某些神学家,可能认为一切其实都是按照神的旨意在进行,只是我们不知而已。说不定真是如此。你看过杰逊王子战群妖(Jason and the Argonauts)吗?这是一部基于希腊神话的电影,内容与十二星座中的牡羊座有关,1963出品。我虽是幼时看的,至今仍印象深刻。片中杰逊王子遭遇的各种突如其来的灾难,以及一次又一次英勇的逢凶化吉,不过是天后赫拉(Hera),与天神宙斯(Zeus)在较劲,分别作梗及协助。但若无从了解神的旨意,对于未来,也只好视为随机。
随着科技进步,人们逐渐弄明白很多现象的来龙去脉。例如,我们知道女性一旦怀孕,婴儿性别便已确定。但对一大腹便便的妇女,好事者由于不知,仍可猜测其生男生女之概率。考试前夕,学生们虽认真准备,但还是绞尽脑汁猜题,各有其认为考出概率很大的题目。老师获知后,觉得好笑。课堂中已一再暗示明示,那些题会考,几乎都该能确定了,何需再猜?实则试题早已印妥,而学生不知考题,且未体会老师的暗示及明示,所以仍可以大猜一通。另外,诸如门外有人敲门,你好奇是男是女?老师要你猜拿在背后的水果,是橘子或苹果?同学盖住落地的铜板,要你猜正面或反面朝上?这类明明已确定的事,本身其实并不随机,只是对你而言,却有如惠子在秋水篇所说的&子非鱼&,当然可猜鱼快乐的概率。
但对已命好题目的老师,去判断那一题会考出的概率,就没什么意义了。因对他而言,每一题会考出的概率,只有1或0,不会是其他值。同样地,对看到背后水果的人,水果会是橘子或苹果的概率,将只能说1或0。随机与随意不同。我们说过了,概率中那套逻辑,是有够大的弹性,让人能挥洒,只是仍要合理,否则就是抬槓了。若你明明知道那是苹果,硬要说它是橘子的概率为0.5;或明明已从医生处掌握一切讯息的待产妈妈,还说生下来,是男是女的概率皆为0.5,那就不是在谈概率了。
在第2节我们以概率空间的方式引进概率。由于样本空间可以是虚拟的,此时事件也就是虚拟的。但假设真的有一项观测,如投掷一个4面体,4面分别标示点数1,2,3,4,并观测所得点数。则样本空间为1,2,3,4之集合。事件的集合可以取那一个最大的,也就是包含样本空间之所有子集所构成的集合。你如果学过排列组合,便知此最大的事件集合中,共有16(2的4次方)个元素。至于概率函数,假设点数1,2,3,4出现的概率,分别为0.1、0.2、0.3,及0.4,相加为1。至于任一事件的概率,就看该事件包含1,2,3,4中那几个数,再把对应的概率相加便是。如一事件中恰包含2,4,则该事件的概率为0.2+0.4=0.6。馀此类推。这就建立了一概率空间。对同一样本空间,可定义出很多不同的概率空间。
就算你已接受了概率空间的概念,反正数学家就是常给一些自得其乐的定义,仍可能会好奇,所谓点数1出现的概率0.1,究竟是什么意思?是每投10次,点数1恰出现1次吗?非也!
有个修过概率论的数学系毕业生,好心地对你解释如下:
假设投掷n次,点数1出现a次,则相对频率a/n与0.1之差的绝对值,会大于一给定的正数(不管它多小)之概率,将随着n的趋近至无限大,而趋近至0。
务实的你,很可能不觉得这样的解释很实际。先提出疑问&什么是趋近至无限大?&就是一直投掷,不可停止,日出日落,春去秋来,继续投掷,即使夸父追日成功了,无限大也仍未达到,还得投掷。那位数学系毕业生,一听到你问起无限大,如鱼得水,这是他在数学系四年寒窗,学到的几招独门绝活之一。你不得不停止无限大这个话题,因连夸父追日,你也觉得岂有成功时?如何能接受解释概率,还得涉及无限大?但还一点你不吐不快的是&我就是不了解概率值的意义,怎么却用概率的概念来解释给我听?&
想解释概率值的意义,将会在概率及无限大,一层又一层的打转。这有如想去定义什么叫做点,结果将如同陷在线团中,学步维艰。最后只好说,点是无定义名词。但无论如何,你应可理解,对前述4面体,仅投掷1次,是无法显示点数1出现概率0.1,那个0.1的意思。概率并非只看&少数几次&的结果。概率是在大样本(n很大)下,威力才显现。概率值的意义,既然不能以一套可接受的逻辑来说明。那么退而求其次,可否让人略微了解概率值的意思?或者说(除非是虚拟,只是在求一些概率值),你拿一4面体,且宣称点数1出现的概率为0.1,怎么样才知道你讲的是真的,而非信口开河,或者说记错。
之前那位数学系毕业生的解释,这时便能派上用场。此即大数法则(law of large numbers)之一简单的版本。数学上的意思为,事件出现的相对频率,会&概率收敛&至事件发生的概率。要知随机世界中,仍有些法则要遵循,大数法则是其中很重要的一个。当然我们已指出了,实际上并无法观测事件无限多次。那是否可说,事件出现的相对频率,当观测数够大,须接近事件发生的概率?也非如此。事件只要概率为正,便都可能发生。所以,不论观测数再大,都不能排除很偏颇(如观测1,000,000次,点数1出现的次数为0,或1,000,000次)的事件发生。但是,这时统计学家跳出来了,可以做一检定,检定点数1出现的概率是否真为0.1,这是属于统计学里假设检定(testing hypothesis)的范畴。简单讲,是以在某一假设下,会观测到这样的结果,是否算不寻常?所谓不寻常,是指发生的概率很小,小于某一预设的值。若属于不寻常,则当初的假设就不宜接受。附带一提,当假设一铜板为公正,则投掷100次,出现至少80次正面,较投掷10次,出现至少8次正面,前者是更不寻常的,因它发生的概率,远比后者小。所以,在同样获得八成以上的正面数下,投掷数愈大,将会使我们更相信此铜板非公正,而接受它出现正面的概率,至少是0.8。这说明:
在统计里,样本数愈大,将使我们的推论愈精准。
在随机世界,究竟何者为真,常属未知。我们往往无法&证明&那件事是真实的。不过是一个个的假设,端看你接受那一假设。四面体点数1出现的概率,是否真为0.1,即使投掷再多次,都无法证明其真伪。只能说数据显示&可以接受&,或&无法接受&概率为0.1。这里面有一套机制,以决定接受或不接受。
另外,对一四面体,也可估计点数1出现的概率,有一些不同的估计法,可以得到不同的估计量。在数学中,使用不同的方法,须导致相同的结果。所谓殊途同归。但统计里,除非做些限制,否则常无定于一尊的方法。对不可测的未来,我们常要做估计,统计在这方面,能扮演很好的角色。诸如铜板出现正面的概率,及病人的存活率等,皆能估计。但有时觉得以一个值估计,虽然明确,但估计值很难恰好等于真实值,一翻两瞪眼,常估计不准。信赖区间的概念,因而产生。
我们常对某一未知的量做估计。未知的量可以是某事件发生的概率,某分布的参数(如期望值及变异数等),或某物件之寿命等。这些未知的量,可通称为参数。有时会以一区间来估计参数,并给出此区间会涵盖该参数之概率。这就是所谓区间估计,所得的区间,称为信赖区间。而区间涵盖参数之概率,则称为此区间之信心水准(confidence level)。与概率一样,信心水准是一介于0,1间的值,常事先给定,且以百分比表示。90%、95%、99%等,都是常取的值。
数据(data)是统计学家做决策之主要依据。若缺乏数据,他们往往将一筹莫展。来看一简单且常见的情况。假设欲估计一铜板出现正面之概率p。很自然地,便投掷若干次,譬如说n次,并观测n次的结果。这个过程便称为取样。在本情况中,各次投掷的结果并不重要。总共得的正面数,以a表之。知道a,就已掌握全部资讯[a称为充分统计量(sufficient statistic)]。给定信心水准,并利用n及a,可得一信赖区间,但作法并不唯一。亦即对于p,有不同的信赖区间公式。但课纲的写法,好像信赖区间的公式唯一。此处由于其中涉及二项分布,计算复杂些,如果n够大(n太小则不行),我们常可藉助常态分布来近似。这要用到概率论里另一重要的法则&中央极限定理(Central limit theorem)。必须一提,只有以常态分布来近似时,才需用到中央极限定理,并非求信赖区间皆要用到此定理。
对估计铜板出现正面之概率p,取样前,信赖区间为一随机区间,若信心水准设定为95%,则有(或精准地说&约有&,如果该信赖区间只是近似的)0.95的概率,信赖区间会包含p。取样后,得到一固定区间。则p会属于该区间的概率,将不是1便是0,而不再是p了。为何如此?很多人对此常感困惑。
我们先以下例来说明。假设某百货公司周年庆,顾客购物达一定金额,便能自1至10号中抽1彩球。若抽中5号,今天在该公司的花费,可获30%抵用券。在抽球之前,你知道有0.1的概率能获抵用券,机会不算小。一旦抽出,一看是3号,获抵用券的概率当然便是0了。
这类例子很多。打击手挥棒前,可以说打出安打之概率为0.341,打完不是安打就非安打,0.341已派不上用场了。再给一例。假设某银行发行的乐透彩,每期自1至42号中,开出6码为头奖号码。你签了一注6码,开奖前,你知道很容易&至少中1码&,因概率约为0.629(见附注1)。等开奖后,你的彩券会至少中1码之概率,将是1(若至少中1码),或是0(若1码皆未中)。
关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯
热门会议:
我们的服务:彩票出号不是随机的?已有人破解彩票出号规律_网易彩票
请开启浏览器的Javascript功能亲,没它我们玩不转啊!求您了,开启Javascript吧!不知道怎么开启Javascript?那就请!
彩票出号不是随机的?已有人破解彩票出号规律
一般人都会说不是凭运气吗?怎么可能呢?还有些专家会告诉的概率几乎是比雷劈的概率还要低。那你就错了。谈到,你必须了解一个人,那就是盖尔霍华德女士,她在1982年首次提出了“平衡选号”和“聪明组合”的策略,从而引发了历史上的一场革命。此后,风行美国和欧洲各国的博彩业从一种单纯“碰运气”的游戏变成了一场讲求技巧的智力竞赛。盖尔创建并不断更新的一套彩票选号策略,迄今已经造就了65位百万美元的大奖得主,奖金额高达9700万美元。这项记录被《吉世界纪录大全》收录并被誉为“彩票富翁的助产士”。她至今还保持一项最高记录—在她的指导下,有三位美国彩民在同一天分别中取了百万美金的大奖。她的这个能力,使她在数百个电台和电视台上频频亮相,其中包括美国“今日要讯”与“早安美国”。 为了比较和研究东西方测彩的理论和实践,我在十多年特地去美国购买了盖尔女士的正版著作和软件,还特地做了全面地翻译,以后有机会易算人生可以分享给大家。虽然目前国内有很多彩票预测软件,不过可惜的是目前国内还没有一款盖尔女士授权的中文版软件。但是国内的彩票软件基本都采用了由盖尔女士提出的“平衡选号”和“聪明组合”理论,部分吸收了盖尔的理论。那什么是“平衡选号”和“聪明组合”呢?简单而言,所谓“平衡选号”是一个取数的理论和系统,经过大数据的分析,盖尔女士发现其实彩票的出号并不是毫无规律的纯概率事件,而是基于“偏态理论”—也就是彩票出号在一定时间内呈现一种正态分布。有些号码几乎不会出,有些号码一起出的概率很小。所以在选号的时候就可以大胆排除这些号码,从而大大提高了准确率。比如在双色球或是大乐透中出现全奇数或全偶数就很少。所谓“聪明组合”实际就是组号的理论和方法,目前彩民所谓的胆拖就是这种方法的体现。总体而言,盖尔的理论是基于概率统计分析对于彩票出数做的一次有效的创新。我把她称为“水平研究体系”。之所以称她“水平研究体系”,是因为她是基于以往的数字来预测未来可能出现的数字。也就是从水平横向作用力的角度来考虑彩票数字的变化。中国人办一些重大的事情都会选择一个比较好的日子,比如结婚,搬家或是企业开张,市面上也有各种各样的老黄历供选择。我之所以提出这个问题,是因为在中国传统文化中,时间和空间都必须引起重视,这源于中国几千年的天人合一的思想,而最能体现这种思想当属五经之首的《易经》。由此而延伸的学问,我们称为易学。易学是基于天人合一的哲学思想,也是采用干支卦象的符号系统,根据阴阳五行的生克制化理论是中国人认知世界的系统论和方法论。由此产生了中国五千年的璀璨文明,虽然其中的理论目前还没有完全被西方科学所证实,但是他独特的价值已经越来越被西方世界所证实。中医就是典型的例子。随着自然疗法的兴起,越来的越多的西方国家已经把中医纳入他们的医疗体系。而中医的核心理论之一就是对于阴阳五行的应用。相对于西方基于数理统计的预测学模式,中国传统的预测学体系几乎都离不开我上面的易学系统。我从小研习易学,长大以后又有机会向多位中国文化的传承人系统学习易学,所以当我回头审视彩票现象时,我发觉了一个一直被西方人甚至被盖尔女士忽视的作用,我称为“垂直作用力”就是开奖时候的时空对于彩票出数的影响力。我认为开奖时日子的阴阳五行对彩票也是有影响的。基于这个理论假设,我展开了我的研究,经过研究我发现了这种内在的联系,于是在2006年首届易学高峰论坛上,我发表了《金口四象全息测彩法》的论文,获得好评。十多年来,我一直致力于彩票的研究和实践,积累了大量的成功经验,由此我研发了中国首款采用易学原理的彩票预测软件,双色球尾数分析软件也在去年获得了中国国家颁发的计算机著作权。因此也打开了彩票研究的一个新的思路。
本文来源:网易彩票
责任编辑:王津_B6437
关键词阅读:
数字彩|单场彩|足彩伪随机的上位和真随机的逆袭 - 文章 - 伯乐在线
& 伪随机的上位和真随机的逆袭
(伯乐在线已征得转载许可,如需再次转载,必须经过作者同意。)
生活中到处都充满了“随机”的概念:抛硬币、抽签、彩票、游戏、歌曲随机播放等等,但事实上有许多所谓的“随机”只是“伪随机”,只是让人感觉起来像是随机。就像我们的眼睛很容易被视觉错觉欺骗,我们关于“随机”的直觉其实也挺不靠谱的。
一、游戏掉宝率和伪随机
二、iTunes的歌曲随机播放
三、抛硬币和教授的“读心术”
四、Benford法则和彩票(有致富信息哦~)
五、”Guardians of the Randomness”——“随机护卫队”
先来说说那些伪随机逼死真随机的故事吧,真是既悲伤又欢乐啊。
一、游戏掉宝率和伪随机:
几乎所有游戏都带有“随机性”,而游戏中最常见也最常被讨论的随机事件就是掉宝,也就是打完怪有一定几率爆出各种不同的宝物。而掉宝就是个很典型的随机事件,一般来说每个怪的掉宝率是固定的,比如一个怪有1/1000的几率掉A物品,1/100的几率掉B物品之类的。一般越稀有越值钱越有用的物品的爆率就越低。
虽说1/这样的爆率看似很简单,但实际上很多人是有认知盲区的。
大家可能都听到过有人这样抱怨:“妈的不是说1/100的掉宝率么,老子都刷了300次了还没掉,骗人的吧!我听说有人总共只打了两次就掉了两次,尼玛不科学啊!” 其实这太科学了。
一些人以为“百分之一的爆率”就意味着我打一百次就差不多该有一次能成功。但其实,打100次爆率为1/100的怪能够至少掉一次宝的概率只有1-(1-0.01)^100=0.634,也就是说36.6%的玩家打100次也没能掉一次。事实上,13.4%的玩家就算打满200次也没结果,4.9%的玩家打满了300次还是悲剧。
而另一方面,玩家们又经常会听说有某个人总共只打了两次,结果两次都掉。这概率有多少呢?如果从个体玩家角度看,这样的概率是1/10000,确实挺小的。但问题是我们“听说”这样的事件发生的概率是针对一个人群而言的,而不是个体。假设你在游戏里认识50个其他玩家朋友,而这50个玩家又各自认识50个玩家朋友,那么你所认识的朋友和朋友的朋友就有2500(假设你50个朋友的圈子没有重叠),而这2500人就构成了你最基本的小道消息网络。那么在你的朋友和朋友的朋友中出现一个“打两次掉两次”的神人的概率是多少呢?是0.222,也就是有超过20%的概率你的一级和二级朋友圈会出现一个1/10000的小概率事件。
如果这个游戏总共有10万玩家,那么就有99.995%的概率会出现至少一个“打两次掉两次”,9.5%概率出现至少一个“打三次掉三次”,而同时,如果每个玩家都打满1000次,那仍然会有64.9%的概率出现一个就算打满1000次也还是悲剧的衰神。总之,一个对于个体的小概率事件在人群中出现的概率往往是很大的。比如知乎去年的世界杯竞猜,好像有人连续十几场猜中,然后大家纷纷膜拜“大神”。我不知道那位用户究竟是靠运气还是实力,但其实就算是一群猴子在猜,只要基数大到一定程度,也是很有可能会出现一个“神猴”的。
虽然这些事背后的原理其实还挺简单的,但偏偏很多玩家无法理解或懒得理解,于是游戏设计者们就整天被一群愤怒的、嫉妒的、坚信“游戏不公平、不科学”的玩家骚扰、差评、威胁。所以许多游戏的掉宝原理的设计到最后都被迫妥协,并不是真随机,而是某种伪随机,人为削弱某些小概率事件的可能,给玩家们营造一种“随机”的感觉。然后之前那些愤怒的玩家们纷纷表示:“这不就行了吗?这才叫真的随机好吧。设计这游戏的简直数死早,还要我们玩家来帮忙。”
伪随机逼死真随机,玩家逼死游戏设计,就是这个意思。
更多关于游戏中的伪随机,请看 的
二、iTunes的歌曲随机播放:
躺枪的不只是游戏,还有苹果。最开始iTunes上“随机播放下一首”的功能用的是真随机,随到哪一首就放哪一首呗。但这想法实在是太年轻了…
苹果很快就收到了大量的投诉,说“我明明用的是随机播放,怎么会连续播放两首一样的呢?!你这随机功能肯定是坏的!差评!” …“我放了4首歌,结果出现了两首歌交替出现,ABAB这样,非常有规律,苹果你耍我呢?!”
唉,真可谓“概率不学好,生活多烦恼”…跟上面游戏的例子相似,这类事件其实完全有可能,而且概率并不小。
如果歌曲列表里有20首歌,那么听完一首歌后马上又随机到同一首的概率其实就是1/20,也就是说你听2小时歌(假设每首平均5分钟),那么至少出现一次连续两首相同的概率是0.708,至少出现一次ABAB的概率是0.058,都还挺高的。这还只是听2小时而已,如果听2000小时,那么出现ABABAB的概率也高达0.139
听说苹果当时还专门发表了一个声明,解释出现这种现象的原因,表示这不是随机播放功能出了问题。但这想得实在太简单了…
最后苹果还是用了伪随机,禁止连续随机到同样的歌,甚至禁止出现一些诸如ABAB,ABCABC之类的常见序列。
不得不通过把“随机”变得不“随机”来让用户觉得这“随机”很“随机”。人脑的认知真是很呵呵啊…
三、抛硬币和教授的“读心术”:
听说有个概率论教授有一次把班上的学生分成两组,其中一组抛一个硬币100次,然后如实记录每一次的结果。另一组,教授不许抛硬币,而是让他们编出100个“尽可能随机”的抛硬币结果。实验过程中教授会走出教室,两组学生不能够互相交流。然后教授告诉大家,他到时只需要看到两组结果就能猜出哪一组结果来自真实的抛硬币,而哪一组是编出来的。学生自然不相信,不都是随机序列么,怎么可能看出区别?教授这是欺负我们智商?于是第二组的熊孩子就干劲十足地开始编,想把结果弄得看起来非常随机,从而混淆教授。下面是最后的两组结果,大家先猜猜哪一组是编的?(我这里直接借用了 在里的例子 )
tthhhhhtthhhhtthhthhhtthhhhttththhhtthhhhhhtthhhhh
htthhthhhthhhhthhththtttththtthhtthhhhhttthhththtt
tthhhhhtthhhhtthhthhhtthhhhttththhhtthhhhhhtthhhhhhtthhthhhthhhhthhththtttththtthhtthhhhhttthhththtt
hthtthhtthtthhhthtthtttththhthhththhhhthhtthtththh
hthhhthtththhhthttththhthhhthththhhhthhthttththhth
hthtthhtthtthhhthtthtttththhthhththhhhthhtthtththhhthhhthtththhhthttththhthhhthththhhhthhthttththhth
教授一眼就看出了正确答案:第二组是编的,第一组是真实的。为什么呢?因为第一组出现了连续6个相同的结果,而第二组的看起来更“杂”更“乱”一些。第二组学生的直觉告诉他们,“随机就是乱、没规律”,于是他们肯定不敢编出有连续五个六个相同结果的序列,因为这看起来“太有规律”了,“不够随机”,“看着太假”。但事实上(根据 的计算),抛100次硬币,至少出现一次连续6个相同结果的概率超过80%,至少出现一次连续5个相同结果的概率超过90%. 所以熊孩子们想把序列弄得“尽可能随机”的心理恰好中了教授的圈套,他们直觉上越“随机”的序列往往反而不是那么“随机”。于是教授成功带领真随机逆袭啦~
这其实跟之前的歌曲随机播放例子里的逻辑很像,只不过教授是反向利用了这种认知模式和错误直觉。抛6次硬币出现6次相同结果的概率很小,但抛100次出现这样情况的概率就很高了。
其实类似的错误直觉在各种牌类游戏和赌博中也很常见。许多大家平时总结出来的“规律”,一些牌桌上的顺口溜,都不一定准确。
还是拿抛硬币举个例子,比如你和小伙伴赌抛硬币,假设已知这个硬币是公平的。之前已经连续抛出10个正面,那么接下来一次还是正面的概率是多少?有些人会想“连续11个正面的概率也太小了吧,下一个总应该是反面了吧?”这种思维模式确实有迷惑性,但只要硬币是公平的,只要每次抛硬币是独立事件,那么不管之前出现了多少次连续正面,下一次还是正面的概率还是50%. 这种心理很容易在赌徒身上出现:我今晚连输30把了,一晚上全输的概率也太小了吧,我接下来肯定要开始赢了!…
相关的讨论有很多,比如
更多关于牌桌上的错觉,请看 的
四、Benford法则和彩票:
我要是说“买彩票是有技巧的”,大家肯定会说我民科。不过用真随机数买彩票,虽然不能帮你提高彩票中奖的概率,但也许能帮你提高中奖的奖金数额。听我慢慢解释:
彩票的中奖概率是无法通过“技巧”或“研究”改变的,这点很多人都解释过了:
但是大多数人都忽略了彩票中奖金额这一维度。对于许多彩票,中同一个号码的人越多,分奖金的人也越多,而每个人分到的奖金也就越少。另一方面,虽然中奖号码的产生本身是真随机,但人们买的号码往往不是随机的。如果把所有人买的号码放在一起做统计,那么0-9这些数字出现的频率会有很大的差异,有些数字被买的次数会明显高于其他一些数字。也就是说,当那些出现频率较高的数字真的出现在中奖号码中时,中奖人数就会比较多,每个人分到的金额就少。这主要有两方面原因。
首先,人们对数字有各种迷信,一般中国人会更喜欢6和8这些数字,而避开4,如果在一些西方国家,人们喜欢7,忌讳13。而买彩票时一些人也会想要一些带6和8的号码来“讨彩头”,但结果这些“幸运号码”反而让他们的收益期望值降低。这就跟出生年份的分布有点相似。大家应该都听说过龙年虎年出生的小孩特别多,而什么鸡年狗年出生的孩子相对少一些。“龙宝宝”、“虎宝宝”听着吉利,但等到小孩要升学、高考、考研、就业时面临的竞争对手也就多了,到这时候不管是再好听的“龙”还是“虎”都没半点用了。
其次,许多人都会用一些“有意义”的数字买彩票,而最常见的就是日期,比如生日、纪念日等等。而这些日期中包含的数字是绝对不随机的,而且是高度可预测的。这里就要提到了。Benford法则粗糙地说就是,在现实中的10进制数据中,以1为首位数字的数的出现频率最高,9最低,中间的数字依次递减。而且这种差异非常明显:
我自己对日期中出现的数字频率进行了统计。严格来说不是Benford法则,但原理应该很相似。在01.02,12.25 这样形式的日期中:
其中0,1,2三个数字竟然占到了66.9%,也就是如果大家都用日期买彩票,那么0,1,2三个数字被买的次数会超过剩下的7个数字总和的两倍还多。这种不随机的程度还真是挺夸张的。
所以,我猜在中国人买的彩票里,0,1,2出现次数最多,3,6,8其次,而4有可能是最少的。所以如果想要避开其他彩民的竞争,应该尽量避免0,1,2之类的数字,然后产生真随机数,这样也许可以最大化收益。于是,真随机似乎又逆袭咯~
这里有三个声明:
1. 以上只能算是一点理论,还需要真实数据验证,所以买彩票亏了别找我哦…
2. 当然按我的方法买彩票赚了的话可要千万记得我哦~
3. 其实就算用这种方法,买任何彩票的期望收益率仍然是负的,所以大家随便玩玩就好。
更多关于Benford法则的介绍请看 的
五、”Guardians of the Randomness”——“随机护卫队”:
The generation of random numbers is too important to be left to chance.
Random numbers should not be generated with a method chosen at random.
就像“银河护卫队”一样,这是一群有点逗逼又有点牛逼的人,他们默默地守卫着:嗯,“随机”。小标题里的名字是我给他们取的,他们的真名叫,也就是他们的网址。这其实是一个很正规的组织,是由爱尔兰都柏林三一学院计算机科学和统计学院的博士于1988年创建的,现在已经升级为有限公司了,曾被各大媒体报道过,甚至还被十几篇顶级期刊发表的论文引用过,至今它累计已经提供了超过19万亿次随机生成相关服务了。
旨在提供最优质最科学最随机的随机数生成及衍生服务。他们提供的免费服务包括:随机数、数组、字符、序列生成,随机正态分布生成,机选彩票,抛硬币,掷色子,洗牌器,随机打乱顺序,随机生成时间、日期、密码、地理坐标、DNA序列、纯净白噪音等等,从娱乐到学术都有。当然他们还有付费服务:第三方认证的抽签,为非常重要的抽签提供最高纯度的随机性。
很多人会问:生成个随机数还有好坏优劣之分?严格来讲的确有。
我们的各种电子设备需要生成许多随机数,但绝大多数的这些随机数生成都是“伪随机数生成”(PRNG),而是世界上少数几个提供“真随机数生成”(TRNG)的机构。“伪随机数生成”是运用一套算法,将一个初始数值/序列等转化为看似非常随机没有规则的结果。对于99.9%的应用而言,这些“伪随机数”其实也完全没问题,但对于一些科学研究、一些专业博彩机构、一些涉及加密和信息安全的应用,“伪随机数”从理论上讲是决定性的,可预测的,周期性的,这也就会带来各种隐患,因为如果知道了初始值,知道了具体算法,就有理论上的可能还原出完全一样的“随机数”。而各类“真随机数生成”一般会使用一些无法预测和控制的自然现象来生成随机数:元素的某些随机衰变现象、环境噪音等。这些方法背后的理论基础就跟量子理论和混沌理论有关了。使用的就是环境噪音。当然,“真随机数生成”的效率是远低于“伪随机数生成”的,这也是为什么对每个IP每天免费生成的随机数是有限制的,大约是122kb左右。
甚至还有针对黑客和恐怖袭击的应对措施…他们的设备分布在多个大洲的多个国家的隐秘地点,所以黑客或恐怖分子必须在所有地点同时用特殊仪器发起攻击才行。但即使是这样,还有对应的内部监测和防御机制,简直酷炫,对得起“随机护卫队”的称号。不过不知为啥读到他们这段说明时总有种浓浓的中二感……
关于“真随机数”的科普和“真随机数”的重要性,请看 和
大家还可以在这里看看各个领域的用户们是如何创造性地使用的:,除了之前提到的比较正经的,还有用来艺术创作的,用来制作白噪音提高睡眠质量的,用来提升夫妻生活质量的,用来拯救选择障碍症晚期患者的,还有跟中国的《易经》一起用来算命的…总之深受又认真又geeky的神经病的欢迎。
我最初知道这个网站是通过我们系管电脑的大叔。他这人完全就是个活生生的computer geek的刻板印象。有一次我们系开会讨论个事,中途需要决定一个日期/数字(记不清了,反正不重要),于是大家说:那我们就随机选一个吧。听到“随机”这个词,本来在思考人生的大叔突然被激活了,特别严肃地对大家说:“等等”。我们还以为他要发表什么重要观点,结果只见他打开电脑,登上,生成了一个符合要求的随机结果,然后在全场的注目礼中继续思考人生,like a boss……从此大家在他面前不太敢用“随机”这个词了…
总之,是一群认真、执着、洁癖但又有些可爱的人二十多年来共同努力的结果。希望大家优雅地使用。
我们生活中充满了跟“随机”相关的事物。有时伪随机逼死真随机,有时真随机又能逆袭,有时伪随机更实用,有时真随机能致富。这事儿还真是“随机”呢~
————————————————————————————————————
大家有兴趣还可以看一下 这个回答:,跟我的文章的第一第二部分也有些关系。本来我也想写的,但刚好看到了这篇,觉得写得蛮好的~
我偶尔还会继续写一些跟概率、统计有关的科普猎奇小文章,下一篇应该叫《廉价的巧合》。有兴趣的话可以关注一下专栏~
可能感兴趣的话题
抛硬币单次来看的概率是0.5,而且也不管前面到底出现了多少次,但是如果前面已经出现了100次,单次来看还是0.5的概率,可是还没有会一直出同一面而不出另一面的情况发生
关于伯乐在线博客
在这个信息爆炸的时代,人们已然被大量、快速并且简短的信息所包围。然而,我们相信:过多“快餐”式的阅读只会令人“虚胖”,缺乏实质的内涵。伯乐在线内容团队正试图以我们微薄的力量,把优秀的原创文章和译文分享给读者,为“快餐”添加一些“营养”元素。
新浪微博:
推荐微信号
(加好友请注明来意)
– 好的话题、有启发的回复、值得信赖的圈子
– 分享和发现有价值的内容与观点
– 为IT单身男女服务的征婚传播平台
– 优秀的工具资源导航
– 翻译传播优秀的外文文章
– 国内外的精选文章
– UI,网页,交互和用户体验
– 专注iOS技术分享
– 专注Android技术分享
– JavaScript, HTML5, CSS
– 专注Java技术分享
– 专注Python技术分享
& 2017 伯乐在线}

我要回帖

更多关于 概率论假设检验 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信