悠长假期悠长假期的概率计算攻略
悠长假期悠长假期的概率计算攻略如下:
上总有帖子po出玩家的实际挂机结果并问钓鱼,捕虫,概率是不是被暗改过,这篇帖子说一下玩家应当如何用统计学方法判断是否有暗改。本帖子涉及3个部分,内容涉及概率,统计推断方面的知识。部分内容用到了理工科大一必修课——概率统计的相关知识。懒得看的玩家可以直接跳到最后看太长不看版的内容。
第一部分:根据官方公开的概率,计算实际出现情况的概率。
这个非常容易,直接套多项分布公式计算就行。
以捕虫为例: 7楼的数据 5星网高级蜜,官方给定的概率是12345星为0.17,0.18,0.20,0.22,0.23 总共465只虫,这次捕虫12345星个数分别为80,98,88,98,101,那么出现这个结果的概率应该是多少?
P=465!/(80!*98!*88!*98!*101!)*(0.17^80)*(0.18^98)*(0.20^88)*(0.22^98)*(0.23^101)=0.000001382557785
第二部分:根据自己实际的收成结果,去判断官方给出的概率是否可信。
这个需要用假设检验。
假设检验的道理其实很简单,分为3步,
第一步:假设官方概率是可信的。
第二步:抽取足够多的样本(50个以上,不需要几百上千,50个就够了),计算样本出现的概率以及更极端的可能性的概率(p-vlaue)。
第三步:判断,如果p-value小于0.05,就可以否定第一步做的假设,即官方概率是骗人的。但是如果p-value大于0.05,则不能否定官方概率可信。(50个样本和0.05的概率是教材给的指标,实际样本数目增多p-value应该更低)
这里仍然以上面的数据举2个例子来说明:
第一个例子我们判断一下,捕获5星虫的概率是否为0.23。
第一步:假设捕获5星虫的概率都为0.23.
第二步:上述例子中抓取了101只5星虫,那么我们分析捉101只5星虫的概率是多少?更加极端的情况(5星虫数目小于等于101)的概率应该是多少?
套二项分布来计算:P只有101只5星虫=C(465,101)*(0.23^101)*((1-0.23)^(465-101))=0.03605299382
p-value=P小于等于101只5星虫=P101+P100+...+P1+P0=0.2762107581
第三步:p-value>0.05,因此我们不能否定捕获5星虫的概率为0.23这个假设。如果本着怀疑从信的态度,应当相信这个假设。
第二个例子我们判断一下,所谓'幸运虫子'的说法,即捕获每种5星虫的概率是否都为0.25。
第一步:假设捕获每种5星虫的概率都为0.25.
第二步:上述例子中抓取了101只5星虫,分别为锹甲15,金裳凤蝶20,双列闪蝶26,兰花螳螂40,那么我们分析最少的锹甲个数,捉101只虫,只有15个锹甲的概率是多少?更加极端的情况(锹甲数小于等于15)的概率应该是多少?
套二项分布来计算:P只有15锹甲=C(101,15)*(0.25^15)*(0.75^86)=0.004987614168
p-value=P小于等于15锹甲=P15+P14+...+P1+P0=0.009667641044
第三步:p-value<0.05,因此我们可以否定每种5星虫的概率都为0.25这个假设。即数值设计在这做了手脚,增加了要特定虫的难度(木桶短板理论)。
第三部分:如果我们不相信官方公布的概率,那么可以根据自己实际的收成结果,去推断实际概率分布。
先明确一个概念:极大似然估计,极大似然估计就是利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的概率参数值。仍然用上述例子,101只5星虫,分别为锹甲15,金裳凤蝶20,双列闪蝶26,兰花螳螂40,如果我们假设概率是P锹甲,P金裳,P双列,P兰花,那么什么概率分布能使得我们抓101只虫,出现锹甲15,金裳凤蝶20,双列闪蝶26,兰花螳螂40的概率最大? 这一次我们只有一组样本,但很显然最大概率应该是接近 P锹甲:P金裳:P双列:P兰花=0.15:0.2:0.25:0.4。
有的玩家就要问了,你这只有一组样本,虽然超过50个,但还是略显单薄,缺乏可信度,那就可以用多组样本估计,其实多组样本的道理也是一样的,我们反推的目标函数变成了使得πP=P(第一组样本)*P(第二组样本)*...*P(第n组样本) 最大的概率分布
这个求解过程较为复杂,这里不细说了。直接说结论,极大似然估计的第i种虫的概率=n组样本第i种虫的和/n组样本所有虫的和。
仍以捕虫为例:使用 7楼的数据 以及 中第一次的捕虫数据。
第一组数据捕虫5星虫最大值,次大值,次小值,最小值个数分别为40,26,20,15
第二组数据捕虫5星虫最大值,次大值,次小值,最小值个数分别为45,18,15,15
那我们推断的实际概率分布应该为:
最大值概率(40+45)/194(5星虫数)=0.44
次大值概率(26+18)/194(5星虫数)=0.23
次小值概率(20+15)/194(5星虫数)=0.18
最小值概率(15+15)/194(5星虫数)=0.15
注意统计陷阱:似乎隔一段时间同一星级出现最大概率的虫子会变,在使用多组样本时,记得统计的是最大值,次大值,次小值,最小值,而并非特定虫子,以免由于不同时间最大概率的虫子变化引起误差。
此处只拿捕虫做了概率计算的举例说明,捕鱼和摸贝以及组队,船运概率也是同样道理。如果有怀疑大家可以自行计算。
PS0:以上计算都是限定在每次抓虫都是独立,同概率的情况,如果实际上挂机是不独立同概率(比如手动钓鱼或者手动摸贝一样,高星跑了下一个必来低一星的情况,此处官方并没说明独立同概率,有可能是坑)上面的计算就是错的。
PS1:为什么要写这么一篇帖子?因为上讨论概率的太多了,对于质疑贴,不是被删除就是几乎所有的回答都是继续挂机,这样增加玩家成本,那还不如自己算。这篇帖子的最大意义就是将验证质疑的成本降低到了50个样本,即最大为150体力,不需要几千体力的挂机了,完全可以被大部分玩家接受。
PS2:太长不看版
5星网,高级蜜,抓50只虫,5星虫数目小于5可以认为概率不符。
5星竿,尊贵饵,钓50条鱼,5星鱼数目小于4可以认为概率不符。
5星手套,摸50个贝,5星贝数目小于3可以认为概率不符。
50次船运,去某一港口的次数小于6次,可以认为概率不符平均。
'幸运虫子'的说法可以被统计学证实,即某种虫子/鱼/贝的概率会特别低,并不是平均的。实际估计'幸运虫'只占全部5星虫的0.15左右,'幸运鱼'艾薇处占全部5星鱼的0.15,码头处数据不足50不好给出,'幸运贝'只占全部5星贝的0.09左右。这个估计的概率数值可能有所偏差。
以上就是悠长假期悠长假期的概率计算攻略相关内容。