样本一个容量为80的样本的计算方法

关注今日:27 | 主题:144657
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
实例教程:手把手教你怎么计算样本量
页码直达:
来源:“医咖会”微信公众号以新英格兰医学杂志上的一篇文章[1]为例,这是一个持续五十六周的多中心、随机双盲对照试验,看利拉鲁肽这个药治疗减肥的效果。 研究对象按照2:1的比例被随机分配到利拉鲁肽组或安慰剂对照组。这篇文章在Protocol的84-85页有样本量计算的详细介绍,如下:The power for the primary endpoint weight change is calculated based on a two sided t-test with a significance level of 5%. The power with regard to the co-primary dichotomous endpoints proportion of subjects with a weight loss larger than of at least 5% and or more than 10%, respectively, is calculated based on a two-sided chi-square test. With a sample size of 2400 subjects treated with liraglutide and 1200 subjects treated with liraglutide placebo, the trial will have more than 90% power to detect a difference between liraglutide and liraglutide placebo in the proportion of subjects with a weight loss greater than 10%, given that the probabilities to achieve this weight loss is 10% for liraglutide placebo and 14% for liraglutide. 总结一下大意:比较主要结局(体重变化)时,按照P=0.05进行双侧t检验。对于另一个主要结局(二分类变量)——体重下降5%及以上、10%以上的人数比例,采用双侧卡方检验比较。假设对照组体重下降10%以上的人数比例为10%,利拉鲁肽组的这个比例为14%。当利拉鲁肽组和对照组的样本量分别为2400例、1200例时,可以有超过90%的把握度发现这种差异。以本研究为例,计算样本量时,需要知道以下几个重要的参数:1、研究设计类型(随机对照试验);2、结局指标类型(二分类变量——体重下降10%以上的人数比例);3、结局指标的预计值(安慰剂组10%,利拉鲁肽组14%);4、检验水准α(通常取α=0.05);5、把握度1-β(通常为80%或更高,本研究为90%)。上述5个参数(尤其是前3个)不同时,样本量计算的方法也不同,一共好几十种呢。这个研究是平行设计的随机对照试验,结局指标是二分类变量,其样本量计算方法就是最常见的一种。下面,就用PASS 11来介绍一下怎么计算这个研究的样本量。1、打开PASS 11软件后,在左侧的菜单栏内选择Proportions→Two Independent Proportions→Test (Inequality)→Test for Two Proportions[Proportions]2、要计算样本量,需要在Find (Solve for)中选择N1。这个研究中,选择的把握度为90%,因此Power (1-Beta)中输入0.9;选择的Significance level(也就是P值)为5%,因此Alpha (Significance Level)中输入0.05;利拉鲁肽组和安慰剂对照组的样本量比值为2:1,因此N2 (Sample Size Group 2)中选择Use R,R (Sample Allocation Ratio)中选择0.5;P1 (Treatment Group Proportion|H1)为本研究中利拉鲁肽组体重下降10%以上的研究对象比例,输入0.14;P2 (Control Group Proportion)为本研究中安慰剂对照组体重下降10%以上的研究对象比例,输入0.1。其它为默认选项,点击RUN。3、结果解读PASS软件给出了样本量计算的结果、参考文献、报告中的名词定义和总结性描述。在样本量计算结果中我们需要重点关注以下两列:1) Sample Size Grp 1 (N1):干预组样本量。干预组需要2097例研究对象。2) Sample Size Grp 2 (N2):对照组样本量。对照组需要1049例研究对象。但是可以看到,计算出来的样本量不是Protocol中写的例,这是因为上面计算得到的是研究所需的最少样本量。实际研究过程中,研究对象会不依从或失访,因此需要适当地扩大样本量。那样本量计算的结果在研究方案或者论文中怎么撰写呢?本研究为平行设计的随机双盲对照试验。干预组为利拉鲁肽治疗组,对照组为安慰剂治疗组,研究对象体重下降10%以上的人数比例为主要观察的结局指标。根据既往文献报道(或预试验结果),估计对照组体重下降10%以上的人数比例为10%。利拉鲁肽组的这个比例为14%。设α=0.05(双侧),把握度=0.90。利用PASS 11软件计算得到利拉鲁肽组的样本量N1=2097,安慰剂对照组的样本量N2=1049例。假定研究对象的失访率为10%,则需样本量N1=2097÷0.9=2330例,N2=1049÷0.9=1166例。最终利拉鲁肽组纳入研究对象2400例,安慰剂对照组纳入1200例。参考文献1. Pi-Sunyer X, et al. A Randomized, Controlled Trial of 3.0 mg of Liraglutide in Weight Management. N Engl J Med. 2015 Jul 2;373(1):11-22.
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
好东西,挺详细的呢,感谢分享!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
好详细!赞!谢谢分享
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
好东西,谢谢分享!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
学习了,一直找不到中文的教程。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
太好了,就缺这种
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园样本量计算-学术百科-知网空间
样本量计算
样本量计算
sample size calculating利用样本统计量对未知的总体参数进行估计推断,是抽样调查最基本的任务。设未知的总体参...但如把全部可能的样本都抽出来,一一计算其某一种统计量(如均值),再将这些统计量加以平均,若此均值(数理统计学称之为期望值)与总体真值吻合,就说样本的这
与"样本量计算"相关的文献前10条
目的探讨并验证非劣效临床试验样本量计算方法。方法通过理论公式的推导,得到非劣效临床试验样本量计算公式,并用随机模拟的方法,使用该公式计算出的样本量估计实际的检验效能,以验证公式的
本文描述了顾客满意度抽样调查的估计值的精度,对影响抽样调查估计值精度的因素进行了分析;用案例说明了计算抽样样本量的方法,对调查组织确认精度时需要考虑的因素进行了简述; 提出了确认
顺序统计量在可靠性评估和寿命预测中有广泛的应用。目前,样本容量较小时的顺序统计量均值、方差和协方差的数值计算已得到很好的解决,但是,由于计算精度问题,样本容量较大时的顺序统计量均
样本量是可以衡量设备抵御CPA攻击的重要指标,因此建立一种计算样本量的模型是很重要的。选择用统计学的方法通过计算样本量测定硬件的防护效果,这就可以让设计者在设计过程中通过计算了解
目的 :当评价指标为定性指标时 ,利用相对率作为标准判断非劣效性是一种方便易行的方法 ,本文目的在于解决这一背景下的样本量计算问题。方法 :利用随机模拟方法 ,在SAS下编写宏
正 引言在动植物育种工作中,有时已知来自同一总体的若干样本的某一统计量。由于抽样误差的存在,样本越小则其统计量误差越大。为更准确估计总体的相应参数,需合并样本。当然可以合并使用各
临床试验中所需病例数应符合统计学要求,以确保对所提出的问题给予可靠的回答。样本的大小通常以试验的主要指标来确定,同时应考虑试验设计类型、比较类型等。针对优效/非劣效/等效性试验的
信息熵理论在水质评价指标权重的确定中发挥了巨大的作用。为了探讨熵权计算过程中的影响因素,针对样本统计量变化对熵权的影响,采用Visual Basic编程计算与曲线拟合的方法对其进
讨论了应用设计效应间接计算不等概率抽群的单级整群抽样和二阶段抽样方案样本量的问题,其中包括:所论抽样方案设计效应的估计;估计所论总体的方差,并根据精度要求计算简单随机抽取基本抽样
在总体或者总体子集不大情况下的抽样调查中,往往不易得出合理的关于比例的区间估计。这一类问题在抽样调查实践中已经严重到非说不可的地步。文章讨论了在样本量不大或者(和)在总体不大时估
"样本量计算"的相关词
快捷付款方式
订购知网充值卡
<font color="#0-819-9993
<font color="#0-
<font color="#0-人人网 - 抱歉
哦,抱歉,好像看不到了
现在你可以:
看看其它好友写了什么
北京千橡网景科技发展有限公司:
文网文[号··京公网安备号·甲测资字
文化部监督电子邮箱:wlwh@··
文明办网文明上网举报电话: 举报邮箱:&&&&&&&&&&&&抽样调查的样本容量的确定方法;摘要:确定样本容量是抽样调查中重要的环节,影响到;关键词:样本容量;抽样调查;抽样误差;极限误差;抽样调查是根据随机原则,从总体中抽取部分实际数据;1.确定样本容量的必要性;1.1样本容量大小影响抽样估计的精确度;抽样估计的精确度是指样本的统计量与其所代表的总体;1.2样本容量大小影响抽样调查的成本和效益;样本量的设计通常受到研
抽样调查的样本容量的确定方法
摘要:确定样本容量是抽样调查中重要的环节,影响到抽样估计的精确度和调查的成本和效益。单位标志变异程度、抽样极限误差、抽样推断的可靠度、抽样类型和方法等影响到样本容量地确定。样本容量的确定可以根据由抽样误差、抽样极限误差和概率度推算出来的公式计算,也可以根据建立在过去抽取满足统计方法要求的样本量所累积下来的经验法则来确定。
关键词:样本容量;抽样调查;抽样误差;极限误差
抽样调查是根据随机原则,从总体中抽取部分实际数据构成样本,同时运用概率估计方法,依据样本信息推断总体数量特征的一种非全面统计调查。根据抽选样本的方法,抽样调查可以分为等概率抽样和非概率抽样两类。等概率抽样又称为随机抽样,是按照概率论和数理统计的原理,从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征做出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。样本是从总体中抽出的部分单位的集合,样本中所包含的单位数被称为样本容量,一般用n表示。确定样本容量是制定抽样调查方案中的一个非常重要的环节。
1.确定样本容量的必要性
1.1样本容量大小影响抽样估计的精确度
抽样估计的精确度是指样本的统计量与其所代表的总体值的接近程度。调查结果相对于总体真实值的精确度与样本容量直接相关。样本容量越大,抽样误差相对就会减少,估计精度就会提高;若样本容量太小,抽样误差就会增大,从而影响抽样估计的精确度。
1.2样本容量大小影响抽样调查的成本和效益
样本量的设计通常受到研究经费及调查时间的限制。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。若样本容量过大,调查单位增多,不仅增加人力、财力和物力的耗费,增加调查费用,而且还影响到抽样调查的时效性,从而不能充分发挥抽样调查的优越性。
因此,为节省调查费用,体现出抽样调查的优越性,在确定样本容量时,应在满足抽样调查对估计数据的精确度的前提下,尽量减少调查单位数,确保必要的抽样数目。
2.影响必要样本容量的主要因素
影响样本容量的因素是多方面的,在抽样调查总体、调查费用和调查时间既定的情况下,为确定最佳的样本容量,应首先分析影响样本容量的因素。从理论上说,影响样本容量的因素有以下几个方面:
2.1单位标志变异程度
单位标志变异程度一般用方差?2或成数方差P(1-P)的大小来表示。在其他
条件不变的情况下,为了达到同样的研究目的,总体单位标志的变异程度大,样本容量应越大;反之,总体单位标志的变异程度越小,则样本容量就应越少。二者成正比关系。
2.2抽样极限误差
抽样极限误差又叫允许误差,是指在一定的把握程度下保证样本指标与总体指标之间的抽样误差不超过某一给定的最大可能范围。在抽样推断中,需要把这个误差控制在一定的范围之内。抽样平均数极限误差一般用?表示,抽样成数极限误差用?P表示。在其他条件不变的前提下,所允许的抽样极限误差越小,即抽样估计的精确度要求越高,样本容量应越大;所允许的抽样极限误差越大,所需的样本容量就越小。二者成反比关系。
2.3抽样推断的可靠度
抽样推断的可靠度是指总体所有可能样本的指标落在一定区间的概率度,即允许误差范围的概率保证程度。概率度用Z?2表示,即置信水平1??的统计量,一般简写为t。在其他条件不变的情况下,抽样估计所要求的可靠程度越高,即概率保证程度越高,要求样本含有的总体信息就越多,只有增加样本容量才能满足高精确度的要求;反之,概率保证程度越低,所需的样本容量就越小。二者成正比关系。
2.4抽样类型和方法
概率抽样的主要类型有简单随机抽样、系统随机抽样、分层随机抽样、整群随机抽样、多阶段随机抽样等。在简单随机抽样中,根据同一单位是否允许重复抽取方式的不同,抽样方法可分为重复抽样和不重复抽样。由于在同样的条件下,不同的抽样方式会产生不同的抽样误差,因此,样本容量也应有所不同。
一般来说,分层随机抽样和系统随机抽样的样本容量可定得小些,若用简单随机抽样和整群随机抽样方式,抽样的样本容量就要定得大些。至于抽样方法,由于不重复抽样的误差小于重复抽样的误差,因此,不重复抽样的样本容量可比重复抽样的样本容量小些。
3.不同抽样方式下的样本容量确定
从上述分析中可以看出,影响样本容量的因素是多方面的,但必要样本容量是根据抽样误差、抽样极限误差和概率度推算出来的,在不同抽样方式下,计算公式有所差异。
3.1简单随机抽样的样本容量
简单随机抽样是指按照随机原则从总体单位中直接抽取若干单位组成样本。简单随机抽样中分为重复简单抽样和简单不重复抽样,因此,简单随机抽样的样本容量计算公式包括两种。
3.1.1重复抽样时的样本容量
在重复抽样条件下,样本容量的计算公式为:
n?t2?2?2或n?t2P(1?P)?2。
在以上公式中,n代表样本容量,t代表概率度Z?2,?代表极限误差,?2代表总体方差,P(1-P)表示成数方差。
3.1.2不重复抽样时的样本容量
在不重复抽样条件下,样本容量的计算公式为:
n?Nt2?2N?2?t2?2或n?Nt2P(1?P)N?2?t2P(1?P)
上式中,N代表样本总数。
3.2分层随机抽样的样本容量
分层随机抽样,也称类型随机抽样,是指首先将调查对象的总体单位按照一定的标准分成各种不同的类别(或组),然后根据各类别(或组)的单位数与总体单位数的比例确定从各类别(或组)中抽取样本的数量,最后按照随机原则从各类(或组)中抽取样本。
对于分层抽样,在总的样本量一定时,一个重要的问题是各层应该分配多少样本量。实际工作中有不同的分配方法,可以按对各层进行常数分配,也可以按各层单位数占总体单位数的比例分配,还可以采用在总费用一定条件下使估计量方差达到最小的最优分配等,其中等比例分配是较为常用的方法。
分层抽样是对每一组抽样,不存在样本组间误差,抽样平均误差取决于各组内方差的平均水平,即以各组样本单位数为权数,计算各组内方差的平均数。因此可用组内方差平均数计算出抽样平均误差。
3.2.1重复抽样时的样本容量
在重复抽样条件下,样本容量的计算公式为:
n?t2?2?2或n?t2P(1?P)?2 在以上公式中,?2是组内平均方差,P(1?P)代表成数的平均组内方差。?2??ni?i2n,其中ni代表各组样本单位数,?i2代表各组的组内方差,n代表样本总数。
3.2.2不重复抽样时的样本容量
在不重复抽样条件下,样本容量的计算公式为:
n?Nt2?2N?2?t2?2或n?Nt2P(1?P)N?2?t2P(1?P)
3.2.3各层样本量的确定
当样本容量n确定之后,各层应抽取的样本单位数可采用等比例法进行分nN配,计算公式为:ni?i
上式中,ni为第i层应抽取的样本数,n为样本容量,Ni为第i层样本数,N为总体单位数。
3.3整群随机抽样的样本容量
整群随机抽样又称聚类抽样,是把总体先分为若干个子群,然后抽取若干群作为样本单位的一种抽样方式。整群抽样是对选中的群进行全面调查,所以只存在群间抽样误差,不存在群内抽样误差,因此抽样平均误差可根据群间方差推算出来。由于整群抽样一般是不重复抽样,故应按不重复抽样计算必要的抽样群数。
由整群抽样的极限误差和抽样标准误差公式导出样本容量计算公式为: n?Nt2?r2N?2?t2?r2或n?Nt2Pr(1?Pr)N?2?t2Pr(1?Pr)
上式中Pr代表成数的群间方差,?代表群间方差,?2
r2r?(?i?)2
i是第i群样本平均数,是全样本平均数,r是抽取的群数。
3.4等距抽样样本容量的确定
等距抽样也称为系统抽样、机械抽样,是将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。
3.4.1无关标志排队的等距抽样
若对总体采用按无关标志排队的等距抽样时,可采用简单随机抽样的公式确定等距抽样的样本容量。由于等距抽样一般都是不重复抽样,应采用在不重复抽样条件下的样本容量的计算公式。
3.4.1有关标志排队的等距抽样
若对总体采用按有关标志排队的等距抽样,则样本容量的确定,可采用分层抽样的样本容量公式确定样本容量。但应注意有序系统抽样的样本容量计算所需的平均组内方差应根据以往的资料作出估计。
4.确定样本容量的相关问题
4.1有关总体方差的问题
样本容量的确定是在调查之前进行的,这样总体方差(或样本方差)一般是未知的。在实际工作中往往利用有关资料代替。如果在本次调查之前,曾搞过同类问题的全面调查,可用全面调查的有关资料代替;在进行正式调查之前,组织两次或两次以上试验性抽样,用试验样本的方差来代替;成数方差在完全缺乏资料的情况下,可用成数方差的极大值0.25(P=0.5)来代替。
4.2一次调查满足多项需要
应用公式计算的样本容量是最低的,也是最必要的样本容量。有时在进行抽样调查时,一次调查要同时满足平均数和成数两个方面需要,这样根据样本容量计算公式得出的必要样本容量可能不相等。为了同时满足两个推断的要求,一般应选用其中较大的样本单位数作为样本容量。
4.3确定样本容量的经验法则
在抽样调查中,除上述利用公式来计算样本容量,还有一种常用的方法,即采用经验法则。经验法则是建立在过去抽取满足统计方法要求的样本量所累积下来的经验。使用这个方法时很少需要统计方法知识,但是得出的样本大小很接近统计方法计算出的结果。在采用经验法则时,有关样本量大小的一项原则是:总体越小,要得到精确样本,即有较高概率得出与总体相同结果的样本,抽样比率就要越大。较大的总体能够使较小的抽样比得出同样好的样本。这是因为随着总体人数的增长,样本大小的精确性会随之增加。
对于规模较小的总体(1000人以下),研究者需要比较大的抽样比率(大约30%)为要有较高的精确性,这时需要大约300个样本;对于中等规模的总体(如10000人),要达到同样的精确度,抽样比率为10%或大约1000个样本量就可以了。就大规模的总体(超过150000)而言,抽样比率为1%或大约1500个样本量就能得出正确的结果。如果是非常大的总体(超过1000万)。研究者可以使用0.025%抽样比或者大约2500个样本,就能够得出精确的结果。当抽样比率非常小时,总体大小的影响力就不那么重要了。从2亿总体中抽取一个2500左右的样本,与从1000万总体中抽出同样规模的样本,它们的精确程度是完全相同的。 参考文献
[1] 肖彦花,马知遥.统计学[M].长沙:国防科技大学出版社,2004.
[2] 胥学跃,张樊主编.统计学基础[M].北京:北京邮电大学出版社.
[3] 汤伟伟.走向营销第一步[M].北京:首都师范大学出版社,2009.
[4] 李英枫.新编统计学[M].北京:北京大学出版社,2008.
[5] 赵振伦.社会经济统计学原理[M].大连:东北财经大学出版社,1997.
[6] 张晓庆,王玉良,王景涛.统计学[M].北京:科学出版社,2007.
[7] 高巍.统计学原理[M].北京:中国市场出版社,2009.
[8] 龚曙明.应用统计学(第2版)[M].北京:清华大学出版社,2005.
[9] 王怀伟.统计学教程[M].北京:清华大学出版社,2004.
包含各类专业文献、生活休闲娱乐、中学教育、行业资料、幼儿教育、小学教育、文学作品欣赏、外语学习资料、91抽样调查的样本容量的确定方法等内容。 
 (四)抽样方法不同 在相同的条件下, 重复抽样的抽样平均误差比不重复抽样的抽样...二、样本容量的计算 在计算样本容量时,必须知道总体的方差,而在实际抽样调查前,...  (四)抽样方法不同 在相同的条件下,重复抽样的抽样平均误差比不重复抽样的抽样...在计算样本容量时,必须知道总体的方差,而在实际抽样调查前,往往总体的方 差是...  本文主要围绕这几个 问题,讨论在不同的抽样方式下确定样本容量的方法,导出其计算公式,并进一 步通过实例说明这些公式的应用. 关键词: 样本容量,抽样调查,抽样方式...  数的大小对调查结果的准确度有很大的影响,从 统计上可以计算出每个抽样样 本数...2. 定量研究中, 采用不同数量的抽样样本, 可达到怎样的研究效果? 研究方法: ...  抽样误差越小,调查的精度就越高,精度的另一种表示方法是给出总体 目标量的...调查单位少,代表性强,所需调查人员少; ③抽选的调查样本数量经过科学的计算确定...  确定哪一个大 10、从 2000 名学生中按不重复抽样方法抽取了 100 名进行调查,...影响样本容量大小的因素有 ( ACDE ) A、总体标准差的大小 B、样本各单位标志...  选取调查单位的方式不同 B.调查的目的不同 C.调查的对象不同 D.调查的误差...无法确定 1 13.在抽样推断中,样本容量 A.越小越好 B.取决于同统一的抽样...  先计算出来的 E、其大小是可能控制的 3.从总体中抽取样本单位的具体方法有(BC...调查方式来消除的 D、只能在调查结束后才能计算的 D、可以计算,但不能控制抽样...  抽样方法概念复习【抽样调查的步骤和方法等】_工学_高等教育_教育专区。1、抽样...6. 根据抽样方案的类型、对主要目标量的精确度要求及置信度等等,确定样本量,并...}

我要回帖

更多关于 一个容量为80的样本 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信