《統(tǒng)計(jì)學(xué)-兩個(gè)率或多個(gè)率的比較》由會(huì)員分享,可在線閱讀,更多相關(guān)《統(tǒng)計(jì)學(xué)-兩個(gè)率或多個(gè)率的比較(25頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、Click to edit Master title style,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,*,計(jì)數(shù)資料的統(tǒng)計(jì)推斷,浙江大學(xué)流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室,李秀央,Email:,率的抽樣誤差與可信區(qū)間,一、率的抽樣誤差與標(biāo)準(zhǔn)誤,二、總體率的可信區(qū)間,一、率的抽樣誤差與標(biāo)準(zhǔn)誤,樣本率(,p),和總體率(,),的差異稱為率的,抽樣誤差,(sampling error of rate),用,率的標(biāo)準(zhǔn)誤,(,standard error of rate)度量。,如果總體
2、率,未知,用樣本率,p,估計(jì),標(biāo)準(zhǔn)誤的計(jì)算,二、總體率的可信區(qū)間,總體率的可信區(qū)間(confidence interval of rate):,根據(jù)樣本率推算總體率可能所在的范圍,率的統(tǒng)計(jì)學(xué)推斷,一、樣本率與總體率比較,u,檢驗(yàn),二、兩個(gè)樣本率的比較,u,檢驗(yàn),一、樣本率與總體率比較的,u,檢驗(yàn),u,檢驗(yàn)的條件:,n p,和,n(1-p),均大于5時(shí),二、兩個(gè)獨(dú)立樣本率比較的,u,檢驗(yàn),表5-1 兩種療法的心血管病病死率比較,療法,死亡,生存,合計(jì),病死率(%),鹽酸苯乙雙胍,26(,X,1,),178,204(,n,1,),12.75(,p,1,),安慰劑,2(,X,2,),62,64(,n
3、,2,),3.13(,p,2,),合 計(jì),28,240,268,10.45(,p,c,),u,檢驗(yàn)的條件:,n,1,p,1,和,n,1,(,1-p,1,),與,n,2,p,2,和,n,2,(,1-p,2,)均 5,卡方檢驗(yàn),2,檢驗(yàn)(Chi-square test)是現(xiàn)代統(tǒng)計(jì)學(xué)的創(chuàng)始人之一,英國(guó)人K.Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計(jì)方法,可用于兩個(gè)或多個(gè)率間的比較,計(jì)數(shù)資料的關(guān)聯(lián)度分析,擬合優(yōu)度檢驗(yàn)等等。,本章僅限于介紹兩個(gè)和多個(gè)率或構(gòu)成比比較的,2,檢驗(yàn)。,一、卡方檢驗(yàn)的基本思想(1),療法,死亡,生存,合計(jì),病死率(%),鹽酸苯乙雙胍,26(,a
4、,),178(,b,),204(,a,+,b,),12.75(,p,1,),安慰劑,2(,c,),62(,d,),64(,c,+,d,),3.13(,p,2,),合 計(jì),28(,a+c,.,),240(,b+d,.,),268(,a,+,b,+,c,+,d=n,),10.45(,p,c,),表5-1 兩種療法的心血管病病死率的比較,22表或四格表(fourfold table),實(shí)際頻數(shù),A,(actual frequency),(,a、b、c、d,)的,理論頻數(shù),T,(,theoretical frequency),(,H,0,:,1,=,2,=,):,a,的理論頻數(shù),(,a,+,b,),p
5、,c,=(,a,+,b,)(,a+c,.,)/,n,=n,R,n,C,/n=21.3,b,的理論頻數(shù),(,a,+,b,)(1-,p,c,)=(,a,+,b,)(,b+d,.,)/,n,=n,R,n,C,/n=182.7,c,的理論頻數(shù),(,c,+,d,),p,c,=(,c,+,d,)(,a,+c)/,n,=n,R,n,C,/n=6.7,d,的理論頻數(shù),(,c,+,d,)(1-,p,c,)=(,c,+,d,)(,b+d,.,)/,n,=n,R,n,C,/n=57.3,一、卡方檢驗(yàn)的基本思想(2),各種情形下,理論與實(shí)際偏離的總和即為卡方值(chi-square value),它服從自由度為,的卡
6、方分布。,3.84,7.81,12.59,P,0.05的臨界值,2,分布,(,chi-square distribution,),2,檢驗(yàn)的基本公式,上述,基本公式,由,Pearson提出,因此軟件上常稱這種檢驗(yàn)為Peareson卡方檢驗(yàn),下面將要介紹的其他卡方檢驗(yàn)公式都是在此基礎(chǔ)上發(fā)展起來(lái)的。它不僅適用于四格表資料,也適用于其它的“行,列表”。,二、四格表專用公式(1),為了不計(jì)算理論頻數(shù)T,可由,基本公式,推導(dǎo)出,,直接由各格子的實(shí)際頻數(shù)(,a,、,b,、,c,、,d,)計(jì)算卡方值的公式:,二、四格表專用公式(2),2,(1),u,2,2.1949,2,4.82(n40,所有T,5時(shí),),
7、三、連續(xù)性校正公式(1),2,分布是一連續(xù)型分布,而行列表資料屬離散型分布,對(duì)其進(jìn)行校正稱為連續(xù)性校正(correction for continuity),又稱Yates校正(Yates correction)。,當(dāng),n,40,而1,T,5時(shí),用,連續(xù)性校正,公式,當(dāng)n40或T1時(shí),用Fisher精確,檢驗(yàn),(Fisher exact test),校正公式,:,三、連續(xù)性校正公式(2),因?yàn)?,T,5,且,n,40時(shí),所以應(yīng)用連續(xù)性校正,2,檢驗(yàn),四、配對(duì)四格表資料的,2,檢驗(yàn),配對(duì)四格表資料的,2,檢驗(yàn)也稱McNemar檢驗(yàn)(,McNemars test,),H,0,:,b,,,c,來(lái)自同
8、一個(gè)實(shí)驗(yàn)總體(兩種劑量的毒性無(wú)差異);,H,1,:,b,,,c,來(lái)自不同的實(shí)驗(yàn)總體(兩種劑量的毒性有差別);,=0.05。,五、行列(,R,C,)表資料的,2,檢驗(yàn),R,C,表的,2,檢驗(yàn)通用公式,幾種,R,C,表的檢驗(yàn)假設(shè),H,0,R,C,表的計(jì)算舉例,R,C,表,2,檢驗(yàn)的應(yīng)用注意事項(xiàng),1.對(duì)RC表,若較多格子(1/5)的理論頻數(shù)小于5,或有一個(gè)格子的理論頻數(shù)小于1,則易犯第一類錯(cuò)誤。,出現(xiàn)某些格子中理論頻數(shù)過(guò)小時(shí)怎么辦?,(1),增大樣本含量,(最好?。?(2),刪去,該格所在的行或列(丟失信息!),(3)根據(jù),專業(yè)知識(shí),將該格所在行或列與別的行或列,合并,。(丟失信息!甚至出假象),R,C,表,2,檢驗(yàn)的應(yīng)用注意事項(xiàng),2.多組比較時(shí),若效應(yīng)有強(qiáng)弱的等級(jí),如+,+,+,最好采用后面的非參數(shù)檢驗(yàn)方法。,2,檢驗(yàn)只能反映其構(gòu)成比有無(wú)差異,不能比較效應(yīng)的平均水平。,3.行列兩種屬性皆有序時(shí),可考慮趨勢(shì)檢驗(yàn)或等級(jí)相關(guān)分析。,