《應用統(tǒng)計學》第6章:置信區(qū)間估計
單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,*,*,本章教學目標:,(1)單個正態(tài)總體均值和方差的區(qū)間估計。,(2)總體比例的區(qū)間估計。,(3)均值和比例置信區(qū)間估計中的樣本容量確定。,(4)兩個正態(tài)總體的均值差和方差比的區(qū)間估計。,(5)單側置信區(qū)間估計。,第6章 置信區(qū)間估計,1,2,由于點估計存在誤差,因此僅對總體參數(shù)作出點估計是不夠的,還需要了解估計的精度及其誤差。,參數(shù)的區(qū)間估計就是在給定的可信度下,估計未知參數(shù)的可能取值范圍。,設,為總體分布的未知參數(shù),,若由樣本確定的,兩,個統(tǒng)計量,和,對給定的概率,(,0,Z,=,0,f,(x),x,z,1-,二.總體均值,的區(qū)間估計,如圖所示,,(,Z,)=1-,,,因此,,可由正態(tài)分布表,得到,Z,。,如:要查,Z,0.025,,,由正態(tài)分布表可查得:,(1.96,)=0.975=1-0.025,,故,Z,0.025,=1.96,11,由正態(tài)分布的性質可得,對給定的置信度1-,,,0,f,(x),x,z,/2,/2,-z,/2,/2,1-,N,(0,1),由此可得,從而,的置信度為 1-,的,置信區(qū)間為,為便于記憶和理解,將,的置信區(qū)間表示為如下形式:,2.,2,已,知時總體均值,的區(qū)間估計,有,其中,d,稱為估計的,允許誤差,。,12,可用 Excel 的統(tǒng)計函數(shù) NORMSINV 返回,Z,。,語法規(guī)則如下:,格式:NORMSINV(1-,),功能:返回,Z,的值。,說明:NORMSINV(,),返回的是,Z,1-,的值。,用 Excel 求,Z,13,3.,t,分布,設,X,N,(0,1),,Y,2,(,n,),,且,X,與,Y,相互,獨立,,則隨機變量,服從自由度為,n,的,t,分布,,,記為,t,t,(,n,)。,14,t,分布密度函數(shù)的圖形,標準正態(tài)分布分布是,t,分布的極限分布。,當,n,很大時,,t,分布近似于標準正態(tài)分布。,x,f,(,x,),0,n,=1,n,=4,n,=10,n,=,,N,(0,1),15,0,x,f,(,x,),t,分布的右側,分位點,t,(,n,),t,(,n,),為,t,分布中滿足下式的右側,分位點:,P,t,t,(,n,),=,由,給定的概率,,可查表得到,t,(,n,)。,由,t,分布的對稱性,可得:,t,1-,(,n,)=-,t,(,n,),。,t,(,n,),t,1,-,(,n,),=,-,t,(,n,),16,可用 Excel 的統(tǒng)計函數(shù) TINV 返回,t,(,n,)。,語法規(guī)則如下:,格式:TINV(2,n,),功能:返回,t,(,n,)的值。,說明:TINV(,n,)返回的是,t,/2,(,n,)的值。,用 Excel 求,t,/2,(,n,),17,4,.,2,未知時總體均值,的區(qū)間估計,t,(,n,-1),設總體,X,N,(,2,),,和,S,2,分別為樣本均值和樣本方差。,由此可得,的置信度為 1-,的,置信區(qū)間為,因此,對給定的置信度 1-,,,有,即,X,1,X,2,X,n,為,X,的容量為,n,的樣本,,可以證明,:,18,用樣本比例代替總體比例,,,設總體比例為,P,,,則當,nP,和,n,(1-,P,)都大于5時,,樣本成數(shù),p,近似服從均值為,P,,,方差為,P,(1-,P,)/,n,的正態(tài),分布。,從而,對給定的置信度1-,,,由,可得總體成數(shù),P,的置信度,為 1-,的,置信區(qū)間為,6.2 總體比例的區(qū)間估計,19,【例3】,求例,1中元件平均壽命,的95%置信區(qū)間,。,故所求,的 95%置信區(qū)間為,解:,由例1,,/2=0.025,,=1423.1,,S,=196.5,,=1-0.95=0.05,,n,=10,,查表得,t,0.025,(9)=2.2622,可用 Excel 的【工具】“數(shù)據(jù)分析”“描述統(tǒng)計”,求解正態(tài)總體均值,的置信區(qū)間。,20,課堂練習2:,某車床加工的缸套外徑尺寸,X,N,(,2,),,下面是隨機測得的10個加工后的缸套外徑尺寸(mm),,90.01,90.01,90.02,90.03,89.99,89.98,89.97,90.00,90.01,89.99,(,),求,的置信度為95%的置信區(qū)間;,21,【,例4】,某廠為了解產品的質量情況,隨機抽取了300件產品進行檢驗,其中有5件次品,求該廠產品次品率的置信度為95%的置信區(qū)間。,解,:產品次品率為比例,,=1-0.95=0.05,,/2=0.025,,n,=300,,查表得,Z,0.025,=1.96,,樣本成數(shù),該廠產品次品率的置信度為95%的置信區(qū)間為,22,案例思考題,國外民意調查機構在進行民意調查時,通常要求在95%的置信度下將調查的允許誤差(即置信區(qū)間的,d,值)控制在3%以內。,問為滿足該調查精度要求,至少需要多大的樣本?,如果要求置信度達到99%,調查誤差仍為3%,此時至少需要多大的樣本?,23,案例思考題解答(1),本案例中,,故需要的樣本容量至少為,24,案例思考題解答(2),如果要求置信度達到99%,則,Z,/2,=,Z,0.005,=2.575,,25,6.3 樣本容量確定,前面的分析都是在給定的樣本容量和樣本數(shù)據(jù)下求置信區(qū)間。但在實際應用中,應當在隨機抽樣前就確定所需抽取的樣本容量。,抽取的樣本容量過大,雖然可以提高統(tǒng)計推斷的精度,但將增加不必要的人力、物力、費用和時間開支;,如果抽取的樣本容量過小,則又會使統(tǒng)計推斷的誤差過大,推斷結果就達不到必要的精度要求。,確定樣本容量的原則,在滿足所需的置信度和允許誤差條件(置信區(qū)間的,d,值)下,確定所需的最低樣本容量。,26,1.總體均值區(qū)間估計時樣本容量的確定,在給定置信度和允許誤差,d,的條件下,由,可得,其中總體標準差或樣本標準差也是未知的,通??梢韵韧ㄟ^小規(guī)模抽樣作出估計。,由于使用的是近似公式,可知實際采用的最低樣本容量應比計算結果稍大。,27,【例6】,在例,3 元件平均壽命的區(qū)間估計問題中,要求,在95%的置信度下,使估計的允許誤差不超過其平均壽命的10%,并設已得到例1的先期抽樣數(shù)據(jù)。求所需的最低樣本容量。,其他條件不變,在99%的置信度下求所需最低樣本容量。,解,:由例1,,S,=196.5,,d,=1423/10=142.3,可知取,n,=10 已能滿足所給精度要求。,可知此時取,n,=20 就能滿足所給精度要求。,在總體均值的區(qū)間估計中,通常,n,=30 就稱為,大樣本,。,在大樣本時,無論總體服從什么分布,都可用前述公式進行區(qū)間估計,。,28,2.總體比例區(qū)間估計時樣本容量的確定,其中樣本成數(shù),p,同樣可先通過小規(guī)模抽樣作出估計,也可根據(jù)其他信息估計,或取 0.5。,29,【例7】,某企業(yè)要重新制定產品抽樣檢驗的規(guī)范。已知過去檢驗的次品率在3.6%左右,現(xiàn)要求允許誤差不超過2%,置信度為95%。問每次至少應抽查多少產品?,解,:由題意,要推斷的是總體成數(shù),,p,=0.036,1-,p,=0.964,,d,=0.02,,=0.05,,z,/2,=,z,0.025,=1.96,故每次至少應抽查 334 件產品。,由此可知,在總體比例的區(qū)間估計問題中,要達到一定的精度要求,樣本,容量至少要在幾百以上。,30,【例5】,(1)求例1中元件平均壽命的95%置信下限。,(2)求元件壽命方差的95%置信上限。,解,:(1),從而,的,單側,1-,置信下限為,本例中,,t,0.05,(9)=1.8331,故所求置信下限為,196.5/,該在95%的置信度下,該元件的平均壽命大于1309.2小時。,=1390.2,可得,由,6.4 單側置信限的區(qū)間估計,31,同理可得,2,的置信度為 1,-,的單側置信上限為,本例中,,故所求,2,的95%置信上限為,9,196.5,2,/3.325=323.3,2,(小時,2,),由以上分析可知,求單側置信限與求雙側置信限的差別僅在于用相應分布的右側,分位點代替雙側區(qū)間估計公式中的右側,/2 分位點。,解(2),:,2,的,置信,上限,32,區(qū)間估計小結,P,2,2,已知,2,未知,雙側,雙側,雙側,雙側,單側上限,單側上限,單側下限,單側下限,33,