日韩欧美国产精品,在线播放国产区,欧美人与物videos另类一,日韩经典欧美一区二区三区,成人午夜视频在线,无毒不卡,香蕉97碰碰视频免费

統(tǒng)計學第6章抽樣和抽樣分布不講概率

上傳人:niu****ong 文檔編號:253267936 上傳時間:2024-12-10 格式:PPT 頁數(shù):127 大小:1.34MB
收藏 版權申訴 舉報 下載
統(tǒng)計學第6章抽樣和抽樣分布不講概率_第1頁
第1頁 / 共127頁
統(tǒng)計學第6章抽樣和抽樣分布不講概率_第2頁
第2頁 / 共127頁
統(tǒng)計學第6章抽樣和抽樣分布不講概率_第3頁
第3頁 / 共127頁

下載文檔到電腦,查找使用更方便

14.9 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《統(tǒng)計學第6章抽樣和抽樣分布不講概率》由會員分享,可在線閱讀,更多相關《統(tǒng)計學第6章抽樣和抽樣分布不講概率(127頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、單擊此處編輯母版標題樣式,,單擊此處編輯母版文本樣式,,第二級,,第三級,,第四級,,第五級,,,,*,第6章 抽樣與抽樣分布,,,第 6 章 抽樣與抽樣分布,6.1,抽樣的基本概念,,6.2 抽樣分布基本理論,,6.3 樣本,抽樣分布,,6.4 抽樣誤差的計算,,,學習目標,了解抽樣中的概率抽樣方法,,理解抽樣分布的意義,,了解抽樣分布的形成過程,,理解中心極限定理和大數(shù)定理,,理解抽樣分布的性質(zhì),,6.1,抽樣的基本概念,6.1.1,抽樣推斷,,,6.1.2,抽樣的方法,,,6.1.3,樣本容量和樣本個數(shù),,,6.1.4,參數(shù)和樣本統(tǒng)計量,,,6.15,抽樣框,,,6.1.

2、6,抽樣的組織形式,,,6.1.7,抽樣誤差,,,,,從研究現(xiàn)象總體的所有單位中,按照,隨機原則,抽取部分單位作為樣本,然后以樣本的觀測結果對總體的數(shù)量特征作出具有,一定可靠程度和精度,的估計或推斷的一種統(tǒng)計調(diào)查方法。,抽樣推斷的含義,總體,?,?,?,?,?,?,?,隨機樣本,?,?,,1.在調(diào)查單位的抽取上遵循隨機原則,抽樣推斷方法的,特點,2.以樣本的數(shù)量特征去推斷總體的數(shù)量特征,3.存在抽樣誤差,可計算并加以控制,,一、了解不能或難以采用全面調(diào)查的總體的數(shù)量特征,,二、與全面調(diào)查相結合,修正和補充全面調(diào)查,,三、在生產(chǎn)過程中進行質(zhì)量控制,,四、可以對總體的某種假設進行檢驗,,,抽樣推斷

3、的,作用,,(一)參數(shù)估計,,(二)假設檢驗,抽樣推斷的,內(nèi)容,,6.1,抽樣的基本概念,6.1.1 抽樣推斷,,6.1.2,抽樣的方法,,,6.1.3,樣本容量和樣本個數(shù),,,6.1.4,參數(shù)和樣本統(tǒng)計量,,,6.15,抽樣框,,,6.1.6,抽樣的組織形式,,,6.1.7,抽樣誤差,,,,6.1.2 抽樣的方法,抽樣的方法,重復抽樣,不重復抽樣,,,重復抽樣:也叫回置抽樣。,,特點:每個單位在每次抽中機會一樣。,,不重復抽樣:也叫不回置抽樣。,,特點:每個單位在每次抽中機會不一樣;每個單位最多只能被抽中一次。,,不重復抽樣的抽樣平均誤差小于重復抽樣的抽樣平均誤差。,,,,6.1.1 抽樣推

4、斷,,,6.1.2,抽樣的方法,,,樣本容量和樣本個數(shù),,,6.1.4,參數(shù)和樣本統(tǒng)計量,,,6.15,抽樣框,,,6.1.6,抽樣的組織形式,,,6.1.7,抽樣誤差,,,,6.1.3 樣本容量和樣本個數(shù),樣本容量:樣本中的單位數(shù),通常用字母,n,表示。,,通常,,n≥30,的樣本稱為大樣本,,n,<,30,的樣本稱為小樣本。,,樣本個數(shù):從總體中可能抽得的樣本的數(shù)目,,,樣本的可能數(shù)目,從總體N中隨機抽取n個樣本單位共有多少種可能的抽選結果與抽樣方法和是否考慮順序有關。有以下四種組合:,⒈ 重復抽樣考慮順序,⒉ 不重復抽樣考慮順序,3. 不重復抽樣不考慮順序,4 重復抽樣不考慮順序(不常用

5、),,⒈ 重復抽樣考慮順序的可能樣本數(shù)目:,⒉ 不重復抽樣考慮順序的可能樣本數(shù)目:,共n個,3 不重復抽樣不考慮順序的可能樣本數(shù)目:,,6.1,抽樣的基本概念,6.1.1 抽樣推斷,,6.1.2 抽樣的方法,,6.1.3 本容量和樣本個數(shù),,6.1.4,參數(shù)和樣本統(tǒng)計量,,,6.15,抽樣框,,,6.1.6,抽樣的組織形式,,,6.1.7,抽樣誤差,,6.1.4 參數(shù)和統(tǒng)計量,參數(shù)(parameter),,來描述總體數(shù)量特征的指標,又稱總體指標。即對總體特征的數(shù)量描述。參數(shù)已知,總體的分布特征就已知。,,所關心的參數(shù)主要有總體均值(,?,),、標準差(,?,)、總體比例(P/,),等,,用 ?

6、 表示,,參數(shù)的特點:參數(shù)的數(shù)值是客觀存在的,總體一定,參數(shù)就唯一確定,但卻是未知的。,,,,,統(tǒng)計量(statistic),,又稱樣本指標或估計量,是根據(jù)樣本數(shù)據(jù)計算出來的一些量,用以推斷總體參數(shù)(總體指標)的綜合指標。,,特點:是隨樣本不同而不同的,隨機變量,不含未知參數(shù)。,,所關心的樣本統(tǒng)計量有:樣本均值(,?,x,)、樣本標準差(,s,)、樣本比例(,p,)等,,用,,表示,,,,,平均數(shù),,標準差,,比例,參數(shù),,?,,?,,統(tǒng)計量,,?,x,,s,,p,?,?,?,?,?,?,?,?,總體,?,?,?,樣本,,6.1,抽樣的基本概念,6.1.1 抽樣推斷,,6.1.2 抽樣的方法,

7、,6.1.3 本容量和樣本個數(shù),,6.1.4,參數(shù)和樣本統(tǒng)計量,,,6.15,抽樣框,,,6.1.6,抽樣的組織形式,,,6.1.7,抽樣誤差,,6.15抽樣框,,抽樣框:全部抽樣單位的名單框架。抽樣框的好壞通常會直接影響到抽樣調(diào)查的隨機性和調(diào)查效果。有如下幾種抽樣框形式:,,名單抽樣框:列出全部總體單位的名錄一覽表。如職工名單,企業(yè)名單。,,區(qū)域抽樣框:按地理位置將總體范圍劃分為若干小區(qū),以小區(qū)為單位進行抽樣。如市住房調(diào)查劃分為街道、區(qū)片。,,時間抽樣框:將總體全部單位按時間順序排列,每隔一定時間抽樣。如流水線抽樣進行產(chǎn)品質(zhì)檢。,,,,6.1,抽樣的基本概念,6.1.1 抽樣推斷,,6.1.

8、2 抽樣的方法,,6.1.3 本容量和樣本個數(shù),,6.1.4 參數(shù)和樣本統(tǒng)計量,,6.15 抽樣框,,6.1.6,抽樣的組織形式,,,6.1.6,抽樣誤差,,6.1.6,抽樣的組織形式,一、簡單隨機抽樣,,二、分層抽樣,,三、系統(tǒng)抽樣,,四、整群抽樣,,五、多階段抽樣,,,——對總體單位逐一編號,然后按隨機原則直接從總體中抽出若干單位構成樣本,應用,僅適用于規(guī)模不大、內(nèi)部各單位標志值差異較小的總體,是最簡單、最基本、最符合隨機原則,,,但同時也是抽樣誤差最大的抽樣組織形式,簡單隨機抽樣,(,simple random sampling,),抽簽、隨機數(shù)字表法,,59079 46755

9、 72348 69595 53408 92708 67110 68260 79820 91123,,48391 76486 60421 69414 37271 89276 07577 43880 08133 09898,,67072 33693 81976 68018 89363 39340 93294 82290 95922 96329,,86050 07331 89994 36265 62934 47361 25352 61467 51683 43833,

10、,84426 40439 57595 37715 16639 06343 00144 98294 64512 19201,,注意:,,必須先對總體中的每一個單位進行編碼或編號,確定抽樣框。,,簡單隨機抽樣適合于調(diào)查標志在各單位分布較均勻的總體,一般情況下,簡單隨機抽樣的效果相對差些。,,,,——將總體全部單位分類,形成若干個類型組,然后從各類型中分別抽取樣本單位組成樣本。,總體,,N,樣本,,n,等額抽取,等比例抽取,最優(yōu)抽取,···,···,能使樣本結構更接近于總體結構,提高樣本的,,代表性;能同時推斷總體指標和各子總體的指標,分層抽樣,(stratifi

11、ed sampling),,注意:,,1、隨機性,,2、分層抽樣要求事先對總體有較多的了解。,,3、分層抽樣對層而言是全面調(diào)查,對層內(nèi)單位而言是非全面調(diào)查。,,4、能避免明顯的偏高或偏低情況。,,5、適合于調(diào)查標志在各單位間的分布差異大的總體。,,等距抽樣/機械抽樣,——將總體單位按某一標志排序,而后按一定的間隔抽取樣本單位。,······,隨機起點,半距起點,對稱起點,(總體單位按某一標志排序),按無關標志排隊,其抽樣效果相當于,簡單隨機抽樣,;按有關標志排隊,其抽樣效果相當于,類型抽樣,。,系統(tǒng)抽樣,(systematic sampling),,,—— 將總體全部單位分為若干,“群”,,然

12、后隨機抽取一部分,“群”,,被抽中群體的所有單位構成樣本,例:總體群數(shù)R=16 樣本群數(shù)r=4,A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,L,H,P,D,樣本容量,簡單、方便,能節(jié)省人力、物力、財,,力和時間,但其樣本代表性可能較差,整群抽樣,(cluster sampling),,,—— 指分兩個或兩個以上的階段來完成抽取樣本單位的過程,例:在某省100多萬農(nóng)戶抽取1000戶調(diào)查農(nóng)戶生產(chǎn)性投資情況。,,第一階段:從該省所有縣中抽取5個縣,第二階段:從被抽中的5個縣中各抽4個鄉(xiāng),第三階段:從被抽中的20個鄉(xiāng)中各抽5個村,第四階段:從被抽中的100個村中各抽10

13、戶,樣本n=100×10=1000(戶),多階段抽樣,,調(diào)查對象的性質(zhì)特點,,對調(diào)查對象的了解程度,,抽樣誤差的大小,,人力、財力和物力等條件的限制,在實際工作中,選擇適當?shù)某闃咏M織方式主要應考慮:,抽樣組織方式的選擇,,6.1,抽樣的基本概念,6.1.1 抽樣推斷,,6.1.2 抽樣的方法,,6.1.3 本容量和樣本個數(shù),,6.1.4 參數(shù)和樣本統(tǒng)計量,,6.1.5 抽樣的組織形式,,6.1.6,抽樣誤差,,抽樣中的誤差,登記性誤差,也叫調(diào)查誤差,代表性誤差,系統(tǒng)性誤差,偶然性誤差,偏差,抽樣誤差,抽樣中的誤差,(抽樣誤差的計算在后邊講),,6.2 抽樣分布基本理論,6.2.1,中心極限定理

14、,,,6.2.2,正態(tài)分布的再生定理,,,6.2.3,大數(shù)定律,,,6.2.4,三種不同性質(zhì)的分布,,,6.2.5,常見的幾種抽樣分布,,,,,,,中心極限定理:,設從均值為,?,,方差為,?,2,的一個任意總體中采取重復抽樣抽取容量為,n,的樣本,當,n,充分大時,樣本均值的抽樣分布近似服從均值為,μ,、方差為,σ,2,/,n,的正態(tài)分布,不論總體服從何種分布,只要其數(shù)學期望和方差存在,對這一總體進行重復抽樣時,當樣本量,n,充分大,就趨于正態(tài)分布,,該定理為均值的抽樣推斷奠定了理論基礎。,中心極限定理,,中心極限定理,當樣本容量足夠大時(,n,,?,30) ,樣本均值的抽樣分布逐漸趨于正態(tài)

15、分布,一個任意分布的總體,x,,中心極限定理,?,x,的分布趨于正態(tài)分布的過程,,正態(tài)分布的再生定理,?,= 50,?,,=10,X,總體分布,n,= 4,抽樣分布,x,n,=16,當總體服從正態(tài)分布,N,(,μ,,,σ,2,),時,來自該總體的所有容量為,n,的樣本的均值,?,x,也服從正態(tài)分布,,?,x,的數(shù)學期望為,μ,,方差為,σ,2,/,n,。即,?,x~N,(,μ,,,σ,2,/,n,),,例題分析,,[例]某酒店電梯中質(zhì)量標志注明最大載重為18人,1350kg。假定已知該酒店旅客及其攜帶行李的平均重量為70kg,標準差為6kg。試問隨機進入電梯18人,總重量超重的概率是多少?,,

16、,,例題分析,,[例] 一個汽車電池的制造商聲稱其最好的電池壽命的分布均值為54個月,標準差為6個月。假設某一消費組織決定購買50個這種電池作為樣本來檢驗電池的壽命,以核實這一聲明。,,(1)假設這個制造商所言真實,試描述這50個電池樣本的平均壽命的抽樣分布,,(2)假設這個制造商所言真實,則消費組織的樣本壽命均值小于或等于52個月的概率是多少?,,,,,6.2.3 大數(shù)定律,1. 獨立同分布大數(shù)定律,,2. 貝努里大數(shù)定律,,大數(shù)定律是闡述大量同類隨機現(xiàn)象的平均結果,,的穩(wěn)定性的一系列定理的總稱。,,獨立同分布大數(shù)定律,——,設,X,1,,,X,2,, …,是獨立同分布的隨機變量序列,且存在

17、有限的數(shù)學期望,E,(,X,i,),=,μ,和方差,D,(,X,i,,),=,σ,2,(,i,=1,2,…,),則對任意小的正數(shù),ε,,,有:,,,大數(shù)定律(續(xù)),該大數(shù)定律表明:當,n,充分大時,相互獨立且服從同一分布的一系列隨機變量取值的算術平均數(shù),與其數(shù)學期望,μ,的偏差小于任意小的正數(shù)概率接近于1。,,該定理給出了,平均值具有穩(wěn)定性的科學描述,從而為使用樣本均值去估計總體均值,(數(shù)學期望)提供了理論依據(jù)。,,貝努里大數(shù)定律,設,m,是,n,次獨立重復試驗中事件,A,發(fā)生的次數(shù),,p,是每次試驗中事件,A,發(fā)生的概率,則對任意的,ε,> 0,有:,它表明,當重復試驗次數(shù),n,充分大時,事

18、件,A,發(fā)生的頻率,m,/,n,依概率收斂于事件,A,發(fā)生的概率,,闡明了,頻率具有穩(wěn)定性,提供了用頻率估計概率的理論依據(jù),。,,總體分布,,總體中各元素的觀察值所形成的分布,,分布通常是未知的,,可以假定它服從某種分布,6.2.4 三種不同性質(zhì)的分布,總體,,一個樣本中各觀察值的分布,,也稱經(jīng)驗分布,,當樣本容量,n,逐漸增大時,樣本分布逐漸接近總體的分布,樣本分布,樣本,,抽樣分布是來自,容量相同,的,所有,可能樣本的概率分布,,是一種理論分布,,抽取容量為,n,,的樣本時,由該統(tǒng)計量的所有可能取值形成的概率分布,,,樣本統(tǒng)計量(如,樣本均值,,,樣本比例,樣本方差等,),是隨機變量

19、,樣本不同,樣本統(tǒng)計量的計算值是不同的。,,3.,抽樣分布反映樣本統(tǒng)計量的分布特征,是進行推斷的理論基礎,揭示樣本統(tǒng)計量和總體參數(shù)之間的關系,估計抽樣誤差,是抽樣推斷科學性的重要依據(jù),,抽樣分布,,抽樣分布的形成過程,總體,計算樣本統(tǒng)計量,,如:樣本均值、比例、方差,樣本,,6.2.5 常見的幾種抽樣分布,X~N,(,μ,,,σ,2,),,正態(tài)分布(略),,,?,2,—分布,,t—分布,,F—分布,,正態(tài)分布,(normal distribution),由,C.F.,高斯,(,Carl Friedrich Gauss,,,1777,—,1855,),作為描述誤差相對頻數(shù)分布的模型而提出,,

20、描述連續(xù)型隨機變量的最重要的分布,,許多現(xiàn)象都可以由正態(tài)分布來描述,,可用于近似離散型隨機變量的計算,,例如: 二項分布,,經(jīng)典統(tǒng)計推斷的基礎,x,f,(,x,),,概率密度函數(shù),f,(,x,) = 隨機變量,X,的頻數(shù) (概率密度函數(shù)),,?,= 正態(tài)隨機變量,X,的均值,,?,?,= 正態(tài)隨機變量,X,的方差,,,?,= 3.1415926,; e =,2.71828,,x,= 隨機變量的取值 (-,?,<,x,<,+,?,),,X服從參數(shù)為,?,?,?,的正態(tài)分布,記為X~N(,?,?,?,),,正態(tài)分布函數(shù)的性質(zhì),圖形是關于,x,=,?,對稱鐘形曲線,且峰值在,x,=,?,處,,均值

21、,?,和標準差,?,一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構成一個完整的“正態(tài)分布族”,,均值,?,可取實數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標準差決定曲線的,“陡峭”或“扁平”程度,。,?,越大,正態(tài)曲線扁平;,?,越小,正態(tài)曲線越高陡峭,,當,X,的取值向橫軸左右兩個方向無限延伸時,曲線的兩個尾端也無限漸近橫軸,理論上永遠不會與之相交,,正態(tài)隨機變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于,1,,,?,,和,?,對,正態(tài)曲線的影響,,x,f,(,x,),C,A,B,?,=1/2,?,1,?,2,?,=1,,正態(tài)分布的概率,概率是曲線下的,面

22、積,!,a,b,x,f,(,x,),,,標準正態(tài)分布,標準正態(tài)分布,的概率密度函數(shù),隨機變量具有均值為,0,,標準差為,1,的正態(tài)分布,,表示為,X~N(0,1),標準正態(tài)分布,的分布函數(shù),,標準正態(tài)分布,,標準正態(tài)分布,X,m,s,一般正態(tài)分布,?,=1,Z,標準正態(tài)分布,?,? ?,,標準化證明,,通過 的線性變化,,,將隨機變量,X~N(,?,?,?,),,轉(zhuǎn)化成,,X~N(,0,1,,),的標準正態(tài)分布,,標準正態(tài)分布表的使用,對,于標準正態(tài)分布,即,Z,~,N,(0,1),,,有,,P,(,a,?,Z,?,b,)?,?,?,b,? ?,?,?,a,?,,P,

23、(|,Z,| ?,a,)?,2,?,?,a,? ?,1,,對于負,的,z,,,,可由,?,(-,z,)???,?,?,z,?,得到,,對,于一般正態(tài)分布,即,X,~,N,(,?,,,?,),,,有,,,標準化的例子,,P,(5,?,X,?,,6.2),,X,?,,=5,?,=10,一般正態(tài)分布,6.2,?,,=1,Z,標準正態(tài)分布,?,?0,0.12,.0478,,標準化的例子,P,(2.9,,?,X,?,,7.1),,5,s,= 10,2.9,7.1,X,一般正態(tài)分布,標準正態(tài)分布,0,,s,= 1,-.21,Z,.21,.1664,.0832,.0832,,正態(tài)分布,(例題分析),【例】假

24、,定某公司職員每周的加班津貼服從均值為,50,元、標準差為,10,元的正態(tài)分布,那么全公司中有多少比例的職員每周的加班津貼會超過,70,元,又有多少比例的職員每周的加班津貼在,40,元到,60,元之間呢?,解:,設,?,=5,0,,,?,,=10,,X,~N,(50,10,2,),,用正態(tài)分布近似二項分布,在試驗次數(shù),n,很大時,二項分布,X~N(n,p,),,則可以用均值,?,=,np,,,?,,2,=,n(1-p),的正態(tài)分布,,要求:,np,和,,n (1-p),都大于5,才能用正態(tài)分布來近似,,,,例題分析,[例]假設有一批種子的發(fā)芽率為0.7,現(xiàn)在這種種子1000顆,試求其中有720

25、顆以上發(fā)芽的概率,,解:,,,,例:,一種電子元件的使用壽命X(小時)服從正態(tài)分布N(100,15,2,),某儀器上裝有3個這種元件,三個元件損壞與否是相互獨立的.求:使用的最初90小時內(nèi)無一元件損壞的概率.,解,:設Y為,使用的最初90小時內(nèi)損壞的元件數(shù),,故,則Y~B(3,p),其中,正態(tài)分布表,,?,2,—分布,,4.?,2,—分布的,密度函數(shù)f(y)曲線,a.分布可加性,若,X,,~ ?2(n,1,),Y~ ?2(n,2,),,,X, Y,獨立,則,,X + Y ~ ?,2,(n,1,+n,2,),,b.期望與方差,,若,X~ ?,2,(n),,則,,E(X)= n,D(X)=2n,5

26、.?,2,—分布的性質(zhì),,C.,?,2,(n)分布的變量值總是為正;,,D. ?2(n)分布的形狀取決于自由度n的大小,通常為不對稱的右偏分布,隨著自由度n的增大逐漸趨近于對稱分布,,6. 分位點,設,X,,~ ?,2,(n),,若對于,?:0

27、度的,t,分布,標準正態(tài)分布,t,(,df,= 13),t,(,df,= 5),z,,t,分布,的概率密度函數(shù)為,f(t),的極限為,N(0,1),的密度函數(shù),即,,t,分布,分位點,,設,T~t(n),,若對,,?:00,, 滿足,P{T?t,?,(n)}=?,,,則稱,t,?,(n),為,,t(n),的上側分位點,,注:,,由統(tǒng)計學家費舍,(,),,提出的,以其姓氏的第一個字母來命名則,,設若,U,為服從自由度為,n,1,的,?,2,分布,即,U,~,?,2,(n,1,),,,V,為服從自由度為,n,2,的,?,2,分布,即,V,~,?,2,(,n,2,)

28、,,且,U,和,V,相互獨立,則,,,為服從自由度,n,1,和,n,2,的,F,分布,,隨機變量,F,簡稱為,F,變量。,記為,F,分布,,3.其概率密度為,F,(1,20),(5,20),(10,20),F分布是偏右分布,隨著兩個自由度增大逐漸接近對稱分布,,4. F—,分布的分位點,,對于,?:00,,,滿足,,P{F?F,?,(n,1,,,n,2,)}=?, 則稱F,?,(n,1,,,n,2,)為,,F(n,1,,,n,2,),的,,上側,?,分位點;,,,6.3 樣本抽樣分布,6.3.1 樣本均值的抽樣分布,,6.3.2 樣

29、本比率的抽樣分布,,6.3.3 抽樣平均誤差的計算,,6.3.4 樣本方差的抽樣分布,,6.3.5 兩個樣本統(tǒng)計量的抽樣分布,,,,,在選取容量為,n,的樣本時,由樣本均值的所有可能取值形成的概率分布,,推斷總體均值,?,的理論基礎,,6.3.1 樣本均值的抽樣分布,,(例題分析),【例】,設一個總體,,含有4個元素(個體),,即總體單位數(shù),N,=,4。4,個個體分別為,x,1,=1,,x,2,=2,,x,3,=3,,x,4,=4,??傮w的均值、方差及分布如下,總體分布,1,4,2,3,0,.1,.2,.3,均值和方差,,(例題分析),?,,現(xiàn)從總體中抽取,n,=2的簡單隨機樣

30、本,在重復抽樣條件下,共有4,2,=16個樣本。所有樣本的結果為,3,4,3,3,3,2,3,1,3,2,4,2,3,2,2,2,1,2,4,4,4,3,4,2,4,1,4,1,4,4,1,3,3,2,1,1,2,1,1,1,第二個觀察值,第一個,,觀察值,所有可能的,n,= 2 的樣本(共16個),,樣本均值的抽樣分布,(數(shù)學期望與方差),比較及結論:,1. 樣本均值的均值(數(shù)學期望) 等于總體均值,,2. 樣本均值的方差等于總體方差的1/,n,,x,樣本均值的抽樣分布,1.0,0,0.1,0.2,0.3,P,,(,x,),1.5,3.0,4.0,3.5,2.0,2.5,,(例題分析),?,

31、計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布,3.5,3.0,2.5,2.0,3,3.0,2.5,2.0,1.5,2,4.0,3.5,3.0,2.5,4,2.5,4,2.0,3,2,1,1.5,1.0,1,第二個觀察值,第一個,,觀察值,16個樣本的均值(,x,),,樣本均值的分布與總體分布的比較,?,= 2.5,,σ,2,=1.25,總體分布,1,4,2,3,0,.1,.2,.3,抽樣分布,P,(,x,),1.0,0,.1,.2,.3,1.5,3.0,4.0,3.5,2.0,2.5,x,,樣本抽樣分布特征的證明,,,,樣本均值的數(shù)學期望,,,樣本均值的方差,,重復抽樣,,,不重復抽樣

32、,樣本均值的抽樣分布特征,,(數(shù)學期望與方差),,抽樣分布與總體分布的關系,總體分布,正態(tài)分布,非正態(tài)分布,大樣本,小樣本,正態(tài)分布,正態(tài)分布,非正態(tài)分布,,1.總體服從正態(tài)分布,N,(,μ,, )時,2. 總體分布未知,當,n,充分大時,重復抽樣時,不重復抽樣時,重復抽樣時,不重復抽樣時,近似,近似,,比率:,總體,(,或樣本,),中具有某種屬性的單位與全部單位總數(shù)之比,,不同性別的人與全部人數(shù)之比,,合格品,(,或不合格品,),與全部產(chǎn)品總數(shù)之比,,總體比率可表示為,,,樣本比率可表示為,,,6.3.2 樣本比率的抽樣分布,,棣莫佛-拉普拉斯中心極限定理,設隨機變量,X,服從

33、二項分布,B,(,n,,P,)的,那么當n→ ∞時,,X,服從均值為,n,P,,、方差為,n,P,(1-,P,),的正態(tài)分布,即:,或:,上述定理表明:,,n,很大,,np,≥5,,n,(1-,p,) ≥5時,二項分布可以用正態(tài)分布去近似。,,在重復選取容量為,n,的樣本時,由樣本比率的所有可能取值形成的相對頻數(shù)分布,,當樣本容量很大時,樣本比率的抽樣分布可用正態(tài)分布近似,,,推斷總體比例的理論基礎,,樣本比率的抽樣分布,中心極限定理,,樣本比率的數(shù)學期望,,,樣本比率的方差,,重復抽樣,,,不重復抽樣,樣本比率的抽樣分布,(數(shù)學期望與方差),,6.3.3 樣本方差的抽樣分布,對總體為正態(tài)

34、總體:,,,~,,用樣本方差推斷總體方差,必須知道總體方差的抽樣分布。,,樣本方差的抽樣分布在重復選取容量為n的樣本時,由樣本方差的所有可能取值形成的相對頻數(shù)分布。,,6.3.5 兩個樣本統(tǒng)計量的抽樣分布,兩個樣本均值之差的抽樣分布,,兩個樣本比率之差的抽樣分布,,兩個樣本方差比的抽樣分布,,兩個總體都為正態(tài)分布,即 ,,,,兩個樣本均值之差 的抽樣分布服從正態(tài)分布,其分布的數(shù)學期望為兩個總體均值之差,,,方差為各自的方差之和,一、兩個樣本均值之差的抽樣分布,,,,從兩個服從二項分布的總體中,分別獨立抽取兩個樣本,由兩個樣本比率之

35、差的所有可能取值形成的相對頻數(shù)分布。,,分別從兩個服從二項分布總體中抽取容量為,n,1,和,n,2,的獨立樣本,當兩個樣本都為大樣本時,兩個樣本比例之差的抽樣分布近似服從正態(tài)分布。,,分布的數(shù)學期望為,,,方差為各自的方差之和,二、兩個樣本比率之差的抽樣分布,,,,三、兩個樣本方差比的抽樣分布,1.兩個樣本方差比的抽樣分布:若兩,個總體都為正態(tài)分布,即,X,1,~,N,(,μ,1,,,σ,1,2,) ,,X,2,~,N,(,μ,2,,,σ,2,2,),,從兩,個總體中分別抽取容量為,n,1,和,n,2,的獨立樣本,由兩個樣本方差比的所有可能取值形成的相對頻數(shù)分布。,,2.兩,個樣本方差比的抽樣

36、分布,服從分子自由度為(,n,1,-1),分母自由度為(,n,2,-1) 的,F,分布,即,,6.4抽樣誤差的計算,,,抽樣誤差,實際抽樣誤差,抽樣平均誤差,抽樣極限誤差,,實際抽樣誤差,指樣本統(tǒng)計量與總體參數(shù)之間的絕對離差。,,實際抽樣誤差,│,│,,│,│,,│,│,,,,抽樣誤差,實際抽樣誤差,抽樣平均誤差,抽樣極限誤差,,抽樣平均誤差是樣本統(tǒng)計量與總體參數(shù)的平均離差,也即樣本統(tǒng)計量的標準差。,1.抽樣平均誤差的概念,,以均值的抽樣平均誤差為例,,測度所有樣本均值對其中心值的離散程度,所有可能的樣本均值的標準差,,所有樣本均值分布在總體均值的周圍,抽樣平均誤差反映了樣本估計值與相應總體參

37、數(shù)的平均差異程度,,抽樣平均誤差越小,樣本估計值的分布越集中在總體參數(shù)的附近,樣本估計值對總體的代表性越高,,,,,(1) 理論公式,,2. 抽樣平均誤差的計算,,抽樣平均誤差計算式推導,,〖例3〗現(xiàn)有A、B、C、D四名工人構成的總體,他們的日產(chǎn)量分別為22、24、26、28件。從四名工人中任取兩名構成一個樣本,請利用重復抽樣和不重復抽樣的方法計算抽樣平均誤差。,【分析】,先計算出三類數(shù)值:,根據(jù)抽樣平均誤差的計算公式,我們必須,本題要求我們計算抽樣平均誤差,。,可能樣本個數(shù)。,總體平均日產(chǎn)量、,樣本平均日產(chǎn)量,、,,解:,,但由于本題計算抽樣平均誤差要分別采用重復抽樣和不重復抽樣兩種方法,因

38、此,除總體平均日產(chǎn)量計算結果相同外,樣本平均日產(chǎn)量、可能樣本總數(shù)均不完全相同。為了準確計算有關數(shù)據(jù),我們將所有可能的樣本及其平均數(shù)列舉出來,然后,根據(jù)列舉結果就可以計算出抽樣平均誤差。,,列舉過程見表4-2,1.采用重復抽樣,,,22,24,26,28,22,(22,22),,(22),(22,24),,(23),(22,26),,(24),(22,28),,(25),24,(24,22),,(23),(24,24),,(24),(24,26),,(25),(24,28),,(26),26,(26,22),,(24),(26,24),,(25),(26,26),,(26),(26,28),,(

39、27),28,(28,22),,(25),(28,24),,(26),(28,26),,(27),(28,28),,(28),,,22,24,26,28,22,,(22,24),,(23),(22,26),,(24),(22,28),,(25),24,(24,22),,(23),,(24,26),,(25),(24,28),,(26),26,(26,22),,(24),(26,24),,(25),,(26,28),,(27),28,(28,22),,(25),(28,24),,(26),(28,26),,(27),,,應當指出的是,上面計算抽樣平均誤差的這個理論公式,在實際應用上會存在兩個困難

40、:,列舉過程見表4-3,2.采用不重復抽樣,⑴運用這個公式要求把,所有的樣本都抽選出來,然后計算它們的指標數(shù)值,。這在實際應用過程中幾乎是不可能的。,⑵運用上面公式要求,總體平均數(shù)的數(shù)值是已知,的。但實際上,總體平均數(shù)的數(shù)值是未知的,它正是抽樣調(diào)查要推斷的。,,因此,根據(jù)上面這個理論公式計算樣本平均數(shù)的抽樣平均誤差是行不通的。必須選用其他計算公式。,數(shù)理統(tǒng)計已經(jīng)證明,在隨機抽樣方式下,,樣本平均數(shù)(成數(shù))的抽樣平均誤差可以按下述公式來計算。,⑴在重復抽樣條件下:,,樣本平均數(shù)的抽樣平均誤差,樣本成數(shù)的抽樣平均誤差,,⑵在不重復抽樣條件下:,,①樣本平均數(shù)的抽樣平均誤差,在總體單位數(shù)很大的情況下

41、,樣本平均數(shù)的抽樣誤差,,②樣本比率(成數(shù))的抽樣平均誤差,在,總體單位數(shù)很大,的情況下,樣本成數(shù)的抽樣誤差,,,樣本標準差s的選取標準:,注意,2.在小樣本情況下,選用無偏的;,1.在大樣本情況下,選用有偏的;,,〖例〗現(xiàn)有A、B、C、D四名工人構成的總體,他們的日產(chǎn)量的標準差為2.236。從四名工人中任取兩名構成一個樣本,請利用重復抽樣和不重復抽樣的方法計算抽樣平均誤差。,,由題意知,總體標準差σ,解:,=4,,樣本單位數(shù) n,總體單位數(shù)N,=2.236,,=2,⑴在重復抽樣條件下:,,樣本平均數(shù)的抽樣平均誤差,,⑵在不重復抽樣條件下:,,樣本平均數(shù)的抽樣平均誤差,,[例]某班組有5個工

42、人,他們的單位工時分別是4,6,8,10,12元,現(xiàn)用重復抽樣方式從5個工人中隨機抽出2人,計算樣本的平均工時工資及其抽樣平均誤差。,,,,,〖例5〗,某廠從1000名工人中采用不重復抽樣隨機抽取100名工人登記每人日產(chǎn)量,對獲得資料進行整理,見表,(1)利用表中數(shù)據(jù)計算樣本平均數(shù)的抽樣平均誤差。(2)如果工人日產(chǎn)量在118件及以上者為完成生產(chǎn)定額,試計算完成生產(chǎn)定額日產(chǎn)量成數(shù)的抽樣平均誤差。,,由題意知,,解:,=1000,,樣本單位數(shù) n,總體單位數(shù) N,=,6.4374,=100,在不重復抽樣條件下,,樣本平均數(shù)的抽樣平均誤差,利用表中數(shù)據(jù),計算得樣本標準差s,在不重復抽樣條件下,,樣本

43、成數(shù)的抽樣平均誤差,,一、總體內(nèi)部的差異程度(用標準差衡量),,二、樣本容量,,三、抽樣方法 (重復與不重復),,四、抽樣組織形式 (分層抽樣和系統(tǒng)抽樣要小,簡單隨機抽樣和整群抽樣相對要大),,,3.影響抽樣平均誤差的因素,,,抽樣誤差,實際抽樣誤差,抽樣平均誤差,抽樣極限誤差,,抽樣極限誤差,對于某一項調(diào)查來說,根據(jù)客觀要求,一般應有一個允許的誤差限度,也就是說若抽樣誤差在這個限度之內(nèi),就認為是可允許的,這一允許的誤差限度就稱為極限誤差。,,,本章小結 抽樣與抽樣分布,6.1,抽樣的 基本概念,,,,,,6.2,抽樣分布,,,4.1.1 抽樣推斷,,4.1.2 抽樣的方法,,4.1.3 本容量和樣本個數(shù),,4.1.4 參數(shù)和樣本統(tǒng)計量,,4.1.5 抽樣的組織形式,,4.1.6 抽樣誤差,,,4.2.1 三種不同性質(zhì)的分布,,4.2.2 樣本均值的抽樣分布,,4.2.3 樣本比例的抽樣分布,,4.2.4 樣本方差的抽樣分布,,4.2.5 兩個樣本統(tǒng)計量的抽樣分布,,4.2.6 抽樣平均誤差的計算,,,,

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關資源

更多
正為您匹配相似的精品文檔
關于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  sobing.com 裝配圖網(wǎng)版權所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!