《統(tǒng)計(jì)學(xué)(sas復(fù)習(xí)總結(jié))》由會(huì)員分享,可在線閱讀,更多相關(guān)《統(tǒng)計(jì)學(xué)(sas復(fù)習(xí)總結(jié))(30頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),*,*,sas,程序步分為兩種:,數(shù)據(jù)步(,data step,),data,:數(shù)據(jù)步的開(kāi)始、命名要?jiǎng)?chuàng)立的數(shù)據(jù)集。,Input,:,確定輸入的數(shù)據(jù)所對(duì)應(yīng)的變量。,cards,:輸入數(shù)據(jù)。,過(guò)程步(,proc step,),proc,:過(guò)程步的開(kāi)始。,Output,:輸出過(guò)程步運(yùn)行結(jié)果,Set,語(yǔ)句:,1,、引用數(shù)據(jù)集,2,、縱向合并數(shù)據(jù)集(合并時(shí)不會(huì)根據(jù),id,進(jìn)行匹配),merge,語(yǔ)句:橫向合并數(shù)據(jù)集(合并時(shí)會(huì)根據(jù),id,變量匹配),常用統(tǒng)計(jì)描述過(guò)程,proc freq,:,調(diào)用,freq,過(guò)程,列頻數(shù)分布
2、表。,proc means,:調(diào)用,means,語(yǔ)句對(duì)變量進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)描述。,proc univariate,:調(diào)用,univariate,過(guò)程對(duì)變量進(jìn)行詳細(xì)統(tǒng)計(jì)描述。,table,:指出列表變量,并生成包含頻數(shù)表數(shù)據(jù)的數(shù)據(jù)集。,var,:指出分析變量。,histogram,:指明對(duì)繪制直方圖所用的數(shù)據(jù)變量并繪圖。,proc gchart,:調(diào)用,ghart,過(guò)程繪圖。,pie,:繪制圓餅圖,gplot,:繪制散點(diǎn)圖,plot,:指出繪圖的縱坐標(biāo)和橫坐標(biāo),二項(xiàng)分布,Poisson,分布,正態(tài)分布,PDF,函數(shù):求概率密度,二項(xiàng)分布,P,(,X,),=PDF(“Binomial”,,,X,,,
3、Prob,,,N,),Poisson,分布,P,(,X,),=PDF(“Poisson”,,,X,,,Lamda,),計(jì)算累計(jì)概率密度的常用函數(shù),二項(xiàng)分布,Poisson,分布,如求,X,服從二項(xiàng)分布,則,P(X,k),probbnml,(,p,,,n,,,k,),-probbnml,(,p,,,n,,,k-1)=PDF(“Binomial”,,,k,,,p,,,n),如,X,服從泊松分布,則,P(X=k)=Poisson,(,p,,,k,),-Poisson,(,p,,,k-1,),=PDF(“poisson”,k,,,p),。,求概率密度函數(shù)的兩種方法,CDF,函數(shù):求正態(tài)分布累積概率密度
4、的函數(shù),cdf(NORMAL,k,mean,std,),:,用于計(jì)算均數(shù)為,mean,,標(biāo)準(zhǔn)差為,std,的正態(tài)分布的隨機(jī)變量,xk,的累積概率。,probnorm,函數(shù):標(biāo)準(zhǔn)正態(tài)分布函數(shù),probnorm(u),:求出從,-,到,u,位置的面積大小,P,robit函數(shù):求標(biāo)準(zhǔn)正態(tài)分布的,Z,值的函數(shù),probit,(,prob,),:求出從,-,到,Z,的位置面積為,prob,時(shí)的,Z,值,SAS,中常用的正態(tài)分布相關(guān)函數(shù),CDF,函數(shù):求正態(tài)分布累積概率密度的函數(shù),cdf(NORMAL,k,mean,std,),:,用于計(jì)算均數(shù)為,mean,,標(biāo)準(zhǔn)差為,std,的正態(tài)分布的隨機(jī)變量,xk,
5、的累積概率。,probnorm,函數(shù):標(biāo)準(zhǔn)正態(tài)分布函數(shù),probnorm(u),:求出從,-,到,u,位置的面積大小,P,robit函數(shù):求標(biāo)準(zhǔn)正態(tài)分布的,Z,值的函數(shù),probit,(,prob,),:求出從,-,到,Z,的位置面積為,prob,時(shí)的,Z,值,常用的正態(tài)分布相關(guān)函數(shù),置信區(qū)間,總體均數(shù)的可信區(qū)間,t,分布法,SAS,函數(shù):,TINV,t=TINV(p,df),可求,t,分位數(shù)的函數(shù),,p,是從,-,到當(dāng)前,t,分位數(shù)位置的面積。,df=n-1,(自由度),T,檢驗(yàn),(均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、,t,檢驗(yàn)),proc,means,mean,std,stderr,t,prt;,var
6、,x;,run,;,proc,univariate,normal,;,var,x;,run,;,proc,ttest,H0,=,40.4,;,var,a,;,run,;,方法,1,方法,2,方法,3,Proc univariate,normal,*進(jìn)行正態(tài)性檢驗(yàn),proc ttest,:調(diào)用,ttest,過(guò)程進(jìn)行,t,檢驗(yàn),paired,:指出,t,檢驗(yàn)重要比較的變量對(duì),class,:指出分類(lèi)變量,方差分析,PROC ANOVA,的過(guò)程格式,PROC ANOVA,;,CLASS,變量表;,MODEL,因變量表效應(yīng);,MEANS,效應(yīng),/,選擇項(xiàng),;,PROC GLM,的過(guò)程格式,PROC GL
7、M,;,CLASS,變量表;,MODEL,因變量表效應(yīng);,MEANS,效應(yīng),/,選擇項(xiàng),;,五、方差分析所用的過(guò)程,ANOVA,過(guò)程,(,An,alysis,O,f,Va,riance),GLM,過(guò)程,(,G,eneral,L,inear,M,odel),Hovtest,使用,levene,檢驗(yàn),選項(xiàng),bartlett,:,使用,bartlett,方法,選項(xiàng),snk,:使用,snk,方法,選項(xiàng),bon,:使用,bonferroni,方法,選項(xiàng),dunnett,:使用,dunnett,方法(要注明對(duì)照組),Treat,:處理組,block,:區(qū)組,卡方檢驗(yàn),proc,freq,;,tables,
8、r*c/,chisq,expected exact,;,weight,f;,run,;,注:,1.,tables,語(yǔ)句中的,chisq,選項(xiàng)指定進(jìn)行卡方檢驗(yàn),,expecte,d,選項(xiàng)指定,輸出理論頻數(shù),2.exact,輸出確切概率,/,四格表資料不加此選項(xiàng)也可以輸出確切概率,3.,weight,語(yǔ)句,指定權(quán)重變量為,f,注,:,agree,選項(xiàng),進(jìn)行,mcnemar,檢驗(yàn)與一致性檢驗(yàn);,exact mcnem,語(yǔ)句,進(jìn)行,mcnemar,檢驗(yàn)同時(shí)輸出確切概率,適用于,b+c40,的情況。,proc,freq,;,tables,r*c/,agree,;,exact mcnem,;,weight
9、,f;,run,;,非參數(shù)檢驗(yàn),PROC NPAR1WAY,過(guò)程格式,PROC NPAR,1,WAY,Wilcoxon,;,CLASS,變量;,VAR,變量表;,Freq,頻數(shù)變量;,RUN,;,*調(diào)用,npar1way,進(jìn)行非參數(shù)檢驗(yàn)(秩和檢驗(yàn)),相關(guān)分析,線性相關(guān),proc corr,秩相關(guān),proc corr spearman,分類(lèi)變量的關(guān)聯(lián)性分析,(,屬兩種屬性獨(dú)立性的,2,檢驗(yàn),定性變量之間的聯(lián)系:查看,Chi-Square,和,Contingency Coefficient,),線性回歸,proc,reg,;,model,y=x/,clm cli clb,;,plot,y*x/,c
10、onf,pred,;,run,;,注:,model,語(yǔ)句,建立自變量對(duì)因變量的回歸,方程,等號(hào)的左邊表示因變量,y,,等號(hào)的右邊,表示自變量,x,;選項(xiàng),clm,指定輸出預(yù)測(cè)值,95%,的置信區(qū)間;選項(xiàng),cli,指定輸出,95%,的預(yù)測(cè)個(gè)體,所在的范圍;選項(xiàng),clb,指定輸出回歸系數(shù)的,95%,置信區(qū)間。,plot,語(yǔ)句,指定輸出以,y,變量為縱坐標(biāo),x,變量,為橫坐標(biāo)的散點(diǎn)圖,并擬合回歸線,選項(xiàng),conf,和,pred,指定輸出,95%,的置信區(qū)間和,95%,的預(yù)測(cè)個(gè)體,所在的范圍的曲線。,線性相關(guān):,proc,corr,;,var,x,y,;,run;,秩相關(guān):,proc,corr spearman,;,var,x,y,;,run;,列聯(lián)相關(guān):,proc,freq,;,weight,f;,table,r*c/chisq nocol norow nopct;run;,回歸分析,:,proc,reg;,model,y=x/,clm cli,;,plot y*x/conf pred;run;,完。,