統(tǒng)計學(sas復習總結(jié))
單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,*,sas,程序步分為兩種:,數(shù)據(jù)步(,data step,),data,:數(shù)據(jù)步的開始、命名要創(chuàng)立的數(shù)據(jù)集。,Input,:,確定輸入的數(shù)據(jù)所對應的變量。,cards,:輸入數(shù)據(jù)。,過程步(,proc step,),proc,:過程步的開始。,Output,:輸出過程步運行結(jié)果,Set,語句:,1,、引用數(shù)據(jù)集,2,、縱向合并數(shù)據(jù)集(合并時不會根據(jù),id,進行匹配),merge,語句:橫向合并數(shù)據(jù)集(合并時會根據(jù),id,變量匹配),常用統(tǒng)計描述過程,proc freq,:,調(diào)用,freq,過程,列頻數(shù)分布表。,proc means,:調(diào)用,means,語句對變量進行簡單的統(tǒng)計描述。,proc univariate,:調(diào)用,univariate,過程對變量進行詳細統(tǒng)計描述。,table,:指出列表變量,并生成包含頻數(shù)表數(shù)據(jù)的數(shù)據(jù)集。,var,:指出分析變量。,histogram,:指明對繪制直方圖所用的數(shù)據(jù)變量并繪圖。,proc gchart,:調(diào)用,ghart,過程繪圖。,pie,:繪制圓餅圖,gplot,:繪制散點圖,plot,:指出繪圖的縱坐標和橫坐標,二項分布,Poisson,分布,正態(tài)分布,PDF,函數(shù):求概率密度,二項分布,P,(,X,),=PDF(“Binomial”,,,X,,,Prob,,,N,),Poisson,分布,P,(,X,),=PDF(“Poisson”,,,X,,,Lamda,),計算累計概率密度的常用函數(shù),二項分布,Poisson,分布,如求,X,服從二項分布,則,P(X,k),probbnml,(,p,,,n,,,k,),-probbnml,(,p,,,n,,,k-1)=PDF(“Binomial”,,,k,,,p,,,n),如,X,服從泊松分布,則,P(X=k)=Poisson,(,p,,,k,),-Poisson,(,p,,,k-1,),=PDF(“poisson”,k,,,p),。,求概率密度函數(shù)的兩種方法,CDF,函數(shù):求正態(tài)分布累積概率密度的函數(shù),cdf(NORMAL,k,mean,std,),:,用于計算均數(shù)為,mean,,標準差為,std,的正態(tài)分布的隨機變量,xk,的累積概率。,probnorm,函數(shù):標準正態(tài)分布函數(shù),probnorm(u),:求出從,-,到,u,位置的面積大小,P,robit函數(shù):求標準正態(tài)分布的,Z,值的函數(shù),probit,(,prob,),:求出從,-,到,Z,的位置面積為,prob,時的,Z,值,SAS,中常用的正態(tài)分布相關(guān)函數(shù),CDF,函數(shù):求正態(tài)分布累積概率密度的函數(shù),cdf(NORMAL,k,mean,std,),:,用于計算均數(shù)為,mean,,標準差為,std,的正態(tài)分布的隨機變量,xk,的累積概率。,probnorm,函數(shù):標準正態(tài)分布函數(shù),probnorm(u),:求出從,-,到,u,位置的面積大小,P,robit函數(shù):求標準正態(tài)分布的,Z,值的函數(shù),probit,(,prob,),:求出從,-,到,Z,的位置面積為,prob,時的,Z,值,常用的正態(tài)分布相關(guān)函數(shù),置信區(qū)間,總體均數(shù)的可信區(qū)間,t,分布法,SAS,函數(shù):,TINV,t=TINV(p,df),可求,t,分位數(shù)的函數(shù),,p,是從,-,到當前,t,分位數(shù)位置的面積。,df=n-1,(自由度),T,檢驗,(均數(shù)、標準差、標準誤、,t,檢驗),proc,means,mean,std,stderr,t,prt;,var,x;,run,;,proc,univariate,normal,;,var,x;,run,;,proc,ttest,H0,=,40.4,;,var,a,;,run,;,方法,1,方法,2,方法,3,Proc univariate,normal,*進行正態(tài)性檢驗,proc ttest,:調(diào)用,ttest,過程進行,t,檢驗,paired,:指出,t,檢驗重要比較的變量對,class,:指出分類變量,方差分析,PROC ANOVA,的過程格式,PROC ANOVA,;,CLASS,變量表;,MODEL,因變量表效應;,MEANS,效應,/,選擇項,;,PROC GLM,的過程格式,PROC GLM,;,CLASS,變量表;,MODEL,因變量表效應;,MEANS,效應,/,選擇項,;,五、方差分析所用的過程,ANOVA,過程,(,An,alysis,O,f,Va,riance),GLM,過程,(,G,eneral,L,inear,M,odel),Hovtest,使用,levene,檢驗,選項,bartlett,:,使用,bartlett,方法,選項,snk,:使用,snk,方法,選項,bon,:使用,bonferroni,方法,選項,dunnett,:使用,dunnett,方法(要注明對照組),Treat,:處理組,block,:區(qū)組,卡方檢驗,proc,freq,;,tables,r*c/,chisq,expected exact,;,weight,f;,run,;,注:,1.,tables,語句中的,chisq,選項指定進行卡方檢驗,,expecte,d,選項指定,輸出理論頻數(shù),2.exact,輸出確切概率,/,四格表資料不加此選項也可以輸出確切概率,3.,weight,語句,指定權(quán)重變量為,f,注,:,agree,選項,進行,mcnemar,檢驗與一致性檢驗;,exact mcnem,語句,進行,mcnemar,檢驗同時輸出確切概率,適用于,b+c40,的情況。,proc,freq,;,tables,r*c/,agree,;,exact mcnem,;,weight,f;,run,;,非參數(shù)檢驗,PROC NPAR1WAY,過程格式,PROC NPAR,1,WAY,Wilcoxon,;,CLASS,變量;,VAR,變量表;,Freq,頻數(shù)變量;,RUN,;,*調(diào)用,npar1way,進行非參數(shù)檢驗(秩和檢驗),相關(guān)分析,線性相關(guān),proc corr,秩相關(guān),proc corr spearman,分類變量的關(guān)聯(lián)性分析,(,屬兩種屬性獨立性的,2,檢驗,定性變量之間的聯(lián)系:查看,Chi-Square,和,Contingency Coefficient,),線性回歸,proc,reg,;,model,y=x/,clm cli clb,;,plot,y*x/,conf,pred,;,run,;,注:,model,語句,建立自變量對因變量的回歸,方程,等號的左邊表示因變量,y,,等號的右邊,表示自變量,x,;選項,clm,指定輸出預測值,95%,的置信區(qū)間;選項,cli,指定輸出,95%,的預測個體,所在的范圍;選項,clb,指定輸出回歸系數(shù)的,95%,置信區(qū)間。,plot,語句,指定輸出以,y,變量為縱坐標,x,變量,為橫坐標的散點圖,并擬合回歸線,選項,conf,和,pred,指定輸出,95%,的置信區(qū)間和,95%,的預測個體,所在的范圍的曲線。,線性相關(guān):,proc,corr,;,var,x,y,;,run;,秩相關(guān):,proc,corr spearman,;,var,x,y,;,run;,列聯(lián)相關(guān):,proc,freq,;,weight,f;,table,r*c/chisq nocol norow nopct;run;,回歸分析,:,proc,reg;,model,y=x/,clm cli,;,plot y*x/conf pred;run;,完。,