千文網(wǎng)小編為你整理了多篇相關(guān)的《stata學(xué)習(xí)感想》,但愿對(duì)你工作學(xué)習(xí)有幫助,當(dāng)然你在千文網(wǎng)還可以找到更多《stata學(xué)習(xí)感想》。
stata11常用命令
注:JB統(tǒng)計(jì)量對(duì)應(yīng)的p大于0.05,則表明非正態(tài),這點(diǎn)跟sktest和swilk檢驗(yàn)剛好相反; dta為數(shù)據(jù)文件; gph為圖文件; do為程序文件;
注意stata要區(qū)別大小寫; 不得用作用戶變量名:
_all _n _N _skip _b _coef _cons _pi _pred _rc _weight double float long int in if using with 命令:
讀入數(shù)據(jù)一種方式 input x y 1 4 2 5.5 3 6.2 4 7.7 5 8.5 end su/summarise/sum x 或 su/summarise/sum x,d 對(duì)分組的描述: sort group by group:su x %%%%% tabstat economy,stats(max)%返回變量economy的最大值
%%stats括號(hào)里可以是:mean,count(非缺失觀測(cè)值個(gè)數(shù)),sum(總和),max,min,range,%% sd,var,cv(變易系數(shù)=標(biāo)準(zhǔn)差/均值),skewness,kurtosis,median,p1(1%分位
%% 數(shù),類似地有p10, p25, p50, p75, p95, p99),iqr(interquantile range = p75 – p25)_all %描述全部
_N 數(shù)據(jù)庫(kù)中觀察值的總個(gè)數(shù)。_n 當(dāng)前觀察值的位置。_pi 圓周率π的數(shù)值。list gen/generate %產(chǎn)生數(shù)列 egen wagemax=max(wage)clear use by(分組變量)set more 1/0 count %計(jì)數(shù)
gsort +x(升序)gsort-x(降序)sort x 升序;并且其它變量順序會(huì)跟著改變 label var y “消費(fèi)” %添加標(biāo)簽 describe %描述數(shù)據(jù)文件的整體,包括觀測(cè)總數(shù),變量總數(shù),生成日期,每個(gè)變量的存儲(chǔ)類型(storage type),標(biāo)簽(label)replace x5=2*y if x!=3 %替換變量值
replace age = 25 in 107 %令第107個(gè)觀測(cè)中age為25 rename y2 u %改變變量名
drop in 2 %刪除全部變量的第2行
drop if x==.刪去x為缺失值的所有記錄
keep if x
keep x1-x5 %保留數(shù)據(jù)庫(kù)中介于x1和x5間的所有變量(包括x1和x5),其余變量刪除
ci x1 x2,by(group)%算出置信區(qū)間,不過先前對(duì)group要先排序,即sort group;
%by的意思逐個(gè)進(jìn)行
cii 12 3.816667 0.2710343, level(90)%已知均值,方差,計(jì)算90%的置信區(qū)間
cii 10 2 %obs=10,mean=2,以二項(xiàng)分布形式,計(jì)算置信區(qū)間 centile x,centile(2.5 25 50 75 97.5)%取分位數(shù) correlate/corr x y z %相關(guān)系數(shù)
pwcorr x y,sig %給出原假設(shè)r=0的命令 %如果變量非服從正態(tài)分布,則spearman x y regress/reg mean year %回歸方程建立 reg y x,noconstant %無(wú)常數(shù)項(xiàng) predict meanhat %預(yù)測(cè)擬合值 predict e,residual %得到殘差 estat hettest % 異方差檢驗(yàn)
dwstat % Durbin-Watson自相關(guān)檢驗(yàn) vif % 方差膨脹因子
logit y x1 x2 x3(y取0或1,是被解釋變量,x1-x3是被解釋變量)%logit回歸
probit y x1 x2 x3(y取0或1,是被解釋變量,x1-x3是被解釋變量)%probit回歸
tobit y x1 x2 x3(y取值在0和1之間,是被解釋變量,x1-x3是被解釋變量)%tobit回歸
sktest e %殘差正態(tài)性檢驗(yàn) p>0.05則接受原假設(shè),即服從正態(tài)分布; %% sktest是基于變量的偏度和斜度(正態(tài)分布的偏度為0,斜度為3)swilk x %基于Shapiro-Wilk檢驗(yàn)
%%p值越小,越傾向于拒絕零假設(shè),也就是變量越有可能不服從正態(tài)分布 xi %生成虛擬變量 tabulat gender,summ(math)%用gender指標(biāo)對(duì)math進(jìn)行分類,返回兩類math的mean、std、freq tabulate=tab %gen f=int((shengao-164)/3)*3+164 組距為3 tabulate 變量名 [, generate(新變量)missing nofreq nolabel plot ] %%%%% generate(新變量)// 按分組變量產(chǎn)生啞變量 nofreq // 不顯示頻數(shù) nolabel // 不顯示數(shù)值標(biāo)記 plot // 顯示各組頻數(shù)圖示 missing // 包含缺失值
cell // 顯示各小組的構(gòu)成比(小組之和為 1)column // 按欄顯示各組之構(gòu)成(各欄總計(jì)為 1)row // 按行顯示各組之構(gòu)成(各行總計(jì)為 1)%%%%% 求和,求最?。?mod(x,y)%求余數(shù)
means %返回三種平均值 di normprob(1.96)di invnorm(0.05)di binomial(20,5,0.5)di invbinomial(20,5,0.5)di tprob(10,2)di invt(10.0.05)di fprob(3,27,1)di invfprob(3,27,0.05)di chi2(3,5)di invchi2(3,0.05)stack x y z,into(e)%把三列合成一列 xpose,clear %矩陣轉(zhuǎn)置
append using d: