Stata 是一(yi)套提供其使(shi)用者數據分(fen)析、數據管(guan)理以及繪制(zhi)(zhi)專業圖表(biao)的(de)完整(zheng)及整(zheng)合性統(tong)計軟件。它(ta)擁(yong)有(you)很多功能,包(bao)含線性混合模型、均衡重復反復及多項式(shi)(shi)普羅比(bi)模式(shi)(shi)。用Stata繪制(zhi)(zhi)的(de)統(tong)計圖形(xing)相當精美。
新版本的(de)STATA采用(yong)最具親(qin)和(he)力(li)的(de)窗口接口,使用(yong)者自行建立程序(xu)時,軟件能提(ti)供具有直接命令式的(de)語法。Stata提(ti)供完整的(de)使用(yong)手冊,包含統計樣本建立、解釋、模型與語法、文獻等超過一(yi)萬余(yu)頁(ye)的(de)出版品。
除此之外,Stata軟(ruan)件(jian)可(ke)以(yi)(yi)透過網絡(luo)實時(shi)更新(xin)每天的(de)最新(xin)功能,更可(ke)以(yi)(yi)得知世界(jie)各地的(de)使(shi)用者(zhe)對(dui)于(yu)STATA公司提出(chu)的(de)問(wen)題與解(jie)決之道。使(shi)用者(zhe)也(ye)可(ke)以(yi)(yi)透過Stata Journal獲得許許多(duo)多(duo)的(de)相(xiang)關訊息(xi)以(yi)(yi)及(ji)書籍介紹等。另外一個(ge)獲取龐大資源的(de)管(guan)道就是(shi)Statalist,它是(shi)一個(ge)獨(du)立的(de)listserver,每月交替提供使(shi)用者(zhe)超過1000個(ge)訊息(xi)以(yi)(yi)及(ji)50個(ge)程序。
Stata官(guan)方網(wang)站。Stata公司提(ti)供的(de)(de)Web resources,涵蓋(gai)了大(da)量相關網(wang)絡資源(yuan);其FAQ則(ze)提(ti)供了各(ge)種常見(jian)問題的(de)(de)解答;Statalist則(ze)是一個類(lei)似于(yu)人(ren)大(da)經濟論壇的(de)(de)免費的(de)(de)討(tao)論區。加入Statalist的(de)(de)方法(fa)很簡(jian)單(dan),你(ni)只(zhi)需(xu)要(yao)發送郵件至Stata-maillist,郵件內(nei)容無需(xu)任何稱謂,只(zhi)需(xu)寫上“subscribe Statalist”的(de)(de)字(zi)樣即(ji)可(ke)。接到確認信息(xi)后,你(ni)便(bian)成(cheng)為一名Statalist的(de)(de)成(cheng)員了。當然(ran),即(ji)使不加入,你(ni)仍(reng)然(ran)可(ke)以瀏覽,但不能提(ti)問。
UCLA(加(jia)州大學洛杉磯分校(xiao)提供的網(wang)絡(luo)教(jiao)程。該網(wang)站提供的Data Management、Graphics、Regression、Logistic Regression、Multilevel Modeling、Survey Data Analysis等模塊(kuai)(kuai)都非常(chang)出色;其Web Books、Textbook Examples模塊(kuai)(kuai)則非常(chang)細(xi)致(zhi)地呈現(xian)了幾十(shi)本非常(chang)流行的統計和計量(liang)教(jiao)材的Stata實例(li);對于LaTeX感興趣(qu)的朋友,則可以通過Stata Tools for LaTeX模塊(kuai)(kuai)獲得諸多有用的信息;在(zai)(zai)Graph examples模塊(kuai)(kuai)中,則列舉了四十(shi)余種圖形(xing)的繪制(zhi)方(fang)法;最后,在(zai)(zai)Classes and Seminars模塊(kuai)(kuai)中,你可以在(zai)(zai)線觀看(kan)數(shu)十(shi)個(ge)Stata教(jiao)學視(shi)頻。
Stata中(zhong)文討(tao)論(lun)(lun)專(zhuan)區(qu)。目前,國內已(yi)有多個(ge)專(zhuan)門討(tao)論(lun)(lun)Stata應(ying)用(yong)(yong)的(de)(de)論(lun)(lun)壇(tan)(tan),包括人(ren)大經(jing)濟論(lun)(lun)壇(tan)(tan)Stata專(zhuan)區(qu),公衛人(ren)EpiMan等。這些論(lun)(lun)壇(tan)(tan)集中(zhong)了(le)國內外數十萬的(de)(de)Stata用(yong)(yong)戶,為交(jiao)流和解決Stata應(ying)用(yong)(yong)過(guo)程(cheng)中(zhong)遇(yu)到的(de)(de)各種問題和經(jing)驗提(ti)供了(le)很好(hao)的(de)(de)平臺。
自從(cong)Hamilton(1990)出版Statistics with Stata后,一(yi)系列將(jiang)計量(liang)理(li)論(lun)與軟件操作結(jie)合起(qi)來的(de)書籍開始相繼面世,而在(zai)此(ci)之前,人們似乎都認為(wei)軟件操作是件非(fei)常(chang)簡單的(de)事情。也正因(yin)為(wei)如(ru)此(ci),很多(duo)學生在(zai)修改完了一(yi)個(ge)學年的(de)計量(liang)經(jing)濟學課程后,仍然(ran)不知道該如(ru)何完成OLS估(gu)計。為(wei)此(ci),我(wo)列舉的(de)書籍多(duo)附有Stata實例(li)(* 表示我(wo)的(de)推(tui)薦程度),多(duo)數書中的(de)范例(li)數據都可通過Stata官方(fang)網站下(xia)載。
一份詳細的書(shu)(shu)單:UCLA提供了的書(shu)(shu)單 。
入門教(jiao)材:Baum(2006)*、Newton and Cox(2009)、Chen et al.(2005)、Adkins and Hill(2008)*;Wooldridge(2009)*,波士頓大學(xue)的網站(zhan)上提供了該書所有(you)章節的Stata范例,是一(yi)套非常好的學(xue)習資料。
綜合性教材:Cameron and Trivedi(2005)撰寫的(de)(de)Microeconometrics: Methods and applications一書(shu)全面介紹了微觀計(ji)(ji)量中的(de)(de)基(ji)本分析工具,其中不乏(fa)最近十年(nian)中得(de)到(dao)廣泛應用的(de)(de)Bootstrap、Monte Carlo模(mo)擬,以及非參(can)數估(gu)計(ji)(ji)法(fa)。二人(ren)于2009年(nian)出(chu)版的(de)(de)另一力作(zuo)(Cameron and Trivedi(2009)*)是(shi)這(zhe)本書(shu)的(de)(de)姊妹篇,重點介紹了常用計(ji)(ji)量模(mo)型的(de)(de)Stata實現方法(fa)。
Stata手(shou)冊:我一(yi)直非(fei)常(chang)佩(pei)服(fu)撰(zhuan)寫Stata手(shou)冊的那(nei)些人,他們總能以最簡潔的語言說(shuo)清楚糾結我很(hen)久的問(wen)題。Stata11附有16本電(dian)子手(shou)冊,僅需(xu)統一(yi)放(fang)置于D:stata11utilities目錄下,即可從Stata內部的幫助文件中的Also see部分直接鏈接到相應的PDF說(shuo)明書中。作為初(chu)學者,我強烈建議你將(jiang)[U]和(he)[D]打印(yin)出來(lai),反復研(yan)讀(du)(du)。stata手(shou)冊內容齊全,但不(bu)便于閱(yue)讀(du)(du),把命令與例題割裂開來(lai),閱(yue)讀(du)(du)起來(lai)很(hen)不(bu)方便。
stata軟件在社(she)會科學研(yan)究中的高(gao)級應(ying)用(yong):周(zhou)文光,李堯遠,梁煒 著,西北工業大(da)學出(chu)版社(she)出(chu)版。該書(shu)詳細介紹了如何應(ying)用(yong)stata對連續變量與(yu)(yu)分(fen)(fen)(fen)類變量進行(xing)分(fen)(fen)(fen)析,包括回(hui)歸分(fen)(fen)(fen)析,時(shi)間序列(lie)分(fen)(fen)(fen)析,面板數(shu)據(ju)分(fen)(fen)(fen)析等(deng),并介紹了如何使用(yong)stata進行(xing)生存(cun)分(fen)(fen)(fen)析與(yu)(yu)聚類分(fen)(fen)(fen)析、編程等(deng)內容。
Stata視(shi)頻。相(xiang)比于網絡教程和紙本教材,通過視(shi)頻學習(xi)Stata可能(neng)是最(zui)快(kuai)捷的(de)(de)方(fang)式了。UCLA免費(fei)發(fa)布的(de)(de)視(shi)頻教程,內(nei)(nei)(nei)容(rong)涉及Stata入(ru)(ru)(ru)門、數(shu)據處理和繪(hui)圖等。采(cai)用英文(wen)講(jiang)解(jie),思路清(qing)晰。局限在于所(suo)涉及內(nei)(nei)(nei)容(rong)不夠系統,但對于想快(kuai)速入(ru)(ru)(ru)門的(de)(de)學生則(ze)是一(yi)份不錯(cuo)的(de)(de)參考(kao)資料。同時(shi),藉(jie)由這(zhe)份資料也可以練習(xi)一(yi)下英語聽力。對于中文(wen)用戶而言,人大論壇(tan)發(fa)布的(de)(de)Stata初(chu)級和高級視(shi)頻則(ze)提供(gong)了更為快(kuai)捷的(de)(de)學習(xi)方(fang)式。其(qi)中,初(chu)級視(shi)頻主要(yao)介(jie)紹(shao)stata的(de)(de)操作方(fang)法,包括stata入(ru)(ru)(ru)門、stata數(shu)據處理、stata繪(hui)圖、stata矩陣以及stata編(bian)程初(chu)步五個部分。高級視(shi)頻主要(yao)介(jie)紹(shao)各種(zhong)計(ji)量模型的(de)(de)基本原理,重點介(jie)紹(shao)其(qi)在stata中的(de)(de)實現方(fang)法,包括OLS、GLS、MLE、IV-GMM、時(shi)間序列分析、面板模型、stata高級編(bian)程、Bootstrap和Monte Carlo模擬等內(nei)(nei)(nei)容(rong),比較全面的(de)(de)涵蓋(gai)了計(ji)量經(jing)濟學和核心(xin)內(nei)(nei)(nei)容(rong)。
統(tong)計方法:Rabe-Hesketh and Everitt(2006)。
Stata繪(hui)圖(tu):Mitchell(2008),非常細致地介紹(shao)了各種圖(tu)形的繪(hui)制(zhi)方(fang)法。
Stata數據處理:Kohler and Kreuter(2005)*、Long(2009)*、楊菊華(hua)(2008)。
Stata編程:Baum(2009),當(dang)然(ran),該書中有關數據處理(li)的介紹也非常(chang)精(jing)彩。
Logit/Probit模(mo)(mo)(mo)型:Hosmer and Lemeshow(2000)*對(dui)相(xiang)關的(de)理論進行(xing)非常細致(zhi)的(de)介(jie)紹,是(shi)我學習Logit模(mo)(mo)(mo)型的(de)入(ru)門(men)教材;Long and Freese(2001)*、Long and Freese(2006)、Hilbe(2009)則涉及了大量的(de)Stata實例,對(dui)解讀Logit/Probit模(mo)(mo)(mo)型的(de)結果很有幫助;Rabe-Hesketh et al.(2004)提供了在GLLAMM架(jia)構下(xia)估(gu)計xtlogit, xtprobit, xtmelogit以及xtmepoisson模(mo)(mo)(mo)型的(de)方法。
Panel Data和多層次(ci)模型:Stata11 手冊[XT]*,簡潔明了,附(fu)有(you)大量實例(li);Cameron and Trivedi(2009)*、王志剛(2008)、Rabe-Hesketh and Skrondal(2008)。
Mata:Schmidheiny(2008)*,簡潔明了介紹了Mata的基本用法;詳情則可參與Stata11手冊[M]。
GLLAMM:Rabe-Hesketh et al.(2004)。
Meta:Sterne(2009)。
GLM:Hardin et al.(2007)。
MLE:Harrison(2008)(Lectures)、Gould et al.(2006)。
生存分(fen)析:Cleves et al.(2008)。
Stata是(shi)一(yi)個(ge)統(tong)計(ji)分(fen)(fen)析軟件,但它(ta)也(ye)具有(you)很(hen)強的(de)(de)程序語(yu)言功(gong)能,這給用戶(hu)(hu)提供了(le)一(yi)個(ge)廣闊的(de)(de)開發應用的(de)(de)天地(di),用戶(hu)(hu)可以(yi)充分(fen)(fen)發揮自(zi)己的(de)(de)聰(cong)明才智,熟練應用各種技巧(qiao),真(zhen)正做(zuo)到(dao)隨心所欲。事實上,Stata的(de)(de)ado文(wen)件(高級統(tong)計(ji)部分(fen)(fen))都(dou)是(shi)用Stata自(zi)己的(de)(de)語(yu)言編寫的(de)(de)。
Stata其(qi)統(tong)計(ji)(ji)分析(xi)能力(li)遠(yuan)(yuan)遠(yuan)(yuan)超(chao)過(guo)了SPSS,在許多方面也(ye)超(chao)過(guo)了SAS!由于Stata在分析(xi)時是將數(shu)據全部(bu)讀入(ru)內存(cun),在計(ji)(ji)算(suan)全部(bu)完成后才(cai)和(he)磁盤交(jiao)換(huan)數(shu)據,因此計(ji)(ji)算(suan)速度極快(一般來說, SAS的運算(suan)速度要比SPSS至(zhi)(zhi)少快一個(ge)數(shu)量級,而(er)Stata的某些模(mo)塊(kuai)(kuai)和(he)執行(xing)同樣功能的SAS模(mo)塊(kuai)(kuai)比,其(qi)速度又比SAS快將近(jin)一個(ge)數(shu)量級!)Stata也(ye)是采用命令行(xing)方式來操作,但使用上遠(yuan)(yuan)比SAS簡單。其(qi)生存(cun)數(shu)據分析(xi)、縱向(xiang)數(shu)據(重復測量數(shu)據)分析(xi)等模(mo)塊(kuai)(kuai)的功能甚(shen)至(zhi)(zhi)超(chao)過(guo)了SAS。用Stata繪制的統(tong)計(ji)(ji)圖形相當精美(mei),很(hen)有特色。
Stata的(de)統(tong)計(ji)功能很(hen)強,除了傳統(tong)的(de)統(tong)計(ji)分(fen)析方法外,還收(shou)集了近20年發(fa)展起來的(de)新(xin)方法,如Cox比例風險回(hui)(hui)(hui)歸(gui),指數與Weibull回(hui)(hui)(hui)歸(gui),多類結(jie)果與有序結(jie)果的(de)logistic回(hui)(hui)(hui)歸(gui),Poisson回(hui)(hui)(hui)歸(gui),負二項(xiang)回(hui)(hui)(hui)歸(gui)及廣(guang)義負二項(xiang)回(hui)(hui)(hui)歸(gui),隨機效應模型(xing)等。具體說, Stata具有如下統(tong)計(ji)分(fen)析能力(li):
數(shu)值變(bian)量資料的一般(ban)分析:參數(shu)估計,t檢驗(yan),單因(yin)(yin)素和多(duo)因(yin)(yin)素的方(fang)(fang)差分析,協方(fang)(fang)差分析,交互效應模(mo)型,平(ping)(ping)衡和非平(ping)(ping)衡設計,嵌套設計,隨機(ji)效應,多(duo)個(ge)均數(shu)的兩兩比(bi)較,缺項數(shu)據的處(chu)理(li),方(fang)(fang)差齊(qi)性檢驗(yan),正(zheng)態性檢驗(yan),變(bian)量變(bian)換等。
分(fen)類(lei)資料的一般分(fen)析:參數(shu)估計,列(lie)聯(lian)表分(fen)析 ( 列(lie)聯(lian)系數(shu),確切概(gai)率 ) ,流(liu)行病(bing)學(xue)表格分(fen)析等。
等級資料的一般分析(xi):秩(zhi)變換,秩(zhi)和檢驗,秩(zhi)相關等
相(xiang)關與回(hui)歸(gui)(gui)分(fen)(fen)析(xi)(xi):簡單相(xiang)關,偏相(xiang)關,典型(xing)相(xiang)關,以及(ji)多達數(shu)十種的(de)回(hui)歸(gui)(gui)分(fen)(fen)析(xi)(xi)方法,如多元線(xian)性回(hui)歸(gui)(gui),逐步(bu)回(hui)歸(gui)(gui),加權(quan)回(hui)歸(gui)(gui),穩鍵回(hui)歸(gui)(gui),二階段(duan)回(hui)歸(gui)(gui),百(bai)分(fen)(fen)位(wei)數(shu) ( 中位(wei)數(shu) ) 回(hui)歸(gui)(gui),殘差分(fen)(fen)析(xi)(xi)、強影響點分(fen)(fen)析(xi)(xi),曲(qu)線(xian)擬(ni)合(he),隨機(ji)效應的(de)線(xian)性回(hui)歸(gui)(gui)模型(xing)等。
其他方法:質量控(kong)制,整群抽(chou)樣的設計效率,診斷試驗(yan)評價(jia), kappa等。
Stata的(de)作圖(tu)(tu)(tu)(tu)模(mo)塊,主要提(ti)(ti)供(gong)(gong)如下八種(zhong)基本圖(tu)(tu)(tu)(tu)形(xing)(xing)的(de)制作 : 直方圖(tu)(tu)(tu)(tu)(histogram),條形(xing)(xing)圖(tu)(tu)(tu)(tu)(bar),百分(fen)條圖(tu)(tu)(tu)(tu) (oneway),百分(fen)圓圖(tu)(tu)(tu)(tu)(pie),散(san)點(dian)(dian)圖(tu)(tu)(tu)(tu)(two way),散(san)點(dian)(dian)圖(tu)(tu)(tu)(tu)矩陣(zhen)(matrix),星形(xing)(xing)圖(tu)(tu)(tu)(tu)(star),分(fen)位數圖(tu)(tu)(tu)(tu)。這(zhe)些(xie)圖(tu)(tu)(tu)(tu)形(xing)(xing)的(de)巧妙應(ying)用,可以(yi)滿足絕大多數用戶(hu)的(de)統計作圖(tu)(tu)(tu)(tu)要求。在(zai)有些(xie)非(fei)繪圖(tu)(tu)(tu)(tu)命(ming)令中,也提(ti)(ti)供(gong)(gong)了(le)(le)專門繪制某(mou)種(zhong)圖(tu)(tu)(tu)(tu)形(xing)(xing)的(de)功能(neng),如在(zai)生存(cun)分(fen)析中,提(ti)(ti)供(gong)(gong)了(le)(le)繪制生存(cun)曲(qu)線(xian)圖(tu)(tu)(tu)(tu),回(hui)歸分(fen)析中提(ti)(ti)供(gong)(gong)了(le)(le)殘差圖(tu)(tu)(tu)(tu)等。
矩(ju)陣代(dai)數是多(duo)(duo)元(yuan)統計(ji)(ji)分(fen)(fen)析的重要(yao)工具, Stata提供了(le)多(duo)(duo)元(yuan)統計(ji)(ji)分(fen)(fen)析中所需的矩(ju)陣基本運算,如(ru)矩(ju)陣的加、積(ji)、逆、 Cholesky分(fen)(fen)解(jie)(jie)、 Kronecker內(nei)積(ji)等;還提供了(le)一(yi)些(xie)高(gao)級運算,如(ru)特(te)征根、特(te)征向量、奇異(yi)值分(fen)(fen)解(jie)(jie)等;在(zai)執行完某些(xie)統計(ji)(ji)分(fen)(fen)析命(ming)令后,還提供了(le)一(yi)些(xie)系統矩(ju)陣,如(ru)估計(ji)(ji)系數向量、估計(ji)(ji)系數的協方差矩(ju)陣等。
數據管理(Data management)
資料轉(zhuan)換、分組處理、附加檔案、 ODBC 、行(xing) - 列(lie)轉(zhuan)換、數據標記、字符串函數…等
基本統計(Basic statistics)
直交表、相(xiang)關性、 t- 檢定(ding)、變異數(shu)相(xiang)等性檢定(ding)、比例檢定(ding)、信(xin)賴(lai)區間…等
線性(xing)模式(shi)(Linear models)
穩健(jian)Huber/White/sandwich變(bian)異(yi)估計(ji) , 三階最小平(ping)方(fang)法、類非相關(guan)回(hui)(hui)歸、齊次多項式(shi)回(hui)(hui)歸、GLS
廣義型線性模式(Generalized linear models)
十連結函(han)數、使用者(zhe)-定義連結、 ML及IRLS估計、九變異數估計、七殘差(cha)…等
二(er)元、計數及有限應變量(Binary, count and limited dependent variables)
羅(luo)吉(ji)斯特、probit、卜松(song)回歸(gui)、tobit、truncated回歸(gui)、條件羅(luo)吉(ji)斯特、多項式(shi)邏輯、巢狀邏輯、負二項、 zero-inflated模型、Heckman 選擇模式(shi)、邊際影響
Panel數據/交叉 - 組合時間序列(Panel data/cross-sectional time-series)
隨(sui)(sui)機(ji)(ji)及(ji)固(gu)定(ding)影(ying)響(xiang)之回歸(gui)、GEE、隨(sui)(sui)機(ji)(ji)及(ji)固(gu)定(ding)-影(ying)響(xiang)之卜松(song)及(ji)負二項分(fen)配、隨(sui)(sui)機(ji)(ji) - 影(ying)響(xiang)、工具變量(liang)回歸(gui)、AR(1) 干(gan)擾回歸(gui)
無母數方法(fa)(Nonparametric methods)
多變量方法(fa)(Multivariate methods)
因素分(fen)析、多變量回歸(gui)、 anonical 相關(guan)系數
模型檢定及事后估計量(liang)支持分析(xi)(Model testing and post-estimation support)
Wald檢定、LR檢定、線(xian)(xian)性及非(fei)線(xian)(xian)性組合、非(fei)線(xian)(xian)性限制檢定、邊(bian)際影響、修正平均數Hausman檢定
群集分析(Cluster analysis)
加權平均、質(zhi)量中心及中位(wei)數聯結、kmeans、kmedians、dendrograms、停(ting)止(zhi)規則、使用者擴充
圖形(Graphics)
直線圖(tu)(tu)、散布圖(tu)(tu)、條狀圖(tu)(tu)、圓餅圖(tu)(tu)、 hi-lo 圖(tu)(tu)、回歸診斷圖(tu)(tu)…
調查(cha)方法(Survey methods)
抽樣權重、叢集抽樣、分層、線性變(bian)異數估(gu)計(ji)量(liang)、擬(ni) - 概(gai)似最大估(gu)計(ji)量(liang)、回歸(gui)、工(gong)具變(bian)量(liang)…
生存(cun)分析(Survival analysis)
Kaplan–Meier、Nelson–Aalen、Cox回歸(弱(ruo)性)、參數模(mo)式(弱(ruo)性)、危險比例(li)測試、時間(jian)共變項、左-右檢(jian)查(cha)、韋柏分配、指(zhi)數分配…
流行病學工具(Tools for epidemiologists)
比例標準化、病例控(kong)制(zhi)(zhi)、已配適(shi)病例控(kong)制(zhi)(zhi)、Mantel – Haenszel,藥理學、ROC分析、ICD-9-CM
時間序(xu)列(Time series)
ARIMA、ARCH/GARCH、VAR、Newey–West、correlograms、periodograms、白色 - 噪音測(ce)試、最小整數根(gen)檢定、時間序列(lie)運算、平(ping)滑(hua)化
最大概似(si)法(fa)(Maximum likelihood)
轉換及常(chang)態檢定(Transforms and normality tests)
Box–Cox、次方(fang)轉換(huan)Shapiro–Wilk、Shapiro–Francia檢(jian)定
其它統計方法(Other statistical methods)
樣本(ben)數(shu)量及次(ci)方、非(fei)線性回(hui)歸(gui)(gui)、逐步式回(hui)歸(gui)(gui) 、統計及數(shu)學函數(shu)
包(bao)含樣本(ben)范(fan)例(Sample session)
再抽樣及模擬方法(Resampling and simulation methods)
bootstrapping、jackknife、蒙地卡羅模(mo)擬、排列檢定(ding)
網絡功能
安裝新指令、網絡(luo)升級、網站檔案分享(xiang)、Stata 最(zui)新消息
epiman論壇學習(xi)資源(yuan)豐富,學術(shu)氛圍良(liang)好,在國內(nei)新(xin)生代公(gong)共(gong)衛生學術(shu)界有一(yi)定影(ying)響力(li)。是(shi)探(tan)討Stata、spss、sas、epidata等統計(ji)軟件的主(zhu)流論壇之一(yi)。