Stata 是一(yi)套提供(gong)其使用(yong)者數據(ju)分析(xi)、數據(ju)管理(li)以(yi)及(ji)繪制(zhi)專業圖(tu)(tu)表的(de)完整及(ji)整合(he)(he)性(xing)統計(ji)(ji)軟件。它擁有很(hen)多(duo)(duo)功能(neng),包含線性(xing)混(hun)合(he)(he)模型、均(jun)衡重復反復及(ji)多(duo)(duo)項(xiang)式普(pu)羅比模式。用(yong)Stata繪制(zhi)的(de)統計(ji)(ji)圖(tu)(tu)形(xing)相當(dang)精美。
新版本的STATA采用(yong)最具(ju)親(qin)和力的窗口接口,使用(yong)者自行建(jian)立程序時,軟件能提供(gong)具(ju)有(you)直接命令式的語法。Stata提供(gong)完整的使用(yong)手冊,包含統計樣本建(jian)立、解釋、模型與(yu)語法、文獻等超(chao)過一萬余頁(ye)的出版品。
除此之外,Stata軟(ruan)件可以(yi)透(tou)過網(wang)絡實時更新(xin)(xin)每(mei)天的(de)最新(xin)(xin)功能,更可以(yi)得知世界各地的(de)使(shi)(shi)用(yong)者對于STATA公司提(ti)出的(de)問題與解決之道。使(shi)(shi)用(yong)者也(ye)可以(yi)透(tou)過Stata Journal獲(huo)得許許多(duo)多(duo)的(de)相關訊(xun)(xun)息(xi)以(yi)及書(shu)籍(ji)介紹(shao)等。另外一(yi)個(ge)(ge)(ge)獲(huo)取龐(pang)大資(zi)源的(de)管道就是Statalist,它(ta)是一(yi)個(ge)(ge)(ge)獨立(li)的(de)listserver,每(mei)月交替提(ti)供使(shi)(shi)用(yong)者超過1000個(ge)(ge)(ge)訊(xun)(xun)息(xi)以(yi)及50個(ge)(ge)(ge)程序。
Stata官(guan)方(fang)網(wang)站。Stata公司提(ti)供(gong)的Web resources,涵(han)蓋了大(da)量相關網(wang)絡資源;其(qi)FAQ則(ze)提(ti)供(gong)了各種(zhong)常見問題(ti)的解答(da);Statalist則(ze)是一個類似于(yu)人大(da)經濟論壇的免(mian)費的討論區。加入Statalist的方(fang)法很(hen)簡單(dan),你(ni)只需(xu)要發送郵(you)(you)件至Stata-maillist,郵(you)(you)件內容無需(xu)任何稱謂,只需(xu)寫上“subscribe Statalist”的字樣即可。接到(dao)確認信息(xi)后,你(ni)便成為一名Statalist的成員了。當然,即使(shi)不加入,你(ni)仍然可以瀏覽,但不能提(ti)問。
UCLA(加州大學洛杉(shan)磯分(fen)校提(ti)供的(de)(de)網絡教(jiao)程。該網站提(ti)供的(de)(de)Data Management、Graphics、Regression、Logistic Regression、Multilevel Modeling、Survey Data Analysis等模塊(kuai)都(dou)非(fei)(fei)常出色;其Web Books、Textbook Examples模塊(kuai)則(ze)(ze)非(fei)(fei)常細(xi)致地呈現(xian)了幾十本非(fei)(fei)常流行的(de)(de)統(tong)計和計量(liang)教(jiao)材的(de)(de)Stata實例;對(dui)于LaTeX感(gan)興趣的(de)(de)朋(peng)友,則(ze)(ze)可以通(tong)過Stata Tools for LaTeX模塊(kuai)獲得諸多(duo)有用的(de)(de)信息;在Graph examples模塊(kuai)中(zhong),則(ze)(ze)列舉(ju)了四十余種圖(tu)形(xing)的(de)(de)繪制方法;最后(hou),在Classes and Seminars模塊(kuai)中(zhong),你可以在線觀看數十個(ge)Stata教(jiao)學視(shi)頻。
Stata中(zhong)文討(tao)論(lun)專區。目前,國內已有(you)多個專門(men)討(tao)論(lun)Stata應(ying)用的論(lun)壇,包括人大(da)經濟(ji)論(lun)壇Stata專區,公(gong)衛人EpiMan等。這(zhe)些論(lun)壇集中(zhong)了國內外(wai)數十(shi)萬的Stata用戶,為交流和解決(jue)Stata應(ying)用過程(cheng)中(zhong)遇到的各種問題和經驗提(ti)供了很好的平臺。
自(zi)從Hamilton(1990)出版Statistics with Stata后(hou),一(yi)系列將計量理(li)論(lun)與軟件操作結(jie)合起(qi)來的書(shu)(shu)籍開始相繼(ji)面世,而在(zai)(zai)此之前,人們似乎都認為(wei)(wei)軟件操作是件非常簡單的事情。也正因為(wei)(wei)如此,很多學生在(zai)(zai)修(xiu)改(gai)完了(le)一(yi)個學年的計量經濟學課(ke)程(cheng)后(hou),仍然不知道該如何(he)完成OLS估計。為(wei)(wei)此,我列舉(ju)的書(shu)(shu)籍多附有Stata實例(* 表(biao)示我的推薦程(cheng)度),多數(shu)書(shu)(shu)中的范例數(shu)據(ju)都可通過Stata官方(fang)網(wang)站下載。
一份詳(xiang)細的(de)(de)書單(dan):UCLA提供了(le)的(de)(de)書單(dan) 。
入門教材:Baum(2006)*、Newton and Cox(2009)、Chen et al.(2005)、Adkins and Hill(2008)*;Wooldridge(2009)*,波士頓大學的網站上提供了該書所有章節的Stata范例,是(shi)一套非常好的學習資料。
綜合性教材:Cameron and Trivedi(2005)撰寫的(de)Microeconometrics: Methods and applications一書(shu)全面介紹(shao)(shao)了微(wei)觀計量中的(de)基本分析工(gong)具,其(qi)中不乏最近十年中得到廣泛應(ying)用(yong)的(de)Bootstrap、Monte Carlo模(mo)擬,以(yi)及(ji)非參數估(gu)計法。二(er)人(ren)于2009年出版的(de)另一力作(Cameron and Trivedi(2009)*)是這本書(shu)的(de)姊妹篇,重點介紹(shao)(shao)了常用(yong)計量模(mo)型的(de)Stata實(shi)現方法。
Stata手(shou)冊:我一(yi)直(zhi)非常佩(pei)服撰(zhuan)寫(xie)Stata手(shou)冊的(de)(de)那些人,他們(men)總能以(yi)最簡潔的(de)(de)語言說(shuo)清楚糾(jiu)結我很(hen)久(jiu)的(de)(de)問題。Stata11附有16本(ben)電子手(shou)冊,僅需統一(yi)放置于D:stata11utilities目錄(lu)下(xia),即可從Stata內(nei)部的(de)(de)幫(bang)助文件(jian)中(zhong)的(de)(de)Also see部分直(zhi)接鏈接到(dao)相應的(de)(de)PDF說(shuo)明書中(zhong)。作為(wei)初學者,我強烈建(jian)議你將[U]和(he)[D]打印(yin)出來(lai)(lai),反復研(yan)讀(du)。stata手(shou)冊內(nei)容齊(qi)全,但不便(bian)于閱讀(du),把命(ming)令與例題割裂開來(lai)(lai),閱讀(du)起來(lai)(lai)很(hen)不方便(bian)。
stata軟件(jian)在社會(hui)科學研(yan)究中(zhong)的高級(ji)應(ying)(ying)用:周文(wen)光,李(li)堯遠,梁煒(wei) 著,西(xi)北工業大學出版(ban)社出版(ban)。該書詳細介(jie)紹了(le)如(ru)何應(ying)(ying)用stata對(dui)連續變量(liang)與(yu)分(fen)(fen)(fen)類變量(liang)進行分(fen)(fen)(fen)析,包括回歸分(fen)(fen)(fen)析,時間序列分(fen)(fen)(fen)析,面板數據分(fen)(fen)(fen)析等,并介(jie)紹了(le)如(ru)何使(shi)用stata進行生存分(fen)(fen)(fen)析與(yu)聚類分(fen)(fen)(fen)析、編程等內容。
Stata視(shi)(shi)頻(pin)(pin)。相比于(yu)(yu)網(wang)絡(luo)教程和(he)紙本教材,通(tong)過視(shi)(shi)頻(pin)(pin)學(xue)習(xi)Stata可能是最(zui)快捷的(de)(de)(de)(de)方(fang)(fang)(fang)(fang)式了(le)。UCLA免費發布的(de)(de)(de)(de)視(shi)(shi)頻(pin)(pin)教程,內容(rong)涉(she)及(ji)Stata入門、數據(ju)處理和(he)繪圖(tu)(tu)等。采用(yong)英文(wen)講解,思路清晰。局限在(zai)于(yu)(yu)所涉(she)及(ji)內容(rong)不夠系統,但對(dui)于(yu)(yu)想快速入門的(de)(de)(de)(de)學(xue)生則(ze)是一份不錯的(de)(de)(de)(de)參考資(zi)料。同(tong)時(shi),藉(jie)由這份資(zi)料也可以(yi)練(lian)習(xi)一下英語聽力。對(dui)于(yu)(yu)中文(wen)用(yong)戶而(er)言,人(ren)大(da)論壇發布的(de)(de)(de)(de)Stata初(chu)(chu)級(ji)和(he)高(gao)級(ji)視(shi)(shi)頻(pin)(pin)則(ze)提(ti)供(gong)了(le)更為快捷的(de)(de)(de)(de)學(xue)習(xi)方(fang)(fang)(fang)(fang)式。其中,初(chu)(chu)級(ji)視(shi)(shi)頻(pin)(pin)主(zhu)要(yao)介(jie)紹(shao)stata的(de)(de)(de)(de)操(cao)作方(fang)(fang)(fang)(fang)法(fa),包括stata入門、stata數據(ju)處理、stata繪圖(tu)(tu)、stata矩陣以(yi)及(ji)stata編(bian)程初(chu)(chu)步五個部分。高(gao)級(ji)視(shi)(shi)頻(pin)(pin)主(zhu)要(yao)介(jie)紹(shao)各(ge)種(zhong)計量模(mo)型(xing)的(de)(de)(de)(de)基本原理,重點介(jie)紹(shao)其在(zai)stata中的(de)(de)(de)(de)實現(xian)方(fang)(fang)(fang)(fang)法(fa),包括OLS、GLS、MLE、IV-GMM、時(shi)間序列(lie)分析(xi)、面(mian)板模(mo)型(xing)、stata高(gao)級(ji)編(bian)程、Bootstrap和(he)Monte Carlo模(mo)擬等內容(rong),比較全(quan)面(mian)的(de)(de)(de)(de)涵蓋(gai)了(le)計量經濟(ji)學(xue)和(he)核心內容(rong)。
統(tong)計方法(fa):Rabe-Hesketh and Everitt(2006)。
Stata繪圖:Mitchell(2008),非常細(xi)致地介紹了各種圖形的繪制方法。
Stata數據處理:Kohler and Kreuter(2005)*、Long(2009)*、楊菊(ju)華(2008)。
Stata編程:Baum(2009),當然,該(gai)書(shu)中有關數據處理的介紹也(ye)非(fei)常精彩。
Logit/Probit模(mo)(mo)型(xing):Hosmer and Lemeshow(2000)*對相關的(de)理論進行非(fei)常細(xi)致的(de)介紹,是我學習Logit模(mo)(mo)型(xing)的(de)入門(men)教(jiao)材;Long and Freese(2001)*、Long and Freese(2006)、Hilbe(2009)則涉及(ji)了(le)大(da)量的(de)Stata實例(li),對解讀Logit/Probit模(mo)(mo)型(xing)的(de)結果很有幫助;Rabe-Hesketh et al.(2004)提供了(le)在GLLAMM架構下估計xtlogit, xtprobit, xtmelogit以(yi)及(ji)xtmepoisson模(mo)(mo)型(xing)的(de)方法。
Panel Data和(he)多層次模型:Stata11 手冊[XT]*,簡潔明了,附有(you)大量實(shi)例;Cameron and Trivedi(2009)*、王志剛(2008)、Rabe-Hesketh and Skrondal(2008)。
Mata:Schmidheiny(2008)*,簡潔明了介(jie)紹(shao)了Mata的基(ji)本(ben)用法;詳情則可參與Stata11手冊[M]。
GLLAMM:Rabe-Hesketh et al.(2004)。
Meta:Sterne(2009)。
GLM:Hardin et al.(2007)。
MLE:Harrison(2008)(Lectures)、Gould et al.(2006)。
生存分析:Cleves et al.(2008)。
Stata是(shi)一(yi)個統計(ji)分(fen)析軟(ruan)件,但(dan)它也具有很強的(de)(de)程序語(yu)言功能,這給用戶(hu)提供(gong)了一(yi)個廣闊的(de)(de)開發應用的(de)(de)天地(di),用戶(hu)可(ke)以充分(fen)發揮(hui)自(zi)己的(de)(de)聰明才智,熟練(lian)應用各種技巧,真正做到隨心所(suo)欲。事實(shi)上,Stata的(de)(de)ado文件(高(gao)級統計(ji)部(bu)分(fen))都是(shi)用Stata自(zi)己的(de)(de)語(yu)言編寫(xie)的(de)(de)。
Stata其(qi)統(tong)計(ji)分析能力遠(yuan)遠(yuan)超過了SPSS,在許(xu)多方(fang)面也(ye)超過了SAS!由于Stata在分析時是將(jiang)(jiang)數(shu)據(ju)全部讀入(ru)內(nei)存(cun),在計(ji)算(suan)(suan)(suan)全部完成后才(cai)和磁(ci)盤交換數(shu)據(ju),因此計(ji)算(suan)(suan)(suan)速度極快(kuai)(一(yi)般來說, SAS的(de)運算(suan)(suan)(suan)速度要比(bi)SPSS至(zhi)少快(kuai)一(yi)個數(shu)量(liang)級(ji),而(er)Stata的(de)某些模塊和執行同樣功能的(de)SAS模塊比(bi),其(qi)速度又比(bi)SAS快(kuai)將(jiang)(jiang)近(jin)一(yi)個數(shu)量(liang)級(ji)!)Stata也(ye)是采用命令行方(fang)式來操作,但使用上遠(yuan)比(bi)SAS簡單(dan)。其(qi)生存(cun)數(shu)據(ju)分析、縱向數(shu)據(ju)(重復測量(liang)數(shu)據(ju))分析等模塊的(de)功能甚至(zhi)超過了SAS。用Stata繪制(zhi)的(de)統(tong)計(ji)圖形相當精美,很有特色。
Stata的統計(ji)功能很強,除了(le)傳統的統計(ji)分(fen)析方法(fa)外,還收集(ji)了(le)近20年(nian)發展起來的新方法(fa),如Cox比例風險回(hui)歸(gui)(gui),指數與Weibull回(hui)歸(gui)(gui),多類結果(guo)與有序(xu)結果(guo)的logistic回(hui)歸(gui)(gui),Poisson回(hui)歸(gui)(gui),負二項(xiang)回(hui)歸(gui)(gui)及廣義(yi)負二項(xiang)回(hui)歸(gui)(gui),隨機效應模型等。具(ju)體(ti)說, Stata具(ju)有如下統計(ji)分(fen)析能力(li):
數(shu)(shu)值變量(liang)資料的一般分(fen)析(xi):參數(shu)(shu)估計(ji),t檢(jian)驗(yan),單因素(su)和(he)多因素(su)的方差(cha)分(fen)析(xi),協(xie)方差(cha)分(fen)析(xi),交互效應模型(xing),平衡(heng)和(he)非(fei)平衡(heng)設計(ji),嵌(qian)套設計(ji),隨機效應,多個均(jun)數(shu)(shu)的兩兩比較(jiao),缺項數(shu)(shu)據(ju)的處理,方差(cha)齊性(xing)檢(jian)驗(yan),正態(tai)性(xing)檢(jian)驗(yan),變量(liang)變換等(deng)。
分(fen)(fen)類資料(liao)的一般分(fen)(fen)析:參數估計,列聯表(biao)分(fen)(fen)析 ( 列聯系數,確(que)切概率 ) ,流行病學(xue)表(biao)格分(fen)(fen)析等(deng)。
等(deng)級資料的一般分(fen)析(xi):秩變(bian)換,秩和檢驗,秩相關等(deng)
相關與(yu)回(hui)(hui)歸(gui)(gui)分析(xi):簡單相關,偏相關,典(dian)型(xing)相關,以及多達數(shu)十種的回(hui)(hui)歸(gui)(gui)分析(xi)方法,如多元線性回(hui)(hui)歸(gui)(gui),逐步回(hui)(hui)歸(gui)(gui),加權回(hui)(hui)歸(gui)(gui),穩鍵回(hui)(hui)歸(gui)(gui),二(er)階段回(hui)(hui)歸(gui)(gui),百分位數(shu) ( 中位數(shu) ) 回(hui)(hui)歸(gui)(gui),殘差分析(xi)、強影響點分析(xi),曲(qu)線擬合,隨機效應的線性回(hui)(hui)歸(gui)(gui)模(mo)型(xing)等。
其(qi)他方法:質(zhi)量控(kong)制,整群抽樣(yang)的設計效率(lv),診斷試驗評價, kappa等(deng)。
Stata的作(zuo)(zuo)圖模(mo)塊,主(zhu)要提供如下八種基本圖形(xing)的制作(zuo)(zuo) : 直(zhi)方圖(histogram),條(tiao)形(xing)圖(bar),百(bai)分(fen)(fen)(fen)條(tiao)圖 (oneway),百(bai)分(fen)(fen)(fen)圓圖(pie),散(san)點圖(two way),散(san)點圖矩陣(zhen)(matrix),星形(xing)圖(star),分(fen)(fen)(fen)位(wei)數(shu)圖。這(zhe)些圖形(xing)的巧(qiao)妙(miao)應用(yong),可以滿足絕大多數(shu)用(yong)戶的統計作(zuo)(zuo)圖要求。在有些非繪(hui)(hui)圖命(ming)令中(zhong),也提供了專門繪(hui)(hui)制某(mou)種圖形(xing)的功(gong)能(neng),如在生(sheng)存分(fen)(fen)(fen)析中(zhong),提供了繪(hui)(hui)制生(sheng)存曲線圖,回歸(gui)分(fen)(fen)(fen)析中(zhong)提供了殘差圖等。
矩陣代數是多元(yuan)統(tong)(tong)計分(fen)析的(de)重要工具, Stata提(ti)供了(le)多元(yuan)統(tong)(tong)計分(fen)析中所需的(de)矩陣基本運算,如矩陣的(de)加(jia)、積、逆、 Cholesky分(fen)解(jie)、 Kronecker內積等(deng);還提(ti)供了(le)一(yi)些(xie)高級運算,如特征(zheng)根、特征(zheng)向量、奇(qi)異(yi)值分(fen)解(jie)等(deng);在(zai)執行完某(mou)些(xie)統(tong)(tong)計分(fen)析命令后,還提(ti)供了(le)一(yi)些(xie)系(xi)統(tong)(tong)矩陣,如估計系(xi)數向量、估計系(xi)數的(de)協方(fang)差矩陣等(deng)。
數據(ju)管理(Data management)
資(zi)料(liao)轉(zhuan)換、分組(zu)處理(li)、附加檔案、 ODBC 、行(xing) - 列轉(zhuan)換、數據標記、字符串函數…等(deng)
基(ji)本統計(Basic statistics)
直交表、相關性、 t- 檢(jian)定、變(bian)異數相等性檢(jian)定、比(bi)例檢(jian)定、信賴區間…等
線性模式(Linear models)
穩健Huber/White/sandwich變異估計(ji) , 三階最小平方法、類非相(xiang)關回歸、齊(qi)次(ci)多項式回歸、GLS
廣(guang)義型(xing)線性模式(Generalized linear models)
十連結函(han)數(shu)、使(shi)用者-定義連結、 ML及IRLS估計(ji)、九變異(yi)數(shu)估計(ji)、七殘差…等(deng)
二元(yuan)、計(ji)數及有限應變量(Binary, count and limited dependent variables)
羅吉斯(si)(si)特、probit、卜松回歸、tobit、truncated回歸、條件羅吉斯(si)(si)特、多項(xiang)式邏(luo)輯、巢狀邏(luo)輯、負二項(xiang)、 zero-inflated模型、Heckman 選(xuan)擇(ze)模式、邊際影響
Panel數據/交叉(cha) - 組合時間序列(Panel data/cross-sectional time-series)
隨機及固定影響(xiang)之回(hui)(hui)歸(gui)(gui)、GEE、隨機及固定-影響(xiang)之卜松(song)及負二項分配、隨機 - 影響(xiang)、工具變量回(hui)(hui)歸(gui)(gui)、AR(1) 干(gan)擾回(hui)(hui)歸(gui)(gui)
無(wu)母數(shu)方(fang)法(Nonparametric methods)
多變(bian)量方法(Multivariate methods)
因(yin)素(su)分析(xi)、多變量回歸(gui)、 anonical 相關系(xi)數
模(mo)型檢定及事后估計量支持(chi)分析(Model testing and post-estimation support)
Wald檢(jian)定(ding)、LR檢(jian)定(ding)、線(xian)性及非(fei)線(xian)性組合、非(fei)線(xian)性限制檢(jian)定(ding)、邊際(ji)影(ying)響(xiang)、修正平(ping)均(jun)數Hausman檢(jian)定(ding)
群(qun)集(ji)分析(xi)(Cluster analysis)
加權平均(jun)、質量中心(xin)及中位數聯結、kmeans、kmedians、dendrograms、停止規則、使用(yong)者擴充
圖形(Graphics)
直線圖(tu)(tu)(tu)、散布圖(tu)(tu)(tu)、條狀圖(tu)(tu)(tu)、圓餅(bing)圖(tu)(tu)(tu)、 hi-lo 圖(tu)(tu)(tu)、回歸診斷(duan)圖(tu)(tu)(tu)…
調(diao)查方法(Survey methods)
抽樣權重、叢集抽樣、分層(ceng)、線性(xing)變(bian)(bian)異數估計(ji)(ji)量(liang)、擬 - 概似最大估計(ji)(ji)量(liang)、回歸、工具(ju)變(bian)(bian)量(liang)…
生存(cun)分析(Survival analysis)
Kaplan–Meier、Nelson–Aalen、Cox回歸(弱性(xing))、參數模式(弱性(xing))、危(wei)險(xian)比(bi)例測(ce)試、時間共變項、左-右檢查、韋柏分配、指數分配…
流行(xing)病學工(gong)具(ju)(Tools for epidemiologists)
比例標準化、病(bing)例控制、已(yi)配適(shi)病(bing)例控制、Mantel – Haenszel,藥理學、ROC分析、ICD-9-CM
時間(jian)序(xu)列(lie)(Time series)
ARIMA、ARCH/GARCH、VAR、Newey–West、correlograms、periodograms、白色 - 噪音測試、最小整數根檢定、時(shi)間序列運算、平滑化
最大概似法(Maximum likelihood)
轉換及常(chang)態檢定(Transforms and normality tests)
Box–Cox、次方轉換Shapiro–Wilk、Shapiro–Francia檢定
其它統(tong)計方(fang)法(Other statistical methods)
樣本數量及(ji)次方、非線性回(hui)歸(gui)、逐步式(shi)回(hui)歸(gui) 、統計及(ji)數學(xue)函(han)數
包含樣本范例(li)(Sample session)
再(zai)抽樣及模擬方法(fa)(Resampling and simulation methods)
bootstrapping、jackknife、蒙地卡羅模擬、排列(lie)檢定
網絡功能
安裝新指(zhi)令(ling)、網絡升級、網站檔案(an)分享、Stata 最新消息
epiman論(lun)(lun)壇學習資源豐富,學術氛圍良好,在(zai)國內新生代公共衛生學術界有一定影響力(li)。是探討Stata、spss、sas、epidata等統計軟件的主流論(lun)(lun)壇之一。