前言:本站為你精心整理了計(jì)量經(jīng)濟(jì)學(xué)教學(xué)實(shí)踐淺析范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢。
摘要:R是一款開(kāi)源免費(fèi)的統(tǒng)計(jì)軟件,其強(qiáng)大的數(shù)據(jù)分析能力使得它在計(jì)量經(jīng)濟(jì)學(xué)領(lǐng)域有著廣闊的應(yīng)用空間。本文結(jié)合計(jì)量經(jīng)濟(jì)學(xué)教學(xué)實(shí)踐,分析總結(jié)了R軟件在計(jì)量經(jīng)濟(jì)學(xué)教學(xué)與科研方面的優(yōu)勢(shì)與挑戰(zhàn),并對(duì)R軟件在計(jì)量經(jīng)濟(jì)學(xué)方面的融合、拓展提出了相關(guān)建議,以便將來(lái)更好開(kāi)展該領(lǐng)域的教研工作。
關(guān)鍵詞:R軟件;計(jì)量經(jīng)濟(jì)學(xué);功能包
一、引言
R是一種用于統(tǒng)計(jì)計(jì)算與繪圖的開(kāi)源軟件,同時(shí)也是一種編程語(yǔ)言。它廣泛應(yīng)用于商業(yè)性數(shù)據(jù)分析和學(xué)術(shù)研究領(lǐng)域。長(zhǎng)期以來(lái),R都被貼上統(tǒng)計(jì)軟件的標(biāo)簽,在統(tǒng)計(jì)、生物、醫(yī)學(xué)以及人工智能等領(lǐng)域有大量的用戶群,但在計(jì)量經(jīng)濟(jì)學(xué)領(lǐng)域,目前使用R開(kāi)展教學(xué)、科研的用戶較為有限。作為一款開(kāi)源軟件,R軟件的所有功能都是由全球范圍內(nèi)的專業(yè)研究人員提供相應(yīng)的功能包(package)來(lái)實(shí)現(xiàn)的,截至2021年5月,在CRAN網(wǎng)站上已經(jīng)發(fā)布了與計(jì)量經(jīng)濟(jì)學(xué)直接相關(guān)的功能包(package)超過(guò)140個(gè),涵蓋了計(jì)量經(jīng)濟(jì)學(xué)中經(jīng)典的以及最前沿的建模方法。Kleiber&Zeileis(2008)是向計(jì)量經(jīng)濟(jì)學(xué)領(lǐng)域推廣R軟件的先行者,他們也是AER包的開(kāi)發(fā)和維護(hù)者[1]。另外,Heiss(2020)也出版了針對(duì)R入門(mén)級(jí)別用戶的計(jì)量經(jīng)濟(jì)學(xué)指導(dǎo)教程[2]。在國(guó)內(nèi),專門(mén)使用R軟件作為計(jì)量經(jīng)濟(jì)學(xué)教學(xué)配套軟件的教材和著作還比較有限,但是鑒于R目前在數(shù)據(jù)科學(xué)領(lǐng)域的快速發(fā)展,越來(lái)越多的研究人員和商業(yè)化的數(shù)據(jù)分析工作者參與其中,這種趨勢(shì)在大數(shù)據(jù)時(shí)代背景下越發(fā)明顯。因此,加快推進(jìn)計(jì)量經(jīng)濟(jì)學(xué)實(shí)證領(lǐng)域的R軟件教學(xué)實(shí)踐,一方面可以使教師緊跟大數(shù)據(jù)時(shí)代的新工具、新方法,同時(shí)也拓寬了學(xué)生的視野,提升了他們的數(shù)據(jù)分析能力。我們相信由此所獲得的收益必將遠(yuǎn)遠(yuǎn)超過(guò)其所付出的學(xué)習(xí)成本。
二、用R開(kāi)展計(jì)量經(jīng)濟(jì)學(xué)教學(xué)的優(yōu)勢(shì)
(一)易獲得性
R是一款免費(fèi)發(fā)行的軟件,它的基礎(chǔ)開(kāi)發(fā)與功能包維護(hù)是由R開(kāi)發(fā)核心小組(RDevelopmentCoreTeam)負(fù)責(zé)。R軟件提供了三個(gè)平臺(tái)的支持:Linux、Macintosh和Windows。R軟件中包含了許多實(shí)用的統(tǒng)計(jì)分析與作圖函數(shù)。統(tǒng)計(jì)分析的結(jié)果通常保存在一個(gè)對(duì)象中,很多中間結(jié)果并不會(huì)直接顯示,用戶可以根據(jù)自己分析的需要進(jìn)行調(diào)用。作圖函數(shù)能將生成的圖片展示在一個(gè)獨(dú)立的窗口中,也可以將繪圖結(jié)果輸出到其他格式的文件中予以保存。打開(kāi)網(wǎng)站:www.r-project.org,進(jìn)入Download欄目下CRAN,選擇合適的鏡像網(wǎng)站。中國(guó)大陸用戶可以選擇China分組下的任一網(wǎng)址鏈接,進(jìn)入CRAN后,點(diǎn)擊“DownloadRforWindows”。Download頁(yè)面有四個(gè)板塊:
1.BASE。R軟件的核心模塊。對(duì)于新用戶,這是首先要安裝的內(nèi)容。
2.Contrib.由第三方提供的功能包(package)的合集,這里面提供了超過(guò)17000個(gè)包,提供了各種不同功能,滿足不同用戶需求。
3.OldContrib.各種功能包的歷史版本。如果用戶對(duì)特定包的歷史發(fā)展感興趣,可以瀏覽此欄目。
4.Rtools.R配套工具箱??捎糜诰幾g自己所寫(xiě)的pack-age。如果想跟其他人分享自己所編寫(xiě)的程序包,可以用Rtools中所提供的函數(shù),實(shí)現(xiàn)package的編譯、審核、發(fā)布。點(diǎn)擊base,進(jìn)入下載頁(yè)面,選擇“downloadR4.2.0forwindows”,下載安裝包并安裝。安裝完畢后,啟動(dòng)R。傳統(tǒng)的R程序運(yùn)行界面比較簡(jiǎn)陋,即所謂的“RGui”,用戶可以在提示符“>”后輸入命令來(lái)完成相應(yīng)操作?,F(xiàn)在已經(jīng)很少有人利用RGui來(lái)執(zhí)行相關(guān)數(shù)據(jù)分析工作,絕大多數(shù)人都選擇了第三方編輯器———Rstudio。Rstudio是Rstudio公司開(kāi)發(fā)的一款適用于R的開(kāi)源編輯器,他有單機(jī)版(Desktop)和網(wǎng)絡(luò)版(Server)兩個(gè)版本。初學(xué)者可以選擇單機(jī)版,簡(jiǎn)潔易用好上手。啟動(dòng)Rstudio,此時(shí)所看到的界面相對(duì)友好。主題界面的左邊是控制臺(tái)窗口,輸入命令,結(jié)果反饋都在這一區(qū)域。右上方是環(huán)境窗口,當(dāng)前工作環(huán)境下有哪些變量、函數(shù)、數(shù)據(jù)等,都將在這顯示。右下方集成了五個(gè)功能界面:Files,當(dāng)前工作路徑下的文件列表;Plots,圖形輸出結(jié)果;Packages,本機(jī)已安裝的包;Help,幫助文檔的顯示界面;Views,視圖界面。Rstudio除了能完成常規(guī)的命令輸入,代碼管理功能外,還可以進(jìn)行項(xiàng)目管理,package開(kāi)發(fā),Rmarkdown的編寫(xiě)等功能,用戶體驗(yàn)良好。以往初學(xué)者對(duì)于R里面過(guò)多的命令與函數(shù)感到頭疼,在Rstudio里,強(qiáng)大的提示和補(bǔ)充功能,讓這一煩惱不復(fù)存在。
(二)功能覆蓋全面
CRAN網(wǎng)站上把R的所有功能包按主題大致分了36個(gè)大類,每一個(gè)主題都有志愿者擔(dān)任維護(hù)人員,主題下面列舉出CRAN上目前與該主題有關(guān)的packages,核心的功能包用星號(hào)予以標(biāo)注。Econometrics位列第七個(gè)主題。這一主題目前的維護(hù)者是AchimZeileis,他同時(shí)也是<AER>包的開(kāi)發(fā)者之一。在Econometrics這個(gè)主題下,列了大約140個(gè)包,這140個(gè)包又分為七個(gè)專題。
1.Basiclinearregression。這一部分基本涵蓋了經(jīng)典計(jì)量經(jīng)濟(jì)學(xué)所需要的絕大部分方法,包括回歸分析、方差分析、嵌套模型比較、非嵌套模型的比較、系數(shù)檢驗(yàn)、穩(wěn)健性標(biāo)準(zhǔn)誤差以及模型診斷等。涉及的功能包有:stats、lmtest、car、sand-wich、nonnest2等。
2.Microeconometrics。這一部分主要包括廣義線性模型,二元響應(yīng)模型(也稱二元選擇模型)、計(jì)數(shù)模型、多元響應(yīng)模型、次序選擇模型、刪失回歸、截?cái)嗷貧w以及其他一些微觀計(jì)量中所用到的方法,如:隨機(jī)前沿分析等。這一專題包括的功能包有:effects,mfx,margins,LinRegInteractive,brglm,Rchoice,glmx,MASS,aod,pscl,countreg,nnet,mlogit,mnlogit,gmnl,VGAM,MNP,bayersm,RSGHB,ordinal,survival,AER,censReg,intReg,crch,mhurdle,sampleSelection,SemiParSampleSel,matchingMa-rkets,frm,betareg,gamlss,sfa,semsfa,mvProbit。
3.Instrumentalvariables。包括基本工具變量回歸、二元選擇模型的工具變量回歸以及面板數(shù)據(jù)模型的工具變量回歸。這一專題包括的功能包有:sem,inpack,lfe,ivprobit,LARF,ivfixed,ivpanel,REndo,ivbma,ivlewbel。
4.Paneldatamodels。包括誤差成分模型、線性面板模型、混合效應(yīng)模型、異質(zhì)性時(shí)間趨勢(shì)模型、門(mén)限回歸與單位根檢驗(yàn)以及面板向量自回歸。這一專題包括的功能包有:plm,Paneldata,OrthoPanels,geepack,pglm,panelvar,panelAR,phtt,pdR,pampe。
5.Furtherregressionmodels。額外的一些回歸模型專題,包括非線性最小二乘估計(jì)、分位數(shù)回歸、廣義矩估計(jì)、空間計(jì)量經(jīng)濟(jì)學(xué)模型、貝葉斯估計(jì)、線性結(jié)構(gòu)方程模型、聯(lián)立方程模型、非參數(shù)核估計(jì)、廣義可加模型、極值分析。這一專題包括的功能包有:quantreg,gmm,Spatial,splm,BMA,sem,systemfit,np,mgcv,gam,ExtremeBounds。
6.Timeseriesdataandmodels。在CRAN上還有一個(gè)主題TimeSeries是專門(mén)討論時(shí)間序列模型的,因此這里只是簡(jiǎn)要論述一些與計(jì)量經(jīng)濟(jì)學(xué)關(guān)系密切的方法。這一專題大致包括規(guī)則頻率的時(shí)間序列模型、不規(guī)則頻率的時(shí)間序列模型、經(jīng)典時(shí)間序列模型、濾波與分解、向量自回歸、單位根與協(xié)整、門(mén)限回歸與平滑轉(zhuǎn)換、混合頻率數(shù)據(jù)的建模、分布滯后模型等。涉及的功能包有:zoo,xts,forecast,vars,urca,tseries,CADFtest,pco,tsDyn,midasr,dlsem,apt,tsfa。
7.Datasets。該專題收集了一些在計(jì)量經(jīng)濟(jì)學(xué)教學(xué)與科研中常用的數(shù)據(jù),包括教科書(shū)和主要期刊上的部分?jǐn)?shù)據(jù)集,加拿大貨幣與信貸數(shù)據(jù),PennWorldtable,經(jīng)濟(jì)學(xué)實(shí)證研究數(shù)據(jù)集,PSID,美國(guó)州縣層面的失業(yè)率數(shù)據(jù),世界銀行數(shù)據(jù)接口。涉及的功能包有:Ecdat,wooldridge,CDNmoney,pwt9,erer,psidR,rUnemploymentData,wbstats。另外還有一些在計(jì)量經(jīng)濟(jì)學(xué)領(lǐng)域備受關(guān)注的新方法,其所對(duì)應(yīng)的功能包還暫未收錄到上述專題,如結(jié)構(gòu)變化,有strucchange和segmented包;政策評(píng)價(jià)中很常用的不連續(xù)回歸(也譯為斷點(diǎn)回歸),有rdd,rddapp,rddrobust,rdlocrand,rd-power,rdmulti等包。
三、用R開(kāi)展計(jì)量經(jīng)濟(jì)學(xué)教學(xué)面臨的挑戰(zhàn)
(一)R學(xué)習(xí)門(mén)檻較高
R在本質(zhì)上是一門(mén)編程語(yǔ)言,它在風(fēng)格上與常見(jiàn)的E-views和STATA等計(jì)量軟件還是存在較大區(qū)別。如果學(xué)生之前有接觸過(guò)Eviews軟件,那么他再學(xué)習(xí)R會(huì)有一個(gè)較長(zhǎng)的適應(yīng)過(guò)程,相反,如果是接觸C語(yǔ)言課程的同學(xué),再學(xué)習(xí)R則相對(duì)輕松得多。但是,目前在大多數(shù)財(cái)經(jīng)類高校,本科生開(kāi)始編程基礎(chǔ)課的很少,因此,當(dāng)他們初次接觸R語(yǔ)言時(shí),對(duì)R的思維模式、風(fēng)格體例、執(zhí)行方式都表現(xiàn)得很陌生甚至抵觸,覺(jué)得這門(mén)軟件難!在以往的教學(xué)經(jīng)驗(yàn)中,我們?yōu)榱私档蛯W(xué)習(xí)難度,消除學(xué)生的畏懼心理,在課程介紹時(shí),往往只是跟學(xué)生介紹與計(jì)量經(jīng)濟(jì)學(xué)關(guān)系緊密的少數(shù)幾個(gè)包,針對(duì)其中的核心函數(shù)的常見(jiàn)用法做簡(jiǎn)單演示和講解,沒(méi)有做過(guò)多展開(kāi),更不要說(shuō)對(duì)R的一些基礎(chǔ)層面的介紹,常規(guī)的數(shù)據(jù)處理和圖形繪制功能介紹。這樣的妥協(xié)固然可以讓學(xué)生在有限課時(shí)內(nèi)“照貓畫(huà)虎”式的完成計(jì)量方法的操作,但對(duì)于學(xué)生更深入的理解和掌握R是非常不利的。
(二)R更強(qiáng)調(diào)對(duì)模型原理的掌握
R語(yǔ)言相對(duì)一些“傻瓜式”數(shù)據(jù)分析軟件,需要學(xué)生對(duì)所用的模型有更深刻的認(rèn)識(shí),即要求學(xué)生不僅“知其然”還要做到“知其所以然”,否則對(duì)軟件的使用可能出現(xiàn)錯(cuò)誤的解讀。例如在本科階段的計(jì)量經(jīng)濟(jì)學(xué)教學(xué)環(huán)節(jié)中,有兩個(gè)基礎(chǔ)的知識(shí)點(diǎn)---多重共線性和異方差補(bǔ)救措施。多重共線性的補(bǔ)救措施中有一種方案為嶺回歸估計(jì),在R中嶺回歸的函數(shù)為lm.ridge(),這個(gè)函數(shù)的實(shí)現(xiàn)原理與SPSS、SAS等軟件的實(shí)現(xiàn)原理都不相同,R軟件的估計(jì)結(jié)果和這個(gè)兩個(gè)軟件的結(jié)果有差異。如果學(xué)生不了解嶺回歸原理,或許會(huì)認(rèn)為R的軟件包存在錯(cuò)誤。對(duì)這一問(wèn)題詳細(xì)討論可參見(jiàn)尹康(2013)[3]。對(duì)于異方差的補(bǔ)救措施,傳統(tǒng)的方案建議采用加權(quán)最小二乘法(WLS),但是在實(shí)際估計(jì)過(guò)程中,權(quán)重不易選取,因此更穩(wěn)健的方案是異方差一致估計(jì)標(biāo)準(zhǔn)誤(HCC)的修正,即參數(shù)估計(jì)仍采用最小二乘法(OLS),僅對(duì)參數(shù)估計(jì)標(biāo)準(zhǔn)誤進(jìn)行修正。在STATA軟件中,實(shí)現(xiàn)這一方案非常簡(jiǎn)單,假如被解釋變量為$y$,解釋變量為$x$,只需輸入命令:regyx,robust,STATA即可輸出穩(wěn)健回歸的結(jié)果。在R中,一致標(biāo)準(zhǔn)誤的設(shè)定要更全面也更復(fù)雜。對(duì)應(yīng)執(zhí)行命令:lm01<-lm(y~x)coeftest(lm01,vcov.=vcovHC(lm01,type="HC3"))在R中報(bào)告穩(wěn)健回歸的結(jié)果需要兩步,首先做回歸,然后對(duì)回歸結(jié)果執(zhí)行coeftest()函數(shù)才能報(bào)告穩(wěn)健回歸的結(jié)果。在coeftest函數(shù)中‘type’參數(shù)用于選擇異方差一致標(biāo)準(zhǔn)誤差的計(jì)算方式,它一共提供8種計(jì)算方式。根據(jù)付宏和尹康(2016)的設(shè)定,對(duì)于多元線性回歸模型Y=Xβ+ε,Y為n維列向量,X為n×k階矩陣,β為k維列向量,ε為n維向量[4]。在最小二乘估計(jì)框架下,有。當(dāng)ε滿足同方差假定時(shí),,當(dāng)ε為異方差時(shí),定義,根據(jù)Davidson&Macki-non(2004)的討論,R軟件一共設(shè)計(jì)了八種異方差一致標(biāo)準(zhǔn)誤的計(jì)算模式[5]。我們這里僅列出其中常用的五種,分別為:,。其中ei為殘差,hi為矩陣主對(duì)角線第i個(gè)元素。在這里,HC0是White(1980)所推薦的方式,而Davidson&Mackinon(2004)通過(guò)模擬發(fā)現(xiàn),HC1、HC2、HC3這三種方式在小樣本情形下更有效[5-6]。在R軟件中,如果不對(duì)'type'參數(shù)做設(shè)定,則默認(rèn)選擇HC3。通過(guò)上面兩個(gè)在基礎(chǔ)計(jì)量經(jīng)濟(jì)學(xué)學(xué)習(xí)階段所遇到的兩個(gè)小問(wèn)題,我們可以看出R軟件更強(qiáng)調(diào)用戶對(duì)每一個(gè)函數(shù)語(yǔ)句背后所對(duì)應(yīng)的計(jì)量理論掌握,這對(duì)于需要進(jìn)一步學(xué)習(xí)更高階計(jì)量經(jīng)濟(jì)學(xué)課程的學(xué)生來(lái)說(shuō),非常有必要,但同時(shí)對(duì)本科階段的學(xué)生又存在一定挑戰(zhàn)。
(三)經(jīng)管類專業(yè)學(xué)習(xí)R的氛圍不足
正如前文所說(shuō),R首先是一個(gè)統(tǒng)計(jì)軟件,所以它在統(tǒng)計(jì)、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、醫(yī)學(xué)統(tǒng)計(jì)以及生物統(tǒng)計(jì)都有大量的用戶群。相反,在經(jīng)管類專業(yè)的學(xué)生或教師群體中,使用R的人還不多,這使得很多學(xué)生在選擇軟件時(shí)因?yàn)閺谋娦睦矶雎訰。針對(duì)這一現(xiàn)象,還需要我們?cè)谟?jì)量實(shí)證領(lǐng)域加大對(duì)R的推廣。一個(gè)令人欣慰的現(xiàn)象是,隨著近些年國(guó)內(nèi)的經(jīng)濟(jì)學(xué)實(shí)證研究越來(lái)越重視對(duì)因果推斷方法的應(yīng)用,而R在因果推斷方面的包現(xiàn)在也比較全面,因此很多介紹因果推斷的教科書(shū)都在介紹相應(yīng)R包的用法,相信在不久的將來(lái),計(jì)量經(jīng)濟(jì)學(xué)領(lǐng)域的R用戶群會(huì)越來(lái)越大。四、總結(jié)及未來(lái)的展望目前,在經(jīng)管類專業(yè)推廣R語(yǔ)言作為計(jì)量經(jīng)濟(jì)學(xué)的配套軟件,有非常大的發(fā)展?jié)摿?,但同時(shí)也面臨一些挑戰(zhàn)。長(zhǎng)遠(yuǎn)來(lái)看,學(xué)生未來(lái)無(wú)論是從事學(xué)術(shù)研究或從事實(shí)務(wù)部門(mén)工作,都需要掌握一定的數(shù)據(jù)分析能力。R作為一款功能強(qiáng)大并且免費(fèi)易獲得的數(shù)據(jù)分析軟件,如果學(xué)生能較為熟練使用該軟件進(jìn)行數(shù)據(jù)分析、計(jì)量建模分析,這對(duì)于經(jīng)管類專業(yè)的學(xué)生而言,絕對(duì)是擁有了一項(xiàng)核心競(jìng)爭(zhēng)力。從應(yīng)用R開(kāi)展計(jì)量教學(xué)經(jīng)驗(yàn)來(lái)看,目前在R已發(fā)布的功能包中,除了AER這個(gè)包之外,尚未有整合較為全面的包。在經(jīng)典計(jì)量經(jīng)濟(jì)學(xué)教科書(shū)中所介紹的主流方法及模型,都是分散在眾多零散功能包之中,有些包中對(duì)同一個(gè)概念的表述還不盡相同,有的估計(jì)方法又在不同包中重復(fù)出現(xiàn)。這既占用了資源,也增加了用戶學(xué)習(xí)使用成本。因此,有必要編制幾個(gè)綜合型功能包,對(duì)已有的計(jì)量功能包進(jìn)行分類整合,這樣對(duì)降低新用戶的學(xué)習(xí)成本非常有幫助,也有利于進(jìn)一步擴(kuò)大R在計(jì)量經(jīng)濟(jì)學(xué)實(shí)證領(lǐng)域的用戶群。
作者:尹康 單位:湖北經(jīng)濟(jì)學(xué)院經(jīng)濟(jì)與貿(mào)易學(xué)院
計(jì)量經(jīng)濟(jì)學(xué) 計(jì)量技術(shù)論文 計(jì)量管理論文 計(jì)量經(jīng)濟(jì)論文 計(jì)量培訓(xùn)總結(jié) 計(jì)量分析論文 計(jì)量技術(shù) 紀(jì)律教育問(wèn)題 新時(shí)代教育價(jià)值觀