前言:本站為你精心整理了復(fù)雜社會(huì)研究中計(jì)算及局限探析范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢。
借助于互聯(lián)網(wǎng)、人工智能和計(jì)算機(jī)科學(xué)的發(fā)展,計(jì)算社會(huì)科學(xué)的興起確實(shí)為社會(huì)研究帶來(lái)了很大的技術(shù)和方法上的突破和拓展。利用網(wǎng)絡(luò)媒體和云計(jì)算等新方法來(lái)獲取與分析數(shù)據(jù),尤其是實(shí)時(shí)獲取數(shù)據(jù)并通過(guò)“機(jī)器學(xué)習(xí)”賦能的“計(jì)算機(jī)算法”,為研究與解釋社會(huì)以及預(yù)測(cè)社會(huì)提供了一種前所未有的新范式或思維方式。這也是計(jì)算社會(huì)科學(xué)作為跨學(xué)科的新興領(lǐng)域發(fā)展如此迅猛的主要原因。然而,對(duì)復(fù)雜社會(huì)進(jìn)行研究,計(jì)算仍然難以避免一些局限,理解這些局限對(duì)于利用計(jì)算來(lái)發(fā)展社會(huì)研究的理論和方法都有幫助。
第一,計(jì)算利用的數(shù)據(jù)難以涵蓋復(fù)雜社會(huì)的各個(gè)構(gòu)成要素和要素之間的關(guān)系。在傳統(tǒng)的社會(huì)調(diào)查研究中存在數(shù)據(jù)難以涵蓋社會(huì)中各類人的問(wèn)題,比如社會(huì)學(xué)家埃里克·奧林·賴特在其《后工業(yè)社會(huì)中的階級(jí)》一書(shū)序言中就專門指出,“具有諷刺意義的是,在馬克思主義傳統(tǒng)內(nèi),對(duì)資本主義的批判首先是直接對(duì)準(zhǔn)資本家階級(jí)中最富有的部分,對(duì)資本主義的道德譴責(zé)很大程度上是基于它使貧窮永久存在”。而抽樣調(diào)查恰因條件有限,把階級(jí)結(jié)構(gòu)內(nèi)的兩個(gè)極端給漏掉了:資本的真正所有者大資本家)和邊緣的“底層階級(jí)”(失業(yè)者和喪失勞動(dòng)能力的人)。這種遺漏重要樣本的情況,相信做數(shù)據(jù)調(diào)查的學(xué)者們不會(huì)陌生。
現(xiàn)在利用新的獲取數(shù)據(jù)的方法也存在這樣的問(wèn)題,比如,窮人買車買房更需要借貸,但銀行里沒(méi)有他們的記錄,如果根據(jù)算法提供的信用來(lái)實(shí)施借貸,那么這些人就得不到貸款;對(duì)于不使用臉書(shū)、微博、推特、微信等社交媒體的人員,在利用這些社交媒體記錄的數(shù)據(jù)進(jìn)行計(jì)算和分析時(shí),同樣會(huì)被漏掉;雖然谷歌書(shū)庫(kù)已經(jīng)有了世界多國(guó)數(shù)百年書(shū)籍的海量數(shù)據(jù),但也只是其中的一部分,究竟有多大代表性,分析結(jié)果會(huì)有多大偏差依然是難以解決的問(wèn)題。據(jù)《2021年全球數(shù)字概覽報(bào)告》(Digital2021:GlobalOverviewReport),截至2021年1月,全球有52.2億人使用手機(jī),相當(dāng)于世界總?cè)丝诘?6.6%,也意味著還有三分之一的人口沒(méi)有使用手機(jī)。全球使用互聯(lián)網(wǎng)的人數(shù)達(dá)到了46.6億,比手機(jī)使用者還少,社交媒體用戶數(shù)量占全球總?cè)丝诘囊话攵嘁稽c(diǎn)。另外,有些社會(huì)特征很重要,但很難量化,也難以進(jìn)入計(jì)算范圍。以互聯(lián)網(wǎng)為主要渠道搜集的信息,雖然樣本量大,但覆蓋范圍的代表性比傳統(tǒng)社會(huì)調(diào)查方法更難以把控。
第二,計(jì)算的算法是處理信息的邏輯,即使假定數(shù)據(jù)有了,采取何種算法依然是一大挑戰(zhàn)。傳統(tǒng)上的定量研究方法重在解釋某個(gè)自變量與因變量的關(guān)系,尤其是識(shí)別其因果關(guān)系。利用數(shù)據(jù)訓(xùn)練獲得模型后進(jìn)行預(yù)測(cè),是大數(shù)據(jù)算法比較關(guān)注的。這種以預(yù)測(cè)為目的的算法會(huì)把模型的具體設(shè)置作為黑箱,只要對(duì)預(yù)測(cè)變量的預(yù)測(cè)越精準(zhǔn)就越好。比如高科技產(chǎn)業(yè)的性別歧視問(wèn)題,谷歌2017年給出的報(bào)告稱女性員工明顯比男性收入低,但控制了晉升和主觀業(yè)績(jī)?cè)u(píng)估變量后,谷歌員工的收入就沒(méi)有性別差異了??刂谱兞康脑鰷p也是模型不確定性的源泉。如果采用了不增加這兩個(gè)變量的算法,谷歌員工的收入性別差異出現(xiàn)了,增加后差異就消失了。性別歧視就在于晉升和主觀業(yè)績(jī)?cè)u(píng)估,同樣條件下男性更容易獲得晉升和好的主觀業(yè)績(jī)?cè)u(píng)價(jià)。如果要做性別歧視的因果分析,算法的目的就不僅僅是用擬合度最好的模型來(lái)預(yù)測(cè)員工的收入。報(bào)告人該如何選擇算法?評(píng)估和晉升這樣的預(yù)測(cè)收入很強(qiáng)的變量是否放進(jìn)模型?這就涉及模型的不確定性。
模型的不確定性給一些研究者提供了“挑櫻桃”的機(jī)會(huì)。假定一個(gè)模型里有13個(gè)控制變量,與自變量進(jìn)行不同的組合,會(huì)產(chǎn)生8192種不同模型,也就是8192種不同算法。假定我們要評(píng)估某個(gè)政策實(shí)施后的效果,如果有十來(lái)個(gè)控制變量,在數(shù)千個(gè)算法中,自變量系數(shù)可能有這樣兩種基本情況:(1)全部為正值(或者負(fù)值)且統(tǒng)計(jì)學(xué)意義上顯著(或者部分顯著);(2)有的估計(jì)系數(shù)是正值,有的是負(fù)值,有的顯著,有的不顯著。假定系數(shù)全部為正值且都顯著,那么報(bào)告人該選擇哪個(gè)報(bào)告?如果有正值有負(fù)值呢?康奈爾大學(xué)克里斯托巴·楊格發(fā)明了一個(gè)檢驗(yàn)?zāi)P头€(wěn)健性的辦法,即把所有系數(shù)分布公布出來(lái),把報(bào)告模型的結(jié)果放在分布圖里,一并呈現(xiàn)給讀者。計(jì)算的邏輯需要人來(lái)解釋和賦予意義,數(shù)字和算法本身并沒(méi)有意義。除了模型選擇問(wèn)題,算法的不確定性同樣存在于數(shù)據(jù)搜集、清洗和指標(biāo)建構(gòu)等全過(guò)程??藙诘蠇I·瓦格納等人在《自然》雜志上《測(cè)量融入算法的社會(huì)》,討論當(dāng)根據(jù)特征進(jìn)行個(gè)人推送這類算法蔓延至社會(huì)后,對(duì)社會(huì)的測(cè)量受到(錯(cuò)誤)測(cè)量后果影響,產(chǎn)生了測(cè)量質(zhì)量欠缺問(wèn)題。因此,計(jì)算社會(huì)科學(xué)也面臨著如何保證測(cè)量的效度和信度等問(wèn)題的挑戰(zhàn)。
第三,算法與復(fù)雜社會(huì)的動(dòng)態(tài)演化涌現(xiàn)的不確定性與預(yù)測(cè)算法背后的人的因素都帶來(lái)了計(jì)算在復(fù)雜社會(huì)研究上的局限。人工智能先驅(qū)赫伯特·西蒙研究人工智能的初心是解決人的決策問(wèn)題。在經(jīng)濟(jì)學(xué)領(lǐng)域獲得諾貝爾獎(jiǎng)是源于他提出的有限理性和滿意理論,改變了經(jīng)濟(jì)學(xué)原來(lái)對(duì)人的完全理性和尋求利益最大化假設(shè)。
復(fù)雜社會(huì)環(huán)境下,我們面臨的挑戰(zhàn)是看不見(jiàn)前方,不知身在何處;有危險(xiǎn)因素;環(huán)境不是靜態(tài)的,而是動(dòng)態(tài)的。這樣的復(fù)雜社會(huì)條件下,會(huì)發(fā)生涌現(xiàn)現(xiàn)象,任何細(xì)微變動(dòng)可能導(dǎo)致不可預(yù)測(cè)的大的新現(xiàn)象的發(fā)生,且難以甄別因果關(guān)系。涌現(xiàn)現(xiàn)象不能簡(jiǎn)化為底層規(guī)律,難以甚至無(wú)法預(yù)測(cè)。復(fù)雜的“系統(tǒng)”涉及的不僅僅是游戲規(guī)則(算法),還有行動(dòng)者及其在每個(gè)選擇點(diǎn)上對(duì)大量可用選項(xiàng)做出的決策。復(fù)雜社會(huì)里,人們的有限理性和數(shù)據(jù)與算法的有限性的結(jié)果是,即使有實(shí)時(shí)數(shù)據(jù)也很難精準(zhǔn)預(yù)測(cè)比較滿意的下一步(更無(wú)法知道是否最優(yōu))。我們知道步步看起來(lái)都最優(yōu)的決策的“貪婪算法”并不可取,因?yàn)樽詈笸皇侨值淖顑?yōu)解。有時(shí)候,人生就像一條有很多極值點(diǎn)的函數(shù),站在導(dǎo)數(shù)為零的極大值點(diǎn),雖然邁出哪一步看起來(lái)都像往下走,但往往是那看似不理性的、向下走的一步,能讓你發(fā)現(xiàn)更高的一座山峰。對(duì)于復(fù)雜性如此高的現(xiàn)代社會(huì),看似理性的“貪婪算法”更不可取。在模型設(shè)置方面,哈佛大學(xué)克里斯托弗·溫士浦教授認(rèn)為,直覺(jué)、理論和事實(shí)以及運(yùn)氣都在幫助我們發(fā)現(xiàn)某種意義上最好的模型上發(fā)揮了作用。也即是說(shuō),雖然我們有很高級(jí)的計(jì)算技術(shù),不斷開(kāi)發(fā)新的計(jì)算軟件,但算法本身的決定因素中含有的運(yùn)氣成分是難以完全掌控的。復(fù)雜社會(huì)里的偶然性因素或者稱運(yùn)氣成分時(shí)刻存在,對(duì)社會(huì)研究中算法的設(shè)置造成了難以解決的不確定性。即使基于主體的建模,即ABM(agent-basedmodeling),作為一種為解決復(fù)雜性而提出的仿真技術(shù),也只能是在主體互動(dòng)游戲規(guī)則方面有限模仿。
算法只是可能幫助我們?yōu)椴淮_定性尋找一定的確定性,其背后是人的情感和偏好。人生中每個(gè)決策都是利用人生閱歷作為數(shù)據(jù),訓(xùn)練出“模型”,即認(rèn)知模式,從而每天做出決策并采取行動(dòng)。算法就在我們的日常生活中。作為計(jì)算社會(huì)科學(xué)學(xué)人,我們要比普通人更理解計(jì)算在面對(duì)復(fù)雜社會(huì)進(jìn)行研究方面的局限,才能更好地利用計(jì)算為社會(huì)科學(xué)方法和理論的創(chuàng)新服務(wù),進(jìn)而為建設(shè)美好社會(huì)作出應(yīng)有的貢獻(xiàn)。
作者:陳心想 單位:中央民族大學(xué)民族學(xué)與社會(huì)學(xué)學(xué)院
部級(jí)期刊 審核時(shí)間1個(gè)月內(nèi)
教育部人文社會(huì)科學(xué)重點(diǎn)研究基地清華大學(xué)技術(shù)創(chuàng)新研究中心;中國(guó)技術(shù)經(jīng)濟(jì)學(xué)會(huì)復(fù)雜科學(xué)管理分會(huì)