前言:本站為你精心整理了人工智能書(shū)刊中符號(hào)和公式編排探思范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢。
摘要:當(dāng)前,新一代人工智能正在全球范圍內(nèi)蓬勃發(fā)展,帶來(lái)人工智能類書(shū)刊文章近幾年以幾何級(jí)倍數(shù)增加。本文針對(duì)國(guó)內(nèi)人工智能類書(shū)刊文章中符號(hào)和公式編排的常見(jiàn)問(wèn)題,結(jié)合國(guó)家標(biāo)準(zhǔn)進(jìn)行思考并給出規(guī)范的表達(dá)方式,以期對(duì)作者和出版社編輯有所啟發(fā),提高相關(guān)出版物的質(zhì)量。
關(guān)鍵詞:人工智能;書(shū)刊文章;符號(hào);公式;編輯加工
導(dǎo)語(yǔ)
當(dāng)前,新一代人工智能正在全球范圍內(nèi)蓬勃發(fā)展,促進(jìn)人類社會(huì)生活、生產(chǎn)和消費(fèi)模式巨大變革,為經(jīng)濟(jì)社會(huì)發(fā)展提供新動(dòng)能,推動(dòng)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展,加速新一輪科技革命和產(chǎn)業(yè)變革。2017年,國(guó)務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,目標(biāo)是搶抓人工智能發(fā)展的重大戰(zhàn)略機(jī)遇,讓我國(guó)在人工智能領(lǐng)域構(gòu)筑先發(fā)優(yōu)勢(shì)。我國(guó)頂級(jí)的IT企業(yè)和一流高校陸續(xù)成立協(xié)同創(chuàng)新中心、人工智能研究院、人工智能學(xué)院等機(jī)構(gòu)。教育方面,《新一代人工智能發(fā)展規(guī)劃》提出“實(shí)施全民智能教育項(xiàng)目,在中小學(xué)階段設(shè)置人工智能相關(guān)課程,逐步推廣編程教育”的要求。不少省、區(qū)、市都已經(jīng)開(kāi)始探索在義務(wù)教育階段開(kāi)展人工智能教育。人工智能高等教育更是走在前列。2018年,教育部印發(fā)了《高等學(xué)校人工智能創(chuàng)新行動(dòng)計(jì)劃》,將完善人工智能領(lǐng)域人才培養(yǎng)體系作為三大任務(wù)之一,并積極加大人工智能專業(yè)建設(shè)力度。在這些背景下,我國(guó)的人工智能類書(shū)刊文章近幾年以幾何級(jí)數(shù)增加,給出版單位的編輯提出了新的要求和挑戰(zhàn)。從人工智能的理論基礎(chǔ)來(lái)看,一方面,人工智能脫胎于計(jì)算機(jī)學(xué)科,是研究使用計(jì)算機(jī)來(lái)模擬智能的科學(xué),需要用計(jì)算機(jī)程序?qū)崿F(xiàn)這些智能應(yīng)用;另一方面,當(dāng)前以深度神經(jīng)網(wǎng)絡(luò)為代表的新一代人工智能又是建立在以線性代數(shù)和概率論為框架的基礎(chǔ)數(shù)學(xué)之上,通過(guò)在多維上簡(jiǎn)單地組合實(shí)現(xiàn)復(fù)雜的功能。因此,在人工智能類書(shū)刊文章中不可避免地會(huì)碰到大量的數(shù)學(xué)公式、物理量符號(hào)、計(jì)算機(jī)算法和程序段代碼交織在一起的情況,給編輯加工帶來(lái)一定的困擾。本文主要談?wù)劸庉嫾庸と斯ぶ悄軙?shū)刊文章中的符號(hào)和公式時(shí)遇到的幾個(gè)典型問(wèn)題,并簡(jiǎn)單進(jìn)行總結(jié)和歸納。[1]
1.人工智能類書(shū)刊文章中的大、小寫(xiě)
人工智能類書(shū)刊文章中的大、小寫(xiě)表示,除了人名、地名、機(jī)構(gòu)等專有名詞的英文釋義需要首字母大寫(xiě),名詞英文縮寫(xiě)、部分運(yùn)算符號(hào)、人名引申的單位符號(hào)、集合符號(hào)等全部大寫(xiě)外,其他的英文字符均建議用小寫(xiě)表示。這和一般科技類書(shū)刊文章中的表示是統(tǒng)一的,下面舉幾個(gè)人工智能文章中的例子做具體說(shuō)明。例1(1)Python語(yǔ)言、GPU、LeNet神經(jīng)網(wǎng)絡(luò)——這些都是與人工智能相關(guān)的專有名詞或?qū)S忻~縮寫(xiě),有些已經(jīng)收入相關(guān)的《專有名詞詞典》或者在“術(shù)語(yǔ)在線”上能查到,但也有相當(dāng)一部分還沒(méi)有,但是可以按照約定俗成來(lái)表示。(2)支持向量機(jī)(supportvectormachine,SVM)卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetworks,CNN)——人工智能書(shū)刊文章中出現(xiàn)的算法、方法、公式名稱的英文釋義一般全用小寫(xiě)表示,縮寫(xiě)一般全用大寫(xiě)表示。(3)隱馬爾科夫模型(hiddenMarkovmodel,HMM)、蒙特卡洛樹(shù)搜索(Monte-Carlotreesearch)——英文釋義中涉及人名或者地名等專有名詞,專有名詞保持首字母大寫(xiě),其他單詞用小寫(xiě)表示,縮寫(xiě)還是全用大寫(xiě)。(4)國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)ICCV(IEEEInternationalConferenceonComputerVision)——頂級(jí)會(huì)議和機(jī)構(gòu)名稱的英文釋義保留首字母大寫(xiě)。人工智能類書(shū)刊文章中的大、小寫(xiě)表示一般是遵循約定的原則而非通用標(biāo)準(zhǔn),所以尺度比較寬松,編輯加工中做到同一類情況全書(shū)或全文統(tǒng)一也就可以了。
2.人工智能類書(shū)刊文章中的正、斜體
2.1量和單位
人工智能類書(shū)刊文章中的量和單位首先要符合一般性的量和單位正規(guī)表達(dá)方式。[2]量的符號(hào),包括物理量和計(jì)算過(guò)程中用到的變量,通常是單個(gè)的拉丁字母或希臘字母,都必須用斜體表示,如x,y,z,W,α,β,Θ等。有一種情況容易忽略,即變量出現(xiàn)在名詞中,如人工智能類書(shū)刊文章中會(huì)出現(xiàn)k-均值(k-mean)算法、n元語(yǔ)法(n-gram)模型等名詞,其中的k和n表示為變量,所以不管是在中文名稱還是英文釋義中都應(yīng)該用斜體表示。單位符號(hào)則一律用正體表示,如厘米(cm)、千克(kg)等。人工智能書(shū)刊文章中還經(jīng)常會(huì)遇到計(jì)算機(jī)中常用的單位,如比特(b)、比特率(b/s)、千比特每秒(Kb/s)、字節(jié)(B)、千字節(jié)(KB)、兆字節(jié)(MB)等。特別要注意小寫(xiě)k、m和大寫(xiě)K、M作為SI詞頭(加在單位前的符號(hào))的用法,一般來(lái)說(shuō),103=k,10-3=m,106=M,但在計(jì)算機(jī)二進(jìn)制中還有210=K,220=M,所以要根據(jù)上下文的準(zhǔn)確意思來(lái)標(biāo)注單位符號(hào)。人工智能書(shū)刊文章中的單位符號(hào)還有幾個(gè)通用原則需要遵循。(1)作為科技書(shū)籍或文獻(xiàn),單位符號(hào)一般應(yīng)全部使用英文符號(hào),不能中文英文單位混用,除非該量只有中文單位,如計(jì)數(shù)單位“元”“人”“冊(cè)”等,計(jì)時(shí)單位“時(shí)辰”“旬”等,因?yàn)闆](méi)有對(duì)應(yīng)的字母符號(hào),所以只能用中文符號(hào)。(2)多個(gè)具有共同單位的數(shù)值并列或區(qū)間表示時(shí),可以只在最后一項(xiàng)數(shù)值后保留單位符號(hào),其他數(shù)據(jù)后省略,例如,100、200、500HZ(或100,200,500HZ),100~500b/s,1991—1995年等。(3)多個(gè)數(shù)值相乘表示面積、體積、分辨率時(shí),每個(gè)數(shù)值的單位都應(yīng)該保留,例如,體積2m×5m×3m,分辨率800px×600px等。這和上文“多個(gè)具有共同單位的數(shù)值并列”是有明顯區(qū)別的,需要特別注意。
2.2函數(shù)、常數(shù)及運(yùn)算符號(hào)
數(shù)學(xué)公式中常見(jiàn)的函數(shù)、常數(shù)及運(yùn)算符號(hào)一律用正體表示,如sin,cos,∑,∏,log,ln,Δ,π,e(自然對(duì)數(shù)底)等。微分號(hào)“d”和偏微分號(hào)“?”本文認(rèn)為也是運(yùn)算符號(hào)的一種,所以應(yīng)該用正體表示。要注意的是,不能見(jiàn)著符號(hào)e就把它排成正體,一定要明白它代表的數(shù)學(xué)意義,e作為字母變量時(shí)應(yīng)該用斜體表示,同樣的情況還是有π,∑等,這些符號(hào)也常用作變量。人工智能用到的公式除高等數(shù)學(xué)外,還涉及統(tǒng)計(jì)學(xué)的內(nèi)容,例如統(tǒng)計(jì)機(jī)器學(xué)習(xí)部分的內(nèi)容。統(tǒng)計(jì)學(xué)的運(yùn)算符號(hào)一般用斜體表示,還應(yīng)注意大、小寫(xiě)的表示規(guī)則,如概率計(jì)算為大寫(xiě)斜體P,算數(shù)平均數(shù)計(jì)算使用大寫(xiě)斜體M,總體的標(biāo)準(zhǔn)差計(jì)算用小寫(xiě)斜體σ等。人工智能類書(shū)刊文章中還有一類特殊的函數(shù)——激活函數(shù),如softmax,logistic,sigmoid,tanh,ReLU等,實(shí)際處理中,作為一般的數(shù)學(xué)函數(shù)對(duì)待,不管是在正文中還是在公式中,都用正體表示。
2.3上、下標(biāo)的正、斜體
一般原則是,物理量符號(hào)或者在計(jì)算過(guò)程中用到的變量符號(hào)出現(xiàn)在上、下標(biāo)的時(shí)候使用斜體表示,其他均應(yīng)用正體表示。[3]例2Wij,其中的ij是雙變量符號(hào),使用斜體表示;Wi,Wo,其中i,o表示物理量的輸入、輸出狀態(tài),使用正體表示;WT,其中的T是時(shí)間變量,使用斜體表示;WT,其中的T表示矩陣的轉(zhuǎn)置,使用正體表示。人工智能類書(shū)刊文章中變量的上、下標(biāo)還會(huì)用到函數(shù)符號(hào),如果是標(biāo)準(zhǔn)數(shù)學(xué)函數(shù)或特定的函數(shù)符號(hào),如sin(正弦),max(最大),lim(極限),exp(以e為底的指數(shù)函數(shù)),tanh(雙曲正切)等,均用正體表示。但是,很多作者也會(huì)用到自定義的函數(shù)符號(hào)做變量的上、下標(biāo),一般來(lái)說(shuō)自定義的函數(shù)在公式計(jì)算中用斜體表示,因此,用作變量的上、下標(biāo)時(shí)也用斜體表示,如等。
2.4計(jì)算機(jī)程序中的正、斜體
人工智能類書(shū)刊文章中還會(huì)遇到大量的程序代碼,計(jì)算機(jī)執(zhí)行程序時(shí)一般不區(qū)分正、斜體,所以程序代碼編排時(shí)不管是變量還是常量一律用正體表示。通常,為表述一致,程序段的注釋部分(用“#”或“/*”等標(biāo)注)出現(xiàn)的變量也一律用正體表示,但如果在兩個(gè)程序段中間出現(xiàn)的沒(méi)有用“#”或“/*”等標(biāo)示的語(yǔ)句,可以認(rèn)為是正文,其中出現(xiàn)的變量還是要用斜體表示。
3.人工智能類書(shū)刊文章中的黑、白體
3.1矢量、向量、張量和矩陣
《量和單位國(guó)家標(biāo)準(zhǔn)實(shí)施指南》[4]中規(guī)定:矢量、向量、張量和矩陣用黑斜體表示。人工智能類書(shū)刊文章中的公式會(huì)大量用到向量、張量、矩陣,但作者在寫(xiě)作的時(shí)候往往會(huì)忽略標(biāo)注黑體,編輯因?yàn)閷I(yè)知識(shí)的限制,有時(shí)也很難判斷某些量是標(biāo)量還是向量、矩陣、張量。[5]簡(jiǎn)單的方法就是從上下文信息判斷出某些量的屬性,例如,判斷矩陣的直觀方法有轉(zhuǎn)置(T)、取模(║·║)等運(yùn)算,再由這些已知的量推導(dǎo)出其他量的性質(zhì)。但是,人工智能類書(shū)刊文章中大部分的量都無(wú)法這么簡(jiǎn)單判斷,本文根據(jù)編輯此類書(shū)刊文章的經(jīng)驗(yàn)以及與相關(guān)作者的交流溝通,以機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)為例給出一些編輯加工思路。單特征的回歸網(wǎng)絡(luò),本質(zhì)上就是一元線性問(wèn)題,其計(jì)算公式就是一個(gè)線性方程:zi=xi·w+bw和b都是一個(gè)標(biāo)量,每個(gè)特征x對(duì)應(yīng)一個(gè)輸出z,所以都是白體。多特征的回歸網(wǎng)絡(luò),其計(jì)算公式也可以簡(jiǎn)單歸納為一個(gè)線性方程:Z=WTX+B其中,X=,即多個(gè)特征向量的矩陣,所有都是黑體。往后,更復(fù)雜的計(jì)算模型,例如多特征的多分類問(wèn)題以及深度學(xué)習(xí)問(wèn)題,樣本數(shù)肯定大于2,甚至是多維數(shù)據(jù),所以輸入和輸出都應(yīng)該是矩陣或張量,特征數(shù)也肯定多于一個(gè),甚至是多維特征,所以特征和偏置也都是矩陣或張量,都應(yīng)該用黑體表示。[6]例如,對(duì)具有n個(gè)訓(xùn)練數(shù)據(jù){(x1,y1)…,(xn,yn)}的神經(jīng)網(wǎng)絡(luò),其中(xi,yi)(1≤i≤n)分別為輸入樣本及其對(duì)應(yīng)的標(biāo)簽,都是向量表示。對(duì)該神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,一般需要計(jì)算該神經(jīng)網(wǎng)絡(luò)的損失函數(shù),可表示為L(zhǎng)oss(yi,f(W,xi))。其中,Loss是損失函數(shù)符號(hào),因?yàn)槭亲远x函數(shù),此處用的是斜體;f(W,xi)表示參數(shù)為W的神經(jīng)網(wǎng)絡(luò)對(duì)輸入xi的預(yù)測(cè),對(duì)卷積神經(jīng)網(wǎng)絡(luò)而言,W表示神經(jīng)元連接權(quán)重和卷積核權(quán)重等需要學(xué)習(xí)的參數(shù)。此外有個(gè)細(xì)節(jié)要特別小心,即使判定變量為向量、張量、矩陣,也不要一股腦地把此變量整個(gè)排成黑體,要注意上、下標(biāo)的量的屬性。只有同樣是向量、張量、矩陣的上、下標(biāo)才需要排成黑體,其余仍是白體。例如,Loss(yi,f(W,xi))中,雖然y和x都是用黑斜體表示,但下標(biāo)i是用白斜體表示。
3.2集合
集合一般都是用大寫(xiě)拉丁字母的白體表示,如A,B,X,Y,Z等,但某些特殊的集合符號(hào)需要用黑正體或空心正體(或花體)形式表示,如N或N(非負(fù)整數(shù)集),Z或Z(整數(shù)集),R或R(實(shí)數(shù)集)等。但要特別注意是集合內(nèi)的元素有可能是向量或張量,這在人工智能類書(shū)刊文章中非常常見(jiàn),例如輸入數(shù)據(jù)集合X={x1,x2,x3,…,xn},這時(shí),很多作者在寫(xiě)書(shū)過(guò)程中容易直接把X集合標(biāo)成黑體并直接代入后面算式進(jìn)行計(jì)算,混淆了數(shù)據(jù)集合和數(shù)據(jù)矩陣。其實(shí),數(shù)據(jù)集合和數(shù)據(jù)是兩個(gè)不同的概念,集合只能參與集合運(yùn)算,不能參與普通運(yùn)算,直接寫(xiě)進(jìn)公式就寫(xiě)錯(cuò)了。碰到此類情況,本文有如下一種編輯加工時(shí)的修改方案。定義數(shù)據(jù)集合X={x1,x2,x3,…,xn},注意X是大寫(xiě)的白體,另定義小寫(xiě)黑體x=(原則上另定義大寫(xiě)黑體X也可以,但是同時(shí)出現(xiàn)不好區(qū)分,也使讀者疑惑)或者xi(i=1,…,n)代表數(shù)據(jù)代入公式進(jìn)行運(yùn)算。這里的x或xi不再表示集合而是表示數(shù)據(jù)矩陣或單個(gè)數(shù)據(jù)向量、張量??梢?jiàn),符號(hào)和公式的正、斜、黑、白體看似不起眼,實(shí)則非常重要,有時(shí)不僅僅是規(guī)范性問(wèn)題,還是科學(xué)性問(wèn)題。[7]
4.公式、算法偽代碼和程序段混排中的處理
能正確標(biāo)注公式中的正、斜、黑、白體已經(jīng)很難了,如果再碰上公式、算法偽代碼和程序段混排的情況,那就更容易混淆了。下面通過(guò)一個(gè)例子來(lái)說(shuō)明本文的處理方式。例3如果使用深度神經(jīng)網(wǎng)絡(luò)來(lái)擬合動(dòng)作─價(jià)值函數(shù),則該算法被稱為深度Q學(xué)習(xí)?!?,是對(duì)的估計(jì)值,……,利用梯度下降法來(lái)更新參數(shù)θ。算法參數(shù)化的Q學(xué)習(xí)算法函數(shù):DeepQLearning輸入:馬爾可夫決策過(guò)程輸出:策略π此例中的θ,從上下文來(lái)看是個(gè)多維參數(shù),必然是向量或張量,所以正文中用黑斜體表示。本文認(rèn)為算法偽代碼也是正文的一種形式,只不過(guò)加入了repeat、until、for、goto這樣的偽語(yǔ)句(偽語(yǔ)句的編排向程序段靠攏,用正體表示),所以期內(nèi)的公式表述還是應(yīng)該和普通正文表述保持一致。所以此例中出現(xiàn)的θ都統(tǒng)一用黑斜體表示。如果算法偽代碼后面還接了一段Python程序,其中定義了同一個(gè)變量θ,按照前文所述原則,程序內(nèi)的θ按照正白體處理。[8]
5.小結(jié)
以上分析了人工智能類書(shū)刊文章中常見(jiàn)的符號(hào)使用和公式編排問(wèn)題,并給出了規(guī)范性的思考。但符號(hào)和公式使用的實(shí)際情況要復(fù)雜得多,特別是人工智能涉及的公式都是抽象公式,其中變量的一符多用或多符共用的情況普遍存在,用好用準(zhǔn)并不容易。作者和編輯要在熟悉規(guī)范的前提下,根據(jù)知識(shí)內(nèi)容的實(shí)際情況,準(zhǔn)確表達(dá),一起提高此類書(shū)刊文章中符號(hào)和公式使用的規(guī)范性,提高成果質(zhì)量,為我國(guó)新一代人工智能的發(fā)展保駕護(hù)航。
參考文獻(xiàn)
[1]國(guó)家技術(shù)監(jiān)督局.GB3100~3102–93量和單位[M].北京:中國(guó)標(biāo)準(zhǔn)出版社,1993.
[2]國(guó)家技術(shù)監(jiān)督局.量和單位國(guó)家標(biāo)準(zhǔn)實(shí)施指南[M].北京:中國(guó)標(biāo)準(zhǔn)出版社,1996.
[3]陳天驕,劉江,黃韜.人工智能在網(wǎng)絡(luò)編排系統(tǒng)中的應(yīng)用[J].電信科學(xué),2019(5):9-16.
[4]姚瓊.科技期刊中數(shù)學(xué)公式編排的常見(jiàn)問(wèn)題分析[J].中國(guó)多媒體與網(wǎng)絡(luò)教學(xué)學(xué)報(bào)(上旬刊),2019(10):247-248.
[5]葉超.關(guān)于減少數(shù)學(xué)類文章編排錯(cuò)誤的幾點(diǎn)思考[J].科技創(chuàng)新與生產(chǎn)力,2017(1):64-66.
[6]論文中公式和反應(yīng)式的編排規(guī)范[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2011(3):110.
[7]王萌.淺析科技期刊中數(shù)學(xué)公式編輯加工常見(jiàn)問(wèn)題[J].中國(guó)傳媒科技,2020(9):96+104.
[8]朱建新.國(guó)內(nèi)外科技期刊中數(shù)學(xué)符號(hào)編排格式的對(duì)比分析[J].編輯學(xué)報(bào),2019(01):34-36.
作者:韓飛 單位:高等教育出版社
人工智能 人工智能技術(shù)綜述 人工智能教育 人工智能論文 人工智能的發(fā)展?fàn)顩r 人工智能課堂 人工智能技術(shù) 人工智能課程 人工智能專業(yè) 人工神經(jīng)網(wǎng)絡(luò) 紀(jì)律教育問(wèn)題 新時(shí)代教育價(jià)值觀
北大期刊 審核時(shí)間1-3個(gè)月
中國(guó)科學(xué)技術(shù)協(xié)會(huì);中國(guó)自動(dòng)化學(xué)會(huì)