前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇名師寄語范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
關鍵詞:命名實體,特征,條件隨機場
1條件隨機場模型介紹
條件隨機場模型(Conditional Random Fields,CRFs)是近年來在序列標注問題中應用的比較多,也是效果最好的一種模型。,特征。。它沒有隱馬爾可夫模型那樣嚴格的獨立性假設,同時克服了最大熵馬爾可夫模型和其他非生成的有向圖模型所固有的標記偏置的缺點。
1.1 條件隨機場模型定義
Lafferty等定義的條件隨機場模型為[1]:設無向圖G=(V,E),其中V是該無向圖中所有頂點的集合,E是其邊的集合。Y是G中的頂點索引,即。當Y的出現(xiàn)條件依賴于X,且Yv根據(jù)圖結構的隨機變量序列具有馬爾可夫特性,即,則稱(X,Y)是一個條件隨機域。
條件隨機場是一種用于在給定輸入結點值時計算指定輸出結點值的條件概率的無向圖模型。若X是一個值可以被觀察的“輸入”隨機變量集合,Y是一個能夠被模型預測的“輸出”隨機變量的集合,且這些輸出隨機變量之間通過指示依賴關系的無向邊所連接,如圖1-1所示。
1.2 模型參數(shù)求解
Lafferty提出了使用基于IIS(Generalized IterativeScaling)和GIS(Improved Iterative Scaling)的兩種算法對CRFs模型參數(shù)進行估計[1]。GIS算法和IIS算法都屬于迭代梯度方法的范疇。,特征。。迭代梯度方法比較簡單、容易實現(xiàn),但是存在收斂緩慢的缺點。Hannah Wallach[2]通過實驗證明,對CRF模型參數(shù)的求解,較之傳統(tǒng)的迭代梯度方法,數(shù)值優(yōu)化方法的收斂速度更快。目前廣泛使用的條件隨機場參數(shù)估計算法是L-BFGS算法,它是一種近似的二階方法。
2 數(shù)據(jù)準備
2.1 語料
在試驗中,訓練語料和測試語料使用了亞洲微軟研究院的MSRA語料庫。該語料庫是近年來在各種評測會議中用的比較多的,具有容量大、范圍廣、平衡性好、以及通用性高等特性。
2.2 各類字典
本文中所用的字典包括人名字典(PER)、地名字典(LOC)、機構名字典(ORG)、譯名常用字字典(TCC)、中文人名姓常用字典(CXCC)、中文人名姓不常用字典(CXBC)、中文人名常用字字典(CMCC)、人名前綴字典(PPC)、機構名后綴字典(SOC)、地名后綴字典(SLC)、常用單字詞字典(SWC)、詞典(WORD)。這些字典主要是從MSRA語料庫、98年人民日報上半年的以及互聯(lián)網(wǎng)中提取或獲取的。其中各字典的詞條數(shù)依次為:40855,61717,26093,679,100,856,550,695,2125,517,3423,191923。條件隨機場的訓練和測試使用了工具CRF++ 0.51。,特征。。
2.3 特征構造
在應用條件隨機場理論進行名實體識別時,通過前人的試驗結果表明,基于字的識別效果明顯好于基于詞,因此,本文在特征構造時,選擇窗口為5,基于字的進行特征選擇。
在特征選擇過程中,所用的初始特征模板是利用復旦大學Zhang[3]等提出的特征模板,然后在模板基礎上進行改進,獲得本文中提出的最優(yōu)模板。,特征。。本文特征模板包含四部分,分別是:基本特征、后綴特征、字典特征以及復合特征。
2.3.1 基本特征
命名實體一般由多個字或詞組成,例如“東莞理工學院”,這些字或詞在命名實體中出現(xiàn)的頻率不一樣,有的字或詞出現(xiàn)時,可能就是命名實體的一部分,而有些字或詞則不太可能出現(xiàn)在命名實體中,例如單字詞“了”,“的”等等。
表2-1 基本特征
【詩詞】《清江引 清明日出游》(明)王磐
問西樓禁煙何處好?
綠野晴天道。
馬穿楊柳嘶,人倚秋千笑,
探鶯花總教春醉倒。
《途中寒食》(唐)宋之問
馬上逢寒食,途中屬暮春。
可憐江浦望,不見洛橋人。
北極懷明主,南溟作逐臣。
故園腸斷處,日夜柳條新。
《清明》(唐)杜牧
清明時節(jié)雨紛紛,路上行人欲斷魂。
借問酒家何處有?牧童遙指杏花村。
《寒食》(唐)韓翃
春城無處不飛花,寒食東風御柳斜。
日暮漢宮傳蠟燭,輕煙散入五侯家。
【諺語】清明不怕晴,谷雨不怕雨(黑)
清明斷雪,谷雨斷霜(華東、華中、華南、四川及云貴高原)
清明斷雪不斷雪,谷雨斷霜不斷霜(冀、晉)
清明無雨旱黃梅,清明有雨水黃梅(蘇、鄂)
雨打清明前,洼地好種田(黑)
清明雨星星,一棵高粱打一升(黑)
清明有霜梅雨少(蘇)
清明有霧,夏秋有雨(蘇、鄂)
清明宜晴,谷雨宜雨(贛)
雨打清明前,春雨定頻繁(魯)
“雨花石”一詞始見于明末清初,并沿用至今。雨花石作為觀賞石,它并不代表雨花石組的所有礫石,而是“南京雨花臺組觀賞礫石”的簡稱,因此,雨花石應是產(chǎn)于南京地區(qū)雨花臺組中,具有觀賞價值、科學價值和收藏價值的礫石。
觀賞石科學分類和規(guī)范命名是觀賞石基礎理論建設的重要內(nèi)容之一。雨花石種類繁多,成因復雜,審美要素各異,分類多種多樣。本文提出雨花石的自然分類,是根據(jù)雨花石的成分、成因等客觀特征進行分類。
一、巖石類雨花石
母巖為巖石的雨花石,依巖石成分的不同可分以下幾種:
1、瑪瑙雨花石(圖1)
母巖以瑪瑙為主的雨花石?,旇菞l紋、條帶、環(huán)帶狀等隱晶質(zhì)石英巖?,旇в屑t、黃、藍、綠、紫、黑、白等顏色,呈透明、半透明狀,摩氏硬度為7,相對密度2.6左右,折射率1.53-1.54,玻璃光澤。按國家標準,它屬于天然玉石。
瑪瑙是雨花石的主要石種,也是精品雨花石的主要品種。據(jù)《中國雨花石圖典》1200余枚精品雨花石統(tǒng)計,屬于瑪瑙雨花石的占32.54%。
2、玉髓雨花石(圖2)
母巖以玉髓為主的雨花石。玉髓是隱晶質(zhì)石英巖。玉髓呈透明、半透明狀,摩氏硬度為7,相對密度2.6左右,折射率1.53-1.54,玻璃光澤、蠟狀光澤。玉髓按顏色不同可分為紅玉髓、黃玉髓、白玉髓等。玉髓常與瑪瑙密切共生,亦是精品雨花石的主要石種之一。據(jù)《中國雨花石圖典》統(tǒng)計,屬于玉髓雨花石的占23.06%。
按國家標準,玉髓雨花石屬于天然玉石。它與近年來炙手可熱的黃龍玉同屬一類。然而,雨花石豐富瑰麗的色彩,千變?nèi)f化的紋理,千姿百態(tài)的圖象和如夢如幻的意境,以及悠久的賞石文化,都是黃龍玉所無法媲美的。
3、蛋白石雨花石
母巖以蛋白石為主的雨花石。蛋白石為含水的非晶質(zhì)二氧化硅凝膠,含水量5%-30%,它會因失去水分而出現(xiàn)裂隙。有的蛋白石含有微粒狀石英,通過折射光線而形成十分漂亮的虹彩(變彩)。蛋白石一般不透明,摩氏硬度為5-6,蠟狀光澤及玻璃光澤。虹彩蛋白石被稱為貴蛋白石,是蛋白石中的上品。紅色、橙色蛋白石被稱為火蛋白石。蛋白石可與瑪瑙、玉髓共生。據(jù)《中國雨花石圖典》統(tǒng)計,屬于蛋白石雨花石的占2.14%。
4、石英雨花石(圖3)
母巖以粒狀晶質(zhì)石英為主的雨花石。石英的顏色以乳白色為主,半透明,摩氏硬度為7,玻璃光澤。據(jù)《中國雨花石圖典》統(tǒng)計,屬于石英雨花石的占3.71%。
5、彩石雨花石(圖4)
母巖以彩石為主的雨花石。中國自古以來把“石有彩色者”當做彩石。本文的“彩石”包括碧玉巖、燧石巖、火山巖、火山碎屑巖、硅化泥質(zhì)砂巖等。大多具有隱晶質(zhì)或晶質(zhì)結構,條帶狀、條紋狀或角礫狀構造等。巖石不透明,摩氏硬度為5-7,其相對密度、折射率、光澤度相對于瑪瑙和玉髓要低。其中碧玉可與瑪瑙、玉髓等共生。彩石是雨花石的主要石種之一,也是精品雨花石的主要品種之一。許多人物雨花石精品,都屬于彩石雨花石。據(jù)《中國雨花石圖典》統(tǒng)計,屬于彩石雨花石的占36.16%。
二、礦物類雨花石:
母巖為礦物單晶的雨花石,有水晶雨花石等。
水晶雨花石,為磨圓的石英單晶體。水晶一般為透明無色,偶見紫色、煙色、淺玫瑰色等。其摩氏硬度為7,相對密度2.66左右,折射率1.54-1.55,玻璃光澤。按國家標準,它屬于天然寶石。根據(jù)顏色的不同,水晶可分為紫水晶、煙水晶等。包裹有金紅石或電氣石等針狀或纖維狀礦物晶體的水晶,被稱為發(fā)晶;包裹有水泡的水晶,被稱為水膽水晶。這兩種雨花石都可能成為精品石或名石。據(jù)《中國雨花石圖典》統(tǒng)計,屬于水晶雨花石的占0.49%。
此外,在雨花石中,水晶常以晶簇出現(xiàn)(圖5)。
三、化石類雨花石:
母巖中含有化石的雨花石,主要有以下幾種:疊層石雨花石(圖6)、珊瑚雨花石、腕足雨花石、鸚鵡螺雨花石、苔蘚蟲雨花石、海綿骨針雨花石、海百合莖雨花石、輝木雨花石等。含化石的巖石有砂巖、灰?guī)r等,均屬沉積巖類。巖石不透明,摩氏硬度為5-6?;枪糯锏倪z骸,是研究地質(zhì)年齡、遠古生態(tài)環(huán)境的珍貴標本,有很高的科學價值;并且,部分化石的紋理、色彩、圖象具有很高的觀賞價值。據(jù)《中國雨花石圖典》統(tǒng)計,屬于化石雨花石的占1.90%。
琥珀雨花石:以琥珀組成為主的雨花石。琥珀是樹脂化石,由有機礦物組成,具有紅、橙、黃、褐等色彩,以透明、半透明為主,摩氏硬度為2-3,樹脂光澤,珍珠光澤。按國家標準,它屬于天然有機寶石。雨花石中大多為琥珀玉髓石(圖7),摩氏硬度達5左右。自古以來,琥珀一直就是皇家、貴族、富紳爭奪的財富。在寶石界,琥珀常依顏色分為血珀、金珀、蜜珀、藍珀等。其中金珀和藍珀最為珍貴。含有動物包裹體的琥珀,被稱為“蟲珀”。它是研究地質(zhì)年齡、遠古生態(tài)環(huán)境的珍貴標本,被收藏界視為為數(shù)不多的收藏珍品。琥珀雨花石常有一層不透明的皮膜,需認真鑒別。
人們最大的不解是,面對“有人溺水被救”這最好的新聞素材,作為新聞記者的她為什么要放棄采訪的機會,而選擇去搶救明顯已經(jīng)停止呼吸的小女孩?在充斥著浮躁功利心態(tài)的今天,這件事無疑給我們帶來了安慰,也帶來了深思。
如果女記者到達現(xiàn)場后立即進行采訪,我想也不會有人責難她,因為采訪是記者的職責,更何況小女孩已經(jīng)停止了呼吸。她也有種種不搶救的理由,譬如我不是醫(yī)生,譬如我不懂得如何搶救。但是她沒有,而是義無反顧地放棄所謂的記者的職責,進行了現(xiàn)在看來無謂的搶救。因為在她心里,生命是最重要的,其他的都不重要。采訪的機會有的是,而生命只有一次。
如果我們也是記者,我們會怎樣選擇?是平靜地采訪,等待救護車的到來,還是像這位女記者一樣去搶救女孩?要果斷做出抉擇是很難的,正因為如此,我們就更加敬佩她。
或許在幾年前,這件事不會引起人們這樣的關注,而現(xiàn)在,市場經(jīng)濟的作用已被人們無限放大,處于社會轉(zhuǎn)型期的中國社會,浮躁、自私,道德淪喪也成為較普遍的問題,街上陌生人不信賴的目光越來越多,人們越來越看中榮譽、成就,而女記者卻又做得那樣自然,這足以喚起人們心中的良知。
女記者是善良的,她同把生的希望留給他人的女導游、深入山區(qū)教學的大學生、無私捐助貧困山區(qū)的歌手一樣,都是創(chuàng)建和諧社會的典范。沒有他們那樣的人存在,怎能讓我們感到社會的溫暖?沒有他們的行為影響我們,怎能改善社會風氣?當機遇與生命相遇,女記者帶給我們的是對人性的重新思考,是對生命的尊重。
2021年英語四級報名時間:3月份和9月份。大學英語四級6月份考試的報名時間約3月中下旬開始報名。12月份考試的報名時間約在9月上中旬開始報名??荚嚂r間通常情況下為每年6月份、12月份的第三個星期六。
擴展資料
大學英語四級考試是由國家教育部高等教育司主持的.全國性英語考試??荚嚨闹饕獙ο笫歉鶕?jù)教育大綱修完大學英語四級的在校專科生、本科生或研究生。大學英語四、六級標準化考試自1986年末開始籌備,1987年正式實施。
(來源:文章屋網(wǎng) )