前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇古漢語范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
關鍵詞:偏義復詞;特點;作用
中圖分類號:H109.2 文獻標識碼:A 文章編號:1005-5312(2013)08-0211-01
一、古漢語偏義復詞成因分析
從對我國傳統(tǒng)語言學的研究中不難發(fā)現(xiàn)古人在遣詞造句以表情說理時往往用語寬緩不迫,偏義復詞這種兩個語素并用卻只有一個語素表義的方法切合了古人的語用習慣,因而古書中就有大量的偏義復詞現(xiàn)象。古人在行文時明明可以用一個單音詞就可以表達意思,卻偏兩個語素連用且其中一個語素只是作為陪襯,”這種用法并不是古人沒有道理肆意為之,而確實是古人為追求行文不迫,音節(jié)舒緩,句式整齊的表達效果而有意而為。
(1)有孫母未去,出入無完裙。(杜甫《石壕吏》)
(2)陟罰臧否,不宜異同。(諸葛亮《出師表》)
例一中“出入”偏“出”義,即是說,出門時沒有合適的衣服。這是五言詩中為求字數(shù)匹配和韻律的需要而加了“入”字,實則“入”字并不表意。例二也都如此。由此可見,古人行文多用字數(shù)相等,結(jié)構(gòu)相當?shù)木渥觼磉_到一種音節(jié)協(xié)調(diào)、對稱之美,偏義復詞的大量使用正是切合了古人的語用習慣。
在上古時期,單音節(jié)詞還是能滿足人們交際表達的需要的。然而,到了西周、春秋時期,單音節(jié)詞的構(gòu)詞方式已經(jīng)遠不能滿足人們的對新詞的需求了。偏義復詞是以單音節(jié)詞連用為基礎而逐漸發(fā)展起來的??梢哉f,如果沒有雙音節(jié)詞連用的構(gòu)詞方式,也不會出現(xiàn)偏義復詞。只是偏義復詞在構(gòu)詞時與復合詞中其他類型有所不同。偏義復詞是兩個語素聯(lián)合而成,但其構(gòu)成方式不是簡單的二者意義的融合或者相加構(gòu)成新義,而是其中一個單音節(jié)詞在構(gòu)詞的新詞中占據(jù)全部意義,而另一個單音節(jié)詞則只是虛化成了只表示語法意義。因而偏義復詞實際上是由一個表示詞匯意義的單音節(jié)詞加上一個沒有詞匯意義只有作為構(gòu)詞成分的語法意義的單音節(jié)詞組合而成。因此不難看出,古人行文修辭上的需要以及漢語雙音詞化的過程都促成了偏義復詞的產(chǎn)生。
二、偏義復詞的特點
偏義復詞特點可從其組合方式和表達意義兩方面分析。
從組合方式上看,偏義復詞有兩個特點:一是詞序組合的不固定性;二是語素組合的不穩(wěn)定性。古漢語偏義復詞是以兩個單音節(jié)詞組合為基礎,它和其他雙音節(jié)合成詞一樣,經(jīng)歷臨時性的組合到凝成詞的發(fā)展變化。這類偏義復詞的陪襯語素,只有在特定的語言環(huán)境中才能顯露出來,一旦脫離了具體的語言環(huán)境,其臨時性即會消失,恢復其固有的詞匯意義。有時會顛倒語素的順序而組成不同的詞。如:“我有親父母,逼迫兼弟兄?!保ā犊兹笘|南飛》)和“今君相楚二十余年,而王無子,即百歲后將更立兄弟?!保ā妒酚?春申君列傳》)此二例中“弟兄”、“兄弟”都是偏義復詞,前一例偏義于“兄”,后一例偏義于“弟”。
從偏義復詞的詞匯意義上看,其具有以下幾方面的特征:詞義的隨意性、狹義性、模糊性。古漢語偏義復詞因其組合的不凝固性遂導致了其詞義的隨意性。有時偏義于前一個語素,有時有偏義于后一個語素。而具體偏義那個語素,就需要在具體的語境中來分析。偏義復詞也是復合詞的一種,屬于聯(lián)合式復合詞。兩個單音節(jié)語素的組合只是其中一個承載了全部詞匯意義,另一個則不表意。因此,它必然有一個特殊的特點,即是它的詞義比構(gòu)成它的兩個語素的詞義要窄,偏義復詞的這種特點使得它對構(gòu)成的詞有限定作用,其狹義性也主要是通過偏義復詞的陪襯語素的限定作用來體現(xiàn)的。構(gòu)成偏義復詞的兩個單音節(jié)語素本身就表意模糊、靈活,而將兩個單音節(jié)詞放在一起后,由于詞義的限制作用,表意反而比較明確了。但是也正是由于偏義復詞這種只有一個語素表義,另一語素不表義的特殊用法,如不在具體的語言環(huán)境中,其表意也是不甚清楚的。
三、偏義復詞的作用
1、作為一種修辭手段,古漢語偏義復詞起到了湊足字數(shù)、協(xié)調(diào)音節(jié)、舒緩語氣、整齊句式的作用,增強了行文的音樂美。
日出東南隅,照我秦氏樓。(《陌上?!罚?/p>
則祠蚩尤,釁鼓旗。(《史記?封禪書》)
上述例子中,“東南”偏指“東”,“南”只是用來協(xié)調(diào)音節(jié);“鼓旗”偏指“鼓”,連及“旗”,只是為了和上下文相對應。偏義復詞的陪襯語素在兼顧準確表義和形式、韻律和諧方面,起到了很好的平衡作用。
2、偏義復詞可使表達含蓄、委婉。等級森嚴的封建社會,人們迫于種種原因,在表達自己意思的時候,忌諱直接說出來。文人們便常用隱晦、委婉、含蓄的方式來表達。
小結(jié):總之,偏義復詞形成和發(fā)展的過程紛繁復雜,作為語言的一種現(xiàn)象,它必然受文化的制約和影響。作為思維的工具,它一定在思維的作用下發(fā)揮作用。古代漢語的偏義復詞至今受人青睞,又具有如此旺盛的生命力,正是因為它具有豐富、獨特而重要的語言表達效果。
【關鍵詞】文言文教學 雞肋 語言文字 情感
《語文課程標準》明確指出:在語文學習過程中,要讓學生逐步形成積極的人生態(tài)度和正確的價值觀,提高文化品位和審美情趣。要讓學生認識中華文化的豐厚博大,吸收民族文化智慧。
錢夢龍先生曾經(jīng)感慨地說:“文言文教學是語文教學改革的一個‘死角’”。教材中所選的文言篇章是千古傳誦、文質(zhì)兼美的佳作,在新課改中我們應盡力從音韻、形式、情理角度去展示古漢語的美,讓甘如醴酪的美文在學生心中綻放成璀璨之花。
一、音韻之美
朱熹說過:“大抵觀書須先熟讀,使其言皆若出于吾之口;繼以精思,使其意皆若出于吾之心,然后可以有得也”。葉圣陶先生也說,吟誦能“傳出文字的情趣,暢發(fā)讀者的興趣” 。讀,可以突出形象思維,感悟課文內(nèi)容;讀,可以鑒賞再創(chuàng)造。文言文教學要做到每堂課都能聽到讀書聲,或老師范讀,或聽名家范讀,或?qū)W生朗讀。 “讀”并不僅是為了活躍課堂氣氛,更是為了把握文言文的音韻神韻。
首先是要求讀準字音,特別要求掌握通假字、古今字、異讀與破讀。例如“數(shù)”,在“范增數(shù)目項王”句中讀“shuò”,意思是“多次、屢次”;而“數(shù)罟不入池”中讀“cù”意為“密”。又如通假字,“天下云集響應,贏糧而景從”中“景”通“影”;“君子生非異也,善假于物也”的“生”通“性”。
其次是讀準句讀節(jié)奏。要求在語言層面上通讀文言文,做到正確停頓,恰當理解。如《廉頗藺相如傳》“相如前進缶”一句,應是“相如/前/進缶”,而非“相如/前進/缶”;《師說》中的“師道之不傳也久矣!欲人之無惑也難矣”,正確斷句應是“師道之不傳也/久矣,欲人之無惑也/難矣”。
再次是要讀出語氣和語勢。這樣有利于體會文言文的感情和氣勢,表現(xiàn)出抑揚頓挫、跌宕起伏的節(jié)奏感。如《赤壁賦》中“白露橫江,水光接天??v一葦之所如,凌萬頃之茫然”,可以讓學生邊讀想象:清風明月,水色一天;朦朧迷離,羽化登仙。讀《陳情表》中的“但以劉日薄西山,氣息奄奄,人命危淺,朝不慮夕”時體會李密的如泣如訴。
古人云:“松聲、澗聲、琴聲、鶴聲……皆聲之至清者,而讀書聲為最?!痹谖难晕慕虒W過程中,只有對課文反復朗讀,才能讓文言文中的無聲語言變成聲情并茂的語言藝術。
二、形式之美
古人作文很重視文章的形式美,所謂“言而無文,行而不遠”說的就是這個。在謀篇布局上或似《阿房宮賦》駢散錯落的句式;或似《六國論》一般正反論述,深入淺出。
在遣詞造句上或似“蜀山兀,阿房出”般高度凝練,6個字概括了無限深廣的內(nèi)容,而從“?!钡健俺觥钡倪^程,更給讀者留下了馳騁想象的廣闊空間。 特殊句式更是文言文美的體現(xiàn),對特殊句式的了解也有助于現(xiàn)代漢語的學習。如許多成語是從古文演變而來的,如:草木皆兵(判斷句)、古為今用 (被動句)、滄海(之)一粟(省略句)、唯利是圖(唯圖利。賓語前置)、生于憂患,死于安樂(于憂患生,于安樂死。狀語后置)……通過學習,學生對成語中的古文知識點有了全面的了解,對成語的掌握將更好。
在修辭手法上多用比喻、對仗、排比、對偶等讓文章增色不少。如“明星熒熒,開妝鏡也;綠云擾擾,梳曉鬟也;渭流漲膩,棄脂水也;煙斜霧橫,焚椒蘭也”,其中既有排比,又有對偶和比喻,間接寫出宮中美人之多。
三、情理之美
高中語文課程標準把語文課程性質(zhì)界定為“工具性與人文性的統(tǒng)一”,這是對語文課程性質(zhì)的認識的歷史性總結(jié)和升華。語文的工具性早已經(jīng)得到了普遍的認可。語文的人文性,亦是由該學科的自身特點所決定。文言文大多是作者“披情入文”的嘔心之作。其中有“茍利國家生死以,豈因禍福避趨之”的愛國熱情,有“窮則獨善其身,達則兼濟天下”的仁愛之道,有“積善成德,而神明自得,圣心備焉”的善心德行。學習這些文言作品,就是聆聽圣哲先賢的濟世忠告,體會中國古代文人的超然、曠達、淡泊、寧靜,領略集大成者的才華、品德、襟抱與睿智。
文言文經(jīng)歷了上千年的錘煉,載負著璀璨的華夏文明,是我們民族精神內(nèi)涵的源頭活水。它之所以能久傳不衰,在于有著永恒的藝術魅力和無盡的美學價值。語文老師肩負著歷史的責任和使命,要盡力去發(fā)掘文本中美的因素,讓這些古代文化之精華在教學中大放異彩,讓古漢語之花璀璨于歷史星河中。
【參考文獻】
1.杜草甬 《葉圣陶論語文教育》河南教育出版社,1986.
2.秦訓剛 蔣紅森《高中語文課程標準教師讀本》華中師范大學出版社,2003.
3.劉永康 翟啟明《中學語文教學論》天地出版社2001年.
我相信這種說法,因為這是專家靠資料統(tǒng)計得出的結(jié)論。但是如何將這100個常見的別字糾正過來?如何把這100個別字糾正了,再把現(xiàn)在出版物上別字總量的另一半也減少下來,或者說把別字減少到最低限度,恐怕仍然是個問題。我的看法是,我們的記者、編輯、校對倘若能夠在繁忙的工作之余,抽空鉆研點古漢語乃至古文字知識不失為減少錯別字的一個途徑。就拿這最常見的100個別字來說吧。
粗看這些別字,有不少錯得很荒唐,比如說“大拇指”的“拇”字,稍有點古漢語常識的都會知道,這是個形聲字,從“手”“母”聲(《說文》:“拇,將指也?!蔽覀児们也蝗ス芩4竽粗甘情L在手上的(腳上當然也有“拇指”),咋也不能寫成“姆”。又如“一鼓作氣”,把“鼓”寫成“股”。稍讀過些古書的人都該知道古文名篇《曹劌論戰(zhàn)》吧,這篇古文講了古代一個有名的戰(zhàn)例,同志在他的著名的軍事理論著作《中國革命戰(zhàn)爭的戰(zhàn)略問題》一文中還引用過它,中學課本中也選用過它?!耙还淖鳉猓俣?,三而竭”是張口就來的,“鼓”是擂鼓,是名詞用作動詞,跟那個作“大腿”用的“股”字有什么關系?
荒唐歸荒唐,錯誤還是照常發(fā)生了,該有什么辦法?這就說明鉆研點古漢語乃至古文字知識或者抽空讀一點古文有多重要了。其實我們不必在理論上有很深的造詣,花很多時間去研究古人認定的漢字的六種造字方法或者古漢語語法知識什么的,粗知一些,相信也會減少一些差錯的。比如“舶來品”的“舶”?!安皝砥贰本褪菑膰膺M口的物品,“舶”是大船,從國外進來得用船。而“泊”的本義該是“湖澤”、“沼澤”,沒有外來的意思?!八沙凇钡摹俺凇?,本來是指拉滿的弓再松弛下來。把弓弦繃在弓上面叫“張”,由這個意義引申為把弓拉開,張弓時,弦被越拉越緊,所以“張”有了“緊”的意思,“弛”則與之相對,指“松”,《禮記》中說,“一張一弛,文武之道也”。而“馳”則是“車馬疾行”,“松弛”寫成“松馳”,意思不正好反了?再如“針砭”。“針”,本字作“钅咸”,是指縫紉用的工具,引申為“用針刺”,成為中醫(yī)上的醫(yī)療用具?!绊尽笔且环N石針,用石塊制的尖石或石片,用以治癰疽、除膿血,為中醫(yī)最古的醫(yī)療工具,有了金屬后,就主要用“針”為醫(yī)療工具了?!搬槨?、“砭”都是用來治病的,于是同義詞連用,成為一個詞“針砭”,后引申為“規(guī)勸”、“告誡”、“指出錯誤”的意思來,與那個作“損減”、“抑制”意思的“貶”字根本不是一回事?!俺銎洳灰狻钡摹捌洹?,古漢語中是個無指代詞,意為“他的”,指對方,戰(zhàn)爭中用計謀必要出敵方意料之外方為好計,“其”寫成“奇”就大錯特錯了?!熬狻薄ⅰ罢鸷场?、“遷徙”、“宣泄”都是同義詞連用,把“粹”換成“萃”、“撼”換成“憾”、“徙”換成“徒”、“宣”換成“渲”就不是了,意思也大不對了。類似這些個字、詞,不寫錯或者一時拿不準問個為什么,然后糾正過來,不需要高深的理論知識吧?
粗知古漢語常識能解決一些問題,但若能在閑暇之余往深處鉆一鉆,或者讀點古代的文化典籍,也許是一件不錯的事,沒準還能有點“小發(fā)現(xiàn)”讓人欣喜不已。比如:
“安裝”?!鞍惭b”的“安”字常被錯寫成“按”,表面上看,“安裝”不得用手嗎?于是把“安裝”寫成“按裝”似乎順理成章了?!鞍惭b”不能寫成“按裝”,許多人會想,“安裝”怎么就和“安定”、“安全”、“平安”的“安”連在一起了呢?其實,認真分析一下“安裝”的“安”字,還真讓人不得不佩服古人看問題看得遠、看得深,辦事認真,而且注重結(jié)果,講求效果,不像“今人”那樣短視,重形式,輕效果?!鞍惭b”是“安”的本義的引申?!鞍惭b”的本義是“安居”、“居處”?!墩f文》:“宀,交覆深屋也。象形,從女在宀中?!薄板病笔且凰孔?,古時男子下地干活,女子在家操持家務,這才像個家,這才讓人感到“安定”、“安寧”。由此引申,“安”有了“安全”、“安定”、“穩(wěn)定”、“安逸”等意思?!稘h語大辭典》把“安”字列了11個意思后,到第12個列出了個“安裝、設置”??梢哉f,在古人看來,你“安裝”一個什么東西,哪怕擺放一件家具或什物,你得給擺穩(wěn)當了,不能擺不穩(wěn),那樣不安全,給人不安定的感覺,我盡管注重工作的方式方法,但更看重結(jié)果、效果。從“安裝”的“安”字不能寫成“按”,足可以看出我們的古人辦事的嚴肅勁、認真勁來。
詞異讀的成因。其中通用假借、古今字、外來語及古書注解相沿而致是主要原因,而“破讀”所致也是重要
原因。本文還對古漢語異讀字的異讀音,進行了分類,并舉例加以說明。
關鍵詞古漢語異讀字分類
***
古漢語中的某些字詞要異讀,原因是很多的。其中,由于通用假借、古今字、外來語以及古書注解相沿
所致則是一個重要原因。其現(xiàn)象有如下幾種:
1.通假字的本義和假借義讀音不用。在古漢語的書面語言里,常有這樣的情形:本來有的字不用,卻用
另一個字來代替,造成讀者的不同。如“信”字,其本義是表示“誠實”、“信任”、“的確”、“任意”
、“使者”等意思,讀xìn。
例信而見疑,忠而被謗,能不怨乎?(《史記·屈原賈生列傳》)
自可斷來信,徐徐更謂之。(《玉臺新詠·古詩為焦仲卿妻作》)
但有時卻假借為“伸展”、“伸張”的意思,即與“伸”同義,讀為shēn。
例狼欣然從之,信足先生。(馬中錫《中山狼傳》)
是故不爭天下之交,不養(yǎng)天下之權,信己之私,威加于敵,故其城可拔,其國可隳隳(《孫子·九地
》)
又如“歸”字,其本義是表示“返回”、“歸還”、“女子出嫁”、“歸附”等意思,讀guī。
例執(zhí)訊獲chǒu@①,薄言還歸。(《詩經(jīng)·小雅·出車》)
余既為此志,后五年,吾妻來歸,時至軒中,從余問古事,或憑幾學書。(歸有光《項脊軒志》)
江表英豪咸歸附之,已據(jù)有六郡,兵精糧多,足以立事。(《資治通鑒·赤壁之戰(zhàn)》)
但又假借為“饋”,即贈送的意思,讀kuì。
例陽貨欲見孔子,孔子不見。歸孔子豚。(《論語·陽貨》)
2.古今字由于其分工不同,讀音亦不盡相同。在上古時代,特別是先秦時代,漢字的數(shù)量比后世要少得
多,一個字往往要表示幾個不同的含義,這就造成某些字“兼職”過多的現(xiàn)象。譬如“說”字,就兼任“解
說”、“講”、“言論”、“勸說”、“喜悅”等義項。當其表達“解說”、“講”、“言論”等意思時,
讀shuō。
例請說之。吾從北方聞子為梯,將以攻宋。(《墨子·公輸》)當其表達“勸說”的意思時,讀shuì
。
例公子患之,數(shù)請魏王,及賓客辯士說王萬端。(《史記·魏公子列傳》)
而當其表達“喜悅”的意思時,通“悅”,讀作yué。
例學而時習之,不亦說乎?(《論語·學而》)
為了避免一字兼職太多,后來才造了“悅”字,分擔了“喜悅”的義項。
再如“責”字,本為“債”字,讀zhài。
例公說,使有司寬政、毀關、去禁、薄斂、已責。(《左傳·昭公二十年》)
誰習計會,能為文收責于薛者乎?(《戰(zhàn)國策·馮諼客孟嘗君》)
當其在兼任“索取”、“要求”、“譴責”、“處罰”等義項時,則讀zè。
例里胥猾黠,假此科斂丁口,每責一頭,輒傾數(shù)家之產(chǎn)。(《聊齋志異·促織》)
抑又聞之,古者重冠禮,將以責成人之道,是圣人所尤用心者也。(柳宗元《答韋中立論師道書》)
梁客辛垣衍安在?吾請為君責而歸之!(《戰(zhàn)國策·魯仲連義不帝秦》)
后來,由于有了“債”字,就將該條義項區(qū)分出來。
又如“賈”字,兼有“買賣”、“商人”、“價錢”、賈姓等義項。表示“買賣”、“商人”等意思時
,讀gǔ。
例商農(nóng)工賈,不敗其業(yè)。(《左傳·宣公十二年》)
年長色衰,委身為賈人婦。(白居易《琵琶行》)
表示“價錢”之義,讀jià。
例有美玉于斯,韞@②而藏諸?求善賈而沽諸?(《論語·子罕》)
表示姓氏,讀jiǎ。
后來由于有了“價(jià@③)字,才分擔了“價錢”這一義項。
3.許多人名、地名、物名保留了古代的讀音,與今音異讀。如“食”、“其”等,在用于人名時,“讀yì,“其”讀jī。
例信引兵東,未渡平原,聞漢王使酈食其已說下齊,韓信欲止。(《史記·淮陰侯列傳》)
“射”在用于古代鐘名時,讀yì。
例噌@④者,周景王之無射也,kuǎn@⑤坎鏜@⑥者,魏莊子之歌鐘也。(蘇軾《石鐘山記》)
在用作草名時,讀yè。
例西方有木焉,名曰射干,莖長四寸,生于高山之上,而臨百仞之淵。(《荀子·勸學》)
“房”在作古宮名時,讀páng。
例六王畢,四海一,蜀山兀,阿房出。(杜牧《阿房宮賦》)
4.有些來自外族語言的國名、人名、姓氏名等,讀音也較為特殊。如“大宛”是古西域的國名,“宛”
則讀作yuān。
例大宛聞漢之饒財,欲通不得,見騫,喜,問欲何之。(《漢書·張騫傳》)
“可汗”,是對古鮮卑、突厥、回紇等少數(shù)民族的君長的稱呼,讀kèhán。
例可汗問所欲,木蘭不用尚書郎;愿馳千里足,送兒還故鄉(xiāng)。(《樂府詩集·木蘭詩》)
“氏”,漢代西域有大月氏、小月氏。“氏”讀zhī。
例(張)騫以郎應募,使月氏,與堂邑氏胡奴甘父,俱出隴西。(《史記·大宛列傳》)
又如漢代對匈奴王后稱“閼氏”,“氏”讀zhī。
例及衛(wèi)律所將降者,陰相與謀劫單于母閼氏歸漢。(《漢書·李廣蘇建傳》)
古漢語某些字詞異讀的另一個重要原因,是由于“破讀”所致。所謂“破讀”(亦稱“讀破”),就是
用改變一個字詞的讀音來表示不同的意義或者不同的詞性。這實際上是詞義引申發(fā)展的結(jié)果。語言中的某一
個字詞,當其產(chǎn)生了新的意義或新的語法作用時,為了在讀音上有所區(qū)別,并使之表達得更加明確,就把這
個字詞讀為另一種讀音,以表示差異。這種現(xiàn)象,概括起來有如下兩類:
1.有的字詞的不同含義,是用不同的讀音來加以區(qū)分的。如“殷”字,在表示“眾多”、“富?!?、“
深厚”等意思時,讀yīn。
例劉璋@⑩弱,張魯在北,民殷國富而不知存恤。(陳壽《隆中對》)
書中情意甚殷,即長者之不忘老父,知老父之念長者深也。(宗臣《報劉一丈書》)
當其表示“震動”的意思時,讀作yìn。
例熊咆龍吟殷巖泉,lì@⑦深林兮驚層巔。(李白《夢游天姥吟留別》)
當表示“赤黑色”時,則讀Yān。
例自始合而矢貫余手及肘,余折以御,左輪朱殷,豈敢言?。。ā蹲髠鳌こ晒辍罚?/p>
再如“惡”字,在表示“罪過”、“兇惡”、“壞人”等意思時,讀è。
例不幸呂師孟構(gòu)惡于前,賈余慶獻諂于后,予羈縻不得還,國事遂不可收拾。(文天祥《〈指南錄〉
后序》)
失時不雨,民且狼顧,歲惡不入,請賣爵子,既聞耳矣,安有為天下阽危者若是而上不驚者?(賈誼
《論積貯疏》)
噫!渫惡吏忍于鬻獄,無責也。(方苞《獄中雜記》)
當表示“討厭”、“憎恨”等意思時,讀wù。
例好逸惡勞,亦猶夫人之情也。(黃宗羲《原君》)
死亦我所惡,所惡有甚于死者,故患有所不避也。(《孟子·告子上》)
而當表示“怎”、“如何”等意思時,則讀wù。
例以小易大,彼惡知之?(《孟子·梁惠王上》)
2.有的字詞的不同詞性,也是靠不同的讀音來予以區(qū)分的。這里有幾種情況:其一是名詞改換為動詞時
所造成的不同讀音。譬如:
“王”字在充當名詞時,表示“帝王”、“諸侯王”的意思,就讀wáng。
例上胡不法先王之法?(《呂氏春秋·察今》)
而當其充當動詞、表示“成就王業(yè)”、“旺盛”等意思時,則讀wàng。
例以力假仁者霸,霸必有大國;以德行仁者王,王不待大。(《孟子·公孫丑上》)
不蘄畜乎樊中——神雖王,不善也。(《莊子·養(yǎng)生主》)
又如“度”字,在作名詞、并表示“計量長短的標準”、“限度”、“法制”、“氣度”、“度過”等思時,讀dù。
例已得履,乃曰:“吾忘持度?!狈礆w取之。(《韓非子·外儲說左上》)
生之有時而用之亡度,則物力必屈。(賈誼《論積貯疏》)
衡下車,治威嚴,整法度,陰知奸黨名姓,一時收禽,上下肅然,稱為政理。(《后漢書·張衡傳
》)
在作動詞、并表示“計量”、“揣測考慮”等意思時,讀duó。
例試使山東之國與陳涉度長挈大,比權量力,則不可同年而語矣。(賈誼《過秦論》)
詩云:“他人有心,予忖度之?!薄蜃又^也。(《孟子·梁惠王上》)
其二是形容詞改作動詞、名詞時造成的不同讀音。如:
“好”字,在充當形容詞、并表示“美好”、“友好”等意思時,讀hǎo。
例不如叔也,洵美且好。(《詩經(jīng)·鄭風·叔于田》)
若備與彼協(xié)心,上下齊同,則宜撫安,與結(jié)盟好。(《資治通鑒·赤壁之戰(zhàn)》)
在充作動詞,表示“喜好”的意思時,讀hào。
例王之好樂甚,則齊國其庶幾乎?(《孟子·梁惠王上》)
再如“臭”字,在充當形容詞,表示與“香”相對的意思時,讀chòu。
例一薰@⑧,十年尚猶有臭。(《左傳·僖公四年》)
在作名詞,表示“氣味”時,讀xiù。
例所謂誠其意者,毋自欺也,如惡惡臭,如好好色。(《禮記·大學》)
其三是主動詞改作被動詞時造成的不同讀音。如“見”字,在作主動詞、且表示“看見”、“召見”等
意思時,讀jiàn。
例一日不見,如三秋兮。(《詩經(jīng)·王風·采葛》)
在表示被動、作“引見”義,或作“顯現(xiàn)”時,讀xiàn。
例初,齊豹見宗魯于公孟,為驂乘馬。(《左傳·昭公二十年》)
臏至,龐涓恐其賢于己,疾之,則以法刑斷其兩足而黥之,欲隱無見。(《史記·孫子吳起列傳》
)
關于古漢語異讀字的異讀音,大抵來講,有四種不同類型。
一類是韻母相同,聲母不相同。如“乘”字,在表示“駕”、“坐”、“趁”的意思時,讀chéng。
例二子乘舟,汛汛其景。(《詩經(jīng)·邶風·二子乘舟》)
而在代表“車輛”和作“四”的代稱時,讀shèng。
例于是為長安君約車百乘,質(zhì)于齊,齊兵乃出。(《戰(zhàn)國策·觸龍說趙太后》)
鄭商人弦高將市于周,遇之,以乘韋先牛十二犒師。(《左傳·僖公三十二年》)
再如“虧”字,在表示“減少”、“毀壞”的意思時,讀kuī。
例不虧不崩,不震不騰。(《詩經(jīng)·魯頌·bì@⑨宮》)
芳與澤其雜糅兮,唯昭質(zhì)其猶未虧。(屈原《離騷》)
而當表示“差異”的意思時,同“詭”,讀guǐ。
例其時已與先王之法虧矣,而曰此先王之法也,而法之。(《呂氏春秋·察今》)
第二類是聲母相同,韻母不同。如“讀”字,在表示“誦讀”的意思時,讀dú。
例又尚論古之人,頌其詩,讀其書,不知其人可乎?(《孟子·萬章下》)
而表示“句讀”(即不足一句,讀時須稍有停頓之處)的意思時,則讀dòu。
例彼童子之師,授之書而習其句讀者,非吾所謂傳其道解其惑者也。(韓愈《師說》)
又如“泛”,在表示“漂浮”、“廣泛”的意思時,讀fàn。
例余感焉,以杜君之言泛訊之,眾言同,于是乎書。(方苞《獄中雜記》)
而在表示“覆、翻”的意思時,讀fěng。
例大命將泛,莫之振救。(賈誼《論積貯疏》)
第三類是聲調(diào)不同。如“創(chuàng)”字,當表示“始造”、“首創(chuàng)”的意思時,讀作chuàng。
例先帝創(chuàng)業(yè)未半,而中道崩殂。(諸葛亮《出師表》)
在表示“創(chuàng)傷”的意思時,讀chuāng。
例夫身中大創(chuàng)十余,適有萬金良藥,故得無死。(《史記·魏其武安侯列傳》)
第四類是聲、韻母均不同。如“罷”字,在表示“停止”、“罷免”等意思時,讀bà。
復請之,吾輩無生理,而主讞者亦各罷去。(方苞《獄中雜記》)
當表示“困?!钡囊馑迹ā捌!?,讀作pí。
例庶民罷敝,而宮室滋侈。(《左傳·昭公三年》)
又如“女”字,在表示女性的意思時,讀nǚ。
例不聞爺娘喚女聲,但聞燕山胡騎鳴啾啾。(《樂府詩集·木蘭詩》)
在表示“以女嫁人”的意思時,讀nü。
例堯之于舜也,使其子九男事之,二女女焉。)《孟子·萬章下》)
而在作人稱代詞時,則通“汝”,讀作rǔ。
例三歲貫女,莫我肯顧。(《詩經(jīng)·魏風·伐檀》)
一些常見的異讀字,因其流傳的歷史久遠,而且有的已進入現(xiàn)代漢語的書面或口頭語之中,有了較廣泛
的群眾基礎;同時許多工具書和古書的注本中,也都注明了它的讀音,因此應按傳統(tǒng)的習慣去讀。而那些較
為少見的、也未保留在現(xiàn)代漢語中的異讀字,或者人民群眾已改讀為一般讀音的字詞,就應按照現(xiàn)在的習慣
去讀。我們今天不必耗費精力去研討它的舊讀音,以免給學習者造成不必要的麻煩。如山東費縣的“費”,
舊讀為bì,現(xiàn)已改讀為fèi;“葉公好龍”的葉,舊讀為shè,今一般讀為yè。再如“暴露”的暴,傳統(tǒng)
的讀音本應是pù,但現(xiàn)已約定俗成,讀作bào,就不必固執(zhí)舊讀了。
(作者單位:蘭州鐵道學院社科部責任編輯:孟恩)
字庫未存字注釋:
@①原字為酉加鬼,為左右結(jié)構(gòu)。
@②原字為匚加賣,為半包圍結(jié)構(gòu)。
@③原字為價的繁體字。
@④原字為口加肱的右半部,為左右結(jié)構(gòu)。
@⑤原字為穴下加款,為上下結(jié)構(gòu)。
@⑥原字為革加搭的右半部,為左右結(jié)構(gòu)。
@⑦原字為忄加栗,為左右結(jié)構(gòu)。
@⑧原字為艸加犭加酉,為上下結(jié)構(gòu)。
關鍵詞:語料庫建設中古漢語語料標注語料檢索
一、 前言
自20世紀80年代始,中古漢語研究取得了長足進展。然而遺憾的是,古漢語語料庫的建設遠遠地落后于研究的進展。綜觀國內(nèi)外研究現(xiàn)狀,要么對中古的語料收錄不多,要么沒有進行精細加工。(董志翹2011)中古時期是漢語的質(zhì)變期,中古漢語的研究對于理清漢語語音、詞匯、語法等的發(fā)展脈絡有著不可或缺的作用?,F(xiàn)今語料庫中收錄的中古語料十分不足,而未做分詞標注等深層加工又在很大程度上減弱了語料庫的整體使用價值。為使中古漢語研究不斷走向縱深,并有更加整體定性的研究方法和多層面的分析角度,建設深加工的研究型中古漢語語料庫十分必要。
中古時期的語言面貌與現(xiàn)代很不相同,兩者在語料庫的構(gòu)建上也必然存在差別。一方面,無論在語言學理論,還是語料庫理論上,針對現(xiàn)代漢語的研究均更為成熟。特別是在分詞標準、語法標注類別等方面,現(xiàn)代漢語成果頗多,不僅有權威的分詞規(guī)范出版,句法分析、格語法、框架語法等多種語法研究也產(chǎn)生了大量研究成果。中古漢語及其語料庫構(gòu)建理論的相關研究則還很薄弱,尚有待進一步探索。另一方面,中古漢語語料庫在構(gòu)建技術上還比較落后,自動分詞、自動標注的相關研究相對滯后,這不僅加大了人工操作的工作量,也不利于提高分詞、標注的一致性,為語料庫的構(gòu)建質(zhì)量埋下了隱患。除此之外,由于中古漢語只存留在文獻中,并不會出現(xiàn)在日常交際中,這使得語料庫在構(gòu)建目的、加工方法、加工層級上與現(xiàn)代漢語語料庫也有所不同。中古漢語語料庫的構(gòu)建目的較為單一,主要服務于漢語史研究和古漢語學習,這就要求在構(gòu)建時更加注重傳統(tǒng)句法、古代特殊語法、特殊語用現(xiàn)象的標注,以及疑難字的解析、與現(xiàn)代漢語的對譯等。
中古漢語研究型語料庫主要收錄從東漢到隋的傳世文獻37本,除此之外還有匯集的詩歌雜帖及出土的中古文獻。收錄原始語料的庫容約1000萬字(化振紅2014),加工后的庫容將大大擴展,包括書籍庫、句子庫、詞匯庫、疑難字庫、義項庫、編碼庫六大不同層級的子庫。語料庫采用開源的MySQL數(shù)據(jù)庫[1]對語料信息進行存取,本文擬就語料庫構(gòu)建的相關問題,進行較深入說明。
二、 語料庫構(gòu)建原則及方法
(一) 語料庫構(gòu)建目標及原則
中古漢語研究型語料庫是基于中古漢語書面語的共時專語語料庫,在建立語料庫之初首先要明確的是語料庫構(gòu)建的目標和原則。
中古漢語語料庫建設的主要目標有: 1) 提供經(jīng)過校勘的中古文獻已校注的電子版;2) 為中古各種詞匯、語法、搭配等語言現(xiàn)象提供可進行統(tǒng)計的平臺;3) 為中古文獻提供可靠的釋義,為機器翻譯、語言學習領域提供基礎材料;4) 為中古漢語語言研究提供大量好的語言實例。
中古漢語語料庫設計遵循的總原則是: 1) 語料庫的設計和建設在系統(tǒng)的理論語言學原則指導下進行;2) 語料庫語料的構(gòu)成有明確的語言學理論指導,按照一定比例收集語料,而不是中古文獻的簡單堆砌;3) 中古漢語研究型語料庫作為中古時期語言運用的樣本,須采用科學的方法確定各種語料的比例,使語料具有代表性;4) 語料加工時采用自動和人工相結(jié)合的方式;5) 語料庫中語料以電子文本形式儲存并且可以方便快捷地通過計算機對語料進行各種處理。
(二) 語料庫模塊劃分
在明確構(gòu)建目的和原則的基礎上,初步確立了語料庫構(gòu)建所涉及的幾個模塊,具體如圖1所示:
圖1中“語料選取及整理”“語料加工”是針對具體語料進行的工作,是把選定、加工后的語料整合起來,以一定方式存儲在數(shù)據(jù)庫中。“語料庫管理及使用”是提供管理和使用該數(shù)據(jù)庫的平臺,針對構(gòu)建好的語料庫設計管理、檢索系統(tǒng),以便為研究者提供共享服務。這三大模塊在語料庫構(gòu)建中都至關重要,其中“語料選取及整理”是基礎,“語料加工”是核心,這兩者屬語料庫本體層,決定了語料庫構(gòu)建的質(zhì)量?!罢Z料庫管理及使用”屬語料庫應用層,決定了語料庫的功能和用戶體驗。這里先介紹本體層的兩個環(huán)節(jié)。
(三) 語料選取及分類
語料是構(gòu)成語料庫的基礎,語料的選取是影響語料庫質(zhì)量的重要因素。中古語料庫所收錄的絕大多數(shù)為東漢至隋朝時期的文I,在選取語料時要遵循代表性、平衡性、關聯(lián)性與區(qū)別度、特色性四大原則,(化振紅2014)以保證對中古時期語言事實的覆蓋率。入庫的語料如表1所示:
由于影響語言全貌的內(nèi)在因素有很多,單純從某一特征來界定語料庫的代表性、平衡性是不夠的,薩默斯主張采用一種“廣泛的客觀定義的文本類型”(Leech 1991),基于該理論,本文主張從多個角度采用多種特征突出語料的區(qū)別度,如成書時代、作者、作者地域、類型、出土/傳世文獻、語體等,這就使得對語料庫平衡性的界定突破了簡單的線性描述。中古語料庫在收錄語料時,在確保語料規(guī)模的基礎上,盡量均衡語料所具備的各種特征,并保證各種特征的值在所有特征值中不是獨一份的(除“作者”外),從而提高語料庫的代表性和平衡性。
中古時期的文獻雖然以文言為主,但古白話已經(jīng)開始興起,文獻中的口語成分在數(shù)量上雖然比不上文言成分,其增量也十分可觀。然而文獻中的口語成分與書面語成分并不是截然分開的,而是相互混雜、難以剝離的,比如,不少漢譯佛經(jīng)的受眾是廣大勞動人民,為了便于傳播,其口語化程度更深;農(nóng)書、醫(yī)書強調(diào)實用性,口語性也較為突出,等等?;谥泄艥h語的這一特點,再加上目前市面上已有的文獻情況,中古語料庫確定各種語料的大致收錄比例如表1,其中官修正史和漢譯佛典類語料現(xiàn)存最多,也最具代表性,因此收錄數(shù)量也分別為最多、次多;其次分別是出土文獻、筆記小說、詩歌等。
除此之外,對語料的加工方式及層次也進行了分類。標記型指對分詞后的語料僅進行句法層面的標注,加工層級較淺;標注型指對分詞后的語料進行句法、語義、語用等方面的標注,加工層級較深;而自動型指僅借助中古漢語分詞軟件對語料進行分詞的粗加工。從表1可以看出,目前中古漢語語料庫中絕大多數(shù)為深加工語料,標注型與標記型語料的比例將近1∶6。
(四) 語料加工
語料庫作為一種研究資源,其價值不能僅僅通過規(guī)模來衡量,語料庫更重要的價值在于通過加工給語料庫帶來的“附加”價值。這種“附加”價值就是對語料庫進行多種有用語言信息的加工標注,以擴展語料庫的語言信息含量,從而對語言研究做出更大貢獻。生語料庫[2](尤其是漢語)包含的詞法和句法等信息非常少,因此其應用價值也就相對有限。分詞是漢語語料庫建設的基礎性工作,也是進行語料標注的前提,而詞是從句子中提取出來的。因此,中古語料庫語料加工流程包括斷句、分詞、標注三個部分,具體如圖2所示。
圖2中,斷句是把文本拆成長短合宜的句子,并對句子進行篇章、書籍頁碼等相關信息的標注;分詞是把斷句后的句子根據(jù)中古時期語言的實際使用情況拆分為詞語;標注是對拆分后的詞語進行詞性、句法、義項、按語等相關信息的標注。中古語料庫中的斷句過程相對簡單,不贅述,這里主要介紹分詞和標注兩大部分。
1. 分詞
漢語的詞沒有形式上的標記,因而分詞對于漢語來說是一件麻煩事。為了確保分詞的正確性和一致性[3],首先需要確立分詞規(guī)范。中古漢語分詞的難點已有專文論述(化振紅2014),分詞規(guī)范的細則也將另文闡釋。中古漢語語料庫的分詞采取人工分詞和自動分詞兩種方法。人工分詞是逐句手工錄入,并參考上下文對句子結(jié)構(gòu)以詞為單位分析判斷并逐條錄入,非常耗費人力和物力。自動分詞采用CRF分詞模型(陳晴2005),在模版中加入古漢語音韻、構(gòu)字等信息,以提高分詞正確率,詳情另有專文論述(石民,李斌,陳小荷2010)。需要指出的是該論文的實驗對象是先秦文獻,先秦文獻與中古文獻存在一定差異,再加上中古文獻內(nèi)部本身存在著很大的區(qū)別度(陳小荷,馮敏萱,徐潤華等2013),自動分詞的準確率不是很高,目前僅在80%~90%,但已成倍提高了人工分詞的效率?,F(xiàn)今仍需通過提高分詞一致性、細化分詞規(guī)范、調(diào)整訓練數(shù)據(jù)等方法進一步提高分詞的準確率。
2. 標注
為了能夠從語料庫中抽取出更多有用信息,必須對語料進行標注。語料庫是供許多帶著不同目的的用戶使用的。數(shù)字化手段讓研究者能從多角度對多層次帶標注語料進行數(shù)據(jù)挖掘,大大拓展了語言研究的深度和廣度,有些研究目的甚至連語料庫設計者都不曾想到過。因此,語料庫的多層次標注很重要。中古語料的標注應遵循兩個基本原則:
一是語料加工分為篇、章、句、詞四個層級,由大到小對這幾個層級進行標注。
二是標注資源具有復用性。語料庫的標注昂貴且耗時,如果能復用就物有所值了。為保證語料庫的復用性,需使每本文獻、每層標注信息有足夠的獨立性,改變某文獻、某層的標注信息不會對其他語料產(chǎn)生影響。
黃昌寧等(2002)指出,目前語言各層面的標注發(fā)展很不平衡。發(fā)展較快的有詞匯層、句法層、語音層和音位層等,今后應重點加強語義層和語用層的標注。(黃昌寧,李涓子2002)由于中古時期漢語的語音系統(tǒng)與今天相比有很大不同,語音標注困難很大且并沒有很強的實用性。語料庫的標注取決于語料庫的整體設計及具體研究目的,同時也是一個重要的檢索依據(jù)。(梁茂成,李文中,S家金2010)中古語料庫的標注信息宜涵蓋篇章、詞匯、句法、語義、語用各層,并對文獻中涉及的疑難字以圖片格式進行收錄標注。據(jù)此,中古語料庫中的標注從大到小包括以下五個方面。
(1) 語篇標注。語篇標注包括文本來源、版本、朝代、作者等相關信息。如果語料源于書籍,該書籍的版本、頁碼信息等也會標注出來。篇章書籍信息是古文獻、古漢語研究專家進行相關研究的基本信息。語篇標注和校勘后的文獻構(gòu)成中古語料庫中獨立的書籍庫。
(2) 句子標注。句子標注是把語篇中的句子標記上文本自身的信息,以便管理者統(tǒng)一管理語料庫中的語料。常用的文本信息包括行分割符、行數(shù)、章、節(jié)、段落等,中古語料庫中選取“章節(jié)段句”這四層信息組成編碼對句子進行標注,形成句子標記。該標注信息屬于篇章層,但在詞匯層會自動生成詞匯所從屬句子的句子標記,從而使詞匯層可以獨立于句子層。該標記不僅方便語料庫管理者統(tǒng)一管理語料,而且是詞匯和句子進行關聯(lián)的中介,為檢索詞匯時可以查詢到上下文信息提供了條件。句子標注連同句子形成了句子庫。
(3) 詞匯標注。詞匯標注是指對詞匯從語法地位、詞性、釋義、用法四個方面進行標注,分別稱為“句法標注”“詞性標注”“義項標注”“用法標注”。其中詞的句法、詞性、用法標注信息均為封閉類,如表2所示:
由表2可知,句法標注、詞性標注屬于句法層;用法標注的層次比較復雜,大部分屬于語用層,其中“古今字”“通假字”“假借字”屬于漢字層面;義項標注屬于語義層。義項標注后的詞條匯總形成了義項庫,句法、詞性、用法標注信息與詞匯共同形成了詞庫。
詞匯標注中,尤其值得一提的是語義層的義項標注,它在中古語料庫的構(gòu)建中是一項十分重要的基礎性工作。如果把古漢語中每個詞的現(xiàn)代意義搞清楚,基本語義也就理解了。義項標注信息和中古文獻信息形成了古今平行對比語料,因此,義項標注在中古語料庫中是重中之重。為了提高義項標注的速度,避免把時間過多地花費在查閱相關資料上,中古語料庫中設立了通用義項庫,義項庫的構(gòu)成如圖3所示:
中古語料庫中的義項庫目前共包括不重復的541456條義項,隨著語料庫構(gòu)建過程中自擬義項的增加和其他相關研究成果的錄入,義項庫的庫容仍會進一步增加。
(4) 按語標注。傳世文獻在流傳過程中不可避免地會產(chǎn)生一些訛誤,甚至會出現(xiàn)不同的文本;再加上時代的限制和編纂者認識上的局限,詞典對古代文獻的釋義、對最早文獻的引例也難免會有所疏漏。這種在對文本標注時需要特別說明的信息可放在按語中。按語信息可以避免研究者重復前人已進行過的工作,對研究工作會起到一定輔助作用。
(5) 疑難字標注。中古文獻中存在著一些現(xiàn)代字庫中不支持的字,還有一些出土文獻中的字尚未能完全辨識。針對這些疑難字,語料庫專門設置疑難字庫,以圖片的形式存儲,并對該疑難字進行編號,通過編號可定位到該疑難字的上下文信息及語義信息。
使用Access進行標注的主界面設計圖如圖4所示:
綜上可知,中古研究型語料庫由其所包含文本的書籍、句子、詞匯、義項、疑難字信息(分別對應于上圖中的“shuji、juzi、cihui、yixiang、quezi”五張表)組成,包含書籍庫、句子庫、詞匯庫、義項庫、疑難字庫五大子庫。此外,為了方便語料庫的管理和使用,語料庫中還設有用戶信息庫。
三、 檢索管理系統(tǒng)研發(fā)
語料庫不僅是文本的集合,它還應該具有良好的存儲、擴展、檢索、反饋、修正等性能,以便各種研究人員都能從中得到自己所需要的信息。為方便語料庫的管理和使用,我們針對中古語料庫研發(fā)了檢索管理系統(tǒng),其功能如圖5所示。
(一) 管理系統(tǒng)
管理系統(tǒng)是提供給語料庫內(nèi)部成員使用以便操作和管理語料庫的頁面管理系統(tǒng)。它主要提供了書籍和疑難字的增加、刪除、查詢功能。書籍的管理功能是以已加工的語料作為對象按書籍為單位進行的,包括書籍庫、句子庫、詞匯庫、義項庫。對疑難字的管理直接以疑難字庫為單位,每個疑難字的記錄中又有它所對應的語料及篇章段信息。如果需要對單個語料中的標注信息進行更改維護,無須直接操作語料庫中的數(shù)據(jù),只要在未導入的語料版本中直接通過Access數(shù)據(jù)庫進行修改,確認無誤后再次導入數(shù)據(jù)庫即可。
(二) 檢索系統(tǒng)
語料庫建立之后將提供給研究者使用,使他們能夠訪問語料庫內(nèi)容,對相關語言現(xiàn)象進行分析研究。檢索系統(tǒng)是實現(xiàn)語料庫共享的必要條件,也是語料庫應該向用戶提供的基本工具。基于檢索系統(tǒng)在語料庫研發(fā)中的重要地位,中古語料庫檢索系統(tǒng)滿足以下幾個條件。
1. 檢索條件多樣化
檢索條件設置得是否適宜、專業(yè),這直接決定了語料庫的用戶功能適用性,也影響著使用者對整個檢索系統(tǒng)的使用體驗。由圖5可知,中古語料庫具有五種主要的查詢方式:
(1) 標記型查詢。檢索條件是同一詞的詞形、詞性、句法三種信息的組合。
(2) 標注型查詢。檢索條件是同一詞的詞形、句法、義項三種信息的組合。
(3) 組合查詢。檢索條件是兩個不同詞的邏輯關系組合,包括相鄰、同句、或、非四種邏輯關系。其中“相鄰”指這兩個選定的詞處于同一句子語料中的相鄰位置;“同句”指它們處于同一句語料,但不是相鄰位置;“或”指檢索結(jié)果中包含這兩個選定詞中任何一個;“非”指檢索結(jié)果中包含前一個選定詞但不包含后一個選定詞。
(4) 對比查詢。檢索條件是同一或不同的兩個詞的詞形、句法、書籍信息的組合。用于對同一詞的不同句法地位或所在文獻(或者不同詞的不同句法地位或所在文獻)進行對比檢索。
(5) 疑難字查詢。檢索條件為書籍、疑難字編號兩種信息的組合。
除了這五種基本檢索功能外,中古語料庫還實現(xiàn)了檢索結(jié)果是否附加上下文信息的可選項。還可以針對詞的不同特征選擇不同的查詢范圍,如高頻詞可以選擇某本專書查詢來減小用例的查詢范圍,低頻詞可以選擇全語料庫查詢來擴大用例的查詢范圍。
2. 結(jié)果出方便快捷,且易于保存
中古語料庫檢索系統(tǒng)的輸出結(jié)果以網(wǎng)頁形式呈現(xiàn),可直接保存為文本。
3. 解讀清晰易懂
檢索系統(tǒng)頁面上不存在語料庫設計時所使用的內(nèi)部編碼(如用法碼“RM01”代表用法“姓加名”),內(nèi)部編碼均以轉(zhuǎn)碼形式轉(zhuǎn)換為自然詞匯,符合使用者的操作習慣,不需要研究者再去過多學習語料庫操作規(guī)范,且轉(zhuǎn)碼后整個檢索系統(tǒng)的頁面顯得更加清晰易懂。
4. 具有開放性和可維護性
整個語料庫通過檢索系統(tǒng)實現(xiàn)開放性,通過數(shù)據(jù)庫維護或管理系統(tǒng)實現(xiàn)可維護性。用戶在使用檢索系統(tǒng)時如需交流意見,可在頁面上直接進行反饋,反饋信息會以郵件的形式發(fā)送給語料庫管理員,由管理員收集整理后提交給語料庫維護專業(yè)人員進行討論和回復。
四、 中古語料庫的應用
(一) 漢語史研究
中古語料庫最基本的服務對象是漢語史研究人員。由于在語篇、句子、詞匯等多個層面對文獻進行了標注,它可以支持多種檢索方式,漢語史研究人員利用這些檢索結(jié)果可以進行特定的語言學研究,例如以下四個方面的應用:
第一,使用中古語料庫中最基本的句法、義項、特定句式、詞性、疑難字查詢、統(tǒng)計功能,以輔助相關的語言學研究及語文教學。
第二,根據(jù)不同的研究目的,可對句法、義項、詞性三個條件變換各種組合進行查詢、統(tǒng)計,可用以輔助對中古時期特定詞匯、句法的研究。
第三,根據(jù)字詞的使用頻率統(tǒng)計結(jié)果,大致確定中古時期常用詞的范圍,然后結(jié)合句法、義項、語用查詢來研究常用詞在句法成分、語義等方面的應用、變化情況。
第四,檢索同一詞匯、句法結(jié)構(gòu)在各個文獻中的使用情況,以對不同類別、時期、作者的文獻語言風格進行對比研究。
(二) 中古漢語詞典編纂
中古漢語語料庫收錄了大批中古時期的文獻,為詞典編纂提供了大量可供篩選的例證。此外,語料庫中對每個詞進行了詞性、句法、義項等方面的標注,標注時主要采用人工方法,在參考各種權威中古漢語詞典的基礎上,對各個詞的義項、用法及例證進行考證、補充、修正,此外還對人名、地名、稱號、離合式詞等進行了語用標注。這些標注信息可以提供中古時期每個詞匯各個層面的統(tǒng)計信息,為中古漢語斷代詞典的編纂提供了直接依據(jù),專家只需根據(jù)分詞情況對檢索到的例證進行篩選,不僅為詞項賦義提供了客觀標準,也保證了詞典可以真實反映中古時期的語言面貌,同時也大大減少了詞典編纂人員的工作強度、縮短了編纂周期。
(三) 語言教學及文化研究
中古漢語語料庫可以直接或間接用于中古文獻的教學。不僅老師可以利用語料庫向?qū)W生展示某些特定語法范疇、詞匯在中古時期的使用情況,學生也可以自己利用語料庫來檢索詞的用法、搭配、詞義間的細微差別等,也就是所謂的數(shù)據(jù)驅(qū)動學習。這種學習方法不僅能為學生營造一個真實的語境,而且能提供一種探索語言的手段,對教學的意義是顯而易見的。
除此之外,中古漢語語料庫收錄了中古時期多個領域(如歷史、宗教、醫(yī)學、農(nóng)業(yè)等)的多本專書,并對這些書做了???、分詞、標注,這就為相關領域的文化研究提供了可靠的電子檢索資源。
五、 結(jié)語
中古漢語研究型語料庫是我國第一個針對中古時期文獻的斷代專語語料庫,目前在該語料庫建設中仍不可避免地存在一些問題,隨著分詞規(guī)范進一步細化、分詞一致性的提高、對中古詞匯特點的深入了解、自動分詞正確率的提升,這些問題也將逐步得到解決。該語料庫目前已應用于中古時期專書、詞匯、語法等方面的研究,并產(chǎn)生了一些成果。隨著語料庫的構(gòu)建完成并實現(xiàn)共享,詞典編纂、歸納性語法、語義搭配等相關應用研究不難預見,而更深層次的語言研究及其他專項應用研究也等待諸位同仁共同來發(fā)掘。
附注
[1]MySQL是一N開放源代碼的關系型數(shù)據(jù)庫管理系統(tǒng),具有速度快、可靠性高和適應性強等優(yōu)點。在不需要事務化處理的情況下,MySQL是管理內(nèi)容最好的選擇。
[2]生語料指收集以后未經(jīng)加工的語料,生語料庫指收錄生語料的數(shù)據(jù)庫;與此相對,熟語料指經(jīng)過加工的語料。
[3]在保持語義同一性的前提下,結(jié)構(gòu)體在語料庫中的分合是否始終一致,如“豬肉”是否始終保持為一個整體,或者始終分開。(孫茂松1999: 90―93)
參考文獻
1. 陳晴.基于條件隨機場的自動分詞技術的研究.東北大學碩士學位論文.2005.
2. 陳小荷,馮敏萱,徐潤華等.先秦文獻信息處理.北京: 世界圖書出版公司,2013.
3. 董志翹.為中古漢語研究夯實基礎――“中古漢語研究型語料庫”建設瑣議.燕山大學學報,2011(1).
4. 國家技術監(jiān)督局.信息處理用現(xiàn)代漢語分詞規(guī)范.北京: 中國標準出版社,1993.
5. 化振紅.深加工中古漢語語料庫建設的若干問題.西南大學學報,2014(3).
6. 黃昌寧,李涓子.語料庫語言學.北京: 商務印書館,2002.
7. 梁茂成,李文中,許家金.語料庫應用教程.北京: 外語教學與研究出版社,2010.
8. 石民,李斌,陳小荷.基于CRF的先秦漢語分詞標注一體化研究.中文信息學報,2010(2).
9. 孫茂松.談談漢語分詞語料庫的一致性問題.語言文字應用,1999(2).