漢語虛詞知識庫的建設(shè)

出版時間:2009-5  出版社:華中師范大學(xué)出版社  作者:劉云  頁數(shù):324  
Tag標簽:無  

前言

  隨著歷史的發(fā)展,社會的進步,科技的發(fā)達,語言學(xué)在整個世界范圍內(nèi)越來越展示出強大的活力和能量。中國語言學(xué)是世界語言學(xué)的重要組成部分。為了對中國語言學(xué)事業(yè)有所推動,我們組織撰寫“華中語學(xué)論庫”。作為專用名稱,這里的“語學(xué)”主要指漢語語言學(xué),近期的15年時間里以現(xiàn)代漢語語法專題研究為重點。“語學(xué)論庫”,這是漢語語言學(xué)研究的一個系統(tǒng)工程,如果將來主客觀條件具備,在研究范圍上可以不斷擴大,在研究時間上可以無限延展,在研究隊伍上可以輩輩交接,代代傳承。“華中”一詞,既跟研究隊伍的華中群體相關(guān),又跟華中師范大學(xué)出版社的名稱相關(guān)?! h語語言學(xué)源遠流長。千百年來,特別是《馬氏文通》出版以來,尤其是20世紀70年代之后,由于一代代學(xué)者的不懈努力,漢語語言學(xué)沿著“創(chuàng)業(yè)——拓新——發(fā)展”的軌道不斷推進。目前,漢語語言學(xué)所統(tǒng)括的漢語語法學(xué)、漢語語音學(xué)、漢語方言學(xué)、漢語詞匯學(xué)、漢語語用學(xué)等等學(xué)科,都已出現(xiàn)了初步繁榮的喜人局面。

內(nèi)容概要

  《漢語虛詞知識庫的建設(shè)》共分五章。第一章“面向信息處理的語言研究”主要介紹了中文信息處理的發(fā)展與成就、漢語自動分析的難點、計算機背景下的漢語語法研究以及“句管控”與漢語信息處理等內(nèi)容。第二章“虛詞知識庫的建設(shè)”主要介紹了虛詞與虛詞研究概貌、漢語虛詞知識庫的重要性、虛詞知識庫建設(shè)的難點以及虛詞知識庫建設(shè)的構(gòu)想等內(nèi)容。第三章“虛詞詞典的內(nèi)容”主要介紹了副詞機器詞典、連詞機器詞典和介詞機器詞典等內(nèi)容。第四章“復(fù)句層次和關(guān)系的自動分析”主要介紹了復(fù)句自動分析的目標和意義、難點和對策、二重復(fù)句的自動分析、復(fù)句關(guān)系詞語的離析度以及關(guān)系詞語驅(qū)動的復(fù)句關(guān)系和層次自動判定。第五章是全書的結(jié)語,主要是對已有研究工作的總結(jié)和進一步的研究計劃。

書籍目錄

序前言第一章 面向信息處理的語言研究第一節(jié) 中文信息處理的發(fā)展與成就一、引言二、中文信息處理的發(fā)展三、中文信息處理的成就第二節(jié) 漢語自動分析的難點一、引言二、詞法分析的難點三、句法分析的難點四、轉(zhuǎn)換過程的難點五、小結(jié)第三節(jié) 計算機背景下的漢語語法研究一、研究對象的轉(zhuǎn)換二、研究目的的轉(zhuǎn)換三、研究手段的轉(zhuǎn)換四、研究視角的轉(zhuǎn)換五、小結(jié)第四節(jié) “句管控”與漢語信息處理一、引言二、詞語切分與詞性標注三、句法與語義四、理論與實踐五、小結(jié)第二章 虛詞知識庫的建設(shè)第一節(jié) 虛詞與虛詞研究一、虛詞概貌及其作用二、虛詞在通用語料庫中的使用情況三、虛詞研究第二節(jié) 漢語虛詞知識庫的重要性一、詞法分析中的作用二、句法分析中的作用三、具體應(yīng)用中的作用第三節(jié) 虛詞知識庫建設(shè)的難點一、虛詞語法意義的概括二、虛詞用法差異的揭示第四節(jié) 虛詞知識庫的建設(shè)一、引言二、“三位一體”的虛詞知識庫建設(shè)三、小結(jié)第三章 虛詞詞典的內(nèi)容第一節(jié) 副詞機器詞典一、副詞及其分類二、副詞字段的設(shè)立三、副詞目錄四、副詞機器詞典摘錄第二節(jié) 連詞機器詞典一、連詞及其研究二、連詞字段的設(shè)立三、連詞目錄四、連詞機器詞典摘錄第三節(jié) 介詞機器詞典一、介詞及其分類二、介詞字段的設(shè)立三、介詞目錄四、介詞機器詞典摘錄第四章 復(fù)句層次和關(guān)系的自動分析第一節(jié) 復(fù)句關(guān)系和層次自動分析的目標和意義一、漢語復(fù)句自動分析的目標二、復(fù)句自動分析的意義第二節(jié) 漢語復(fù)句自動分析的難點與對策一、復(fù)句自動分析的難點二、復(fù)句自動分析的策略三、單復(fù)句的確認對策第三節(jié) 二重復(fù)句自動劃分研究一、引言二、復(fù)句關(guān)系詞語的包孕機制三、小結(jié)第四節(jié) 復(fù)句關(guān)系詞語離析度一、引言二、復(fù)句關(guān)系詞語的離析度三、復(fù)句關(guān)系詞語離析能力差異分析第五節(jié) 關(guān)系詞語驅(qū)動的復(fù)句關(guān)系和層次自動判定一、引言二、復(fù)句關(guān)系詞語的作用三、復(fù)句關(guān)系詞語的表現(xiàn)四、復(fù)句自動分析的流程第五章 結(jié)語第一節(jié) 研究工作回眸第二節(jié) 研究工作設(shè)想附錄1 復(fù)句層次和關(guān)系標注語料庫樣例及說明附錄2 復(fù)句層次和關(guān)系自動分析系統(tǒng)后記

章節(jié)摘錄

  1991年,北京語言學(xué)院漢語水平考試中心組成研制小組,以國內(nèi)影響較大的七個動態(tài)性頻度統(tǒng)計詞典、詞表和字表為主要依據(jù),編制了《漢語水平詞匯與漢字等級大綱》。其編制總原則為:(1)多學(xué)科定量統(tǒng)計與群體性定性分析相結(jié)合;(2)語言學(xué)科學(xué)原財與對外漢語教學(xué)需要相結(jié)合。共得常用詞8822個,分成甲、乙、丙、丁四級,寫進《大綱》(修訂稿)。這是一次較為典型的把主、客觀標準有機結(jié)合起來選擇漢語常用詞的實踐?! ∮捎?0世紀90年代初期有多個常用字詞統(tǒng)計結(jié)果的推出,隨后常用字詞的統(tǒng)計相對沉寂了幾年。隨著網(wǎng)絡(luò)等媒體的興盛,大規(guī)模字詞統(tǒng)計又開始復(fù)興。進入21世紀后,先后有兩次大規(guī)模的詞匯統(tǒng)計,分別是《中國語言生活狀況報告(2005)》和《中國語言生活狀況報告(2006)》。這兩次調(diào)查統(tǒng)計有三個重要的特點:一是規(guī)模大?!吨袊Z言生活狀況報告(2005)》調(diào)查語料分為平面媒體、有聲媒體、網(wǎng)絡(luò)媒體三種,共計892034個文本文件,909429700字符次,其中漢字出現(xiàn)732143010字次?!吨袊Z言生活狀況報告(2006)》調(diào)查的語料分為平面媒體、有聲媒體、網(wǎng)絡(luò)媒體三種,共計1311749個文本文件,1170367879字符次,其中漢字出現(xiàn)978994406字次,規(guī)模達10億次,這是迄今為止最大規(guī)模的漢語字詞統(tǒng)計。二是統(tǒng)計項目全面。兩次調(diào)查的主要對象是漢字和詞語,調(diào)查項目有“頻次、頻率、累加頻率、出現(xiàn)文本數(shù)”等。三是成果豐碩。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    漢語虛詞知識庫的建設(shè) PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7