大規(guī)模真實文本漢語字母詞語考察研究

出版時間:2010-4  出版社:廈門大學出版社  作者:鄭澤芝  頁數(shù):295  
Tag標簽:無  

前言

  鄭澤芝博士的專著《大規(guī)模真實文本漢語字母詞語考察研究》是她在博士論文的基礎上修改增訂而成的,她于2005年畢業(yè)獲博士學住,而本書在她畢業(yè)四年之后才提上出版日程,2005年后她又在《語言文字應用》、《中文信息學報》、《語言科學》、《廈門大學學報》等學術期刊和“中國語言學會”、“中國社會語言學國際會議”、“漢語和漢字關系國際會議”等學術會議上陸續(xù)報告了多篇相關論文。從2004年到2009年,她共發(fā)表了近20篇有關字母詞語的研究論文,在她讀博期間,字母詞語研究就得到國家語言資源監(jiān)測與研究中心項目“中國主流報紙大規(guī)模真實文本字母詞語考察”的支持,畢業(yè)后她到廈門大學工作,又繼續(xù)申請了福建省社科規(guī)劃項目“基于大規(guī)模真實文本的漢語字母詞語分類考察研究”以及廈門大學科研啟動基金的資助?! 〈_定研究目標之后,“咬定青山不放松”,持之以恒。她不急于出書,而是先發(fā)表階段性成果,既有先發(fā)優(yōu)勢,也得以在深入觀察研究分析之后再系統(tǒng)全面論述,這是澤芝的研究特點之一?! ∷龘屨枷葯C抓緊不放的這個特點,我還有一個小故事作佐證:  2003年10月初,我去國家語委參加關于“字母詞”的討論會,澤芝的字母詞研究還處在收集材料和預研階段(所以她在《后記》中說她對字母詞語的研究“始于2004年”)。離開會還有一兩天時間,我問她:“你能不能給我一些最基本的統(tǒng)計數(shù)據(jù)?比如到底在我們的報紙上字母詞語的實際使用情況是多少?《人民日報》上是多少?《北京青年報》又是多少?

內容概要

  漢語中字母詞語的使用情況已經無法僅僅用外來語來涵蓋,比如:HSK、GB、3C、阿Q等。而且這種語言現(xiàn)象在漢語中的使用,呈泛濫的態(tài)勢,有的字母串已經產生了很強的構詞語能力,字母參與構詞也已屢見不鮮,它們已經是漢語中不容忽視的一種新語言現(xiàn)象。它們的影響還不僅限于此,對于漢語信息處理而言,字母詞語不僅是漢語中的一類新詞語,而且其中含有大量的各領域術語,其中許多術語正在進入漢語語言社會的各個層面,它們已經成了情報翻譯、自動分詞、信息檢索、機器翻譯中不可低估的影響因素?! ≌Z言學界見仁見智,態(tài)度各異,有人主張保衛(wèi)祖國語言的純潔性,有人為字母詞語叫好。本書認為字母詞語在漢語中的使用不是孤立的,只有經過大規(guī)模真實文本的考察,才可以用事實說話,并據(jù)實給予規(guī)范和制定相關的政策?! ”緯捎谜Z料庫技術與內省相結合、定量和定性相結合的研究方法,以大規(guī)模真實文本為研究基礎,歷時5年,跟蹤考察了近兩億真實文本語料。界定了文字字母;對字母詞語所用字符進行了考察和歸納,界定了字母詞語;在共時截面上對字母詞語在主流報紙媒體的使用狀況進行了全面客觀的描述和分析;對字母詞語的主題領域分布、用法分布狀況進行了量化分析研究;從不同角度對字母詞語分類、構成成分進行了研究;從歷時發(fā)展的角度對字母詞語演化狀況進行了跟蹤研究;從語言信息處理的角度對字母詞語的統(tǒng)計特征和字母詞語的自動識別進行了研究;對通用字母詞語的量化提取進行了探索;對字母詞語將給漢語文字系統(tǒng)帶來怎樣的影響進行了探索等等??陀^真實地描寫和分析了字母詞語的各種情況,取得了大量第一手的資料。全書共分15章,書后附有作者整理的字母詞語研究文獻索引錄,雙語對釋字母詞語表,5年歷時字母詞語表,《人民日報》、《北京青年報》、《羊城晚報》共有字母詞語表等附錄?! ”緯鴮ι鐣Z言學、漢語詞匯學、新詞語、外來語的研究有重要的參考價值,是中文信息處理領域的人員和相關單位關注的對象,同時也可為政府有關部門制訂相關政策提供參考。

書籍目錄

序/張普第一章 緒論1 字母詞語的界定2 字母詞語與真實文本3 本書的結構第二章 主流報紙媒體字母詞語的使用狀況1 語料的選擇2 文本中使用的非漢字符3 外文字母在漢語文本中的使用情況4 媒體字母詞語的量化概況5 各報紙媒體字母詞語概況5.1 《人民日報》字母詞語概況5.2 《北京青年報》字母詞語概況5.3 《羊城晚報》字母詞語概況6 媒體字母詞語的一次性使用情況7 不同性質媒體中字母詞語的使用情況8 媒體共有字母詞語情況9 小結第三章 字母詞語中的標點1 字母詞語中的標點符號2 字母詞語中標點符號出現(xiàn)情況及問題2.1 字母詞語中標點的出現(xiàn)情況2.2 與標點相關問題的處理3 小結第四章 字母詞語中的數(shù)字1 數(shù)字在字母前的情形2 數(shù)字在字母后的情形3 含數(shù)字字母詞語之管見第五章 單字母、多字母、光桿字母詞語與字母詞語并列結構1 單字母字母詞語2 多字母字母詞語考察3 光桿字母詞語與外語原文縮略語3.1 光桿字母詞語使用狀況3.2 字母詞語原文縮略和漢語拼音成詞問題4 字母詞語的并列結構第六章 雙語對釋字母詞語1 雙語對釋字母詞語在文本中的使用情況概述2 對釋漢字串的分布考察3 雙語對釋字母詞語語形歷時演化分析4 雙語對釋字母詞語使用方式演化4.1 共有雙語對釋字母詞語I型、Ⅱ型分布4.2 雙語對釋全稱簡稱形式的演化4.3 字母詞語中的新詞語5 小結第七章 字母詞語領域分布特點1 媒體主題領域聚類2 字母詞語在各主題領域的量化分布規(guī)律2.1 一般字母詞語領域分布情況2.2 雙語對釋字母詞語領域分布情況3 領域共有字母詞語的情況分析4 各主題域獨有字母詞語情況分析5 小結第八章 字母詞語有多少種用法1 字母詞語的用法分類2 字母詞語的用法分布情況3 字母詞語領域和用法交叉分布情況4 小結第九章 字母詞語的演化態(tài)勢1 字母詞語的使用數(shù)量的歷時演化2 字母詞語一次性使用的歷時變化3 字母詞語變化程度及變化趨勢4 一般字母詞語的演化情況分析4.1 數(shù)量變化4.2 字母詞語搭配漢字的情況4.3 共有一般詞語的分類考察5 字母詞語穩(wěn)定性第十章 字母詞語的使用與規(guī)范1 字母詞語的層次劃分1.1 字母詞語三圈劃分1.2 外語原詞、計算機相關詞語在文本中的使用情況2 字母詞語來源分析3 外文字母使用例析4 字母詞語不規(guī)范情況分類5 字母詞語的詞性問題6 字母詞語的歸化7 關于字母詞語的幾點建議第十一章 字母詞語對漢語文字系統(tǒng)的影響1 語言與文字2 從外來語到字母詞語2.1 傳統(tǒng)外來語的影響2.2 字母詞語與漢語言系統(tǒng)3 漢語文字系統(tǒng)4 漢字系統(tǒng)可否發(fā)生變化5 小結第十二章 通用字母詞語提取研究1 通用詞語的各種量化屬性2 字母詞語量化屬性觀察分析3 通用字母詞語提取算法3.1 絕對指標提取方法3.2 通用度方法3.3 散布均勻度方法……第十三章 字母詞語的自動識別第十四章 字母詞語的社會接受程度考察第十五章 結束語附錄后記

章節(jié)摘錄

  面的、口頭的、日常生活中街市門面、各種標牌的……語言的使用涉及生活的方方面面,邊邊角角,各個層面,各個年齡段。我們只是從一個側面考察了字母詞語的使用情況,雖說一滴水可以折射大海,但畢竟客觀實際中還存在大量應該但卻沒有被反映的現(xiàn)實。如果可以,我們應該從更多的途徑考察更多的媒體中外文字母的使用情況,以便更全面地反映外文字母在漢語中的使用狀況?! ∽詣犹崛『腿斯ばΦ慕Y果不可謂不豐富,十幾萬條次的工程字母詞語,足以產生一些很有價值的結論,但因投入的時間、人力、物力等原因,我們目前不可能對它們一一標記語義、領域、結構、語法等屬性以供后人更好地研究它們,或為國家語言生活提供更好的參考。面對如此大量的條目進行人工歸類分析,工程非常巨大,我們認為必須對計算機輔助字母詞語自動聚類進行研究,以減少人工投入;工程中還存在語言學需要解決的問題、各領域術語的映射問題,如:語言學對專名描述就不夠精細,拿來說事時往往捉襟見肘;語言學的專名與語言信息處理學界的命名實體之間是一種什么樣的關系,我們弄不清楚或者就沒有想去弄清楚,這一點也反映出語言學和語言信息處理研究上缺乏溝通和互補。因而,我們對《人民日報》的提取結果進行的分類分析,也只是粗淺的、不太成熟的,但已經可以初見字母詞語在漢語中使用狀況的端倪?! 】疾熘形覀儼l(fā)現(xiàn)字母詞語一次性出現(xiàn)的比率達到甚至超過了70%,這種現(xiàn)象引起了我們的注意,我們發(fā)現(xiàn)這種現(xiàn)象除了與字母詞語是新詞語、出現(xiàn)的次數(shù)低有關系外,也和它們多為產品名、公司名、各種術語協(xié)定名有關。這類對象只在各種專業(yè)或行業(yè)文本中高頻出現(xiàn)。還有一個更重要的原因就是字母詞語缺乏使用規(guī)范,造成字母詞語使用的混亂狀態(tài),同一個對象有多個不同的指稱,如“全國男籃甲A聯(lián)賽(CBA)”這個比較普通的字母詞語在文本中還有“全國男子籃球甲A聯(lián)賽(CBA)”這一孿生兄弟,所以對字母詞語結果進行。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    大規(guī)模真實文本漢語字母詞語考察研究 PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網 手機版

京ICP備13047387號-7