出版時(shí)間:2010-4 出版社:廈門(mén)大學(xué)出版社 作者:鄭澤芝 頁(yè)數(shù):295
Tag標(biāo)簽:無(wú)
前言
鄭澤芝博士的專(zhuān)著《大規(guī)模真實(shí)文本漢語(yǔ)字母詞語(yǔ)考察研究》是她在博士論文的基礎(chǔ)上修改增訂而成的,她于2005年畢業(yè)獲博士學(xué)住,而本書(shū)在她畢業(yè)四年之后才提上出版日程,2005年后她又在《語(yǔ)言文字應(yīng)用》、《中文信息學(xué)報(bào)》、《語(yǔ)言科學(xué)》、《廈門(mén)大學(xué)學(xué)報(bào)》等學(xué)術(shù)期刊和“中國(guó)語(yǔ)言學(xué)會(huì)”、“中國(guó)社會(huì)語(yǔ)言學(xué)國(guó)際會(huì)議”、“漢語(yǔ)和漢字關(guān)系國(guó)際會(huì)議”等學(xué)術(shù)會(huì)議上陸續(xù)報(bào)告了多篇相關(guān)論文。從2004年到2009年,她共發(fā)表了近20篇有關(guān)字母詞語(yǔ)的研究論文,在她讀博期間,字母詞語(yǔ)研究就得到國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究中心項(xiàng)目“中國(guó)主流報(bào)紙大規(guī)模真實(shí)文本字母詞語(yǔ)考察”的支持,畢業(yè)后她到廈門(mén)大學(xué)工作,又繼續(xù)申請(qǐng)了福建省社科規(guī)劃項(xiàng)目“基于大規(guī)模真實(shí)文本的漢語(yǔ)字母詞語(yǔ)分類(lèi)考察研究”以及廈門(mén)大學(xué)科研啟動(dòng)基金的資助。 確定研究目標(biāo)之后,“咬定青山不放松”,持之以恒。她不急于出書(shū),而是先發(fā)表階段性成果,既有先發(fā)優(yōu)勢(shì),也得以在深入觀察研究分析之后再系統(tǒng)全面論述,這是澤芝的研究特點(diǎn)之一。 她搶占先機(jī)抓緊不放的這個(gè)特點(diǎn),我還有一個(gè)小故事作佐證: 2003年10月初,我去國(guó)家語(yǔ)委參加關(guān)于“字母詞”的討論會(huì),澤芝的字母詞研究還處在收集材料和預(yù)研階段(所以她在《后記》中說(shuō)她對(duì)字母詞語(yǔ)的研究“始于2004年”)。離開(kāi)會(huì)還有一兩天時(shí)間,我問(wèn)她:“你能不能給我一些最基本的統(tǒng)計(jì)數(shù)據(jù)?比如到底在我們的報(bào)紙上字母詞語(yǔ)的實(shí)際使用情況是多少?《人民日?qǐng)?bào)》上是多少?《北京青年報(bào)》又是多少?
內(nèi)容概要
漢語(yǔ)中字母詞語(yǔ)的使用情況已經(jīng)無(wú)法僅僅用外來(lái)語(yǔ)來(lái)涵蓋,比如:HSK、GB、3C、阿Q等。而且這種語(yǔ)言現(xiàn)象在漢語(yǔ)中的使用,呈泛濫的態(tài)勢(shì),有的字母串已經(jīng)產(chǎn)生了很強(qiáng)的構(gòu)詞語(yǔ)能力,字母參與構(gòu)詞也已屢見(jiàn)不鮮,它們已經(jīng)是漢語(yǔ)中不容忽視的一種新語(yǔ)言現(xiàn)象。它們的影響還不僅限于此,對(duì)于漢語(yǔ)信息處理而言,字母詞語(yǔ)不僅是漢語(yǔ)中的一類(lèi)新詞語(yǔ),而且其中含有大量的各領(lǐng)域術(shù)語(yǔ),其中許多術(shù)語(yǔ)正在進(jìn)入漢語(yǔ)語(yǔ)言社會(huì)的各個(gè)層面,它們已經(jīng)成了情報(bào)翻譯、自動(dòng)分詞、信息檢索、機(jī)器翻譯中不可低估的影響因素。 語(yǔ)言學(xué)界見(jiàn)仁見(jiàn)智,態(tài)度各異,有人主張保衛(wèi)祖國(guó)語(yǔ)言的純潔性,有人為字母詞語(yǔ)叫好。本書(shū)認(rèn)為字母詞語(yǔ)在漢語(yǔ)中的使用不是孤立的,只有經(jīng)過(guò)大規(guī)模真實(shí)文本的考察,才可以用事實(shí)說(shuō)話,并據(jù)實(shí)給予規(guī)范和制定相關(guān)的政策。 本書(shū)采用語(yǔ)料庫(kù)技術(shù)與內(nèi)省相結(jié)合、定量和定性相結(jié)合的研究方法,以大規(guī)模真實(shí)文本為研究基礎(chǔ),歷時(shí)5年,跟蹤考察了近兩億真實(shí)文本語(yǔ)料。界定了文字字母;對(duì)字母詞語(yǔ)所用字符進(jìn)行了考察和歸納,界定了字母詞語(yǔ);在共時(shí)截面上對(duì)字母詞語(yǔ)在主流報(bào)紙媒體的使用狀況進(jìn)行了全面客觀的描述和分析;對(duì)字母詞語(yǔ)的主題領(lǐng)域分布、用法分布狀況進(jìn)行了量化分析研究;從不同角度對(duì)字母詞語(yǔ)分類(lèi)、構(gòu)成成分進(jìn)行了研究;從歷時(shí)發(fā)展的角度對(duì)字母詞語(yǔ)演化狀況進(jìn)行了跟蹤研究;從語(yǔ)言信息處理的角度對(duì)字母詞語(yǔ)的統(tǒng)計(jì)特征和字母詞語(yǔ)的自動(dòng)識(shí)別進(jìn)行了研究;對(duì)通用字母詞語(yǔ)的量化提取進(jìn)行了探索;對(duì)字母詞語(yǔ)將給漢語(yǔ)文字系統(tǒng)帶來(lái)怎樣的影響進(jìn)行了探索等等??陀^真實(shí)地描寫(xiě)和分析了字母詞語(yǔ)的各種情況,取得了大量第一手的資料。全書(shū)共分15章,書(shū)后附有作者整理的字母詞語(yǔ)研究文獻(xiàn)索引錄,雙語(yǔ)對(duì)釋字母詞語(yǔ)表,5年歷時(shí)字母詞語(yǔ)表,《人民日?qǐng)?bào)》、《北京青年報(bào)》、《羊城晚報(bào)》共有字母詞語(yǔ)表等附錄?! ”緯?shū)對(duì)社會(huì)語(yǔ)言學(xué)、漢語(yǔ)詞匯學(xué)、新詞語(yǔ)、外來(lái)語(yǔ)的研究有重要的參考價(jià)值,是中文信息處理領(lǐng)域的人員和相關(guān)單位關(guān)注的對(duì)象,同時(shí)也可為政府有關(guān)部門(mén)制訂相關(guān)政策提供參考。
書(shū)籍目錄
序/張普第一章 緒論1 字母詞語(yǔ)的界定2 字母詞語(yǔ)與真實(shí)文本3 本書(shū)的結(jié)構(gòu)第二章 主流報(bào)紙媒體字母詞語(yǔ)的使用狀況1 語(yǔ)料的選擇2 文本中使用的非漢字符3 外文字母在漢語(yǔ)文本中的使用情況4 媒體字母詞語(yǔ)的量化概況5 各報(bào)紙媒體字母詞語(yǔ)概況5.1 《人民日?qǐng)?bào)》字母詞語(yǔ)概況5.2 《北京青年報(bào)》字母詞語(yǔ)概況5.3 《羊城晚報(bào)》字母詞語(yǔ)概況6 媒體字母詞語(yǔ)的一次性使用情況7 不同性質(zhì)媒體中字母詞語(yǔ)的使用情況8 媒體共有字母詞語(yǔ)情況9 小結(jié)第三章 字母詞語(yǔ)中的標(biāo)點(diǎn)1 字母詞語(yǔ)中的標(biāo)點(diǎn)符號(hào)2 字母詞語(yǔ)中標(biāo)點(diǎn)符號(hào)出現(xiàn)情況及問(wèn)題2.1 字母詞語(yǔ)中標(biāo)點(diǎn)的出現(xiàn)情況2.2 與標(biāo)點(diǎn)相關(guān)問(wèn)題的處理3 小結(jié)第四章 字母詞語(yǔ)中的數(shù)字1 數(shù)字在字母前的情形2 數(shù)字在字母后的情形3 含數(shù)字字母詞語(yǔ)之管見(jiàn)第五章 單字母、多字母、光桿字母詞語(yǔ)與字母詞語(yǔ)并列結(jié)構(gòu)1 單字母字母詞語(yǔ)2 多字母字母詞語(yǔ)考察3 光桿字母詞語(yǔ)與外語(yǔ)原文縮略語(yǔ)3.1 光桿字母詞語(yǔ)使用狀況3.2 字母詞語(yǔ)原文縮略和漢語(yǔ)拼音成詞問(wèn)題4 字母詞語(yǔ)的并列結(jié)構(gòu)第六章 雙語(yǔ)對(duì)釋字母詞語(yǔ)1 雙語(yǔ)對(duì)釋字母詞語(yǔ)在文本中的使用情況概述2 對(duì)釋漢字串的分布考察3 雙語(yǔ)對(duì)釋字母詞語(yǔ)語(yǔ)形歷時(shí)演化分析4 雙語(yǔ)對(duì)釋字母詞語(yǔ)使用方式演化4.1 共有雙語(yǔ)對(duì)釋字母詞語(yǔ)I型、Ⅱ型分布4.2 雙語(yǔ)對(duì)釋全稱(chēng)簡(jiǎn)稱(chēng)形式的演化4.3 字母詞語(yǔ)中的新詞語(yǔ)5 小結(jié)第七章 字母詞語(yǔ)領(lǐng)域分布特點(diǎn)1 媒體主題領(lǐng)域聚類(lèi)2 字母詞語(yǔ)在各主題領(lǐng)域的量化分布規(guī)律2.1 一般字母詞語(yǔ)領(lǐng)域分布情況2.2 雙語(yǔ)對(duì)釋字母詞語(yǔ)領(lǐng)域分布情況3 領(lǐng)域共有字母詞語(yǔ)的情況分析4 各主題域獨(dú)有字母詞語(yǔ)情況分析5 小結(jié)第八章 字母詞語(yǔ)有多少種用法1 字母詞語(yǔ)的用法分類(lèi)2 字母詞語(yǔ)的用法分布情況3 字母詞語(yǔ)領(lǐng)域和用法交叉分布情況4 小結(jié)第九章 字母詞語(yǔ)的演化態(tài)勢(shì)1 字母詞語(yǔ)的使用數(shù)量的歷時(shí)演化2 字母詞語(yǔ)一次性使用的歷時(shí)變化3 字母詞語(yǔ)變化程度及變化趨勢(shì)4 一般字母詞語(yǔ)的演化情況分析4.1 數(shù)量變化4.2 字母詞語(yǔ)搭配漢字的情況4.3 共有一般詞語(yǔ)的分類(lèi)考察5 字母詞語(yǔ)穩(wěn)定性第十章 字母詞語(yǔ)的使用與規(guī)范1 字母詞語(yǔ)的層次劃分1.1 字母詞語(yǔ)三圈劃分1.2 外語(yǔ)原詞、計(jì)算機(jī)相關(guān)詞語(yǔ)在文本中的使用情況2 字母詞語(yǔ)來(lái)源分析3 外文字母使用例析4 字母詞語(yǔ)不規(guī)范情況分類(lèi)5 字母詞語(yǔ)的詞性問(wèn)題6 字母詞語(yǔ)的歸化7 關(guān)于字母詞語(yǔ)的幾點(diǎn)建議第十一章 字母詞語(yǔ)對(duì)漢語(yǔ)文字系統(tǒng)的影響1 語(yǔ)言與文字2 從外來(lái)語(yǔ)到字母詞語(yǔ)2.1 傳統(tǒng)外來(lái)語(yǔ)的影響2.2 字母詞語(yǔ)與漢語(yǔ)言系統(tǒng)3 漢語(yǔ)文字系統(tǒng)4 漢字系統(tǒng)可否發(fā)生變化5 小結(jié)第十二章 通用字母詞語(yǔ)提取研究1 通用詞語(yǔ)的各種量化屬性2 字母詞語(yǔ)量化屬性觀察分析3 通用字母詞語(yǔ)提取算法3.1 絕對(duì)指標(biāo)提取方法3.2 通用度方法3.3 散布均勻度方法……第十三章 字母詞語(yǔ)的自動(dòng)識(shí)別第十四章 字母詞語(yǔ)的社會(huì)接受程度考察第十五章 結(jié)束語(yǔ)附錄后記
章節(jié)摘錄
面的、口頭的、日常生活中街市門(mén)面、各種標(biāo)牌的……語(yǔ)言的使用涉及生活的方方面面,邊邊角角,各個(gè)層面,各個(gè)年齡段。我們只是從一個(gè)側(cè)面考察了字母詞語(yǔ)的使用情況,雖說(shuō)一滴水可以折射大海,但畢竟客觀實(shí)際中還存在大量應(yīng)該但卻沒(méi)有被反映的現(xiàn)實(shí)。如果可以,我們應(yīng)該從更多的途徑考察更多的媒體中外文字母的使用情況,以便更全面地反映外文字母在漢語(yǔ)中的使用狀況。 自動(dòng)提取和人工校對(duì)的結(jié)果不可謂不豐富,十幾萬(wàn)條次的工程字母詞語(yǔ),足以產(chǎn)生一些很有價(jià)值的結(jié)論,但因投入的時(shí)間、人力、物力等原因,我們目前不可能對(duì)它們一一標(biāo)記語(yǔ)義、領(lǐng)域、結(jié)構(gòu)、語(yǔ)法等屬性以供后人更好地研究它們,或?yàn)閲?guó)家語(yǔ)言生活提供更好的參考。面對(duì)如此大量的條目進(jìn)行人工歸類(lèi)分析,工程非常巨大,我們認(rèn)為必須對(duì)計(jì)算機(jī)輔助字母詞語(yǔ)自動(dòng)聚類(lèi)進(jìn)行研究,以減少人工投入;工程中還存在語(yǔ)言學(xué)需要解決的問(wèn)題、各領(lǐng)域術(shù)語(yǔ)的映射問(wèn)題,如:語(yǔ)言學(xué)對(duì)專(zhuān)名描述就不夠精細(xì),拿來(lái)說(shuō)事時(shí)往往捉襟見(jiàn)肘;語(yǔ)言學(xué)的專(zhuān)名與語(yǔ)言信息處理學(xué)界的命名實(shí)體之間是一種什么樣的關(guān)系,我們弄不清楚或者就沒(méi)有想去弄清楚,這一點(diǎn)也反映出語(yǔ)言學(xué)和語(yǔ)言信息處理研究上缺乏溝通和互補(bǔ)。因而,我們對(duì)《人民日?qǐng)?bào)》的提取結(jié)果進(jìn)行的分類(lèi)分析,也只是粗淺的、不太成熟的,但已經(jīng)可以初見(jiàn)字母詞語(yǔ)在漢語(yǔ)中使用狀況的端倪?! 】疾熘形覀儼l(fā)現(xiàn)字母詞語(yǔ)一次性出現(xiàn)的比率達(dá)到甚至超過(guò)了70%,這種現(xiàn)象引起了我們的注意,我們發(fā)現(xiàn)這種現(xiàn)象除了與字母詞語(yǔ)是新詞語(yǔ)、出現(xiàn)的次數(shù)低有關(guān)系外,也和它們多為產(chǎn)品名、公司名、各種術(shù)語(yǔ)協(xié)定名有關(guān)。這類(lèi)對(duì)象只在各種專(zhuān)業(yè)或行業(yè)文本中高頻出現(xiàn)。還有一個(gè)更重要的原因就是字母詞語(yǔ)缺乏使用規(guī)范,造成字母詞語(yǔ)使用的混亂狀態(tài),同一個(gè)對(duì)象有多個(gè)不同的指稱(chēng),如“全國(guó)男籃甲A聯(lián)賽(CBA)”這個(gè)比較普通的字母詞語(yǔ)在文本中還有“全國(guó)男子籃球甲A聯(lián)賽(CBA)”這一孿生兄弟,所以對(duì)字母詞語(yǔ)結(jié)果進(jìn)行。
圖書(shū)封面
圖書(shū)標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載
大規(guī)模真實(shí)文本漢語(yǔ)字母詞語(yǔ)考察研究 PDF格式下載
250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版