日語語料庫研究的理論與實踐

出版時間:2009-5  出版社:上海外語教育出版社  作者:毛文偉  頁數(shù):191  
Tag標簽:無  

前言

  依據(jù)實際語料對語言進行研究有著悠久的歷史,最早可以追溯到中世紀。即便從現(xiàn)代意義上的第一個語料庫布朗語料庫建成至今,也已經(jīng)經(jīng)歷了近半個世紀。20世紀90年代以來,隨著個人電腦的普及和功能的不斷增強,利用語料庫進行語言研究在技術條件上已經(jīng)逐漸成熟。而隨著研究的深入,人們也越來越清楚地認識到內(nèi)省法研究的局限。一些研究者開始逐步嘗試利用報刊、小說等素材,對語言現(xiàn)象進行實證性研究,涌現(xiàn)出一大批優(yōu)秀的科研成果?! 【C觀該領域,我們可以發(fā)現(xiàn),語料庫研究法的有效性不僅在理論上得到廣泛認同,在實際的研究活動中也得到了越來越廣泛的應用。但是,毋庸諱言,其中還存在著一些不盡如人意之處。尤其是相對于英語語料庫在架構、內(nèi)容和研究手段方面的日臻充實、完善,日語語料庫的建設和應用無論是在研究理念,還是在具體實施上都無疑是較為落后的?! ∈紫?,缺乏經(jīng)過周密規(guī)劃、語料來源廣泛、具有較好代表性的大型日語語料庫。只有在強有力的理論支撐下,語料庫才有可能具備較好的平衡性和代表性,全面、忠實地反映語言的本來面貌。為此必須進行科學規(guī)劃,并在語料的選擇、錄入、校對以及后期維護方面投入極大的人力、物力。

內(nèi)容概要

  《日語語料庫研究的理論與實踐》結合研究實例,從理論和實踐兩個方面探討了語料庫在語言研究中的具體應用。內(nèi)容涉及語料庫研究的學科定位、理論意義、日語語料庫建設的現(xiàn)狀與不足以及語料庫的設計規(guī)劃等方面的諸多問題。在此基礎上,運用語料庫信息自動處理技術,實現(xiàn)了語料自動賦碼、信息自動篩選和提取等各項功能,并結合具體研究課題,對其進行了實踐和拓展?!  度照Z語料庫研究的理論與實踐》內(nèi)容翔實,緊貼語言研究的實際,具有一定的創(chuàng)新性和啟發(fā)意義。

書籍目錄

第一部 理論篇第1章 語料庫研究概述 1.1 何謂“語料庫” 1.2 關于語料庫在語言研究中的價值的論爭 1.3 “語料庫語言學”和“計量語言學”的關系 1.4 “語料庫語言學”質(zhì)疑 1.5 小結 第2章 日語語料庫建設的現(xiàn)狀及問題 2.J語料庫的分類 2.2 日語語料庫建設的現(xiàn)狀 2.3 日語語料庫存在的問題及原因分析 2.4 小結 第3章 語料庫的設計與構建 3.1 語料庫的內(nèi)容設計 3.2 語料庫的結構設計 3.3 語料的后期加工及賦碼 3.4 小結 第4章 信息自動抽取技術的原理及實現(xiàn)4.1 形態(tài)素自動分析和賦碼 4.2 檢索對象的定位 4.3 賦碼的刪除 4.4 小結 第5章 語料庫素材對結論信度的影響 5.1 語料庫的規(guī)模問題 5.2 語料庫素材的類型 5.3 語料庫素材的時代特征 5.4 關于網(wǎng)上素材的使用問題 5.5 小結 第6章 分析手法對結論信度的影響 6.1 如何進行科學取樣 6.2 關注樣本的數(shù)量問題 6.3 重視樣本的時代特性 6.4 樣本的分布與去偽存真 6.5 樣本歸納的客觀、合理 6.6 小結 第二部 實踐篇第7章 共時語法研究領域的應用之一7.1 先行研究 7.2 對機能辭功能的假設 7.3 關于先行詞的限制 7.4 語氣層面的考察 7.5 小結 第8章 共時語法研究領域的應用之二8.1 先行研究 8.2 對先行詞的初步觀察 8.3 先行詞的意義范疇 8.4 語氣方面的考察 8.5 小結 第9章 歷時語法研究領域的應用之一9.1 先行研究 9.2 使用情況的初步分析 9.3 機能辭語法化時期的判斷 9.4 功能的分析 9.5 各個形態(tài)使用頻率的歷史變遷 9.6 小結 第10章 歷時語法研究領域的應用之二——對瞬間繼起機能辭歷史變遷的考察10.1 表示瞬間繼起關系的各機能辭間的競爭10.2 各機能辭的核心功能 10.3 使用頻率出現(xiàn)消長的原因分析 10.4 前后事項之間的時間關系 10.5 小結 第11章 詞匯研究領域的應用11.1 引入語料庫信息自動處理技術的必要性11.2 先行研究 11.3 例句自動篩選方案 11.4 自動篩選方案二的思路 11.5 對篩選結果的分析 11.6 小結 第12章 文體研究領域的應用——夏目漱石短篇小說的計量性研究12.1 何謂“文體” 12.2 先行研究 12.3 夏目漱石短篇小說的統(tǒng)計結果 12.4 數(shù)據(jù)的換算 12.5 對于作品近似程度的觀察 12.6 小結 附錄1日本國立國語研究所研究報告一覽附錄2與語料庫研究有關的部分參考文獻 附錄3本書使用的語料庫素材一覽 附錄4本書各章 節(jié)與已發(fā)表論文的關系

章節(jié)摘錄

  正是由于基于問卷調(diào)查的研究方法存在著以上不足,自20世紀80年代以來,研究者開始嘗試運用存儲于計算機內(nèi)的大量實際語料對語言現(xiàn)象進行考察,涌現(xiàn)出大量基于語料庫(corpus)的研究成果。這一方面是由于計算機技術日新月異,硬件性能不斷提高,海量存儲設備逐漸普及,軟件在易用性方面也取得了長足進步,在很大程度上降低了研究者進入的門檻。另一方面也是由于人們對于實際語料的價值有了新的認識?! ∵@些研究的共同之處在于,它們都是在大量現(xiàn)有的出版物或口語素材中檢索包含某種語言現(xiàn)象的實例。通過進一步的觀察、分析和統(tǒng)計,總結出其中蘊含的客觀規(guī)律。因此,從本質(zhì)上看,都屬于實證性研究方法。近年來,基于語料庫的實證性研究已經(jīng)產(chǎn)生了許多成果,在語法、詞匯以及句法等各個領域奠定了自己穩(wěn)固的地位。  對于這種建立在觀察分析自然語言現(xiàn)象基礎上的實證性研究來說,語料庫是不可或缺的研究基礎。實證性研究方法在語言學研究的各個領域廣受推崇也使得語料庫的重要性不斷提高,逐漸成為研究者不可或缺的工具之一?! ≌Z料庫一詞來源于拉丁語Corpus,意為“資料的總體”。英語中的corpus一詞繼承了拉丁語的原意。但我們現(xiàn)在所說的語料庫顯然不再是簡單的資料的集合,它被賦予了新的意義?! rystal(1991)認為,語料庫是語言資料的集合,其資料來源既可以是書面語篇,也可以是話語的記錄腳本。Sinclair(1991)將語料庫定義為對自然發(fā)生的語篇的收集,目的在于描述一種狀態(tài)或某種語言中的變化。Bmer(1998)認為語料庫是對自然語篇大宗的、有原則的收集。顧日國(1998)則將語料庫定義為放置語言材料的倉庫,存放在計算機里的原始語料文本或經(jīng)過加工后帶有語言學信息標注的語料文本。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    日語語料庫研究的理論與實踐 PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7