知識工程語言學

出版時間:2010-6  出版社:清華大學出版社  作者:魯川  頁數(shù):357  
Tag標簽:無  

前言

我要告訴讀者:為什么要寫這本書?這本書是怎樣寫成的?書中主要寫了些什么?半個世紀前的1956年初夏,中國大地上響徹了“向科學進軍”的號角聲,那時我正要填報高考志愿。在所能夠閱讀到的《知識就是力量》等科普刊物中,最令我神往的就是那剛誕生了10年的“電子計算機”。那一年招計算機專業(yè)的高等院校只有一所,就是哈爾濱工業(yè)大學。我幸運考取之后,產(chǎn)生了一個想法:既然“機器人”是以“計算機”為大腦的,那么這個大腦就不應(yīng)該只會“計算”,還應(yīng)懂得“語言”、會做“文章”。從上大學一年級開始我就在學好“高等數(shù)學”等規(guī)定課程的同時,找來中文系的各種課本默默地自學起來。后來才知道恰在我入學的1956年暑期,在美國的達特茅斯(Dartmooth)召開的學術(shù)會議宣告了“人工智能”的誕生,也知道了新興的“自然語言理解”等研究領(lǐng)域。這堅定了我對“計算機能理解人類語言”的信心,也增強了“我應(yīng)該自學語言學”的恒心。我在世界“人工智能”誕生的1956年暑期考上計算機系,這個巧合是我的幸運,也決定了我一生的命運。1961年從計算機系畢業(yè)以后的20年間,我為了“人工智能”的目的,堅持自學古代漢語、現(xiàn)代漢語、理論語言學和外語,注意追蹤國外語言學主要學派的最新成果。1982年我慕名拜訪了范繼淹先生,他是中國社會科學院語言研究所著名的語言學家、中國人工智能學會的副理事長、我國“計算語言學”的開拓者之一。我向范先生表達了要報考他的“計算語言學”研究生的愿望。范先生告訴我:超過規(guī)定報考年齡的人是不準報考的。在我的懇切請求下,范先生對我進行了口試,證實了我的語言學基礎(chǔ)知識遠遠超過了研究生的入學水平,答應(yīng)向領(lǐng)導(dǎo)請示可否破例特招,結(jié)果沒有批準。但范先生已被我的特殊經(jīng)歷和優(yōu)異成績打動,決定破例招收我為“不發(fā)文憑的在職研究生”,悉心輔導(dǎo)我學習“計算語言學碩士研究生”的全部課程。拜范先生為師之后才聽別人說,早在1973年他就被確診患了血癌,為了給國家培養(yǎng)急需的計算語言學人才,他分秒必爭地跟死神搶奪時間而忍受著難以想象的痛苦。1985年春天,范先生正式宣布我達到了“計算語言學碩士研究生”的結(jié)業(yè)水平。不久范先生就住進了醫(yī)院,在病床上恩師對我說了他的臨終囑托:①恩師已經(jīng)在給《中國語文》(1985年第5期)的稿件《無定NP主語句》中提到我的名字,在參考文獻中引用了我的一篇會議論文,目的是引起語言學界的關(guān)注。讓我盡早在語言學期刊上發(fā)表論文以爭取語言學界的指導(dǎo)。②前幾年恩師跟陸儉明和邢福義先生等中年語言學家發(fā)起的、有語言學大師呂叔湘和朱德熙先生出席的“現(xiàn)代漢語語法學術(shù)討論會”已召開了三次。范先生知道自己不可能參加第四次討論會了,他跟會議負責人說過,要我接替他參加討論會,讓我趕快寫一篇論文在會上宣讀。③讓我全力籌建“計算語言學”的全國性學術(shù)團體。

內(nèi)容概要

本書是作者在為中國科學院研究生院和中國郵電大學研究生講授“知識工程語言學”課程時所寫的講義的基礎(chǔ)上完成的。這本書為人工智能、知識工程及相關(guān)專業(yè)的人員提供了所需的最必要的語言學基礎(chǔ)理論和最有用的語言數(shù)據(jù),包含對漢語特色的最新認識以及跟英語的對比。它凝聚了作者數(shù)十年從事知識工程領(lǐng)域科研工作和堅持不懈鉆研語言學的心得?! ”緯晒氖氯斯ぶ悄?、知識工程、自然語言理解、中文信息處理、機器翻譯的研究人員參考,也可供從事對外漢語教學、漢語國際推廣、英漢對比研究的教師和研究者參考,還可以作為高等院校相關(guān)專業(yè)的高年級本科生和研究生的選修課教材或參考書。

作者簡介

魯川,河南開封市人,1961年畢業(yè)于哈爾濱工業(yè)大學計算機系。長期從事中文信息處理和計算語言學的研究和教學工作。曾任北京信息工程學院教授,教育部語言文字應(yīng)用研究所計算語言學研究窒研究員,中國中文信息學會計算語言學專業(yè)委員會首屆主任,中國人工智能學會自然語言理解專業(yè)委員會委員兼機器學習專業(yè)委員會委員,中國應(yīng)用語言學會理事,《中文信息學報》編委。研究領(lǐng)域為人工智能、知識工程、自然語言理解、機器翻譯、英漢對比、對外漢語教學等。出版的專著有((漢語語法的意合網(wǎng)絡(luò)》?!禠earn Chinese Through100 Sentence Frames》等,主編了《動詞大詞典(人機兩用)》等。在《中國語言學報》、《漢語學習》、《語言教學與研究》、《世界漢語教學》、《語言科學》等核心期刊上發(fā)表過多篇論文。作為項目負責人,多次主持完成了國家級科研項目,如國家語言文字應(yīng)用科研項目“信息處理用規(guī)范漢字字義統(tǒng)計和造詞模式”和國家社會科學基金項目“信息處理與對外漢語教學的句子語序模式”等。所設(shè)計的從漢字輸入技術(shù)到對外漢語教學一條龍的“漢語自學機”獲得了國家發(fā)明專利。

書籍目錄

上篇 導(dǎo)論 第1章 信息時代需要知識工程語言學  1.1 信息   1.1.1 信息是物質(zhì)的基本屬性之   1.1.2 信息的定義   1.1.3 人類文明的三個時代   1.1.4信息時代的高級階段必然出現(xiàn)知識經(jīng)濟  1.2 知識   1.2.1  信息有待于優(yōu)化和系統(tǒng)化   1.2.2 知識的定義   1.2.3 知識的層次  1.3 智能   1.3.1  知識處理主要包括知識獲取、知識傳播和知識運用   1.3.2 智能的定義  1.4 人工智能   1.4.1 人工智能的誕生和初期的發(fā)展   1.4.2 知識表示和自然語言理解應(yīng)該緊密結(jié)合  1.5 知識工程   1.5.1 知識工程的提出   1.5.2 初期的知識工程主要是專家系統(tǒng)  1.6 自然語言理解   1.6.1  自然語言的特點   1.6.2  自然語言理解的難點及其原因   1.6.3  自然語言的自釋性和突破其理解難點的方法   1.6.4  自然語言理解的進展拓寬了知識工程的范圍  1.7 知識工程語言學   1.7.1  新興的作為交叉學科的語言學分支的融合   1.7.2 知識工程語言學的研究內(nèi)容 第2章 語言是知識的編碼系統(tǒng)  2.1 人類語言觀的發(fā)展   2.1.1  語言是人類跟其他動物的主要區(qū)別之   2.1.2 語言是人類和計算機傳遞信息及實施控制的符號系統(tǒng)  2.2 語言是人類認識世界和表述知識的編碼系統(tǒng)   2.2.1 客觀世界·認知世界·語言世界   2.2.2 語言信息的發(fā)送和接收   2.3 語言的基本結(jié)構(gòu)單位   2.3.1 漢語和英語的基本結(jié)構(gòu)單位   2.3.2 漢語和英語基本結(jié)構(gòu)單位的差異   2.4 認知模式對語言的制約   2.4.1 認知模式對語言基本結(jié)構(gòu)單位的制約   2.4.2 認知模式對語言基本結(jié)構(gòu)順序的制約   2.4.3 認知模式對語言類型的制約  2.5 語言研究的觀察視角和剖析平面   2.5.1 語言研究的觀察視角‰   2.5.2 句子構(gòu)件的剖析平面  2.6 語言的優(yōu)化發(fā)展和人類的國際通用語   2.6.1  人類的語言正在逐步優(yōu)化而發(fā)生重大變化   2.6.2 人類文明史上最成功的通用符號系統(tǒng)   2.6.3 衡量語言“科學性”的標準   2.6.4 推薦漢語作為國際通用語的候選者   2.6.5 國際通用語的基本條件   2.6.6 漢語要持續(xù)優(yōu)化才可能成為國際通用語   2.6.7 “漢語一千字”成為通用語義符號的可行性中篇 語言的庫存單位 第3章 語形學:語言的光波載體和視覺感知  3.1 人類的刻寫能力和文字的不同來源   3.1.1 人類的刻寫能力是創(chuàng)造文字的原動力   3.1.2 漢語的文字是注重視覺信息的自源性文字   3.1.3 英語的文字是注重聽覺信息的他源性文字  3.2 英語的拼寫形式跟實際讀音的關(guān)系   3.2.1 英語拼寫跟讀音關(guān)系復(fù)雜的原因   3.2.2 英語單個元音字母在四種音節(jié)類型中的讀音   3.3 漢字的字形演變   3.3.1 漢字字形演變的主要階段   3.3.2 漢字的簡化和規(guī)范漢字   3.3.3 現(xiàn)代通用漢字印刷體的字號和字體  ……下篇 語言的交際單位參考文獻

章節(jié)摘錄

插圖:“信息論”奠基人仙農(nóng)(C.shannon)說:“信息是用以消除隨機不確定性的東西?!睉?yīng)該說這個定義是個實用的定義。盡管它說明的是信息的作用而沒有說明信息的本身到底是什么,但這個定義明確指出了信息對人類的重要性。人類在認識和改造客觀世界的實踐中必然遇到大量令人困惑的“不確定性”,正是依靠所獲得的信息來消除了這些“不確定性”,取得了令人滿意的成果。(2)在各位學者研究成果基礎(chǔ)上所建議的定義信息是物質(zhì)的基本屬性之一,是物質(zhì)的間接存在性的自身顯示,所顯示的是該物質(zhì)的存在狀況。信息的作用是能夠消除不確定性。這個定義闡明了“信息”的本質(zhì)和作用。①“材質(zhì)”和“能量”體現(xiàn)的是物質(zhì)的“直接存在性”;而“信息”體現(xiàn)的是物質(zhì)的“間接存在性”?!伴g接存在性”顯示“直接存在性”的狀況。例如,有三個塑料的英文字母塊“E、N、T”。從材質(zhì)的角度看,無論其排列的狀況如何,這三個塑料塊的總質(zhì)量是恒定的;從能量的角度看,如果將其靜止地擺在同一地點,無論排列狀況如何,這三個塑料塊的總能量也是恒定的。但是當排列順序是“TEN”時,顯示的信息是“十(ten)”;當排列順序是“NET”時,顯示的信息是“網(wǎng)(net)”。②“材質(zhì)、能量、信息”一起,成為物質(zhì)的三個基本屬性?;谶@種認識,人們說當代前沿科學的三大支柱是“材料科學、能源科學、信息科學”。③“信息”都是自身顯示的。并非因被其他認識主體所反映才存在,而是在被反映之前就已經(jīng)存在了?!靶畔ⅰ倍际俏镔|(zhì)自身發(fā)出的“自顯信息”。④“自顯信息”分為“所感信息”和“未感信息”。因為人們能夠研究的僅僅是“所感信息”,所以在不致誤解的條件下,我們把“所感信息”簡稱為“信息”。⑤“信息”的作用是消除“不確定性”。所以“信息”對人們來說是特別珍貴的??疾煲幌氯藗儭皞鬟f信息(說話)”的過程:人們在說話時,通常會首先說出一個“話題”(topic),然后再對這個話題加以“說明”(comment)。這就是說,說話者先用“話題”來提出一個不確定的并引起聽話者注意的懸念,然后再用“說明”去消除其中的不確定性,從而解除聽話者的懸念。1.1.3 人類文明的三個時代人類文明的三個時代是按照物質(zhì)生產(chǎn)的發(fā)展水平來劃分的。人類生存于地球這個物質(zhì)世界之中。在“前文明時代”,人類跟地球上的一般動物一樣,賴以生存的主要方式是覓食,即尋覓、采摘、捕捉、獵取大自然提供的現(xiàn)成的食物。所以,前文明時代也稱為“漁獵時代”。文明時代的標志是人類運用自己創(chuàng)造的勞動工具從事物質(zhì)生產(chǎn),即生產(chǎn)包括食物在內(nèi)的“生活資料”和包括工具在內(nèi)的“生產(chǎn)資料”等。人類文明時代按生產(chǎn)力的發(fā)展水平來分期。即按照依次開發(fā)“材質(zhì)資源、能量資源、信息資源”的順序而分為下列三個時代。

編輯推薦

《知識工程語言學》是由清華大學出版社出版的。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    知識工程語言學 PDF格式下載


用戶評論 (總計2條)

 
 

  •   如果你對語言知識處理比較感興趣,請你關(guān)注一下這本書,值得仔細研究。
  •   It's about Chinese, maybe not universal.
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7