出版時(shí)間:2010-6 出版社:清華大學(xué)出版社 作者:魯川 頁數(shù):357
Tag標(biāo)簽:無
前言
我要告訴讀者:為什么要寫這本書?這本書是怎樣寫成的?書中主要寫了些什么?半個(gè)世紀(jì)前的1956年初夏,中國大地上響徹了“向科學(xué)進(jìn)軍”的號角聲,那時(shí)我正要填報(bào)高考志愿。在所能夠閱讀到的《知識就是力量》等科普刊物中,最令我神往的就是那剛誕生了10年的“電子計(jì)算機(jī)”。那一年招計(jì)算機(jī)專業(yè)的高等院校只有一所,就是哈爾濱工業(yè)大學(xué)。我幸運(yùn)考取之后,產(chǎn)生了一個(gè)想法:既然“機(jī)器人”是以“計(jì)算機(jī)”為大腦的,那么這個(gè)大腦就不應(yīng)該只會(huì)“計(jì)算”,還應(yīng)懂得“語言”、會(huì)做“文章”。從上大學(xué)一年級開始我就在學(xué)好“高等數(shù)學(xué)”等規(guī)定課程的同時(shí),找來中文系的各種課本默默地自學(xué)起來。后來才知道恰在我入學(xué)的1956年暑期,在美國的達(dá)特茅斯(Dartmooth)召開的學(xué)術(shù)會(huì)議宣告了“人工智能”的誕生,也知道了新興的“自然語言理解”等研究領(lǐng)域。這堅(jiān)定了我對“計(jì)算機(jī)能理解人類語言”的信心,也增強(qiáng)了“我應(yīng)該自學(xué)語言學(xué)”的恒心。我在世界“人工智能”誕生的1956年暑期考上計(jì)算機(jī)系,這個(gè)巧合是我的幸運(yùn),也決定了我一生的命運(yùn)。1961年從計(jì)算機(jī)系畢業(yè)以后的20年間,我為了“人工智能”的目的,堅(jiān)持自學(xué)古代漢語、現(xiàn)代漢語、理論語言學(xué)和外語,注意追蹤國外語言學(xué)主要學(xué)派的最新成果。1982年我慕名拜訪了范繼淹先生,他是中國社會(huì)科學(xué)院語言研究所著名的語言學(xué)家、中國人工智能學(xué)會(huì)的副理事長、我國“計(jì)算語言學(xué)”的開拓者之一。我向范先生表達(dá)了要報(bào)考他的“計(jì)算語言學(xué)”研究生的愿望。范先生告訴我:超過規(guī)定報(bào)考年齡的人是不準(zhǔn)報(bào)考的。在我的懇切請求下,范先生對我進(jìn)行了口試,證實(shí)了我的語言學(xué)基礎(chǔ)知識遠(yuǎn)遠(yuǎn)超過了研究生的入學(xué)水平,答應(yīng)向領(lǐng)導(dǎo)請示可否破例特招,結(jié)果沒有批準(zhǔn)。但范先生已被我的特殊經(jīng)歷和優(yōu)異成績打動(dòng),決定破例招收我為“不發(fā)文憑的在職研究生”,悉心輔導(dǎo)我學(xué)習(xí)“計(jì)算語言學(xué)碩士研究生”的全部課程。拜范先生為師之后才聽別人說,早在1973年他就被確診患了血癌,為了給國家培養(yǎng)急需的計(jì)算語言學(xué)人才,他分秒必爭地跟死神搶奪時(shí)間而忍受著難以想象的痛苦。1985年春天,范先生正式宣布我達(dá)到了“計(jì)算語言學(xué)碩士研究生”的結(jié)業(yè)水平。不久范先生就住進(jìn)了醫(yī)院,在病床上恩師對我說了他的臨終囑托:①恩師已經(jīng)在給《中國語文》(1985年第5期)的稿件《無定NP主語句》中提到我的名字,在參考文獻(xiàn)中引用了我的一篇會(huì)議論文,目的是引起語言學(xué)界的關(guān)注。讓我盡早在語言學(xué)期刊上發(fā)表論文以爭取語言學(xué)界的指導(dǎo)。②前幾年恩師跟陸儉明和邢福義先生等中年語言學(xué)家發(fā)起的、有語言學(xué)大師呂叔湘和朱德熙先生出席的“現(xiàn)代漢語語法學(xué)術(shù)討論會(huì)”已召開了三次。范先生知道自己不可能參加第四次討論會(huì)了,他跟會(huì)議負(fù)責(zé)人說過,要我接替他參加討論會(huì),讓我趕快寫一篇論文在會(huì)上宣讀。③讓我全力籌建“計(jì)算語言學(xué)”的全國性學(xué)術(shù)團(tuán)體。
內(nèi)容概要
本書是作者在為中國科學(xué)院研究生院和中國郵電大學(xué)研究生講授“知識工程語言學(xué)”課程時(shí)所寫的講義的基礎(chǔ)上完成的。這本書為人工智能、知識工程及相關(guān)專業(yè)的人員提供了所需的最必要的語言學(xué)基礎(chǔ)理論和最有用的語言數(shù)據(jù),包含對漢語特色的最新認(rèn)識以及跟英語的對比。它凝聚了作者數(shù)十年從事知識工程領(lǐng)域科研工作和堅(jiān)持不懈鉆研語言學(xué)的心得?! ”緯晒氖氯斯ぶ悄?、知識工程、自然語言理解、中文信息處理、機(jī)器翻譯的研究人員參考,也可供從事對外漢語教學(xué)、漢語國際推廣、英漢對比研究的教師和研究者參考,還可以作為高等院校相關(guān)專業(yè)的高年級本科生和研究生的選修課教材或參考書。
作者簡介
魯川,河南開封市人,1961年畢業(yè)于哈爾濱工業(yè)大學(xué)計(jì)算機(jī)系。長期從事中文信息處理和計(jì)算語言學(xué)的研究和教學(xué)工作。曾任北京信息工程學(xué)院教授,教育部語言文字應(yīng)用研究所計(jì)算語言學(xué)研究窒研究員,中國中文信息學(xué)會(huì)計(jì)算語言學(xué)專業(yè)委員會(huì)首屆主任,中國人工智能學(xué)會(huì)自然語言理解專業(yè)委員會(huì)委員兼機(jī)器學(xué)習(xí)專業(yè)委員會(huì)委員,中國應(yīng)用語言學(xué)會(huì)理事,《中文信息學(xué)報(bào)》編委。研究領(lǐng)域?yàn)槿斯ぶ悄?、知識工程、自然語言理解、機(jī)器翻譯、英漢對比、對外漢語教學(xué)等。出版的專著有((漢語語法的意合網(wǎng)絡(luò)》?!禠earn Chinese Through100 Sentence Frames》等,主編了《動(dòng)詞大詞典(人機(jī)兩用)》等。在《中國語言學(xué)報(bào)》、《漢語學(xué)習(xí)》、《語言教學(xué)與研究》、《世界漢語教學(xué)》、《語言科學(xué)》等核心期刊上發(fā)表過多篇論文。作為項(xiàng)目負(fù)責(zé)人,多次主持完成了國家級科研項(xiàng)目,如國家語言文字應(yīng)用科研項(xiàng)目“信息處理用規(guī)范漢字字義統(tǒng)計(jì)和造詞模式”和國家社會(huì)科學(xué)基金項(xiàng)目“信息處理與對外漢語教學(xué)的句子語序模式”等。所設(shè)計(jì)的從漢字輸入技術(shù)到對外漢語教學(xué)一條龍的“漢語自學(xué)機(jī)”獲得了國家發(fā)明專利。
書籍目錄
上篇 導(dǎo)論 第1章 信息時(shí)代需要知識工程語言學(xué) 1.1 信息 1.1.1 信息是物質(zhì)的基本屬性之 1.1.2 信息的定義 1.1.3 人類文明的三個(gè)時(shí)代 1.1.4信息時(shí)代的高級階段必然出現(xiàn)知識經(jīng)濟(jì) 1.2 知識 1.2.1 信息有待于優(yōu)化和系統(tǒng)化 1.2.2 知識的定義 1.2.3 知識的層次 1.3 智能 1.3.1 知識處理主要包括知識獲取、知識傳播和知識運(yùn)用 1.3.2 智能的定義 1.4 人工智能 1.4.1 人工智能的誕生和初期的發(fā)展 1.4.2 知識表示和自然語言理解應(yīng)該緊密結(jié)合 1.5 知識工程 1.5.1 知識工程的提出 1.5.2 初期的知識工程主要是專家系統(tǒng) 1.6 自然語言理解 1.6.1 自然語言的特點(diǎn) 1.6.2 自然語言理解的難點(diǎn)及其原因 1.6.3 自然語言的自釋性和突破其理解難點(diǎn)的方法 1.6.4 自然語言理解的進(jìn)展拓寬了知識工程的范圍 1.7 知識工程語言學(xué) 1.7.1 新興的作為交叉學(xué)科的語言學(xué)分支的融合 1.7.2 知識工程語言學(xué)的研究內(nèi)容 第2章 語言是知識的編碼系統(tǒng) 2.1 人類語言觀的發(fā)展 2.1.1 語言是人類跟其他動(dòng)物的主要區(qū)別之 2.1.2 語言是人類和計(jì)算機(jī)傳遞信息及實(shí)施控制的符號系統(tǒng) 2.2 語言是人類認(rèn)識世界和表述知識的編碼系統(tǒng) 2.2.1 客觀世界·認(rèn)知世界·語言世界 2.2.2 語言信息的發(fā)送和接收 2.3 語言的基本結(jié)構(gòu)單位 2.3.1 漢語和英語的基本結(jié)構(gòu)單位 2.3.2 漢語和英語基本結(jié)構(gòu)單位的差異 2.4 認(rèn)知模式對語言的制約 2.4.1 認(rèn)知模式對語言基本結(jié)構(gòu)單位的制約 2.4.2 認(rèn)知模式對語言基本結(jié)構(gòu)順序的制約 2.4.3 認(rèn)知模式對語言類型的制約 2.5 語言研究的觀察視角和剖析平面 2.5.1 語言研究的觀察視角‰ 2.5.2 句子構(gòu)件的剖析平面 2.6 語言的優(yōu)化發(fā)展和人類的國際通用語 2.6.1 人類的語言正在逐步優(yōu)化而發(fā)生重大變化 2.6.2 人類文明史上最成功的通用符號系統(tǒng) 2.6.3 衡量語言“科學(xué)性”的標(biāo)準(zhǔn) 2.6.4 推薦漢語作為國際通用語的候選者 2.6.5 國際通用語的基本條件 2.6.6 漢語要持續(xù)優(yōu)化才可能成為國際通用語 2.6.7 “漢語一千字”成為通用語義符號的可行性中篇 語言的庫存單位 第3章 語形學(xué):語言的光波載體和視覺感知 3.1 人類的刻寫能力和文字的不同來源 3.1.1 人類的刻寫能力是創(chuàng)造文字的原動(dòng)力 3.1.2 漢語的文字是注重視覺信息的自源性文字 3.1.3 英語的文字是注重聽覺信息的他源性文字 3.2 英語的拼寫形式跟實(shí)際讀音的關(guān)系 3.2.1 英語拼寫跟讀音關(guān)系復(fù)雜的原因 3.2.2 英語單個(gè)元音字母在四種音節(jié)類型中的讀音 3.3 漢字的字形演變 3.3.1 漢字字形演變的主要階段 3.3.2 漢字的簡化和規(guī)范漢字 3.3.3 現(xiàn)代通用漢字印刷體的字號和字體 ……下篇 語言的交際單位參考文獻(xiàn)
章節(jié)摘錄
插圖:“信息論”奠基人仙農(nóng)(C.shannon)說:“信息是用以消除隨機(jī)不確定性的東西?!睉?yīng)該說這個(gè)定義是個(gè)實(shí)用的定義。盡管它說明的是信息的作用而沒有說明信息的本身到底是什么,但這個(gè)定義明確指出了信息對人類的重要性。人類在認(rèn)識和改造客觀世界的實(shí)踐中必然遇到大量令人困惑的“不確定性”,正是依靠所獲得的信息來消除了這些“不確定性”,取得了令人滿意的成果。(2)在各位學(xué)者研究成果基礎(chǔ)上所建議的定義信息是物質(zhì)的基本屬性之一,是物質(zhì)的間接存在性的自身顯示,所顯示的是該物質(zhì)的存在狀況。信息的作用是能夠消除不確定性。這個(gè)定義闡明了“信息”的本質(zhì)和作用。①“材質(zhì)”和“能量”體現(xiàn)的是物質(zhì)的“直接存在性”;而“信息”體現(xiàn)的是物質(zhì)的“間接存在性”?!伴g接存在性”顯示“直接存在性”的狀況。例如,有三個(gè)塑料的英文字母塊“E、N、T”。從材質(zhì)的角度看,無論其排列的狀況如何,這三個(gè)塑料塊的總質(zhì)量是恒定的;從能量的角度看,如果將其靜止地?cái)[在同一地點(diǎn),無論排列狀況如何,這三個(gè)塑料塊的總能量也是恒定的。但是當(dāng)排列順序是“TEN”時(shí),顯示的信息是“十(ten)”;當(dāng)排列順序是“NET”時(shí),顯示的信息是“網(wǎng)(net)”。②“材質(zhì)、能量、信息”一起,成為物質(zhì)的三個(gè)基本屬性。基于這種認(rèn)識,人們說當(dāng)代前沿科學(xué)的三大支柱是“材料科學(xué)、能源科學(xué)、信息科學(xué)”。③“信息”都是自身顯示的。并非因被其他認(rèn)識主體所反映才存在,而是在被反映之前就已經(jīng)存在了?!靶畔ⅰ倍际俏镔|(zhì)自身發(fā)出的“自顯信息”。④“自顯信息”分為“所感信息”和“未感信息”。因?yàn)槿藗兡軌蜓芯康膬H僅是“所感信息”,所以在不致誤解的條件下,我們把“所感信息”簡稱為“信息”。⑤“信息”的作用是消除“不確定性”。所以“信息”對人們來說是特別珍貴的。考察一下人們“傳遞信息(說話)”的過程:人們在說話時(shí),通常會(huì)首先說出一個(gè)“話題”(topic),然后再對這個(gè)話題加以“說明”(comment)。這就是說,說話者先用“話題”來提出一個(gè)不確定的并引起聽話者注意的懸念,然后再用“說明”去消除其中的不確定性,從而解除聽話者的懸念。1.1.3 人類文明的三個(gè)時(shí)代人類文明的三個(gè)時(shí)代是按照物質(zhì)生產(chǎn)的發(fā)展水平來劃分的。人類生存于地球這個(gè)物質(zhì)世界之中。在“前文明時(shí)代”,人類跟地球上的一般動(dòng)物一樣,賴以生存的主要方式是覓食,即尋覓、采摘、捕捉、獵取大自然提供的現(xiàn)成的食物。所以,前文明時(shí)代也稱為“漁獵時(shí)代”。文明時(shí)代的標(biāo)志是人類運(yùn)用自己創(chuàng)造的勞動(dòng)工具從事物質(zhì)生產(chǎn),即生產(chǎn)包括食物在內(nèi)的“生活資料”和包括工具在內(nèi)的“生產(chǎn)資料”等。人類文明時(shí)代按生產(chǎn)力的發(fā)展水平來分期。即按照依次開發(fā)“材質(zhì)資源、能量資源、信息資源”的順序而分為下列三個(gè)時(shí)代。
編輯推薦
《知識工程語言學(xué)》是由清華大學(xué)出版社出版的。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載