出版時間:2009-12 出版社:東南大學出版社 作者:章成志,白振田 著 頁數(shù):198 字數(shù):173000
Tag標簽:無
前言
2001年7-8月《中圖法》編委會在京對《中國分類主題詞表》第2版初稿進行綜合審定,南京農(nóng)業(yè)大學、中山大學、上??哲娬螌W院等信息管理系的老師帶領(lǐng)部分研究生參加了審定工作。薛春香就是這批學生中的佼佼者之一。她敏捷嚴謹?shù)乃季S、沉穩(wěn)扎實的作風以及深究勤問的性格給我留下深刻的印象。此后,她攻讀博士、做博士后,始終在信息組織這塊沃土上辛勤耕耘,由此也與《中圖法》、《中國分類主題詞表》結(jié)下了不解之緣,成為《中圖法》編委會的常客。八年后,薛春香的《網(wǎng)絡(luò)環(huán)境中知識組織系統(tǒng)構(gòu)建與應(yīng)用研究》問世,這是她在博士論文的基礎(chǔ)上從更廣闊的情報語言領(lǐng)域進行深入研究后完成的,論證的結(jié)構(gòu)更加完善、內(nèi)容也更加豐富。這本書對網(wǎng)絡(luò)環(huán)境中的知識組織系統(tǒng)及研究現(xiàn)狀、知識組織系統(tǒng)構(gòu)建與描述標準等作了全面的概述,深入對網(wǎng)絡(luò)環(huán)境中知識組織系統(tǒng)的設(shè)計、傳統(tǒng)知識組織系統(tǒng)自動構(gòu)建以及知識組織系統(tǒng)的互操作與整合進行了研究,并對網(wǎng)絡(luò)環(huán)境中知識組織系統(tǒng)的應(yīng)用做了分析,是目前國內(nèi)一本較全面地研究知識組織系統(tǒng)構(gòu)建與應(yīng)用的著作。
內(nèi)容概要
本書總結(jié)了作者近年來在文本自動標引和,自動分類上所做的研究與實踐。全書由四部分構(gòu)成:第一部分為基礎(chǔ)部分,介紹研究背景和研究意義,并對相關(guān)研究進展進行綜述;第二部分介紹作者在自動標引方面的研究工作;第三部分介紹基于《中圖法》分類知識庫的文本自動分類系統(tǒng):第四部分介紹基于統(tǒng)計與規(guī)則相結(jié)合的文本自動分類系統(tǒng)?! ”緯菄鴥?nèi)第一本比較系統(tǒng)地介紹文本自動標引和自動分類研究的專著,對從事信息檢索、文本挖掘、知識組織、數(shù)字圖書館等研究和應(yīng)用開發(fā)的科技人員有較高參考價值,可作為圖書館學、情報學、計算機科學與技術(shù)、信息管理和信息系統(tǒng)等專業(yè)的研究生、高年級本科生的教學參考書和技術(shù)資料。
作者簡介
章成志,1997年生,1999年獲安徽工程科技學院學士學位,2002年獲南京農(nóng)業(yè)大學碩士學位,2007年獲南京大學博士學位。現(xiàn)為中國科學技術(shù)信息研究所在站博士后,南京理工大學信息管理系講師、碩士生導(dǎo)師。研究領(lǐng)域包括信息組織、信息檢索、文本挖掘等。曾獲國家自然科學基金
書籍目錄
第一部分 第1章 引言 1.1 研究背景 1.2 自動標引與自動分類的作用 1.3 本書的內(nèi)容與章 節(jié)安排 第2章 文本自動標引與分類研究進展 2.1 自動標引研究綜述 2.2 文本分類研究綜述 2.3 本章 小結(jié)第二部分 第3章 文本分詞技術(shù)及抽詞詞典構(gòu)造 3.1 文本分詞技術(shù)概述 3.2 分詞模式設(shè)計及其原理 3.3 原始抽詞詞典的構(gòu)造 3.4 詞典約簡算法實驗 第4章 基于多特征選擇及權(quán)值計算 4.1 特征選擇方法概述 4.2 算法設(shè)計原理 4.3 結(jié)果分析 第5章 自動標引中標引源權(quán)重方案確定 5.1 標引源權(quán)重研究綜述 5.2 標引源權(quán)重方案的確定 5.3 本章 小結(jié)第三部分 第6章 分類知識庫的制作 6.1 概述 6.2 關(guān)鍵詞(串)一分類號關(guān)聯(lián)研究綜述 6.3 關(guān)鍵詞(串)一分類號關(guān)聯(lián)方法 6.4 分類知識庫的制作 6.5 分類知識庫的性能測評 6.6 篇名知識庫的制作 6.7 本章 小結(jié) 第7章 基于語義體系的詞語相似度計算 7.1 概述 7.2 詞語相似度研究綜述 7.3 基于語義體系的詞語相似度算法 7.4 基于語義相似度的同義詞挖掘 7.5 本章 小結(jié) 第8章 基于知識庫的文本自動分類 8.1 文本自動系統(tǒng)總體設(shè)計 8.2 文本自動分類系統(tǒng)的測評 8.3 《全國報刊索引》自動標引與自動分類系統(tǒng)介紹 8.4 本章 小結(jié)第四部分 第9章 統(tǒng)計與決策規(guī)則雙重分類算法 9.1 分類器概述 9.2 雙重分類原理 9.3 分類規(guī)則提取 9.4 雙重分類過程 9.5 實驗結(jié)果及分析 第10章 層次分類算法實驗 10.1 層次分類原理 10.2 層次分類算法設(shè)計 10.3 實驗結(jié)果及分析 第11章 基于統(tǒng)計與規(guī)則相結(jié)合的文本分類系統(tǒng)的實現(xiàn) 11.1 系統(tǒng)實驗用語料選擇及分析 11.2 系統(tǒng)總體框架與模塊介紹 11.3 系統(tǒng)測試分析 11.4 本章 小結(jié)名稱索引主題索引后記
章節(jié)摘錄
插圖:(3)術(shù)語表和字典/詞典術(shù)語表是術(shù)語及其定義的列表。術(shù)語可來源于特定領(lǐng)域或特定作品,這些術(shù)語在某一特定環(huán)境中被定義,而且很少有多種不同的含義。字典/詞典是以字順排列的字或詞以及它們的定義的列表,包括字或詞的各種不同含義。字典/詞典的范圍要比術(shù)語表寬泛和通用。字典/詞典還可以提供字或詞的起源信息,如拼寫或詞法,以及跨學科的多種含義;有的字典或詞典還可能提供不同含義的同義詞、相關(guān)詞,但它沒有明確的等級層次體系,也沒有試圖通過概念來將字詞加以分組,如《現(xiàn)代漢語詞典》等。(4)規(guī)范文檔規(guī)范文檔亦稱權(quán)威檔,是用來控制同一實體(人或事物)不同的名稱,或者某個特定領(lǐng)域中專有名詞的詞匯表,例如國家名稱表、個人姓名表、組織結(jié)構(gòu)名稱列表。非規(guī)范的詞匯被鏈接指向規(guī)范詞匯。這種類型的知識組織系統(tǒng)并不揭示復(fù)雜的結(jié)構(gòu)和組織關(guān)系,一般只揭示等同關(guān)系。如臺灣“中央研究院”組織制作的人名權(quán)威檔、地名權(quán)威檔、時代權(quán)威檔等,在其人名權(quán)威檔中檢索“徐光啟”,在“徐光啟”這一條目下,以“徐光啟”作為規(guī)范名,并列有其字、號,如“子先”、“徐玄扈”、“玄扈先生”、“徐文定公”等,通過這些詞匯的檢索能指向“徐光啟”這一條目。(5)同義詞環(huán)同義詞環(huán)是一組同義、近義甚至相關(guān)詞的集合,類似于入口詞表,但是它不會強行要求環(huán)中某一個詞作為“正式詞”,環(huán)中任何一個詞的士也位都是平等的,都可以是正式詞。同義詞環(huán)通常與搜索引擎一起使用,以幫助擴充檢索式,用戶只要使用同義詞環(huán)中的任何一個詞,就可以找到這一類的資源。圖1-5是利用Googl。
后記
本書系《情報檢索語言與智能信息處理》叢書之一,是在筆者博士學位論文《農(nóng)史知識組織系統(tǒng)構(gòu)建與應(yīng)用研究》(2006年6月完成)的基礎(chǔ)上經(jīng)過擴充改編而成。知識組織系統(tǒng)是對各種知識組織的語義工具的統(tǒng)稱。從廣義而言,其包含的各種具體類型的工具有數(shù)十種之多,本書在論述時盡量從整體上論述,以求全面。但限于筆者以往的研究以分類法和詞表建設(shè)與應(yīng)用為主,對本體、主題圖等缺乏實踐;同時,分類法和受控詞表仍是本體、主題圖等新型知識組織系統(tǒng)構(gòu)建的基礎(chǔ),因此在本書實驗研究中仍以網(wǎng)絡(luò)環(huán)境中的分類法和受控詞表為研究重點。但是從傳統(tǒng)分類法、敘詞表向本體轉(zhuǎn)換,基于概念圖和主題圖來組織和導(dǎo)航信息資源等,將是筆者今后研究中不可回避并將著重關(guān)注的課題。本書能夠得以出版,首先感謝我的導(dǎo)師侯漢清教授,沒有導(dǎo)師的親切教誨和悉心指導(dǎo),要完成本書是不可想象的。導(dǎo)師一貫嚴謹?shù)闹螌W作風、孜孜不倦的探索精神給我留下深切的體會,并鞭策我在今后的人生旅程中不斷學習與提高。
編輯推薦
《網(wǎng)絡(luò)環(huán)境中知識組織系統(tǒng)構(gòu)建與應(yīng)用研究》:情報檢索語言與智能信息處理叢書
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載