出版時間:2008-12 出版社:科學出版社 作者:施國良 頁數(shù):152
Tag標簽:無
前言
隨著網(wǎng)絡信息的迅猛發(fā)展,龐大的網(wǎng)絡信息資源和人們特定的信息需求之間形成了巨大的矛盾。在此背景下,本書專門討論了分面分類法在網(wǎng)絡信息組織中應用的理論與實踐問題。信息量的迅速增長與人們對信息的特定需求是人們學習、工作和生活中的一對矛盾。只有研究網(wǎng)絡信息資源的現(xiàn)狀與特征,找到網(wǎng)絡信息資源組織的規(guī)律,才能從根本上解決這一矛盾,為人們方便、快捷地利用網(wǎng)絡信息提供一個理想的途徑。 正是在這樣的背景下,本書首先從搜索引擎的不足之處出發(fā),對分類法、分面分類法、網(wǎng)絡信息組織、數(shù)據(jù)庫等相關(guān)領(lǐng)域進行文獻調(diào)查;其次運用實驗方法對實物、服務和網(wǎng)絡文獻三個類型的網(wǎng)絡信息進行分面分析;再次選擇其中的實物類型進行概念設計、邏輯設計和物理設計;最后建立一個簡單的分面分類網(wǎng)絡應用模型,并將這個模型初步應用于上海寶山鋼鐵股份有限公司(以下簡稱寶鋼公司),旨在建立一個基于工藝和流程的企業(yè)知識組織系統(tǒng)。這個系統(tǒng)的底層正是分面數(shù)據(jù)庫。設計系統(tǒng)模型的參數(shù)為:開源服務器Apache 2.O.50,開源數(shù)據(jù)庫5.O,服務器端腳本為PHP 5.2.4,瀏覽器端使用AJAX技術(shù)實現(xiàn)無刷新更新數(shù)據(jù)功能,從而基本上適應了分面分類法的應用原理。 本書的觀點是:搜索引擎的局限性決定了僅僅依靠特性檢索方式無法解決用戶個性化的信息需求問題;枚舉式分類法用于指導實物排架的功能特性決定了其無法根本解決網(wǎng)絡信息激增所帶來的網(wǎng)絡信息組織問題;分面分類法并不能簡單地等同于阮岡納贊的冒號分類法,網(wǎng)絡上應用分面分類法必須遵循嚴謹?shù)姆置娣治鲞^程;網(wǎng)絡既為分面分類法的復蘇提供了廣闊的應用舞臺,也為分面分類法再次興起提供了強大的技術(shù)支持?! ”緯慕Y(jié)構(gòu)為:第1章,主要從網(wǎng)絡信息資源的現(xiàn)狀出發(fā),分析目前網(wǎng)絡信息組織與檢索存在的問題,從而引出全書的研究問題;第2章,主要對目前網(wǎng)絡信息組織尤其是網(wǎng)絡信息分類的理論與實踐進行評述,讓讀者對與本書有關(guān)的研究有一個簡要的了解;第3章,主要在理論上探討用分面分類法對網(wǎng)絡信息進行組織的必要性;第4章,主要在理論上探討用分面分類法對網(wǎng)絡信息進行組織的可能性;第5~7章,主要通過實驗的方法將分面分類法具體應用于網(wǎng)絡信息組織;第8章,作為案例,對寶鋼公司做了基于業(yè)務和流程的分面分類系統(tǒng)模型的介紹;第9章,主要討論分面分類法網(wǎng)絡應用的一些拓展問題;第10章,主要是概括全書的結(jié)論,并粗略地勾勒了未來的一些研究方向。
內(nèi)容概要
隨著網(wǎng)絡信息的迅猛發(fā)展,龐大的網(wǎng)絡信息資源和人們特定的信息需求之間形成了巨大的矛盾。在此背景下,本書專門討論了分面分類法在網(wǎng)絡信息組織中應用的理論與實踐問題。首先,本書分析了網(wǎng)絡信息組織面臨的問題;其次,專門論述了分面分類法的原理、特征和獨特的性能及其用于網(wǎng)絡信息組織的長處、必要性和可能性;再次,詳細討論了分面分類法應用于網(wǎng)絡信息組織的基本技術(shù)特點、過程和方法,并結(jié)合實例說明其可操作性,使讀者既對網(wǎng)絡信息組織的特殊性有一個完整的了解,又對分面分類法的具體應用有了感性的認識;最后,將理論、技術(shù)與實踐相結(jié)合,用實驗的方法將分面分類法應用于網(wǎng)絡信息組織,并結(jié)合一個案例做了具體的說明。本書集原理和應用于一體,語言深入淺出,通俗易懂,并配有必要的圖表,具有較強的可讀性?! ”緯m合作為高等院校圖書情報類和信息管理類專業(yè)各層次學生的教學參考書和補充讀物,也可作為各類信息資源管理部門(包括政府部門和科研機構(gòu))工作人員、眾多網(wǎng)絡公司工作人員以及廣大計算機與網(wǎng)絡愛好者的參考書。
書籍目錄
前言第1章 緒論 1.1 網(wǎng)絡信息資源的現(xiàn)狀與特征 1.2 網(wǎng)絡信息資源組織的問題 1.3 搜索引擎的現(xiàn)狀與問題 1.4 本書的框架結(jié)構(gòu)與寫作目的第2章 網(wǎng)絡信息分類研究進展評述 2.1 關(guān)于分面分類研究 2.2 關(guān)于網(wǎng)絡信息組織的研究 2.3 與網(wǎng)絡信息分類有關(guān)的技術(shù)問題的研究第3章 網(wǎng)絡信息分類的基本原理 3.1 分類問題的起源 3.2 從人類基本的思維方式看族性檢索的重要性 3.3 對分類過程、性質(zhì)與目的的探討有助于認識分類的基本原理 3.4 對分類法種類的探討有助于認識網(wǎng)絡信息分類的基本原理 3.5 枚舉式分類法對網(wǎng)絡的嘗試 3.6 網(wǎng)絡信息分類的特殊性 3.7 小結(jié)第4章 分面分類法與網(wǎng)絡信息組織 4.1 分面分類法的特征 4.2 網(wǎng)絡信息組織應用分面分類法的標準 4.3 網(wǎng)絡信息分面分類法的編制 4.4 小結(jié)第5章 網(wǎng)絡分面分類系統(tǒng)概念模型設計 5.1 概述 5.2 實物類 5.3 服務類 5.4 電子文獻類第6章 網(wǎng)絡分面分類系統(tǒng)邏輯模型設計 6.1 邏輯模型概述 6.2 邏輯模型的設計第7章 網(wǎng)絡分面分類系統(tǒng)物理模型設計 7.1 概述 7.2 數(shù)據(jù)結(jié)構(gòu)的設計 7.3 訪問方法的設計 7.4 數(shù)據(jù)存放位置的設計 7.5 系統(tǒng)配置的設計 7.6 用戶界面設計第8章 案例研究——寶鋼公司分面分類系統(tǒng)設計 8.1 案例背景 8.2 分面本體的設計 8.3 寶鋼公司信息知識系統(tǒng)的物理設計與開發(fā) 8.4 小結(jié)第9章 網(wǎng)絡信息分類的拓展 9.1 分面分類法網(wǎng)絡應用中的兩個問題 9.2 數(shù)據(jù)庫模型的選擇 9.3 用戶界面設計問題第10章 結(jié)束語 10.1 研究結(jié)論 10.2 分類研究的局限性 10.3 未來的研究方向主要參考文獻附錄A 縮略語與全稱對照表附錄8 部分XM1數(shù)據(jù)庫代碼 B1 DTD模式 B2 XSD1 B3 數(shù)據(jù)表(部分)
章節(jié)摘錄
互聯(lián)網(wǎng)出現(xiàn)后,搜索引擎是一種重要的網(wǎng)絡信息檢索工具,它讓用戶鍵人關(guān)鍵詞,然后到數(shù)據(jù)庫中去匹配。不同于學科目錄,搜索引擎不用人工索引員來編制索引,而是通過軟件來自動生成包含網(wǎng)頁的數(shù)據(jù)庫。概括說來,搜索引擎的工作原理包括三個部分:一是用某種程序,如“網(wǎng)絡爬蟲”(crawler),來收集眾多的網(wǎng)頁內(nèi)容;二是以某種利于高效檢索的方式(如標引)組織這些網(wǎng)頁,形成數(shù)據(jù)庫;三是接受查詢,并用某種排序軟件進行排序,并輸出結(jié)果?! 〉谝?,爬蟲負責跟蹤網(wǎng)絡,以廣度優(yōu)先或深度優(yōu)先的方法從Web上下載頁面,按照鏈接從一個網(wǎng)站到另一個網(wǎng)站。不同的搜索引擎有不同的爬蟲,有的遍歷所有網(wǎng)站,有的則根據(jù)自己的標準選擇一些流行的網(wǎng)站遍歷。前者返回的結(jié)果量很大,而后者會返回更加相關(guān)的結(jié)果,速度也更快?! 〉诙?,爬蟲返回的每一個頁面都存放在一個數(shù)據(jù)庫中,對下載頁面的內(nèi)容進行分析以用于索引,具體包括分詞、過濾、轉(zhuǎn)換等工作;然后將文檔表示為一種便于檢索的方式并存儲在索引數(shù)據(jù)庫中,一般采用的方法有矢量空間模型、倒排文檔、概率模型等;并通過自動抽詞和字順排列編制好索引。索引是每一個有效詞的列表,并有一個相應的指針指向它在數(shù)據(jù)庫中的位置。 第三,實現(xiàn)用戶查詢關(guān)鍵詞和目標文檔匹配度的計算,根據(jù)計算結(jié)果所有符合查詢要求的頁面URL按照相關(guān)度遞減的順序排列,并返回給用戶;用戶接口為用戶提供一個輸入查詢請求,定制查詢結(jié)果的Web頁面并將查詢結(jié)果格式化后返回給瀏覽器。同樣,不同的搜索引擎會遵循不同的原則:有的標引爬蟲返回頁面中每一個單個的詞,有的只標引標題或短語。搜索引擎的第三個要素是搜索軟件。該軟件將用戶鍵人的提問關(guān)鍵詞與索引進行比較,發(fā)現(xiàn)匹配的結(jié)果并按照相關(guān)度進行排序。相關(guān)度排序標準依不同的搜索引擎而不同?! 〔煌乃阉饕嫠褂玫呐老x和標引方法會導致不同的結(jié)果。這就是為什么在不同的搜索引擎中鍵入相同的關(guān)鍵詞會得到不同的結(jié)果。而且,由于這樣的操作方式,使得搜索引擎會返回較分類目錄更全面更專業(yè)的結(jié)果。這是因為它們搜索整個網(wǎng)頁而非網(wǎng)站的頂層頁面,使用的索引也是自動生成的,而非向分類目錄那樣使用預先生成的索引。
編輯推薦
《網(wǎng)絡信息分類:原理與應用》的第1章,主要從網(wǎng)絡信息資源的現(xiàn)狀出發(fā),分析目前網(wǎng)絡信息組織與檢索存在的問題,從而引出全書的研究問題;第2章,主要對目前網(wǎng)絡信息組織尤其是網(wǎng)絡信息分類的理論與實踐進行評述,讓讀者對與《網(wǎng)絡信息分類:原理與應用》有關(guān)的研究有一個簡要的了解;第3章,主要在理論上探討用分面分類法對網(wǎng)絡信息進行組織的必要性;第4章,主要在理論上探討用分面分類法對網(wǎng)絡信息進行組織的可能性;第5~7章,主要通過實驗的方法將分面分類法具體應用于網(wǎng)絡信息組織;第8章,作為案例,對寶鋼公司做了基于業(yè)務和流程的分面分類系統(tǒng)模型的介紹;第9章,主要討論分面分類法網(wǎng)絡應用的一些拓展問題;第10章,主要是概括全書的結(jié)論,并粗略地勾勒了未來的一些研究方向。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載