網絡信息分類

出版時間:2008-12  出版社:科學出版社  作者:施國良  頁數:152  
Tag標簽:無  

前言

  隨著網絡信息的迅猛發(fā)展,龐大的網絡信息資源和人們特定的信息需求之間形成了巨大的矛盾。在此背景下,本書專門討論了分面分類法在網絡信息組織中應用的理論與實踐問題。信息量的迅速增長與人們對信息的特定需求是人們學習、工作和生活中的一對矛盾。只有研究網絡信息資源的現狀與特征,找到網絡信息資源組織的規(guī)律,才能從根本上解決這一矛盾,為人們方便、快捷地利用網絡信息提供一個理想的途徑。  正是在這樣的背景下,本書首先從搜索引擎的不足之處出發(fā),對分類法、分面分類法、網絡信息組織、數據庫等相關領域進行文獻調查;其次運用實驗方法對實物、服務和網絡文獻三個類型的網絡信息進行分面分析;再次選擇其中的實物類型進行概念設計、邏輯設計和物理設計;最后建立一個簡單的分面分類網絡應用模型,并將這個模型初步應用于上海寶山鋼鐵股份有限公司(以下簡稱寶鋼公司),旨在建立一個基于工藝和流程的企業(yè)知識組織系統(tǒng)。這個系統(tǒng)的底層正是分面數據庫。設計系統(tǒng)模型的參數為:開源服務器Apache 2.O.50,開源數據庫5.O,服務器端腳本為PHP 5.2.4,瀏覽器端使用AJAX技術實現無刷新更新數據功能,從而基本上適應了分面分類法的應用原理?! ”緯挠^點是:搜索引擎的局限性決定了僅僅依靠特性檢索方式無法解決用戶個性化的信息需求問題;枚舉式分類法用于指導實物排架的功能特性決定了其無法根本解決網絡信息激增所帶來的網絡信息組織問題;分面分類法并不能簡單地等同于阮岡納贊的冒號分類法,網絡上應用分面分類法必須遵循嚴謹的分面分析過程;網絡既為分面分類法的復蘇提供了廣闊的應用舞臺,也為分面分類法再次興起提供了強大的技術支持?! ”緯慕Y構為:第1章,主要從網絡信息資源的現狀出發(fā),分析目前網絡信息組織與檢索存在的問題,從而引出全書的研究問題;第2章,主要對目前網絡信息組織尤其是網絡信息分類的理論與實踐進行評述,讓讀者對與本書有關的研究有一個簡要的了解;第3章,主要在理論上探討用分面分類法對網絡信息進行組織的必要性;第4章,主要在理論上探討用分面分類法對網絡信息進行組織的可能性;第5~7章,主要通過實驗的方法將分面分類法具體應用于網絡信息組織;第8章,作為案例,對寶鋼公司做了基于業(yè)務和流程的分面分類系統(tǒng)模型的介紹;第9章,主要討論分面分類法網絡應用的一些拓展問題;第10章,主要是概括全書的結論,并粗略地勾勒了未來的一些研究方向。

內容概要

隨著網絡信息的迅猛發(fā)展,龐大的網絡信息資源和人們特定的信息需求之間形成了巨大的矛盾。在此背景下,本書專門討論了分面分類法在網絡信息組織中應用的理論與實踐問題。首先,本書分析了網絡信息組織面臨的問題;其次,專門論述了分面分類法的原理、特征和獨特的性能及其用于網絡信息組織的長處、必要性和可能性;再次,詳細討論了分面分類法應用于網絡信息組織的基本技術特點、過程和方法,并結合實例說明其可操作性,使讀者既對網絡信息組織的特殊性有一個完整的了解,又對分面分類法的具體應用有了感性的認識;最后,將理論、技術與實踐相結合,用實驗的方法將分面分類法應用于網絡信息組織,并結合一個案例做了具體的說明。本書集原理和應用于一體,語言深入淺出,通俗易懂,并配有必要的圖表,具有較強的可讀性?! ”緯m合作為高等院校圖書情報類和信息管理類專業(yè)各層次學生的教學參考書和補充讀物,也可作為各類信息資源管理部門(包括政府部門和科研機構)工作人員、眾多網絡公司工作人員以及廣大計算機與網絡愛好者的參考書。

書籍目錄

前言第1章 緒論  1.1 網絡信息資源的現狀與特征  1.2 網絡信息資源組織的問題  1.3 搜索引擎的現狀與問題  1.4 本書的框架結構與寫作目的第2章 網絡信息分類研究進展評述  2.1 關于分面分類研究  2.2 關于網絡信息組織的研究  2.3 與網絡信息分類有關的技術問題的研究第3章 網絡信息分類的基本原理  3.1 分類問題的起源  3.2 從人類基本的思維方式看族性檢索的重要性  3.3 對分類過程、性質與目的的探討有助于認識分類的基本原理  3.4 對分類法種類的探討有助于認識網絡信息分類的基本原理  3.5 枚舉式分類法對網絡的嘗試  3.6 網絡信息分類的特殊性  3.7 小結第4章 分面分類法與網絡信息組織  4.1 分面分類法的特征  4.2 網絡信息組織應用分面分類法的標準  4.3 網絡信息分面分類法的編制  4.4 小結第5章 網絡分面分類系統(tǒng)概念模型設計  5.1 概述  5.2 實物類  5.3 服務類  5.4 電子文獻類第6章 網絡分面分類系統(tǒng)邏輯模型設計  6.1 邏輯模型概述  6.2 邏輯模型的設計第7章 網絡分面分類系統(tǒng)物理模型設計  7.1 概述  7.2 數據結構的設計  7.3 訪問方法的設計  7.4 數據存放位置的設計  7.5 系統(tǒng)配置的設計  7.6 用戶界面設計第8章 案例研究——寶鋼公司分面分類系統(tǒng)設計  8.1 案例背景  8.2 分面本體的設計  8.3 寶鋼公司信息知識系統(tǒng)的物理設計與開發(fā)  8.4 小結第9章 網絡信息分類的拓展  9.1 分面分類法網絡應用中的兩個問題  9.2 數據庫模型的選擇  9.3 用戶界面設計問題第10章 結束語  10.1 研究結論  10.2 分類研究的局限性  10.3 未來的研究方向主要參考文獻附錄A 縮略語與全稱對照表附錄8 部分XM1數據庫代碼  B1  DTD模式  B2  XSD1    B3  數據表(部分)

章節(jié)摘錄

  互聯(lián)網出現后,搜索引擎是一種重要的網絡信息檢索工具,它讓用戶鍵人關鍵詞,然后到數據庫中去匹配。不同于學科目錄,搜索引擎不用人工索引員來編制索引,而是通過軟件來自動生成包含網頁的數據庫。概括說來,搜索引擎的工作原理包括三個部分:一是用某種程序,如“網絡爬蟲”(crawler),來收集眾多的網頁內容;二是以某種利于高效檢索的方式(如標引)組織這些網頁,形成數據庫;三是接受查詢,并用某種排序軟件進行排序,并輸出結果。  第一,爬蟲負責跟蹤網絡,以廣度優(yōu)先或深度優(yōu)先的方法從Web上下載頁面,按照鏈接從一個網站到另一個網站。不同的搜索引擎有不同的爬蟲,有的遍歷所有網站,有的則根據自己的標準選擇一些流行的網站遍歷。前者返回的結果量很大,而后者會返回更加相關的結果,速度也更快。  第二,爬蟲返回的每一個頁面都存放在一個數據庫中,對下載頁面的內容進行分析以用于索引,具體包括分詞、過濾、轉換等工作;然后將文檔表示為一種便于檢索的方式并存儲在索引數據庫中,一般采用的方法有矢量空間模型、倒排文檔、概率模型等;并通過自動抽詞和字順排列編制好索引。索引是每一個有效詞的列表,并有一個相應的指針指向它在數據庫中的位置?! 〉谌?,實現用戶查詢關鍵詞和目標文檔匹配度的計算,根據計算結果所有符合查詢要求的頁面URL按照相關度遞減的順序排列,并返回給用戶;用戶接口為用戶提供一個輸入查詢請求,定制查詢結果的Web頁面并將查詢結果格式化后返回給瀏覽器。同樣,不同的搜索引擎會遵循不同的原則:有的標引爬蟲返回頁面中每一個單個的詞,有的只標引標題或短語。搜索引擎的第三個要素是搜索軟件。該軟件將用戶鍵人的提問關鍵詞與索引進行比較,發(fā)現匹配的結果并按照相關度進行排序。相關度排序標準依不同的搜索引擎而不同?! 〔煌乃阉饕嫠褂玫呐老x和標引方法會導致不同的結果。這就是為什么在不同的搜索引擎中鍵入相同的關鍵詞會得到不同的結果。而且,由于這樣的操作方式,使得搜索引擎會返回較分類目錄更全面更專業(yè)的結果。這是因為它們搜索整個網頁而非網站的頂層頁面,使用的索引也是自動生成的,而非向分類目錄那樣使用預先生成的索引。

編輯推薦

  《網絡信息分類:原理與應用》的第1章,主要從網絡信息資源的現狀出發(fā),分析目前網絡信息組織與檢索存在的問題,從而引出全書的研究問題;第2章,主要對目前網絡信息組織尤其是網絡信息分類的理論與實踐進行評述,讓讀者對與《網絡信息分類:原理與應用》有關的研究有一個簡要的了解;第3章,主要在理論上探討用分面分類法對網絡信息進行組織的必要性;第4章,主要在理論上探討用分面分類法對網絡信息進行組織的可能性;第5~7章,主要通過實驗的方法將分面分類法具體應用于網絡信息組織;第8章,作為案例,對寶鋼公司做了基于業(yè)務和流程的分面分類系統(tǒng)模型的介紹;第9章,主要討論分面分類法網絡應用的一些拓展問題;第10章,主要是概括全書的結論,并粗略地勾勒了未來的一些研究方向。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    網絡信息分類 PDF格式下載


用戶評論 (總計1條)

 
 

  •   沒細看 大概的還可以
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網 手機版

京ICP備13047387號-7