南華大學機構典藏系統:Item 987654321/7981
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 18278/19583 (93%)
造访人次 : 915821      在线人数 : 758
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: http://nhuir.nhu.edu.tw/handle/987654321/7981


    题名: 以標籤區域為基之網頁文件分類模式
    作者: 王冠程;黃家偉;呂敏如;林大千;蘇泰郡
    貢獻者: 南華大學資訊管理學系
    楊士霆
    关键词: 標籤區域;網頁文件分類;關鍵字擷取;知識管理
    日期: 2011
    上传时间: 2011-05-17 13:36:57 (UTC+8)
    摘要: 隨著網際網路相關技術之盛行,網路使用者亦日趨增加,網路環境資訊量已呈爆炸性成長,因此瀏覽網路上文件或資訊已成為現代人吸取知識的重要管道之一。故如何有效管理此些網路文件/資訊,讓使用者得以掌握,以協助使用者快速吸收並運用此些網路資訊,乃成為在現今資訊爆炸時代中之重要課題。目前網頁分類大多以關鍵字擷取或以HTML語法標籤內的文字區域為依據,作為關鍵資訊分析基礎並進行網頁分類。此些分類技術係將網頁標籤去除,以擷取當中文字型態資訊,進行網頁分類(亦即將所擷取之網頁文字視為同等重要性),但此種情況下,可能有多項關鍵資訊被忽略(如可能遺失網頁標題資訊)。有鑑於此,本研究提出一套以網頁標籤區域(Tagged-Region)為基礎之網頁文件分類模式;於模式中,首先本研究乃考量網頁標籤屬性,發展一套「標籤區域權重分配」模組,以尋找影響網頁文件分類之標籤,並解析各網頁標籤於不同網頁空間規劃下之重要性;之後以具分類代表性標籤區域為基礎,擷取當中關鍵字詞,發展一套「網頁文件類別判定」模組,以推論目標網頁文件之隸屬類別;最後再以鏈結網頁為基礎,發展一套「鏈結網頁關聯程度推導」模組,將關鍵性鏈結網頁之隸屬類別,修訂目標網頁文件之隸屬類別,以完成網頁文件之隸屬類別判定任務。本研究最終乃建立一套網頁文件自動分類系統,並以一案例評估此模式與技術之有效性與可行性。綜合言之,本研究之目標乃為提昇網頁文件分類技術之正確率與效率性,因此,對於資訊需求者而言,本研究期望能協助資訊需求者於龐大之網路資訊/文件中,迅速且便捷地尋得其所需要之網路文件資料,以節省資訊需求者花費於資訊過濾與篩選之大量時間。
    關聯: 96級
    显示于类别:[資訊管理學系] 畢業專題

    文件中的档案:

    档案 描述 大小格式浏览次数
    96006.pdf777KbAdobe PDF2133检视/开启


    在NHUIR中所有的数据项都受到原著作权保护.

    TAIR相关文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 回馈