手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

Web资源组织与服务性能研究

朱征宇

  随着Internet技术的飞速发展以及应用的日益普及,Web上存储的信息量正以指数级增长(仅HTML文件就数以亿计)。虽然目前Web搜索引擎数以百计,新的Web个性化服务系统、新的Web数据模型和查询语言在不断涌现,但由于Web资源所具有的分布性、开放性和异构性等特点,使得Web信息的有效组织以及快速准确地获取日益困难,人们正面临所谓“Rich Data Poor Information”的尴尬局面。论文方向为Web数据管理,以电子商务、电子政务、数字图书馆和远程教育的应用基础为研究背景。通过分析目前Web数据管理中资源组织(数据模型,资源建设,异构资源集成)与信息访问(资源浏览效率,信息检索与信息重构)方面存在的不足,提出了新的Web资源表示模型,并对其在Web资源管理中的应用进行了深入的研究。通过新模型的提出和进行一系列的技术改进,能够使Web数据管理的整体性能得到一定改善。论文主要创新点和研究成果如下:(1)针对Web资源的传统表示方法在资源建设、数据冗余和数据一致性维护等方面存在的不足,提出了将具体数据内容和数据组织结构相分离的Web资源虚拟表示模型,较好地解决了上述不足。新模型不仅支持数据级的信息共享、不需修改资源设计即能够使Web资源随内容的改变而动态更新,而且还可以作为异构Web资源集成的公共数据模型。(2)在虚拟表示模型基础上,通过引入模块化标记、ETG嫁接操作和剪枝操作等概念,提出了Web资源(网页资源和XML资源)的模块化设计方法。该技术支持设计级的信息共享,允许设计静态和动态公共信息模块,并在Web资源设计中进行引用,具有使设计问题简化、减少设计冗余、便于资源设计的快速更新和一致性维护等特点。总之,该技术在Web资源建设中所起作用,达到了类似于模块化设计技术在程序设计中起到的作用。(3)在虚拟表示模型基础上,通过分析借鉴当前异构数据源集成和异构系统集成技术,提出了一种异构Web资源集成系统框架。在包装器的设计中,采用了将数据仓库方法与虚拟方法相结合的技术思想。与纯粹采用数据仓库方法的集成系统相比,该系统具有减少数据冗余、数据一致性维护和动态更新好的特点。而与采用虚拟方法侧重查询功能包装的集成系统相比,该系统具有不涉及复杂的查询分解与转换、包装器设计简化、易于加入新的数据源等特点。(4)在虚拟表示模型基础上,通过引入ETG操作和ETG重构操作,提出了一种基于资源内部标记结构和语义的Web信息抽取与重组技术,并给出了作为用户操作接口的标记查询语言TagSQL。该技术具有操作功能强、语言使用方便、信息抽取灵活、能够基于多资源进行信息重组等特点,是对基于内容的Web信息检索系统功能的补充和完善。该技术能够扩展应用到基于虚拟表示模型的异构Web资源集成系统上。(5)在虚拟表示模型基础上,通过引入内容模块概念,提出了Web资源快速访问技术。通过查看资源摘要信息和动态指定内容模块参数,可使用户在资源访问过程中减少传输和浏览无关资源和资源中的无关信息,提高资源访问效率。该技术能够扩展应用到基于虚拟表示模型的异构Web资源集成系统上。……   
[关键词]:Web数据管理;Web数据库;网页;XML;数据模型;资源设计;Web信息检索;Web查询语言
[文献类型]:博士论文
[文献出处]:重庆大学2003年
App内打开