手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

支持数据集成的元数据仓库管理与维护工具的设计与实现

叶国权

   进入21世纪以后,生命科学得到了飞速的发展,生物信息出现了爆炸性的增长,如何快速有效的整合查询这些分布。异构。自治的数据库,成为困扰生物学家难题之一。为了解决目前生物信息集成查询中存在的问题,我们提出了基于元数据的蛋白质组数据资源整合方案,并已经建立了元仓库,包括根据CWM规范建立的源数据库结构元数据。供用户查询的用户模式和依据本体标注的语义元数据,本文是在以上工作的基础上,着重研究元仓库的管理与维护。源数据库与元仓库的元数据同步以及元仓库中各类元数据更新一致等问题。 由于采用的数据资源的整合方案是基于元数据的数据集成,因此如何对这些集成到元仓库的元数据进行有效的管理与维护,就成为整合方案实现过程中必须要解决的问题。首先是对已经从各个数据源集成到元仓库中的元数据的管理与维护,包括元数据信息的浏览。查询和备份;其次,由于源数据库的自治性,元仓库的管理者并不能控制源数据库的结构元数据的改变,那么如何捕获这些变化,并将这些变化反映到元仓库,是本课题的难点。基于以上问题,本文主要在以下几个方面进行了重点地研究: 1)对元数据以及CWM元模型进行研究和分析,使用相关接口实现元仓库信息的初始化。元数据的树形结构浏览和查询。本体信息和用户模式信息的初始化,以及用户模式信息和本体信息的多角度浏览和查询。 2)通过对数据库信息同步的研究,研究和设计了源数据库结构变化的捕获工具,并根据捕获到的源数据库的结构变化信息对元仓库进行更新,以及将更新传播到用户模式库和语义元数据库中,解决因元数据更新而造成的用户模式和语义元数据的悬挂问题。 3)研究和分析了数据库的容灾策略,为元仓库建立了相应的容灾机制。综合以上研究,本文最终实现了一个元数据仓库管理与维护工具的原型系统(CWMMS),元仓库的管理员可以通过此系统,方便地实现对元仓库的更新与维护。该工作是整个基于元数据的蛋白质组数据资源整合方案的有机部分,为进一步研究工作打下基础。……   
[关键词]:数据集成;元数据;CWM;悬挂
[文献类型]:硕士论文
[文献出处]:国防科学技术大学2010年
App内打开