书合文秘网 - 设为首页 - 加入收藏
当前位置 首页 > 范文大全 > 公文范文 >

基于信息挖掘和学科服务的特色资源库建设研究

作者: 浏览数: 关键词: 资源库 挖掘 学科 特色 建设

[摘要]以建设中药平性药数据库为例,探讨在学科服务环境和信息挖掘技术的支撑下,高校特色资源库的建设思路、建设内容和建库体会,以期待为高校图书馆建设特色资源库提供参考借鉴。

[关键词]特色资源库;学科服务;信息挖掘

[中图分类号]G258.6[文献标志码]B[文章编号]1005-6041(2016)04-0031-04

高等院校是重要的学术交流阵地和科研场所,有着强大的学科特色与优势,学科建设水平成为一所高校办学质量、教学水平和综合竞争力的显著标志。在高校大力发展学科建设的背景下,图书馆作为高校文献资源保障基地,也必须进行相应的改革,由传统单一的资源服务逐步转变为深层次的学科服务,积极探索建立学科数据库的知识环境。基于此,高校图书馆应充分利用图书馆特有的丰富文献资源,以学科建设为导向,将各种信息资源充分运用和加工,对知识进行深入地挖掘和重组,致力于建设具有鲜明学科特色的数字资源保障系统,促进知识共享,充分体现图书馆学科服务的功能。本文以广西中医药大学图书馆中药平性药数据库建设为例,重点介绍在学科服务环境下特色资源库设计的思路及建设的主要内容。

1立足于学科专业发展需求的建库方案

中医药专业是广西中医药大学特色重点学科专业,而平性药则是中医药资源中极其重要的部分。“中药平性药数据库”就是在充分利用本校学科优势的基础上,依托图书馆丰富的中医药文献资源,对“平性药”各方面的信息资料进行专业地采集、分析、加工和存储,实现资源的数字化,并充分利用学科馆员的知识优势,对数据库蕴含的、对用户价值最大的隐性信息[1]进行深度提炼,打造具有显著中医药学科特色的数字资源保障体系,为中药学、中医药临床提供必要的知识服务。图1为数据库建设思路图。

2基于学科服务的特色数据库建库内容

2.1 数据库建设的软硬件配置

选择合适的软硬件配置能为后期的信息加工与服务打下坚实的基础,是建设特色数据库首要解决的问题。为了保证数据库平台稳定运行,配置了一台64位4核CUP高性能Web服务器;安装Windows Server 2008操作系统,采用SQL Server 2005作为数据库软件集成开发系统,以C#编程语言为前台设计数据采集页面,采用国际标准的元数据规范进行数据的加工与整合,规范后的数据格式统一,便于统一显示和提高检索效率;在网页设计方面,安装支撑ASP.NET 4.0运行的.NET Framework 4.0组件。

2.2 以学科服务为导向进行数据的采集和加工

专业数据是特色资源库的核心,数据的采集是建设资源库一个非常重要的环节,基于学科服务的数据采集更应重视数据源的专业性、层次化与知识的抽取[2]。中药平性药数据库的数据来源于《中华本草》[3],该著作系统总结了历代中药学的发展成果,又充分反映了现代中药学的研究水平,里面所收载的药物之多及分类之细均超过了以往的本草著作。我们选择其为数据源能最大限度地保证数据的权威性与完整性。

《中华本草》所记载的中药平性药包括平性药的功效、主治、药理作用、化学成分等方面资料,因此,我们对应设计了平性药的功效表、主治表、药理作用表、化学成分表等数据表,并详细描述各个表中数据项的编码方式、属性和数据类型等,全面反映每个表描述所要记录的数据信息。例如:在平性药功效表中,一共设计了26个字段,分别为解表、祛风、清热、泻下等,每个字段下有多个选项,如祛风包括祛风除湿、祛风燥湿、祛风通络、祛风止痛、祛风止痒、祛风解痉、祛风明目等选项。在数据录入界面的设计中,遵循友好性、便捷性、正确性和一致性的基本原则,利用C#语言设计,完成数据采集工作,例如功效表的数据采集页面见图2。为了提高用户的检索效率,规定以药名索引号作为各个表之间的关联字段,建立一个平性药索引表,其中药名索引号字段根据药物来源顺序编排,分为动物药、矿物药、植物药,分别以D、K、Z字母开头,后面各自再加上“所属科目序号(3位数)+排列序号(3位数)”。其中动物药、植物药按自然属性分类,由低等到高等排列;矿物药按阳离子分类排列。平性药索引表数据格式见表1。

2.3 网站设计及信息发布

网站发布平台的定位是:提供中药平性药的检索、利用、共享与传播。在网页色彩搭配上,选择明亮活泼色调,给浏览者耳目一新的感觉;在网页框架设计上力求用户简单方便操作,采用的是传统大众化的页面框架布局结构。设计的页面框架左边窗口是分类导航栏,以平性药药名作为关键检索点,分为动物药、矿物药、植物药三大类,每一大类下以树型结构方式呈现出该大类所包含的全部平性药物名称,方便用户快速浏览和选择;右边窗口是中药平性药物信息资源显示区,根据用户选择的平性药物名称,动态显示该平性药物所对应的如功效、主治、药理、化学成分等详细信息,并配上相应的原色图片,做到图文并茂,加深用户的印象。查询系统网页界面见图3。

2.4 信息挖掘与特色学科服务

特色数据库不仅应实现学术知识的整理和利用,更应注重提炼和深度揭示各类信息中所蕴含的知识,将隐性的知识显性化,增加数据库的附加值[4]。在中医药领域,有不少研究人员在方剂数据库和医案数据库中应用数据挖掘的关联分析方法,例如成都中医药大学与四川大学合作的对脾胃方的挖掘,西南交通大学对乙肝医案数据进行挖掘[5],等等。本课题组成员在百度搜索网、中国知网、重庆维普资讯网进行搜索,没有发现对中药平性药主治病症进行数据挖掘的相关报道,因此在中药平性药数据库中特别设计了“中药平性药主治病症数据研究”这一模块。首先,将中药平性药8 355条主治病症条目分类整理录入到SQL数据库中;然后根据关联规则Apriori算法[6],设定最小支持度的数值,可以找出一条主治病症条目(如跌打损伤)、两条主治病症条目(如痹证+跌打损伤)、三条主治病症条目(如痹证+疮疡+跌打损伤)各自对应的平性药名、出现的频次,频次从高到低进行排序,部分频次表见表2、表3、表4,并提供网上查询,从而找出药名与病症之间存在的治疗关系。

从表2、表3、表4中可以发现,在中医临床实践中,中药平性药主要针对治疗跌打损伤、痹证、疮疡、咳嗽等症状,主治一种或两种以上疾病涉及的平性药种类较多,这对我们进一步研究平性中药的治病机制及组方配伍规律指明了研究方向,为中药临床提供必要的用药依据,对于丰富、发展中药药性理论具有重要的启发意义。

3建设体会

3.1 用户定位及需求分析

准确地定位和把握用户需求,是促进资源建设和服务开展的前提条件[7]。建设什么样的特色资源、如何建设、建成的特色资源给谁用,这是建设特色资源库首先要思考的三个问题,而准确的用户定位和分析可以很好回答以上问题,因为用户定位不仅决定了资源的选择标准,而且也界定了服务的内容。中药平性药数据库的用户主要是中医药专业的师生以及广大的中医药科研工作者,为其提供中药平性药的检索、利用、传播与共享,服务中医药学科建设,为中药学、中医临床提供文献知识保障,以促进中医药文化精髓的传承和发扬。用户群及服务内容的界定,为下一步数据库建设指明大致的目标方向。

3.2 建库内容重在知识提炼与知识整合

数据库建设包括资源的收集、整理加工、标准化处理、平台搭建以及信息发布等内容,是一项非常复杂的系统工程[8]。“中药平性药数据库”建设注重提炼资源中的有效知识,从众多独具特色的中药著作中选取了能全面反映20世纪中药学科发展水平与成就的综合类本草著作《中华本草》收载的平性药作为数据来源,并从中提炼有效信息,收集整理与平性药相关方面的资料。在知识整合方面,该数据库根据平性药的相关资料设计了对应的多个数据表,并经过深入的研究分析,确定每个表描述所要记录的数据编码、属性、类型等详细信息,规定以药名为索引号,使多个数据表关联起来,将各种平性药的功效、主治、药理作用等研究对象整合在一起,确保数据的完整性与一致性,提高用户的检索效率。

3.3 提高挖掘隐性知识的能力,拓展图书馆的学科服务功能

如何建设特色数据库并使其充分体现广泛的学术与实践价值,这是建库过程中值得探讨的关键问题。以往的建设理念多局限于对文献资源的收集管理,重在馆藏建设。这导致了有些数据库的信息量与大型商业数据库资源大量重复,且信息量又远不足于大型数据库,大大降低了这些数据库的使用价值[9]。面向学科服务的特色数据库建设不仅要注重文献资源的收集整理,更应注重从数据中挖掘隐性知识,提升图书馆对教学科研的服务能力。基于此,“中药平性药数据库”功能的设计理念为:第一,满足用户方便检索平性药的功效、主治、化学成分等多种信息;第二,利用数据挖掘技术,从平性药海量的主治病症中科学地提炼有价值的信息,分析挖掘其主治病症的一些规律,用户可以通过网上查询,检索出平性药主治病症条目所对应的平性药名以及出现频次,从而找出药名与病症之间存在的治疗关系,为中医临床用药提供理论依据。

3.4 依托重大科研项目,大力推进特色资源库建设

国家重大科研项目着眼于国家发展战略目标,瞄准科学前沿的重大科技问题,具有投资大、多学科交叉、研究目标宏大等特点。“中药平性药数据库”是依托我校主持国家“973”计划项目“平性药药性本质及其调节机体平衡科学内涵研究”而建立的。重大科研项目的推进,为特色资源建设带来了良好的发展契机:首先,得到了大量的科研经费投入,极大改善了现有科研条件。由于历史等各方面原因,多数高校图书馆经费非常紧张,如果创建并维持一个特色资源数据库,仅仅依靠有限的图书经费是很困难的,因此需要通过多方面筹集专项经费,创建特色资源库建设的长效机制,为教学科研提供文献知识保障;其次,促进人才培养和团队建设。优秀团队是建设高质量特色数据库的保证,它最大限度地体现了图书馆服务的智力内涵。本课题组成员由本科以上学历具有中医药专业、计算机专业、图书情报专业背景的人员构成,各种专业人才各尽其职:样本的抽取与分类整理由中医药专业人员负责;计算机专业人员主要任务为数据库模型的建立、数据挖掘、网页设计与发布、系统维护等技术工作[10];而图书情报专业馆员则负责数据的标引及文献信息的检索途径等等。以学科建设为基础,以重大科研项目为纽带,凝聚学术队伍的组织模式[11],为数据库建设提供了技术支撑和开发动力。

[参考文献]

[1]田青.基于知识服务构建图书馆核心业务的战略思考[J].图书馆学研究,2013,(14):16—18.

[2]王知津,徐芳.论信息服务十大走向[J].中国图书馆学报,2009(1):52—58.

[3]国家中医药管理局《中华本草》编委会.中华本草(第10卷)[M].上海:上海科学技术出版社,1999.

[4]曾娜,陈巍,李文兰.面向学科服务的高校图书馆重点学科特色资源数据库建设探析[J].现代情报,2012(6):75—76.

[5]李园白.中医妇科常见病医案数据挖掘方法研究[D].北京:中国中医科学院,2006.

[6]王丽珍.数据仓库与数据挖掘原理及应用[M].北京:科学出版社,2009.

[7]程红梅.高校图书馆特色资源建设的案例分析[J].图书馆建设,2013(6):26—29.

[8]程桂练,仲超生.知识服务环境下图书馆特色数据库建设——以“凹土资源特色数据库”建设为例[J].陕西学前师范学院学报,2015(4):8—10.

[9]谢春汛,郑萍.地方院校图书馆特色数据库建设策略研究[J].图书馆学研究,2012(19):27—30.

[10]裴丽,李铁男,徐小滨,等.特色数据库建设的实践与启示[J].图书馆学研究,2014(1):54—56.

[11]陈浩.高校国家重大科研项目中申报策略与管理研究[J].科技生活,2010(7):196.

相关文章:

Top