中医药学语言系统超级叙词表分类原则和构架的探讨

中医药学语言系统超级叙词表分类原则和构架的探讨

论文摘要

一体化医学语言系统解决了生物医学信息检索中相同的概念具有不同的表达方式、有用的信息分散在不同的数据库系统中所造成的查询困难等问题。超级叙词表作为一体化医学语言系统的重要组成部分,在系统中发挥着不可替代的作用,超级叙词表是系统的核心,为系统提供了“基本素材”——术语和概念。对于词表的研究而言,词表的分类占有重要的地位,合理的分类可以优化系统,提高用户的检索速度,减少加工人员的工作量,同时分类也是实现数据资源管理现代化的必要条件。参照国家标准、中医药学词典、词表等的分类,本文在现在的中医药学语言系统(TCMLS)超级叙词表的基础上制定了中医药超级叙词表的分类原则,提出了新的词表分类框架,以期能对中医药学语言系统的分类进行优化。1一体化医学语言系统研究现状目前,国内外研究一体化医学语言系统的有美国国立医学图书馆(NLM)的一体化医学语言系统(UMLS).中国医学科学院医学信息研究所的中文一体化医学语言系统(CUMLS)和中国中医科学院中医药信息研究所的中医药学语言系统(TCMLS)UMLS于1986年开始研制,到现在已经处于成熟阶段,广泛应用于词表的编制、自然语言的处理、自动索引和生物医学信息检索、医疗决策支持系统等地方。它有3个组成部分:超级叙词表、语义网络、专家词典。CUMLS的研究主要集中在中国医学科学院医学信息研究所,它建立的目的是为解决中文生物医学检索中相同的概念有不同的表达方式,有用的信息分散在不同地方的问题。该系统由中国医学用语数据库、中国医学用语语义网络系统、中国医学用语与标引检索语言对应转换系统3个部分组成。TCMLS是在参照UMLS基础上,根据中医药语言特点及学科体系特色,按照本体论设计原理而研制的语言系统。系统的建立将为中医药学科的数字化和标准化及与国际接轨提供必要的工具,同时将进一步提示中医药学科的完整性和概念中的相互关联性。2中医药词表研究现状目前,中医药相关词表主要有《中国中医药学主题词表》、中医药学语言系统的中医药超级叙词表和《中国图书馆分类法·医学专业分类表》。《中国中医药学主题词表》以中医药学学科体系为基础,同时兼顾了《汉语主题词表》和美国《医学主题词表》词表,将全部主题词按学科门类划分,排列于15个类目68个子类目,它是目前使用最广泛、影响最大的一部中医药学专业主题词表。中医药超级叙词表在参照《中医药表》、《中图法》、《医学主题词注释字顺表》及近年来各种版本的中医药学教科书的基础上分为16大类。由于TCMLS还没有完整建立,因此其分类还在不断完善中。《医学专业分类表》采用理、法、方、药的类目编制原则,将中国医学分为中医预防、卫生学、中医基础理论、中医临床学、内科学、外科学、妇产科学、儿科学、骨伤科学、皮肤科学、五官科学、急症学、中药学、中国少数民族医学等。3中医药超级叙词表分类原则在参照GB/T 7072-2002信息分类和编码的基本原则与方法、《中医药表》分类原则、地理信息分类原则等基础上,本课题将中医药超级叙词表的分类原则分为基本原则和独特原则。分类的基本原则是词表分类需要遵循的一般性原则,包括科学性原则、系统性原则、可延性原则、实用性原则、逻辑性原则、兼容性原则等。中医药学科有区别与其它学科的特征,所以中医药超级叙词表的分类原则也有别与其他学科词表的分类原则。中医药概念词的分类需要遵循中医的理论体系、诊疗手段等逻辑思维习惯,同时在制定中医药超级叙词表分类原则的时候需要考虑到中医药学语言系统的应用目的。中医药超级叙词表分类除遵循信息分类的基本原则外,还需要遵循以下独特原则:类名规范原则、详尽性原则、一致性原则、专指性原则、类目粒度的控制性原则、自调整原则、约定俗称原则、优先性原则、平衡性原则等。4中医药超级叙词表分类方法信息分类常见的方法有三种:线分类法、面分类法、混合分类法。其中线分类法又称层级分类法、体系分类法;面分类法又称组配分类法。本课题采用混合分类法,遵循中医药学科特色,自上而下建立中医药超级叙词表分类框架,将词表层层划分,形成树状结构表,从而清晰明了地展现中医药学的知识等级体系,满足不同角度和多途径查询知识信息。5中医药超级叙词表分类框架中医药学理论体系是包括理、法、方、药在内的整体,是关于中医学的基本概念、基本原理和基本方法的科学知识体系。在参照中医药相关词表体系类别的基础上,采用自上而下的方法,按照理、法、方、药的类目编排原则,对中医药超级叙词表类目体系进行构造。将中医药超级叙词表的一级类目分为“病因病机与诊断”、“地理学”、“方剂学”、“疾病”、“预防与养生”、“针灸学”、“治则治法”、“中药化学”、“中药学”、“中医基础理论”、“中医药研究机构”、“民族医学”、“中医人体形态”、“中医药相关学科”、“中西医结合”。6中医药超级叙词表分类框架的验证本课题通过两种途径来验证中医药超级叙词表的分类框架,一种途径是与现在系统的分类框架作对比,另一种是从中医药相关期刊中抽取主题词和关键词,验证其能否归入本文提出的框架。(1)与现在中医药超级叙词表作对比研究与现在的中医药超级叙词表相比,本文建议增加以下类目:“民族医学”、“中医人体形态”、“中西医结合”。“民族医学”作为中国传统医学的一部分,与中医药学的研究息息相关;疾病的诊断和治疗都离不开“人体形态学”的支持;医学的快速发展使得“中西医结合”的研究如火如茶,相关的机构、文献量激增。在原来的中医药超级叙词表基础上合并了部分类目,有些类目在语言系统中涉及的概念术语比较少,检索中很少用到,建议将其合并。例如“人文科学”、“医学信息学与文献学”、“自然科学与物理科学”等类目,系统中它们作为一级类目,其子类目仅有一个或者两个,因此建议将它们合并为“中医药相关学科”。(2)框架的验证抽取中医药相关核心期刊的主题词和关键词做分类框架的验证,从《中医杂志》、《中国中西医结合杂志》、《中国中医药信息杂志》中抽取2010年文章的主题词和关键词共5638个,与现在的TCMLS系统中的概念和术语匹配后,有1578个未在系统中出现。对这些词进行统计后,发现很多是西医的术语,例如:热休克蛋白70、理化检查、白细胞介素、碘放射性同位素等。还有些是自拟方剂、人物名称、疾病名称等,但是这些都可以归入系统的类目中,所以此分类框架还是比较合理的,可以囊括中医药相关的概念和术语。7总结与展望中医药超级叙词表的研究无论是对中医药词表的分类,还是对语言系统的应用开发都有重要的意义,其分类成果是理论与应用的桥梁。但是,由于人类的主观性和客观的复杂性,人类对中医药的认识不可避免存在局限性。本文提出的中医药超级叙词表分类原则与方法参考了国内外词表分类的相关研究,期望能在实践中不断完善,为中医药概念、术语的分类研究、相关标准的制定和语言系统的完善及应用提供帮助。中医药学语言系统不是一天建立的,它需要不断完善。中医药超级叙词表框架的构建也不能满足所有人的要求,只能尽量满足本系统的功能需求。坚持中医药学分类体系与现代医学分类体系的接轨,完善中医药学分类体系,不断反映中医药学现代化研究进程,是中医药分类的永恒主题。

论文目录

  • 中文摘要
  • Abstract
  • 综述:中医药学语言系统超级叙词表研究现状
  • 1 医学语言系统研究现状
  • 2 中医药词表研究现状
  • 3 中医药超级叙词表研究存在问题分析
  • 4 结语
  • 参考文献
  • 前言
  • 1 国内外医学语言系统参考借鉴研究
  • 1.1 一体化医学语言系统(LMLS)
  • 1.1.1 超级叙词表
  • 1.1.2 语义网络
  • 1.1.3 专家词典
  • 1.2 中文一体化医学语言系统
  • 1.3 中医药学语言系统
  • 1.3.1 中医药超级叙词表
  • 1.3.2 语义网络
  • 2 中医药相关词表研究现状
  • 2.1 《中国中医药学主题词表》
  • 2.2 中医药超级叙词表
  • 2.3 《中国图书馆分类法·医学专业分类表》
  • 2.4 中国生物医学文献数据库
  • 3 中医药超级叙词表分类原则
  • 3.1 基本原则
  • 3.1.1 科学性原则
  • 3.1.2 系统性原则
  • 3.1.3 逻辑性原则
  • 3.1.4 实用性原则
  • 3.1.5 可扩延性原则
  • 3.1.6 兼容性原则
  • 3.2 独特原则
  • 3.2.1 类名规范原则
  • 3.2.2 一致性原则
  • 3.2.3 详尽性原则
  • 3.2.4 专指性原则
  • 3.2.5 平衡性原则
  • 3.2.6 类目粒度的控制性原则
  • 3.2.7 自调整性原则
  • 3.2.8 约定俗成性原则
  • 3.2.9 优先性原则
  • 4 中医药超级叙词表分类方法
  • 4.1 线分类法
  • 4.2 面分类法
  • 4.3 混合分类法
  • 4.4 中医药超级叙词表的分类方法
  • 5 中医药超级叙词表的构架模型
  • (1) 病因病机与诊断
  • (2) 地理学
  • (3) 方剂学
  • (4) 疾病
  • (5) 预防与养生
  • (6) 针灸学
  • (7) 治则治法
  • (8) 中药化学
  • (9) 中药学
  • (10) 中医基础理论
  • (11) 中医药研究机构
  • (12) 民族医学
  • (13) 中医人体形态
  • (14) 中医药相关学科
  • (15) 中西医结合
  • 6 中医药超级叙词表框架的验证
  • 6.1 与原框架作对比
  • 6.1.1 增加了新的类目
  • 6.1.2 合并了部分类目
  • 6.2 框架验证
  • 7 总结与展望
  • 7.1 总结
  • 7.2 展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].叙词表和本体的比较研究[J]. 浙江高校图书情报工作 2012(01)
    • [2].中文叙词表发展概况和性能测评(1980-2009)[J]. 中国索引 2012(02)
    • [3].面向叙词表更新的新术语分布特征研究[J]. 图书情报工作 2019(20)
    • [4].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2018(12)
    • [5].基于生态学视角的叙词表概念稳定性研究[J]. 情报杂志 2019(07)
    • [6].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2019(07)
    • [7].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2018(01)
    • [8].我国叙词表的编制历史与发展模式[J]. 情报理论与实践 2018(06)
    • [9].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2018(10)
    • [10].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2017(02)
    • [11].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2017(03)
    • [12].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2017(04)
    • [13].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2017(05)
    • [14].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2017(08)
    • [15].用于信息检索的叙词表编制标准[J]. 国家图书馆学刊 2016(02)
    • [16].叙词表与其他词表的互操作标准[J]. 国家图书馆学刊 2016(02)
    • [17].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2016(06)
    • [18].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2016(05)
    • [19].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2016(03)
    • [20].《网络环境下叙词表编制与发展》[J]. 数字图书馆论坛 2016(09)
    • [21].多语叙词表构建方法研究与实践[J]. 图书情报工作 2014(19)
    • [22].叙词表概念映射研究[J]. 图书馆论坛 2015(01)
    • [23].《网络环境下叙词表编制与发展》书讯[J]. 图书情报工作 2015(12)
    • [24].从叙词表到知识图谱的构建研究与实践[J]. 农业图书情报 2019(01)
    • [25].叙词表的结构分析[J]. 计算机产品与流通 2019(09)
    • [26].基于生态学视角的叙词表概念多样性研究[J]. 情报杂志 2018(11)
    • [27].40年来中文叙词表修订情况概览[J]. 图书情报工作 2013(02)
    • [28].中文叙词表发展概况和性能测评(1980-2009)[J]. 图书馆论坛 2012(04)
    • [29].叙词表映射研究综述[J]. 图书情报工作 2012(12)
    • [30].加强网络时代叙词表的研究[J]. 图书情报工作 2009(08)

    标签:;  ;  ;  ;  

    中医药学语言系统超级叙词表分类原则和构架的探讨
    下载Doc文档

    猜你喜欢