UMLS
UMLS
UMLS( Unified Medical Language System)是美国国家医学图书馆(NLM)自1986年起研究和开发的一体化医学语言系统。UMLS是计算机化的情报检索语言集成系统,它不仅是语言翻译、自然语言处理及语言规范化的工具,而且是实现跨数据库检索的词汇转换系统,它可以帮助用户在联接情报源,包括计算机化的病案记录、书目数据库、事实数据库以及专家系统的过程中对其中的电子式生物医学情报作一体化检索。
主要功能
UMLS包括四个部分:超级叙词表(Metathesaurus)、语义网络(Semantic Network)、情报源图谱(Information Sources Map)和专家词典(SPECIALIST Lexicon)。其中超级叙词表是生物医学概念、术语、词汇及其涵义、等级范畴的广泛集成。1997年第8版的超级叙词表收录了来源于30多种生物医学词表和分类表的能表达33万多个概念的739439个词汇,词汇量达到空前规模。而语义网络则是为建立概念术语间相互错综复杂关系而设计的,是为超级叙词表中的所有概念提供语义类型及相互关系结构的工具。UMLS的语义网络不仅运用了常规的语义控制手段,如语义等级、属分、相关关系控制,而且在语义规范和语义关系分析、延伸等多方面有许多创新。
目的和应用
UMLS由美国国家医学图书馆设计和维护,每季度更新,可免费使用。该项目由图书馆主任唐纳德·林德伯格博士发起,并由贝齐·汉弗莱斯指导。UMLS的目的是通过促进理解生物医学语言的计算机系统的发展,增强对文献的获取。这是通过克服两个重要障碍实现的:“相同概念在不同的可机读来源和不同的人员中表达的方式的多样性”和“有用信息分布在许多不同的数据库和系统中”。
许可
系统的用户需要签署“UMLS协议”并提交简要的年度使用报告。学术用户可以免费使用UMLS进行研究目的。商业或生产使用需要对一些纳入的源词汇进行版权许可。
配套软件工具
除了知识来源,美国国家医学图书馆还提供支持工具
不一致和其他错误
考虑到 UMLS 的规模和复杂性及其对整合术语的宽松政策,错误是不可避免的。 错误包括歧义和冗余、层次关系循环(一个概念既是另一个概念的祖先又是后代)、缺少祖先(父概念和子概念的语义类型不相关)以及语义倒置(子概念与子概念的关系)。语义类型与概念不一致)。
这些错误是通过审核 UMLS 发现并解决的。手动审核可能非常耗时且成本高昂。研究人员尝试通过多种方式解决这个问题。可以使用自动化工具来搜索这些错误。对于结构不一致(例如循环),基于顺序的简单解决方案将起作用。但是,当不一致出现在术语或概念级别(术语的上下文特定含义)时,同样的情况就不适用。这需要使用明智的搜索策略(知识表示)。
参考资料

Warning: Invalid argument supplied for foreach() in /www/wwwroot/newbaike1.com/id.php on line 362
目录
概述
主要功能
目的和应用
许可
配套软件工具
不一致和其他错误
参考资料