面向珍稀濒危古树名木健康保护的本体构建与可视化研究

作者: 刘乾凝 马晓燕 解方 申永臣 罗鹏 王佳美 张唯聪 陈娜

面向珍稀濒危古树名木健康保护的本体构建与可视化研究0

摘要  针对珍稀濒危古树名木产生的海量、复杂庞大却又互不交叉且独立存储的相关的知识信息的问题,在语义关联的基础上对其进行本体化组织和有机结合十分必要。基于本体的理论和方法,对濒危古树名木健康保护领域资源涉及的概念应用元数据进行知识抽取和语义描述,选取概念参考模型对领域内概念进行统一组织整合,构建濒危古树名木健康保护本体,以期全方位揭示出领域资源的知识内容及其相互关系,在每一株古树名木之间、古树名木和健康保护之间建立起语义深层次关联及可视化展示,进一步推动古树名木健康保护知识服务。

关键词  古树名木;健康保护;本体;可视化

中图分类号  S-058  文献标识码  A  文章编号  0517-6611(2024)21-0216-06

doi:10.3969/j.issn.0517-6611.2024.21.045

开放科学(资源服务)标识码(OSID):

Study of Ontology Construction and Visualization for Health Protection of Rare and Endangered Old and Famous Trees—A Case of Beijing

LIU Qian-ning1,MA Xiao-yan1,2,XIE Fang1 et al

(1.Beijing University of Agriculture,Beijing 102206;2.National Forestry and Grassland Ancient Tree Health and Ancient Tree Culture Engineering Technology Research Center,Beijing University of Agriculture,Beijing 102206)

Abstract  In view of the problem of massive,complex and huge related knowledge information produced by rare and endangered ancient and famous trees,which are not interlinked and stored independently.It is necessary to organize and combine them organically on the basis of semantic association.Based on ontology theory and method,we carried out knowledge extraction and semantic description on the metadata of concept application in the field of health protection of endangered old and famous trees,the concept reference model was selected to organize and integrate the concepts in the field,and the health protection ontology of the endangered old and famous trees was constructed,it established semantic deep-level association between each old and famous tree,old and famous tree and health protection,further promote knowledge services on the health protection of ancient and famous trees.

Key words  Ancient tree;Health protection;Ontology;Visualization

基金项目  市属高校分类发展-都市农林特色教师队伍建设项目(110000-24T000002961733)。

作者简介  刘乾凝(1968—),女,湖北荆州人,副研究馆员,硕士,从事文献计量学、图书情报学研究。*通信作者:马晓燕,教授,硕士,硕士生导师,从事古树学科研究;解方,助理研究员,硕士,从事人力资源工作。

收稿日期  2024-05-27;修回日期  2024-06-04

古树作为一种古老的植物树种,是具有重要的科学、历史和观赏价值而又不可再生、珍稀濒危的自然文化遗产。古树名木健康保护资源的搜集、整理和保护研究,对于历史文化保存和植物生态学研究等都有独特的价值。近年来,古树名木的保护管理工作受到中央和北京市委领导高度重视,强调“首都的古树名木极为珍贵,要加强保护”,叮嘱“古树、鸽哨、老院落等都是北京胡同的文化符号,要保护好,留住乡愁”,要“让古树活起来”。同时,北京市为了加强古树名木的保护管理、维护古都风貌,出台了《北京市古树名木保护管理条例》等地方性法规。

随着互联网的发展,不同的用户对搜索不同类型的古树名木信息的兴趣各有不同,如古树繁殖专家、技术人员对古树树种基因、健康保护档案、健康监测评估信息等的需求、古树学者对基于语义的知识搜索需求、市民游客对古树人文历史、民俗文化等知识的关注。基于此,政、学、商各界对古树名木健康保护领域数据的知识组织开展了大量研究工作,如地理信息管理系统[1-3]、健康状况评估模型[4]、北京市古树名木保护智慧管理系统、AncientTree古树名木监测评估系统[5]、北京市园林绿化局官网、中国知网和百度学术等平台。基于上述古树名木知识源,很明显这些知识源来源于不同领域且主要以传统数据库形式进行存储,存在信息融合能力差、难以形成对珍稀濒危古树名木健康保护全方位信息的深层次开发利用与知识共享等问题。因此,由于古树自然衰老、区域生境以及全球气候的变化,古树濒危衰弱发生有可能更频繁,多领域合作建立古树名木健康保护本体数据库具有必要性和迫切性。

本体(ontology)利用形式化描述对象及对象间的关系,建立一个语义级的环境,可以很好地屏蔽信息资源的多维性、异构性,从而将用户和信息资源统一在一个虚拟的语义空间中,使计算机能够理解信息的语义[6]。因此,基于本体知识表达、良好的概念层次和对逻辑推理的支持,可以真正实现语义级的知识服务[7]。

国内学者针对历史文化遗产具有多维异构性的大数据特点,通过构建本体、知识库、开放性知识图谱,使大规模数据的可视化和关联成为可能。本体思想应用于珍稀濒危古树名木健康风险分析,可以解决古树种植资源生产、城市园林绿化、古树健康管理、古树生态环境领域及古树科研领域知识难于共享和应用的难题。基于上述研究和古树在复壮保护、环境保护等方面的多领域、多来源知识,该研究设计构建了面向健康保护的古树本体模型(下称“古树本体”),目的是分析珍稀濒危古树名木健康保护涉及领域技术服务信息数据的结构特征,逐步构建可以融合多源异构信息知识的本体模型,对珍稀濒危古树名木健康保护知识源的归纳,理清思路,为构建古树领域健康保护技术服务数据库做准备,最终有助于促进古树领域知识创新和传播。鉴于此,笔者基于本体的理论和方法,对濒危古树名木健康保护领域资源涉及的概念应用元数据进行知识抽取和语义描述,选取概念参考模型对领域内概念进行统一组织整合,构建濒危古树名木健康保护本体,以期全方位揭示出领域资源的知识内容及其相互关系,在每一株古树名木之间、古树名木和健康保护之间建立起语义深层次关联及可视化展示,进一步推动古树名木健康保护知识服务。

1  相关本体实践与研究述评

在农业领域,目前大多已有的本体库,如农业古籍本体领域本体[8]、万里茶道档案领域本体模型[9]、花卉学文献试验性本体检索系统[10]等均参考联合国粮农组织(Food and Agriculture Organization of the United Nations,简称FAO)的多语种叙词表AGROVOC、国际农业和生物中心叙词表与美国国家农业图书馆的叙词表AgNIC,常用的农业叙词表有中国农业科学院农业信息研究所编制的中国农业叙词表(Chi-nese Agricultural Thesaurus,CAT)、FAO创建的AGROVOC(多语种农业主题词表) 、美国国家农业图书馆创建的NALT美国国家农业图书馆叙词表、欧盟创建和维护的 EUROVOC(欧盟农业主题词表)等。

斯坦福大学开发的七步法是一种具有很强的逻辑性、可操作性以及可拓展性的领域本体的构建方法,常常被相关学者在建立领域本体时所采用。例如,刘丽婷等[11]应用七步法模型 ,在分析广东省和海南省台风气象灾害事件,抽提出林木台风气象灾害事件的类、个体及属性概念,进行元语言转化的基础上,应用Protégé本体构建软件进行林木气象灾害事件本体框架模型构建。

针对多维异构性的领域知识难以融合,相关学者通过构建开放性知识图谱,把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制显示出来,揭示知识领域的动态发展规律,使大规模数据的可视化和关联成为可能,为相关研究提供切实的、有价值的参考。例如,田梦晖等[12]针对珍稀濒危植物形态特征、分类等级、濒危系数、保护措施等知识不明确的问题,设计了文本融合轻量级双向转换编码表示模型(Albert)的知识抽取模型框架,实现批量抽取珍稀濒危植物知识,从而构建珍稀濒危植物本体和知识图谱,完成珍稀濒危植物知识图谱的可视化展示;段宇锋等[13]以BFO作为上层本体,参考KACTUS法,通过复用PO构建涵括720条实体和4 000多个实例的中文植物物种多样性本体;张伶子等[14]针对现有农业病虫害专家系统领域知识共享和重用困难、症状输入严重影响准确率等问题,研究了基于领域知识、推理知识和任务知识的本体构建技术;刘桂锋等[15]利用本体原理和本体构建工具Protégé,抽取国家农业科学数据中心的数据资源,构建可视化数据资源的关联关系,深度揭示与可视化农业科学数据资源,实现了知识发现和数据增值,并为科学数据平台建设提供了借鉴、参考;针对作物病虫害数据,吴赛赛等[16]构建了一种基于深度学习的作物病虫害知识图谱;周树斌等[17]通过融合诗词文化基因与诗词资源,利用知识图谱技术的可视化分析,完成传统诗词资源微观至基因、宏观到时空的诗词资源知识的关联及可视化展示。

2  领域本体构建理论与方法

2.1  本体理论

源自哲学领域的本体(ontology)这一概念,原本是对客观世界本质及其规律的抽象化,20世纪90年代以来,这个词随即被应用到计算机领域,起到越来越重要的作用。虽然不同研究者对本体的定义有不同的描述,但在根本上,对本体的认识是一致的,本体就是对某一研究领域应用本体论的方法进行分析、构建领域模型,是将现实世界中的某个领域抽象成一组概念和概念之间的关联[18],或者说本体在信息科学领域是一种模型,是对客观存在的对象类型或概念及其相互关系的规范描述和表达[19],并转化为资源描述框架(resource description framework,RDF ),如Perez 等[20]认为,本体可以用于在计算机领域表示知识,包含类、关系、公理、函数和实例5种要素,能够规范特定范围的基本概念、属性、概念间的关系以及属性和关系的约束规则[21]。

2.2  本体构建方法与流程

根据上述文献综述,分析得出七步法最适合领域本体的构建,其成熟度也是现有本体构建方法中最好的,因此该研究在构建本体的过程中也应用了七步法的思想作为方法论构建本体模型。笔者综合主流本体构建方法,从多个维度出发对珍稀濒危古树名木健康保护领域实体知识的概念、属性、实体与实例、实例与实例之间的关系加以概括性的描述和定义。

设计古树本体,具体步骤如下:确定本体的专业领域和范畴;考虑用现有本体的可能性;抽取古树知识概念;构建古树上位本体;本体类及属性的设计;按照需要,添加实例。

经典小说推荐

杂志订阅

友情链接